已选(0)清除
条数/页: 排序方式: |
| 从视频到语言:视频标题生成与描述研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397 作者: 汤鹏杰; 王瀚漓 Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/20 视频描述 卷积神经网络 循环神经网络 语段生成 情感表达 逻辑语义 |
| 基于平行学习的艺术绘画图像描述算法研究 学位论文 , 2023 作者: 鲁越 Adobe PDF(15730Kb)  |  收藏  |  浏览/下载:117/3  |  提交时间:2023/06/25 平行学习 艺术绘画 图像描述 内容描述 情感描述 |
| 面向结构化学习的跨模态视频检索研究 学位论文 , 2023 作者: 王威 Adobe PDF(14339Kb)  |  收藏  |  浏览/下载:155/11  |  提交时间:2023/06/15 跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1131/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 面向自然人机交互的语言-视觉物体定位方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 李钱钟 Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:275/13  |  提交时间:2022/06/13 自然人机交互 零样本物体检测 自然语言-图像指代表达理解 自然语言-视频指代表达理解 |
| 基于语义的跨模态检索研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 程文龙 Adobe PDF(3471Kb)  |  收藏  |  浏览/下载:303/17  |  提交时间:2022/06/13 跨模态检索 视觉问答 语音-图像检索 三模态排序损失 循环一致性损失 |
| 基于深度结构化学习的手写数学公式识别 学位论文 工学博士, 中国科学院自动化所: 中国科学院大学, 2021 作者: 吴金文 Adobe PDF(4312Kb)  |  收藏  |  浏览/下载:254/8  |  提交时间:2022/04/07 手写数学公式识别 配对对抗学习 预感知单元 图到图生成 字符原型 |
| 基于序列生成的图像语义描述 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 郭龙腾 Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:311/20  |  提交时间:2021/06/24 图像语义描述 视觉和语言 序列生成 注意力机制 非自回归解码 |
| 基于视觉与语言的行人理解 学位论文 , 自动化研究所智能化大厦1610: 中国科学院大学自动化研究所, 2021 作者: 荆雅 Adobe PDF(21773Kb)  |  收藏  |  浏览/下载:344/12  |  提交时间:2021/06/21 情境识别 行人检索 行人分割 多模态对齐 关系学习 |
| 基于特征学习和关系推理的视频行为识别 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院大学, 2021 作者: 胡古月 Adobe PDF(17584Kb)  |  收藏  |  浏览/下载:272/5  |  提交时间:2021/06/11 视频理解 行为分析 特征学习 关系推理 |