已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:34/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 基于多模态预训练模型的弱监督跨模态目标定位 学位论文 , 2024 作者: 赵宸麟 Adobe PDF(7997Kb)  |  收藏  |  浏览/下载:42/3  |  提交时间:2024/06/20 弱监督 提示学习 跨模态目标定位 |
| 面向图像识别的深度神经网络迁移研究 学位论文 , 2024 作者: 聂兴 Adobe PDF(14000Kb)  |  收藏  |  浏览/下载:82/5  |  提交时间:2024/06/18 图像识别 深度神经网络迁移 提示学习 双端记忆巩固 可微分门控 |
| 组合性感知的弱监督视觉定位研究 学位论文 , 2024 作者: 曾宇楠 Adobe PDF(7681Kb)  |  收藏  |  浏览/下载:56/3  |  提交时间:2024/06/04 视觉定位,视觉语言预训练模型,弱监督,组合性 |
| 非受限场景下文本到图像的生成方法研究 学位论文 , 2024 作者: 孙建新 Adobe PDF(32226Kb)  |  收藏  |  浏览/下载:57/3  |  提交时间:2024/06/04 生成式对抗网络,扩散模型,文本到图像生成,人脸图像编辑 |
| 推理机制启发的视觉语言导航 学位论文 , 2024 作者: 安东 Adobe PDF(10930Kb)  |  收藏  |  浏览/下载:120/10  |  提交时间:2024/05/27 视觉语言导航 模块化推理 认知地图 子目标导航 |
| 基于文生图模型的商品背景自动更换 学位论文 , 2024 作者: 邓鹏飞 Adobe PDF(22364Kb)  |  收藏  |  浏览/下载:28/0  |  提交时间:2024/05/27 文生图模型,扩散模型,背景更换,主体概念注入,边缘控制,商品 |
| 自适应特征融合的多模态实体对齐研究 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 4, 页码: 758-770 作者: 郭浩; 李欣奕; 唐九阳; 郭延明; 赵翔 Adobe PDF(7063Kb)  |  收藏  |  浏览/下载:65/21  |  提交时间:2024/04/28 多模态知识图谱 实体对齐 预训练模型 特征融合 |
| 基于多模态交互与注意力机制的视觉问答 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 刘飞 Adobe PDF(10058Kb)  |  收藏  |  浏览/下载:472/17  |  提交时间:2022/06/13 视觉问答 多模态交互 注意力机制 关系推理 |
| 基于视觉与语言的行人理解 学位论文 , 自动化研究所智能化大厦1610: 中国科学院大学自动化研究所, 2021 作者: 荆雅 Adobe PDF(21773Kb)  |  收藏  |  浏览/下载:376/12  |  提交时间:2021/06/21 情境识别 行人检索 行人分割 多模态对齐 关系学习 |