CASIA OpenIR

浏览/检索结果: 共12条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:34/2  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
基于多模态预训练模型的弱监督跨模态目标定位 学位论文
, 2024
作者:  赵宸麟
Adobe PDF(7997Kb)  |  收藏  |  浏览/下载:42/3  |  提交时间:2024/06/20
弱监督  提示学习  跨模态目标定位  
面向图像识别的深度神经网络迁移研究 学位论文
, 2024
作者:  聂兴
Adobe PDF(14000Kb)  |  收藏  |  浏览/下载:82/5  |  提交时间:2024/06/18
图像识别  深度神经网络迁移  提示学习  双端记忆巩固  可微分门控  
组合性感知的弱监督视觉定位研究 学位论文
, 2024
作者:  曾宇楠
Adobe PDF(7681Kb)  |  收藏  |  浏览/下载:56/3  |  提交时间:2024/06/04
视觉定位,视觉语言预训练模型,弱监督,组合性  
非受限场景下文本到图像的生成方法研究 学位论文
, 2024
作者:  孙建新
Adobe PDF(32226Kb)  |  收藏  |  浏览/下载:57/3  |  提交时间:2024/06/04
生成式对抗网络,扩散模型,文本到图像生成,人脸图像编辑  
推理机制启发的视觉语言导航 学位论文
, 2024
作者:  安东
Adobe PDF(10930Kb)  |  收藏  |  浏览/下载:120/10  |  提交时间:2024/05/27
视觉语言导航  模块化推理  认知地图  子目标导航  
基于文生图模型的商品背景自动更换 学位论文
, 2024
作者:  邓鹏飞
Adobe PDF(22364Kb)  |  收藏  |  浏览/下载:28/0  |  提交时间:2024/05/27
文生图模型,扩散模型,背景更换,主体概念注入,边缘控制,商品  
自适应特征融合的多模态实体对齐研究 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 4, 页码: 758-770
作者:  郭浩;  李欣奕;  唐九阳;  郭延明;  赵翔
Adobe PDF(7063Kb)  |  收藏  |  浏览/下载:65/21  |  提交时间:2024/04/28
多模态知识图谱  实体对齐  预训练模型  特征融合  
基于多模态交互与注意力机制的视觉问答 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  刘飞
Adobe PDF(10058Kb)  |  收藏  |  浏览/下载:472/17  |  提交时间:2022/06/13
视觉问答  多模态交互  注意力机制  关系推理  
基于视觉与语言的行人理解 学位论文
, 自动化研究所智能化大厦1610: 中国科学院大学自动化研究所, 2021
作者:  荆雅
Adobe PDF(21773Kb)  |  收藏  |  浏览/下载:376/12  |  提交时间:2021/06/21
情境识别  行人检索  行人分割  多模态对齐  关系学习