CASIA OpenIR

Browse/Search Results:  1-8 of 8 Help

Selected(0)Clear Items/Page:    Sort:
基于跨膜态分析的图像指代分割算法研究 学位论文
, 2024
Authors:  闫熠辰
Adobe PDF(5636Kb)  |  Favorite  |  View/Download:29/0  |  Submit date:2024/06/04
跨模态分析,图像指代分割,视觉语言模型  
推理机制启发的视觉语言导航 学位论文
, 2024
Authors:  安东
Adobe PDF(10930Kb)  |  Favorite  |  View/Download:67/5  |  Submit date:2024/05/27
视觉语言导航  模块化推理  认知地图  子目标导航  
视觉语言导航研究进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14
Authors:  司马双霖;  黄岩;  何科技;  安东;  袁辉;  王亮
Adobe PDF(6272Kb)  |  Favorite  |  View/Download:39/14  |  Submit date:2024/05/09
视觉语言导航  视觉语言理解  跨模态匹配  具身智能  
基于形态的具身智能研究:历史回顾与前沿进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1131-1154
Authors:  刘华平;  郭迪;  孙富春;  张新钰
Adobe PDF(55262Kb)  |  Favorite  |  View/Download:25/4  |  Submit date:2024/05/09
具身智能  形态智能  形态计算  形态控制  形态-控制协同优化  
基于深度强化学习的主动目标检测方法研究 学位论文
, 2022
Authors:  许诺
Adobe PDF(9588Kb)  |  Favorite  |  View/Download:347/18  |  Submit date:2022/12/19
目标检测  深度强化学习  主动目标检测  深度学习  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张子琦
Adobe PDF(19170Kb)  |  Favorite  |  View/Download:1146/15  |  Submit date:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于多模态交互与注意力机制的视觉问答 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  刘飞
Adobe PDF(10058Kb)  |  Favorite  |  View/Download:431/17  |  Submit date:2022/06/13
视觉问答  多模态交互  注意力机制  关系推理  
基于注意与记忆机制的视觉描述 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2019
Authors:  王君波
Adobe PDF(6335Kb)  |  Favorite  |  View/Download:438/3  |  Submit date:2020/01/07
视觉描述  注意与记忆机制  长序列建模  模态相关性  关系学习