CASIA OpenIR

浏览/检索结果: 共17条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向多模态语义理解与推理的视觉问答研究 学位论文
, 2024
作者:  张熙
Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:44/2  |  提交时间:2024/07/08
多模态  视觉问答  语义挖掘  可靠关联  推理泛化  
基于多模态协同的驾驶行为预测 学位论文
, 2024
作者:  董清辉
Adobe PDF(5017Kb)  |  收藏  |  浏览/下载:27/0  |  提交时间:2024/07/08
人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习  
结构启发的神经语义解析方法研究 学位论文
, 2024
作者:  张翔
Adobe PDF(3373Kb)  |  收藏  |  浏览/下载:42/0  |  提交时间:2024/06/26
自然语言理解  神经语义解析  形式化语义表示  组合泛化  
跨模态信息融合的文本图像翻译方法研究 学位论文
, 2024
作者:  马聪
Adobe PDF(11285Kb)  |  收藏  |  浏览/下载:52/5  |  提交时间:2024/06/26
文本图像翻译  跨模态信息融合  多任务学习  跨模态对比学习  参数高效微调  
A Survey of Recent Advances in Commonsense Knowledge Acquisition: Methods and Resources 期刊论文
Machine Intelligence Research, 2024, 页码: 1
作者:  Wang, Chenhao;  Li, Jiachun;  Chen, Yubo;  Liu, Kang;  Zhao, Jun
Adobe PDF(1228Kb)  |  收藏  |  浏览/下载:23/5  |  提交时间:2024/06/25
事件类常识知识获取与语言模型知识内化关键技术研究 学位论文
, 2024
作者:  王晨皓
Adobe PDF(5599Kb)  |  收藏  |  浏览/下载:55/3  |  提交时间:2024/06/16
常识知识  常识知识获取  语言模型知识萃取  语言模型知识内化  常识问答  
BFRFormer: Transformer-based generator for Real-World Blind Face Restoration 会议论文
, Seoul, Korea, 2024年4月14日到2024年4月19日
作者:  Guojing Ge;  Qi Song;  Guibo Zhu;  Yuting Zhang;  Jinglu Chen;  Miao Xin;  Ming Tang;  Jinqiao Wang
Adobe PDF(6872Kb)  |  收藏  |  浏览/下载:48/12  |  提交时间:2024/06/06
基于隐变量模型的自然语言处理解释方法研究 学位论文
, 2024
作者:  江忠涛
Adobe PDF(3157Kb)  |  收藏  |  浏览/下载:53/1  |  提交时间:2024/06/05
解释方法,自然语言处理,隐变量模型  
Investigating Compositional Challenges in Vision-Language Models for Visual Grounding 会议论文
, Seattle WA, USA, 17-21 June 2024
作者:  Yunan Zeng;  Yan Huang;  Jinjin Zhang;  Zequn Jie;  Zhenhua Chai;  Liang Wang
Adobe PDF(4268Kb)  |  收藏  |  浏览/下载:75/24  |  提交时间:2024/06/05
组合性感知的弱监督视觉定位研究 学位论文
, 2024
作者:  曾宇楠
Adobe PDF(7681Kb)  |  收藏  |  浏览/下载:54/3  |  提交时间:2024/06/04
视觉定位,视觉语言预训练模型,弱监督,组合性