CASIA OpenIR

浏览/检索结果: 共181条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文
IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931
作者:  Zhang Xi(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(4719Kb)  |  收藏  |  浏览/下载:19/5  |  提交时间:2024/07/08
CGNN: A Compatibility-aware Graph Neural Network for Social Media Bot Detection 期刊论文
IEEE Transactions on Computational Social System, 2024, 页码: Early Access
作者:  Huang, Haitao;  Tian, Hu;  Zheng, Xiaolong;  Zhang, Xingwei;  Zeng, Dajun;  Wang, Feiyue
Adobe PDF(2267Kb)  |  收藏  |  浏览/下载:14/6  |  提交时间:2024/07/08
graph neural network  heterogeneous compatibility  social media bot detection  
面向多模态语义理解与推理的视觉问答研究 学位论文
, 2024
作者:  张熙
Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:16/1  |  提交时间:2024/07/08
多模态  视觉问答  语义挖掘  可靠关联  推理泛化  
Attribute-Guided Cross-Modal Interaction and Enhancement for Audio-Visual Matching 期刊论文
IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, 2024, 卷号: 19, 页码: 4986-4998
作者:  Wang, Jiaxiang;  Zheng, Aihua;  Yan, Yan;  He, Ran;  Tang, Jin
收藏  |  浏览/下载:2/0  |  提交时间:2024/07/03
Audio-visual cross-modal matching  attribute-guided cross-modal interaction  attribute-guided cross-modal enhancement  
融合多模态太阳数据及其动态特征的Kp指数预报 学位论文
, 2024
作者:  张天宇
Adobe PDF(7337Kb)  |  收藏  |  浏览/下载:35/1  |  提交时间:2024/07/01
地磁暴  Kp指数预报  多模态数据  动态特征  注意力机制  
Memory-Adaptive Vision-and-Language Navigation 期刊论文
Pattern Recognition, 2024, 卷号: 153, 页码: 110511
作者:  Keji He;  Ya Jing;  Yan Huang;  Zhihe Lu;  Dong An;  Liang Wang
Adobe PDF(3831Kb)  |  收藏  |  浏览/下载:32/11  |  提交时间:2024/06/26
Vision-and-Language Navigation  Memory bank  History noises  Memory-Adaptive Model  
结构启发的神经语义解析方法研究 学位论文
, 2024
作者:  张翔
Adobe PDF(3373Kb)  |  收藏  |  浏览/下载:32/0  |  提交时间:2024/06/26
自然语言理解  神经语义解析  形式化语义表示  组合泛化  
跨模态信息融合的文本图像翻译方法研究 学位论文
, 2024
作者:  马聪
Adobe PDF(11285Kb)  |  收藏  |  浏览/下载:38/5  |  提交时间:2024/06/26
文本图像翻译  跨模态信息融合  多任务学习  跨模态对比学习  参数高效微调  
Modal Contrastive Learning Based End-to-End Text Image Machine Translation 期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing (IEEE/ACM TASLP), 2023, 卷号: 32, 期号: 32, 页码: 2153-2165
作者:  Ma, Cong;  Han, Xu;  Wu, Linghui;  Zhang, Yaping;  Zhao, Yang;  Zhou, Yu;  Zong, Chengqing
Adobe PDF(6551Kb)  |  收藏  |  浏览/下载:20/9  |  提交时间:2024/06/26
Transformers  Machine translation  Decoding  Semantics  Pipelines  Text recognition  Task analysis  Text image machine translation  contrastive learning  text image recognition  machine translation