验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [13]

模式识别实验室 [6]

学术期刊 [5]

复杂系统认知与决策实... [3]

紫东太初大模型研究中... [3]

作者

文献类型

学位论文 [16]

期刊论文 [16]

会议论文 [12]

发表日期

语种

出处

Machine In... [3]

IEEE/CAA J... [2]

ACM TRANSA... [1]

ACM Transa... [1]

IEEE TRANS... [1]

资助项目

Beijing Na... [1]

Jiangsu Pr... [1]

Key Resear... [1]

National K... [1]

National K... [1]

National K... [1]

收录类别

SCI [9]

EI [3]

导师

资助机构

National N... [4]

National K... [2]

Beijing Na... [1]

Jiangsu Pr... [1]

Key Resear... [1]

National K... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共44条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	面向视觉-语言的跨模态预训练与匹配方法研究学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb) \| 收藏 \| 浏览/下载：13/1 \| 提交时间：2024/07/11 视觉语言匹配图像文本预训练知识蒸馏双向匹配评估令牌合并
	NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文 IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931 作者: Zhang Xi(张熙); Feifei Zhang; Changsheng Xu Adobe PDF(4719Kb) \| 收藏 \| 浏览/下载：19/5 \| 提交时间：2024/07/08
	Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文 , Chengdu, China, 2021-10 作者: Zhang X(张熙); Feifei Zhang; Changsheng Xu Adobe PDF(5740Kb) \| 收藏 \| 浏览/下载：22/5 \| 提交时间：2024/07/08
	面向多模态语义理解与推理的视觉问答研究学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb) \| 收藏 \| 浏览/下载：16/1 \| 提交时间：2024/07/08 多模态视觉问答语义挖掘可靠关联推理泛化
	Calibration & Reconstruction: Deep Integrated Language for Referring Image Segmentation 会议论文 Proceedings of the 2024 International Conference on Multimedia Retrieval, Phuket, Thailand, 2024/03/08 作者: Yichen Yan; Xingjian He; Sihan Chen; Jing Liu Adobe PDF(2868Kb) \| 收藏 \| 浏览/下载：12/5 \| 提交时间：2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision
	Fuse & Calibrate: A bi-directional Vision-Language Guided Framework for Referring Image Segmentation 会议论文 , Tianjin, China, 2024/08/05 作者: Yichen Yan; Xingjian He; Sihan Chen; Shichen Lu; Jing Liu Adobe PDF(1978Kb) \| 收藏 \| 浏览/下载：11/6 \| 提交时间：2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision
	Multi-Stage Image-Language Cross-Generative Fusion Network for Video-Based Referring Expression Comprehension 期刊论文 IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 3256-3270 作者: Zhang, Yujia; Li, Qianzhong; Pan, Yi; Zhao, Xiaoguang; Tan, Min 收藏 \| 浏览/下载：5/0 \| 提交时间：2024/07/03 Feature extraction Visualization Task analysis Representation learning Location awareness Linguistics Grounding Video-based referring expression comprehension multi-stage learning image-language cross-generative fusion consistency loss
	Memory-Adaptive Vision-and-Language Navigation 期刊论文 Pattern Recognition, 2024, 卷号: 153, 页码: 110511 作者: Keji He; Ya Jing; Yan Huang; Zhihe Lu; Dong An; Liang Wang Adobe PDF(3831Kb) \| 收藏 \| 浏览/下载：32/11 \| 提交时间：2024/06/26 Vision-and-Language Navigation Memory bank History noises Memory-Adaptive Model
	Part-aware Prompt Tuning For Weakly Supervised Referring Expression Grounding 会议论文 , Amsterdam, 2024-1-29 作者: Chenlin, Zhao; Jiabo, Ye; Yaguang, Song; Ming, Yan; Xiaoshan, Yang; Changsheng, Xu Adobe PDF(6114Kb) \| 收藏 \| 浏览/下载：23/8 \| 提交时间：2024/06/21
	基于多模态预训练模型的弱监督跨模态目标定位学位论文 , 2024 作者: 赵宸麟 Adobe PDF(7997Kb) \| 收藏 \| 浏览/下载：28/3 \| 提交时间：2024/06/20 弱监督提示学习跨模态目标定位

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25752
全文量13633
访问量5636127
下载量871400

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495