验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [11]

模式识别实验室 [8]

学术期刊 [3]

脑图谱与类脑智能实验... [2]

复杂系统认知与决策实... [1]

作者

文献类型

期刊论文 [19]

学位论文 [14]

会议论文 [6]

发表日期

语种

出处

IMAGE AND ... [4]

Image and ... [3]

Machine In... [3]

Brain Conn... [1]

IEEE ROBOT... [1]

IEEE TRANS... [1]

资助项目

Beijing Mu... [1]

Beijing Na... [1]

Beijing Na... [1]

National K... [1]

National N... [1]

National N... [1]

收录类别

EI [6]

导师

资助机构

6162010600... [1]

6172010600... [1]

Beijing Mu... [1]

Beijing Na... [1]

Beijing Na... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共39条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	面向视觉-语言的跨模态预训练与匹配方法研究学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb) \| 收藏 \| 浏览/下载：13/1 \| 提交时间：2024/07/11 视觉语言匹配图像文本预训练知识蒸馏双向匹配评估令牌合并
	ViLEM: Visual-Language Error Modeling for Image-Text Retrieval 会议论文 , 加拿大温哥华, 2023-6 作者: chen yuxin; ma zongyang; zhang ziqi; qi zhongang; yuan chunfeng; shan ying; li bing; hu weiming; qie xiaohu; wu jianping Adobe PDF(1379Kb) \| 收藏 \| 浏览/下载：24/6 \| 提交时间：2024/06/25
	Investigating Compositional Challenges in Vision-Language Models for Visual Grounding 会议论文 , Seattle WA, USA, 17-21 June 2024 作者: Yunan Zeng; Yan Huang; Jinjin Zhang; Zequn Jie; Zhenhua Chai; Liang Wang Adobe PDF(4268Kb) \| 收藏 \| 浏览/下载：51/13 \| 提交时间：2024/06/05
	组合性感知的弱监督视觉定位研究学位论文 , 2024 作者: 曾宇楠 Adobe PDF(7681Kb) \| 收藏 \| 浏览/下载：50/3 \| 提交时间：2024/06/04 视觉定位，视觉语言预训练模型，弱监督，组合性
	弱监督数据条件下的场景分割方法研究学位论文 , 2024 作者: 覃杰 Adobe PDF(9886Kb) \| 收藏 \| 浏览/下载：41/3 \| 提交时间：2024/06/03 场景分割弱监督数据图像级标注半监督分割开放域场景
	GPT-4V with Emotion: A Zero-shot Benchmark for Generalized Emotion Recognition 期刊论文 Information Fusion, 2024, 页码: 1-12 作者: Zheng Lian; Licai Sun; Haiyang Sun; Kang Chen; Zhuofan Wen; Hao Gu; Bin Liu; Jianhua Tao Adobe PDF(6888Kb) \| 收藏 \| 浏览/下载：59/8 \| 提交时间：2024/05/31
	基于低秩约束的熵加权多视角模糊聚类算法期刊论文自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1760-1770 作者: 张嘉旭; 王骏; 张春香; 林得富; 周塔; 王士同 Adobe PDF(1846Kb) \| 收藏 \| 浏览/下载：19/10 \| 提交时间：2024/05/20 多视角模糊聚类香农熵低秩约束核范数交替方向乘子法
	VLP: A Survey on Vision-language Pre-training 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56 作者: Fei-Long Chen; Du-Zhen Zhang; Ming-Lun Han; Xiu-Yi Chen; Jing Shi; Shuang Xu; Bo Xu Adobe PDF(1427Kb) \| 收藏 \| 浏览/下载：47/14 \| 提交时间：2024/04/23 Vision and language pre-training transformers multimodal learning representation learning
	Causal Reasoning Meets Visual Representation Learning: A Prospective Study 期刊论文 Machine Intelligence Research, 2022, 卷号: 19, 期号: 6, 页码: 485-511 作者: Yang Liu; Yu-Shen Wei; Hong Yan; Guan-Bin Li; Liang Lin Adobe PDF(3224Kb) \| 收藏 \| 浏览/下载：40/4 \| 提交时间：2024/04/23 Causal reasoning visual representation learning reliable artificial intelligence spatial-temporal data multi-modal analysis
	Multi-Correlation Siamese Transformer Network With Dense Connection for 3D Single Object Tracking 期刊论文 IEEE ROBOTICS AND AUTOMATION LETTERS, 2023, 卷号: 8, 期号: 12, 页码: 8066-8073 作者: Feng, Shihao; Liang, Pengpeng; Gao, Jin; Cheng, Erkang Adobe PDF(2745Kb) \| 收藏 \| 浏览/下载：122/6 \| 提交时间：2023/12/21 3D object tracking Point cloud Transformer

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25752
全文量13633
访问量5634053
下载量871154

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495