验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统全... [7]

学术期刊 [4]

模式识别实验室 [2]

紫东太初大模型研究中... [1]

综合信息系统研究中心 [1]

数字内容技术与服务研... [1]

作者

文献类型

期刊论文 [16]

会议论文 [1]

发表日期

2024 [17]

语种

出处

Machine In... [4]

IEEE TRANS... [3]

IEEE TRANS... [2]

APPLIED IN... [1]

IEEE ROBOT... [1]

IEEE Trans... [1]

资助项目

National N... [6]

Excellent ... [1]

Ministry o... [1]

National K... [1]

National K... [1]

National N... [1]

收录类别

EI [1]

导师

资助机构

National N... [6]

Excellent ... [1]

Ministry o... [1]

National K... [1]

National K... [1]

National N... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共17条，第1-10条

帮助

限定条件

发表日期：2024

已选(0)清除条数/页：排序方式：
	CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 6906-6916 作者: Wang, Wenxuan; He, Xingjian; Zhang, Yisi; Guo, Longteng; Shen, Jiachen; Li, Jiangyun; Liu, Jing 收藏 \| 浏览/下载：3/0 \| 提交时间：2024/07/03 Referring image segmentation cross-modality guidance masked self-distillation vision and language
	Multi-Stage Image-Language Cross-Generative Fusion Network for Video-Based Referring Expression Comprehension 期刊论文 IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 3256-3270 作者: Zhang, Yujia; Li, Qianzhong; Pan, Yi; Zhao, Xiaoguang; Tan, Min 收藏 \| 浏览/下载：7/0 \| 提交时间：2024/07/03 Feature extraction Visualization Task analysis Representation learning Location awareness Linguistics Grounding Video-based referring expression comprehension multi-stage learning image-language cross-generative fusion consistency loss
	Comprehensive Attribute Prediction Learning for Person Search by Language 期刊论文 IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 1990-2003 作者: Niu, Kai; Huang, Linjiang; Long, Yuzhou; Huang, Yan; Wang, Liang; Zhang, Yanning 收藏 \| 浏览/下载：3/0 \| 提交时间：2024/07/03 Person search by language cross-modal retrieval smart video surveillance attribute prediction
	SgVA-CLIP: Semantic-Guided Visual Adapting of Vision-Language Models for Few-Shot Image Classification 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 3469-3480 作者: Peng, Fang; Yang, Xiaoshan; Xiao, Linhui; Wang, Yaowei; Xu, Changsheng 收藏 \| 浏览/下载：6/0 \| 提交时间：2024/07/03 Few-shot image classification vision-language models
	An end-to-end model for multi-view scene text recognition 期刊论文 PATTERN RECOGNITION, 2024, 卷号: 149, 页码: 17 作者: Banerjee, Ayan; Shivakumara, Palaiahnakote; Bhattacharya, Saumik; Pal, Umapada; Liu, Cheng-Lin 收藏 \| 浏览/下载：7/0 \| 提交时间：2024/07/03 Text detection Scene text recognition Siamese network Natural language model Genetic algorithm Multi-view text detection
	Memory-Adaptive Vision-and-Language Navigation 期刊论文 Pattern Recognition, 2024, 卷号: 153, 页码: 110511 作者: Keji He; Ya Jing; Yan Huang; Zhihe Lu; Dong An; Liang Wang Adobe PDF(3831Kb) \| 收藏 \| 浏览/下载：38/15 \| 提交时间：2024/06/26 Vision-and-Language Navigation Memory bank History noises Memory-Adaptive Model
	Training Large Language Models to Follow System Prompt with Self-Supervised Fine-Tuning 会议论文 , YOKOHAMA, JAPAN, 2024-07 作者: Junyan Qiu; Haitao Wang; Yiping Yang Adobe PDF(1596Kb) \| 收藏 \| 浏览/下载：40/17 \| 提交时间：2024/06/17 large language models supervised fine-tuning instruct tuning stylized generation
	Prompting Large Language Models for Automatic Question Tagging 期刊论文 Machine Intelligence Research, 2024, 页码: 0 作者: Nuojia Xu; Dizhan Xue; Shengsheng Qian; Quan Fang; Jun Hu Adobe PDF(1493Kb) \| 收藏 \| 浏览/下载：38/17 \| 提交时间：2024/06/04 Community Question Answering Machine Learning Large Language Model Prompt Learning Question Tagging
	CLIP-VG: Self-Paced Curriculum Adapting of CLIP for Visual Grounding 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 4334-4347 作者: Xiao, Linhui; Yang, Xiaoshan; Peng, Fang; Yan, Ming; Wang, Yaowei; Xu, Changsheng 收藏 \| 浏览/下载：28/0 \| 提交时间：2024/05/30 Grounding Reliability Adaptation models Task analysis Visualization Data models Annotations Visual grounding curriculum learning pseudo-language label and vision-language models
	GesGPT: Speech Gesture Synthesis With Text Parsing From ChatGPT 期刊论文 IEEE ROBOTICS AND AUTOMATION LETTERS, 2024, 卷号: 9, 期号: 3, 页码: 2718-2725 作者: Gao, Nan; Zhao, Zeyu; Zeng, Zhi; Zhang, Shuwu; Weng, Dongdong; Bao, Yihua 收藏 \| 浏览/下载：41/0 \| 提交时间：2024/05/30 Semantics Chatbots Task analysis Robots Deep learning Cognition Annotations Gesture synthesis human robot interaction large language model

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25772
全文量13653
访问量5687049
下载量885251

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495