验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [64]

智能感知与计算研究中... [9]

09年以前成果 [8]

脑图谱与类脑智能实验... [6]

紫东太初大模型研究中... [6]

复杂系统认知与决策实... [5]

作者

文献类型

期刊论文 [106]

学位论文 [1]

发表日期

语种

出处

IEEE-ACM T... [7]

JOURNAL OF... [6]

PATTERN RE... [6]

NEUROCOMPU... [5]

AFFECTIVE ... [4]

IEEE TRANS... [4]

资助项目

National ... [10]

National N... [8]

National N... [8]

National N... [6]

Inria-CAS ... [4]

Inria-CAS ... [3]

收录类别

SCI [107]

导师

资助机构

National ... [12]

National ... [11]

National K... [6]

Inria-CAS ... [4]

National K... [4]

National K... [3]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共107条，第1-10条

帮助

限定条件

收录类别：SCI

已选(0)清除条数/页：排序方式：
	GesGPT: Speech Gesture Synthesis With Text Parsing From ChatGPT 期刊论文 IEEE ROBOTICS AND AUTOMATION LETTERS, 2024, 卷号: 9, 期号: 3, 页码: 2718-2725 作者: Gao, Nan; Zhao, Zeyu; Zeng, Zhi; Zhang, Shuwu; Weng, Dongdong; Bao, Yihua 收藏 \| 浏览/下载：1/0 \| 提交时间：2024/05/30 Semantics Chatbots Task analysis Robots Deep learning Cognition Annotations Gesture synthesis human robot interaction large language model
	Pixel-Wise Grasp Detection via Twin Deconvolution and Multi-Dimensional Attention 期刊论文 IEEE Transactions on Circuits and Systems for Video Technology, 2023, 卷号: 33, 期号: 8, 页码: 4002-4010 作者: Ren, Guangli; Geng, Wenjie; Guan, Peiyu; Cao, Zhiqiang; Yu, Junzhi Adobe PDF(4013Kb) \| 收藏 \| 浏览/下载：5/1 \| 提交时间：2024/05/28
	GAN-Based Facial Attribute Manipulation 期刊论文 IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2023, 卷号: 45, 期号: 12, 页码: 14590-14610 作者: Liu, Yunfan; Li, Qi; Deng, Qiyao; Sun, Zhenan; Yang, Ming-Hsuan Adobe PDF(15297Kb) \| 收藏 \| 浏览/下载：44/13 \| 提交时间：2024/02/22 Generative adversarial networks image translation facial attribute manipulation
	Reparameterizing and dynamically quantizing image features for image generation 期刊论文 PATTERN RECOGNITION, 2024, 卷号: 146, 页码: 11 作者: Sun, Mingzhen; Wang, Weining; Zhu, Xinxin; Liu, Jing Adobe PDF(3612Kb) \| 收藏 \| 浏览/下载：126/15 \| 提交时间：2023/12/21 Vector quantization Variational auto-encoder Unconditional image generation Text-to-image generation Autoregressive generation
	Adversarial Multi-Task Learning for Mandarin Prosodic Boundary Prediction With Multi-Modal Embeddings 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2023, 卷号: 31, 页码: 2963-2973 作者: Yi, Jiangyan; Tao, Jianhua; Fu, Ruibo; Wang, Tao; Zhang, Chu Yuan; Wang, Chenglong 收藏 \| 浏览/下载：53/0 \| 提交时间：2023/11/17 Adversarial training multi-task learning prosodic boundaries speech synthesis multi-modal embeddings
	Attention Weighted Local Descriptors 期刊论文 IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2023, 卷号: 45, 期号: 9, 页码: 10632-10649 作者: Wang, Changwei; Xu, Rongtao; Lu, Ke; Xu, Shibiao; Meng, Weiliang; Zhang, Yuyang; Fan, Bin; Zhang, Xiaopeng Adobe PDF(8075Kb) \| 收藏 \| 浏览/下载：130/1 \| 提交时间：2023/11/17 Local features detection and description consistent attention mechanism context augmentation lightweight local descriptors knowledge distillation
	GCNet: Graph Completion Network for Incomplete Multimodal Learning in Conversation 期刊论文 IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2023, 卷号: 45, 期号: 7, 页码: 8419-8432 作者: Lian, Zheng; Chen, Lan; Sun, Licai; Liu, Bin; Tao, Jianhua Adobe PDF(3959Kb) \| 收藏 \| 浏览/下载：136/0 \| 提交时间：2023/11/17 Oral communication Correlation Data models Task analysis Feature extraction Tensors Benchmark testing Conversational data graph complete network (GCNet) incomplete multimodal learning speaker-sensitive modeling temporal-sensitive modeling
	SMIN: Semi-Supervised Multi-Modal Interaction Network for Conversational Emotion Recognition 期刊论文 IEEE TRANSACTIONS ON AFFECTIVE COMPUTING, 2023, 卷号: 14, 期号: 3, 页码: 2415-2429 作者: Lian, Zheng; Liu, Bin; Tao, Jianhua Adobe PDF(2103Kb) \| 收藏 \| 浏览/下载：104/0 \| 提交时间：2023/11/15 Emotion recognition Feature extraction Training Acoustics Semisupervised learning Benchmark testing Hidden Markov models Semi-supervised multi-modal interaction network (SMIN) conversational emotion recognition semi-supervised learning intra-modal interaction cross-modal interaction
	Everybody’s Talkin’: Let Me Talk as You Want 期刊论文 IEEE Transactions on Information Forensics and Security, 2022, 卷号: 17, 期号: 1, 页码: 585 - 598 作者: 宋林森; 吴文岩; 钱晨; 赫然; Loy, Chen Change Adobe PDF(15432Kb) \| 收藏 \| 浏览/下载：79/11 \| 提交时间：2023/06/29 Talking face generation Video generation GAN Audio dubbing
	基于视听融合的目标定位与趋近导航学位论文 , 2023 作者: 王智清 Adobe PDF(49485Kb) \| 收藏 \| 浏览/下载：129/10 \| 提交时间：2023/06/02 听觉特征，声源定位，趋近控制，机器人运动，多目标定位，视听融合

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24898
全文量12750
访问量5184346
下载量795905

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495