×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
多模态人工智能系统... [18]
紫东太初大模型研究中... [4]
模式识别实验室 [3]
复杂系统认知与决策实... [1]
作者
徐常胜 [11]
杨小汕 [6]
高君宇 [5]
刘静 [4]
卢汉清 [4]
王亮 [3]
更多...
文献类型
期刊论文 [26]
发表日期
2024 [2]
2023 [4]
2022 [5]
2021 [8]
2020 [4]
2019 [3]
更多...
语种
英语 [26]
出处
IEEE TRANS... [8]
ACM TRANSA... [2]
IEEE TRANS... [2]
IEEE Trans... [2]
PATTERN RE... [2]
Computatio... [1]
更多...
资助项目
National N... [7]
National N... [7]
National N... [6]
National N... [6]
National N... [5]
Beijing Na... [4]
更多...
收录类别
SCI [26]
导师
资助机构
National ... [26]
National ... [11]
Beijing Na... [6]
Key Resear... [5]
Research P... [4]
Beijing Na... [1]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共26条,第1-10条
帮助
限定条件
资助机构:National Natural Science Foundation of China
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
作者升序
作者降序
发表日期升序
发表日期降序
期刊影响因子升序
期刊影响因子降序
Modal Contrastive Learning Based End-to-End Text Image Machine Translation
期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing (IEEE/ACM TASLP), 2023, 卷号: 32, 期号: 32, 页码: 2153-2165
作者:
Ma, Cong
;
Han, Xu
;
Wu, Linghui
;
Zhang, Yaping
;
Zhao, Yang
;
Zhou, Yu
;
Zong, Chengqing
Adobe PDF(6551Kb)
  |  
收藏
  |  
浏览/下载:27/14
  |  
提交时间:2024/06/26
Transformers
Machine translation
Decoding
Semantics
Pipelines
Text recognition
Task analysis
Text image machine translation
contrastive learning
text image recognition
machine translation
The survey on multi-source data fusion in cyber-physical-social systems: Foundational infrastructure for industrial metaverses and industries 5.0
期刊论文
Information Fusion, 2024, 卷号: 107, 页码: 1-16
作者:
Xiao Wang
;
Yutong Wang
;
Jing Yang
;
Xiaofeng Jia
;
Lijun Li
;
Weiping Ding
;
Fei-Yue Wang
Adobe PDF(4446Kb)
  |  
收藏
  |  
浏览/下载:46/7
  |  
提交时间:2024/06/06
Multi-source data fusion
CPSS
Industrial metaverses
Parallel manufacturing
Social manufacturing
Tri-relational multi-faceted graph neural networks for automatic question tagging
期刊论文
Neurocomputing, 2024, 卷号: 576, 页码: 127250
作者:
Nuojia Xu
;
Jun Hu
;
Quan Fang
;
Dizhan Xue
;
Yongxi Li
;
Shengsheng Qian
Adobe PDF(2105Kb)
  |  
收藏
  |  
浏览/下载:43/20
  |  
提交时间:2024/06/04
Graph Neural Networks
Community Question Answering
Question Tagging
Reducing Vision-Answer Biases for Multiple-Choice VQA
期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2023, 卷号: 32, 页码: 4621-4634
作者:
Zhang, Xi
;
Zhang, Feifei
;
Xu, Changsheng
Adobe PDF(2684Kb)
  |  
收藏
  |  
浏览/下载:90/5
  |  
提交时间:2023/11/17
Multiple-choice VQA
vision-answer bias
causal intervention
counterfactual interaction learning
Latent Structure Mining With Contrastive Modality Fusion for Multimedia Recommendation
期刊论文
IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, 2023, 卷号: 35, 期号: 9, 页码: 9154-9167
作者:
Zhang, Jinghao
;
Zhu, Yanqiao
;
Liu, Qiang
;
Zhang, Mengqi
;
Wu, Shu
;
Wang, Liang
Adobe PDF(1134Kb)
  |  
收藏
  |  
浏览/下载:157/10
  |  
提交时间:2023/11/17
Multimedia recommendation
graph structure learning
contrastive learning
Recovering Generalization via Pre-training-like Knowledge Distillation for Out-of-Distribution Visual Question Answering
期刊论文
IEEE Transactions on Multimedia, 2023, 卷号: 26, 页码: 1-15
作者:
Song, Yaguang
;
Yang, Xiaoshan
;
Wang, Yaowei
;
Xu, Changsheng
Adobe PDF(2397Kb)
  |  
收藏
  |  
浏览/下载:200/50
  |  
提交时间:2023/06/12
Multi-modal Foundation Model
Out-of-Distribution Generalization
Visual Question Answering
Knowledge Distillation
Weakly-Supervised Video Object Grounding Via Learning Uni-Modal Associations
期刊论文
IEEE Transactions on Multimedia, 2022, 卷号: 25, 页码: 1-12
作者:
Wang, Wei
;
Gao, Junyu
;
Xu, Changsheng
Adobe PDF(5406Kb)
  |  
收藏
  |  
浏览/下载:140/41
  |  
提交时间:2023/04/25
Visualization
Grounding
Task analysis
Prototypes
Annotations
Uncertainty
Proposals
Cross-modal retrieval
weakly-supervised learning
video object grounding
uni-modal association
A Framework and Operational Procedures for Metaverses-Based Industrial Foundation Models
期刊论文
IEEE TRANSACTIONS ON SYSTEMS MAN CYBERNETICS-SYSTEMS, 2022, 页码: 10
作者:
Wang, Jiangong
;
Tian, Yonglin
;
Wang, Yutong
;
Yang, Jing
;
Wang, Xingxia
;
Wang, Sanjin
;
Kwan, Oliver
Adobe PDF(3322Kb)
  |  
收藏
  |  
浏览/下载:177/58
  |  
提交时间:2023/02/22
Cyber-physical-social intelligence (CPSI)
cyber-physical-social systems (CPSSs)
industrial foundation models (IFMs)
intelligent enterprises
metaverses
operational processes
parallel intelligence
Explicit Cross-Modal Representation Learning for Visual Commonsense Reasoning
期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2022, 卷号: 24, 页码: 2986-2997
作者:
Zhang, Xi
;
Zhang, Feifei
;
Xu, Changsheng
Adobe PDF(5681Kb)
  |  
收藏
  |  
浏览/下载:415/4
  |  
提交时间:2022/07/25
Cognition
Video recording
Syntactics
Visualization
Task analysis
Semantics
Linguistics
Visual Commonsense Reasoning
explicit reasoning
syntactic structure
interpretability
Holographic Feature Learning of Egocentric-Exocentric Videos for Multi-Domain Action Recognition
期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2022, 卷号: 24, 页码: 2273-2286
作者:
Huang, Yi
;
Yang, Xiaoshan
;
Gao, Junyun
;
Xu, Changsheng
Adobe PDF(2409Kb)
  |  
收藏
  |  
浏览/下载:376/75
  |  
提交时间:2022/07/25
Videos
Feature extraction
Visualization
Task analysis
Computational modeling
Target recognition
Prototypes
Egocentric videos
exocentric videos
holographic feature
multi-domain
action recognition