×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
多模态人工智能系统... [98]
毕业生 [67]
学术期刊 [38]
智能感知与计算研究... [20]
紫东太初大模型研究... [16]
复杂系统认知与决策... [13]
更多...
作者
徐常胜 [29]
王亮 [13]
卢汉清 [13]
杨小汕 [12]
刘静 [11]
方全 [10]
更多...
文献类型
期刊论文 [109]
学位论文 [83]
会议论文 [57]
专著 [1]
研究报告 [1]
发表日期
2024 [4]
2023 [50]
2022 [44]
2021 [40]
2020 [32]
2019 [29]
更多...
语种
英语 [90]
中文 [74]
出处
Machine I... [19]
IEEE/CAA ... [11]
IEEE TRAN... [10]
自动化学报 [7]
IEEE Trans... [4]
Internatio... [4]
更多...
资助项目
National N... [6]
National N... [6]
National N... [5]
National N... [4]
National N... [4]
National N... [3]
更多...
收录类别
SCI [58]
EI [31]
其他 [2]
CSCD [1]
ISTP [1]
SSCI [1]
更多...
导师
赵军 [8]
徐常胜 [7]
卢汉清 [4]
谭铁牛 [4]
刘成林 [3]
宗成庆 [3]
更多...
资助机构
National ... [19]
National ... [12]
Beijing Na... [4]
Fundamenta... [2]
Key Resear... [2]
Key Resear... [2]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共251条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
作者升序
作者降序
期刊影响因子升序
期刊影响因子降序
题名升序
题名降序
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
基于显著性特征提取的图像描述算法
期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 735-746
作者:
王鑫
;
宋永红
;
张元林
Adobe PDF(4402Kb)
  |  
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2024/05/20
图像描述
显著性特征提取
语言模型
编码器
解码器
卷积神经网络表征可视化研究综述
期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1890-1920
作者:
司念文
;
张文林
;
屈丹
;
罗向阳
;
常禾雨
;
牛铜
Adobe PDF(36687Kb)
  |  
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/05/20
深度学习
卷积神经网络
可解释性
表征可视化
显著图
基于多重注意结构的图像密集描述生成方法研究
期刊论文
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2537-2548
作者:
刘青茹
;
李刚
;
赵创
;
顾广华
;
赵耀
Adobe PDF(5134Kb)
  |  
收藏
  |  
浏览/下载:2/1
  |  
提交时间:2024/05/20
图像密集描述
多重注意结构
多尺度特征环路融合
多分支空间分步注意力
自适应特征融合的多模态实体对齐研究
期刊论文
自动化学报, 2024, 卷号: 50, 期号: 4, 页码: 758-770
作者:
郭浩
;
李欣奕
;
唐九阳
;
郭延明
;
赵翔
Adobe PDF(7063Kb)
  |  
收藏
  |  
浏览/下载:8/3
  |  
提交时间:2024/04/28
多模态知识图谱
实体对齐
预训练模型
特征融合
基于语境辅助转换器的图像标题生成算法
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1889-1903
作者:
连政
;
王瑞
;
李海昌
;
姚辉
;
胡晓惠
Adobe PDF(3362Kb)
  |  
收藏
  |  
浏览/下载:13/5
  |  
提交时间:2024/04/24
图像标题生成
注意力机制
转换器
视觉连贯性
A Comprehensive Overview of CFN From a Commonsense Perspective
期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 239-256
作者:
Ru Li
;
Yunxiao Zhao
;
Zhiqiang Wang
;
Xuefeng Su
;
Shaoru Guo
;
Yong Guan
;
Xiaoqi Han
;
Hongyan Zhao
Adobe PDF(2392Kb)
  |  
收藏
  |  
浏览/下载:8/2
  |  
提交时间:2024/04/23
Chinese FrameNet (CFN), commonsense, scenario commonsense, frame, knowledge
Exploring Variational Auto-encoder Architectures, Configurations, and Datasets for Generative Music Explainable AI
期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 29-45
作者:
Nick Bryan-Kinns
;
Bingyuan Zhang
;
Songyan Zhao
;
Berker Banar
Adobe PDF(1683Kb)
  |  
收藏
  |  
浏览/下载:7/4
  |  
提交时间:2024/04/23
Variational auto-encoder, explainable AI (XAI), generative music, musical features, datasets
How Good is Google Bard's Visual Understanding? An Empirical Study on Open Challenges
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 5, 页码: 605-613
作者:
Haotong Qin
;
Ge-Peng Ji
;
Salman Khan
;
Deng-Ping Fan
;
Fahad Shahbaz Khan
;
Luc Van Gool
Adobe PDF(10373Kb)
  |  
收藏
  |  
浏览/下载:5/2
  |  
提交时间:2024/04/23
Google Bard, multi-modal understanding, visual comprehension, large language models, conversational AI, chatbot
Cross-modal Contrastive Learning for Generalizable and Efficient Image-text Retrieval
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 569-582
作者:
Haoyu Lu
;
Yuqi Huo
;
Mingyu Ding
;
Nanyi Fei
;
Zhiwu Lu
Adobe PDF(2928Kb)
  |  
收藏
  |  
浏览/下载:9/2
  |  
提交时间:2024/04/23
Image-text retrieval, multimodal modeling, contrastive learning, weak correlation, computer vision
Transformer: A General Framework from Machine Translation to Others
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 514-538
作者:
Yang Zhao
;
Jiajun Zhang
;
Chengqing Zong
Adobe PDF(1415Kb)
  |  
收藏
  |  
浏览/下载:14/5
  |  
提交时间:2024/04/23
Neural machine translation, Transformer, document neural machine translation (NMT), multimodal NMT, low-resource NMT