×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
多模态人工智能系统... [43]
毕业生 [38]
学术期刊 [23]
紫东太初大模型研究... [15]
智能感知与计算研究... [12]
复杂系统认知与决策实... [8]
更多...
作者
徐常胜 [13]
刘静 [8]
王亮 [8]
杨小汕 [8]
卢汉清 [8]
谭铁牛 [7]
更多...
文献类型
期刊论文 [73]
学位论文 [50]
会议论文 [17]
研究报告 [2]
发表日期
2024 [4]
2023 [29]
2022 [24]
2021 [31]
2020 [15]
2019 [17]
更多...
语种
英语 [50]
中文 [45]
出处
Machine I... [10]
PATTERN RE... [7]
IEEE TRANS... [6]
IEEE/CAA J... [6]
自动化学报 [6]
Internatio... [3]
更多...
资助项目
National N... [4]
National N... [3]
Capital Sc... [2]
National K... [2]
National K... [2]
National N... [2]
更多...
收录类别
SCI [42]
EI [8]
其他 [2]
导师
卢汉清 [5]
王亮 [5]
谭铁牛 [3]
徐常胜 [2]
潘春洪 [2]
赵晓光 [2]
更多...
资助机构
National ... [13]
National K... [7]
Beijing Na... [3]
61532009 [2]
61572498 [2]
Capital Sc... [2]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共142条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
作者升序
作者降序
期刊影响因子升序
期刊影响因子降序
题名升序
题名降序
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
从视频到语言:视频标题生成与描述研究综述
期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:
汤鹏杰
;
王瀚漓
Adobe PDF(8546Kb)
  |  
收藏
  |  
浏览/下载:3/1
  |  
提交时间:2024/05/20
视频描述
卷积神经网络
循环神经网络
语段生成
情感表达
逻辑语义
视觉Transformer研究的关键问题:现状及展望
期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 957-979
作者:
田永林
;
王雨桐
;
王建功
;
王晓
;
王飞跃
Adobe PDF(6913Kb)
  |  
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2024/05/20
视觉Transformer
图像分类
目标检测
图像分割
计算机视觉
卷积神经网络表征可视化研究综述
期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1890-1920
作者:
司念文
;
张文林
;
屈丹
;
罗向阳
;
常禾雨
;
牛铜
Adobe PDF(36687Kb)
  |  
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/05/20
深度学习
卷积神经网络
可解释性
表征可视化
显著图
基于多重注意结构的图像密集描述生成方法研究
期刊论文
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2537-2548
作者:
刘青茹
;
李刚
;
赵创
;
顾广华
;
赵耀
Adobe PDF(5134Kb)
  |  
收藏
  |  
浏览/下载:2/1
  |  
提交时间:2024/05/20
图像密集描述
多重注意结构
多尺度特征环路融合
多分支空间分步注意力
视觉语言导航研究进展
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14
作者:
司马双霖
;
黄岩
;
何科技
;
安东
;
袁辉
;
王亮
Adobe PDF(6272Kb)
  |  
收藏
  |  
浏览/下载:16/5
  |  
提交时间:2024/05/09
视觉语言导航
视觉语言理解
跨模态匹配
具身智能
Comprehensive Relation Modelling for Image Paragraph Generation
期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 369-382
作者:
Xianglu Zhu
;
Zhang Zhang
;
Wei Wang
;
Zilei Wang
Adobe PDF(1963Kb)
  |  
收藏
  |  
浏览/下载:14/7
  |  
提交时间:2024/04/23
Image paragraph generation, visual relationship, scene graph, graph convolutional network (GCN), long short-term memory
Cogeneration of Innovative Audio-visual Content: A New Challenge for Computing Art
期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 4-28
作者:
Mengting Liu
;
Ying Zhou
;
Yuwei Wu
;
Feng Gao
Adobe PDF(14438Kb)
  |  
收藏
  |  
浏览/下载:20/1
  |  
提交时间:2024/04/23
Artificial intelligence (AI) art, audio-visual, artificial intelligence generated content (AIGC), multimodal, artistic evaluation
Cross-modal Contrastive Learning for Generalizable and Efficient Image-text Retrieval
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 569-582
作者:
Haoyu Lu
;
Yuqi Huo
;
Mingyu Ding
;
Nanyi Fei
;
Zhiwu Lu
Adobe PDF(2928Kb)
  |  
收藏
  |  
浏览/下载:9/2
  |  
提交时间:2024/04/23
Image-text retrieval, multimodal modeling, contrastive learning, weak correlation, computer vision
Large-scale Multi-modal Pre-trained Models: A Comprehensive Survey
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 447-482
作者:
Xiao Wang
;
Guangyao Chen
;
Guangwu Qian
;
Pengcheng Gao
;
Xiao-Yong Wei
;
Yaowei Wang
;
Yonghong Tian
;
Wen Gao
Adobe PDF(3540Kb)
  |  
收藏
  |  
浏览/下载:17/3
  |  
提交时间:2024/04/23
Multi-modal (MM), pre-trained model (PTM), information fusion, representation learning, deep learning
VLP: A Survey on Vision-language Pre-training
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:
Fei-Long Chen
;
Du-Zhen Zhang
;
Ming-Lun Han
;
Xiu-Yi Chen
;
Jing Shi
;
Shuang Xu
;
Bo Xu
Adobe PDF(1427Kb)
  |  
收藏
  |  
浏览/下载:13/4
  |  
提交时间:2024/04/23
Vision and language
pre-training
transformers
multimodal learning
representation learning