CASIA OpenIR

浏览/检索结果: 共251条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于显著性特征提取的图像描述算法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 735-746
作者:  王鑫;  宋永红;  张元林
Adobe PDF(4402Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
图像描述  显著性特征提取  语言模型  编码器  解码器  
卷积神经网络表征可视化研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1890-1920
作者:  司念文;  张文林;  屈丹;  罗向阳;  常禾雨;  牛铜
Adobe PDF(36687Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
深度学习  卷积神经网络  可解释性  表征可视化  显著图  
基于多重注意结构的图像密集描述生成方法研究 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2537-2548
作者:  刘青茹;  李刚;  赵创;  顾广华;  赵耀
Adobe PDF(5134Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/05/20
图像密集描述  多重注意结构  多尺度特征环路融合  多分支空间分步注意力  
自适应特征融合的多模态实体对齐研究 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 4, 页码: 758-770
作者:  郭浩;  李欣奕;  唐九阳;  郭延明;  赵翔
Adobe PDF(7063Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/04/28
多模态知识图谱  实体对齐  预训练模型  特征融合  
基于语境辅助转换器的图像标题生成算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1889-1903
作者:  连政;  王瑞;  李海昌;  姚辉;  胡晓惠
Adobe PDF(3362Kb)  |  收藏  |  浏览/下载:13/5  |  提交时间:2024/04/24
图像标题生成  注意力机制  转换器  视觉连贯性  
A Comprehensive Overview of CFN From a Commonsense Perspective 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 239-256
作者:  Ru Li;  Yunxiao Zhao;  Zhiqiang Wang;  Xuefeng Su;  Shaoru Guo;  Yong Guan;  Xiaoqi Han;  Hongyan Zhao
Adobe PDF(2392Kb)  |  收藏  |  浏览/下载:8/2  |  提交时间:2024/04/23
Chinese FrameNet (CFN), commonsense, scenario commonsense, frame, knowledge  
Exploring Variational Auto-encoder Architectures, Configurations, and Datasets for Generative Music Explainable AI 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 29-45
作者:  Nick Bryan-Kinns;  Bingyuan Zhang;  Songyan Zhao;  Berker Banar
Adobe PDF(1683Kb)  |  收藏  |  浏览/下载:7/4  |  提交时间:2024/04/23
Variational auto-encoder, explainable AI (XAI), generative music, musical features, datasets  
How Good is Google Bard's Visual Understanding? An Empirical Study on Open Challenges 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 5, 页码: 605-613
作者:  Haotong Qin;   Ge-Peng Ji;  Salman Khan;  Deng-Ping Fan;  Fahad Shahbaz Khan;  Luc Van Gool
Adobe PDF(10373Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/04/23
Google Bard, multi-modal understanding, visual comprehension, large language models, conversational AI, chatbot  
Cross-modal Contrastive Learning for Generalizable and Efficient Image-text Retrieval 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 569-582
作者:  Haoyu Lu;  Yuqi Huo;  Mingyu Ding;  Nanyi Fei;  Zhiwu Lu
Adobe PDF(2928Kb)  |  收藏  |  浏览/下载:9/2  |  提交时间:2024/04/23
Image-text retrieval, multimodal modeling, contrastive learning, weak correlation, computer vision  
Transformer: A General Framework from Machine Translation to Others 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 514-538
作者:  Yang Zhao;  Jiajun Zhang;  Chengqing Zong
Adobe PDF(1415Kb)  |  收藏  |  浏览/下载:14/5  |  提交时间:2024/04/23
Neural machine translation, Transformer, document neural machine translation (NMT), multimodal NMT, low-resource NMT