CASIA OpenIR

浏览/检索结果: 共294条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向特征学习的图像开集识别方法研究 学位论文
, 2024
作者:  孙珈因
Adobe PDF(8220Kb)  |  收藏  |  浏览/下载:8/2  |  提交时间:2024/05/23
开集识别  分布建模  层级注意力  频域滤波  反事实去混淆  直推式框架  
基于自注意力对抗的深度子空间聚类 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 271-281
作者:  尹明;  吴浩杨;  谢胜利;  杨其宇
Adobe PDF(5066Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/20
子空间聚类  生成对抗网络  自注意力模型  深度学习  
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
基于显著性特征提取的图像描述算法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 735-746
作者:  王鑫;  宋永红;  张元林
Adobe PDF(4402Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
图像描述  显著性特征提取  语言模型  编码器  解码器  
卷积神经网络表征可视化研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1890-1920
作者:  司念文;  张文林;  屈丹;  罗向阳;  常禾雨;  牛铜
Adobe PDF(36687Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
深度学习  卷积神经网络  可解释性  表征可视化  显著图  
基于多重注意结构的图像密集描述生成方法研究 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2537-2548
作者:  刘青茹;  李刚;  赵创;  顾广华;  赵耀
Adobe PDF(5134Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/05/20
图像密集描述  多重注意结构  多尺度特征环路融合  多分支空间分步注意力  
基于语境辅助转换器的图像标题生成算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1889-1903
作者:  连政;  王瑞;  李海昌;  姚辉;  胡晓惠
Adobe PDF(3362Kb)  |  收藏  |  浏览/下载:13/5  |  提交时间:2024/04/24
图像标题生成  注意力机制  转换器  视觉连贯性  
Comprehensive Relation Modelling for Image Paragraph Generation 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 369-382
作者:  Xianglu Zhu;  Zhang Zhang;  Wei Wang;  Zilei Wang
Adobe PDF(1963Kb)  |  收藏  |  浏览/下载:14/7  |  提交时间:2024/04/23
Image paragraph generation, visual relationship, scene graph, graph convolutional network (GCN), long short-term memory  
Cogeneration of Innovative Audio-visual Content: A New Challenge for Computing Art 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 4-28
作者:  Mengting Liu;  Ying Zhou;  Yuwei Wu;  Feng Gao
Adobe PDF(14438Kb)  |  收藏  |  浏览/下载:20/1  |  提交时间:2024/04/23
Artificial intelligence (AI) art, audio-visual, artificial intelligence generated content (AIGC), multimodal, artistic evaluation  
Cross-modal Contrastive Learning for Generalizable and Efficient Image-text Retrieval 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 569-582
作者:  Haoyu Lu;  Yuqi Huo;  Mingyu Ding;  Nanyi Fei;  Zhiwu Lu
Adobe PDF(2928Kb)  |  收藏  |  浏览/下载:8/2  |  提交时间:2024/04/23
Image-text retrieval, multimodal modeling, contrastive learning, weak correlation, computer vision