CASIA OpenIR

浏览/检索结果: 共258条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
基于显著性特征提取的图像描述算法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 735-746
作者:  王鑫;  宋永红;  张元林
Adobe PDF(4402Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
图像描述  显著性特征提取  语言模型  编码器  解码器  
视觉Transformer研究的关键问题:现状及展望 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 957-979
作者:  田永林;  王雨桐;  王建功;  王晓;  王飞跃
Adobe PDF(6913Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
视觉Transformer  图像分类  目标检测  图像分割  计算机视觉  
卷积神经网络表征可视化研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1890-1920
作者:  司念文;  张文林;  屈丹;  罗向阳;  常禾雨;  牛铜
Adobe PDF(36687Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
深度学习  卷积神经网络  可解释性  表征可视化  显著图  
基于多重注意结构的图像密集描述生成方法研究 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2537-2548
作者:  刘青茹;  李刚;  赵创;  顾广华;  赵耀
Adobe PDF(5134Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
图像密集描述  多重注意结构  多尺度特征环路融合  多分支空间分步注意力  
视觉语言导航研究进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14
作者:  司马双霖;  黄岩;  何科技;  安东;  袁辉;  王亮
Adobe PDF(6272Kb)  |  收藏  |  浏览/下载:15/5  |  提交时间:2024/05/09
视觉语言导航  视觉语言理解  跨模态匹配  具身智能  
基于运动引导的高效无监督视频目标分割网络 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 4, 页码: 872-880
作者:  赵子成;  张开华;  樊佳庆;  刘青山
Adobe PDF(8449Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/05/09
无监督视频目标分割  运动引导  局部注意力  互注意力  
基于内容特征和风格特征融合的单幅图像去雾网络 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 4, 页码: 769-777
作者:  杨爱萍;  刘瑾;  邢金娜;  李晓晓;  何宇清
Adobe PDF(10700Kb)  |  收藏  |  浏览/下载:7/4  |  提交时间:2024/05/09
图像去雾  卷积神经网络  特征融合  颜色保持  注意力通道加权  
基于语境辅助转换器的图像标题生成算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1889-1903
作者:  连政;  王瑞;  李海昌;  姚辉;  胡晓惠
Adobe PDF(3362Kb)  |  收藏  |  浏览/下载:13/5  |  提交时间:2024/04/24
图像标题生成  注意力机制  转换器  视觉连贯性  
Comprehensive Relation Modelling for Image Paragraph Generation 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 369-382
作者:  Xianglu Zhu;  Zhang Zhang;  Wei Wang;  Zilei Wang
Adobe PDF(1963Kb)  |  收藏  |  浏览/下载:14/7  |  提交时间:2024/04/23
Image paragraph generation, visual relationship, scene graph, graph convolutional network (GCN), long short-term memory