CASIA OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:52/10  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
视觉Transformer研究的关键问题:现状及展望 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 957-979
作者:  田永林;  王雨桐;  王建功;  王晓;  王飞跃
Adobe PDF(6913Kb)  |  收藏  |  浏览/下载:58/20  |  提交时间:2024/05/20
视觉Transformer  图像分类  目标检测  图像分割  计算机视觉  
卷积神经网络表征可视化研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1890-1920
作者:  司念文;  张文林;  屈丹;  罗向阳;  常禾雨;  牛铜
Adobe PDF(36687Kb)  |  收藏  |  浏览/下载:13/5  |  提交时间:2024/05/20
深度学习  卷积神经网络  可解释性  表征可视化  显著图  
基于多重注意结构的图像密集描述生成方法研究 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2537-2548
作者:  刘青茹;  李刚;  赵创;  顾广华;  赵耀
Adobe PDF(5134Kb)  |  收藏  |  浏览/下载:33/14  |  提交时间:2024/05/20
图像密集描述  多重注意结构  多尺度特征环路融合  多分支空间分步注意力  
视觉语言导航研究进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14
作者:  司马双霖;  黄岩;  何科技;  安东;  袁辉;  王亮
Adobe PDF(6272Kb)  |  收藏  |  浏览/下载:72/25  |  提交时间:2024/05/09
视觉语言导航  视觉语言理解  跨模态匹配  具身智能