CASIA OpenIR

浏览/检索结果: 共93条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
DARTScore: DuAl-Reconstruction Transformer for Video Captioning Evaluation 期刊论文
IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 2024, 卷号: 34, 期号: 4, 页码: 2041-2055
作者:  Chen, Yuxin;  Zhang, Ziqi;  Qi, Zhongang;  Yuan, Chunfeng;  Wang, Jie;  Shan, Ying;  Li, Bing;  Hu, Weiming;  Qie, Xiaohu;  Wu, Jianping
收藏  |  浏览/下载:6/0  |  提交时间:2024/05/30
Chinese video captioning evaluation  dual-reconstruction transformer  
Spatial-Frequency Multi-Scale Transformer for Deblurring and Shape-Preserving Reconstruction in Magnetic Particle Imaging 期刊论文
IEEE TRANSACTIONS ON COMPUTATIONAL IMAGING, 2024, 卷号: 10, 页码: 196-207
作者:  Shang, Yaxin;  Liu, Jie;  Liu, Yanjun;  Wang, Yueqi;  Shen, Yusong;  Wu, Xiangjun;  Zhang, Liwen;  Hui, Hui;  Tian, Jie
收藏  |  浏览/下载:4/0  |  提交时间:2024/05/30
Feature extraction  Imaging  Image reconstruction  Image edge detection  Frequency-domain analysis  Image restoration  Transforms  Magnetic particle imaging  X-space  transformer  deblurring  shape-preserving  
The Devil is in Details: Delving Into Lite FFN Design for Vision Transformers 会议论文
, Seoul, Korea, 2024-4-14
作者:  Chen, Zhiyang;  Zhu, Yousong;  Li, Zhaowen;  Yang, Fan;  Zhao, Chaoyang;  Wang, Jinqiao;  Tang, Ming
Adobe PDF(407Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/05/28
Vision Transformer  Light-Weight Structure  Feed-Forward Networks  
Obj2Seq: Formatting Objects as Sequences with Class Prompt for Visual Tasks 会议论文
, New Orleans, Louisiana & Online, 2022-11-28
作者:  Chen, Zhiyang;  Zhu, Yousong;  Li, Zhaowen;  Yang, Fan;  Li, Wei;  Wang, Haixin;  Zhao, Chaoyang;  Wu, Liwei;  Zhao, Rui;  Wang, Jinqiao;  Tang, Ming
Adobe PDF(1289Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/05/28
transformer  general visual framework  sequence prediction  multi-task  
Dual Frequency Transformer for Efficient SDR-to-HDR Translation 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 538-548
作者:  Gang Xu;  Qibin Hou;  Ming-Ming Cheng
Adobe PDF(2981Kb)  |  收藏  |  浏览/下载:18/9  |  提交时间:2024/05/23
Standard-dynamic-range to high-dynamic-range (SDR-to-HDR) translation, Transformer, dual frequency attention (DFA), frequency-aware feature decomposition, efficient model  
视觉Transformer研究的关键问题:现状及展望 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 957-979
作者:  田永林;  王雨桐;  王建功;  王晓;  王飞跃
Adobe PDF(6913Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/05/20
视觉Transformer  图像分类  目标检测  图像分割  计算机视觉  
问答ChatGPT之后:超大预训练模型的机遇和挑战 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 4, 页码: 705-717
作者:  卢经纬;  郭超;  戴星原;  缪青海;  王兴霞;  杨静;  王飞跃
Adobe PDF(2118Kb)  |  收藏  |  浏览/下载:22/6  |  提交时间:2024/05/09
预训练模型  ChatGPT  Transformer  人工智能生成内容  平行智能  社会化大闭环  
基于无锚框的目标检测方法及其在复杂场景下的应用进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 7, 页码: 1369-1392
作者:  刘小波;  肖肖;  王凌;  蔡之华;  龚鑫;  郑可心
Adobe PDF(24186Kb)  |  收藏  |  浏览/下载:19/7  |  提交时间:2024/04/25
无锚框  关键点  中心点  Transformer  复杂场景  目标检测  
基于重组性高斯自注意力的视觉Transformer 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1976-1988
作者:  赵亮;  周继开
Adobe PDF(29103Kb)  |  收藏  |  浏览/下载:8/2  |  提交时间:2024/04/24
Transformer  局部自注意力  混合高斯权重重组  图像分类  目标检测  
DepthFormer: Exploiting Long-range Correlation and Local Information for Accurate Monocular Depth Estimation 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 6, 页码: 837-854
作者:  Zhenyu Li;  Zehui Chen;  Xianming Liu;  Junjun Jiang
Adobe PDF(8871Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/04/23
Autonomous driving, 3D reconstruction, monocular depth estimation, Transformer, convolution