CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Pro-tuning: Unified Prompt Tuning for Vision Tasks 期刊论文
IEEE Transactions on Circuits and Systems for Video Technology, 2023, 卷号: 34, 期号: 6, 页码: 4653 - 4667
作者:  Xing Nie;  Bolin Ni;  Jianlong Chang;  Gaofeng Meng;  Chunlei Huo;  Shiming Xiang;  Qi Tian
Adobe PDF(2224Kb)  |  收藏  |  浏览/下载:35/10  |  提交时间:2024/06/21
DARTScore: DuAl-Reconstruction Transformer for Video Captioning Evaluation 期刊论文
IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 2024, 卷号: 34, 期号: 4, 页码: 2041-2055
作者:  Chen, Yuxin;  Zhang, Ziqi;  Qi, Zhongang;  Yuan, Chunfeng;  Wang, Jie;  Shan, Ying;  Li, Bing;  Hu, Weiming;  Qie, Xiaohu;  Wu, Jianping
Adobe PDF(13765Kb)  |  收藏  |  浏览/下载:58/5  |  提交时间:2024/05/30
Chinese video captioning evaluation  dual-reconstruction transformer  
Dual-stream Representation Fusion Learning for accurate medical image segmentation 期刊论文
Engineering Applications of Artificial Intelligence, 2023, 卷号: 123, 页码: 106402
作者:  Xu RT(许镕涛);  Wang CW(王常维);  Xu SB(徐士彪);  Meng WL(孟维亮);  Zhang XP(张晓鹏)
Adobe PDF(1893Kb)  |  收藏  |  浏览/下载:267/64  |  提交时间:2023/05/18
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1177/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练