CASIA OpenIR

浏览/检索结果: 共30条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
CMFN: Cross-Modal Fusion Network for Irregular Scene Text Recognition 会议论文
, 中国, 2023.06.08
作者:  Jinzhi Zheng;  Ruyi Ji;  Libo Zhang;  Yanjun Wu;  Chen Zhao
Adobe PDF(1516Kb)  |  收藏  |  浏览/下载:26/10  |  提交时间:2024/07/08
TaiSu: A 166M Large-scale High-Quality Dataset for Chinese Vision-Language Pre-training 会议论文
, New Orleans Convention Center ,America, 2022-11-28至 2022-12-9
作者:  Yulong Liu;  Guibo Zhu;  Bin Zhu;  Qi Song;  Guojing Ge;  Haoran Chen;  Guanhui Qiao;  Ru Peng;  Lingxiang Wu;  Jinqiao Wang
Adobe PDF(2408Kb)  |  收藏  |  浏览/下载:44/9  |  提交时间:2024/06/06
Dual-Path Transformer for 3D Human Pose Estimation 期刊论文
IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 2024, 卷号: 34, 期号: 5, 页码: 3260-3270
作者:  Zhou Lu;  Chen Yingying;  Wang Jinqiao
Adobe PDF(2410Kb)  |  收藏  |  浏览/下载:47/20  |  提交时间:2024/06/03
Transformers  Three-dimensional displays  Pose estimation  Task analysis  Solid modeling  Feature extraction  Benchmark testing  3D human pose estimation  transformer  motion  distillation  
Reparameterizing and dynamically quantizing image features for image generation 期刊论文
PATTERN RECOGNITION, 2024, 卷号: 146, 页码: 11
作者:  Sun, Mingzhen;  Wang, Weining;  Zhu, Xinxin;  Liu, Jing
Adobe PDF(3612Kb)  |  收藏  |  浏览/下载:179/27  |  提交时间:2023/12/21
Vector quantization  Variational auto-encoder  Unconditional image generation  Text-to-image generation  Autoregressive generation  
ED-T2V: An Efficient Training Framework for Diffusion-based Text-to-Video Generation 会议论文
, Queensland, Australia, 2023-6-18
作者:  Liu, Jiawei;  Wang, Weining;  Liu, Wei;  He, Qian;  Liu, Jing
Adobe PDF(4537Kb)  |  收藏  |  浏览/下载:220/47  |  提交时间:2023/05/04
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation 期刊论文
IEEE Transactions on Multimedia, 2023, 卷号: 26, 页码: 1 - 13
作者:  Liu, Jiawei;  Wang, Weining;  Chen, Sihan;  Zhu, Xinxin;  Liu, Jing
Adobe PDF(7741Kb)  |  收藏  |  浏览/下载:169/36  |  提交时间:2023/05/03
Text-guided sounding-video generation  Videoaudio representation  Contrastive learning  Transformer  
MSCap: Multi-Style Image Captioning with Unpaired Stylized Text 会议论文
, 美国长滩, 2019.06.16
作者:  Longteng, Guo;  Jing, Liu;  Peng, Yao;  Jiangwei, Li;  Hanqing, Lu
Adobe PDF(914Kb)  |  收藏  |  浏览/下载:142/33  |  提交时间:2021/06/25
Normalized and Geometry-Aware Self-Attention Network for Image Captioning 会议论文
, 线上, 2020.06.14
作者:  Guo LT(郭龙腾);  Liu J(刘静);  Zhu XX(朱欣鑫);  Yao P(姚鹏);  Lu SC(卢诗晨);  Lu HQ(卢汉清)
Adobe PDF(574Kb)  |  收藏  |  浏览/下载:350/87  |  提交时间:2021/06/25
Image captioning  Self-attention  
Non-Autoregressive Image Captioning with Counterfactuals-Critical Multi-Agent Learning 会议论文
, 日本横滨, 2021.01.07
作者:  Guo LT(郭龙腾);  Liu J(刘静);  Zhu XX(朱欣鑫);  He XJ(何兴建);  Jiang J(江洁);  Lu HQ(卢汉清)
Adobe PDF(434Kb)  |  收藏  |  浏览/下载:249/63  |  提交时间:2021/06/25
基于信息传递的人体姿态估计方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  周鲁
Adobe PDF(28429Kb)  |  收藏  |  浏览/下载:286/6  |  提交时间:2021/06/21
人体姿态估计  信息传递  姿态语法  空间变换  遮挡感知