CASIA OpenIR

浏览/检索结果: 共314条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
TextFormer: A Query-based End-to-end Text Spotter with Mixed Supervision 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 704-717
作者:  Yukun Zhai;   Xiaoqiang Zhang;   Xiameng Qin;   Sanyuan Zhao;  Xingping Dong;   Jianbing Shen
Adobe PDF(2312Kb)  |  收藏  |  浏览/下载:26/8  |  提交时间:2024/07/18
End-to-end text spotting  arbitrarily-shaped texts  transformer  mixed supervision  multitask modeling  
基于透视投影的三维人脸重建及姿态估计 学位论文
, 2024
作者:  徐淼
Adobe PDF(12191Kb)  |  收藏  |  浏览/下载:33/0  |  提交时间:2024/07/15
人脸重建,姿态估计,深度学习,神经网络,六自由度  
人脸三维结构恢复和层次化解析 学位论文
, 2024
作者:  于畅
Adobe PDF(31650Kb)  |  收藏  |  浏览/下载:39/2  |  提交时间:2024/07/06
人脸层次化解析  三维人脸表征  胶囊网络  可解释表征  
Design of a curled hyper-redundant manipulator and the motion control with tip-following algorithm 会议论文
, 中国宜昌, 2023.5.20-2023.5.22
作者:  Zhang AS(章澳顺);  Li E(李恩);  Zhang F(张峰);  Guo R(郭锐);  Luo MR(罗明睿);  Zhang YW(张雨薇)
Adobe PDF(2359Kb)  |  收藏  |  浏览/下载:42/17  |  提交时间:2024/06/27
跨模态信息融合的文本图像翻译方法研究 学位论文
, 2024
作者:  马聪
Adobe PDF(11285Kb)  |  收藏  |  浏览/下载:58/5  |  提交时间:2024/06/26
文本图像翻译  跨模态信息融合  多任务学习  跨模态对比学习  参数高效微调  
Modal Contrastive Learning Based End-to-End Text Image Machine Translation 期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing (IEEE/ACM TASLP), 2023, 卷号: 32, 期号: 32, 页码: 2153-2165
作者:  Ma, Cong;  Han, Xu;  Wu, Linghui;  Zhang, Yaping;  Zhao, Yang;  Zhou, Yu;  Zong, Chengqing
Adobe PDF(6551Kb)  |  收藏  |  浏览/下载:42/20  |  提交时间:2024/06/26
Transformers  Machine translation  Decoding  Semantics  Pipelines  Text recognition  Task analysis  Text image machine translation  contrastive learning  text image recognition  machine translation  
Improving End-to-End Text Image Translation From the Auxiliary Text Translation Task 会议论文
Proceedings of the 26th International Conference on Pattern Recognition (ICPR 2022), Montréal, Québec, Canada, August 21-25, 2022
作者:  Ma, Cong;  Zhang, Yaping;  Tu, Mei;  Han, Xu;  Wu, Linghui;  Zhao, Yang;  Zhou, Yu
Adobe PDF(1891Kb)  |  收藏  |  浏览/下载:52/24  |  提交时间:2024/06/26
面向生成语音的模型指纹分析研究 学位论文
, 2024
作者:  ZHANG, CHU YUAN
Adobe PDF(2152Kb)  |  收藏  |  浏览/下载:30/0  |  提交时间:2024/06/25
生成语音  语音生成方法辨别  声学模型  声码器  模型指纹分析  
面向复杂场景的跨维度视觉感知方法研究 学位论文
, 2024
作者:  潘聪
Adobe PDF(28980Kb)  |  收藏  |  浏览/下载:38/0  |  提交时间:2024/06/25
视觉场景感知  二维目标检测  单目三维目标检测  鸟瞰图语义分割  视觉Transformer  
An Effective Morphological Analysis Framework of Intracranial Artery in 3D Digital Subtraction Angiography 会议论文
, Changsha, China, 2023.11.20-2023.11.20
作者:  Zhao, Haining;  Wang, Tao;  Liu, Shiqi;  Xie, Xiaoliang;  Zhou, Xiaohu;  Hou, Zengguang;  Jiao, Liqun;  Ma, Yan;  Li, Ye;  Luo, Jichang;  Dong, Jia;  Zhang, Bairu
Adobe PDF(2726Kb)  |  收藏  |  浏览/下载:40/17  |  提交时间:2024/06/25