CASIA OpenIR

浏览/检索结果: 共872条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
TextFormer: A Query-based End-to-end Text Spotter with Mixed Supervision 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 704-717
作者:  Yukun Zhai;   Xiaoqiang Zhang;   Xiameng Qin;   Sanyuan Zhao;  Xingping Dong;   Jianbing Shen
Adobe PDF(2312Kb)  |  收藏  |  浏览/下载:26/8  |  提交时间:2024/07/18
End-to-end text spotting  arbitrarily-shaped texts  transformer  mixed supervision  multitask modeling  
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:34/2  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
CMFN: Cross-Modal Fusion Network for Irregular Scene Text Recognition 会议论文
, 中国, 2023.06.08
作者:  Jinzhi Zheng;  Ruyi Ji;  Libo Zhang;  Yanjun Wu;  Chen Zhao
Adobe PDF(1516Kb)  |  收藏  |  浏览/下载:34/12  |  提交时间:2024/07/08
Conditional visibility aware view synthesis via parallel light fields 期刊论文
NEUROCOMPUTING, 2024, 卷号: 588, 页码: 13
作者:  Shen, Yu;  Li, Yuke;  Liu, Yuhang;  Wang, Yutong;  Chen, Long;  Wang, Fei-Yue
Adobe PDF(3348Kb)  |  收藏  |  浏览/下载:21/3  |  提交时间:2024/07/04
Parallel theory  Light fields  Neural rendering  View synthesis  Conditional visibility  Normalizing Flow  
An end-to-end model for multi-view scene text recognition 期刊论文
PATTERN RECOGNITION, 2024, 卷号: 149, 页码: 17
作者:  Banerjee, Ayan;  Shivakumara, Palaiahnakote;  Bhattacharya, Saumik;  Pal, Umapada;  Liu, Cheng-Lin
收藏  |  浏览/下载:25/0  |  提交时间:2024/07/03
Text detection  Scene text recognition  Siamese network  Natural language model  Genetic algorithm  Multi-view text detection  
任意书写方向联机手写中文文本行识别方法 学位论文
, 2024
作者:  陈懿
Adobe PDF(6205Kb)  |  收藏  |  浏览/下载:42/2  |  提交时间:2024/06/26
联机中文文本行识别  任意书写方向文本行  原型学习  过切分算法  
面向智慧医疗的人体参数化建模技术 学位论文
, 2024
作者:  周仝希
Adobe PDF(51449Kb)  |  收藏  |  浏览/下载:37/2  |  提交时间:2024/06/26
人体参数化建模  多模态融合  逆运动学  智慧医疗  
跨模态信息融合的文本图像翻译方法研究 学位论文
, 2024
作者:  马聪
Adobe PDF(11285Kb)  |  收藏  |  浏览/下载:59/5  |  提交时间:2024/06/26
文本图像翻译  跨模态信息融合  多任务学习  跨模态对比学习  参数高效微调  
Modal Contrastive Learning Based End-to-End Text Image Machine Translation 期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing (IEEE/ACM TASLP), 2023, 卷号: 32, 期号: 32, 页码: 2153-2165
作者:  Ma, Cong;  Han, Xu;  Wu, Linghui;  Zhang, Yaping;  Zhao, Yang;  Zhou, Yu;  Zong, Chengqing
Adobe PDF(6551Kb)  |  收藏  |  浏览/下载:43/20  |  提交时间:2024/06/26
Transformers  Machine translation  Decoding  Semantics  Pipelines  Text recognition  Task analysis  Text image machine translation  contrastive learning  text image recognition  machine translation  
Reconfiguration of Structure-Function Coupling in Diverse Subgroups of Adolescents with Depression 会议论文
, Seoul, Korea, 2024-6
作者:  Xu,Ming;  Li, Xuemei;  Teng, Teng;  Huang, Yang;  Liu, Mengqi;  Long, Yicheng;  Lv, Fajin;  Zhi, Dongmei;  Li, Xiang;  Feng, Aichen;  Yu, Shan;  Zhou, Xinyu;  Sui, Jing
Adobe PDF(753Kb)  |  收藏  |  浏览/下载:57/23  |  提交时间:2024/06/25