CASIA OpenIR

浏览/检索结果: 共318条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于计算机视觉的工业金属表面缺陷检测综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 7, 页码: 1261-1283
作者:  伍麟;  郝鸿宇;  宋友
Adobe PDF(25552Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/07/25
表面缺陷检测  计算机视觉  金属表面缺陷  自动化检测  
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:35/2  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
标注受限的光学遥感图像目标检测模型与算法研究 学位论文
, 2024
作者:  任至达
Adobe PDF(18136Kb)  |  收藏  |  浏览/下载:44/1  |  提交时间:2024/07/08
光学遥感图像目标检测  标注受限  弱监督学习  显著性检测  特征增强  
Memory-Adaptive Vision-and-Language Navigation 期刊论文
Pattern Recognition, 2024, 卷号: 153, 页码: 110511
作者:  Keji He;  Ya Jing;  Yan Huang;  Zhihe Lu;  Dong An;  Liang Wang
Adobe PDF(3831Kb)  |  收藏  |  浏览/下载:63/24  |  提交时间:2024/06/26
Vision-and-Language Navigation  Memory bank  History noises  Memory-Adaptive Model  
Multi-teacher Knowledge Distillation for End-to-End Text Image Machine Translation 会议论文
Proceedings of the 17th Document Analysis and Recognition (ICDAR 2023), San José, California, USA, August 21-26, 2023
作者:  Ma, Cong;  Zhang, Yaping;  Tu, Mei;  Zhao, Yang;  Zhou, Yu;  Zong, Chengqing
Adobe PDF(1478Kb)  |  收藏  |  浏览/下载:38/16  |  提交时间:2024/06/26
Improving End-to-End Text Image Translation From the Auxiliary Text Translation Task 会议论文
Proceedings of the 26th International Conference on Pattern Recognition (ICPR 2022), Montréal, Québec, Canada, August 21-25, 2022
作者:  Ma, Cong;  Zhang, Yaping;  Tu, Mei;  Han, Xu;  Wu, Linghui;  Zhao, Yang;  Zhou, Yu
Adobe PDF(1891Kb)  |  收藏  |  浏览/下载:54/24  |  提交时间:2024/06/26
Distinguishing Neural Speech Synthesis Models Through Fingerprints in Speech Waveforms 会议论文
, Taiyuan, Shanxi, China, 2024-07-27
作者:  Zhang, Chu Yuan;  Yi, Jiangyan;  Tao, Jianhua;  Wang, Chenglong;  Yan, Xinrui
Adobe PDF(2254Kb)  |  收藏  |  浏览/下载:38/14  |  提交时间:2024/06/26
面向复杂场景的跨维度视觉感知方法研究 学位论文
, 2024
作者:  潘聪
Adobe PDF(28980Kb)  |  收藏  |  浏览/下载:40/0  |  提交时间:2024/06/25
视觉场景感知  二维目标检测  单目三维目标检测  鸟瞰图语义分割  视觉Transformer  
基于视觉-语言引导的机器人导航研究 学位论文
, 2024
作者:  何科技
Adobe PDF(29796Kb)  |  收藏  |  浏览/下载:71/5  |  提交时间:2024/06/25
视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为  
How to Make Cross Encoder a Good Teacher for Efficient Image-Text Retrieval? 会议论文
, 美国西雅图, 2024-6
作者:  chen yuxin;  ma zongyang;  zhang ziqi;  qi zhongang;  yuan chunfeng;  li bing;  pu junfu;  shan ying;  qi xiaojuan;  hu weiming
Adobe PDF(1070Kb)  |  收藏  |  浏览/下载:53/13  |  提交时间:2024/06/25