CASIA OpenIR

浏览/检索结果: 共416条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
无权访问的条目 学位论文
作者:  沈宇
Adobe PDF(27210Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/07/29
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:34/2  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
面向多模态语义理解与推理的视觉问答研究 学位论文
, 2024
作者:  张熙
Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:54/2  |  提交时间:2024/07/08
多模态  视觉问答  语义挖掘  可靠关联  推理泛化  
几何驱动的三维场景检测与分割 学位论文
, 2024
作者:  关赫
Adobe PDF(31711Kb)  |  收藏  |  浏览/下载:52/1  |  提交时间:2024/06/27
几何驱动  单目三维检测  多维场景分割  数据增强  实用性  特征交互  
面向生成语音的模型指纹分析研究 学位论文
, 2024
作者:  ZHANG, CHU YUAN
Adobe PDF(2152Kb)  |  收藏  |  浏览/下载:30/0  |  提交时间:2024/06/25
生成语音  语音生成方法辨别  声学模型  声码器  模型指纹分析  
面向复杂场景的跨维度视觉感知方法研究 学位论文
, 2024
作者:  潘聪
Adobe PDF(28980Kb)  |  收藏  |  浏览/下载:40/0  |  提交时间:2024/06/25
视觉场景感知  二维目标检测  单目三维目标检测  鸟瞰图语义分割  视觉Transformer  
基于视觉-语言引导的机器人导航研究 学位论文
, 2024
作者:  何科技
Adobe PDF(29796Kb)  |  收藏  |  浏览/下载:71/5  |  提交时间:2024/06/25
视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为  
ViLEM: Visual-Language Error Modeling for Image-Text Retrieval 会议论文
, 加拿大温哥华, 2023-6
作者:  chen yuxin;  ma zongyang;  zhang ziqi;  qi zhongang;  yuan chunfeng;  shan ying;  li bing;  hu weiming;  qie xiaohu;  wu jianping
Adobe PDF(1379Kb)  |  收藏  |  浏览/下载:38/10  |  提交时间:2024/06/25
High-Definition Mapping for Autonomous Driving in Surface Mines 期刊论文
IEEE Transactions on Intelligent Vehicles, 2024, 页码: 1-12
作者:  Bin Tian;  Junhui Wang;  Yuting Xie;  Yuchen Li;  Yachen Zhu;  Long Chen
Adobe PDF(4525Kb)  |  收藏  |  浏览/下载:56/16  |  提交时间:2024/06/24
MRFTrans: Multimodal Representation Fusion Transformer for Monocular 3D Semantic Scene Completion 期刊论文
Information Fusion, 2024, 页码: 102493
作者:  Xu RT(许镕涛);  Jiguang Zhang;  Jiaxi Sun;  Changwei Wang;  Yifan Wu;  Shibiao Xu;  Weiliang Meng;  Xiaopeng Zhang
Adobe PDF(3764Kb)  |  收藏  |  浏览/下载:45/12  |  提交时间:2024/06/24