已选(0)清除
条数/页: 排序方式: |
| 无权访问的条目 学位论文 作者: 沈宇 Adobe PDF(27210Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/07/29 |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:34/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:54/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫 Adobe PDF(31711Kb)  |  收藏  |  浏览/下载:52/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| 面向生成语音的模型指纹分析研究 学位论文 , 2024 作者: ZHANG, CHU YUAN Adobe PDF(2152Kb)  |  收藏  |  浏览/下载:30/0  |  提交时间:2024/06/25 生成语音 语音生成方法辨别 声学模型 声码器 模型指纹分析 |
| 面向复杂场景的跨维度视觉感知方法研究 学位论文 , 2024 作者: 潘聪 Adobe PDF(28980Kb)  |  收藏  |  浏览/下载:40/0  |  提交时间:2024/06/25 视觉场景感知 二维目标检测 单目三维目标检测 鸟瞰图语义分割 视觉Transformer |
| 基于视觉-语言引导的机器人导航研究 学位论文 , 2024 作者: 何科技 Adobe PDF(29796Kb)  |  收藏  |  浏览/下载:71/5  |  提交时间:2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为 |
| ViLEM: Visual-Language Error Modeling for Image-Text Retrieval 会议论文 , 加拿大温哥华, 2023-6 作者: chen yuxin; ma zongyang; zhang ziqi; qi zhongang; yuan chunfeng; shan ying; li bing; hu weiming; qie xiaohu; wu jianping Adobe PDF(1379Kb)  |  收藏  |  浏览/下载:38/10  |  提交时间:2024/06/25 |
| High-Definition Mapping for Autonomous Driving in Surface Mines 期刊论文 IEEE Transactions on Intelligent Vehicles, 2024, 页码: 1-12 作者: Bin Tian; Junhui Wang; Yuting Xie; Yuchen Li; Yachen Zhu; Long Chen Adobe PDF(4525Kb)  |  收藏  |  浏览/下载:56/16  |  提交时间:2024/06/24 |
| MRFTrans: Multimodal Representation Fusion Transformer for Monocular 3D Semantic Scene Completion 期刊论文 Information Fusion, 2024, 页码: 102493 作者: Xu RT(许镕涛); Jiguang Zhang; Jiaxi Sun; Changwei Wang; Yifan Wu; Shibiao Xu; Weiliang Meng; Xiaopeng Zhang Adobe PDF(3764Kb)  |  收藏  |  浏览/下载:45/12  |  提交时间:2024/06/24 |