已选(0)清除
条数/页: 排序方式: |
| 无权访问的条目 学位论文 作者: 沈宇![](/image/person.jpg)
Adobe PDF(27210Kb)  |   收藏  |  浏览/下载:6/0  |  提交时间:2024/07/29 |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:35/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:54/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫![](/image/person.jpg)
Adobe PDF(31711Kb)  |   收藏  |  浏览/下载:53/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| 面向生成语音的模型指纹分析研究 学位论文 , 2024 作者: ZHANG, CHU YUAN![](/image/person.jpg)
Adobe PDF(2152Kb)  |   收藏  |  浏览/下载:30/0  |  提交时间:2024/06/25 生成语音 语音生成方法辨别 声学模型 声码器 模型指纹分析 |
| 面向复杂场景的跨维度视觉感知方法研究 学位论文 , 2024 作者: 潘聪![](/image/person.jpg)
Adobe PDF(28980Kb)  |   收藏  |  浏览/下载:40/0  |  提交时间:2024/06/25 视觉场景感知 二维目标检测 单目三维目标检测 鸟瞰图语义分割 视觉Transformer |
| 基于视觉-语言引导的机器人导航研究 学位论文 , 2024 作者: 何科技![](/image/person.jpg)
Adobe PDF(29796Kb)  |   收藏  |  浏览/下载:71/5  |  提交时间:2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为 |
| ViLEM: Visual-Language Error Modeling for Image-Text Retrieval 会议论文 , 加拿大温哥华, 2023-6 作者: chen yuxin ; ma zongyang; zhang ziqi ; qi zhongang; yuan chunfeng ; shan ying; li bing ; hu weiming ; qie xiaohu; wu jianping
Adobe PDF(1379Kb)  |   收藏  |  浏览/下载:38/10  |  提交时间:2024/06/25 |
| LEGO: A Multi-agent Collaborative Framework with Role-playing and Iterative Feedback for Causality Explanation Generation 会议论文 , Singapore, 2023-12 作者: Zhitao He ; Pengfei Cao ; Yubo Chen ; Kang Liu; Jun Zhao![](/image/person.jpg)
Adobe PDF(1153Kb)  |   收藏  |  浏览/下载:28/8  |  提交时间:2024/06/25 |
| High-Definition Mapping for Autonomous Driving in Surface Mines 期刊论文 IEEE Transactions on Intelligent Vehicles, 2024, 页码: 1-12 作者: Bin Tian ; Junhui Wang ; Yuting Xie; Yuchen Li; Yachen Zhu; Long Chen![](/image/person.jpg)
Adobe PDF(4525Kb)  |   收藏  |  浏览/下载:58/16  |  提交时间:2024/06/24 |