已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| Parallel Data and Foundation Model Driven Closed-Loop of Autonomous Driving 会议论文 , Edmonton, Canada, SEP 24-27, 2024 作者: Bin Tian ; Tingting Yao ; Yisheng Lv ; Shichao Chen ; Yang Sun; Ruiqi Song
Adobe PDF(5420Kb)  |   收藏  |  浏览/下载:37/8  |  提交时间:2024/07/10 |
| Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文 , Chengdu, China, 2021-10 作者: Zhang X(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(5740Kb)  |   收藏  |  浏览/下载:22/5  |  提交时间:2024/07/08 |
| Fuse & Calibrate: A bi-directional Vision-Language Guided Framework for Referring Image Segmentation 会议论文 , Tianjin, China, 2024/08/05 作者: Yichen Yan ; Xingjian He ; Sihan Chen; Shichen Lu; Jing Liu
Adobe PDF(1978Kb)  |   收藏  |  浏览/下载:11/6  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| Autonomy Evaluation of Unmanned Systems Based on Task Models 期刊论文 Machine Intelligence Research, 2024, 页码: 1-16 作者: Yi Zou; Zehao Ni; Xun Lei; Chi Zhang![](/image/person.jpg)
Adobe PDF(1801Kb)  |   收藏  |  浏览/下载:29/8  |  提交时间:2024/06/27 |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫![](/image/person.jpg)
Adobe PDF(31711Kb)  |   收藏  |  浏览/下载:28/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才![](/image/person.jpg)
Adobe PDF(5844Kb)  |   收藏  |  浏览/下载:35/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |
| On the Effects of Structural Modeling for Neural Semantic Parsing 会议论文 Proceedings of the 27th Conference on Computational Natural Language Learning (CoNLL), Singapore, Singapore, 2023-12 作者: Zhang X(张翔) ; He SZ(何世柱) ; Liu K(刘康) ; Zhao J(赵军)![](/image/person.jpg)
Adobe PDF(730Kb)  |   收藏  |  浏览/下载:17/10  |  提交时间:2024/06/27 |
| Memory-Adaptive Vision-and-Language Navigation 期刊论文 Pattern Recognition, 2024, 卷号: 153, 页码: 110511 作者: Keji He ; Ya Jing ; Yan Huang ; Zhihe Lu ; Dong An ; Liang Wang![](/image/person.jpg)
Adobe PDF(3831Kb)  |   收藏  |  浏览/下载:32/11  |  提交时间:2024/06/26 Vision-and-Language Navigation Memory bank History noises Memory-Adaptive Model |
| Landmark-RxR: Solving Vision-and-Language Navigation with Fine-Grained Alignment Supervision 会议论文 , 线上, 2021-12-7至2021-12-10 作者: Keji He ; Yan Huang; Qi Wu; Jianhua Yang; Dong An ; Shuanglin Sima ; Liang Wang![](/image/person.jpg)
Adobe PDF(871Kb)  |   收藏  |  浏览/下载:23/7  |  提交时间:2024/06/26 |