CASIA OpenIR

浏览/检索结果: 共1121条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
Parallel Data and Foundation Model Driven Closed-Loop of Autonomous Driving 会议论文
, Edmonton, Canada, SEP 24-27, 2024
作者:  Bin Tian;  Tingting Yao;  Yisheng Lv;  Shichao Chen;  Yang Sun;  Ruiqi Song
Adobe PDF(5420Kb)  |  收藏  |  浏览/下载:37/8  |  提交时间:2024/07/10
Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文
, Chengdu, China, 2021-10
作者:  Zhang X(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(5740Kb)  |  收藏  |  浏览/下载:22/5  |  提交时间:2024/07/08
Fuse & Calibrate: A bi-directional Vision-Language Guided Framework for Referring Image Segmentation 会议论文
, Tianjin, China, 2024/08/05
作者:  Yichen Yan;  Xingjian He;  Sihan Chen;  Shichen Lu;  Jing Liu
Adobe PDF(1978Kb)  |  收藏  |  浏览/下载:11/6  |  提交时间:2024/07/08
Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision  
Autonomy Evaluation of Unmanned Systems Based on Task Models 期刊论文
Machine Intelligence Research, 2024, 页码: 1-16
作者:  Yi Zou;  Zehao Ni;  Xun Lei;  Chi Zhang
Adobe PDF(1801Kb)  |  收藏  |  浏览/下载:29/8  |  提交时间:2024/06/27
几何驱动的三维场景检测与分割 学位论文
, 2024
作者:  关赫
Adobe PDF(31711Kb)  |  收藏  |  浏览/下载:28/1  |  提交时间:2024/06/27
几何驱动  单目三维检测  多维场景分割  数据增强  实用性  特征交互  
基于多模态表征学习与融合的情感识别研究 学位论文
, 2024
作者:  孙立才
Adobe PDF(5844Kb)  |  收藏  |  浏览/下载:35/4  |  提交时间:2024/06/27
情感识别  表征学习  自监督学习  多模态融合  注意力机制  
On the Effects of Structural Modeling for Neural Semantic Parsing 会议论文
Proceedings of the 27th Conference on Computational Natural Language Learning (CoNLL), Singapore, Singapore, 2023-12
作者:  Zhang X(张翔);  He SZ(何世柱);  Liu K(刘康);  Zhao J(赵军)
Adobe PDF(730Kb)  |  收藏  |  浏览/下载:17/10  |  提交时间:2024/06/27
Memory-Adaptive Vision-and-Language Navigation 期刊论文
Pattern Recognition, 2024, 卷号: 153, 页码: 110511
作者:  Keji He;  Ya Jing;  Yan Huang;  Zhihe Lu;  Dong An;  Liang Wang
Adobe PDF(3831Kb)  |  收藏  |  浏览/下载:32/11  |  提交时间:2024/06/26
Vision-and-Language Navigation  Memory bank  History noises  Memory-Adaptive Model  
Landmark-RxR: Solving Vision-and-Language Navigation with Fine-Grained Alignment Supervision 会议论文
, 线上, 2021-12-7至2021-12-10
作者:  Keji He;  Yan Huang;  Qi Wu;  Jianhua Yang;  Dong An;  Shuanglin Sima;  Liang Wang
Adobe PDF(871Kb)  |  收藏  |  浏览/下载:23/7  |  提交时间:2024/06/26