已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:35/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文 IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931 作者: Zhang Xi(张熙); Feifei Zhang; Changsheng Xu Adobe PDF(4719Kb)  |  收藏  |  浏览/下载:41/10  |  提交时间:2024/07/08 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:54/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| 动态资讯 2021年 第08期(总第88期) 其他 2021-08-01 作者: 张桂英 Adobe PDF(7780Kb)  |  收藏  |  浏览/下载:38/17  |  提交时间:2024/07/01 |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫 Adobe PDF(31711Kb)  |  收藏  |  浏览/下载:53/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| Dual-channel spatio-temporal wavelet transform graph neural network for traffic forecasting 会议论文 , Gold Coast, Australia, 2023-6 作者: Xu BW(许宝文); Wang XL(王学雷); Liu CB(刘承宝); Liu ZJ(刘振杰); Kang LW(康丽雯) Adobe PDF(1681Kb)  |  收藏  |  浏览/下载:50/24  |  提交时间:2024/06/26 |
| 面向复杂场景的跨维度视觉感知方法研究 学位论文 , 2024 作者: 潘聪 Adobe PDF(28980Kb)  |  收藏  |  浏览/下载:40/0  |  提交时间:2024/06/25 视觉场景感知 二维目标检测 单目三维目标检测 鸟瞰图语义分割 视觉Transformer |
| 基于视觉-语言引导的机器人导航研究 学位论文 , 2024 作者: 何科技 Adobe PDF(29796Kb)  |  收藏  |  浏览/下载:71/5  |  提交时间:2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为 |
| MRFTrans: Multimodal Representation Fusion Transformer for Monocular 3D Semantic Scene Completion 期刊论文 Information Fusion, 2024, 页码: 102493 作者: Xu RT(许镕涛); Jiguang Zhang; Jiaxi Sun; Changwei Wang; Yifan Wu; Shibiao Xu; Weiliang Meng; Xiaopeng Zhang Adobe PDF(3764Kb)  |  收藏  |  浏览/下载:47/12  |  提交时间:2024/06/24 |
| Improving Generalization of Deepfake Detectors by Imposing Gradient Regularization 期刊论文 IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, 2024, 卷号: 19, 期号: 2024, 页码: 5345-5356 作者: Weinan Guan; Wei Wang; Jing Dong; Bo Peng Adobe PDF(1989Kb)  |  收藏  |  浏览/下载:53/18  |  提交时间:2024/06/21 Deepfake detection forgery texture patterns |