已选(0)清除
条数/页: 排序方式: |
| VLP: A Survey on Vision-language Pre-training 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56 作者: Fei-Long Chen; Du-Zhen Zhang; Ming-Lun Han; Xiu-Yi Chen; Jing Shi; Shuang Xu; Bo Xu Adobe PDF(1427Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/04/23 Vision and language pre-training transformers multimodal learning representation learning |
| Causal Reasoning Meets Visual Representation Learning: A Prospective Study 期刊论文 Machine Intelligence Research, 2022, 卷号: 19, 期号: 6, 页码: 485-511 作者: Yang Liu; Yu-Shen Wei; Hong Yan; Guan-Bin Li; Liang Lin Adobe PDF(3224Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/04/23 Causal reasoning visual representation learning reliable artificial intelligence spatial-temporal data multi-modal analysis |
| Cybersecurity Landscape on Remote State Estimation: A Comprehensive Review 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 4, 页码: 851-865 作者: Jing Zhou; Jun Shang; Tongwen Chen Adobe PDF(1169Kb)  |  收藏  |  浏览/下载:17/4  |  提交时间:2024/03/18 Cyber-attacks Kalman filtering remote state estimation unreliable transmission channels |
| Cascaded Decoding and Multi-Stage Inference for Spatio-Temporal Video Grounding 会议论文 , Lisbon, Portugal, 2022-10 作者: Li Yang; Peixuan Wu; Chunfeng Yuan; Bing Li; Weiming Hu Adobe PDF(1313Kb)  |  收藏  |  浏览/下载:140/37  |  提交时间:2023/07/06 |
| Improving Visual Grounding With Visual-Linguistic Verification and Iterative Reasoning 会议论文 , New Orleans, Louisiana, 2022-6 作者: Li Yang; Yan Xu; Chunfeng Yuan; Wei Liu; Bing Li; Weiming Hu Adobe PDF(2060Kb)  |  收藏  |  浏览/下载:149/43  |  提交时间:2023/06/26 |
| 面向多语义和多模态的视觉目标检测研究 学位论文 , 2023 作者: 杨力 Adobe PDF(19168Kb)  |  收藏  |  浏览/下载:157/13  |  提交时间:2023/06/25 目标检测 指代目标检测 多语义 多模态 视觉-语言 |
| VLP: A Survey on Vision-language Pre-training 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56 作者: Feilong Chen; Duzhen Zhang; Minglun Han; Xiuyi Chen; Jing Shi; Shuang Xu; Bo Xu Adobe PDF(969Kb)  |  收藏  |  浏览/下载:132/28  |  提交时间:2023/06/21 |
| 跨模态数据引导的视觉场景分割 学位论文 , 2023 作者: 甘睿彤 Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:123/6  |  提交时间:2023/05/29 视觉场景分割 跨模态数据引导 跨模态特征融合 语义分割 |
| Learning Hierarchical Video Graph Networks for One-Stop Video Delivery 期刊论文 ACM Transactions on Multimedia Computing, Communications, and Applications, 2022, 卷号: 18, 期号: 1, 页码: 1-23 作者: Song, Yaguang; Gao, Junyu; Yang, Xiaoshan; Xu, Changsheng Adobe PDF(7608Kb)  |  收藏  |  浏览/下载:134/41  |  提交时间:2023/04/25 Cross modal video retrieval deep learning graph neural networks |
| 面向样本缺失场景的情绪与压力状态评估方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 武金婷 Adobe PDF(7138Kb)  |  收藏  |  浏览/下载:209/8  |  提交时间:2022/09/02 情绪识别 心理压力检测 零样本学习 迁移学习 孪生网络 |