CASIA OpenIR

浏览/检索结果: 共27条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Fei-Long Chen;  Du-Zhen Zhang;  Ming-Lun Han;  Xiu-Yi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(1427Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/04/23
Vision and language  pre-training  transformers  multimodal learning  representation learning  
Causal Reasoning Meets Visual Representation Learning: A Prospective Study 期刊论文
Machine Intelligence Research, 2022, 卷号: 19, 期号: 6, 页码: 485-511
作者:  Yang Liu;  Yu-Shen Wei;  Hong Yan;  Guan-Bin Li;  Liang Lin
Adobe PDF(3224Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/04/23
Causal reasoning  visual representation learning  reliable artificial intelligence  spatial-temporal data  multi-modal analysis  
Cybersecurity Landscape on Remote State Estimation: A Comprehensive Review 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 4, 页码: 851-865
作者:  Jing Zhou;  Jun Shang;  Tongwen Chen
Adobe PDF(1169Kb)  |  收藏  |  浏览/下载:17/4  |  提交时间:2024/03/18
Cyber-attacks  Kalman filtering  remote state estimation  unreliable transmission channels  
Cascaded Decoding and Multi-Stage Inference for Spatio-Temporal Video Grounding 会议论文
, Lisbon, Portugal, 2022-10
作者:  Li Yang;  Peixuan Wu;  Chunfeng Yuan;  Bing Li;  Weiming Hu
Adobe PDF(1313Kb)  |  收藏  |  浏览/下载:140/37  |  提交时间:2023/07/06
Improving Visual Grounding With Visual-Linguistic Verification and Iterative Reasoning 会议论文
, New Orleans, Louisiana, 2022-6
作者:  Li Yang;  Yan Xu;  Chunfeng Yuan;  Wei Liu;  Bing Li;  Weiming Hu
Adobe PDF(2060Kb)  |  收藏  |  浏览/下载:149/43  |  提交时间:2023/06/26
面向多语义和多模态的视觉目标检测研究 学位论文
, 2023
作者:  杨力
Adobe PDF(19168Kb)  |  收藏  |  浏览/下载:157/13  |  提交时间:2023/06/25
目标检测  指代目标检测  多语义  多模态  视觉-语言  
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Feilong Chen;  Duzhen Zhang;  Minglun Han;  Xiuyi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(969Kb)  |  收藏  |  浏览/下载:132/28  |  提交时间:2023/06/21
跨模态数据引导的视觉场景分割 学位论文
, 2023
作者:  甘睿彤
Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:123/6  |  提交时间:2023/05/29
视觉场景分割  跨模态数据引导  跨模态特征融合  语义分割  
Learning Hierarchical Video Graph Networks for One-Stop Video Delivery 期刊论文
ACM Transactions on Multimedia Computing, Communications, and Applications, 2022, 卷号: 18, 期号: 1, 页码: 1-23
作者:  Song, Yaguang;  Gao, Junyu;  Yang, Xiaoshan;  Xu, Changsheng
Adobe PDF(7608Kb)  |  收藏  |  浏览/下载:134/41  |  提交时间:2023/04/25
Cross modal  video retrieval  deep learning  graph neural networks  
面向样本缺失场景的情绪与压力状态评估方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  武金婷
Adobe PDF(7138Kb)  |  收藏  |  浏览/下载:209/8  |  提交时间:2022/09/02
情绪识别  心理压力检测  零样本学习  迁移学习  孪生网络