CASIA OpenIR

浏览/检索结果: 共28条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
视觉语言导航研究进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14
作者:  司马双霖;  黄岩;  何科技;  安东;  袁辉;  王亮
Adobe PDF(6272Kb)  |  收藏  |  浏览/下载:16/5  |  提交时间:2024/05/09
视觉语言导航  视觉语言理解  跨模态匹配  具身智能  
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Fei-Long Chen;  Du-Zhen Zhang;  Ming-Lun Han;  Xiu-Yi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(1427Kb)  |  收藏  |  浏览/下载:13/4  |  提交时间:2024/04/23
Vision and language  pre-training  transformers  multimodal learning  representation learning  
Causal Reasoning Meets Visual Representation Learning: A Prospective Study 期刊论文
Machine Intelligence Research, 2022, 卷号: 19, 期号: 6, 页码: 485-511
作者:  Yang Liu;  Yu-Shen Wei;  Hong Yan;  Guan-Bin Li;  Liang Lin
Adobe PDF(3224Kb)  |  收藏  |  浏览/下载:12/2  |  提交时间:2024/04/23
Causal reasoning  visual representation learning  reliable artificial intelligence  spatial-temporal data  multi-modal analysis  
Cybersecurity Landscape on Remote State Estimation: A Comprehensive Review 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 4, 页码: 851-865
作者:  Jing Zhou;  Jun Shang;  Tongwen Chen
Adobe PDF(1169Kb)  |  收藏  |  浏览/下载:27/7  |  提交时间:2024/03/18
Cyber-attacks  Kalman filtering  remote state estimation  unreliable transmission channels  
Cascaded Decoding and Multi-Stage Inference for Spatio-Temporal Video Grounding 会议论文
, Lisbon, Portugal, 2022-10
作者:  Li Yang;  Peixuan Wu;  Chunfeng Yuan;  Bing Li;  Weiming Hu
Adobe PDF(1313Kb)  |  收藏  |  浏览/下载:150/39  |  提交时间:2023/07/06
Improving Visual Grounding With Visual-Linguistic Verification and Iterative Reasoning 会议论文
, New Orleans, Louisiana, 2022-6
作者:  Li Yang;  Yan Xu;  Chunfeng Yuan;  Wei Liu;  Bing Li;  Weiming Hu
Adobe PDF(2060Kb)  |  收藏  |  浏览/下载:163/48  |  提交时间:2023/06/26
面向多语义和多模态的视觉目标检测研究 学位论文
, 2023
作者:  杨力
Adobe PDF(19168Kb)  |  收藏  |  浏览/下载:165/14  |  提交时间:2023/06/25
目标检测  指代目标检测  多语义  多模态  视觉-语言  
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Feilong Chen;  Duzhen Zhang;  Minglun Han;  Xiuyi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(969Kb)  |  收藏  |  浏览/下载:139/29  |  提交时间:2023/06/21
跨模态数据引导的视觉场景分割 学位论文
, 2023
作者:  甘睿彤
Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:131/7  |  提交时间:2023/05/29
视觉场景分割  跨模态数据引导  跨模态特征融合  语义分割  
Learning Hierarchical Video Graph Networks for One-Stop Video Delivery 期刊论文
ACM Transactions on Multimedia Computing, Communications, and Applications, 2022, 卷号: 18, 期号: 1, 页码: 1-23
作者:  Song, Yaguang;  Gao, Junyu;  Yang, Xiaoshan;  Xu, Changsheng
Adobe PDF(7608Kb)  |  收藏  |  浏览/下载:142/41  |  提交时间:2023/04/25
Cross modal  video retrieval  deep learning  graph neural networks