CASIA OpenIR

浏览/检索结果: 共123条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
推理机制启发的视觉语言导航 学位论文
, 2024
作者:  安东
Adobe PDF(10930Kb)  |  收藏  |  浏览/下载:16/2  |  提交时间:2024/05/27
视觉语言导航  模块化推理  认知地图  子目标导航  
面向开放环境无人平台的持续目标检测算法研究 学位论文
, 2024
作者:  冯航涛
Adobe PDF(12990Kb)  |  收藏  |  浏览/下载:13/0  |  提交时间:2024/05/27
持续学习  目标检测  持续目标检测  无人平台  
基于自回归预训练的多语言文本-图像理解方法研究 学位论文
, 2024
作者:  田哲源
Adobe PDF(10331Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/27
多语言模型  文本-图像跨模态理解  自回归预训练  参数微调  
基于特征增强的模型调优与自适应方法 学位论文
, 2024
作者:  周圣超
Adobe PDF(6415Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/27
图像识别  特征分布漂移  开放类别  特征增强  
面向复杂工业过程的虚拟样本生成综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 4, 页码: 688-718
作者:  汤健;  崔璨麟;  夏恒;  乔俊飞
Adobe PDF(2984Kb)  |  收藏  |  浏览/下载:6/4  |  提交时间:2024/04/28
复杂工业过程  虚拟样本生成  数据驱动建模  样本覆盖区域  
Deep Industrial Image Anomaly Detection: A Survey 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 104-135
作者:  Jiaqi Liu;  Guoyang Xie;  Jinbao Wang;  Shangnian Li;  Chengjie Wang;  Feng Zheng;  Yaochu Jin
Adobe PDF(3376Kb)  |  收藏  |  浏览/下载:19/4  |  提交时间:2024/04/23
Image anomaly detection, defect detection, industrial manufacturing, deep learning, computer vision  
Transformer: A General Framework from Machine Translation to Others 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 514-538
作者:  Yang Zhao;  Jiajun Zhang;  Chengqing Zong
Adobe PDF(1415Kb)  |  收藏  |  浏览/下载:15/5  |  提交时间:2024/04/23
Neural machine translation, Transformer, document neural machine translation (NMT), multimodal NMT, low-resource NMT  
A Review of Predictive and Contrastive Self-supervised Learning for Medical Images 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 483-513
作者:  Wei-Chien Wang;  Euijoon Ahn;  Dagan Feng;  Jinman Kim
Adobe PDF(2691Kb)  |  收藏  |  浏览/下载:17/5  |  提交时间:2024/04/23
Self-supervised learning (SSL), contrastive learning, deep learning, medical image analysis, computer vision  
Large-scale Multi-modal Pre-trained Models: A Comprehensive Survey 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 447-482
作者:  Xiao Wang;  Guangyao Chen;  Guangwu Qian;  Pengcheng Gao;  Xiao-Yong Wei;  Yaowei Wang;  Yonghong Tian;  Wen Gao
Adobe PDF(3540Kb)  |  收藏  |  浏览/下载:20/4  |  提交时间:2024/04/23
Multi-modal (MM), pre-trained model (PTM), information fusion, representation learning, deep learning  
Compositional Prompting Video-language Models to Understand Procedure in Instructional Videos 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 249-262
作者:  Guyue Hu;  Bin He;  Hanwang Zhang
Adobe PDF(2167Kb)  |  收藏  |  浏览/下载:21/11  |  提交时间:2024/04/23
Prompt learning  video-language pretrained models  instructional videos  procedure understanding  knowledge distilling