CASIA OpenIR

浏览/检索结果: 共258条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Multi-Stage Image-Language Cross-Generative Fusion Network for Video-Based Referring Expression Comprehension 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 3256-3270
作者:  Zhang, Yujia;  Li, Qianzhong;  Pan, Yi;  Zhao, Xiaoguang;  Tan, Min
收藏  |  浏览/下载:0/0  |  提交时间:2024/07/03
Feature extraction  Visualization  Task analysis  Representation learning  Location awareness  Linguistics  Grounding  Video-based referring expression comprehension  multi-stage learning  image-language cross-generative fusion  consistency loss  
Source-Guided Target Feature Reconstruction for Cross-Domain Classification and Detection 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 2808-2822
作者:  Jiao, Yifan;  Yao, Hantao;  Bao, Bing-Kun;  Xu, Changsheng
收藏  |  浏览/下载:0/0  |  提交时间:2024/07/03
Source-guided target feature reconstruction  cross-domain image classification  cross-domain object detection  
多尺度视觉语义增强的多模态命名实体识别方法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1234-1245
作者:  王海荣;  徐玺;  王彤;  陈芳萍
Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:7/3  |  提交时间:2024/07/02
多模态命名实体识别  多任务学习  多模态融合  Transformer  
Autonomy Evaluation of Unmanned Systems Based on Task Models 期刊论文
Machine Intelligence Research, 2024, 页码: 1-16
作者:  Yi Zou;  Zehao Ni;  Xun Lei;  Chi Zhang
Adobe PDF(1801Kb)  |  收藏  |  浏览/下载:20/6  |  提交时间:2024/06/27
几何驱动的三维场景检测与分割 学位论文
, 2024
作者:  关赫
Adobe PDF(31711Kb)  |  收藏  |  浏览/下载:20/0  |  提交时间:2024/06/27
几何驱动  单目三维检测  多维场景分割  数据增强  实用性  特征交互  
基于多尺度特征融合的图像语义分割方法研究 学位论文
, 2024
作者:  朱袁兵
Adobe PDF(29615Kb)  |  收藏  |  浏览/下载:21/1  |  提交时间:2024/06/27
图像语义分割  实时语义分割  开放词汇语义分割  视觉语言模型  
CAM: Consistency Adversarial Model for Image Generation with High-frequency Image Details 会议论文
, 昆明, 2024-03
作者:  Qin ZH(秦子涵);  Sun MZ(孙铭真);  Liu J(刘静)
Adobe PDF(570Kb)  |  收藏  |  浏览/下载:18/8  |  提交时间:2024/06/27
基于脉冲神经网络的多模态视听分类 学位论文
, 2024
作者:  郭凌月
Adobe PDF(3051Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/06/27
脉冲神经网络  多模态对齐  多模态融合  视听分类  
基于强化学习的视觉内容生成 学位论文
, 2024
作者:  秦子涵
Adobe PDF(11517Kb)  |  收藏  |  浏览/下载:13/2  |  提交时间:2024/06/26
图像生成  视频生成  强化学习  
Memory-Adaptive Vision-and-Language Navigation 期刊论文
Pattern Recognition, 2024, 卷号: 153, 页码: 110511
作者:  Keji He;  Ya Jing;  Yan Huang;  Zhihe Lu;  Dong An;  Liang Wang
Adobe PDF(3831Kb)  |  收藏  |  浏览/下载:23/7  |  提交时间:2024/06/26
Vision-and-Language Navigation  Memory bank  History noises  Memory-Adaptive Model