CASIA OpenIR

浏览/检索结果: 共1434条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Snippet-to-Prototype Contrastive Consensus Network for Weakly Supervised Temporal Action Localization 期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 6717-6729
作者:  Shao, Yuxiang;  Zhang, Feifei;  Xu, Changsheng
收藏  |  浏览/下载:9/0  |  提交时间:2024/07/22
Contrastive learning  knowledge distillation  weakly-supervised temporal action localization  
A Novel Divide and Conquer Solution for Long-term Video Salient Object Detection 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 684-703
作者:  Yun-Xiao Li;  Cheng-Li-Zhao Chen;   Shuai Li;   Ai-Min Hao;  Hong Qin
Adobe PDF(6454Kb)  |  收藏  |  浏览/下载:28/10  |  提交时间:2024/07/18
Video salient object detection  background consistency analysis  weakly supervised learning  long-term information  background shift  
Rethinking Global Context in Crowd Counting 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 640-651
作者:  Guolei Sun;   Yun Liu;   Thomas Probst;   Danda Pani Paudel;  Nikola Popovic;   Luc Van Gool
Adobe PDF(2388Kb)  |  收藏  |  浏览/下载:23/8  |  提交时间:2024/07/18
Crowd counting  vision transformer  global context  attention  density map  
基于透视投影的三维人脸重建及姿态估计 学位论文
, 2024
作者:  徐淼
Adobe PDF(12191Kb)  |  收藏  |  浏览/下载:33/0  |  提交时间:2024/07/15
人脸重建,姿态估计,深度学习,神经网络,六自由度  
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:35/2  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文
, Canada, 2023
作者:  Zhang X(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(1199Kb)  |  收藏  |  浏览/下载:37/8  |  提交时间:2024/07/08
基于多模态协同的驾驶行为预测 学位论文
, 2024
作者:  董清辉
Adobe PDF(5017Kb)  |  收藏  |  浏览/下载:38/1  |  提交时间:2024/07/08
人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习  
Multi-Stage Image-Language Cross-Generative Fusion Network for Video-Based Referring Expression Comprehension 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 3256-3270
作者:  Zhang, Yujia;  Li, Qianzhong;  Pan, Yi;  Zhao, Xiaoguang;  Tan, Min
收藏  |  浏览/下载:14/0  |  提交时间:2024/07/03
Feature extraction  Visualization  Task analysis  Representation learning  Location awareness  Linguistics  Grounding  Video-based referring expression comprehension  multi-stage learning  image-language cross-generative fusion  consistency loss  
几何驱动的三维场景检测与分割 学位论文
, 2024
作者:  关赫
Adobe PDF(31711Kb)  |  收藏  |  浏览/下载:53/1  |  提交时间:2024/06/27
几何驱动  单目三维检测  多维场景分割  数据增强  实用性  特征交互  
基于多模态表征学习与融合的情感识别研究 学位论文
, 2024
作者:  孙立才
Adobe PDF(5844Kb)  |  收藏  |  浏览/下载:48/4  |  提交时间:2024/06/27
情感识别  表征学习  自监督学习  多模态融合  注意力机制