已选(0)清除
条数/页: 排序方式: |
| Snippet-to-Prototype Contrastive Consensus Network for Weakly Supervised Temporal Action Localization 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 6717-6729 作者: Shao, Yuxiang; Zhang, Feifei; Xu, Changsheng![](/image/person.jpg)
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:9/0  |  提交时间:2024/07/22 Contrastive learning knowledge distillation weakly-supervised temporal action localization |
| A Novel Divide and Conquer Solution for Long-term Video Salient Object Detection 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 684-703 作者: Yun-Xiao Li; Cheng-Li-Zhao Chen; Shuai Li; Ai-Min Hao; Hong Qin
Adobe PDF(6454Kb)  |   收藏  |  浏览/下载:28/10  |  提交时间:2024/07/18 Video salient object detection background consistency analysis weakly supervised learning long-term information background shift |
| Rethinking Global Context in Crowd Counting 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 640-651 作者: Guolei Sun; Yun Liu; Thomas Probst; Danda Pani Paudel; Nikola Popovic; Luc Van Gool
Adobe PDF(2388Kb)  |   收藏  |  浏览/下载:23/8  |  提交时间:2024/07/18 Crowd counting vision transformer global context attention density map |
| 基于透视投影的三维人脸重建及姿态估计 学位论文 , 2024 作者: 徐淼![](/image/person.jpg)
Adobe PDF(12191Kb)  |   收藏  |  浏览/下载:33/0  |  提交时间:2024/07/15 人脸重建,姿态估计,深度学习,神经网络,六自由度 |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:35/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文 , Canada, 2023 作者: Zhang X(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(1199Kb)  |   收藏  |  浏览/下载:37/8  |  提交时间:2024/07/08 |
| 基于多模态协同的驾驶行为预测 学位论文 , 2024 作者: 董清辉![](/image/person.jpg)
Adobe PDF(5017Kb)  |   收藏  |  浏览/下载:38/1  |  提交时间:2024/07/08 人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习 |
| Multi-Stage Image-Language Cross-Generative Fusion Network for Video-Based Referring Expression Comprehension 期刊论文 IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 3256-3270 作者: Zhang, Yujia ; Li, Qianzhong ; Pan, Yi ; Zhao, Xiaoguang ; Tan, Min![](/image/person.jpg)
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:14/0  |  提交时间:2024/07/03 Feature extraction Visualization Task analysis Representation learning Location awareness Linguistics Grounding Video-based referring expression comprehension multi-stage learning image-language cross-generative fusion consistency loss |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫![](/image/person.jpg)
Adobe PDF(31711Kb)  |   收藏  |  浏览/下载:53/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才![](/image/person.jpg)
Adobe PDF(5844Kb)  |   收藏  |  浏览/下载:48/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |