CASIA OpenIR

浏览/检索结果: 共1687条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
A Novel Divide and Conquer Solution for Long-term Video Salient Object Detection 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 684-703
作者:  Yun-Xiao Li;  Cheng-Li-Zhao Chen;   Shuai Li;   Ai-Min Hao;  Hong Qin
Adobe PDF(6454Kb)  |  收藏  |  浏览/下载:12/4  |  提交时间:2024/07/18
Video salient object detection  background consistency analysis  weakly supervised learning  long-term information  background shift  
Rethinking Global Context in Crowd Counting 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 640-651
作者:  Guolei Sun;   Yun Liu;   Thomas Probst;   Danda Pani Paudel;  Nikola Popovic;   Luc Van Gool
Adobe PDF(2388Kb)  |  收藏  |  浏览/下载:11/4  |  提交时间:2024/07/18
Crowd counting  vision transformer  global context  attention  density map  
Optimal Positioning Strategy for Multi-Camera Zooming Drones 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 8, 页码: 1802-1818
作者:  Manuel Vargas;  Carlos Vivas;  Teodoro Alamo
Adobe PDF(6070Kb)  |  收藏  |  浏览/下载:7/3  |  提交时间:2024/07/16
Convex optimization  projective transformation  unmanned aerial vehicle  visual object tracking  visual surveillance  
基于透视投影的三维人脸重建及姿态估计 学位论文
, 2024
作者:  徐淼
Adobe PDF(12191Kb)  |  收藏  |  浏览/下载:19/0  |  提交时间:2024/07/15
人脸重建,姿态估计,深度学习,神经网络,六自由度  
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:22/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
基于多模态协同的驾驶行为预测 学位论文
, 2024
作者:  董清辉
Adobe PDF(5017Kb)  |  收藏  |  浏览/下载:24/0  |  提交时间:2024/07/08
人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习  
人脸三维结构恢复和层次化解析 学位论文
, 2024
作者:  于畅
Adobe PDF(31650Kb)  |  收藏  |  浏览/下载:30/2  |  提交时间:2024/07/06
人脸层次化解析  三维人脸表征  胶囊网络  可解释表征  
基于强化学习的多无人机协同任务规划技术 学位论文
, 2024
作者:  张梦瑶
Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:73/0  |  提交时间:2024/07/04
多无人机协同作战  任务规划  图神经网络  多旅行商问题  强化学习  
Comprehensive Attribute Prediction Learning for Person Search by Language 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 1990-2003
作者:  Niu, Kai;  Huang, Linjiang;  Long, Yuzhou;  Huang, Yan;  Wang, Liang;  Zhang, Yanning
收藏  |  浏览/下载:5/0  |  提交时间:2024/07/03
Person search by language  cross-modal retrieval  smart video surveillance  attribute prediction  
An end-to-end model for multi-view scene text recognition 期刊论文
PATTERN RECOGNITION, 2024, 卷号: 149, 页码: 17
作者:  Banerjee, Ayan;  Shivakumara, Palaiahnakote;  Bhattacharya, Saumik;  Pal, Umapada;  Liu, Cheng-Lin
收藏  |  浏览/下载:13/0  |  提交时间:2024/07/03
Text detection  Scene text recognition  Siamese network  Natural language model  Genetic algorithm  Multi-view text detection