已选(0)清除
条数/页: 排序方式: |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦![](/image/person.jpg)
Adobe PDF(19170Kb)  |   收藏  |  浏览/下载:1165/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 基于孪生网络的实时视觉目标跟踪研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2020 作者: 王强![](/image/person.jpg)
Adobe PDF(8516Kb)  |   收藏  |  浏览/下载:500/14  |  提交时间:2020/06/09 视觉目标跟踪 孪生网络 端到端学习 注意力机制 实例分割 |
| 基于深度学习的人体行为识别研究 学位论文 工学博士学位, 中国科学院自动化研究所: 中国科学院大学, 2019 作者: 杨浩![](/image/person.jpg)
Adobe PDF(16833Kb)  |   收藏  |  浏览/下载:424/15  |  提交时间:2019/06/17 深度学习 卷积神经网络 递归神经网络 行为识别 |
| 基于相关滤波的在线视觉跟踪研究 学位论文 , 北京: 中国科学院研究生院, 2018 作者: 张梦丹![](/image/person.jpg)
Adobe PDF(47557Kb)  |   收藏  |  浏览/下载:310/6  |  提交时间:2018/05/30 相关滤波 视觉跟踪 弱监督学习 深度学习 卷积神经网络 |
| 基于视觉词包模型的行为识别 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2010 作者: 原春锋![](/image/person.jpg)
Adobe PDF(5826Kb)  |   收藏  |  浏览/下载:221/0  |  提交时间:2015/09/02 时空区域描述子 黎曼度量 推土机距离 金字塔词汇树 稀疏时空金字塔匹配核 时空邻近分布 特征融合 视觉词包 行为识别 Spatio-temporal Covariance Descriptor Riemannian Metric Earth Mover's Distance Pyramid Vocabulary Tree Sparse Spatio-temporal Pyramid Matching Kernel Spatio-temporal Proximity Distribution Bag-of-visual-words Features Fusion Action Recognition |