已选(0)清除
条数/页: 排序方式: |
| Vision Transformers with Hierarchical Attention 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 670-683 作者: Yun Liu; Yu-Huan Wu; Guolei Sun; Le Zhang; Ajad Chhatkuli; Luc Van Gool
Adobe PDF(1358Kb)  |   收藏  |  浏览/下载:36/12  |  提交时间:2024/07/18 Vision transformer hierarchical attention global attention local attention scene understanding |
| Rethinking Global Context in Crowd Counting 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 640-651 作者: Guolei Sun; Yun Liu; Thomas Probst; Danda Pani Paudel; Nikola Popovic; Luc Van Gool
Adobe PDF(2388Kb)  |   收藏  |  浏览/下载:23/8  |  提交时间:2024/07/18 Crowd counting vision transformer global context attention density map |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:35/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| A Semantic and Structural Transformer for Code Summarization Generation 会议论文 , 澳大利亚, 2023.6.8 作者: Ruyi Ji ; Zhenyu Tong; Tiejian Luo; Jing Liu; Libo Zhang
Adobe PDF(912Kb)  |   收藏  |  浏览/下载:35/14  |  提交时间:2024/07/08 |
| 人脸三维结构恢复和层次化解析 学位论文 , 2024 作者: 于畅![](/image/person.jpg)
Adobe PDF(31650Kb)  |   收藏  |  浏览/下载:39/2  |  提交时间:2024/07/06 人脸层次化解析 三维人脸表征 胶囊网络 可解释表征 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才![](/image/person.jpg)
Adobe PDF(5844Kb)  |   收藏  |  浏览/下载:48/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |
| V2X-BGN: Camera-based V2X-Collaborative 3D Object Detection with BEV Global Non-Maximum Suppression 会议论文 , Jeju Island, South Korea, June 2-5, 2024 作者: Zhang Caiji ; Tian Bin ; Meng Shi ; Qi Shuangying; Sun Yang; Ai Yunfeng; Chen Long![](/image/person.jpg)
Adobe PDF(1659Kb)  |   收藏  |  浏览/下载:34/11  |  提交时间:2024/06/25 V2X |
| 面向复杂场景的跨维度视觉感知方法研究 学位论文 , 2024 作者: 潘聪![](/image/person.jpg)
Adobe PDF(28980Kb)  |   收藏  |  浏览/下载:40/0  |  提交时间:2024/06/25 视觉场景感知 二维目标检测 单目三维目标检测 鸟瞰图语义分割 视觉Transformer |
| 面向脑血管疾病的介入手术多模态影像融合导航关键技术研究 学位论文 , 2024 作者: 赵海宁![](/image/person.jpg)
Adobe PDF(16927Kb)  |   收藏  |  浏览/下载:43/4  |  提交时间:2024/06/25 颅内动脉狭窄 血管介入手术导航 多模态医学影像融合 三维血管影 像快速提取 二维血管影像精准提取 |
| GFFNet: Global Feature Fusion Network for Semantic Segmentation of Large-Scale Remote Sensing Images 期刊论文 IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2024, 卷号: 17, 期号: 2024, 页码: 4222 - 4234 作者: Cao, Yong ; Huo, Chunlei ; Xiang, Shiming ; Pan, Chunhong![](/image/person.jpg)
Adobe PDF(4340Kb)  |   收藏  |  浏览/下载:36/8  |  提交时间:2024/06/25 Cross feature fusion (CFF) global context learning group transformer semantic segmentation |