已选(0)清除
条数/页: 排序方式: |
| 基于Transformer的几何基元检测与分析 学位论文 , 2024 作者: 周威 Adobe PDF(10067Kb)  |  收藏  |  浏览/下载:42/5  |  提交时间:2024/07/21 基元检测 关系分析 关键点 Transformer |
| TextFormer: A Query-based End-to-end Text Spotter with Mixed Supervision 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 704-717 作者: Yukun Zhai; Xiaoqiang Zhang; Xiameng Qin; Sanyuan Zhao; Xingping Dong; Jianbing Shen Adobe PDF(2312Kb)  |  收藏  |  浏览/下载:26/8  |  提交时间:2024/07/18 End-to-end text spotting arbitrarily-shaped texts transformer mixed supervision multitask modeling |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:34/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:54/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| Calibration & Reconstruction: Deep Integrated Language for Referring Image Segmentation 会议论文 Proceedings of the 2024 International Conference on Multimedia Retrieval, Phuket, Thailand, 2024/03/08 作者: Yichen Yan; Xingjian He; Sihan Chen; Jing Liu Adobe PDF(2868Kb)  |  收藏  |  浏览/下载:27/10  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| Fuse & Calibrate: A bi-directional Vision-Language Guided Framework for Referring Image Segmentation 会议论文 , Tianjin, China, 2024/08/05 作者: Yichen Yan; Xingjian He; Sihan Chen; Shichen Lu; Jing Liu Adobe PDF(1978Kb)  |  收藏  |  浏览/下载:26/10  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 6906-6916 作者: Wang, Wenxuan; He, Xingjian; Zhang, Yisi; Guo, Longteng; Shen, Jiachen; Li, Jiangyun; Liu, Jing 收藏  |  浏览/下载:10/0  |  提交时间:2024/07/03 Referring image segmentation cross-modality guidance masked self-distillation vision and language |
| AI资讯 2023年 第04期(总第108期) 其他 2023-04-01 作者: 张桂英 Adobe PDF(6703Kb)  |  收藏  |  浏览/下载:10/6  |  提交时间:2024/07/01 |
| AI资讯 2021年 第12期(总第92期) 其他 2021-12-01 作者: 张桂英 Adobe PDF(7382Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/07/01 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才 Adobe PDF(5844Kb)  |  收藏  |  浏览/下载:48/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |