已选(0)清除
条数/页: 排序方式: |
| TextFormer: A Query-based End-to-end Text Spotter with Mixed Supervision 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 704-717 作者: Yukun Zhai; Xiaoqiang Zhang; Xiameng Qin; Sanyuan Zhao; Xingping Dong; Jianbing Shen
Adobe PDF(2312Kb)  |   收藏  |  浏览/下载:26/8  |  提交时间:2024/07/18 End-to-end text spotting arbitrarily-shaped texts transformer mixed supervision multitask modeling |
| Segment Anything Is Not Always Perfect: An Investigationof SAM on Different Real-world Applications 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 617-630 作者: Wei Ji; Jingjing Li; Qi Bi; Tingwei Liu; Wenbo Li ; Li Cheng
Adobe PDF(11623Kb)  |   收藏  |  浏览/下载:15/4  |  提交时间:2024/07/18 Segment anything model (SAM) visual perception segmentation foundational model computer vision |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅![](/image/person.jpg)
Adobe PDF(11380Kb)  |   收藏  |  浏览/下载:60/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:34/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文 IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931 作者: Zhang Xi(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(4719Kb)  |   收藏  |  浏览/下载:41/10  |  提交时间:2024/07/08 |
| VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文 , Canada, 2023 作者: Zhang X(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(1199Kb)  |   收藏  |  浏览/下载:37/8  |  提交时间:2024/07/08 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:54/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| A Semantic and Structural Transformer for Code Summarization Generation 会议论文 , 澳大利亚, 2023.6.8 作者: Ruyi Ji ; Zhenyu Tong; Tiejian Luo; Jing Liu; Libo Zhang
Adobe PDF(912Kb)  |   收藏  |  浏览/下载:35/14  |  提交时间:2024/07/08 |
| Calibration & Reconstruction: Deep Integrated Language for Referring Image Segmentation 会议论文 Proceedings of the 2024 International Conference on Multimedia Retrieval, Phuket, Thailand, 2024/03/08 作者: Yichen Yan ; Xingjian He ; Sihan Chen; Jing Liu
Adobe PDF(2868Kb)  |   收藏  |  浏览/下载:27/10  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| 基于多模态协同的驾驶行为预测 学位论文 , 2024 作者: 董清辉![](/image/person.jpg)
Adobe PDF(5017Kb)  |   收藏  |  浏览/下载:33/0  |  提交时间:2024/07/08 人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习 |