已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文 , Chengdu, China, 2021-10 作者: Zhang X(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(5740Kb)  |   收藏  |  浏览/下载:22/5  |  提交时间:2024/07/08 |
| 标注受限的光学遥感图像目标检测模型与算法研究 学位论文 , 2024 作者: 任至达![](/image/person.jpg)
Adobe PDF(18136Kb)  |   收藏  |  浏览/下载:16/0  |  提交时间:2024/07/08 光学遥感图像目标检测 标注受限 弱监督学习 显著性检测 特征增强 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:16/1  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| CMFN: Cross-Modal Fusion Network for Irregular Scene Text Recognition 会议论文 , 中国, 2023.06.08 作者: Jinzhi Zheng; Ruyi Ji ; Libo Zhang; Yanjun Wu; Chen Zhao
Adobe PDF(1516Kb)  |   收藏  |  浏览/下载:14/6  |  提交时间:2024/07/08 |
| A Semantic and Structural Transformer for Code Summarization Generation 会议论文 , 澳大利亚, 2023.6.8 作者: Ruyi Ji ; Zhenyu Tong; Tiejian Luo; Jing Liu; Libo Zhang
Adobe PDF(912Kb)  |   收藏  |  浏览/下载:14/5  |  提交时间:2024/07/08 |
| 人脸三维结构恢复和层次化解析 学位论文 , 2024 作者: 于畅![](/image/person.jpg)
Adobe PDF(31650Kb)  |   收藏  |  浏览/下载:21/2  |  提交时间:2024/07/06 人脸层次化解析 三维人脸表征 胶囊网络 可解释表征 |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏![](/image/person.jpg)
Adobe PDF(7273Kb)  |   收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| Robust Adversarial Watermark Defending Against GAN Synthesization Attack 期刊论文 IEEE SIGNAL PROCESSING LETTERS, 2024, 卷号: 31, 页码: 351-355 作者: Xu, Shengwang; Qiao, Tong; Xu, Ming; Wang, Wei ; Zheng, Ning
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:2/0  |  提交时间:2024/07/03 Watermarking Transform coding Generative adversarial networks Forgery Image coding Discrete cosine transforms Decoding GAN synthesized image adversarial watermark JPEG compression |
| Contextualized Relation Predictive Model for Self-Supervised Group Activity Representation Learning 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 353-366 作者: Zhou, Wanting ; Kong, Longteng; Han, Yushan; Qin, Jie ; Sun, Zhenan![](/image/person.jpg)
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:2/0  |  提交时间:2024/07/03 Group activity representation learning group activity recognition self-supervised learning transformer predictive coding |