已选(0)清除
条数/页: 排序方式: |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:14/0  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| Ensemble Quadratic Assignment Network for Graph Matching 期刊论文 INTERNATIONAL JOURNAL OF COMPUTER VISION, 2024, 页码: 23 作者: Tan, Haoru ; Wang, Chuang ; Wu, Sitong; Zhang, Xu-Yao ; Yin, Fei ; Liu, Cheng-Lin![](/image/person.jpg)
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:7/0  |  提交时间:2024/07/03 Graph matching Combinatorial optimization Graph neural network Ensemble learning |
| SgVA-CLIP: Semantic-Guided Visual Adapting of Vision-Language Models for Few-Shot Image Classification 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 3469-3480 作者: Peng, Fang ; Yang, Xiaoshan ; Xiao, Linhui; Wang, Yaowei; Xu, Changsheng![](/image/person.jpg)
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:4/0  |  提交时间:2024/07/03 Few-shot image classification vision-language models |
| Emotion selectable end-to-end text-based speech editing 期刊论文 ARTIFICIAL INTELLIGENCE, 2024, 卷号: 329, 页码: 16 作者: Wang, Tao ; Yi, Jiangyan ; Fu, Ruibo ; Tao, Jianhua ; Wen, Zhengqi ; Zhang, Chu Yuan
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:7/0  |  提交时间:2024/07/03 Emotion selectable Text-based speech editing Emotion decoupling Mask prediction Few-shot learning Text-to-speech |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫![](/image/person.jpg)
Adobe PDF(31711Kb)  |   收藏  |  浏览/下载:26/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| 基于多尺度特征融合的图像语义分割方法研究 学位论文 , 2024 作者: 朱袁兵![](/image/person.jpg)
Adobe PDF(29615Kb)  |   收藏  |  浏览/下载:28/1  |  提交时间:2024/06/27 图像语义分割 实时语义分割 开放词汇语义分割 视觉语言模型 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才![](/image/person.jpg)
Adobe PDF(5844Kb)  |   收藏  |  浏览/下载:35/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |
| 基于脉冲神经网络的多模态视听分类 学位论文 , 2024 作者: 郭凌月![](/image/person.jpg)
Adobe PDF(3051Kb)  |   收藏  |  浏览/下载:21/0  |  提交时间:2024/06/27 脉冲神经网络 多模态对齐 多模态融合 视听分类 |
| 基于强化学习的视觉内容生成 学位论文 , 2024 作者: 秦子涵![](/image/person.jpg)
Adobe PDF(11517Kb)  |   收藏  |  浏览/下载:22/2  |  提交时间:2024/06/26 图像生成 视频生成 强化学习 |
| Memory-Adaptive Vision-and-Language Navigation 期刊论文 Pattern Recognition, 2024, 卷号: 153, 页码: 110511 作者: Keji He ; Ya Jing ; Yan Huang ; Zhihe Lu ; Dong An ; Liang Wang![](/image/person.jpg)
Adobe PDF(3831Kb)  |   收藏  |  浏览/下载:31/11  |  提交时间:2024/06/26 Vision-and-Language Navigation Memory bank History noises Memory-Adaptive Model |