已选(0)清除
条数/页: 排序方式: |
| CMFN: Cross-Modal Fusion Network for Irregular Scene Text Recognition 会议论文 , 中国, 2023.06.08 作者: Jinzhi Zheng; Ruyi Ji; Libo Zhang; Yanjun Wu; Chen Zhao Adobe PDF(1516Kb)  |  收藏  |  浏览/下载:18/9  |  提交时间:2024/07/08 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才 Adobe PDF(5844Kb)  |  收藏  |  浏览/下载:36/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |
| 跨模态信息融合的文本图像翻译方法研究 学位论文 , 2024 作者: 马聪 Adobe PDF(11285Kb)  |  收藏  |  浏览/下载:42/5  |  提交时间:2024/06/26 文本图像翻译 跨模态信息融合 多任务学习 跨模态对比学习 参数高效微调 |
| 磁纳米粒子成像时频域信号增强方法研究 学位论文 , 2024 作者: 卫泽琛 Adobe PDF(16714Kb)  |  收藏  |  浏览/下载:46/6  |  提交时间:2024/06/24 磁纳米粒子成像 时频域信号增强 双频激励技术 注意力机制 掩码自监督学习 |
| Improved Learning for Online Handwritten Chinese Text Recognition with Convolutional Prototype Network 期刊论文 ICDAR2023, 2023, 页码: 1 作者: Chen Y(陈懿); Zhang H(张恒); Liu CL(刘成林) Adobe PDF(1058Kb)  |  收藏  |  浏览/下载:26/10  |  提交时间:2024/06/24 |
| 面向无词注释的手语翻译研究 学位论文 , 2024 作者: 陈志刚 Adobe PDF(3701Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/05/28 手语翻译 无词注释 多模态预训练 手语表征学习 |
| 面向精准价格牌识别的多任务循环神经网络 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 608-614 作者: 牟永强; 范宝杰; 孙超; 严蕤; 郭怡适 Adobe PDF(1478Kb)  |  收藏  |  浏览/下载:46/21  |  提交时间:2024/05/20 卷积神经网络 循环神经网络 文本识别 多任务学习 价格牌识别 |
| 结合感受野增强和全卷积网络的场景文字检测方法 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 797-807 作者: 李晓玉; 宋永红; 余涛 Adobe PDF(7403Kb)  |  收藏  |  浏览/下载:32/12  |  提交时间:2024/05/20 感受野增强 Focalloss GIo Uloss 全卷积网络 |
| 基于边缘特征增强的任意形状文本检测网络 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 1019-1030 作者: 白鹤翔; 王浩然 Adobe PDF(3157Kb)  |  收藏  |  浏览/下载:45/16  |  提交时间:2024/05/09 场景文本检测 任意形状 边缘区域 浅层特征 渐进尺度扩张网络 |
| How Good is Google Bard's Visual Understanding? An Empirical Study on Open Challenges 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 5, 页码: 605-613 作者: Haotong Qin; Ge-Peng Ji; Salman Khan; Deng-Ping Fan; Fahad Shahbaz Khan; Luc Van Gool Adobe PDF(10373Kb)  |  收藏  |  浏览/下载:38/6  |  提交时间:2024/04/23 Google Bard, multi-modal understanding, visual comprehension, large language models, conversational AI, chatbot |