已选(0)清除
条数/页: 排序方式: |
| 会议场景智能语音处理技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 范志赟 Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:258/12  |  提交时间:2022/09/15 会议场景,语音识别,说话人转换点检测,说话人自适应 |
| 面向低功耗的语音增强与分离算法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 黄雅婷 Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:323/18  |  提交时间:2022/09/14 语音增强与分离 脉冲神经网络 模型压缩 听觉感知恢复 |
| 知识与数据协同驱动的异质图像表示与合成 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 骆曼迪 Adobe PDF(10423Kb)  |  收藏  |  浏览/下载:303/15  |  提交时间:2022/08/08 知识与数据协同驱动 异质图像表示 异质图像合成 异质图像转换 生成对抗网络 信息瓶颈 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1136/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 开放环境下的高保真人脸图像生成研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 傅朝友 Adobe PDF(98636Kb)  |  收藏  |  浏览/下载:377/28  |  提交时间:2022/06/14 人脸图像生成 开放环境 对偶变分生成 异质人脸识别 |
| 基于多模态交互与注意力机制的视觉问答 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 刘飞 Adobe PDF(10058Kb)  |  收藏  |  浏览/下载:408/17  |  提交时间:2022/06/13 视觉问答 多模态交互 注意力机制 关系推理 |
| 面向自然人机交互的语言-视觉物体定位方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 李钱钟 Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:279/13  |  提交时间:2022/06/13 自然人机交互 零样本物体检测 自然语言-图像指代表达理解 自然语言-视频指代表达理解 |