CASIA OpenIR

浏览/检索结果: 共7条,第1-7条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:258/12  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:323/18  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
知识与数据协同驱动的异质图像表示与合成 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  骆曼迪
Adobe PDF(10423Kb)  |  收藏  |  浏览/下载:303/15  |  提交时间:2022/08/08
知识与数据协同驱动  异质图像表示  异质图像合成  异质图像转换  生成对抗网络  信息瓶颈  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1136/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
开放环境下的高保真人脸图像生成研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  傅朝友
Adobe PDF(98636Kb)  |  收藏  |  浏览/下载:377/28  |  提交时间:2022/06/14
人脸图像生成  开放环境  对偶变分生成  异质人脸识别  
基于多模态交互与注意力机制的视觉问答 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  刘飞
Adobe PDF(10058Kb)  |  收藏  |  浏览/下载:408/17  |  提交时间:2022/06/13
视觉问答  多模态交互  注意力机制  关系推理  
面向自然人机交互的语言-视觉物体定位方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李钱钟
Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:279/13  |  提交时间:2022/06/13
自然人机交互  零样本物体检测  自然语言-图像指代表达理解  自然语言-视频指代表达理解