CASIA OpenIR

浏览/检索结果: 共13条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:295/17  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:299/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
智能对话系统中的知识表示、激活与利用研究 学位论文
工学博士, 中国科学院自动化研究所: casia, 2022
作者:  陈修意
Adobe PDF(5912Kb)  |  收藏  |  浏览/下载:258/15  |  提交时间:2022/06/14
对话系统,知识表示,知识对话生成  
基于表示学习的中文短文本对话分析方法研究 学位论文
, 北京: 中国科学院大学, 2017
作者:  周玉军
Adobe PDF(2456Kb)  |  收藏  |  浏览/下载:551/8  |  提交时间:2017/12/07
中文短文本对话  深度神经网络  表示学习  词/字向量  注意力机制  
智能交互型虚拟角色运动合成方法研究 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  王雨萌
Adobe PDF(22448Kb)  |  收藏  |  浏览/下载:266/4  |  提交时间:2017/06/06
角色动画  运动合成  交互式动画  递归神经网络  深度强化学习  
广播视频节目层结构分析及视觉内容检索研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  陈见耸
Adobe PDF(3915Kb)  |  收藏  |  浏览/下载:235/0  |  提交时间:2015/09/02
广播视频  节目层结构分析  音视频模板匹配  重复序列检测  图像检索  台标识别  Broadcast Videos  Program Layer Structure Analysis  Audio/video Template Matching  Repeated Sequence Detection  Image Retrieval  Tv Logo Recognition  
大规模人群说话人识别关键技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2012
作者:  朱磊
Adobe PDF(1513Kb)  |  收藏  |  浏览/下载:217/1  |  提交时间:2015/09/02
说话人识别  残差因子分析  语种失配补偿  说话人快速识别  说话人搜索  Speaker Recognition  Residual Factor Analysis  Languages Mismatch Compensation  Quick Speaker Recognition  Speaker Search Algorithm  
汉语CALL系统韵律诊断关键技术的研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2011
作者:  朱涛涛
Adobe PDF(1196Kb)  |  收藏  |  浏览/下载:116/0  |  提交时间:2015/09/02
重音检错  声调诊断  声调聚类  语调识别  语调诊断  主导集  决策树  Stress Detection  Tone Error Detection  Tone Diagnosis  Tone Clustering  Intonation Recognition  Intonation Diagnosis  Dominants Set  Decision Tree  
基于计算听觉场景分析的单声道混合语音分离研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2007
作者:  李鹏
Adobe PDF(1867Kb)  |  收藏  |  浏览/下载:294/0  |  提交时间:2015/09/02
单声道语音分离  计算听觉场景分析  二值掩蔽  语音客观质量评估  多基音跟踪  因子最大矢量量化  Monaural Speech Separation  Computational Auditory Scene Analysis  Binary Mask  Objective Quality Assessment Of Speech  Multi-pitch Tracking  Factorial-max Vector Quantization  
基于内容的连续音频流分割与标注技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2007
作者:  张世磊
Microsoft Word(3417Kb)  |  收藏  |  浏览/下载:246/0  |  提交时间:2015/09/02
分割与标注技术  音频分割  音频分类  说话人聚类  说话人标注系统  语音识别预处理  Segmentation And Annotation  Audio Segmentation  Audio Classification  Speaker Clustering  Speaker Diarization System  Pre-processing System