CASIA OpenIR

浏览/检索结果: 共10条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:360/18  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
面向鸡尾酒会问题的视觉辅助语音分离算法研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  张鹏
Adobe PDF(8406Kb)  |  收藏  |  浏览/下载:330/4  |  提交时间:2021/06/21
鸡尾酒会问题  语音分离  视觉辅助  在线流式处理  生成对抗训练  
面向低资源场景的端到端语音识别方法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  易澄
Adobe PDF(3846Kb)  |  收藏  |  浏览/下载:422/14  |  提交时间:2021/06/21
低资源语音识别  端到端  预训练  
电视节目结构化分析与摘要技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  徐夙
Adobe PDF(13971Kb)  |  收藏  |  浏览/下载:167/0  |  提交时间:2015/09/02
逻辑单元分割  条件随机场模型  图片摘要  图片摘要可视化  Logical Unit Segmentation  Conditional Random Field  Still-image Abstract  Still-image Visualization  
广播视频节目层结构分析及视觉内容检索研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  陈见耸
Adobe PDF(3915Kb)  |  收藏  |  浏览/下载:269/0  |  提交时间:2015/09/02
广播视频  节目层结构分析  音视频模板匹配  重复序列检测  图像检索  台标识别  Broadcast Videos  Program Layer Structure Analysis  Audio/video Template Matching  Repeated Sequence Detection  Image Retrieval  Tv Logo Recognition  
视音频全局时序特征在疑似广告检测中的应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2012
作者:  张波
Adobe PDF(7235Kb)  |  收藏  |  浏览/下载:177/0  |  提交时间:2015/09/02
广告检测  广告分割  视频分析  多模态融合  在线学习  Commercial Detection  Commercial Segmentation  Video Analysis  Multi-model Fusion  Online Learning  
英语口语超音段层次自动检错与评估技术的研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2011
作者:  黄申
Adobe PDF(3989Kb)  |  收藏  |  浏览/下载:215/1  |  提交时间:2015/09/02
语音识别  计算机辅助语言学习  超音段  流利  韵律  Speech Recognition  Computer Aided Language Learning  Supra-segmental Feature  Fluency  Prosody  
汉语CALL系统声调语调评估诊断技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2009
作者:  柯登峰
Adobe PDF(2325Kb)  |  收藏  |  浏览/下载:297/0  |  提交时间:2015/09/02
计算机辅助语言学些  韵律  声调  语调  评估  诊断  Call  Prosody  Tone  Intonation  Assessment  Diagnosis  
音频信息检索关键技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2009
作者:  王磊
Adobe PDF(1915Kb)  |  收藏  |  浏览/下载:244/0  |  提交时间:2015/09/02
哼唱音乐检索  音频模板检索  音频分类  广播新闻条目自动分割  Query By Singing/humming  Audio Template Searching  Audio Classification  Broadcasting News Story Segmentation  
多语言语种识别技术的研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2007
作者:  姜洪臣
Adobe PDF(1145Kb)  |  收藏  |  浏览/下载:299/0  |  提交时间:2015/09/02
多语言语种识别  音频分类  支持向量机  高斯混合模型-全局背景模型  识别置信度  Multilingual Language Identification  Audio Classification  Svm  Gmm-ubm  Recognition Confidence Measure