鸡尾酒会问题与相关听觉模型的研究现状与展望
黄雅婷1,2; 石晶1,2; 许家铭1; 徐波1,2,3
发表期刊自动化学报
2019-02
卷号45期号:2页码:234-251
摘要

近些年, 随着电子设备和人工智能技术的飞速发展, 人机语音交互的重要性日益凸显. 然而, 由于干扰声源的存在, 在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度. 现阶段, 开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务. 因此, 鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别, 语音识别, 关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值. 本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望. 在简要介绍了听觉机理的相关研究, 并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后, 本文还讨论了受听觉认知机理启发的听觉注意建模方法, 认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性. 之后, 本文简单回顾了近期的多说话人语音识别模型. 最后, 本文讨论了目前各类计算模型对于处理鸡尾酒会问题时仍然存在的困难和挑战, 并对未来的研究方向进行了展望.

收录类别EI
语种中文
七大方向——子方向分类类脑模型与计算
国重实验室规划方向分类语音语言处理
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/49726
专题复杂系统认知与决策实验室_听觉模型与认知计算
通讯作者许家铭
作者单位1.中国科学院自动化研究所 北京 100190
2.中国科学院大学 北京 100049
3.中国科学院脑科学与智能技术卓越创新中心 上海 200031
第一作者单位中国科学院自动化研究所
通讯作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
黄雅婷,石晶,许家铭,等. 鸡尾酒会问题与相关听觉模型的研究现状与展望[J]. 自动化学报,2019,45(2):234-251.
APA 黄雅婷,石晶,许家铭,&徐波.(2019).鸡尾酒会问题与相关听觉模型的研究现状与展望.自动化学报,45(2),234-251.
MLA 黄雅婷,et al."鸡尾酒会问题与相关听觉模型的研究现状与展望".自动化学报 45.2(2019):234-251.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
鸡尾酒会问题与相关听觉模型的研究现状与展(3009KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[黄雅婷]的文章
[石晶]的文章
[许家铭]的文章
百度学术
百度学术中相似的文章
[黄雅婷]的文章
[石晶]的文章
[许家铭]的文章
必应学术
必应学术中相似的文章
[黄雅婷]的文章
[石晶]的文章
[许家铭]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 鸡尾酒会问题与相关听觉模型的研究现状与展望.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。