Knowledge Commons of Institute of Automation,CAS
鸡尾酒会问题与相关听觉模型的研究现状与展望 | |
黄雅婷1,2; 石晶1,2; 许家铭1; 徐波1,2,3 | |
发表期刊 | 自动化学报 |
2019-02 | |
卷号 | 45期号:2页码:234-251 |
摘要 | 近些年, 随着电子设备和人工智能技术的飞速发展, 人机语音交互的重要性日益凸显. 然而, 由于干扰声源的存在, 在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度. 现阶段, 开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务. 因此, 鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别, 语音识别, 关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值. 本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望. 在简要介绍了听觉机理的相关研究, 并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后, 本文还讨论了受听觉认知机理启发的听觉注意建模方法, 认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性. 之后, 本文简单回顾了近期的多说话人语音识别模型. 最后, 本文讨论了目前各类计算模型对于处理鸡尾酒会问题时仍然存在的困难和挑战, 并对未来的研究方向进行了展望. |
收录类别 | EI |
语种 | 中文 |
七大方向——子方向分类 | 类脑模型与计算 |
国重实验室规划方向分类 | 语音语言处理 |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/49726 |
专题 | 复杂系统认知与决策实验室_听觉模型与认知计算 |
通讯作者 | 许家铭 |
作者单位 | 1.中国科学院自动化研究所 北京 100190 2.中国科学院大学 北京 100049 3.中国科学院脑科学与智能技术卓越创新中心 上海 200031 |
第一作者单位 | 中国科学院自动化研究所 |
通讯作者单位 | 中国科学院自动化研究所 |
推荐引用方式 GB/T 7714 | 黄雅婷,石晶,许家铭,等. 鸡尾酒会问题与相关听觉模型的研究现状与展望[J]. 自动化学报,2019,45(2):234-251. |
APA | 黄雅婷,石晶,许家铭,&徐波.(2019).鸡尾酒会问题与相关听觉模型的研究现状与展望.自动化学报,45(2),234-251. |
MLA | 黄雅婷,et al."鸡尾酒会问题与相关听觉模型的研究现状与展望".自动化学报 45.2(2019):234-251. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
鸡尾酒会问题与相关听觉模型的研究现状与展(3009KB) | 期刊论文 | 作者接受稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[黄雅婷]的文章 |
[石晶]的文章 |
[许家铭]的文章 |
百度学术 |
百度学术中相似的文章 |
[黄雅婷]的文章 |
[石晶]的文章 |
[许家铭]的文章 |
必应学术 |
必应学术中相似的文章 |
[黄雅婷]的文章 |
[石晶]的文章 |
[许家铭]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论