Knowledge Commons of Institute of Automation,CAS
普通话语音识别中的神经网络语言模型的比较研究 | |
马浩鑫1,2; 白烨1,2; 易江燕1; 陶建华1,2,3 | |
2019-09 | |
会议名称 | NCMMSC2019 |
会议日期 | 2019-8 |
会议地点 | 青海西宁 |
摘要 | 语言模型是语音识别的重要组成部分,在具体实现时,模型参数设置会影响识别效果。本文对基于神经网络的语 言模型展开研究,在 AISHELL-1 中文数据集上进行解码实验,以识别结果的词错率以及语言模型的大小和困惑度为评价指标, 在前馈神经网络语言模型和循环神经网络语言模型这两种模型上广泛而详细地比较了不同网络参数对于识别效果的影响,如:激活函数、N 元语法窗口长度、循环结构等。此外,实验还比较了有无共享 Embedding 结构对语言模型的影响,证明了该结构确实 可以在大大减少模型参数的基础上对提升语言模型性能。 |
收录类别 | 其他 |
语种 | 中文 |
文献类型 | 会议论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/48842 |
专题 | 多模态人工智能系统全国重点实验室_智能交互 |
作者单位 | 1.中国科学院自动化研究所 模式识别国家重点实验室,北京 2.中国科学院大学 人工智能技术学院,北京 3.中国科学院自动化研究所 中国科学院脑科学与智能技术研究中心,北京 |
第一作者单位 | 模式识别国家重点实验室 |
推荐引用方式 GB/T 7714 | 马浩鑫,白烨,易江燕,等. 普通话语音识别中的神经网络语言模型的比较研究[C],2019. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
5 An investigation o(621KB) | 会议论文 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[马浩鑫]的文章 |
[白烨]的文章 |
[易江燕]的文章 |
百度学术 |
百度学术中相似的文章 |
[马浩鑫]的文章 |
[白烨]的文章 |
[易江燕]的文章 |
必应学术 |
必应学术中相似的文章 |
[马浩鑫]的文章 |
[白烨]的文章 |
[易江燕]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论