CASIA OpenIR  > 模式识别国家重点实验室  > 自然语言处理
一种拼音和汉字相结合的汉外口语自动翻译方法
周玉; 宗成庆
2009-12-30
公开日期2010-07-28
授权国家CN
专利类型发明
摘要一种拼音和汉字相结合的汉外口语自动翻译方法:首先将原始汉外双语语料的汉语部分进行字音转化和单字分割,得到基于拼音和基于汉字的汉外双语语料;分别利用基于拼音和汉字的汉外训练语料进行词对齐的训练,得到基于拼音和汉字的词对齐并对这两个词对齐进行融合得到融合后的词对齐文件;在此基础上抽取并学习翻译知识,得到基于拼音和基于汉字的翻译模型;结合外文语料的语言模型和翻译模型在开发集上进行最小错误训练,得到各个特征的特征权重及相关参数;最后进行融合解码生成最终翻译。该方法大大改善了翻译性能和系统的鲁棒性,与目前通用的基于字的翻译系统相比,系统性能利用机器翻译通用评测标准BLEU打分能够提高约10%。
授权日期2011-12-07
专利号CN200910244513.6
专利状态授权
文献类型专利
条目标识符http://ir.ia.ac.cn/handle/173211/8431
专题模式识别国家重点实验室_自然语言处理
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
周玉,宗成庆. 一种拼音和汉字相结合的汉外口语自动翻译方法. CN200910244513.6[P]. 2009-12-30.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
5周玉一种拼音和汉字相结合的汉外口语自动(6021KB)专利 开放获取CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[周玉]的文章
[宗成庆]的文章
百度学术
百度学术中相似的文章
[周玉]的文章
[宗成庆]的文章
必应学术
必应学术中相似的文章
[周玉]的文章
[宗成庆]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。