CASIA OpenIR  > 模式识别国家重点实验室  > 自然语言处理
一种拼音和汉字相结合的汉外口语自动翻译方法
周玉; 宗成庆
2009-12-30
Date Available2010-07-28
CountryCN
Subtype发明
Abstract一种拼音和汉字相结合的汉外口语自动翻译方法:首先将原始汉外双语语料的汉语部分进行字音转化和单字分割,得到基于拼音和基于汉字的汉外双语语料;分别利用基于拼音和汉字的汉外训练语料进行词对齐的训练,得到基于拼音和汉字的词对齐并对这两个词对齐进行融合得到融合后的词对齐文件;在此基础上抽取并学习翻译知识,得到基于拼音和基于汉字的翻译模型;结合外文语料的语言模型和翻译模型在开发集上进行最小错误训练,得到各个特征的特征权重及相关参数;最后进行融合解码生成最终翻译。该方法大大改善了翻译性能和系统的鲁棒性,与目前通用的基于字的翻译系统相比,系统性能利用机器翻译通用评测标准BLEU打分能够提高约10%。
Copyright Date2011-12-07
Patent NumberCN200910244513.6
Status授权
Document Type专利
Identifierhttp://ir.ia.ac.cn/handle/173211/8431
Collection模式识别国家重点实验室_自然语言处理
Affiliation中国科学院自动化研究所
Recommended Citation
GB/T 7714
周玉,宗成庆. 一种拼音和汉字相结合的汉外口语自动翻译方法. CN200910244513.6[P]. 2009-12-30.
Files in This Item:
File Name/Size DocType Version Access License
5周玉一种拼音和汉字相结合的汉外口语自动(6021KB)专利 开放获取CC BY-NC-SAApplication Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[周玉]'s Articles
[宗成庆]'s Articles
Baidu academic
Similar articles in Baidu academic
[周玉]'s Articles
[宗成庆]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[周玉]'s Articles
[宗成庆]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.