CASIA OpenIR  > 模式识别国家重点实验室  > 自然语言处理
一种汉英词语自动对齐方法
宗成庆; 周玉; 何彦青
2008-01-09
Date Available2009-07-15
CountryCN
Subtype发明
Abstract本发明涉及一种汉英词语自动对齐方法,首先对原始汉、英双语 句提取划分语块的特征信息划分,生成多层不同粒度的语块划分锚点 信息,对双语词对之间进行局部定位,生成词对齐文件。本发明解决 了传统方法规划路径多、复杂度高,难生成好的对齐结果,影响对齐 效率的问题,本发明根据相关特征将汉英双语句子分割,完成不同粒 度下的单元对齐,在各种粒度下将词对齐操作限制在相应的单元范围 内。实验表明,该方法获得的词语对齐比GIZA++工具包词对齐错误 率下降了28%,在该词对齐基础上的翻译结果BLEU打分比原始词 对齐提高了20%,而且克服了GIZA++不能对超过100个单词的长句 子进行很好的词语对齐的弊端。
Copyright Date2011-06-01
Patent NumberCN200810055783.8
Status授权
Document Type专利
Identifierhttp://ir.ia.ac.cn/handle/173211/8301
Collection模式识别国家重点实验室_自然语言处理
Affiliation中国科学院自动化研究所
Recommended Citation
GB/T 7714
宗成庆,周玉,何彦青. 一种汉英词语自动对齐方法. CN200810055783.8[P]. 2008-01-09.
Files in This Item:
File Name/Size DocType Version Access License
2周玉一种汉英词语自动对齐方法.pdf(401KB)专利 开放获取CC BY-NC-SAApplication Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[宗成庆]'s Articles
[周玉]'s Articles
[何彦青]'s Articles
Baidu academic
Similar articles in Baidu academic
[宗成庆]'s Articles
[周玉]'s Articles
[何彦青]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[宗成庆]'s Articles
[周玉]'s Articles
[何彦青]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.