Knowledge Commons of Institute of Automation,CAS
一种汉英词语自动对齐方法 | |
宗成庆![]() ![]() | |
2008-01-09 | |
公开日期 | 2009-07-15 |
授权国家 | CN |
专利类型 | 发明专利 |
摘要 | 本发明涉及一种汉英词语自动对齐方法,首先对原始汉、英双语 句提取划分语块的特征信息划分,生成多层不同粒度的语块划分锚点 信息,对双语词对之间进行局部定位,生成词对齐文件。本发明解决 了传统方法规划路径多、复杂度高,难生成好的对齐结果,影响对齐 效率的问题,本发明根据相关特征将汉英双语句子分割,完成不同粒 度下的单元对齐,在各种粒度下将词对齐操作限制在相应的单元范围 内。实验表明,该方法获得的词语对齐比GIZA++工具包词对齐错误 率下降了28%,在该词对齐基础上的翻译结果BLEU打分比原始词 对齐提高了20%,而且克服了GIZA++不能对超过100个单词的长句 子进行很好的词语对齐的弊端。 |
授权日期 | 2011-06-01 |
专利号 | CN200810055783.8 |
专利状态 | 已授权 |
文献类型 | 专利 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/40765 |
专题 | 多模态人工智能系统全国重点实验室_自然语言处理 |
作者单位 | 中国科学院自动化研究所 |
第一作者单位 | 中国科学院自动化研究所 |
推荐引用方式 GB/T 7714 | 宗成庆,周玉,何彦青. 一种汉英词语自动对齐方法. CN200810055783.8[P]. 2008-01-09. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[宗成庆]的文章 |
[周玉]的文章 |
[何彦青]的文章 |
百度学术 |
百度学术中相似的文章 |
[宗成庆]的文章 |
[周玉]的文章 |
[何彦青]的文章 |
必应学术 |
必应学术中相似的文章 |
[宗成庆]的文章 |
[周玉]的文章 |
[何彦青]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论