CASIA OpenIR  > 模式识别国家重点实验室  > 自然语言处理
一种汉英词语自动对齐方法
宗成庆; 周玉; 何彦青
2008-01-09
公开日期2009-07-15
授权国家CN
专利类型发明
摘要本发明涉及一种汉英词语自动对齐方法,首先对原始汉、英双语 句提取划分语块的特征信息划分,生成多层不同粒度的语块划分锚点 信息,对双语词对之间进行局部定位,生成词对齐文件。本发明解决 了传统方法规划路径多、复杂度高,难生成好的对齐结果,影响对齐 效率的问题,本发明根据相关特征将汉英双语句子分割,完成不同粒 度下的单元对齐,在各种粒度下将词对齐操作限制在相应的单元范围 内。实验表明,该方法获得的词语对齐比GIZA++工具包词对齐错误 率下降了28%,在该词对齐基础上的翻译结果BLEU打分比原始词 对齐提高了20%,而且克服了GIZA++不能对超过100个单词的长句 子进行很好的词语对齐的弊端。
授权日期2011-06-01
专利号CN200810055783.8
专利状态授权
文献类型专利
条目标识符http://ir.ia.ac.cn/handle/173211/8301
专题模式识别国家重点实验室_自然语言处理
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
宗成庆,周玉,何彦青. 一种汉英词语自动对齐方法. CN200810055783.8[P]. 2008-01-09.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
2周玉一种汉英词语自动对齐方法.pdf(401KB)专利 开放获取CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[宗成庆]的文章
[周玉]的文章
[何彦青]的文章
百度学术
百度学术中相似的文章
[宗成庆]的文章
[周玉]的文章
[何彦青]的文章
必应学术
必应学术中相似的文章
[宗成庆]的文章
[周玉]的文章
[何彦青]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。