CASIA OpenIR  > 模式识别国家重点实验室  > 自然语言处理
一种汉英短语翻译对自动抽取与过滤方法
宗成庆; 周玉
2008-01-09
公开日期2009-07-15
授权国家CN
专利类型发明
摘要本发明汉英短语翻译对自动抽取与过滤方法,是对原始汉、英双 语句对提取划分语块和对候选短语进行过滤的特征信息;根据不同 的特征信息确定划分语块锚点,将原始汉、英句对划分为多个单语 语块;利用原始汉、英双语句对的词对齐信息在语块内进行候选短 语的抽取;利用候选短语的出现频率的特征信息来对生成的候选短 语过滤,生成需要的短语对。本发明采用遍历语块内的短语抽取来 取代现有遍历整句进行抽取的方法,对于空词的无限制扩展尤其有 用,从而有效的解决了目前短语抽取量过大对于存储空间的要求, 并且有效的过滤掉了很多噪音短语。本发明能够直接根据当前句对 的固定词对齐生成多组短语,从而在满足精度的前提下提高了短语 对的召回率。
授权日期2010-12-01
专利号CN200810055782.3
专利状态授权
文献类型专利
条目标识符http://ir.ia.ac.cn/handle/173211/8300
专题模式识别国家重点实验室_自然语言处理
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
宗成庆,周玉. 一种汉英短语翻译对自动抽取与过滤方法. CN200810055782.3[P]. 2008-01-09.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
4周玉一种汉英短语翻译对自动抽取与过滤方(6043KB)专利 开放获取CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[宗成庆]的文章
[周玉]的文章
百度学术
百度学术中相似的文章
[宗成庆]的文章
[周玉]的文章
必应学术
必应学术中相似的文章
[宗成庆]的文章
[周玉]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。