CASIA OpenIR  > 模式识别国家重点实验室  > 自然语言处理
一种汉英短语翻译对自动抽取与过滤方法
宗成庆; 周玉
2008-01-09
Date Available2009-07-15
CountryCN
Subtype发明
Abstract本发明汉英短语翻译对自动抽取与过滤方法,是对原始汉、英双 语句对提取划分语块和对候选短语进行过滤的特征信息;根据不同 的特征信息确定划分语块锚点,将原始汉、英句对划分为多个单语 语块;利用原始汉、英双语句对的词对齐信息在语块内进行候选短 语的抽取;利用候选短语的出现频率的特征信息来对生成的候选短 语过滤,生成需要的短语对。本发明采用遍历语块内的短语抽取来 取代现有遍历整句进行抽取的方法,对于空词的无限制扩展尤其有 用,从而有效的解决了目前短语抽取量过大对于存储空间的要求, 并且有效的过滤掉了很多噪音短语。本发明能够直接根据当前句对 的固定词对齐生成多组短语,从而在满足精度的前提下提高了短语 对的召回率。
Copyright Date2010-12-01
Patent NumberCN200810055782.3
Status授权
Document Type专利
Identifierhttp://ir.ia.ac.cn/handle/173211/8300
Collection模式识别国家重点实验室_自然语言处理
Affiliation中国科学院自动化研究所
Recommended Citation
GB/T 7714
宗成庆,周玉. 一种汉英短语翻译对自动抽取与过滤方法. CN200810055782.3[P]. 2008-01-09.
Files in This Item:
File Name/Size DocType Version Access License
4周玉一种汉英短语翻译对自动抽取与过滤方(6043KB)专利 开放获取CC BY-NC-SAApplication Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[宗成庆]'s Articles
[周玉]'s Articles
Baidu academic
Similar articles in Baidu academic
[宗成庆]'s Articles
[周玉]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[宗成庆]'s Articles
[周玉]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.