CASIA OpenIR  > 毕业生  > 硕士学位论文
面向自然语言的信息智能检索
高山
Subtype工学硕士
Thesis Advisor徐波
2001-06-01
Degree Grantor中国科学院研究生院
Place of Conferral中国科学院自动化研究所
Degree Discipline模式识别与智能系统
Keyword信息检索 自然语言处理 三元统计模型 模糊智能检索
Abstract本文主要研究信息检索的理论及其方法,并建立一套基于模糊集合的智能检 索系统,使用户能够应用自然语言进行检索,克服了按照关键词进行简单匹配检 索的种种弊端。本文首先介绍了信息检索的基本概念及其背景,简单地阐述了信 息检索的主要方法。然后,分析了汉语信息检索的难点,为了更好地理解汉语语 言,文章概述了可以借鉴的自然语言处理的主要理论体系。分词和词性标注成为 汉语的自然语言处理的基础工作。文本详细地讲解了应用三元统计模型的分词及 标注一体化实行的方法。最后,给出了基于模糊集合的检索方法及其实现过程。 通过筛选出关键词,为每个关键词建立模糊集合,根据关键词矢量计算出每个文 档在每个集合中的隶属函数。在对全部文档及用户的检索要求预处理后,根据检 索要求与文档之间关键词矢量的相似度,用模糊运算给每个文档打分,按分值排 序输出结果。 按照本文所讲述的方法建立的检索系统,实验证明能够取得较好的结果。
shelfnumXWLW614
Other Identifier614
Language中文
Document Type学位论文
Identifierhttp://ir.ia.ac.cn/handle/173211/6852
Collection毕业生_硕士学位论文
Recommended Citation
GB/T 7714
高山. 面向自然语言的信息智能检索[D]. 中国科学院自动化研究所. 中国科学院研究生院,2001.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[高山]'s Articles
Baidu academic
Similar articles in Baidu academic
[高山]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[高山]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.