| 面向自然语言的信息智能检索 |
| 高山
|
| 2001-06-01
|
学位类型 | 工学硕士
|
中文摘要 | 本文主要研究信息检索的理论及其方法,并建立一套基于模糊集合的智能检 索系统,使用户能够应用自然语言进行检索,克服了按照关键词进行简单匹配检 索的种种弊端。本文首先介绍了信息检索的基本概念及其背景,简单地阐述了信 息检索的主要方法。然后,分析了汉语信息检索的难点,为了更好地理解汉语语 言,文章概述了可以借鉴的自然语言处理的主要理论体系。分词和词性标注成为 汉语的自然语言处理的基础工作。文本详细地讲解了应用三元统计模型的分词及 标注一体化实行的方法。最后,给出了基于模糊集合的检索方法及其实现过程。 通过筛选出关键词,为每个关键词建立模糊集合,根据关键词矢量计算出每个文 档在每个集合中的隶属函数。在对全部文档及用户的检索要求预处理后,根据检 索要求与文档之间关键词矢量的相似度,用模糊运算给每个文档打分,按分值排 序输出结果。 按照本文所讲述的方法建立的检索系统,实验证明能够取得较好的结果。 |
关键词 | 信息检索
自然语言处理
三元统计模型
模糊智能检索
|
语种 | 中文
|
文献类型 | 学位论文
|
条目标识符 | http://ir.ia.ac.cn/handle/173211/6852
|
专题 | 毕业生_硕士学位论文
|
推荐引用方式 GB/T 7714 |
高山. 面向自然语言的信息智能检索[D]. 中国科学院自动化研究所. 中国科学院研究生院,2001.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论