CASIA OpenIR  > 毕业生  > 硕士学位论文
基于概念复合的自然语言处理系统及其对汉语名词短语的处理
姚亭
1991-07-01
学位类型工学硕士
中文摘要自然语言理解是人工智能领域的难点之一,它研究的是使机器处理自然语言,以达 到让人们用自然语言同机器直接进行交流的目的。虽仍有许多基本问题未获解决,自然 语言理解领域在近30年有了较大的发展,已提出有关机器处理自然语言的多种理论方法, 并实现一些面向某一领域的自然语言处理系统。汉语的语言处理工作也在70年代开始, 并取得一定的成果。 汉语不同于西文而有其自身的特点,如: ‘ i)词间无标记,词的切分需要语义的介入; ii)语法规则不严谨,时态不完备; iii)词类与语法成分之间无简单对应关系; iV)无词形变化等等。 所有这些特点,都表明在汉语语言理解中是语义而不是语法起主导作用,因而使得 西文语言处理中的以语法分析为基础的语言处理方法显得力不从心。 笔者在对人类理解语言机制深入探讨的基础上,提出一种有关人类理解语言的基于 概念复合的假说,认为: i)人们对概念的理解,是基于概念的。概念的建立和把握,是人们理解语言的重要 枢纽,并且在许多情况下还是理解语言的终极结果; ii)人们对语言进行理解,建立语言的内部语义表示的过程,实际上是一个依据一定 规则进行概念复合的过程。 在这一假说的基础上,笔者提出了一种基于概念复合的自然语言处理模型(称为概 念分析器),它有一部概念一语义辞典定义概念的语义表示、概念之间的语义继承和相 互作用;一个概念复合机制对语言片段(短语或句子)中的概念进行复合而得到其语义表 示;一个概念复合规则集指导概念复合机制对语言片段进行概念的复合。对于不同性质 的语言片段,对应着不同的规则集,如面对汉语名词短语的概念分析器对应的复合规则 集中的规则是以实体概念为中心的,而面对句子(主谓短语)的概念分析器对应的规则 集中的规则则是以事件概念为中心。 在对汉语名词短语的语法复杂性(核与定语体的多样性、名词短语的递归性、词的 兼类)及语义复杂性(名词短语的语义结构的层次性、复合名词中隐含的语义联系及处 理英语中复合名词的RDP理论的引入)之后,笔者设计实现了面向汉语名词短语的概念 分析器,采用多趟的由后向前传播的概念复合算法,对汉语名词短语进行分析,得到其 内部语义表示或报告语义错误。该系统在386微机上用汉化GCLISP实现,对概念一语义 辞典覆盖的名词短语进行处理得到满意的结果。在此基础上,笔者还设计了理解汉语名词短语的问题回答系统,因时间问题而未能完成。 本
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6997
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
姚亭. 基于概念复合的自然语言处理系统及其对汉语名词短语的处理[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1991.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[姚亭]的文章
百度学术
百度学术中相似的文章
[姚亭]的文章
必应学术
必应学术中相似的文章
[姚亭]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。