CASIA OpenIR  > 毕业生  > 硕士学位论文
基于概念复合的自然语言处理系统及其对汉语名词短语的处理
姚亭
Subtype工学硕士
Thesis Advisor庞真
1991-07-01
Degree Grantor中国科学院自动化研究所
Place of Conferral中国科学院自动化研究所
Degree Discipline模式识别与智能系统
Abstract自然语言理解是人工智能领域的难点之一,它研究的是使机器处理自然语言,以达 到让人们用自然语言同机器直接进行交流的目的。虽仍有许多基本问题未获解决,自然 语言理解领域在近30年有了较大的发展,已提出有关机器处理自然语言的多种理论方法, 并实现一些面向某一领域的自然语言处理系统。汉语的语言处理工作也在70年代开始, 并取得一定的成果。 汉语不同于西文而有其自身的特点,如: ‘ i)词间无标记,词的切分需要语义的介入; ii)语法规则不严谨,时态不完备; iii)词类与语法成分之间无简单对应关系; iV)无词形变化等等。 所有这些特点,都表明在汉语语言理解中是语义而不是语法起主导作用,因而使得 西文语言处理中的以语法分析为基础的语言处理方法显得力不从心。 笔者在对人类理解语言机制深入探讨的基础上,提出一种有关人类理解语言的基于 概念复合的假说,认为: i)人们对概念的理解,是基于概念的。概念的建立和把握,是人们理解语言的重要 枢纽,并且在许多情况下还是理解语言的终极结果; ii)人们对语言进行理解,建立语言的内部语义表示的过程,实际上是一个依据一定 规则进行概念复合的过程。 在这一假说的基础上,笔者提出了一种基于概念复合的自然语言处理模型(称为概 念分析器),它有一部概念一语义辞典定义概念的语义表示、概念之间的语义继承和相 互作用;一个概念复合机制对语言片段(短语或句子)中的概念进行复合而得到其语义表 示;一个概念复合规则集指导概念复合机制对语言片段进行概念的复合。对于不同性质 的语言片段,对应着不同的规则集,如面对汉语名词短语的概念分析器对应的复合规则 集中的规则是以实体概念为中心的,而面对句子(主谓短语)的概念分析器对应的规则 集中的规则则是以事件概念为中心。 在对汉语名词短语的语法复杂性(核与定语体的多样性、名词短语的递归性、词的 兼类)及语义复杂性(名词短语的语义结构的层次性、复合名词中隐含的语义联系及处 理英语中复合名词的RDP理论的引入)之后,笔者设计实现了面向汉语名词短语的概念 分析器,采用多趟的由后向前传播的概念复合算法,对汉语名词短语进行分析,得到其 内部语义表示或报告语义错误。该系统在386微机上用汉化GCLISP实现,对概念一语义 辞典覆盖的名词短语进行处理得到满意的结果。在此基础上,笔者还设计了理解汉语名词短语的问题回答系统,因时间问题而未能完成。 本
shelfnumXWLW209
Other Identifier209
Language中文
Document Type学位论文
Identifierhttp://ir.ia.ac.cn/handle/173211/6997
Collection毕业生_硕士学位论文
Recommended Citation
GB/T 7714
姚亭. 基于概念复合的自然语言处理系统及其对汉语名词短语的处理[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1991.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[姚亭]'s Articles
Baidu academic
Similar articles in Baidu academic
[姚亭]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[姚亭]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.