CASIA OpenIR  > 毕业生  > 博士学位论文
基于分析动作建模的汉语依存句法分析研究
其他题名Researches on Chinese Dependency Parsing Based on Parse Action Modeling
段湘煜
2008-02-03
学位类型工学博士
中文摘要句法分析是自然语言处理的重要任务之一。在机器翻译、自动问答、信息提取等应用系统中,句法分析能够为各系统提供句子结构上的信息。在最近十多年,依存句法以其简单明了的表示形式、快速高效的分析算法越来越受到广泛关注,并且应用到了很多自然语言处理任务中。 本文研究汉语依存句法分析技术,主要工作及创新点包括: (1) 在统一的数据集合、数据切分和评价指标下,针对汉语依存分析问题,对各种代表性的依存句法分析方法进行了对比实验。 (2) 基于决策的依存分析方法本身是一种贪婪决策的方法。为了克服这种贪婪性,本文提出了概率化决策动作模型。该模型融合了决策式方法和动态规划方法的优点,既可以利用丰富的上下文特征,又从全局最优的视角进行分析,对决策动作进行概率建模。 (3) 汉语中存在一些特有的句法结构,对于这些结构,依存分析的动作很难判断。对这些特有结构进行针对性的处理,会提升汉语依存句法分析的性能。针对这个问题,本文提出了n阶段模型。该模型主要分为两大类:n阶段的决策式动作模型、短距离依存与长距离依存分治模型。 (4) 为了分析和验证动作建模方法在多语言依存分析上的性能,我们参加了第十一届计算自然语言学习会议(CoNLL-2007)的“多语言依存分析”共享任务的的评测。该共享任务包括10种语言的依存句法分析。评测结果显示,动作建模方法在所有10种语言上均可取得优于传统决策式方法的性能。 (5) 除了依存句法分析之外,动作建模方法也可以应用于语块分析等任务中。本文基于动作建模方法,从结构预测角度进行语块分析的研究。
英文摘要Syntactic parsing is one of the important tasks in the area of Natural Language Processing (NLP). It can provide structural information of sentences in various kinds of application systems such as Machine Translation, Question Answering and Information Extraction. In recent years, dependency syntax received more and more attention because of its simple form and efficient parsing algorithm, and has been widely applied in various NLP tasks. This thesis focuses on Chinese dependency parsing. The main achievements and innovations include: (1) We conduct a comparative study on the representive methods for Chinese de-pendency parsing through using the same data set, data division and evaluation metrics. (2) Deterministic dependency parsing method is a greedy method. This thesis pro-poses probabilistic parse action model to overcome the greediness. This model integrates the advantages of both deterministic method and dynamic programming method. (3) Chinese has some special structures that make parse action decision difficult. This thesis proposes n-phase model for these ambiguous structures in Chinese depend-ency parsing. This model has two classes: n-phase parse action model, short distance and long distance separated model. (4) To analyze and test the performance of parse action model on multiple languages, we attended multilingual dependency parsing shared task in CoNLL-2007. This shared task consists of ten kinds of languages. The evaluation results show that parse action model performs superior to traditional deterministic method on all ten languages. (5) This thesis proposes structure prediction method for chunk parsing. Experimental results show that structure prediction method improves the performance on long chunks, and chunking action model performs superior to traditional deterministic method in all chunk parsing problems.
关键词汉语依存句法分析 分析动作建模 概率化决策动作模型 N阶段模型 Chinese Dependency Parsing Parse Action Modeling Probabilistic Models For Parse Actions N-phase Model
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6050
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
段湘煜. 基于分析动作建模的汉语依存句法分析研究[D]. 中国科学院自动化研究所. 中国科学院研究生院,2008.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20021801460320(1286KB) 暂不开放CC BY-NC-SA
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[段湘煜]的文章
百度学术
百度学术中相似的文章
[段湘煜]的文章
必应学术
必应学术中相似的文章
[段湘煜]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。