CASIA OpenIR  > 博士后  > 出站报告
面向对话文本的自然语言理解——在医疗领域的实践
张元哲
2020-08
Other Abstract

对话文本理解是自然语言处理研究领域的热点和难点问题。对于对话的理解具有重要的科学研究意义和实际应用价值。例如,在医疗、电商、司法领域都存在着大量的对话文本。与普通形式的文本相比,对话文本更加困难,主要体现在:1)口语化严重;2)对话具有交互性,说话人风格不统一;3)对话具有主题性和知识性,隐式信息更多,需要额外知识引导。

本文主要面向对话形式的文本,以医疗领域对话作为实践对象,研究针对性的背景知识图谱构建、实体抽取、关系分类、实体链接和整体信息抽取问题,期望以医疗领域的研究作为基础,扩展到更多领域,或者更进一步,解决多领域的对话理解问题。

本文的主要贡献如下:

首先,探讨医疗知识图谱的构建方法,并提出一种构建症状知识图谱的方法,获得一个医疗症状图谱,作为后续工作的知识依托。

其次,提出面向对话文本的实体和关系标注数据集,医疗命名实体识别仍然采用基于序列标注的方法,明确实体的边界和类别标签,从而将口语化表达转化为规范表达;关系分类则完成了医学属性抽取的工作,采用了多种关系分类方法。此外,本章还尝试将对话文本中出现的实体链接到医疗知识图谱,从而帮助后续的自动诊断、病历质控等落地应用。

最后,提出一个面向整体对话的信息抽取方法,提出相关数据集标注方法,并提出基于深度匹配的信息抽取模型,获得对话内提及的重要医疗信息。实验结果表明本文提出的方法在窗口级别和对话级别上可以达到69.29F值,说明本方法有较好的研究前景。

综上,本文主要研究一系列针对医疗对话的文本理解方法,以识别实体、关系以及抽取信息为目标,通过在医疗领域的实践,提升针对对话文本的自然语言理解关键技术水平。

MOST Discipline Catalogue工学::计算机科学与技术(可授工学、理学学位)
Keyword对话文本理解,自然语言处理,知识图谱,信息抽取,医疗对话文本
Language中文
Contributor张元哲
Document Type其他
Identifierhttp://ir.ia.ac.cn/handle/173211/40120
Collection博士后_出站报告
Affiliation中国科学院自动化研究所
First Author AffilicationInstitute of Automation, Chinese Academy of Sciences
Recommended Citation
GB/T 7714
张元哲. 面向对话文本的自然语言理解——在医疗领域的实践. 2020-08-01.
Files in This Item: Download All
File Name/Size DocType Version Access License
张元哲_博士后出站报告_final.pd(2036KB)其他 开放获取CC BY-NC-SAView Download
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[张元哲]'s Articles
Baidu academic
Similar articles in Baidu academic
[张元哲]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[张元哲]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: 张元哲_博士后出站报告_final.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.