Institutional Repository of Chinese Acad Sci, Inst Automat, Natl Lab Pattern Recognit, Beijing 100190, Peoples R China
面向中文微博的情绪-原因对抽取数据集构建及分析研究 | |
陈仲豪1,2![]() ![]() ![]() ![]() ![]() | |
Source Publication | 中文信息学报
![]() |
2022-12 | |
Pages | 0 |
Abstract | 情绪-原因对抽取(ECPE)任务旨在从给定文档中同步抽取情绪子句及其对应的原因子句,该任务在新闻领域得到了广泛研究。然而,社交媒体领域ECPE任务的研究相对较少,主要原因在于缺少适用的数据集。与新闻领域相比,该领域更具挑战性和实用性:(a)在社交媒体领域,情绪表达更加多样化、非规范化;(b)以往的研究忽略了情绪造成的主观意图,它对于决策分析有很重要的价值。针对以上问题,该文首先构建了一个面向中文微博的情绪原因抽取数据集,并对其中5 009条数据进行了人工标注。该数据集具备以下特点:(1)收录了隐喻、反讽等形式的情绪表达,标注了细粒度的情绪类别;(2)定义了三种类型的意图,并标注了意图子句;(3)当前规模最大的中文情绪-原因对抽取数据集。结合数据集特点,该文提出一种融合情绪类别和意图信息的情绪-原因对抽取方法,并将该方法与多个ECPE主流方法进行了比较分析。实验结果表明,该文所提方法可以更有效地提升社交媒体领域情绪-原因对抽取的效果。 |
Keyword | 情绪-原因对抽取 中文社交媒体 微博数据集 |
Indexed By | 中文核心期刊要目总览 |
Language | 中文 |
Document Type | 期刊论文 |
Identifier | http://ir.ia.ac.cn/handle/173211/48727 |
Collection | 模式识别国家重点实验室_自然语言处理 |
Corresponding Author | 周玉 |
Affiliation | 1.中国科学院自动化研究所 模式识别国家重点实验室 2.中国科学院大学 人工智能学院 3.北京中科凡语科技有限公司 凡语AI研究院 |
First Author Affilication | Chinese Acad Sci, Inst Automat, Natl Lab Pattern Recognit, Beijing 100190, Peoples R China |
Corresponding Author Affilication | Chinese Acad Sci, Inst Automat, Natl Lab Pattern Recognit, Beijing 100190, Peoples R China |
Recommended Citation GB/T 7714 | 陈仲豪,朱军楠,向露,等. 面向中文微博的情绪-原因对抽取数据集构建及分析研究[J]. 中文信息学报,2022:0. |
APA | 陈仲豪,朱军楠,向露,周玉,&宗成庆.(2022).面向中文微博的情绪-原因对抽取数据集构建及分析研究.中文信息学报,0. |
MLA | 陈仲豪,et al."面向中文微博的情绪-原因对抽取数据集构建及分析研究".中文信息学报 (2022):0. |
Files in This Item: | Download All | |||||
File Name/Size | DocType | Version | Access | License | ||
面向中文微博的情绪-原因对抽取数据集构建(872KB) | 期刊论文 | 作者接受稿 | 开放获取 | CC BY-NC-SA | View Download |
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment