Institutional Repository of Chinese Acad Sci, Inst Automat, Natl Lab Pattern Recognit, Beijing 100190, Peoples R China
基于篇章结构多任务学习的神经机器翻译 | |
亢晓勉1,2![]() ![]() | |
Source Publication | 软件学报
![]() |
2021 | |
Issue | AcceptPages:Accept |
Abstract | 篇章翻译方法借助跨句的上下文信息以提升篇章的翻译质量.篇章具有结构化的语义信息,可以形式化地表示为基本篇章单元之间的依存关系.但是,目前的神经机器翻译方法很少利用篇章的结构信息.为此本文提出了一种篇章翻译模型,能够在神经机器翻译的编码器-解码器框架中显式地建模基本篇章单元切分、篇章依存结构预测和篇章关系分类任务,从而得到结构信息增强的篇章单元表示.该表示分别通过门控加权和层次注意力的方式,与编码和解码的状态向量进行融合.此外,为缓解模型在测试阶段对篇章分析器的依赖,在训练时采用多任务学习的策略引导模型对翻译任务和篇章分析任务进行联合优化.在公开数据集上的实验结果表明,所提出的方法能够有效地建模和利用篇章单元间的依存结构信息从而达到提升译文质量的目的. |
Keyword | 神经机器翻译 篇章结构 多任务学习 篇章分析 |
Indexed By | 中文核心期刊要目总览 |
Language | 中文 |
Sub direction classification | 自然语言处理 |
Document Type | 期刊论文 |
Identifier | http://ir.ia.ac.cn/handle/173211/44307 |
Collection | 模式识别国家重点实验室_自然语言处理 |
Corresponding Author | 宗成庆 |
Affiliation | 1.中国科学院自动化研究所模式识别国家重点实验室 2.中国科学院大学 人工智能学院 |
First Author Affilication | Chinese Acad Sci, Inst Automat, Natl Lab Pattern Recognit, Beijing 100190, Peoples R China |
Corresponding Author Affilication | Chinese Acad Sci, Inst Automat, Natl Lab Pattern Recognit, Beijing 100190, Peoples R China |
Recommended Citation GB/T 7714 | 亢晓勉,宗成庆. 基于篇章结构多任务学习的神经机器翻译[J]. 软件学报,2021(Accept):Accept. |
APA | 亢晓勉,&宗成庆.(2021).基于篇章结构多任务学习的神经机器翻译.软件学报(Accept),Accept. |
MLA | 亢晓勉,et al."基于篇章结构多任务学习的神经机器翻译".软件学报 .Accept(2021):Accept. |
Files in This Item: | Download All | |||||
File Name/Size | DocType | Version | Access | License | ||
02定稿_基于篇章结构多任务学习的神经机(923KB) | 期刊论文 | 作者接受稿 | 开放获取 | CC BY-NC-SA | View Download |
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment