Knowledge Commons of Institute of Automation,CAS
基于中英文单语术语库的双语术语对齐方法 | |
向露1,2; 周玉1,2,3; 宗成庆1,2 | |
发表期刊 | 中国科技术语 |
2022-01 | |
卷号 | 24期号:1页码:14-25 |
摘要 | 双语术语对齐库是自然语言处理领域的重要资源,对于跨语言信息检索、机器翻译等多语言应用具有重要意义。 双语术语对通常是通过人工翻译或从双语平行语料中自动提取获得的。 然而,人工翻译需要一定的专业知识且耗时耗力,而特定领域的双语平行语料也很难具有较大规模。 但是同一领域中各种语言的单语术语库却较易获得。 为此,提出一种基于两种不同语言的单语术语库自动实现术语对齐,以构建双语术语对照表的方法。 该方法首先利用多个在线机器翻译引擎通过投票机制生成目标端“伪”术语,然后利用目标端“伪”术语从目标端术语库中检索得到目标端术语候选集合,最后采用基于 mBERT 的语义匹配算法对目标端候选集合进行重排序,从而获得最终的双语术语对。 计算机科学、土木工程和医学三个领域的中英文双语术语对齐实验结果表明,该方法能够提高双语术语抽取的准确率。 |
关键词 | 双语术语 单语术语库 术语对齐 语义匹配 |
收录类别 | 其他 |
语种 | 中文 |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/48929 |
专题 | 多模态人工智能系统全国重点实验室_自然语言处理 |
通讯作者 | 周玉 |
作者单位 | 1.中国科学院自动化研究模式识别国家重点实验室,北京 2.中国科学院大学人工智能学院,北京 3.凡语AI研究院/北京中科凡语科技有限公司,北京 |
第一作者单位 | 模式识别国家重点实验室 |
通讯作者单位 | 模式识别国家重点实验室 |
推荐引用方式 GB/T 7714 | 向露,周玉,宗成庆. 基于中英文单语术语库的双语术语对齐方法[J]. 中国科技术语,2022,24(1):14-25. |
APA | 向露,周玉,&宗成庆.(2022).基于中英文单语术语库的双语术语对齐方法.中国科技术语,24(1),14-25. |
MLA | 向露,et al."基于中英文单语术语库的双语术语对齐方法".中国科技术语 24.1(2022):14-25. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
基于中英文单语术语库的双语术语对齐方法.(1386KB) | 期刊论文 | 作者接受稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[向露]的文章 |
[周玉]的文章 |
[宗成庆]的文章 |
百度学术 |
百度学术中相似的文章 |
[向露]的文章 |
[周玉]的文章 |
[宗成庆]的文章 |
必应学术 |
必应学术中相似的文章 |
[向露]的文章 |
[周玉]的文章 |
[宗成庆]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论