中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

图片搜索

粘贴图片网址

CASIA OpenIR > 学术期刊 > 自动化学报

	基于显著性特征提取的图像描述算法
	王鑫; 宋永红; 张元林
发表期刊	自动化学报
ISSN	0254-4156
	2022
卷号	48 期号:3 页码:735-746
摘要	图像描述(Image captioning)是一个融合了计算机视觉和自然语言处理这两个领域的研究方向,本文为图像描述设计了一种新颖的显著性特征提取机制(Salient feature extraction mechanism, SFEM),能够在语言模型预测每一个单词之前快速地向语言模型提供最有价值的视觉特征来指导单词预测,有效解决了现有方法对视觉特征选择不准确以及时间性能不理想的问题. SFEM包含全局显著性特征提取器和即时显著性特征提取器这两个部分:全局显著性特征提取器能够从多个局部视觉向量中提取出显著性视觉特征,并整合这些特征到全局显著性视觉向量中;即时显著性特征提取器能够根据语言模型的需要,从全局显著性视觉向量中提取出预测每一个单词所需的显著性视觉特征.本文在MS COCO (Microsoft common objects in context)数据集上对SFEM进行了评估,实验结果表明SFEM能够显著提升基准模型(baseline)生成图像描述的准确性,并且SFEM在生成图像描述的准确性方面明显优于广泛使用的空间注意力模型,在时间性能上也大幅领先空间注意力模型.
关键词	图像描述显著性特征提取语言模型编码器解码器
DOI	10.16383/j.aas.c190279
引用统计
文献类型	期刊论文
条目标识符	http://ir.ia.ac.cn/handle/173211/56385
专题	学术期刊_自动化学报
推荐引用方式 GB/T 7714	王鑫,宋永红,张元林. 基于显著性特征提取的图像描述算法[J]. 自动化学报,2022,48(3):735-746.
APA	王鑫,宋永红,&张元林.(2022).基于显著性特征提取的图像描述算法.自动化学报,48(3),735-746.
MLA	王鑫,et al."基于显著性特征提取的图像描述算法".自动化学报 48.3(2022):735-746.

条目包含的文件		下载所有文件
文件名称/大小	文献类型	版本类型	开放类型	使用许可
AAS-CN-2019-0279.pdf（4402KB）	期刊论文	出版稿	开放获取	CC BY-NC-SA	浏览下载

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[王鑫]的文章

[宋永红]的文章

[张元林]的文章

百度学术

百度学术中相似的文章

[王鑫]的文章

[宋永红]的文章

[张元林]的文章

必应学术

必应学术中相似的文章

[王鑫]的文章

[宋永红]的文章

[张元林]的文章

相关权益政策

收藏/分享

文件名：	AAS-CN-2019-0279.pdf
格式：	Adobe PDF

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量25867
全文量13705
访问量5890342
下载量928064