CASIA OpenIR  > 毕业生  > 博士学位论文
图像和视频画面显示自适应技术研究
其他题名Research on Image and Video Retargeting Technology
屈展
学位类型工学博士
导师卢汉清
2014-05-27
学位授予单位中国科学院大学
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
关键词图像和视频自适应 变形 裁切 缩放 显著性检测 凸规划 Image And Video Retargeting Warping Cropping Scaling Salience Map Convex Programming
摘要随着多媒体技术与互联网技术的高速发展,海量增长的图像、视频等可视媒体数据正极大地充实着现代人的生活。 各种图像、视频的显示播放设备层出不穷,从传统的个人电脑、数字电视到更加便携的手机、个人数字助理(PDA)和数码相册等。 与数字显示平台多样化伴随而来的一个重要问题就是如何使数据(图像、视频)自适应地匹配不同规格的数码平台, 其具体内容包括:改变原始图像、视频的画面长宽比以匹配不同设备的屏幕,以及改变原始视频的时间长度以匹配不同设备的存储能力。当前主流的图像、视频画面显示系统中所采用的方案往往不考虑数据中的内容,将整个画面均匀地缩放到设备长宽比上,这 会导致数据中的重要内容在处理后出现明显扭曲变形,严重影响用户的浏览体验。在这样的背景下,图像和视频的画面显示自适应技术应运而生。作为 一种基于内容的技术,自适应的核心目标在于在改变图像和视频的尺寸过程中,尽量减少重要信息损失并保持原有的视觉效果。近年来, 自适应技术作为计算机视觉领域的一个热点课题得到许多学者的重视与研究,相关的成果也层出不穷,但是面对不同的应用环境,当前方法表现得仍不够成熟,存在一定的局限性,仍存在着相当大的改进空间。 通过系统回顾国内外画面显示自适应技术的相关工作,在分析不同方法特点和缺陷的基础上,本文针对图像和视频的画面显示自适应问题提出了一系列解决方案,主要工作和创新点包括: 1. 裁切和变形是图像自适应领域的经典方法,两种方法各具特点。 本文提出了一种把裁切策略融合进变形框架的图像自适应方法,目标是利用裁切方法降低图像的非重要区域的影响,以改进变形方法的性能,进而改善图像自适应结果。本文所采用的融合策略具有两个优点,一方面,通过显著性分析可以有选择地裁切掉重要性较低的区域,从而使输出图像中有更多的空间去保存重要的图像内容;另一方面,最终保留在输出中的图像内容,其成像质量不会受到裁切策略的影响而完全由变形算法所决定,使重要内容的几何结构和形状得以在输出中得到 最大程度地保留。在公共数据集上的实验结果证明,本方法同时具有裁切和变形算法的优点,有效地提高了图像自适应结果的质量。 2. 当待生成的目标图像尺寸被设定得过小时,单一的自适应策略所得到的结果往往会出现严重的视觉缺陷,这是阻碍单一自适应方法用于生成图像缩略图的关键因素。实际上,不同的自适应方法之间存在着互补性,本文依此提出了一个 基于网格的联合裁切、变形与缩放策略的缩略图生成方法。其中,裁切策略用于有选择地舍弃图像中不重要的区域,使有限的空间更集中地用于显示图像中的重要内容;变形策略用于在缩略图中保持重要目标和场景的形状,而压缩和扭曲非重要区域使重要目标在空间上分布得更加紧密,使缩略图更加完整地包含原图中的重要信息;缩放策略用于以一个合适的尺度来显示图像的重要内容,避免目标过大或过小。本文通过基于网格的优化框架,将三种策略融合成一个统一的凸规划问题,可以被高效地求解。与当前多个主流方法的对比证明本方法可以有效改善缩略图的视觉效果,在由源图像生成缩略...
其他摘要With the development of Multimedia and Internet techniques, massively increasing image and video data is playing a more and more important role in modern life. A variety of digital display devices are emerging constantly, which range from the traditional ones as PC, digital TV to the portable ones as cell phone, PDA and digital album. Along with the diversity of digital platform is an urgent problem to be solved, i.e. adaption of source data(image and video) to different screen resolution, which involves both changing the aspect ratio of source for diverse screens and changing the play length of video for diverse memory capacity of platforms.Without consideration about the content, most of the current image/video displaying application achieves the adaption through scaling source uniformly, which results in obvious distortion of the important foreground and degrades the users experience significantly. As result, image and video retargeting is developed for solving this problem. As content-aware technique, the key issue of retargeting is altering the solution and aspect ratio of source while avoiding the loss of information as much as possible. Most recently, retargeting techniques have become a hot topic in computer vision and been researched extensively. However, the existing approaches are insufficient to yield satisfactory results in all circumstances, and there is still room for improvement. This thesis first surveys the work on image and video retargeting systematically. Then, based on the analysis of the advantages and limitations of existing work, this thesis proposes a series of solutions for image and video retargeting. The contributions of this thesis are summarized as follows: 1. Cropping and warping are two classic strategies of retargeting, and have respective characters. This thesis proposes an image retargeting method through bringing cropping into a warping framework. Cropping is employed to reduce the influence of unimportant region and improve the performance of warping. One one hand, the proposed solution selectively discards the unimportant regions to free up more room for salient image content. On the other hand, the imaging quality of output mostly depends on the warping strategy, not the croppong, where the geometry and structure of content would be preserved better. The experiments on public data set demonstrates that this solution has both advantages of warping and cropping, which improves the quality of resulting image signi...
馆藏号XWLW1968
其他标识符200918014628044
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6613
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
屈展. 图像和视频画面显示自适应技术研究[D]. 中国科学院自动化研究所. 中国科学院大学,2014.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20091801462804(19195KB) 暂不开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[屈展]的文章
百度学术
百度学术中相似的文章
[屈展]的文章
必应学术
必应学术中相似的文章
[屈展]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。