CASIA OpenIR  > 毕业生  > 博士学位论文
互联网不良图像及视频检测技术
其他题名Harmful Image and Video Detection Technology on the Internet
左海强
2010-04-22
学位类型工学博士
中文摘要经过多年的发展,互联网已经在社会的各个层面为全人类提供便利。电子邮件、即时消息、视频会议、网络博客、网上购物等已经成为越来越多人的一种生活方式。然而在带给人们机遇,促进发展,产生积极作用的同时,互联网上不良信息(如色情、赌博、毒品、暴力、恐怖等)的肆意传播,也对广大网民尤其是未成年人造成一定程度的身心伤害。开展针对互联网上的不良信息检测技术研究,从技术层面将这些不良信息屏蔽于互联网之外,已成为迫切需要解决的关键问题。 本文针对互联网上不良图像及视频信息检测技术进行了深入的研究,重点开展了图像型垃圾邮件检测技术、肤色检测技术、色情图像检测技术以及色情影片及流媒体检测技术等方面的研究工作。本文的主要工作和贡献包括: 1) 提出了一种基于整体不变量特征的图像型垃圾邮件检测算法。算法利用了Fourier-Mellin 特征具有的平移、缩放和旋转不变的优良性质,来对抗图像型垃圾邮件的多种变种形式。首先提取图像的Fourier-Mellin 不变量特征,将得到的2D 矩阵按行展开成一高维的向量,并采用主成份分析(PCA)方法对其降维,得到最终用于分类的低维特征向量,最后训练One-class SVDD 分类器对图像型垃圾邮件进行建模,得到图像型垃圾邮件在特征空间中的分布界面,并对新样本进行检测。 2) 提出了一种基于局部不变量特征的图像型垃圾邮件检测算法。首先在图像上检测兴趣点(MSER, SURF),并提取兴趣点处的局部不变量特征(SIFT, Shape Context,SURF),进而利用金字塔匹配核度量两幅图像的相似度,并作为One-class SVDD分类器的核函数。最后训练One-class SVDD 分类器对图像型垃圾邮件进行建模,得到图像型垃圾邮件在特征空间中的分布界面,并对新样本进行检测。 3) 提出了一种基于区域的肤色检测算法。为了兼顾肤色检测速度和肤色检测的精度提出了两种区域生成机制:基于滑动窗口的规则区域生成机制和基于图像分割的非规则区域生成机制。规则区域生成机制由于区域形状规则,而且可以采用积分图像技术加速特征的提取过程,算法速度快,但检测到的肤色区域边缘存在锯齿,不光滑。非规则区域生成机制由于利用了图像分割技术,可以获得较为精确的肤色区域轮廓,但算法速度也受到了一定的影响。算法首先将图像从RGB 色彩空间转换到YCbCr 色彩空间,并在生成的每个小的图像区域上提取基于协方差描述子的区域纹理特征。然后分别在Cr 和Cb 颜色通道上计算每一小区域内的均值和标准偏差,生成区域颜色特征。合并区域纹理特征和区域颜色特征生成区域特征向量,最后利用随机森林算法判定每一小区域是否为肤色区域,完成对输入图像的肤色检测。 4) 提出了一种色情图像检测算法。该算法在有效的图像肤色检测基础上,提取图像整体特征、人体局部部位特征以及人体躯干形状特征三类共31 维特征构成特征向量,最后采用随机森林分类器对输入图像的色情程度进行检测。 5) 提出了一种基于音视频融合策略的色情影片及流媒体检测算法。充分利用了色情影片及流媒体中的两个模态的信息,在音频上,提取MFCC 特征,进而采用高斯混合模型对色情相关的声音进行建模,描述声音...
英文摘要After years of development, the internet has facilitated people's lives at all levels of society. Internet services, such as e-mail, instant messaging, video conferencing, web blog and online shopping have become a way of life for more and more people. The internet brings opportunities, developments, and promotion, but at the same time, it brings the ravaging spread of harmful information, such as pornography, gambling, drugs, violence, terror, etc. The harmful information will do harm to internet users, especially minors. Therefore, harmful information filtering technique has become an urgent issue need to be addressed. In this thesis, we focus on four issues: image spam detection, human skin tone detection, pornography image detection, pornography film and streaming media detection. The main contributions of this thesis are summarized as follows: 1) An algorithm for filtering image spams by using global invariant features is proposed. Fourier-Mellin transform is a translation, scaling and rotation invariant function, and is effective for fighting most image spam variants. First, we extract the Fourier-Mellin invariant features from the input images. The resulting Fourier-Mellin feature matrix is then stretched into a 1D vector by row concatenation. The Principal Components Analysis (PCA) method is employed to mapping the high-dimensional feature space into low-dimensional feature space. At last, a one-class classi¯er, the support vector data description (SVDD), is trained to model the boundary of image spam class in the feature space, and is exploited to detect the new e-mail samples. 2) An algorithm for filtering image spams by using local invariant features is proposed. The MSER and SURF detectors are used to find interest points in each image, and SIFT, shape contexts, SURF descriptors are used to compose the feature sets. Then, a vocabulary-guided pyramid match kernel is employed to measure the similarity of two images and is used as the kernel function of SVDD. At last, the one-class SVDD classifier is trained to model the boundary of image spam class in the feature space, and is exploited to detect the new e-mail samples. 3) A patch-based skin color detection algorithm is proposed. Taking into account the speed and accuracy of skin detection, we propose two methods to generate small patches. One is regular patch generation method based on non-overlapping sliding rectangle windows, the other is irregular patch generation method based on com...
关键词不良信息检测 肤色检测 色情图像检测 色情视频检测 音视频融合 Harmful Information Detection Human Skin Tone Detection Pornographic Image Detection Pornographic Video Detection Audio And Video Fusion
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6232
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
左海强. 互联网不良图像及视频检测技术[D]. 中国科学院自动化研究所. 中国科学院研究生院,2010.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20051801462804(2766KB) 限制开放CC BY-NC-SA
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[左海强]的文章
百度学术
百度学术中相似的文章
[左海强]的文章
必应学术
必应学术中相似的文章
[左海强]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。