CASIA OpenIR  > 毕业生  > 博士学位论文
基于高斯过程的物体识别和视觉跟踪研究
其他题名Object Recognition and Visual Tracking Based on Gaussian Processes
李宏伟
2009-05-31
学位类型工学博士
中文摘要物体识别和视觉跟踪是当今模式识别和计算机视觉领域中相当活跃的研究方向,其主要研究目的是如何代替人对目标进行自动识别和跟踪。在实际应用中,由于目标的外观多样性、几何变换、光照的变化、遮挡、低分辨率以及噪声等问题所带来的困难,使得物体识别和视觉跟踪任务变得非常具有挑战性,存在很多理论与技术问题需要解决。 当前,统计机器学习算法成功地应用于物体识别和视觉跟踪领域,例如高斯过程模型和核机器等,这些新颖的统计学习技术具有很大的潜力,能够进一步为物体识别和视觉跟踪领域的发展作出贡献。本文主要围绕高斯过程模型从三个方面针对物体识别和视觉跟踪问题进行探讨: 判别式方法广泛地应用于物体类识别问题,但这些方法通常是非概率的,不能直接对类标的预测提供一种不确定性估计,进而对有限训练数据缺少泛化能力。高斯过程作为一种倍受关注的统计机器学习方法,为核函数的学习提供一种既具有理论基础、又可用于实践的概率模型,可方便地对不确定性进行建模,并在模型的选择、学习和预测方面提供了一个完整的理论框架,其优良的分类性能可广泛地应用于物体类识别问题; 在监督学习中,高斯过程后验概率不受未标记数据的影响,使得未标记数据并不能影响决策边界的位置。因而针对高斯过程的诸多特性,本文考虑如何把这种监督学习方法有效地扩展到半监督学习框架中去,结合未标记数据信息构建性能更好的分类器,用于物体识别问题; 跟踪算法通常分为确定性方法和随机性方法。确定性方法虽然快速、效率高,但是其对遮挡问题非常敏感,使得跟踪算法不能够从一个暂时的错误中恢复过来;而随机性方法通过在状态空间中设定假设并对跟踪目标进行概率估计,其更具鲁棒性,具有从暂时错误中恢复的能力。因此,本文考虑把随机性跟踪算法融入到高斯过程模型中,以获取更加鲁棒的视觉跟踪算法。 本文针对物体识别和视觉跟踪问题进行了深入的研究,涉及到监督学习、半监督学习、图谱分解、概率模型的选择和学习、核校准、凸最优化以及非线性回归等关键技术,主要工作和贡献如下: 提出一种基于高斯过程模型的概率判别式方法,以一种尺度不变的方式,来学习和识别未分割场景中的物体类。首先,采用多尺度的算法选择图像中的显著性区域;再通过PCA-SIFT方法以一种紧凑的方式来描述这些特征点;对每一物体类,区域特征的概率模型通过高斯过程来描述。该算法的主要特点是采用基于显著性和尺度不变性的方法描述物体,并通过高斯过程模型的核函数有效地对数据的不确定性进行建模。实验结果显示了所提出算法的有效性以及高斯过程模型优良的分类性能。 提出了一种半监督算法用于学习高斯过程分类器,其通过结合非参数的半监督核向分类器提供未标记数据信息。该算法主要包括以下几个方面:(1)通过图拉普拉斯的谱分解获得核矩阵,其联合了标记数据和未标记数据信息;(2)采用凸最优化方法学习核矩阵特征向量的最优权值,构建非参数的半监督核;(3)把半监督核整合到高斯过程模型中,构建所提出的半监督学习算法。该算法的主要特点是把基于整个数据集的非参数半监督核应用于高斯过程模...
英文摘要Object recognition and visual tracking, whose main purpose is how to automatically recognize and track the objects instead of human, are currently the most actively researched areas of pattern recognition and computer vision. During many practical applications, object recognition and visual tracking are the challenging jobs owing to the difficulties arising from diverse appearance of objects, geometrical transformations, illumination changes, occlusions, low-image resolution and noises etc, and many theory and technical problems remain unsolved. Recently, statistical machine learning algorithms, such as Gaussian process model and kernel machines, have been successfully applied in object recognition and visual tracking areas. It is fully believed that novel statistical learning technologies have strong potential to further contribute to the development of object recognition and tracking. In this dissertation, we explore object recognition and visual tracking based on Gaussian processes model from three aspects: Discriminative methods for object category recognition are typically non-probabilistic, and predict class labels without directly providing an estimate of uncertainty, then do not have good generalization capabilities with limited training data. As a statistical machine learning method with considerable attention, Gaussian processes provides a principled, practical and probabilistic model conveniently modeling the uncertainty, and a well-founded framework for model selection, model learning and model prediction. The excellent classi¯cation performance of Gaussian process model can be widely used in object categories recognition. In the supervised learning framework, the posterior distribution of Gaussian processes can not be affected by unlabeled data, which makes the location of decision boundary not be in°uenced. Based on the various characteristics of Gaussian processes, we consider how to effectively expand this supervised learning method into the semi-supervised framework through incorporating unlabeled data, and build the better performance of classifier for object recognition. Tracking algorithms can be roughly classified into two categories: deterministic methods and stochastic methods. Deterministic methods are fast and efficient, but can not recover from the temporary tracking failures because of being sensitive to occlusion and clutter. By estimating the probability distribution and maintain multiple hypotheses in the state s...
关键词物体识别 视觉跟踪 机器学习 高斯过程 核方法 Object Recognition Visual Tracking Machine Learning Gaussian Processes Kernel Methods
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6195
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
李宏伟. 基于高斯过程的物体识别和视觉跟踪研究[D]. 中国科学院自动化研究所. 中国科学院研究生院,2009.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20051801462806(12790KB) 暂不开放CC BY-NC-SA
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[李宏伟]的文章
百度学术
百度学术中相似的文章
[李宏伟]的文章
必应学术
必应学术中相似的文章
[李宏伟]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。