CASIA OpenIR  > 毕业生  > 博士学位论文
图像流形相关问题研究
其他题名Issues on Image Manifold Modeling
龚海峰
学位类型工学博士
导师马颂德
2007-05-24
学位授予单位中国科学院研究生院
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
关键词图像建模 流形学习 神经网络 纹理合成 尺度空间 图像融合 Image Modeling Manifold Learning Neural Network Texture Synthesis Scale Space Image Fusion
摘要近年来,基于流形假设的图像建模受到了广泛关注。 考察自然图像的空间结构可知,其在向量空间中是呈极稀疏分布的, 因此必然由各种不同的流形组成, 这些流形分别对应于自然图象所表达的景物的不同状态和成像条件, 例如:物体姿态流形、摄像机参数形成的图像流形、光谱-分辨率流形等。 本文首先解决了当前流形学习的存在的两个问题,然后利用流形的概念 指导了几个应用。具体内容包括三个方面: 物体姿态流形的半监督匹配、流形的神经网络建模和 图像流形上的融合和光流。 *姿态流形的半监督匹配 以前的流形学习文献都只提到了将离散的流形映射到一个欧氏空间的子集。然而,有许多 拓扑结构复杂的流形却不能在保证邻域结构的条件下被映射到等维的欧氏空间。 对于这一类数据流形,使用以前的方法将只能找到该流形能够嵌入的最低维度的欧氏空间, 并不能将其嵌入到本质维度的解析流形上去。 因此,本文尝试将有闭环的流形直接映射到其解析形式的本质参数流形上去,例如,将圆形数据直接映射到 圆上,将不同摄像机角度得到的图像映射到刚体旋转矩阵流形(特殊正交群$SO(3)$)。 部分解决了流形学习中带回环的流形的问题。 *图像流形的神经网络表示 本文引入神经网络来建模流形学习得到的对应关系,实现了流形的神经网络表示。 同时利用神经网络来训练从高维图像空间到嵌入空间的前向和从嵌入空间到 图像空间的反向网络。此外,我们还将前向和反向网络组合起来构建了自联想和交叉联想模型。 前向映射、反向影射、自联想和交叉联想实验结果表明,该方法能在更广泛的意义上解决 Out-of-Sample的问题。神经网络是流形的一种既便于学习训练,又便于投影、反投的表示。 *图像流形上的融合与光流 本文围绕场景的图像流形进行了三个方面的工作: 一是通过对光谱-分辨率流形的分析,提出了一种新的图像融合的方法; 二是通过对多焦距流形的分析,提出了一种新的多焦距图像融合方法; 三是将尺度空间光流推广到了一般多维多通道图像。 光谱-分辨率流形上的图像融合 对于同一场景的高分辨率图像和多光谱图像,如果他们位于同一光谱-分辨率流形,则图像融合 相当于在该流形上某一对角线上采样。如果两者并不位于同一流形,则可通过最小化他们到融合目标 图像所在的流形的距离得到。基于上述分析,本文提出了Poisson融合和最优融合两种方法。 两种方法都可以用于任意多个波段的融合中, 其融合效果出色,特别是最优融合,不仅优于传统方法,甚至优于小波变换。 多焦距流形上的图像融合 本文对薄透镜以不同焦距产生的图像流形,也就是多焦距流形,进行了分析。 认为该流形上的融合,就是要在给定不同焦距的图像的条件下,求解本质图像。 为此,在未知焦距参数的情况下,本文通过寻找聚焦中心以及模型转换,利用 最优融合算法求得了清晰图像,并和一些经典算法进行了对比分析,说明其有效性。 多维多通道图像尺度空间光流 尺度空间是一个一维流形,可以看作光谱-分辨率流形的退化情形, 是解决多尺度问题的一种很自然的方法。尺度间的对应关系导致在尺度空间中对点进行跟踪。 光流正是用于实现这种跟踪的。本文将原尺度空间的光流(SSOF)推广到多维多通道的图像滤波中。
其他摘要In recent years, image modeling based on manifold assumption has attracted more and more attentions. Investigating the structure of the space of natural images, it can be seen that the images are distributed very sparsely in the vector space. So, they must lie on manifolds with various dimensions. The natural image ensemble can be sliced to obtain manifolds at many sections. This thesis first resolves two existing problems in manifold learning, then presents several applications guided by the manifold concept. The details lie on three aspects: semi-supervised matching of pose manifold, neural network representation of manifolds, and fusion and optical flow in the scene image manifold. *Semi-supervised matching of pose manifold This thesis presents a novel scheme for manifold learning. Different from the previous work reducing data to Euclidean space which cannot handle the looped manifold well, we map the scattered data to its intrinsic parameter manifold by semi-supervised learning. Given a set of partially labelled points, the map to specified parameter manifold is computed by an iterative neighborhood average method called Anchor Points Diffusion procedure (APD). *Neural network representation of manifolds This study introduces manifold to model the correspondences learn by manifold learning algorithms. The neural network is used to learn the map from the high dimensional image space and low dimensional embedding space, as well as the inverse map. Besides, neural network is used to build auto-association and cross association model. Fusion and optical flow in the scene image manifold This thesis presents work about three aspects of the scene image manifold。 First, an image fusion method is proposed based on the analysis of the spectral-resolution manifold. Secondly, a multi-focus image fusion method is proposed based on the analysis of the multi-focus image manifold. Thirdly, a generalization of the scale space optical flow is presented to handle multi-dimensional multi-channel images. To fuse two images with different spatial resolutions and spectral resolutions, we can minimize the distances between the target image and two given images. By defining the distances in gradient manner, Poisson fusion and optimal fusion is proposed to fuse the two images. Based on the analysis of the multi-focus image manifold, we find that the the fusion process is equivalent to finding the underlying intrinsic image. The experiment results are compared to traditional method and illustrate that the proposed method is more effective. Scale space is a one-dimensional manifold and a natural way to handle multi-scale problems. Yang and Ma have considered the correspondence between scales, and proposed optical flow in the scale space. In this thesis, we generalized Yang and Ma's work to multi-dimensional multi-spectral images.
馆藏号XWLW1153
其他标识符200318014603004
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/5972
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
龚海峰. 图像流形相关问题研究[D]. 中国科学院自动化研究所. 中国科学院研究生院,2007.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20031801460300(9840KB) 暂不开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[龚海峰]的文章
百度学术
百度学术中相似的文章
[龚海峰]的文章
必应学术
必应学术中相似的文章
[龚海峰]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。