CASIA OpenIR  > 毕业生  > 博士学位论文
基于图的紧致特征描述和快速图像搜索方法研究
其他题名Graph-based CompactFeature Description and Fast Image Retrieval
李鹏
学位类型工学博士
导师卢汉清
2013-05-30
学位授予单位中国科学院大学
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
关键词图模型 特征描述 主题模型 哈希编码 快速图像搜索 Graph Theory Feature Description Topic Model Hash Fast Image Retrieval
摘要随着科学技术的迅猛发展,计算机硬件、数字化设备和通信传输等信息技术日新月异,将人类社会带入到一个高度信息化的时代。而多媒体和网络技术的发展,导致了大量图像资源在网上爆炸性增长。作为多媒体数据的一种重要表现形式,图像往往包含着丰富的信息内容,如何对图像数据进行有效的描述和分析对于计算机更好地理解图像内容具有重要的研究意义。另一方面,由于网络图像数量的快速增长,如何对海量的图像数据进行有效地组织管理,并从中快速搜索得到人们感兴趣的结果也成为了当今一个日益重要的研究课题,具有重大的现实意义。 本文以机器学习中常用的图分析方法对图像之间的内在结构关系进行建模,然后将其嵌入到图像的内容分析过程中,并在此基础上对图像潜在主题挖掘、紧致特征描述和大规模数据的快速搜索等内容做了深入研究,主要工作和贡献如下: (1)提出了一种基于双重局部约束限制的潜在语义分析模型。在图像的词袋表示形式下,潜在主题模型常被用来缩小图像底层特征和高层语义之间的鸿沟。为了克服传统潜在语义分析方法在主题描述能力方面的不足,本文在建模过程中融入了双重局部约束限制。首先,模型通过构造一个l1<上标!>-图对图像间的稀疏近邻结构进行表示;然后,将其与视觉单词之间共生关系联合嵌入到潜在主题的学习过程中,从而得到图像在中层语义空间中更为准确的概率描述,并在图像聚类任务中取得了较好的效果。 (2)提出了一种基于语义图学习的谱哈希算法,实现了图像的紧致编码和快速搜索。哈希算法是为了加快近邻搜索速度而设计的一种编码技术。本文的方法以谱哈希算法为基础,提出了一种新的相似度度量方式对图像关系进行构图,然后利用图像所携带的用户标签等信息对构图结构进行学习,最后在优化的图结构上实现更为准确的图像二进制编码,提高了快速搜索的准确率。 (3)提出了一种半监督的多图哈希算法,并用于图像的快速相似度搜索。针对图像的多种模态表示形式,该方法能够在一个半监督多图框架中同时对图像的多种模态信息进行融合学习,并自适应地学习出每一种模态图的优化权重系数,从而可以更准确地对不同信息进行建模,得到更为有效的图像编码,实现快速图像搜索。 (4)提出了一种基于双互补哈希算法的快速图像检索方法。在判别结构图的基础上,该方法采用了互补学习的方式来进行哈希函数和哈希表的学习,可以同时得到具有互补特性的哈希编码函数和多个互补的哈希表。这种双互补的哈希编码方式能够有效地平衡图像搜索的准确率和召回率,大大提高了快速图像搜索的性能。
其他摘要With the rapid development of the technologies and great advances in computer hardware, digital devices and communication transmission, we are entering the age of information. The image resources grow explosively on the Internet due to the improvements of multimedia and web techniques. As an important form of multimedia data, image usually contains massive information. How to represent and analyze image data is very important for understanding of image content. Moreover, due to the explosive growth of web images, the ability of managing huge image data and conducting fast image search in large-scale databases has also become a more and more important research issue, which is of great significance to the modern world. This paper employs graph theory, which is widely used in machine learning methods, to model the intrinsic structure of images and applies it to the process of image content analysis. We conduct intensive research on image latent topic discovery, compact feature description and fast image search on large database. The main contributions of this dissertation include the following issues: (1) We propose a novel latent topic model with dual local consistency for image analysis. Based on the Bag-of-Words representation for images, the latent topic models are usually used to narrow the gap between the low-level image features and high-level semantic information in different tasks. In order to overcome the shortcoming of traditional topic models in the ability of topic description, we incorporate two different local constraints in topic discovering. We first construct a l1<上标!>-graph to model the sparse neighborhood structure of images, and then combine it with word co-occurrence information for topic learning to obtain more accurate probabilistic distribution of images in the latent semantic space. Our model achieves improvements in image clustering task compared with traditional models. (2) We propose a novel spectral hashing method with semantically consistent graph for image compact coding and fast retrieval. Hashing methods is purposely designed to speed up the Approximate Nearest Neighbor (ANN) search. Baded on the Spectral Hashing (SH) method, our approach propose a novel similarity measure for graph construction between images. Then, we employ the image tags provided by the users to learn the graph structure. Finally, we can obtain more effective binary codes of images based on the optimized graph and get higher precis...
馆藏号XWLW1869
其他标识符201018014628044
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6546
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
李鹏. 基于图的紧致特征描述和快速图像搜索方法研究[D]. 中国科学院自动化研究所. 中国科学院大学,2013.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20101801462804(3467KB) 暂不开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[李鹏]的文章
百度学术
百度学术中相似的文章
[李鹏]的文章
必应学术
必应学术中相似的文章
[李鹏]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。