CASIA OpenIR  > 毕业生  > 博士学位论文
交通场景中目标检测方法研究与应用
其他题名Vision-based Object Detection and Applications in Traffic Environments
李泊
学位类型工学博士
导师王飞跃
2014-05-24
学位授予单位中国科学院大学
学位授予地点中国科学院自动化研究所
学位专业控制理论与控制工程
关键词交通视频监控系统 车牌检测 行人检测 概率图模型 Traffic Video Surveillance Systems License Plate Detection Pedestrian Detection Probabilistic Graphical Models
摘要智能交通系统的高效工作建立在交通信息的实时获取上。随着智能视频监控与分析方法的研究发展,基于视频检测的交通信息采集技术已成为智能交通系统的重要组成部分,具有广阔的应用前景。基于视觉的交通目标检测技术是完成视频图像中信息采集以及其他高层任务的基础和核心。随着图像采集技术的不断发展,高清数字摄像机已经逐渐取代传统D1分辨率的模拟摄像机,成为交通监控应用的主流设备。而视频图像的高清特点为传统目标检测技术提供了新的发展机遇,同时带来了挑战与难题。 在本文中,我们选取了两种常见而典型的交通目标(车牌和行人)作为研究对象,利用计算机视觉和机器学习等理论,研究两种目标在复杂的城市交通监控场景中的检测问题。本文利用基于部件的目标检测思想,结合概率图模型,针对高清图像中的目标检测所面临的目标遮挡、类内变化大、背景复杂等问题进行了研究。本文的主要工作包括以下几个方面: (1)提出了基于连通分量最近邻链的车牌检测算法。针对传统车牌检测算法应用环境受限、使用特征单一等问题,将基于部件的目标检测思想应用到车牌检测中,综合利用车牌的外观特征和结构特征。首先,引入MSER检测子提取图像中稳定的连通分量作为备选车牌字符。然后,通过建立备选字符的最近邻对,构造最近邻链,描述字符之间的空间关系。最后通过最近邻链的序列编码和匹配推断车牌的具体位置。实验结果表明该算法可以在复杂交通环境中有效检测链式结构的车牌目标,同时保持较低的检测虚警率。 (2)提出了基于条件随机场的车牌检测算法。针对最近邻链模型在车牌检测中的局限性,引入概率图模型建模,实现更复杂的字符结构和更具有挑战性的监控场景下的车牌检测。选择满足邻域条件的MSER作为观测结点建立条件随机场,并用灵活的模型拓扑结构和概率分布对字符之间的空间关系和视觉特征关系进行建模。根据不同类型车牌的特点,定义特定的条件随机场势函数形式。最后,使用置信度传播算法推理获得条件随机场中观测结点的最优标记值。实验结果表明该算法与传统车牌检测算法相比具有明显的性能优势,可适应车牌遮挡、污损等多种挑战性场景。 (3)提出了基于聚类poselet的行人部位表示模型。考虑到人体姿态估计和人体检测两种任务中所使用的部位模型都具有各自的局限性,我们引入综合考虑两者特点的poselet模型,并在此基础上,根据交通场景中行人检测任务的特点加以改进,提出聚类poselet。聚类poselet重新定义行人关键点,并明确每次操作时的部位类型和关键点范围,保证部位模型在检测时具有足够的语义性和判别能力。在训练中引入近邻传播聚类算法,学习出部位的典型姿态模式。实验结果表明聚类poselet不仅保留了poselet的优势,还克服了原有poselet模型应用于行人检测中的一些限制,能够完整描述交通场景中行人在姿态外观上的多变性。 (4)提出了基于分层与或语法模型的行人检测算法。考虑到一般的单层分解结构很难对行人巨大的类内姿态差异进行完整建模,我们引入分层结构的与或语法模型,对行人目标进行由粗到细的分解,通过语法模型的各种产生式组合对多变的人体姿态...
其他摘要Efficient intelligent transportation systems (ITS) should be built on the real-time traffic information collection. With the deep research of intelligent video surveillance, video-based traffic information collection attracts attentions of numerous researchers since its broad application prospects. Then, the technique to detect traffic objects in images is the core and foundation for information collection and other high-level tasks. Currently, with the development of image acquisition devices, traditional analog cameras with D1 resolutions are gradually replaced with high-definition digital video cameras, which have been mainstream devices in traffic application. New opportunities may be brought to solve many fixed difficulties in object detection because of the high-definition characteristics. Based on complex video surveillance scenarios in urban traffic environments, we select two representative objects, license plates and pedestrians, to achieve their detection with the help of computer vision, machine learning, and other technologies. We use component-based detection methods and introduce probabilistic graphical models (PGM). Efforts are made to solve many common difficulties in object detection, such as occlusion, large intra-class variations, cluttered background. The main work and contributions of this paper are: (1) A license plate detection algorithm based on nearest neighbor chain (NNC) of connected components is proposed to detect license plates with characters aligning in chain structures. The component-based object detection is utilized in this task to use both appearance features and structural features of license plates. Firstly, the maximally stable extremal region (MSER) detector is introduced to extract stable connected components as candidate license plate characters in the image. Then, the nearest neighbor pairs (NNP) of connected components are constructed with the spatial relationships to build NNCs. Finally, sequence encoding and matching strategies are performed on NNCs. Experimental results show the effectiveness of the algorithm in various real traffic environments with extremely low false positive rate. (2) A license plate detection algorithm using conditional random field (CRF) models is proposed. In order to solve the limitations of NNC-based license plate algorithms, PGM are introduced to make the algorithm adapt to more complex character arrangement and more challenging environments. MSERs that meet certain neighborhood...
馆藏号XWLW1994
其他标识符201118014628010
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6592
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
李泊. 交通场景中目标检测方法研究与应用[D]. 中国科学院自动化研究所. 中国科学院大学,2014.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20111801462801(3386KB) 暂不开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[李泊]的文章
百度学术
百度学术中相似的文章
[李泊]的文章
必应学术
必应学术中相似的文章
[李泊]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。