CASIA OpenIR  > 毕业生  > 博士学位论文
基于自适应动态规划的高速路优化控制
其他题名Freeway Optimal Control based on Adaptive Dynamic Programming
白雪瑞
学位类型工学博士
导师赵冬斌 ; 易建强
2010-05-31
学位授予单位中国科学院研究生院
学位授予地点中国科学院自动化研究所
学位专业控制理论与控制工程
关键词高速路 入口匝道控制 协调控制 自适应动态规划 适合度轨迹 模糊神经网络 Freeway Ramp Metering Coordinated Control Adaptive Dynamic Programming Eligibility Traces Neuro-fuzzy Network
摘要随着社会和经济的快速发展,高速路建设的速度以及高速路的交通容量已经远远不及高速路上车辆数量的增长速度。上述原因导致高速路上发生了越来越多的交通拥堵和交通延迟,导致了大量空气污染的产生,同时降低了人员和车辆的安全性。动态交通流控制和管理是有效地解决上述问题的一种方法。动态交通流控制和管理包括很多种策略,比如入口匝道控制、路径导航、可变向车道以及限速控制等等。在上述策略中入口匝道控制是一种众所周知的方法,并且已经被广泛应用于当前高速路交通控制系统中。入口匝道控制通过调节从入口匝道处进入高速路主线的交通流流量,从而使高速路达到一定的服务水平。理论和实践都已经证明,通过合理的设计,入口匝道控制可以有效地消除高速路上发生的常发性和偶发性交通拥堵。 动态规划是一种多阶段决策过程寻优问题的有效而精确的方法,但在许多实际问题的应用上,存在维数灾的问题。自适应动态规划(ADP)利用神经网络来逼近动态规划方法的性能指标函数,避免了动态规划算法的维数灾问题,并能够在性能指标上获得近似最优的控制策略。为了提高ADP方法的训练速度以及解决ADP的初始参数随机选择所带来的优化效果的不稳定性,本文将强化学习中的适合度轨迹理论和模糊神经网络与ADP结合起来,提出了改进后的ADHDP(λ)和NFADHDP(λ)算法,用于解决高速路上的偶发性交通拥堵和常发性交通拥堵问题。 第一,对高速路及其控制问题进行了介绍,综述了本论文的研究背景和意义、研究目的和任务以及论文的主要内容和结构安排。 第二,对高速路交通流模型进行了介绍。给出了交通流理论中的一些基本概念,介绍了高速路交通流基本参数之间的相互关系,并介绍了本文仿真中使用到的LWR和MACK交通流模型,最后引出了高速路的优化控制问题。 第三,首先介绍了经典动态规划方法;接着介绍了强化学习算法中的典型算法以及ADP算法;最后针对传统ADP算法存在训练速度较慢的问题,将ADP与强化学习中的适合度轨迹结合起来,提出了一种新的算法ADHDP(λ),以加快传统ADP算法的优化速度。 第四,以单入口匝道为例,针对是否考虑高速路入口匝道处的排队长度,设计了两种基于ADHDP(λ)算法的高速路单入口匝道控制算法。并将所设计的控制算法与经典的ALINEA方法和传统ADP方法进行了仿真实验比较,仿真结果显示出本文给出的算法所需的训练次数少、响应速度快、稳态性能好的优点,便于在实时高速路入口匝道控制领域的应用。 第五,针对高速路多入口匝道的协调优化控制问题,提出了一种基于ADHDP(λ)的高速路多匝道协调控制策略。本协调控制策略中,不同匝道间所需交互的信息量较少,且无需上级控制协调单元,便于形成分布式高速路入口匝道控制系统。最后,在仿真实验中,通过与ALINEA方法的比较,验证了ADHDP(λ)多入口匝道协调策略的有效性,并且成功地解决了一段高速路上发生的偶发性交通拥堵问题。 第六,针对ADP算法中动作网络模块的初始参数随机选择而带来的优化效果的不稳定性,将模糊神经网络与ADP算法相结合,引入了先验知识,提出了NFADHDP(λ)算法。最后设计了基于NFADHDP(λ)算法的高速路...
其他摘要With the rapid development of modern society, the number of vehicles and the need for mobility has increased beyond the current road capacity. This has resulted in congestions, consequent excess delays, reduced pedestrian and vehicle safety, and increased air pollution. A promising solution to these problems exploits the existing infrastructure through efficient dynamic traffic management and control. Specifically, in freeway traffic systems, many measures could be adopted to improve the service quality of freeways, such as ramp metering, route guidance, reversible lanes, speed limits and so on. Among these measures, ramp metering is a well-known method extensively used in present freeway traffic systems. This method regulates the volume of traffic entering a given freeway at its entry ramps, so that the freeway can operate at some desired level of service. When properly designed, ramp metering can efficiently alleviate recurrent and nonrecurrent congestions, which has been proven both by mathematically sound arguments and in practice. It is well known that traditional dynamic programming is limited in applications due to its high computation and storage complexity for high order nonlinear systems, causing the problem of the curse of dimensionality. However, Approximate Dynamic Programming (ADP) is able to artfully circumvent such difficulties by using a critic network for estimating the performance and an action network for generating optimal actions. In order to improve the learning efficiency of ADP and to solve the problem of random selecting initial parameters with ADP, we combine eligibility traces of reinforcement learning and neuro-fuzzy network with ADP, then present the novel ADHDP(λ) and NFADHDP(λ) methods which are used to solve the non-recurrent and recurrent congestions in freeway. Firstly, we pay attention to freeway control problems. We also present the research background and significance of this paper. The research aims, as well as this paper’s main work and missions are introduced. Secondly, we introduce the freeway traffic models; present a general overview of the concept of the parameters of traffic theory and relationships between them. Then we introduce the LWR and MACK traffic flow models which are used in simulation tests to present the freeway optimal control problems. Thirdly, this paper introduces the traditional Dynamic Programming (DP), then presents an overview of the reinforcement learning and ADP theory. For dealing...
馆藏号XWLW1464
其他标识符200718014628001
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6275
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
白雪瑞. 基于自适应动态规划的高速路优化控制[D]. 中国科学院自动化研究所. 中国科学院研究生院,2010.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20071801462800(1749KB) 暂不开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[白雪瑞]的文章
百度学术
百度学术中相似的文章
[白雪瑞]的文章
必应学术
必应学术中相似的文章
[白雪瑞]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。