基于监督机制的城市交通信号多智能强化学习控制方法被引量：4

Supervisory Mechanism Based Multi-agent Reinforcement Learning for Urban Traffic Signal Control

下载PDF

导出

摘要在城市交通环境下,通过分析控制方法灵活性与稳定性的关系,提出一种考虑网络稳定性的多智能体强化学习控制方法。该方法将稳定状态引入信号控制决策模块,建立稳定规则库,在基本多智能体强化学习控制系统上,设置了一套独立运行的稳定监督装置,对违反稳定规则的控制策略进行校正,以约束控制方法灵活性的方式提升其稳定性,以监督控制的形式实现了多智能体强化学习控制。在时变交通流场景下,以典型路网进行VISSIM仿真试验。结果表明:基于稳定监督控制的多智能体强化学习控制方法提高了算法的运行效率,同时保证了控制效果,适用于复杂交通网络。 In the urban traffic environment,a multi-agent reinforcement learning control method considering network stability is presented by analysis of the relationship between the flexibility and stability.This method introduces stable state into the decision module and sets up a set of stability rules.An independent operating mechanism is proposed based the basic multiagent reinforcement learning control system.The function of this mechanism is to calibrate the strategy,which violates the stability rules.Then,the stability of the constraint control method is improved,and the multi-agent reinforcement control is realized in the form of supervisory control.Under traffic demand of time-varying scene,VISSIM simulation is conducted on the typical road network.The result shows that supervision control based multi-agent reinforcement learning method improves the efficiency of the algorithm and ensures the control effect.It is applicable for the complex traffic network.

作者张轮张希雨夏凡赵文文 ZHANG Lun;ZHANG Xiyu;XIA Fan;ZHAO Wenwen(Key Laboratory of Road and Traffic Engineering,Ministry of Education,Tongji University,Shanghai 201804,China)

机构地区同济大学道路与交通工程教育部重点实验室

出处《交通与运输》 2020年第4期86-91,共6页 Traffic & Transportation

关键词交通工程交通信号多智能体强化学习 Q学习网络稳定性监督机制 Transportation engineering Traffic signal Multi-agent reinforcement learning Q-learning Network stability Supervision mechanism

分类号 U491 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献3

1田晓剑.消除“城市交通病”需要“智”理[J].交通与运输,2018,34(2):53-53. 被引量：1
2刘义,何均宏.强化学习在城市交通信号灯控制方法中的应用[J].科技导报,2019,37(6):84-90. 被引量：14
3杨文臣,张轮,Zhu Feng.多智能体强化学习在城市交通网络信号控制方法中的应用综述[J].计算机应用研究,2018,35(6):1613-1618. 被引量：32

二级参考文献9

1赵冬斌,刘德荣,易建强.基于自适应动态规划的城市交通信号优化控制方法综述[J].自动化学报,2009,35(6):676-681. 被引量：44
2陈学松,杨宜民.强化学习研究综述[J].计算机应用研究,2010,27(8):2834-2838. 被引量：66
3何兆成,佘锡伟,杨文臣,陈宁宁.结合Q学习和模糊逻辑的单路口交通信号自学习控制方法[J].计算机应用研究,2011,28(1):199-202. 被引量：13
4聂建强,徐大林.基于模糊Q学习的分布式自适应交通信号控制[J].计算机技术与发展,2013,23(3):171-174. 被引量：3
5龙琼,胡列格,张谨帆,周昭明,彭烁.考虑交通管理策略的交叉口信号控制多目标优化[J].中南大学学报（自然科学版）,2014,45(7):2503-2508. 被引量：8
6陆化普,孙智源,屈闻聪.大数据及其在城市智能交通系统中的应用综述[J].交通运输系统工程与信息,2015,15(5):45-52. 被引量：167
7杨文臣,张轮,Zhu Feng.多智能体强化学习在城市交通网络信号控制方法中的应用综述[J].计算机应用研究,2018,35(6):1613-1618. 被引量：32
8马寿峰,李英,刘豹.一种基于Agent的单路口交通信号学习控制方法[J].系统工程学报,2002,17(6):526-530. 被引量：62
9Li Li,Yisheng Lv,Fei-Yue Wang.Traffic Signal Timing via Deep Reinforcement Learning[J].IEEE/CAA Journal of Automatica Sinica,2016,3(3):247-254. 被引量：79

共引文献43

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：62
2彭正辉.摩天大楼里的复仇女郎[J].传奇故事（百家讲堂）,2000(8):4-24.
3冯其明.高校多功能体育馆周边路网应急疏散定量研究[J].计算机与数字工程,2018,46(9):1744-1748.
4王紫.面向多类型规划咨询的城市交通模型建模方法分析[J].黑龙江交通科技,2018,41(10):225-225.
5范申民.基于复杂网络的交通系统的动态管理[J].计算机与数字工程,2018,46(12):2491-2498. 被引量：1
6刘义,何均宏.强化学习在城市交通信号灯控制方法中的应用[J].科技导报,2019,37(6):84-90. 被引量：14
7王兆艳,乔枫,孙昊琛,ALEXANDER T.Fashakin.交通信号控制方法综述[J].现代交通技术,2019,16(3):75-79. 被引量：9
8沈宇,王晓,韩双双,陈龙,王飞跃.代理技术Agent在智能车辆与驾驶中的应用现状[J].指挥与控制学报,2019,5(2):87-98. 被引量：17
9杜威,丁世飞.多智能体强化学习综述[J].计算机科学,2019,46(8):1-8. 被引量：56
10刘泽宇.智能体技术在城市交通信号控制系统中的应用[J].数字通信世界,2019(8):226-226. 被引量：2

同被引文献37

1霍凤财,迟金,黄梓健,任璐,孙勤江,陈建玲.移动机器人路径规划算法综述[J].吉林大学学报（信息科学版）,2018,36(6):639-647. 被引量：174
2赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红.深度强化学习综述:兼论计算机围棋的发展[J].控制理论与应用,2016,33(6):701-717. 被引量：140
3王亚飞.THMR-V平台上的智能交通监控系统设计与实现[J].计算机测量与控制,2017,25(7):106-109. 被引量：4
4熊先青,刘慧,朱卿卿,包瑜亮,吴智慧.定制家居产业链协同发展的思考[J].木材工业,2018,32(2):18-22. 被引量：41
5李中原,丁建文.板式定制家具智能制造技术浅探[J].家具,2018,39(4):106-110. 被引量：22
6高乐,马天录,刘凯,张宇轩.改进Q-Learning算法在路径规划中的应用[J].吉林大学学报（信息科学版）,2018,36(4):439-443. 被引量：22
7熊先青,吴智慧.家居产业智能制造的现状与发展趋势[J].林业工程学报,2018,3(6):11-18. 被引量：135
8卫玉梁,靳伍银.基于神经网络Q-learning算法的智能车路径规划[J].火力与指挥控制,2019,44(2):46-49. 被引量：19
9舒凌洲,吴佳,王晨.基于深度强化学习的城市交通信号控制算法[J].计算机应用,2019,39(5):1495-1499. 被引量：22
10董瑶,葛莹莹,郭鸿湧,董永峰,杨琛.基于深度强化学习的移动机器人路径规划[J].计算机工程与应用,2019,55(13):15-19. 被引量：33

引证文献4

1周红丽,张颖.城市交通过饱和状态下干线信号控制优化的研究[J].智能城市,2021,7(5):129-130. 被引量：1
2颜文胜,吕红兵.基于Deep Q Networks的交通指示灯控制方法[J].计算机测量与控制,2021,29(6):93-97. 被引量：2
3王慧,秦广义,杨春梅.定制家具板材搬运AGV路径规划[J].包装工程,2021,42(17):203-209. 被引量：3
4赵乾,张灵,赵刚,金盛.双环相位结构约束下的强化学习交通信号控制方法[J].交通运输工程与信息学报,2023,21(1):19-28. 被引量：3

二级引证文献9

1张乾隆,胡智群,肖海林.基于行人安全的交通信号灯智能控制算法研究[J].计算机测量与控制,2022,30(4):114-120.
2何启嘉,王启明,李佳璇,王正佳,王通.基于优势竞争网络的转运机器人路径规划[J].清华大学学报（自然科学版）,2022,62(11):1751-1757. 被引量：6
3陈靖宇,徐志林.VANET随机部署环境下基于改进型共享最近邻密度峰聚类的快速分簇算法[J].计算机测量与控制,2023,31(9):174-182.
4张萌,王殿海,金盛.结合领域经验的深度强化学习信号控制方法[J].浙江大学学报（工学版）,2023,57(12):2524-2532. 被引量：2
5卫诚琨,周俊.订单驱动下基于强化学习的智能车间AGV调度[J].上海工程技术大学学报,2023,37(4):397-403.
6巫茜,郭冬冬,骆进朝,韩雨.基于人工势场算法改进的AGV自主避障路径规划算法及其应用[J].重庆理工大学学报（自然科学）,2024,38(4):189-195. 被引量：8
7赵红顺.公路交通指南标记对信号交叉口饱和流速的影响研究[J].大众科学,2024,45(5):79-81.
8叶宝林,孙瑞涛,吴维敏,陈滨,姚青.基于异步优势演员-评论家的交通信号控制方法[J].浙江大学学报（工学版）,2024,58(8):1671-1680. 被引量：5
9马昌喜,刘奕奕,赵红星,麻存瑞.考虑低排放的交叉口信号控制优化研究综述[J].兰州交通大学学报,2025,44(3):51-61. 被引量：2

1方超.智能交通信号的控制策略分析与应用[J].集成电路应用,2020,37(8):78-79.
2张斌.探究工民建施工质量监督控制的问题[J].砖瓦,2020(8):95-95. 被引量：7
3杨伊静.北斗三号正式开通!开启服务全人类新篇章[J].中国科技产业,2020(8):72-74. 被引量：1
4智东西.北斗三号组网完成[J].物联网技术,2020,10(8):3-3. 被引量：1
5李燕丽,王晓喃.基于分层机制的全IP车载网地址配置方案[J].计算机工程,2020,46(8):160-163.
6梁志剑,郝淼.基于改进深度注意神经网络的语义角色标注[J].计算机工程与设计,2020,41(8):2327-2331. 被引量：4
7杨扬.分析住宅工程质量通病治理监督控制[J].建筑与装饰,2020(19):59-60.
8陈鹏腾.铁路四电工程信息化协同系统[J].价值工程,2020,39(23):194-195. 被引量：1
9郭湛,雍歧东,魏振堃,赵素丽,徐磊.海军油料运输网络初始节点战时风险熵评估[J].军事交通学院学报,2020,22(4):90-95.
10李坤伦,张鲁,赵佳钐,孙勇.SaaS模式下多租户架构型高校IT资产管理系统研究[J].电子设计工程,2020,28(16):43-48. 被引量：4

交通与运输

2020年第4期

浏览历史

内容加载中请稍等...

基于监督机制的城市交通信号多智能强化学习控制方法被引量：4

参考文献3

二级参考文献9

共引文献43

同被引文献37

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于监督机制的城市交通信号多智能强化学习控制方法 被引量：4

参考文献3

二级参考文献9

共引文献43

同被引文献37

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于监督机制的城市交通信号多智能强化学习控制方法被引量：4