强化学习算法在空调系统运行优化中的应用研究被引量：11

Application of Reinforcement Learning in HVAC System Operation Optimization

下载PDF

导出

摘要空调系统运行优化是建筑节能的重要组成部分。提出了在空调系统运行优化中应用强化学习算法,主要采用拟合Q迭代算法。结合空调系统运行优化的实际需求及强化学习算法的特征,将强化学习控制器在空调系统运行优化中的应用过程分为4个阶段,包括准备、初始、探索和运行阶段,并具体描述了各阶段完整的算法流程。通过强化学习控制器在空气源热泵联合电辅热系统中的应用,案例对其控制效果进行验证分析。仿真结果显示,提出的基于强化学习算法的空调系统运行方法在满足建筑负荷需求的同时,可以有效降低建筑运行费用。与模型预测控制方法相比,强化学习控制器响应速度更快。此外,该方法具备对先验知识依赖程度低、自适应性强的特点,具备一定的实用性,其应用有助于实现空调系统精细化运行的目标。 The operation optimization of HVAC system is an essential part of building energy conservation.In this study,HVAC system operation optimization based on reinforcement learning controller is proposed.The fitted Q-iteration algorithm is selected as the main algorithm.Considering the features of the algorithm and the requirement of HVAC system operation,the application of RLC is divided into four phases,including preliminary phase,initial phase,exploration phase and operation phase.Detailed process of each phase is described.The application case of RLC in air-source heat pump with auxiliary heating system for small residential building is conducted to validate the performance of the reinforcement learning controller.The simulation result shows that the proposed RLC method for HVAC system operation can reduce energy cost and meet the building cooling/heating demand at the same time.Compared with model predictive control,RLC also saves the computational time for decision making.In addition,the proposed RLC method requires only little prior knowledge and is capable to adapt to the environment.The proposed method is practical and its application could enhance HVAC system operation.

作者丁志梁潘毅群(指导) 谢建彤王尉同黄治钟 DING Zhi-liang;PAN Yi-qun;XIE Jian-tong;WANG Wei-tong;HUANG Zhi-zhong(School of Mechanical Engineering,Tongji University,Shanghai 201804,China;Sino-German College of Applied Sciences,Tongji University,Shanghai 201804,China)

机构地区同济大学机械与能源工程学院同济大学中德工程学院

出处《建筑节能》 CAS 2020年第7期14-20,共7页 BUILDING ENERGY EFFICIENCY

关键词空调系统运行优化强化学习数据驱动 HVAC system operation optimization reinforcement learning data-driven

分类号 TU17 [建筑科学—建筑理论]

引文网络
相关文献

参考文献2

1高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：300
2陈学松,杨宜民.强化学习研究综述[J].计算机应用研究,2010,27(8):2834-2838. 被引量：66

二级参考文献64

1杨洋,陈小平.动态不确定环境下的决策:一种分层决策模型[J].计算机科学,2005,32(1):151-154. 被引量：1
2苏畅,高阳,陈世福,陈兆乾.基于SMDP环境的自主生成options算法的研究[J].模式识别与人工智能,2005,18(6):679-684. 被引量：9
3秦志斌,钱徽,朱淼良.自主移动机器人混合式体系结构的一种Multi-agent实现方法[J].机器人,2006,28(5):478-482. 被引量：8
4原魁,李园,房立新.多移动机器人系统研究发展近况[J].自动化学报,2007,33(8):785-794. 被引量：78
5AL-BATAH M S,MATISA N A,ZAMLI K Z,et al.Modified recursive least squares algorithm to train the hybrid multilayered perceptron (HMLP) network[J].Applied Soft Computing,2010,10(1):236-244.
6BOWLING M.Multi agent learning in the presence of agents with limi-tations[R].Pittsburgh:Carnegie Mellon University,2003.
7KYUN Y,OH S-Y.Hybrid control for autonomous mobile robotnavigation using neural network based behavior modules and environment classification[J].Autonomous Robots,2003,15(2):193-206.
8ARAI S,SYCARA K.Multi-agent reinforcement learning for planning and conflict resolution in a dynamic domain[C] //Proc of the 4th International Conference on Autonomous agents.2000:104-105.
9VRANCY P,VERBEEK K,NOWE A.Decetralized learning in Markov games[J].IEEE Trans on Systems,Man and Cyberne-tics Part B:Cybernetics,2008,38(4):976-981.
10LUCIAN B,ROBERT B,BART D S.A comprehension survey of multiagent reinforcement learning[J].IEEE Trans on Systems,Man and Cybernetics Part C:Applications and Reviews,2008,68(2):156-172.

共引文献352

1李小强,杨凯,代龙飞,夏炜豪,蔡正鑫.冷轧连退机组中央段自动控制系统开发[J].冶金自动化,2023,47(S01):121-124.
2项宇,秦进,袁琳琳.结合向前状态预测和隐空间约束的强化学习表示算法[J].计算机系统应用,2022,31(11):148-156. 被引量：4
3张雨.基于马尔科夫过程状态转移矩阵的桥梁结构技术状态预测方法研究[J].四川水泥,2023(3):212-214. 被引量：1
4安萌萌,樊秀梅,蔡含宇.基于雾计算和强化学习的交通灯智能协同控制研究[J].计算机应用研究,2020,37(2):465-469. 被引量：9
5王彦朋,郭佳佳,王晓君.基于Q-Learning的青霉素发酵过程控制方法[J].信息化研究,2023,49(3):31-35.
6马庆刘,喻鹏,吴佳慧,熊翱,颜拥.基于深度强化学习的综合能源业务通道优化机制[J].北京邮电大学学报,2020,43(2):87-93. 被引量：1
7赵元,张合新.基于目标状态距离简化Q-learning算法的迷宫路径规划[J].火箭军工程大学学报,2019(4):79-84.
8周济,陈锋.基于强化神经网络的区域协调控制研究[J].电子技术（上海）,2010(9):20-22.
9卓睿,陈宗海,陈春林.基于强化学习和模糊逻辑的移动机器人导航[J].计算机仿真,2005,22(8):157-162. 被引量：5
10魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19

同被引文献75

1Di Cao,Weihao Hu,Junbo Zhao,Guozhou Zhang,Bin Zhang,Zhou Liu,Zhe Chen,Frede Blaabjerg.Reinforcement Learning and Its Applications in Modern Power and Energy Systems: A Review[J].Journal of Modern Power Systems and Clean Energy,2020,8(6):1029-1042. 被引量：42
2姚佳伟,黄辰宇,付斌,纪尧姆·卡尼奥.深度强化学习支持下风环境性能驱动的设计研究与实践[J].建筑学报,2022(S01):31-38. 被引量：9
3尹伯悦,赖明,谢飞鸿.绿色建筑与智能建筑在世界和我国的发展与应用状况[J].建筑技术,2006,37(10):733-735. 被引量：30
4徐兴声.智能建筑的发展与可持续发展方向[J].建筑学报,1997(6):20-22. 被引量：37
5杨启文,蔡亮,薛云灿.差分进化算法综述[J].模式识别与人工智能,2008,21(4):506-513. 被引量：147
6张雪松.可持续建筑的智能、动态立面设计[J].新建筑,2010(2):107-110. 被引量：9
7邵双全,梁楠,田长青.多联式空调制冷系统动态仿真研究[J].制冷学报,2011,32(1):16-22. 被引量：26
8张剑麟,路建岭,麦粤帮.下送风通信机柜发热量改变对其出风温度的影响[J].洁净与空调技术,2011(3):17-20. 被引量：1
9胡世华,郑爱平.地下商场与地上商场建筑空调节能分析研究[J].建筑节能,2012,40(3):5-10. 被引量：2
10陈实,路建岭,麦粤帮,潘城岿.下送风通信机柜进风速度对其出风温度的影响[J].洁净与空调技术,2012(2):29-32. 被引量：1

引证文献11

1曾宇,袁祥枫,王海宁.基于AI的运营级IDC节能研究[J].中兴通讯技术,2020,26(5):39-44. 被引量：3
2万典典,刘智伟,陈语,池明.基于DDPG算法的冰蓄冷空调系统运行策略优化[J].控制工程,2022,29(3):441-446. 被引量：9
3高志刚,胡桐月,周品品.基于数据挖掘的建筑负荷预测与空调系统优化控制探析[J].节能,2022,41(7):1-3. 被引量：1
4蔡荣,吴昕烨,徐迟,金立标,曹灿.数据中心AI节能技术研究及应用[J].通信电源技术,2022,39(20):208-212. 被引量：1
5秦浩森,于震,李太禄,李立.基于深度强化学习的热泵供热系统节能控制[J].建筑科学,2022,38(12):1-6. 被引量：9
6陈鑫星,宋晔皓.碳中和视角下的公共建筑主动感知与智能控制研究[J].艺术与设计（城市空间设计）,2022(4):6-9.
7陈长成,安晶晶,王闯,段晓绒.基于强化学习的室内温湿度联合控制方法研究[J].科学技术与工程,2024,24(12):5123-5133. 被引量：4
8韩帅,卢健斌,吴宁,陈卫东,孙乐平.基于深度强化学习技术的空调用户无感调控研究[J].供用电,2024,41(12):54-61. 被引量：5
9王涛,于泽沛,时斌,赵永俊,尹鹏,张思哲.基于LSTM与DDPG的空调能耗优化控制策略[J].计算机与数字工程,2024,52(11):3439-3445. 被引量：2
10赵安军,魏渊,张洺瑞,任启航.基于强化学习的地下空间除湿机组系统优化控制研究[J].建筑节能(中英文),2025,53(4):89-98. 被引量：1

二级引证文献34

1钟玮琦,喻仁虹,李明柱.基于DDPG算法的供热末端运行策略研究[J].暖通空调,2022,52(S02):170-174. 被引量：1
2张渊,林武隽,曾宇.基于像素编码的通信电源专业危险因素辨识方法[J].长江信息通信,2021,34(12):169-172.
3张永民,胡章元.基于AI的机房能耗运营管理系统方案研究[J].通信与信息技术,2023(2):80-83. 被引量：1
4丁萌.智能控制技术在机电控制系统中的应用探析[J].消费电子,2022(10):93-95. 被引量：1
5蒙艳玫,张月,段青山.基于深度集成学习的甘蔗压榨抽出率预测方法[J].三峡大学学报（自然科学版）,2023,45(4):101-107. 被引量：2
6齐义文,李鑫,张弛,姜渭宇.高空直连试验台进气压力模拟系统DDPG前馈补偿智能控制[J].沈阳航空航天大学学报,2023,40(3):44-55.
7于军琪,赵何超,陈登峰.基于IW-ABC算法的冰蓄冷空调系统优化调度研究[J].建筑科学,2023,39(8):124-133. 被引量：5
8张力,金立,任炬光,刘小兵.计及气象因素与分时电价影响的综合能源系统负荷调控策略研究[J].综合智慧能源,2024,46(1):18-27. 被引量：5
9李中伟,乔美英,王聪.基于强化学习的化学发光免疫分析仪温度控制策略研究[J].科技创新与应用,2024,14(13):39-43. 被引量：1
10赵柏扬.基于AHP的智能空调控制算法设计与应用[J].日用电器,2024(4):30-33.

1兰方铨.基于BIM的工程造价精细化研究[J].四川水泥,2020(8):238-238. 被引量：1
2亢中苗,汪莹,张珮明,陶志强,李家樑.云计算环境下基于强化学习的虚拟机资源调度[J].自动化与仪器仪表,2020(10):68-72. 被引量：9
3王骏超.基于SAC算法的机械臂控制方法与分析[J].赤峰学院学报（自然科学版）,2020,36(10):33-39. 被引量：4
4陈昱.基于积分强化学习的连续线性不确定系统最优控制分析[J].河南科技,2020,39(28):12-14.

建筑节能

2020年第7期

浏览历史

内容加载中请稍等...

强化学习算法在空调系统运行优化中的应用研究被引量：11

参考文献2

二级参考文献64

共引文献352

同被引文献75

引证文献11

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

强化学习算法在空调系统运行优化中的应用研究 被引量：11

参考文献2

二级参考文献64

共引文献352

同被引文献75

引证文献11

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

强化学习算法在空调系统运行优化中的应用研究被引量：11