期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于PER-DDPG算法的城市轨道交通越区切换研究
1
作者
张军平
王小鹏
王冶力
《山西电子技术》
2024年第3期100-102,共3页
针对传统IEEE802.11越区切换方式存在较高的切换延时以及乒乓切换等问题,提出深度强化学习(Deep Q-Network,DQN)越区切换算法。通过对列车运行的特征状态信息进行提取输入,考虑列车运行速度及场强、切换阈值等动态信息构建越区切换模型...
针对传统IEEE802.11越区切换方式存在较高的切换延时以及乒乓切换等问题,提出深度强化学习(Deep Q-Network,DQN)越区切换算法。通过对列车运行的特征状态信息进行提取输入,考虑列车运行速度及场强、切换阈值等动态信息构建越区切换模型。同时针对算法时间成本复杂度及稳定性,采用优先经验回放深度确定性策略梯度(Prioritized Experience Replay-Deep Deterministic Policy Gradient,PER-DDPG)算法,将列车状态空间信息传输至PER-DDPG网络中进行优化分析。结果表明基于PER-DDPG算法优化后的列车越区切换模型使用该算法时间计算成本降低,数据包传输延时约降低55%。
展开更多
关键词
基于通信列车控制
CBTC系统
IEEE802.11标准
优先经验回放机制深度确定策略梯度算法
在线阅读
下载PDF
职称材料
基于DDPG-PER的智慧楼宇云边任务调度策略
2
作者
杨萍
赵俊睿
《自动化与仪表》
2026年第2期138-143,共6页
随着智慧楼宇中物联网终端激增,大量计算任务须上传处理,但云端延迟高且边缘算力有限。该文提出一种跨层联合优化框架,基于楼宇拓扑与业务特征,建立包含计算时延、任务优先级、云边计算与通信资源的联合调度模型。提出将SumTree结构的...
随着智慧楼宇中物联网终端激增,大量计算任务须上传处理,但云端延迟高且边缘算力有限。该文提出一种跨层联合优化框架,基于楼宇拓扑与业务特征,建立包含计算时延、任务优先级、云边计算与通信资源的联合调度模型。提出将SumTree结构的优先经验回放引入DDPG的DDPG-PER算法,提高样本利用率与收敛性。仿真实验显示,DDPG-PER在全局寻优、收敛速度与稳定性上优于标准DDPG及其他基线,并在最小化总体时延的同时优先完成高优先级任务,为智慧楼宇场景下的云边任务调度提供了一种有效的新思路。
展开更多
关键词
智慧楼宇
任务调度
资源分配
DDPG-PER
在线阅读
下载PDF
职称材料
考虑空调系统的燃料电池汽车能量管理策略
3
作者
赵又群
徐周
+3 位作者
虞志浩
林棻
何鲲鹏
尤庆伸
《华南理工大学学报(自然科学版)》
北大核心
2025年第6期56-65,共10页
在燃料电池混合动力汽车的实际运行中,空调系统为驾驶员和乘客提供舒适的环境,然而空调系统的运行效果与汽车实际运行的能量分配相互影响,因此需要将空调系统考虑进能量管理策略,设计出在满足舱内温度舒适性要求的情况下,兼顾整车氢耗...
在燃料电池混合动力汽车的实际运行中,空调系统为驾驶员和乘客提供舒适的环境,然而空调系统的运行效果与汽车实际运行的能量分配相互影响,因此需要将空调系统考虑进能量管理策略,设计出在满足舱内温度舒适性要求的情况下,兼顾整车氢耗经济性的能量管理策略。首先在建立整车动力学模型的基础上,利用热平衡方程建立热泵空调系统模型和热负荷模型;然后采用结合了双Q网络和深度确定性策略梯度的优先经验采样的双延迟深度确定性策略梯度(TD3-PER)算法,建立考虑空调系统能耗与车辆运行需求的能量管理策略。在NEDC典型工况下进行仿真得出:TD3-PER能量管理策略下的空调系统能够使舱温在100s内迅速达到并维持在22~26℃的舒适范围内,满足制冷/制热的同时又保证车舱温度舒适,验证了考虑空调系统时TD3-PER能量管理策略的可行性;在空调系统制冷/制热时,相比传统的深度确定性策略梯度(DDPG)算法策略,基于TD3-PER算法策略的功率分配情况能够延长燃料电池和蓄电池使用寿命,且在制冷/制热时根据氢耗量分别可提高2.59和3.58个百分点的经济性,验证了基于TD3-PER算法能量管理策略在降低氢耗量、提高整车经济性方面相较于传统算法更具优势。
展开更多
关键词
双能源燃料电池汽车
空调系统
能量管理策略
TD3-PER
DDPG
在线阅读
下载PDF
职称材料
时变多参数不确定性下室内环境的节能控制
4
作者
赵建豪
宋华
+1 位作者
南新元
蔡鑫
《河北科技大学学报》
CAS
北大核心
2024年第6期597-608,共12页
为解决当前室内环境受多种时变参数影响不确定性较大,且现有控制设备无法根据室内环境对工作功率进行自适应调节造成的能源浪费问题,采用在深度确定性策略梯度(deep deterministic policy gradient,DDPG)中融入优先经验重放(prioritized...
为解决当前室内环境受多种时变参数影响不确定性较大,且现有控制设备无法根据室内环境对工作功率进行自适应调节造成的能源浪费问题,采用在深度确定性策略梯度(deep deterministic policy gradient,DDPG)中融入优先经验重放(prioritized experience replay,PER)的方法,合理优化控制设备功率,对室内空气质量(indoor air quality,IAQ)和热舒适度进行控制。结果表明:DDPG-PER算法能够在冬夏两季不同室外空气质量条件下,结合多时变参数,将室内环境控制在要求范围之内;与定风量控制系统相比,能源成本降低了13.30%,用户全年可节约2000元左右电费。研究结果对中国“碳中和”策略和绿色低碳建筑行业的发展具有一定的参考价值。
展开更多
关键词
环境质量监测与评价
强化学习
深度确定性策略梯度
优先经验重放
节能控制
在线阅读
下载PDF
职称材料
车用电机定子电流新型优化控制方法
5
作者
周雅夫
王翰涛
连静
《机械设计与制造》
北大核心
2023年第3期230-233,238,共5页
为了实现交直轴电流最优匹配控制,提出了一种基于深度确定性策略梯度的车用电机定子电流优化控制方法。在不对交直轴耦合项电压进行补偿解耦的情况下实现IPMSM交直轴电流的最优匹配控制。实验分析表明基于DDPG的定子电流优化控制方法在...
为了实现交直轴电流最优匹配控制,提出了一种基于深度确定性策略梯度的车用电机定子电流优化控制方法。在不对交直轴耦合项电压进行补偿解耦的情况下实现IPMSM交直轴电流的最优匹配控制。实验分析表明基于DDPG的定子电流优化控制方法在优化交直轴电流匹配和最大转矩电流比控制方面优势显著。相比较传统的前馈补偿解耦(FFCDC)方法实现MTPA控制,同等定子电流产生转矩输出平均高出最高14%,实验验证进一步证明了DDPG具有优化交直轴电流最佳匹配和产生最大转矩输出的能力,验证了该方法的有效性。
展开更多
关键词
内置式永磁同步电机
最大转矩电流比
深度确定性策略梯度
交直轴电流最优匹配
定子电流优化控制
在线阅读
下载PDF
职称材料
基于PER-PDDPG的无人机路径规划研究
被引量:
4
6
作者
乔哲
黎思利
+1 位作者
王景志
符小卫
《无人系统技术》
2022年第6期12-23,共12页
针对未知复杂环境下的多无人机路径规划问题,提出了一种基于优先经验回放的并行深度确定性策略梯度(PER-PDDPG)算法。首先,该算法在传统深度强化学习算法和匈牙利算法的基础上,结合了优先经验回放机制与多智能体经验共享的特点,提高了...
针对未知复杂环境下的多无人机路径规划问题,提出了一种基于优先经验回放的并行深度确定性策略梯度(PER-PDDPG)算法。首先,该算法在传统深度强化学习算法和匈牙利算法的基础上,结合了优先经验回放机制与多智能体经验共享的特点,提高了经验的获取效率,并使高价值经验能够被更加充分的多次利用。其次,算法将针对单无人机的PER-DDPG算法并行拓展到多无人机中,使得算法的网络结构相对于传统多智能体强化学习算法更加简洁高效。仿真结果表明,该方法可以灵活应用于不同数量的无人机群中,并且相较于传统的多智能体强化学习算法拥有更快的收敛速度以及更高的收敛奖励均值,有效提升了在未知复杂环境下的多无人机路径规划效果。
展开更多
关键词
无人机
路径规划
深度强化学习
并行DDPG
优先经验回放
原文传递
题名
基于PER-DDPG算法的城市轨道交通越区切换研究
1
作者
张军平
王小鹏
王冶力
机构
兰州交通大学研究院
兰州交通大学电子与信息工程学院
太原中铁轨道交通建设运营有限公司
出处
《山西电子技术》
2024年第3期100-102,共3页
基金
甘肃省教育厅优秀研究生创新之星项目(2021CXZX-507)
甘肃省自然科学基金(21JR11RA061)
甘肃省科技计划项目(20YF8GA036)。
文摘
针对传统IEEE802.11越区切换方式存在较高的切换延时以及乒乓切换等问题,提出深度强化学习(Deep Q-Network,DQN)越区切换算法。通过对列车运行的特征状态信息进行提取输入,考虑列车运行速度及场强、切换阈值等动态信息构建越区切换模型。同时针对算法时间成本复杂度及稳定性,采用优先经验回放深度确定性策略梯度(Prioritized Experience Replay-Deep Deterministic Policy Gradient,PER-DDPG)算法,将列车状态空间信息传输至PER-DDPG网络中进行优化分析。结果表明基于PER-DDPG算法优化后的列车越区切换模型使用该算法时间计算成本降低,数据包传输延时约降低55%。
关键词
基于通信列车控制
CBTC系统
IEEE802.11标准
优先经验回放机制深度确定策略梯度算法
Keywords
communication-based train control
CBTCsystem
IEEE802.11standard
per-ddpg
分类号
U285.21 [交通运输工程—交通信息工程及控制]
TN926 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于DDPG-PER的智慧楼宇云边任务调度策略
2
作者
杨萍
赵俊睿
机构
陕西科技大学电子信息与人工智能学院
出处
《自动化与仪表》
2026年第2期138-143,共6页
基金
陕西省重点研发计划项目(2023-YBGY-213)
陕西省教育厅服务地方专项计划项目(23JC016)。
文摘
随着智慧楼宇中物联网终端激增,大量计算任务须上传处理,但云端延迟高且边缘算力有限。该文提出一种跨层联合优化框架,基于楼宇拓扑与业务特征,建立包含计算时延、任务优先级、云边计算与通信资源的联合调度模型。提出将SumTree结构的优先经验回放引入DDPG的DDPG-PER算法,提高样本利用率与收敛性。仿真实验显示,DDPG-PER在全局寻优、收敛速度与稳定性上优于标准DDPG及其他基线,并在最小化总体时延的同时优先完成高优先级任务,为智慧楼宇场景下的云边任务调度提供了一种有效的新思路。
关键词
智慧楼宇
任务调度
资源分配
DDPG-PER
Keywords
smart buildings
task scheduling
resource allocation
DDPG-PER
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
考虑空调系统的燃料电池汽车能量管理策略
3
作者
赵又群
徐周
虞志浩
林棻
何鲲鹏
尤庆伸
机构
南京航空航天大学能源与动力学院
奇瑞新能源汽车股份有限公司
出处
《华南理工大学学报(自然科学版)》
北大核心
2025年第6期56-65,共10页
基金
国家自然科学基金项目(52472411,52272397)
芜湖市重点研发与成果转化项目(2023yf010)
+1 种基金
南京航空航天大学中央高校基本科研业务费专项资金资助项目(NP2022408)
南京航空航天大学研究生科研与实践创新计划项目(xcxjh20240204)。
文摘
在燃料电池混合动力汽车的实际运行中,空调系统为驾驶员和乘客提供舒适的环境,然而空调系统的运行效果与汽车实际运行的能量分配相互影响,因此需要将空调系统考虑进能量管理策略,设计出在满足舱内温度舒适性要求的情况下,兼顾整车氢耗经济性的能量管理策略。首先在建立整车动力学模型的基础上,利用热平衡方程建立热泵空调系统模型和热负荷模型;然后采用结合了双Q网络和深度确定性策略梯度的优先经验采样的双延迟深度确定性策略梯度(TD3-PER)算法,建立考虑空调系统能耗与车辆运行需求的能量管理策略。在NEDC典型工况下进行仿真得出:TD3-PER能量管理策略下的空调系统能够使舱温在100s内迅速达到并维持在22~26℃的舒适范围内,满足制冷/制热的同时又保证车舱温度舒适,验证了考虑空调系统时TD3-PER能量管理策略的可行性;在空调系统制冷/制热时,相比传统的深度确定性策略梯度(DDPG)算法策略,基于TD3-PER算法策略的功率分配情况能够延长燃料电池和蓄电池使用寿命,且在制冷/制热时根据氢耗量分别可提高2.59和3.58个百分点的经济性,验证了基于TD3-PER算法能量管理策略在降低氢耗量、提高整车经济性方面相较于传统算法更具优势。
关键词
双能源燃料电池汽车
空调系统
能量管理策略
TD3-PER
DDPG
Keywords
dual-energy fuel cell vehicle
air conditioning system
energy management strategy
TD3-PER
DDPG
分类号
U469.72 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
时变多参数不确定性下室内环境的节能控制
4
作者
赵建豪
宋华
南新元
蔡鑫
机构
中国石油独山子石化分公司聚烯烃一部
新疆大学电气工程学院
新疆建筑设计研究院
出处
《河北科技大学学报》
CAS
北大核心
2024年第6期597-608,共12页
基金
国家自然科学基金(52065064,62303394)
新疆维吾尔自治区自然科学基金(2022D01C694)。
文摘
为解决当前室内环境受多种时变参数影响不确定性较大,且现有控制设备无法根据室内环境对工作功率进行自适应调节造成的能源浪费问题,采用在深度确定性策略梯度(deep deterministic policy gradient,DDPG)中融入优先经验重放(prioritized experience replay,PER)的方法,合理优化控制设备功率,对室内空气质量(indoor air quality,IAQ)和热舒适度进行控制。结果表明:DDPG-PER算法能够在冬夏两季不同室外空气质量条件下,结合多时变参数,将室内环境控制在要求范围之内;与定风量控制系统相比,能源成本降低了13.30%,用户全年可节约2000元左右电费。研究结果对中国“碳中和”策略和绿色低碳建筑行业的发展具有一定的参考价值。
关键词
环境质量监测与评价
强化学习
深度确定性策略梯度
优先经验重放
节能控制
Keywords
environmental quality monitoring and assessment
reinforcement learn
DDPG
PER
energy saving control
分类号
TP393 [自动化与计算机技术—计算机应用技术]
X510.2 [环境科学与工程—环境工程]
在线阅读
下载PDF
职称材料
题名
车用电机定子电流新型优化控制方法
5
作者
周雅夫
王翰涛
连静
机构
大连理工大学运载工程与力学学部汽车工程学院
出处
《机械设计与制造》
北大核心
2023年第3期230-233,238,共5页
基金
大连市科技创新基金项目(2018J12GX061)。
文摘
为了实现交直轴电流最优匹配控制,提出了一种基于深度确定性策略梯度的车用电机定子电流优化控制方法。在不对交直轴耦合项电压进行补偿解耦的情况下实现IPMSM交直轴电流的最优匹配控制。实验分析表明基于DDPG的定子电流优化控制方法在优化交直轴电流匹配和最大转矩电流比控制方面优势显著。相比较传统的前馈补偿解耦(FFCDC)方法实现MTPA控制,同等定子电流产生转矩输出平均高出最高14%,实验验证进一步证明了DDPG具有优化交直轴电流最佳匹配和产生最大转矩输出的能力,验证了该方法的有效性。
关键词
内置式永磁同步电机
最大转矩电流比
深度确定性策略梯度
交直轴电流最优匹配
定子电流优化控制
Keywords
Interior Permanent Magnet Synchronous Motor(IPMSM)
Maximum Torque Per Ampere(MTPA)
Deep Deterministic Policy Gradient(DDPG)
Optimal Matching of D-Q Axis Current
Stator Current Optimization Control
分类号
TH16 [机械工程—机械制造及自动化]
TP29 [自动化与计算机技术—检测技术与自动化装置]
U463.233 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
基于PER-PDDPG的无人机路径规划研究
被引量:
4
6
作者
乔哲
黎思利
王景志
符小卫
机构
西北工业大学电子信息学院
航空工业沈阳飞机设计研究所体系部
出处
《无人系统技术》
2022年第6期12-23,共12页
基金
航空科学基金(2020Z023053001)。
文摘
针对未知复杂环境下的多无人机路径规划问题,提出了一种基于优先经验回放的并行深度确定性策略梯度(PER-PDDPG)算法。首先,该算法在传统深度强化学习算法和匈牙利算法的基础上,结合了优先经验回放机制与多智能体经验共享的特点,提高了经验的获取效率,并使高价值经验能够被更加充分的多次利用。其次,算法将针对单无人机的PER-DDPG算法并行拓展到多无人机中,使得算法的网络结构相对于传统多智能体强化学习算法更加简洁高效。仿真结果表明,该方法可以灵活应用于不同数量的无人机群中,并且相较于传统的多智能体强化学习算法拥有更快的收敛速度以及更高的收敛奖励均值,有效提升了在未知复杂环境下的多无人机路径规划效果。
关键词
无人机
路径规划
深度强化学习
并行DDPG
优先经验回放
Keywords
UAV
Path Planning
Deep Reinforcement Learning
Parallel DDPG
PER
分类号
V279 [航空宇航科学与技术—飞行器设计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于PER-DDPG算法的城市轨道交通越区切换研究
张军平
王小鹏
王冶力
《山西电子技术》
2024
0
在线阅读
下载PDF
职称材料
2
基于DDPG-PER的智慧楼宇云边任务调度策略
杨萍
赵俊睿
《自动化与仪表》
2026
0
在线阅读
下载PDF
职称材料
3
考虑空调系统的燃料电池汽车能量管理策略
赵又群
徐周
虞志浩
林棻
何鲲鹏
尤庆伸
《华南理工大学学报(自然科学版)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
4
时变多参数不确定性下室内环境的节能控制
赵建豪
宋华
南新元
蔡鑫
《河北科技大学学报》
CAS
北大核心
2024
0
在线阅读
下载PDF
职称材料
5
车用电机定子电流新型优化控制方法
周雅夫
王翰涛
连静
《机械设计与制造》
北大核心
2023
0
在线阅读
下载PDF
职称材料
6
基于PER-PDDPG的无人机路径规划研究
乔哲
黎思利
王景志
符小卫
《无人系统技术》
2022
4
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部