期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
融入SAC算法的光储微网混合储能自驱优级联自抗扰控制
1
作者 周雪松 张宇轩 +3 位作者 马幼捷 王馨悦 陶珑 问虎龙 《电力系统保护与控制》 北大核心 2025年第13期93-104,共12页
母线电压稳定是实现新能源高水平消纳的重要前提。针对光储直流微电网混合储能系统因源荷不确定性扰动导致的母线电压波动问题,提出一种融入深度强化学习柔性动作评价(soft actor-critic, SAC)算法的自驱优级联自抗扰控制策略。首先,设... 母线电压稳定是实现新能源高水平消纳的重要前提。针对光储直流微电网混合储能系统因源荷不确定性扰动导致的母线电压波动问题,提出一种融入深度强化学习柔性动作评价(soft actor-critic, SAC)算法的自驱优级联自抗扰控制策略。首先,设计了级联扩张状态观测器来实时估计和补偿系统中的不确定性扰动,以提升系统的扰动估计精度。其次,针对系统建立了马尔可夫决策模型,并设计了状态奖励与信息熵综合评估的SAC智能体,融入控制器参数优化中。通过其在线学习和经验回放实现了控制参数的自驱优整定,进一步提高了系统的抗扰性和鲁棒性。最后,通过仿真实验对比了3种控制策略在典型工况下的控制性能,验证了所提策略的有效性和优越性。 展开更多
关键词 光储直流微电网 混合储能 自抗扰控制 深度强化学习 sac算法
在线阅读 下载PDF
未知环境下基于突变定位SAC算法的移动机器人路径规划
2
作者 胡立坤 韦春有 《计算机应用研究》 北大核心 2025年第2期455-461,共7页
针对缺乏完整环境信息的条件下移动机器人局部路径规划算法性能提升及深度强化学习智能体训练速度慢的问题,提出了突变定位算法和改进的soft actor-critic(SAC)算法,并将两者结合为突变定位SAC算法。突变定位算法能够在缺乏完备环境信... 针对缺乏完整环境信息的条件下移动机器人局部路径规划算法性能提升及深度强化学习智能体训练速度慢的问题,提出了突变定位算法和改进的soft actor-critic(SAC)算法,并将两者结合为突变定位SAC算法。突变定位算法能够在缺乏完备环境信息的情况下计算子目标点位置,减少移动机器人规划路径的长度。同时,通过引入基于虚拟势场的critic网络改进损失函数和多阶段训练方法,提高SAC智能体的训练速度。实验结果表明,与DDPG、SAC、PER-SAC和HER-TD3相比,突变定位SAC算法在训练时间上分别减少了46.68%、39.50%、20.18%和27.79%。此外,突变定位SAC算法在不同环境下规划路径的长度平均减少了13.71%、10.26%、10.90%和15.89%。 展开更多
关键词 移动机器人 路径规划 深度强化学习算法 sac算法 激光雷达 未知环境
在线阅读 下载PDF
一种基于改进SAC算法的六轴机械臂路径规划
3
作者 妥吉英 徐笑南 +4 位作者 李俊 张玉琛 黄安 胡都 刘梓林 《中国机械工程》 北大核心 2025年第12期2986-2992,共7页
为提升柔性动作-评价(SAC)算法的收敛速度及训练的稳定性,在引入优势函数与奖励聚中机制的基础上,提出一种改进SAC算法。为验证改进SAC算法的训练效果,在六轴机械臂路径规划场景中进行了仿真分析,并与深度确定性策略梯度(DDPG)算法、双... 为提升柔性动作-评价(SAC)算法的收敛速度及训练的稳定性,在引入优势函数与奖励聚中机制的基础上,提出一种改进SAC算法。为验证改进SAC算法的训练效果,在六轴机械臂路径规划场景中进行了仿真分析,并与深度确定性策略梯度(DDPG)算法、双延迟深度确定性策略梯度(TD3)算法及SAC算法进行对比。结果显示,改进SAC算法在收敛速度和稳定性上均超越DDPG、TD3与SAC算法,训练1500回合后其路径规划成功率较SAC算法提高4.8%。进一步的实验验证了改进SAC算法的规划结果在真实环境中的可行性与有效性。 展开更多
关键词 六轴机械臂 路径规划 优势函数 奖励聚中 改进sac算法
在线阅读 下载PDF
基于SAC算法的露天煤矿无人驾驶运输车辆避障控制研究 被引量:2
4
作者 宋佳琛 韩硕 +1 位作者 田文明 辛守辉 《煤矿机械》 2025年第2期213-217,共5页
大部分无人驾驶车辆避障控制过程只适用于动作空间和状态空间维度较低的环境,易导致避障控制形成的运动路径过长。针对这一问题,提出了基于Soft Actor-Critic(SAC)算法的露天煤矿无人驾驶运输车辆避障控制方法。建立包含1个演员网络、2... 大部分无人驾驶车辆避障控制过程只适用于动作空间和状态空间维度较低的环境,易导致避障控制形成的运动路径过长。针对这一问题,提出了基于Soft Actor-Critic(SAC)算法的露天煤矿无人驾驶运输车辆避障控制方法。建立包含1个演员网络、2个评论家目标网络和2个评论家网络的SAC深度学习网络框架。通过SAC算法的迭代更新,对环境地图中的智能体进行不断训练,规划出最优避障路径。通过模糊PID控制器执行控制指令,实现无人驾驶运输车辆避障安全行驶控制。实验结果表明,该方法形成的车辆避障运动路径长度始终不超过60 m,显著提升了复杂环境中运输车辆的工作性能。 展开更多
关键词 sac算法 露天煤矿 无人驾驶车辆 局部地图 避障路径 避障控制
原文传递
基于PID-Lagrange-SAC的深度强化学习楼宇建筑用能行为调控策略
5
作者 凌䶮飞 陈涛 高赐威 《电力需求侧管理》 2025年第5期90-96,共7页
楼宇建筑的用能行为有着巨大的调节潜力,为解决此问题提出了一种基于PID-Lagrange-SAC算法的调控方法。首先,将楼宇建筑用能行为调控问题建模为马尔科夫决策过程(markov decision process,MDP)模型,将可调控设备的状态及外部变量建立为... 楼宇建筑的用能行为有着巨大的调节潜力,为解决此问题提出了一种基于PID-Lagrange-SAC算法的调控方法。首先,将楼宇建筑用能行为调控问题建模为马尔科夫决策过程(markov decision process,MDP)模型,将可调控设备的状态及外部变量建立为状态空间,可调控设备的运行功率作为决策变量,设计恰当的奖励函数以指导智能体学习较好的动作策略。为了抑制智能体违反约束条件的行为,进一步将问题建立为带约束项的马尔科夫决策过程(constrained MDP,CMDP),并将PID控制与Lagrange方法结合应用于Soft actor-critic算法进行训练。算例分析表明,最终得到的调控策略在满足用户舒适度的同时降低了楼宇建筑的运行成本及碳排放,验证了所提方法的有效性及优越性。 展开更多
关键词 楼宇建筑 用能行为调控 深度强化学习 带约束项的马尔科夫决策过程 马尔科夫决策过程算法
在线阅读 下载PDF
基于SAC算法的无人机路径规划与视频QoE研究
6
作者 刘利民 李晋峰 康云鹏 《长江信息通信》 2025年第9期198-201,210,共5页
随着无人机(UAV)技术的发展,凭借其高灵活性和快速部署能力,已成为灾后救援场景中不可或缺的工具。针对灾区复杂环境下的通信和能耗优化问题,该研究提出了一种结合动态自适应流媒体编码(DASH)技术和Soft Actor-Critic(SAC)算法的解决方... 随着无人机(UAV)技术的发展,凭借其高灵活性和快速部署能力,已成为灾后救援场景中不可或缺的工具。针对灾区复杂环境下的通信和能耗优化问题,该研究提出了一种结合动态自适应流媒体编码(DASH)技术和Soft Actor-Critic(SAC)算法的解决方案。通过联合优化视频编码参数、飞行策略及带宽资源分配,以实现在保证用户视频视频体验质量(QoE)的同时,尽可能降低UAV能耗,从而提高系统效益。仿真实验表明,相较于传统深度强化学习(DRL)算法(如DDPG、PPO),该文提出的SAC算法在收敛速度、奖励值及稳定性等方面均具有显著优势。 展开更多
关键词 无人机 深度强化学习 灾后救援 sac算法 路径规划
在线阅读 下载PDF
AoI约束下基于SAC算法的无人机路径规划
7
作者 朱庆亮 郭志坚 王奇 《仪表技术》 2025年第3期73-77,共5页
无人机因其高灵活性和广覆盖能力,被广泛应用于动态场景下的信息采集。然而,现有研究多集中于静态设备场景,忽视了高移动性节点环境下的信息新鲜度(age of information, AoI)优化问题,同时无人机的有限能量限制了其在实际应用的有效性... 无人机因其高灵活性和广覆盖能力,被广泛应用于动态场景下的信息采集。然而,现有研究多集中于静态设备场景,忽视了高移动性节点环境下的信息新鲜度(age of information, AoI)优化问题,同时无人机的有限能量限制了其在实际应用的有效性。针对无人机辅助的车辆信息采集场景,提出一种基于柔性演员-评论家(soft actor-critic, SAC)算法的路径规划方法,通过优化无人机的飞行策略,平衡AoI和能效约束,引入最大熵深度强化学习框架,结合双Q网络结构和经验回放机制,在连续动作空间中实现了高效的策略学习。反复实验表明,该方法在收敛速度、奖励值和系统鲁棒性上显著优于传统强化学习算法(如DDPG和PPO),同时在复杂动态环境下有效提升了信息新鲜度和能量利用效率。 展开更多
关键词 无人机 深度强化学习 信息新鲜度 柔性演员-评论家算法 路径优化
原文传递
基于SAC-IA和改进ICP算法的点云配准技术 被引量:50
8
作者 陈学伟 朱耀麟 +1 位作者 武桐 王祖全 《西安工程大学学报》 CAS 2017年第3期395-401,共7页
点云配准是真实三维世界物体或场景模型重建的关键问题之一.针对传统的ICP算法收敛速度慢,且在两点云集初始位置较大时易陷入局部最优解的问题,提出一种改进的点云配准算法.该算法首先利用基于特征点的采样一致性初始配准算法(SAC-IA)... 点云配准是真实三维世界物体或场景模型重建的关键问题之一.针对传统的ICP算法收敛速度慢,且在两点云集初始位置较大时易陷入局部最优解的问题,提出一种改进的点云配准算法.该算法首先利用基于特征点的采样一致性初始配准算法(SAC-IA)实现两点云的初始变换,使两点云集有相对较好的初始位姿,然后在传统ICP算法基础上使用k-d树(k-dimensional tree)加速对应点对的查找速度,并利用方向向量阈值去除错误点对.实验证明该算法具有相对较好的配准精度和收敛速度. 展开更多
关键词 点云配准 ICP算法 sac-IA 方向向量阈值
在线阅读 下载PDF
基于ASP-SAC算法的列车自动驾驶速度控制 被引量:5
9
作者 刘伯鸿 卢田 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第7期2637-2648,共12页
随着经济建设的绿色转型以及人工智能的快速发展,城市轨道交通已成为居民日常出行的重要方式,在保障安全性、高效性和准点性的前提下,列车运行的节能性和舒适性需求也越来越被关注。合理的运行策略能够有效实现多种目标需求下的列车自... 随着经济建设的绿色转型以及人工智能的快速发展,城市轨道交通已成为居民日常出行的重要方式,在保障安全性、高效性和准点性的前提下,列车运行的节能性和舒适性需求也越来越被关注。合理的运行策略能够有效实现多种目标需求下的列车自动驾驶速度控制,强化学习作为一种智能决策方法,能够有效解决这一控制问题。首先,通过综合分析技术、安全性和乘客体验等方面的因素,基于专家经验动作划分和状态信息熵将软演员-评论家(SAC)改进为动作状态经验优先软演员-评论家(ASP-SAC)方法,用于研究列车自动驾驶速度控制问题。其次,将问题马尔可夫形式化,搭建了列车运行环境,确定了状态空间、动作空间以及基于目标控制的奖励函数。最后,以北京地铁亦庄线的一段区间数据为例进行试验,对ASP-SAC方法进行验证并与其他一些算法在相同环境下进行性能优劣比较。研究结果表明:该方法对于多目标控制需求下的列车自动驾驶速度控制问题具有可行性,与未改进前相比算法效率提高22.73%,与PPO算法相比提高29.17%,改进效果良好。同时,列车运行时在安全性、舒适性无误的情况下,准时性、精确性和节能性都强于SAC、DQN、PPO以及PID算法,其中能耗分别减少3.64%、5.62%、4.38%、7.35%,控制效果良好。此外,该方法亦具备鲁棒性,在列车自动驾驶速度控制方面具有一定的优越性和可参考性。 展开更多
关键词 列车自动驾驶 多目标控制 强化学习 ASP-sac算法 速度控制
在线阅读 下载PDF
基于SAC强化学习的车联网频谱资源动态分配 被引量:11
10
作者 黄煜梵 彭诺蘅 +3 位作者 林艳 范建存 张一晋 余妍秋 《计算机工程》 CAS CSCD 北大核心 2021年第9期34-43,共10页
针对车联网频谱资源稀缺问题,提出一种基于柔性致动-评价(SAC)强化学习算法的多智能体频谱资源动态分配方案。以最大化信道总容量与载荷成功交付率为目标,建立车辆-车辆(V2V)链路频谱资源分配模型。将每条V2V链路作为单个智能体,构建多... 针对车联网频谱资源稀缺问题,提出一种基于柔性致动-评价(SAC)强化学习算法的多智能体频谱资源动态分配方案。以最大化信道总容量与载荷成功交付率为目标,建立车辆-车辆(V2V)链路频谱资源分配模型。将每条V2V链路作为单个智能体,构建多智能体马尔科夫决策过程模型。利用SAC强化学习算法设计神经网络,通过最大化熵与累计奖励和以训练智能体,使得V2V链路经过不断学习优化频谱资源分配。仿真结果表明,与基于深度Q网络和深度确定性策略梯度的频谱资源分配方案相比,该方案可以更高效地完成车联网链路之间的频谱共享任务,且信道传输速率和载荷成功交付率更高。 展开更多
关键词 车联网 资源分配 多智能体强化学习 柔性致动-评价算法 频谱分配
在线阅读 下载PDF
基于路径模仿和SAC强化学习的机械臂路径规划算法 被引量:2
11
作者 宋紫阳 李军怀 +2 位作者 王怀军 苏鑫 于蕾 《计算机应用》 CSCD 北大核心 2024年第2期439-444,共6页
在机械臂路径规划算法的训练过程中,由于动作空间和状态空间巨大导致奖励稀疏,机械臂路径规划训练效率低,面对海量的状态数和动作数较难评估状态价值和动作价值。针对上述问题,提出一种基于SAC(Soft Actor-Critic)强化学习的机械臂路径... 在机械臂路径规划算法的训练过程中,由于动作空间和状态空间巨大导致奖励稀疏,机械臂路径规划训练效率低,面对海量的状态数和动作数较难评估状态价值和动作价值。针对上述问题,提出一种基于SAC(Soft Actor-Critic)强化学习的机械臂路径规划算法。通过将示教路径融入奖励函数使机械臂在强化学习过程中对示教路径进行模仿以提高学习效率,并采用SAC算法使机械臂路径规划算法的训练更快、稳定性更好。基于所提算法和深度确定性策略梯度(DDPG)算法分别规划10条路径,所提算法和DDPG算法规划的路径与参考路径的平均距离分别是0.8 cm和1.9 cm。实验结果表明,路径模仿机制能提高训练效率,所提算法比DDPG算法能更好地探索环境,使得规划路径更加合理。 展开更多
关键词 模仿学习 强化学习 sac算法 路径规划 奖励函数
在线阅读 下载PDF
基于改进SAC算法的移动机器人路径规划 被引量:14
12
作者 李永迪 李彩虹 +1 位作者 张耀玉 张国胜 《计算机应用》 CSCD 北大核心 2023年第2期654-660,共7页
为解决SAC算法在移动机器人局部路径规划中训练时间长、收敛速度慢等问题,通过引入优先级经验回放(PER)技术,提出了PER-SAC算法。首先从等概率从经验池中随机抽取样本变为按优先级抽取,使网络优先训练误差较大的样本,从而提高了机器人... 为解决SAC算法在移动机器人局部路径规划中训练时间长、收敛速度慢等问题,通过引入优先级经验回放(PER)技术,提出了PER-SAC算法。首先从等概率从经验池中随机抽取样本变为按优先级抽取,使网络优先训练误差较大的样本,从而提高了机器人训练过程的收敛速度和稳定性;其次优化时序差分(TD)误差的计算,以降低训练偏差;然后利用迁移学习,使机器人从简单环境到复杂环境逐步训练,从而提高训练速度;另外,设计了改进的奖励函数,增加机器人的内在奖励,从而解决了环境奖励稀疏的问题;最后在ROS平台上进行仿真测试。仿真结果表明,在不同的障碍物环境中,PER-SAC算法均比原始算法收敛速度更快、规划的路径长度更短,并且PER-SAC算法能够减少训练时间,在路径规划性能上明显优于原始算法。 展开更多
关键词 移动机器人 局部路径规划 sac算法 优先级经验回放 ROS平台
在线阅读 下载PDF
融合注意力机制与SAC算法的虚拟电厂多能流低碳调度 被引量:8
13
作者 俞晓荣 徐青山 +1 位作者 杜璞良 王冬 《电力工程技术》 北大核心 2024年第5期233-246,共14页
虚拟电厂(virtual power plant,VPP)作为多能流互联的综合能源网络,已成为中国加速实现双碳目标的重要角色。但VPP内部资源协同低碳调度面临多能流的耦合程度紧密、传统碳交易模型参数主观性强、含高维动态参数的优化目标在线求解困难... 虚拟电厂(virtual power plant,VPP)作为多能流互联的综合能源网络,已成为中国加速实现双碳目标的重要角色。但VPP内部资源协同低碳调度面临多能流的耦合程度紧密、传统碳交易模型参数主观性强、含高维动态参数的优化目标在线求解困难等问题。针对这些问题,文中提出一种融合注意力机制(attention mechanism,AM)与柔性动作评价(soft actor-critic,SAC)算法的VPP多能流低碳调度方法。首先,根据VPP的随机碳流特性,面向动态参数建立基于贝叶斯优化的改进阶梯型碳交易机制。接着,以经济效益和碳排放量为目标函数构建含氢VPP多能流解耦模型。然后,考虑到该模型具有高维非线性与权重参数实时更新的特征,利用融合AM的改进SAC深度强化学习算法在连续动作空间对模型进行求解。最后,对多能流调度结果进行仿真分析和对比实验,验证了文中方法的可行性及其相较于原SAC算法较高的决策准确性。 展开更多
关键词 虚拟电厂(VPP) 多能流 改进碳交易机制 深度强化学习 注意力机制(AM) 柔性动作评价(sac)算法
在线阅读 下载PDF
基于SAC算法的含柔性负荷电-气互联系统的频率与气压协调控制策略 被引量:3
14
作者 张磊光 陈海涛 杨军 《智慧电力》 北大核心 2024年第4期8-14,共7页
现今,电燃气系统在维持微电网稳定、经济、灵活运行方面发挥着重要作用。当其受到电力与天然气负荷扰动时,控制器需要协调微电网频率和天然气管道节点的燃气压力。为此,提出1种基于柔性动作评价(SAC)算法的电-气互联系统的频率-气压协... 现今,电燃气系统在维持微电网稳定、经济、灵活运行方面发挥着重要作用。当其受到电力与天然气负荷扰动时,控制器需要协调微电网频率和天然气管道节点的燃气压力。为此,提出1种基于柔性动作评价(SAC)算法的电-气互联系统的频率-气压协调控制策略。首先,在分析天然气管网及耦合设备运行特性的基础上,建立天然气输送动态模型。其次,基于可控负荷用户行为的随机性,建立了包括微型燃气轮机(MT),电转气(P2G)设备、可控负荷、分布式电源和负荷的微电网负载频率控制模型。此外,根据微电网频率与气压2个控制目标,设计了控制器的结构。最后,设置不同工况进行仿真,结果表明所提策略能协调系统的频率与气压。 展开更多
关键词 频率控制 微电网 电气耦合系统 sac算法 柔性负荷
在线阅读 下载PDF
基于SAC算法的工厂变电站储能设备控制方法 被引量:1
15
作者 叶志晖 丁男哲 +1 位作者 金文龙 王文娟 《自动化技术与应用》 2023年第7期34-38,共5页
传统方法控制工厂变电站储能设备时,易发生收敛过早、FHC值和放电深度最大值偏高以及储能设备使用寿命缩短的问题。提出基于SAC算法的工厂变电站储能设备控制方法,首先通过SAC算法对工厂变电站储能设备进行分析,通过充分利用训练样本,... 传统方法控制工厂变电站储能设备时,易发生收敛过早、FHC值和放电深度最大值偏高以及储能设备使用寿命缩短的问题。提出基于SAC算法的工厂变电站储能设备控制方法,首先通过SAC算法对工厂变电站储能设备进行分析,通过充分利用训练样本,获取储能设备的最优参数,然后分析计算光伏系统设备和储能设备的电压、功率等,最后结合两者共同控制出口,得到工厂变电站储能设备最优控制方法。实验表明方法能够有效地降低FHC值和放电深度最大值,延长储能设备的使用寿命。 展开更多
关键词 sac算法 储能设备 控制方法 极大熵原理
在线阅读 下载PDF
基于最近双经验SAC算法的无人分队控制研究 被引量:1
16
作者 李海川 阳周明 +2 位作者 王洋 崔新悦 王娜 《火力与指挥控制》 CSCD 北大核心 2023年第6期70-75,83,共7页
针对无人分队控制,如何进行行为决策以更好地完成任务,是当前无人驾驶的一个研究热点。基于SAC算法,提出最近双经验回放SAC算法模型。该模型主要从两方面入手:1)使用最近经验采样代替随机采样;2)使用双经验池代替单经验池。实验结果表明... 针对无人分队控制,如何进行行为决策以更好地完成任务,是当前无人驾驶的一个研究热点。基于SAC算法,提出最近双经验回放SAC算法模型。该模型主要从两方面入手:1)使用最近经验采样代替随机采样;2)使用双经验池代替单经验池。实验结果表明,改进后的SAC算法相比传统SAC算法,提升了学习效率与稳定性,降低了策略网络误差,使无人分队能有更高的任务成功率。 展开更多
关键词 深度强化学习 sac算法 最近双经验池回放 无人分队行为决策
在线阅读 下载PDF
基于SAC算法的多源信息融合机械臂控制方法 被引量:2
17
作者 权双璐 郭艳婕 +4 位作者 费逢宇 瑜熙敬 宋小云 辛顺恒 王超 《自动化应用》 2024年第5期52-54,共3页
融合多源传感器信息可实现机械臂的精准控制。提出了一种基于深度强化学习的多源信息融合控制方法,设计并搭建了可实现多源信息融合的机械臂控制实验平台,融合视觉、触觉、编码器3种模态信息,并选取学习效率较高的SAC算法实现机械臂自... 融合多源传感器信息可实现机械臂的精准控制。提出了一种基于深度强化学习的多源信息融合控制方法,设计并搭建了可实现多源信息融合的机械臂控制实验平台,融合视觉、触觉、编码器3种模态信息,并选取学习效率较高的SAC算法实现机械臂自主精准控制。在实验平台上,开展了3个由易到难的机械臂运动控制任务,以验证所提多源信息融合机械臂控制方案的有效性。 展开更多
关键词 机械臂 多源信息融合 深度强化学习 sac算法
在线阅读 下载PDF
基于SAC-IA和NDT融合的点云配准方法 被引量:36
18
作者 荆路 武斌 李先帅 《大地测量与地球动力学》 CSCD 北大核心 2021年第4期378-381,共4页
提出一种基于采样一致性初始配准(SAC-IA)和正态分布变换(NDT)配准融合的点云配准方法。首先计算出待配准点云和目标点云的快速点特征直方图(FPFH)特征;然后依据该特征,利用SAC-IA算法求出初始转换矩阵,完成初始配准;最后在初始配准的... 提出一种基于采样一致性初始配准(SAC-IA)和正态分布变换(NDT)配准融合的点云配准方法。首先计算出待配准点云和目标点云的快速点特征直方图(FPFH)特征;然后依据该特征,利用SAC-IA算法求出初始转换矩阵,完成初始配准;最后在初始配准的基础上,利用NDT算法对两片点云进行精配准。实验结果表明,该方法的配准精度显著优越于ICP算法,且配准效率也有所提升。 展开更多
关键词 点云配准 ICP算法 sac-IA NDT FPFH
在线阅读 下载PDF
基于改进SAC-IA算法的激光点云粗配准 被引量:19
19
作者 张晗 康国华 +2 位作者 张琪 张文豪 徐伟证 《航天控制》 CSCD 北大核心 2019年第5期67-74,共8页
针对传统采样一致性初始配准(SAC-IA)算法存在收敛速度慢与精度不高等问题,提出一种改进SAC-IA算法。该算法利用扫描角限定方法对特征点选取进行几何约束;配准后两站点云特征点的FPFH直方图差值、欧氏距离差值和几何斜率差值同时作为误... 针对传统采样一致性初始配准(SAC-IA)算法存在收敛速度慢与精度不高等问题,提出一种改进SAC-IA算法。该算法利用扫描角限定方法对特征点选取进行几何约束;配准后两站点云特征点的FPFH直方图差值、欧氏距离差值和几何斜率差值同时作为误差修正标准;当变换矩阵满足精配准初始角度和平移要求时才输出该矩阵。通过实验仿真:该算法有效解决样点共线和局部的问题,有效缩短了算法时间,效率提高1倍以上;提供给精配准初始角度精度在10-2量级,平移量精度提高3个数量级。 展开更多
关键词 点云粗配准 sac-IA算法 几何约束 误差修正 激光点云
原文传递
基于SAC和TD3的含电动汽车虚拟电厂调度策略 被引量:5
20
作者 陶力 杨夏喜 +3 位作者 顾金辉 魏兵兵 张琳 王嘉宁 《电气传动》 2023年第9期25-34,共10页
虚拟电厂(VPP)可以聚合分布式电源(DER)参与电力市场和辅助服务市场运行,为配电网和输电网提供管理和辅助服务,其运行和控制得到广泛关注。针对含电动汽车(EV)充电站的虚拟电厂,构建了基于柔性行动器-评判器(SAC)算法和双延迟深度确定... 虚拟电厂(VPP)可以聚合分布式电源(DER)参与电力市场和辅助服务市场运行,为配电网和输电网提供管理和辅助服务,其运行和控制得到广泛关注。针对含电动汽车(EV)充电站的虚拟电厂,构建了基于柔性行动器-评判器(SAC)算法和双延迟深度确定性策略梯度(TD3)算法的VPP与EV充电站主从博弈模型。通过训练主从博弈网络参数,计算博弈均衡时的策略和解。算例结果表明,上述模型训练完成后,可以有效地降低EV充电站运行费用以及平缓功率,基于SAC强化学习方法能够整合VPP内部DER,并引导电动汽车有序充电。在VPP作为价格接受者参与日前电力市场时,也能够给出优化的交易策略;当VPP与EV之间存在主从博弈时,EV用确定性策略算法可以降低充电成本,VPP用随机性策略算法则可以提高收益。 展开更多
关键词 虚拟电厂 sac算法 TD3算法 电动汽车 主从博弈 实时调度
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部