期刊文献+
共找到3,801篇文章
< 1 2 191 >
每页显示 20 50 100
融入SAC算法的光储微网混合储能自驱优级联自抗扰控制
1
作者 周雪松 张宇轩 +3 位作者 马幼捷 王馨悦 陶珑 问虎龙 《电力系统保护与控制》 北大核心 2025年第13期93-104,共12页
母线电压稳定是实现新能源高水平消纳的重要前提。针对光储直流微电网混合储能系统因源荷不确定性扰动导致的母线电压波动问题,提出一种融入深度强化学习柔性动作评价(soft actor-critic, SAC)算法的自驱优级联自抗扰控制策略。首先,设... 母线电压稳定是实现新能源高水平消纳的重要前提。针对光储直流微电网混合储能系统因源荷不确定性扰动导致的母线电压波动问题,提出一种融入深度强化学习柔性动作评价(soft actor-critic, SAC)算法的自驱优级联自抗扰控制策略。首先,设计了级联扩张状态观测器来实时估计和补偿系统中的不确定性扰动,以提升系统的扰动估计精度。其次,针对系统建立了马尔可夫决策模型,并设计了状态奖励与信息熵综合评估的SAC智能体,融入控制器参数优化中。通过其在线学习和经验回放实现了控制参数的自驱优整定,进一步提高了系统的抗扰性和鲁棒性。最后,通过仿真实验对比了3种控制策略在典型工况下的控制性能,验证了所提策略的有效性和优越性。 展开更多
关键词 光储直流微电网 混合储能 自抗扰控制 深度强化学习 sac算法
在线阅读 下载PDF
未知环境下基于突变定位SAC算法的移动机器人路径规划
2
作者 胡立坤 韦春有 《计算机应用研究》 北大核心 2025年第2期455-461,共7页
针对缺乏完整环境信息的条件下移动机器人局部路径规划算法性能提升及深度强化学习智能体训练速度慢的问题,提出了突变定位算法和改进的soft actor-critic(SAC)算法,并将两者结合为突变定位SAC算法。突变定位算法能够在缺乏完备环境信... 针对缺乏完整环境信息的条件下移动机器人局部路径规划算法性能提升及深度强化学习智能体训练速度慢的问题,提出了突变定位算法和改进的soft actor-critic(SAC)算法,并将两者结合为突变定位SAC算法。突变定位算法能够在缺乏完备环境信息的情况下计算子目标点位置,减少移动机器人规划路径的长度。同时,通过引入基于虚拟势场的critic网络改进损失函数和多阶段训练方法,提高SAC智能体的训练速度。实验结果表明,与DDPG、SAC、PER-SAC和HER-TD3相比,突变定位SAC算法在训练时间上分别减少了46.68%、39.50%、20.18%和27.79%。此外,突变定位SAC算法在不同环境下规划路径的长度平均减少了13.71%、10.26%、10.90%和15.89%。 展开更多
关键词 移动机器人 路径规划 深度强化学习算法 sac算法 激光雷达 未知环境
在线阅读 下载PDF
基于SACS的大型余热发电机橇装设备吊装分析
3
作者 赵周林 张秀林 +1 位作者 邓记松 杨莹莹 《石油和化工设备》 2025年第8期146-151,共6页
随着海洋平台建造速度的加快,平台上更多系统模块需整橇供货,这些模块成橇后重量和体积较大,在制造、运输、平台安装过程中需多次吊装搬运,而吊装过程风险性最大,必须进行结构的强度校核。SACS软件是一款广泛应用于海洋工程结构分析的... 随着海洋平台建造速度的加快,平台上更多系统模块需整橇供货,这些模块成橇后重量和体积较大,在制造、运输、平台安装过程中需多次吊装搬运,而吊装过程风险性最大,必须进行结构的强度校核。SACS软件是一款广泛应用于海洋工程结构分析的有限元软件,在吊装计算中发挥了重要作用。本文运用SACS软件对某项目余热发电机橇的吊装过程进行分析计算,从结构模型、约束条件、荷载工况以及计算结果等方面进行阐述,为大型橇装设备的现场吊装提供计算依据。 展开更多
关键词 sacS软件 吊装分析 橇装设备 强度校核
在线阅读 下载PDF
冷却速度对高可靠性SAC-SBN合金及其焊点显微组织的影响
4
作者 夏梓淇 曹大力 +2 位作者 曹丽华 赵玲彦 杨娇娇 《金属热处理》 北大核心 2025年第2期218-225,共8页
为了优化汽车电子用高可靠性焊料SAC-SBN合金的焊接工艺,探讨了不同冷却速度对SAC-SBN焊料合金及其焊点微观组织的影响。结果表明,SAC-SBN合金中的组织随着冷却速度的降低而逐渐粗化。冷却速度为48℃/s条件下合金组织细化程度最佳,而冷... 为了优化汽车电子用高可靠性焊料SAC-SBN合金的焊接工艺,探讨了不同冷却速度对SAC-SBN焊料合金及其焊点微观组织的影响。结果表明,SAC-SBN合金中的组织随着冷却速度的降低而逐渐粗化。冷却速度为48℃/s条件下合金组织细化程度最佳,而冷却速度为0.13℃/s下合金中IMC发生粗化,且合金中Bi元素出现晶界偏析现象。与传统SAC305合金对比,在焊点界面处,SAC-SBN焊点的IMC晶粒数量多且尺寸小,这归因于Bi元素在界面晶界处的析出,其促进了(Cu,Ni)_(6)Sn_(5)的异质成核生长。冷却速度为48℃/s时,SAC-SBN焊点界面IMC层最薄,为1.96μm,但由于热膨胀系数差异导致界面处应力较大,界面IMC层出现孔洞。冷却速度为0.13℃/s时,焊点IMC层最厚,为3.18μm,且由于界面反应与熟化机制,合金Sn基体与IMC之间存在应力,导致界面处IMC层和焊料内部熟化长大的(Cu,Ni)_(6)Sn_(5)处均存在孔洞。冷却速度为1.33℃/s时,焊点组织细密,无明显缺陷。 展开更多
关键词 sac-SBN合金 冷却速度 金属间化合物 焊点 界面形貌
原文传递
SAC3D1在肝细胞癌中的高表达及其对预后和药敏性的影响
5
作者 黄庆玲 李建棣 +6 位作者 王磊 池邦藤 林茜 黄婉英 熊丹丹 何融泉 陈罡 《中国医药科学》 2025年第16期10-14,41,共6页
目的探讨含有SAC3结构域的蛋白1(SAC3D1)在肝细胞癌(HCC)中的表达水平及其与预后和药敏性的关系。方法免疫组织化学评估SAC3D1在HCC中的表达及其与临床参数的关系。单细胞RNA测序(scRNA-seq)分析SAC3D1在HCC单细胞的表达。整合GEO、TCG... 目的探讨含有SAC3结构域的蛋白1(SAC3D1)在肝细胞癌(HCC)中的表达水平及其与预后和药敏性的关系。方法免疫组织化学评估SAC3D1在HCC中的表达及其与临床参数的关系。单细胞RNA测序(scRNA-seq)分析SAC3D1在HCC单细胞的表达。整合GEO、TCGA等数据库的HCC数据评估SAC3D1 mRNA表达。单因素Cox分析及Kaplan-Meier预后分析评估SAC3D1对HCC生存的影响。药敏分析探索SAC3D1与抗HCC药物相关性。富集分析揭示SAC3D1促HCC的潜在通路。结果SAC3D1蛋白在HCC组织的表达水平高于正常肝组织,且与年龄、T分期和临床分期呈正相关(P<0.05)。scRNA-seq显示SAC3D1表达在上皮细胞。SAC3D1 mRNA在HCC中上调(标准化均数差为1.30,曲线下面积为0.90),其高表达与不良预后相关(风险比为2.17,95%CI=1.42~3.34,P<0.05)。药敏分析显示SAC3D1表达量与抗HCC药物的半数抑制浓度相关(|相关系数|>0.3,P<0.05)。SAC3D1相关基因富集于细胞周期相关通路。结论SAC3D1可能通过调控细胞周期促进HCC进展及抗肿瘤药物耐药。 展开更多
关键词 肝细胞癌 sac3D1 单细胞RNA测序 免疫组织化学
暂未订购
基于SAC算法的露天煤矿无人驾驶运输车辆避障控制研究 被引量:1
6
作者 宋佳琛 韩硕 +1 位作者 田文明 辛守辉 《煤矿机械》 2025年第2期213-217,共5页
大部分无人驾驶车辆避障控制过程只适用于动作空间和状态空间维度较低的环境,易导致避障控制形成的运动路径过长。针对这一问题,提出了基于Soft Actor-Critic(SAC)算法的露天煤矿无人驾驶运输车辆避障控制方法。建立包含1个演员网络、2... 大部分无人驾驶车辆避障控制过程只适用于动作空间和状态空间维度较低的环境,易导致避障控制形成的运动路径过长。针对这一问题,提出了基于Soft Actor-Critic(SAC)算法的露天煤矿无人驾驶运输车辆避障控制方法。建立包含1个演员网络、2个评论家目标网络和2个评论家网络的SAC深度学习网络框架。通过SAC算法的迭代更新,对环境地图中的智能体进行不断训练,规划出最优避障路径。通过模糊PID控制器执行控制指令,实现无人驾驶运输车辆避障安全行驶控制。实验结果表明,该方法形成的车辆避障运动路径长度始终不超过60 m,显著提升了复杂环境中运输车辆的工作性能。 展开更多
关键词 sac算法 露天煤矿 无人驾驶车辆 局部地图 避障路径 避障控制
原文传递
In ovo delivery of carvacrol triggers expression of chemotactic factors, antimicrobial peptides and pro-inflammatory pathways in the yolk sac of broiler chicken embryos 被引量:1
7
作者 Mila M.Y.Meijer Henry van den Brand +1 位作者 Shahram Niknafs Eugeni Roura 《Journal of Animal Science and Biotechnology》 2025年第2期883-894,共12页
Background Broiler chickens are most vulnerable immediately after hatching due to their immature immune systems,making them susceptible to infectious diseases.The yolk plays an important role in early immune defence b... Background Broiler chickens are most vulnerable immediately after hatching due to their immature immune systems,making them susceptible to infectious diseases.The yolk plays an important role in early immune defence by showing relevant antioxidant and passive immunity capabilities during broiler embryonic development.The immunomodulatory effects of phytogenic compound carvacrol have been widely reported.After in ovo delivery in the amniotic fluid during embryonic development carvacrol is known to migrate to the yolk sac.However,it is unknown whether carvacrol in the yolk could enhance defence responsiveness in the yolk sac.Therefore,the aim of this study was to improve early immune function in chicken embryos,and it was hypothesized that in ovo delivery of carvacrol would result in immunomodulatory effects in the yolk sac,potentially improving post-hatch resilience.Methods On embryonic day(E)17.5,either a saline(control)or carvacrol solution was injected into the amniotic fluid.Yolk sac tissue samples were collected at E19.5,and transcriptomic analyses using RNA sequencing were performed,following functional enrichment analyses comparing the control(saline)and carvacrol-injected groups.Results The results showed that 268 genes were upregulated and 174 downregulated in the carvacrol group compared to the control(P<0.05;logFC<-0.5 or log FC>0.5).Functional analyses of these differentially expressed genes,using KEGG,REACTOME,and Gene Ontology databases,showed enrichment of several immune-related pathways.This included the pathways‘Antimicrobial peptides’(P=0.001)and‘Chemoattractant activity’(P=0.004),amongst others.Moreover,the‘NOD-like receptor signaling’pathway was enriched(P=0.002).Antimicrobial peptides are part of the innate immune defence and are amongst the molecules produced after the nucleotide oligomeriza-tion domain(NOD)-like receptor pathway activation.While these responses may be associated with an inflammatory reaction to an exogenous threat,they could also indicate that in ovo delivery of carvacrol could prepare the newly hatched chick against bacterial pathogens by potentially promoting antimicrobial peptide production through acti-vation of NOD-like receptor signaling in the yolk sac.Conclusion In conclusion,these findings suggest that in ovo delivery of carvacrol has the potential to enhance anti-pathogenic and pro-inflammatory responses in the yolk sac via upregulation of antimicrobial peptides,and NOD-like receptor pathways. 展开更多
关键词 Antimicrobial peptides Broiler chicken CARVACROL Essential oils IMMUNOMODULATION In ovo Yolk sac
在线阅读 下载PDF
基于强化学习SAC的采煤机截割电机调速方法研究 被引量:1
8
作者 王宇 《山西焦煤科技》 2025年第2期17-20,共4页
为解决采煤机截割电机传统调速控制方法存在的无法适应煤层动态变化和突发情况频发的问题,研究不依赖模型和参数、未知环境探索能力更强的SAC算法并应用于采煤机截割电机调速系统。在分析SAC算法理论的基础上,阐述了SAC算法用于采煤机... 为解决采煤机截割电机传统调速控制方法存在的无法适应煤层动态变化和突发情况频发的问题,研究不依赖模型和参数、未知环境探索能力更强的SAC算法并应用于采煤机截割电机调速系统。在分析SAC算法理论的基础上,阐述了SAC算法用于采煤机截割电机调速的控制步骤、调速过程并完成仿真试验。结果表明,与传统模糊PID算法相比,SAC算法在转速跟踪、突加负载、突减负载工况时的超调量更小、调节时间更短,能够较好地适应采煤机截割电机实际运行工况。 展开更多
关键词 采煤机 截割电机 调速系统 sac算法
在线阅读 下载PDF
VRF与SAC融合的无人机蜂群分段智能轨迹规划方法
9
作者 陆璐 王鑫海 孟云鹤 《火箭军工程大学学报》 2025年第3期32-44,共13页
针对无人机蜂群机动过程中需兼顾较大搜索范围和高效到达目标点的问题,提出一种基于多目标评估的优化方法,以改善传统路径规划算法在无人机编队半径受限情况下的性能表现。通过设计多目标评估体系,从路径质量、编队稳定性、能量效率及... 针对无人机蜂群机动过程中需兼顾较大搜索范围和高效到达目标点的问题,提出一种基于多目标评估的优化方法,以改善传统路径规划算法在无人机编队半径受限情况下的性能表现。通过设计多目标评估体系,从路径质量、编队稳定性、能量效率及任务完成度4个方面,将路径规划分为虚拟刚体算法执行段和智能算法执行段。通过对比柔性动作-评价(soft actor-critic, SAC)算法与深度确定性策略梯度(deep deterministic policy gradient, DDPG)2种智能算法的训练效果,最终选取SAC算法来执行分段轨迹优化。仿真结果表明:以四旋翼无人机为例,所提出的融合了虚拟刚体编队(virtual rigid formation, VRF)算法与SAC算法的多段轨迹规划方法,在路径质量方面相比传统A*算法和DDPG算法分别提升了12.2%和5.8%,在能量效率方面分别提升了19.3%和6.5%,表明所提方法能够克服传统轨迹规划算法在大范围搜索下的局限性,实现了动态路径优化与评估性能的提升。 展开更多
关键词 无人机蜂群 虚拟刚体编队 sac算法 分段规划 多目标评估
原文传递
合金化对低银SAC107焊点组织及性能的影响
10
作者 万永康 严嘉祺 +3 位作者 王小京 王钦 李振远 孟智超 《集成技术》 2025年第5期97-106,共10页
为应对高可靠性电子封装的需求,需开发新型焊料合金。本研究以SAC107焊料为基体,添加Ni、Bi、In、Sb,通过相图计算方法设计一组合金体系。通过调控Bi与Sb的添加质量分数之比,系统研究170℃等温前后,焊点的力学性能及界面金属间化合物的... 为应对高可靠性电子封装的需求,需开发新型焊料合金。本研究以SAC107焊料为基体,添加Ni、Bi、In、Sb,通过相图计算方法设计一组合金体系。通过调控Bi与Sb的添加质量分数之比,系统研究170℃等温前后,焊点的力学性能及界面金属间化合物的生长行为,并确定最优添加比例。结果表明:适量添加Bi和Sb可有效抑制(Cu,Ni)_(6)(Sn,In,Sb)_(5)和(Cu,Ni)_(3)(Sn,In,Sb)相的过度生长;当Bi和Sb的质量分数之比为3∶3时,可实现焊点界面及内部颗粒析出的可控性,并可平衡焊点强度与塑性性能,为最优比例。 展开更多
关键词 合金化 相图计算 无铅焊点 sac107 金属间化合物
在线阅读 下载PDF
有机酸对SAC305焊锡膏焊接性能的影响 被引量:1
11
作者 付翀 李振阳 +2 位作者 李旭 肖冬 周小伟 《西安工程大学学报》 2025年第1期97-103,共7页
为探究单一有机酸和有机酸复配做活性剂对SAC305焊锡膏焊接润湿性的影响,采用热失重测试确定8种有机酸的分解温度,结合焊锡膏的回流焊接实验,以焊点形貌和铺展率为指标,对单一有机酸配制的焊锡膏的焊接润湿性进行研究,筛选出3种有机酸... 为探究单一有机酸和有机酸复配做活性剂对SAC305焊锡膏焊接润湿性的影响,采用热失重测试确定8种有机酸的分解温度,结合焊锡膏的回流焊接实验,以焊点形貌和铺展率为指标,对单一有机酸配制的焊锡膏的焊接润湿性进行研究,筛选出3种有机酸通过均匀配方设计进行复配,并通过SEM和EDS对焊点界面层进行分析。结果表明:单一有机酸A酸、B酸和水杨酸的焊点形貌饱满、基本无回缩,铺展率在82%以上;3种有机酸复配后焊点均饱满光亮且无回缩,铺展率进一步增大;当A酸、B酸和水杨酸的质量占比分别为43.6%、28.2%、28.2%时,铺展率达到最大值为87.82%,为最佳复配含量。有机酸复配比例对金属间化合物(IMC)层厚度和形态有显著影响,IMC层厚度最小为1.67μm,最大为2.39μm。在最佳复配含量时,IMC层较为平坦、连续且均匀。 展开更多
关键词 sac305焊锡膏 有机酸 铺展率 焊点形貌 金属间化合物(IMC)
在线阅读 下载PDF
基于PID-Lagrange-SAC的深度强化学习楼宇建筑用能行为调控策略
12
作者 凌䶮飞 陈涛 高赐威 《电力需求侧管理》 2025年第5期90-96,共7页
楼宇建筑的用能行为有着巨大的调节潜力,为解决此问题提出了一种基于PID-Lagrange-SAC算法的调控方法。首先,将楼宇建筑用能行为调控问题建模为马尔科夫决策过程(markov decision process,MDP)模型,将可调控设备的状态及外部变量建立为... 楼宇建筑的用能行为有着巨大的调节潜力,为解决此问题提出了一种基于PID-Lagrange-SAC算法的调控方法。首先,将楼宇建筑用能行为调控问题建模为马尔科夫决策过程(markov decision process,MDP)模型,将可调控设备的状态及外部变量建立为状态空间,可调控设备的运行功率作为决策变量,设计恰当的奖励函数以指导智能体学习较好的动作策略。为了抑制智能体违反约束条件的行为,进一步将问题建立为带约束项的马尔科夫决策过程(constrained MDP,CMDP),并将PID控制与Lagrange方法结合应用于Soft actor-critic算法进行训练。算例分析表明,最终得到的调控策略在满足用户舒适度的同时降低了楼宇建筑的运行成本及碳排放,验证了所提方法的有效性及优越性。 展开更多
关键词 楼宇建筑 用能行为调控 深度强化学习 带约束项的马尔科夫决策过程 马尔科夫决策过程算法
在线阅读 下载PDF
基于EFRE-SAC的无人机自主避障策略
13
作者 刘萌月 时宏伟 《计算机系统应用》 2025年第6期53-61,共9页
在无人机自主避障任务中,传统强化学习算法往往面临状态空间高维、信息稀疏以及探索效率低下等挑战.现有的SAC(soft Actor-Critic)算法虽然具备较强的稳定性和样本效率,但在复杂环境下的表现仍显不足.为此,本文提出了一种基于注意力机... 在无人机自主避障任务中,传统强化学习算法往往面临状态空间高维、信息稀疏以及探索效率低下等挑战.现有的SAC(soft Actor-Critic)算法虽然具备较强的稳定性和样本效率,但在复杂环境下的表现仍显不足.为此,本文提出了一种基于注意力机制SE和随机网络蒸馏RND模块改进的SAC算法,旨在提升无人机在三维地形环境中的自主避障能力.注意力机制SE通过自适应调整特征图的通道权重,增强了模型对重要信息的关注能力,从而提升了特征表达的有效性;而改进的RND网络则通过生成对抗目标,鼓励探索新环境,丰富了样本的多样性和改善了收集效率.基于上述的SE和RND,我们构建了一个增强特征表达和探索的SAC(EFRE-SAC)框架,使得无人机能够更有效地从深度图像中学习环境特征,并在三维环境中快速适应.在AirSim+UE4仿真平台的实验结果表明,所提出的改进方法显著提高了无人机的避障成功率和训练效率,验证了改进的SE和RND模块在强化学习任务中的有效性. 展开更多
关键词 无人机 避障 软行动者-评论家 随机网络蒸馏 注意力机制
在线阅读 下载PDF
中国科学院软件所智能博弈重点实验室研究团队荣获ACL 2025会议SAC Highlights奖
14
《信息网络安全》 北大核心 2025年第10期1642-1642,共1页
近日,中国科学院软件所智能博弈重点实验室研究团队的论文“Mimicking the Familiar:Dynamic Command Generation for Information Theft Attacks in LLM Tool-Learning System”被自然语言处理领域会议ACL 2025授予SAC Highlights奖。... 近日,中国科学院软件所智能博弈重点实验室研究团队的论文“Mimicking the Familiar:Dynamic Command Generation for Information Theft Attacks in LLM Tool-Learning System”被自然语言处理领域会议ACL 2025授予SAC Highlights奖。该研究揭示了大语言模型工具学习系统(LLM Tool-Learning System)存在的安全隐患,通过模拟攻击者工具投毒,分析造成的信息窃取风险并提出针对性防御方法,弥补了现有推理端安全检测方法的不足。论文主要完成人为特别研究助理江子攸、副研究员李明阳、研究员王俊杰和研究员王青。 展开更多
关键词 sac Highlights奖 ACL 2025
在线阅读 下载PDF
基于SAC算法的带落角约束的末制导律
15
作者 康冰冰 姜涛 +2 位作者 赵念 王晓宁 吴思 《战术导弹技术》 北大核心 2025年第2期121-129,共9页
为发挥强化学习算法在制导律设计中的优势,针对带落角约束的末制导问题,构建了基于柔性动作-评价(Soft Actor-Critic,SAC)算法的训练模型。根据期望导弹命中状态和降低收敛难度的原则,设计了奖励函数、状态参数。在训练中设定了不同的... 为发挥强化学习算法在制导律设计中的优势,针对带落角约束的末制导问题,构建了基于柔性动作-评价(Soft Actor-Critic,SAC)算法的训练模型。根据期望导弹命中状态和降低收敛难度的原则,设计了奖励函数、状态参数。在训练中设定了不同的初始条件并尝试不同的模型参数,得到了稳定的SAC制导律,经过仿真验证,SAC制导律能够以设定的落角命中固定目标。仿真结果表明,与最优制导律(Optimal Proportional Law,OPL)相比,SAC制导律需用加速度值更小,末时刻加速度接近零;SAC制导律的终端落角误差更小、收敛更快;SAC制导律的脱靶量更小,制导精度更高。 展开更多
关键词 sac算法 强化学习 落角约束 末制导律 最优制导律 偏置导引律 人工神经网络
原文传递
基于SAC算法的无人机路径规划与视频QoE研究
16
作者 刘利民 李晋峰 康云鹏 《长江信息通信》 2025年第9期198-201,210,共5页
随着无人机(UAV)技术的发展,凭借其高灵活性和快速部署能力,已成为灾后救援场景中不可或缺的工具。针对灾区复杂环境下的通信和能耗优化问题,该研究提出了一种结合动态自适应流媒体编码(DASH)技术和Soft Actor-Critic(SAC)算法的解决方... 随着无人机(UAV)技术的发展,凭借其高灵活性和快速部署能力,已成为灾后救援场景中不可或缺的工具。针对灾区复杂环境下的通信和能耗优化问题,该研究提出了一种结合动态自适应流媒体编码(DASH)技术和Soft Actor-Critic(SAC)算法的解决方案。通过联合优化视频编码参数、飞行策略及带宽资源分配,以实现在保证用户视频视频体验质量(QoE)的同时,尽可能降低UAV能耗,从而提高系统效益。仿真实验表明,相较于传统深度强化学习(DRL)算法(如DDPG、PPO),该文提出的SAC算法在收敛速度、奖励值及稳定性等方面均具有显著优势。 展开更多
关键词 无人机 深度强化学习 灾后救援 sac算法 路径规划
在线阅读 下载PDF
基于PRND-SAC强化学习的耙吸式挖泥船装舱系统控制
17
作者 张云飞 苏贞 王伟 《水运工程》 2025年第6期186-193,210,共9页
针对现有耙吸式挖泥船装舱控制过程人员依赖性强和效率低下的问题,融合优先经验回放(PER)和随机网络蒸馏(RND)技术,提出一种基于优先回放和随机网络蒸馏柔性动作评价(PRND-SAC)的强化学习控制算法,通过设计相应的状态空间、动作空间和... 针对现有耙吸式挖泥船装舱控制过程人员依赖性强和效率低下的问题,融合优先经验回放(PER)和随机网络蒸馏(RND)技术,提出一种基于优先回放和随机网络蒸馏柔性动作评价(PRND-SAC)的强化学习控制算法,通过设计相应的状态空间、动作空间和奖励函数,将PRND-SAC控制器与传统的SAC控制器进行对比,并基于全过程装舱阶段仿真环境将PRND-SAC控制器与实际疏浚数据进行对比试验。结果表明,设计的控制器能够快速且稳定地收敛;与传统的SAC控制器相比,所提出的PRND-SAC控制器不仅有效提高了控制过程的稳定性,还显著提升了装舱效率。 展开更多
关键词 强化学习 sac 随机网络蒸馏 耙吸式挖泥船 优先经验回放
在线阅读 下载PDF
基于SACS的海上风电大直径单桩复合承载能力数值分析
18
作者 章杞龙 李杨 +1 位作者 褚凯敏 梁英杰 《水电与新能源》 2025年第7期41-45,共5页
海上风电超大直径单桩基础受到上部结构自重的竖向荷载以及洋流和风浪等水平荷载的共同作用,导致桩基受荷性状复杂,增加了其设计难度。针对江苏省射阳某海上风电项目,基于SACS软件开展海上风电大直径单桩复合承载能力数值模拟,分析大直... 海上风电超大直径单桩基础受到上部结构自重的竖向荷载以及洋流和风浪等水平荷载的共同作用,导致桩基受荷性状复杂,增加了其设计难度。针对江苏省射阳某海上风电项目,基于SACS软件开展海上风电大直径单桩复合承载能力数值模拟,分析大直径单桩的轴力、剪力、弯矩以及挠度与桩基础高度的关系,为工程设计提供参考依据。 展开更多
关键词 海上风电 大直径单桩 sacS
在线阅读 下载PDF
Self-Adaptive LSAC-PID Approach Based on Lyapunov Reward Shaping for Mobile Robots
19
作者 YU Xinyi XU Siyu +1 位作者 FAN Yuehai OU Linlin 《Journal of Shanghai Jiaotong university(Science)》 2025年第6期1085-1102,共18页
In order to solve the control problem of multiple-input multiple-output(MIMO)systems in complex and variable control environments,a model-free adaptive LSAC-PID method based on deep reinforcement learning(RL)is propos... In order to solve the control problem of multiple-input multiple-output(MIMO)systems in complex and variable control environments,a model-free adaptive LSAC-PID method based on deep reinforcement learning(RL)is proposed in this paper for automatic control of mobile robots.According to the environmental feedback,the RL agent of the upper controller outputs the optimal parameters to the lower MIMO PID controllers,which can realize the real-time PID optimal control.First,a model-free adaptive MIMO PID hybrid control strategy is presented to realize real-time optimal tuning of control parameters in terms of soft-actor-critic(SAC)algorithm,which is state-of-the-art RL algorithm.Second,in order to improve the RL convergence speed and the control performance,a Lyapunov-based reward shaping method for off-policy RL algorithm is designed,and a self-adaptive LSAC-PID tuning approach with Lyapunov-based reward is then determined.Through the policy evaluation and policy improvement of the soft policy iteration,the convergence and optimality of the proposed LSAC-PID algorithm are proved mathematically.Finally,based on the proposed reward shaping method,the reward function is designed to improve the system stability for the line-following robot.The simulation and experiment results show that the proposed adaptive LSAC-PID approach has good control performance such as fast convergence speed,high generalization and high real-time performance,and achieves real-time optimal tuning of MIMO PID parameters without the system model and control loop decoupling. 展开更多
关键词 multiple-input multiple-output(MIMO) PID tuning reinforcement learning(RL) Lyapunov-based reward shaping soft actor-critic(sac) mobile robot
原文传递
上一页 1 2 191 下一页 到第
使用帮助 返回顶部