期刊文献+
共找到7,882篇文章
< 1 2 250 >
每页显示 20 50 100
基于TD3强化学习的光储微网双向DC-DC变换器自抗扰控制研究
1
作者 马幼捷 胡钰 +3 位作者 周雪松 闫凤祥 白鑫 陶珑 《太阳能学报》 北大核心 2026年第1期202-213,共12页
考虑到高比例新能源接入带来的不确定性问题会导致微电网直流母线电压的大幅波动难以平抑,该文提出一种基于双延迟深度确定性策略梯度算法(TD3)强化学习的双向DC-DC变换器的自抗扰控制策略。首先,利用线性扩张状态观测器进行系统重构来... 考虑到高比例新能源接入带来的不确定性问题会导致微电网直流母线电压的大幅波动难以平抑,该文提出一种基于双延迟深度确定性策略梯度算法(TD3)强化学习的双向DC-DC变换器的自抗扰控制策略。首先,利用线性扩张状态观测器进行系统重构来实现对总扰动的估计补偿,并就控制策略的跟踪性和抗扰性进行频域分析。接着,通过大量的仿真交互自学习获得观测器参数来智能调节神经网络的权值更新方式,优化奖励函数形式,并在线利用网络进行参数实时调度,使其充分训练以实现近似最优控制律。最后,利用数字仿真平台和小功率实验验证了在多工况下所提控制策略较双闭环PI控制和传统线性自抗扰控制具有更小的电压偏差及更快的响应速度等优越的动稳态性能,有效提升了直流母线电压的抗扰能力。 展开更多
关键词 双向DC-DC变换器 光储微电网 自抗扰控制 td3深度强化学习算法
原文传递
基于TD3算法的改进LADRC风电机组变桨控制研究
2
作者 岳有军 樊鹏博 赵辉 《现代电子技术》 北大核心 2026年第6期102-111,共10页
针对风力发电系统中因波动风速和复杂风况导致的传统变桨控制参数难以动态整定、输出功率波动大等问题,提出一种基于改进误差补偿的TD3-LADRC控制策略。该策略通过分析线性扩展状态观测器(LESO)的估计误差,并引入控制增益改进自抗扰控制... 针对风力发电系统中因波动风速和复杂风况导致的传统变桨控制参数难以动态整定、输出功率波动大等问题,提出一种基于改进误差补偿的TD3-LADRC控制策略。该策略通过分析线性扩展状态观测器(LESO)的估计误差,并引入控制增益改进自抗扰控制律,增强了风机系统的抗扰性。同时,采用双延迟深度确定性策略梯度(TD3)深度强化学习算法,对改进后的线性自抗扰控制(LADRC)观测器带宽和控制器带宽等关键参数进行动态优化,有效提升了风电机组的输出稳定性。通过Matlab/Simulink对2 MW风电机组进行建模,仿真结果表明,所提控制策略在阶跃风况和湍流风况下均能显著降低风机输出功率波动,验证了其有效性。 展开更多
关键词 风机系统 变桨距控制 td3算法 误差补偿 线性自抗扰控制 线性扩展状态观测器
在线阅读 下载PDF
Galectin-3抑制剂TD139对小鼠术后认知功能障碍及海马神经炎症和氧化应激的影响
3
作者 郑星星 任鸿权 +2 位作者 张耀国 陈欣 刘瑞霞 《现代生物医学进展》 2026年第4期481-491,共11页
目的探讨Galectin-3选择性抑制剂TD139对小鼠术后认知功能障碍及海马神经炎症和氧化应激的影响。方法C57BL/6J雄性小鼠,18-24月龄,体重22~26g,随机分为3组:Control+Vehicle组(仅接受异氟烷麻醉)、Surgery+Vehicle组(接受开腹探查手术并... 目的探讨Galectin-3选择性抑制剂TD139对小鼠术后认知功能障碍及海马神经炎症和氧化应激的影响。方法C57BL/6J雄性小鼠,18-24月龄,体重22~26g,随机分为3组:Control+Vehicle组(仅接受异氟烷麻醉)、Surgery+Vehicle组(接受开腹探查手术并给予生理盐水)和Surgery+TD139组(接受开腹探查手术并给予TD139)。Surgery+TD139组小鼠在术后第1、2、3天每日接受TD139经鼻给药(0.2mg/次)。使用Morris水迷宫实验评估小鼠术后认知功能,Western blot检测海马Galectin-3、TLR4、磷酸化NF-κB p65(p-NFκB p65)及总NF-κB p65蛋白表达水平,免疫荧光染色观察海马CA1区小胶质细胞活化情况,ELISA检测海马促炎因子白细胞介素-1β(Interleukin-1β,IL-1β)、肿瘤坏死因子-α(Tumor Necrosis Factor-α,TNF-α)和白细胞介素-6(Interleukin-6,IL-6)水平,并测定海马活性氧(Reactive Oxygen Species,ROS)、丙二醛(Malondialdehyde,MDA)和超氧化物歧化酶(Superoxide Dismutase,SOD)水平以评估氧化应激程度。结果(1)与Control+Vehicle组相比,Surgery+Vehicle组小鼠在Morris水迷宫测试中表现出显著的认知功能障碍,表现为逃离潜伏期延长(P<0.05),目标象限停留时间减少(P<0.05)和穿越平台次数减少(P<0.05);(2)Surgery+Vehicle组小鼠海马Galectin-3和TLR4蛋白表达显著上调(P<0.0001),Iba-1阳性小胶质细胞数量增加(P<0.0001),促炎因子IL-1β、TNF-α和IL-6水平升高(P<0.05),同时ROS和MDA含量增加(P<0.05),SOD活性降低(P<0.05);(3)与Surgery+Vehicle组相比,TD139治疗显著改善了小鼠的认知功能(P<0.05),抑制了Galectin-3和TLR4的表达以及NF-κB的活化(P<0.0001),减少了小胶质细胞的活化(P<0.0001)和促炎因子的释放(P<0.05),同时降低了ROS和MDA水平(P<0.05),提高了SOD活性(P<0.05)。结论Galectin-3抑制剂TD139可有效改善小鼠术后认知功能障碍,其机制可能与抑制Galectin-3/TLR4介导的NF-κB通路活化及后续的海马神经炎症和氧化应激密切相关。这一发现为POCD的预防和治疗提供了新的潜在靶点。 展开更多
关键词 td139 术后认知功能障碍 GALECTIN-3 TLR4 神经炎症 氧化应激
原文传递
基于AEA-ITD3-MMC算法的核电蒸汽系统性能优化
4
作者 董元发 张俊 +4 位作者 肖云龙 安友军 刘浩 张弦 郭鹏 《计算机集成制造系统》 北大核心 2026年第1期115-130,共16页
针对核电蒸汽系统的高维函数优化问题,传统进化算法存在精度差、收敛速度慢和极易陷入局部最优等问题。为此,通过结合传统进化算法和深度强化学习,提出了一种包含多机制协同和改进TD3(ITD3)的自适应进化算法(AEA-ITD3-MMC)。首先,引入... 针对核电蒸汽系统的高维函数优化问题,传统进化算法存在精度差、收敛速度慢和极易陷入局部最优等问题。为此,通过结合传统进化算法和深度强化学习,提出了一种包含多机制协同和改进TD3(ITD3)的自适应进化算法(AEA-ITD3-MMC)。首先,引入基于多机制协同的种群重构策略,以增强初始种群的质量;其次,采用平衡优选策略,增强算法的全局探索能力和局部开发能力;然后,通过对标准TD3算法进行改进,设计了针对单目标函数优化问题的状态空间、动作空间、决策变量更新策略和自适应终止条件等,极大地提升了标准TD3算法的局部搜索能力;最后,设计了子代种群的生成策略,以保持子代种群的收敛性和多样性。在数值实验中,首先利用CEC2014和CEC2017测试函数集对AEA-ITD3-MMC算法的改进算子进行有效性分析,论证了所有改进算子的有效性;然后通过与传统进化算法进行对比,证明了AEA-ITD3-MMC算法在整体性能上显著优于10种经典进化算法;最后将AEA-ITD3-MMC算法应用于某核电蒸汽系统的高维决策变量优化问题上,进一步论证了该算法在工程应用中的优越性。 展开更多
关键词 自适应进化算法 td3算法 高维函数优化 核电蒸汽系统性能优化
在线阅读 下载PDF
基于双经验回放池TD3算法的PID参数优化
5
作者 钟皓俊 王振雷 《控制理论与应用》 北大核心 2026年第1期139-148,共10页
PID控制器在工业控制领域应用广泛,其参数的选择过度依赖于人工经验,效率低且过程繁琐.近年来,深度强化学习因其具有对复杂环境自学习的能力,在很多领域取得了成功应用.本文提出一种基于双经验回放池双延迟深度确定性策略梯度(TD3)算法... PID控制器在工业控制领域应用广泛,其参数的选择过度依赖于人工经验,效率低且过程繁琐.近年来,深度强化学习因其具有对复杂环境自学习的能力,在很多领域取得了成功应用.本文提出一种基于双经验回放池双延迟深度确定性策略梯度(TD3)算法的PID参数优化方法,利用深度强化学习的方法,自主优化PID控制器的参数.在整个优化过程中,将控制问题视为序列决策过程,通过设计智能体的状态、动作空间以及网络结构,将PID参数的优化过程转化为强化学习策略网络权重的更新过程.同时,针对TD3算法训练前期探索效率低的问题,在TD3算法的基础上,增加双经验回放池机制,提升了算法训练前期的效率.最后,在二阶系统和一阶加纯时滞系统上进行仿真验证,并与基于粒子群优化(PSO)算法优化PID参数的方法进行对比,实验结果表明,所提算法优化得到的PID参数在控制器上体现的控制性能要优于PSO算法. 展开更多
关键词 PID参数优化 深度强化学习 td3
在线阅读 下载PDF
基于改进TD3的深度强化学习算法研究
6
作者 杨宇伟 李智 《电子制作》 2026年第3期53-58,共6页
针对TD3算法在高维状态空间、稀疏奖励环境及动态不确定性系统中存在的策略探索效率不足、收敛速度慢、对超参数敏感等问题,本文提出一种改进TD3算法。首先,设计经验优先级重评估机制,采用TD-error与状态价值双指标动态计算样本优先级,... 针对TD3算法在高维状态空间、稀疏奖励环境及动态不确定性系统中存在的策略探索效率不足、收敛速度慢、对超参数敏感等问题,本文提出一种改进TD3算法。首先,设计经验优先级重评估机制,采用TD-error与状态价值双指标动态计算样本优先级,避免智能体过度关注负面经验;其次,构建动态经验回放框架,通过质量评分对经验进行分类存储,并采用指数衰减函数动态调整优先池与探索池的采样概率,平衡策略学习与探索;最后,引入回合式延迟学习策略,将网络参数更新延迟至每回合结束时进行,基于长期收益优化策略稳定性。在MuJoCo平台的Pusher、Walker2d、Reacher和Hopper四个连续控制任务上的实验表明,改进后的TD3算法相比原始TD3算法在Pusher、Reacher环境中奖励值分别提升了11.6%、12.8%,有效提升了奖励值,具有较高的实用价值和应用潜力。 展开更多
关键词 强化学习 td3 优先级重评估 动态经验回放
在线阅读 下载PDF
TD2合金在长时氧化条件下的组织演变与稳定性
7
作者 彭文雅 赵春玲 +3 位作者 查小晖 王邓彪 王凯 何建 《中国冶金》 北大核心 2026年第1期130-138,共9页
TD2(Ti_(2)AlNb)合金以其“中密度、中温高强度”特性,成为航空发动机热端部件轻质耐高温的候选材料。然而,该部件在600~650℃环境中长期服役时,易出现O相粗化与氧化层剥落等组织劣化现象,严重制约其工程应用。为揭示该合金在长期高温... TD2(Ti_(2)AlNb)合金以其“中密度、中温高强度”特性,成为航空发动机热端部件轻质耐高温的候选材料。然而,该部件在600~650℃环境中长期服役时,易出现O相粗化与氧化层剥落等组织劣化现象,严重制约其工程应用。为揭示该合金在长期高温环境下的组织演变规律与稳定性机制,本研究对TD2合金在500、600及650℃下进行了25~3000 h的高温氧化试验。通过扫描电镜(SEM)量化氧化层厚度,结合高分辨透射电镜(HRTEM)分析相组成,并运用线性/抛物线氧化方程、Ostwald粗化模型及阿伦尼乌斯方程对相关机制进行解析。结果表明,经3000 h氧化后,500、600和650℃条件下的氧化层厚度分别为16.6、30.5和45.9μm,氧化动力学呈现“界面反应控制-扩散控制”两阶段特征。在650℃条件下,线性速率常数(kl)为0.30μm/h,抛物线速率常数(kp)为0.69μm^(2)/h,均显著高于500℃。在相演变方面,500℃时B2基体中析出纳米级O相且粗化缓慢;600℃以上则以O相粗化为主,未观察到明显新相析出。铌的扩散系数随温度升高呈指数增长,650℃时达到5.1×10^(-14) m^(2)/s,主导合金的相演变过程。组织稳定性评估显示,500℃下合金综合性能最优,氧化层无剥落且O相粗化缓慢;在650℃时氧化层出现明显剥落与微裂纹,稳定性显著下降。本研究明确了TD2合金在高温服役过程中的组织劣化机制,为热端部件的温度适配与寿命设计提供了科学依据。后续可通过成分优化或表面强化手段进一步提升其高温稳定性。 展开更多
关键词 td2合金 长时氧化 组织演变 析出相 稳定性
在线阅读 下载PDF
基于TDS在线监测的锅炉表面与底部排污协同智能控制策略
8
作者 段鹏飞 《能源与节能》 2026年第1期56-59,共4页
随着锅炉系统运行过程中水质变化对能效和设备稳定性的影响加剧,基于TDS(Total Dissolved Solids,溶解性总固体)在线监测的智能控制策略成为提升锅炉排污系统效率的关键。分析了七甸产业区的20 t/h燃气锅炉运行系统关键数据,研究了基于... 随着锅炉系统运行过程中水质变化对能效和设备稳定性的影响加剧,基于TDS(Total Dissolved Solids,溶解性总固体)在线监测的智能控制策略成为提升锅炉排污系统效率的关键。分析了七甸产业区的20 t/h燃气锅炉运行系统关键数据,研究了基于双PID(Proportional-Integral-Derivative,比例-积分-微分)并行控制算法、模糊逻辑补偿算法和大流量排污阀动态控制技术的协同智能控制策略,提出了一种多模态排污决策引擎。该引擎结合实时TDS数据和机器学习方法,动态优化排污策略,旨在提高水质稳定性并降低能源消耗。经过3个月的实证研究,验证了该策略在节能和水质控制方面的显著优势。 展开更多
关键词 tdS在线监测 智能控制 燃气锅炉 水质稳定性
在线阅读 下载PDF
基于TDS-OFDM的MIMO通感一体化波形设计与性能分析
9
作者 杜疆苏 张超 《实验技术与管理》 北大核心 2026年第1期205-210,共6页
为实现通信与感知功能在统一频谱资源下的高效融合,该文围绕通感一体化的应用需求,提出了一种基于TDS-OFDM的MIMO通感一体化波形设计方案,为TDS-OFDM结构引入伪噪声序列作为时域训练信号,并与Alamouti空时编码相结合,在不额外占用频谱... 为实现通信与感知功能在统一频谱资源下的高效融合,该文围绕通感一体化的应用需求,提出了一种基于TDS-OFDM的MIMO通感一体化波形设计方案,为TDS-OFDM结构引入伪噪声序列作为时域训练信号,并与Alamouti空时编码相结合,在不额外占用频谱资源的前提下,同时支持传输通信数据与提取感知参数。场景的通信部分采用卷积编码与正交相移键控调制,以提高系统的可靠性与抗噪声能力;感知部分基于PN序列的良好自相关特性,以估计到达时间、到达角度等参数。方案的接收端基于TDS-OFDM解调框架,完成同步、信道估计、均衡及空时解码,并在此基础上提取感知信息。仿真结果表明,该设计方案的波形在多径信道条件下能够有效降低误比特率,同时具备较好的时延与角度估计精度,在通信与感知融合的场景中具备可行性与有效性。 展开更多
关键词 通感一体化 时域同步正交频分复用 伪随机序列 多径抑制 仿真实验
在线阅读 下载PDF
基于TD的机载激光通信跟踪控制系统设计
10
作者 陈怡 俞建杰 +2 位作者 于丙文 王磊 邬佳杰 《计算机测量与控制》 2026年第1期86-93,共8页
机载激光通信系统限于机载平台的高机动性和运动的随机性,同时受到探测器检测误差、平台振动抑制残差和系统安装误差等影响,如何在大气环境中提高跟踪精度来提高通信质量是需要重点解决的问题之一;为了提高机载平台对发射端信号光的跟... 机载激光通信系统限于机载平台的高机动性和运动的随机性,同时受到探测器检测误差、平台振动抑制残差和系统安装误差等影响,如何在大气环境中提高跟踪精度来提高通信质量是需要重点解决的问题之一;为了提高机载平台对发射端信号光的跟踪精度,设计一种基于TD的机载激光通信跟踪控制系统;由主控模块、伺服系统、光学系统和图像处理单元组成跟踪控制系统;利用跟踪微分器加上传统PID控制器,将系统中的低频大幅扰动和大动态范围的跟踪补偿量进行过渡,经过PID控制器补偿控制时,在保证快速响应的前提下同时减小了超调,从而提高控制系统的跟踪精度;通过实验分析表明,设计的系统无干扰时拥有较好的鲁棒性,在有扰动的环境中能够将跟踪精度保持在5 mrad以内,可以保证机载激光通信系统进行稳定通信。 展开更多
关键词 机载激光通信 跟踪微分器 PID控制 跟踪控制 稳定通信
在线阅读 下载PDF
小分子药物TD-198946促进大鼠骨髓间充质干细胞的成骨分化 被引量:1
11
作者 杨超 罗宗平 《中国组织工程研究》 CAS 北大核心 2025年第13期2648-2654,共7页
背景:小分子药物TD-198946是一种能诱导干细胞形成软骨的高效软骨生成剂,但目前尚不清楚其对成骨分化的作用。目的:探讨小分子药物TD-198946促进大鼠骨髓间充质干细胞成骨分化的效果及其作用机制。方法:提取SD大鼠骨髓间充质干细胞,利用... 背景:小分子药物TD-198946是一种能诱导干细胞形成软骨的高效软骨生成剂,但目前尚不清楚其对成骨分化的作用。目的:探讨小分子药物TD-198946促进大鼠骨髓间充质干细胞成骨分化的效果及其作用机制。方法:提取SD大鼠骨髓间充质干细胞,利用CCK-8法评估不同浓度TD-198946对骨髓间充质干细胞增殖的影响,确定TD-198946的最佳使用浓度;然后加入最适浓度TD-198946和成骨分化培养基对骨髓间充质干细胞进行成骨诱导;成骨诱导第3天用qRT-PCR检测碱性磷酸酶、Runt相关转录因子2、骨桥蛋白、骨钙蛋白、Ⅰ型胶原基因表达;成骨诱导第7天进行碱性磷酸酶染色,Western blot检测Runt相关转录因子2、Ⅰ型胶原、AKT、p-AKT、PI3K、p-PI3K蛋白表达;成骨诱导第21天进行茜素红染色。结果与结论:①CCK-8实验结果显示,100 nmol/L TD-198946能促进骨髓间充质干细胞增殖;②碱性磷酸酶染色及茜素红染色结果显示,TD-198946能促进大鼠骨髓间充质干细胞的成骨分化;③qRT-PCR结果显示,TD-198946可促进成骨相关基因碱性磷酸酶、Runt相关转录因子2、骨桥蛋白、骨钙蛋白、Ⅰ型胶原的表达;④Western blot结果显示,TD-198946可促进Runt相关转录因子2、Ⅰ型胶原以及p-PI3K、p-AKT蛋白表达。结果表明,小分子药物TD-198946可能通过激活PI3K/AKT信号通路,诱导大鼠骨髓间充质干细胞成骨分化。 展开更多
关键词 骨髓间充质干细胞 td-198946 成骨分化 PI3K/AKT信号通路 AKT P-AKT
暂未订购
改进TD3算法的机械臂三维路径规划方法 被引量:1
12
作者 马天 李超 杨嘉怡 《电光与控制》 北大核心 2025年第1期100-105,共6页
在军事航空领域中,复杂任务对机械臂路径规划提出了挑战。针对双延迟深度确定性策略梯度(TD3)算法学习效率低、样本利用率低的问题,提出了一种改进的TD3算法(Recurrent-TD3算法)。首先,将LSTM结合到策略网络与价值网络中,捕获航空控制... 在军事航空领域中,复杂任务对机械臂路径规划提出了挑战。针对双延迟深度确定性策略梯度(TD3)算法学习效率低、样本利用率低的问题,提出了一种改进的TD3算法(Recurrent-TD3算法)。首先,将LSTM结合到策略网络与价值网络中,捕获航空控制任务中的时间序列信息,增强对时间序列变化的响应能力,使其能够在决策时考虑历史动作和状态,提高网络的表达能力;然后,将事后经验回放(HER)技术集成到TD3算法中,以解决任务中稀疏奖励难以学习的问题,通过将未达到目标的经验转化为达到新目标的经验,从而更有效地利用样本;最后,设计了一种基于包围盒的碰撞检测流程,以提高机械臂在军用航空任务中的安全性。实验表明,该算法相比于其他算法能够更快地找到一条无碰撞的路径,且平均路径长度最短。 展开更多
关键词 机械臂 路径规则 td3 长短期记忆网络 事后经验回放技术
在线阅读 下载PDF
融合TD3智能优化与自适应分数阶的电液伺服滑模控制
13
作者 孙春耕 孙泽宇 刘建强 《机床与液压》 北大核心 2025年第23期108-117,共10页
针对传统控制算法难以解决电液伺服系统强非线性、参数摄动和位置干扰带来的跟踪精度下降与稳定性劣化问题,提出一种融合TD3深度强化学习算法与自适应分数阶滑模控制(AFOSMC)的智能复合控制策略——TD3AFOSMC。设计分数阶滑模面,并根据... 针对传统控制算法难以解决电液伺服系统强非线性、参数摄动和位置干扰带来的跟踪精度下降与稳定性劣化问题,提出一种融合TD3深度强化学习算法与自适应分数阶滑模控制(AFOSMC)的智能复合控制策略——TD3AFOSMC。设计分数阶滑模面,并根据滑模面设计系统控制律。依据Lyapunov稳定性理论设计自适应律,并使用TD3深度强化学习算法在线优化滑模切换增益参数。最后,建立仿真环境来验证此控制器的有效性:先在两种参考信号中加入轻微干扰,验证控制器的追踪能力和稳定性,再建立恶劣突变负载和时变参数模型,评估其在复杂工况下的鲁棒性和抗干扰能力。仿真结果表明:在参考信号1、2下,所提TD3AFOSMC控制器较自适应分数阶滑模控制器的误差标准差(SDE)和均方根误差(RMSE)都降低了0.3%~31%,峰值误差(PE)降低1.5%~84%;在恶劣突变干扰和时变参数下,所提TD3AFOSMC控制器较AFOSMC的SDE和RMSE均降低78%,PE降低81%。因此,所提控制器能够有效提升跟踪性能,降低抖振,提高系统的稳定性与安全性。 展开更多
关键词 电液伺服系统 分数阶滑模控制 td3深度强化学习算法 自适应律
在线阅读 下载PDF
基于改进TD3算法的青霉素发酵过程控制方法
14
作者 王晓君 徐涛 +2 位作者 赵春丽 彭亮亮 杜越 《软件导刊》 2025年第10期104-110,共7页
为提高复杂场景下的青霉素产量,提出一种基于改进TD3算法的发酵控制模型Res-OD-TD3,以实现对青霉素发酵过程的优化控制。首先,将残差网络融合到Actor和Critic网络中,用于提升其收敛性;其次,使用OU噪声代替传统高斯噪声,使动作值能够在... 为提高复杂场景下的青霉素产量,提出一种基于改进TD3算法的发酵控制模型Res-OD-TD3,以实现对青霉素发酵过程的优化控制。首先,将残差网络融合到Actor和Critic网络中,用于提升其收敛性;其次,使用OU噪声代替传统高斯噪声,使动作值能够在连续控制任务中以更平滑的方式进行探索,减少探索过程中的剧烈波动;最后,通过动态调整的Huber损失函数对原有损失函数进行改进,在训练的不同阶段提供更合适的损失度量,使算法在处理异常值时更为鲁棒。仿真实验结果表明,与传统的TD3算法和DDPG算法相比,Res-OD-TD3算法对于温度精度和稳定性的控制效果更好,溶解氧浓度分别提升了4.1%、5.5%,产量分别提升了12.8%、27.8%,证实了其在青霉素发酵优化控制中的显著优势。 展开更多
关键词 深度强化学习 控制策略 td3算法 残差网络 青霉素发酵
在线阅读 下载PDF
基于随机森林模型识别浅层地下水TDS异常的方法研究 被引量:4
15
作者 褚宴佳 何宝南 +1 位作者 陈珍 何江涛 《地学前缘》 北大核心 2025年第2期456-468,共13页
准确识别人类活动引起的地下水水化学异常对于确定地下水水化学组分的背景值,合理开展地下水污染评价至关重要。溶解性总固体(TDS)作为地下水水化学的综合指标,其值的高低直接反映了地下水水质的好坏。目前,水化学图法在地下水TDS的异... 准确识别人类活动引起的地下水水化学异常对于确定地下水水化学组分的背景值,合理开展地下水污染评价至关重要。溶解性总固体(TDS)作为地下水水化学的综合指标,其值的高低直接反映了地下水水质的好坏。目前,水化学图法在地下水TDS的异常值识别中取得了较好的效果,但是,其基本原理是基于主要离子组分构成的水化学类型异常必然导致TDS异常的假设,而进行的反向异常识别,可能存在过度识别的情况。为此,本文以沙颍河流域浅层地下水为研究对象,从TDS成因机制出发,提出了采用随机森林模型结合数理统计的正向识别方法,对研究区内浅层地下水TDS的异常值进行识别,并开展了多种方法异常值识别效果的对比研究。结果表明,机器学习法能够有效地识别出地下水TDS异常值,其识别出的地下水TDS阈值与其他方法较为一致。但相比之下,机器学习法从TDS成因机制角度识别异常,能够有效避免水化学图存在的过度识别问题,而且能够区分高、低异常,为TDS异常识别提供了另外一种有效的思路和方法,丰富了地下水环境背景值的研究思路。 展开更多
关键词 地下水环境背景值 tdS 异常值 机器学习法 沙颍河流域
在线阅读 下载PDF
基于TD3-MPC算法的芯片分拣机轨迹规划研究 被引量:1
16
作者 何金山 孟新宇 《凿岩机械气动工具》 2025年第3期86-88,共3页
针对芯片分拣机运动平台在复杂轨迹规划中的高精度需求,文章提出了一种将双延迟深度确定策略梯度算法(twin delayed deep deterministic policy gradient,TD3)与模型预测控制(model predictive control,MPC)相结合的混合控制策略——TD3... 针对芯片分拣机运动平台在复杂轨迹规划中的高精度需求,文章提出了一种将双延迟深度确定策略梯度算法(twin delayed deep deterministic policy gradient,TD3)与模型预测控制(model predictive control,MPC)相结合的混合控制策略——TD3-MPC。仿真实验结果表明,TD3-MPC算法能够有效提高轨迹规划精度,并在复杂轨迹和动态环境中表现出更高的灵活性与稳定性。 展开更多
关键词 td3 MPC 轨迹规划 芯片分拣机
在线阅读 下载PDF
基于改进TD3的四足机器人非结构化地形运动控制 被引量:2
17
作者 谢子健 秦建军 曹钰 《现代制造工程》 北大核心 2025年第1期33-41,共9页
四足机器人在非结构化地形的运动控制高度依赖于复杂的动力学模型和控制器设计,利用深度强化学习方法设计四足机器人控制器已成为趋势。针对在深度强化学习训练过程中收敛较慢、容易陷入局部最优解及计算资源消耗较大等问题,提出一种融... 四足机器人在非结构化地形的运动控制高度依赖于复杂的动力学模型和控制器设计,利用深度强化学习方法设计四足机器人控制器已成为趋势。针对在深度强化学习训练过程中收敛较慢、容易陷入局部最优解及计算资源消耗较大等问题,提出一种融合记忆组件的双延迟深度确定性策略梯度(Memory-integrated Twin Delayed Deep Deterministic policy gradient,M-TD3)算法。首先,对四足机器人以及非结构化地形建模;其次,分析M-TD3算法收敛状态与学习效率;最后,为验证控制器性能,针对多种地形进行运动控制仿真对比并制作样机进行测试。仿真结果表明,相较于传统TD3算法,M-TD3算法收敛更快,效率更高,运动控制性能有显著改善,样机测试结果证明基于改进TD3算法所设计的控制器能够让四足机器人在非结构化地形进行有效的运动越障。 展开更多
关键词 四足机器人 非结构化地形 深度强化学习 td3算法
在线阅读 下载PDF
基于TD3算法的多智能体协作缓存策略
18
作者 曾建州 李泽平 张素勤 《计算机工程》 北大核心 2025年第2期365-374,共10页
为了降低移动边缘网络中的内容获取时延和传输开销,提出一种基于双延迟深度确定性策略梯度(TD3)的多智能体协作缓存策略(MACC)。首先构建多智能体边缘缓存模型,将多节点缓存替换问题建模为部分可观测马尔可夫决策过程(POMDP),把相邻节... 为了降低移动边缘网络中的内容获取时延和传输开销,提出一种基于双延迟深度确定性策略梯度(TD3)的多智能体协作缓存策略(MACC)。首先构建多智能体边缘缓存模型,将多节点缓存替换问题建模为部分可观测马尔可夫决策过程(POMDP),把相邻节点的缓存状态和内容请求信息融入到各节点的观察空间,提高智能体对环境的感知能力,并通过三次指数平滑法提取各节点内容请求的流行度特征,使得算法能够适应内容流行度变化,从而提高缓存命中率;然后联合本地与相邻节点的传输时延和开销来设计指导性奖励函数,引导智能体进行协作缓存,降低系统的缓存冗余和内容传输开销;最后结合Wolpertinger Architecture方法对TD3算法进行多智能体扩展,使每个边缘节点都能自适应地学习缓存策略,从而提高系统性能。实验结果表明,MACC算法中边缘节点牺牲了部分缓存空间来协助相邻节点缓存请求内容,从而提高缓存命中率,在同一数据集上与MAAC、DDPG、独立TD3算法相比,MACC算法的缓存命中率分别平均提高了8.50%、13.91%和29.21%,并能适应动态的边缘环境,实现较小的内容获取时延和传输开销。 展开更多
关键词 移动边缘网络 多智能体 协作缓存 深度强化学习 td3算法
在线阅读 下载PDF
基于改进TD3的山地无人作业底盘姿态控制方法
19
作者 李希明 刘业通 +3 位作者 彭世康 吴湘柠 李恒强 蒙艳玫 《现代制造工程》 北大核心 2025年第5期1-11,共11页
针对山地无人作业底盘在复杂道路下姿态不平稳,传统控制方法适应性、鲁棒性差等问题,提出了一种基于牛顿-拉弗森优化(Newton-Raphson-Based Optimizer,NRBO)算法、极致梯度提升树(eXtreme Gradient Boosting,XGBoost)算法和双延迟深度... 针对山地无人作业底盘在复杂道路下姿态不平稳,传统控制方法适应性、鲁棒性差等问题,提出了一种基于牛顿-拉弗森优化(Newton-Raphson-Based Optimizer,NRBO)算法、极致梯度提升树(eXtreme Gradient Boosting,XGBoost)算法和双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic policy gradient,TD3)算法的底盘姿态控制策略。首先,搭建七自由度主动悬架振动模型环境;然后,训练NRBO-XGBoost的状态预测模型,在TD3算法中加入状态预测模型并在网络中加入注意力机制,增强TD3智能体在复杂环境下的决策能力和适应能力,同时设计奖励函数并训练TD3智能体,实现在复杂道路环境下的底盘姿态控制;最后,基于Matlab 2023a/Simulink软件开展仿真。仿真结果表明,基于改进TD3的底盘姿态控制策略能够有效抑制无人作业底盘在复杂道路下的姿态变化,其俯仰角、侧倾角和垂向位移分别抑制了61.4%、84.9%和84.9%,显著提高了平稳性;相比传统DDPG、PPO和TD3强化学习控制策略,改进TD3算法下的俯仰角分别改善了49.1%、7.4%和37.2%,侧倾角分别改善了83.3%、36.5%和34.7%,垂向位移分别改善了70.7%、77.5%和64.0%,垂向位移加速度分别改善了67.7%、42.1%和49.7%,控制效果更好,具有更好的适应性与鲁棒性。 展开更多
关键词 山地无人作业底盘 主动悬架控制 改进td3算法 自注意力机制
在线阅读 下载PDF
TD-SCDMA演进与国内TD产业发展形势分析 被引量:2
20
作者 程德杰 《移动通信》 2009年第1期28-32,共5页
文章首先阐述了TD-SCDMA在国内的发展现状,然后论述了LTE和TD-LTE的特点,指出了从TD-SCDMA到TD-LTE的发展将面临较长的窗口期,以及中国TD产业面临机遇和挑战。
关键词 td—SCDMA td—LTE 演进3G 4G tdD FDD
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部