期刊文献+
共找到161篇文章
< 1 2 9 >
每页显示 20 50 100
通信感知一体化系统中的联合波形与相移设计
1
作者 杨青青 唐润朋 彭艺 《浙江大学学报(工学版)》 北大核心 2026年第4期906-914,共9页
针对如何在可重构智能表面(RIS)辅助通信感知一体化(ISAC)系统中有效提升系统容量的问题,提出RIS单元的不规则拓扑结构以及深度强化学习(DRL)算法.采用模拟退火算法用于解决不规则RIS的拓扑优化问题,以提高在有限元件数量下的最优空间... 针对如何在可重构智能表面(RIS)辅助通信感知一体化(ISAC)系统中有效提升系统容量的问题,提出RIS单元的不规则拓扑结构以及深度强化学习(DRL)算法.采用模拟退火算法用于解决不规则RIS的拓扑优化问题,以提高在有限元件数量下的最优空间利用效率.在感知波束图增益约束下,分别采用Adam优化器结合传统的梯度下降法与基于DRL的方法来解决最小化用户间干扰(MUI)的问题.具体而言,DRL方案通过深度Q网络(DQN)与近端策略优化(PPO)这2种算法分别处理RIS的离散相移控制和ISAC的恒模波形设计.仿真结果表明,基于DRL算法的不规则RIS辅助通感一体化系统的加权和速率(WSR)相较传统RIS方案提升了13.3%.DRL算法在抑制恒模波束能量泄漏方面具有更显著的优势,进一步验证了不规则RIS的拓扑设计和DRL算法在通感一体化系统中协同优化的可行性. 展开更多
关键词 通信感知一体化(ISAC) 不规则可重构智能表面(RIS) 联合波形设计 相移矩阵 深度强化学习(DRL)
在线阅读 下载PDF
关于口岸出入境人员医学影像检查中人体辐射剂量控制与安全防护策略研究
2
作者 秦佳 华羚 +1 位作者 黄晶 鞠志英 《口岸非传统安全学刊》 2026年第1期48-53,共6页
本文在系统梳理国内外相关法规、标准与研究成果的基础上,分析了口岸常用的DR胸片、低剂量螺旋CT(Low-Dose Spiral Computed Tomography,LDCT)及移动X射线设备的辐射剂量水平与影响因素,提出了分层正当性管理、低剂量成像技术优化、标... 本文在系统梳理国内外相关法规、标准与研究成果的基础上,分析了口岸常用的DR胸片、低剂量螺旋CT(Low-Dose Spiral Computed Tomography,LDCT)及移动X射线设备的辐射剂量水平与影响因素,提出了分层正当性管理、低剂量成像技术优化、标准化操作流程、质量控制体系、敏感人群保护、工作人员职业防护、环境与公众安全保障等全流程一体化策略。指出全国统一的口岸诊断参考水平(Diagnostic reference leve,DRL)缺失、设备与人员水平差异及信息化管理不足是制约防护水平提升的主要瓶颈。建议由国家主管部门牵头建立口岸专用DRL并建设全国剂量监测与预警平台,推进智慧防护体系建设。未来,人工智能重建算法与光子计数CT等新技术,有望在更低剂量下实现高质量成像,推动口岸辐射防护向“以人为本”的精准化、智能化方向发展。 展开更多
关键词 口岸检疫 医学影像检查 辐射防护 诊断参考水平(DRL) 人工智能
在线阅读 下载PDF
基于深度强化学习的车联网可信任务卸载
3
作者 秦雪晴 石琼 +1 位作者 师智斌 王梦丽 《计算机系统应用》 2026年第2期40-52,共13页
针对车载边缘计算(vehicular edge computing,VEC)中路侧单元(road side unit,RSU)资源受限和高负载的难题,以及现有的任务卸载优化方案局限于降低时延或能耗,忽视了边缘节点所面临的安全问题,提出一种基于信任感知和近端策略优化算法(P... 针对车载边缘计算(vehicular edge computing,VEC)中路侧单元(road side unit,RSU)资源受限和高负载的难题,以及现有的任务卸载优化方案局限于降低时延或能耗,忽视了边缘节点所面临的安全问题,提出一种基于信任感知和近端策略优化算法(PPO)的任务卸载方案.首先,构建VEC网络架构,利用周围空闲车辆的计算资源,将任务在本地执行或卸载至RSU、空闲服务车辆进行计算处理,以降低系统整体时延与能耗.其次,构建一种基于多源赋权和奖惩机制的动态反馈信任评估模型,实现对边缘节点可信度的量化评估.最后,利用基于深度强化学习的PPO算法对任务卸载策略进行优化.实验结果表明,相较于DQN、D3QN和TASACO算法,所提方案具有更好的收敛性和稳定性,而且在任务执行时延和能耗等方面优于现有方案. 展开更多
关键词 车载边缘计算(VEC) 任务卸载 深度强化学习(DRL) 信任评估 网络安全 车联网(IoV)
在线阅读 下载PDF
Joint Optimization of Routing and Resource Allocation in Decentralized UAV Networks Based on DDQN and GNN
4
作者 Nawaf Q.H.Othman YANG Qinghai JIANG Xinpei 《电讯技术》 北大核心 2026年第1期1-10,共10页
Optimizing routing and resource allocation in decentralized unmanned aerial vehicle(UAV)networks remains challenging due to interference and rapidly changing topologies.The authors introduce a novel framework combinin... Optimizing routing and resource allocation in decentralized unmanned aerial vehicle(UAV)networks remains challenging due to interference and rapidly changing topologies.The authors introduce a novel framework combining double deep Q-networks(DDQNs)and graph neural networks(GNNs)for joint routing and resource allocation.The framework uses GNNs to model the network topology and DDQNs to adaptively control routing and resource allocation,addressing interference and improving network performance.Simulation results show that the proposed approach outperforms traditional methods such as Closest-to-Destination(c2Dst),Max-SINR(mSINR),and Multi-Layer Perceptron(MLP)-based models,achieving approximately 23.5% improvement in throughput,50% increase in connection probability,and 17.6% reduction in number of hops,demonstrating its effectiveness in dynamic UAV networks. 展开更多
关键词 decentralized UAV network resource allocation routing algorithm GNN DDQN DRL
在线阅读 下载PDF
基于DRL的城市急救无人机路径规划系统架构研究
5
作者 冀峰 《无线互联科技》 2026年第4期71-76,共6页
针对城市突发医疗急救响应慢和无人机传统路径规划算法难以应对城市低空复杂环境的问题,文章提出一种基于深度强化学习(Deep Reinforcement Learning,DRL)的城市急救无人机路径规划系统架构,包括感知、状态生成、DRL决策、执行与安全监... 针对城市突发医疗急救响应慢和无人机传统路径规划算法难以应对城市低空复杂环境的问题,文章提出一种基于深度强化学习(Deep Reinforcement Learning,DRL)的城市急救无人机路径规划系统架构,包括感知、状态生成、DRL决策、执行与安全监控四层结构。本架构基于马尔可夫决策过程(Markov Decision Process,MDP)建模,设计了融合时间窗约束、避障、节能等目标的复合奖励函数,支持根据任务紧急程度动态调整权重;采用SAC算法适配无人机连续动作的路径规划,引入课程学习策略提升训练稳定性;此外,通过规则库兜底机制、人机交互及故障应对逻辑,有效降低了DRL的决策风险。该架构为实现高安全性、高实时性的城市急救无人机投递提供了技术支撑。 展开更多
关键词 DRL 无人机 路径规划 系统架构 医疗急救
在线阅读 下载PDF
广西石化乙烯球罐Q490DRL2调质高强钢首次应用焊接技术分析及质量控制
6
作者 程庆龙 《中国高新科技》 2026年第2期129-131,共3页
乙烯球罐作为在一定温度和压力下盛装乙烯的Ⅲ类球形压力容器,在炼油化工装置中得到了广泛应用。乙烯球罐焊接质量作为球罐施工各工序中最为重要的关键环节,需要对焊接过程的工艺执行情况进行重点控制。项目三台乙烯球罐根据新标准首次... 乙烯球罐作为在一定温度和压力下盛装乙烯的Ⅲ类球形压力容器,在炼油化工装置中得到了广泛应用。乙烯球罐焊接质量作为球罐施工各工序中最为重要的关键环节,需要对焊接过程的工艺执行情况进行重点控制。项目三台乙烯球罐根据新标准首次采用Q490DRL2调质高强钢作为球罐的主体材料,高强钢淬硬倾向较大,易产生延迟裂纹,对焊接工艺的执行要求高,并且焊接质量决定了焊缝的性能从而确保乙烯球罐的安全使用性能满足设计要求,因此需要在施工过程中对焊接质量进行严格控制。 展开更多
关键词 Q490DRL2调质高强钢 首次应用 乙烯球罐 质量控制
在线阅读 下载PDF
基于深度强化学习的直驱型风力涡轮机变桨控制
7
作者 母志俊 李铭 +3 位作者 杨永刚 张汉清 林强 张昆 《电子制作》 2026年第3期70-75,共6页
为了应对风速随机性引起的功率波动和机械载荷问题,本文提出了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的智能变桨控制策略,专为直驱风力涡轮机设计。该策略采用深度确定性策略梯度(Deep Deterministic Policy Gradient,... 为了应对风速随机性引起的功率波动和机械载荷问题,本文提出了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的智能变桨控制策略,专为直驱风力涡轮机设计。该策略采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法,以提升系统的稳定性和可靠性。本文构建了一个集成发电机侧最大功率跟踪、电网侧直流电压稳定和智能变桨调节的分层控制架构。为验证该策略的有效性,搭建了基于OpenFAST与Simulink的联合仿真平台。仿真结果表明,与传统PID控制方法相比,所提出的DDPG控制器在桨叶调整平滑性、功率输出稳定性和机械振动抑制方面具有显著优势。定量分析显示DDPG控制器使桨距角变化率降低了42%,功率波动减少了35%,同时转子速度方差降低了28%,显著提升了系统的整体性能。 展开更多
关键词 风力涡轮机 变桨控制 深度强化学习(DRL) 深度确定性策略梯度(DDPG) 联合仿真
在线阅读 下载PDF
AquaTree:Deep Reinforcement Learning-Driven Monte Carlo Tree Search for Underwater Image Enhancement
8
作者 Chao Li Jianing Wang +1 位作者 Caichang Ding Zhiwei Ye 《Computers, Materials & Continua》 2026年第3期1444-1464,共21页
Underwater images frequently suffer from chromatic distortion,blurred details,and low contrast,posing significant challenges for enhancement.This paper introduces AquaTree,a novel underwater image enhancement(UIE)meth... Underwater images frequently suffer from chromatic distortion,blurred details,and low contrast,posing significant challenges for enhancement.This paper introduces AquaTree,a novel underwater image enhancement(UIE)method that reformulates the task as a Markov Decision Process(MDP)through the integration of Monte Carlo Tree Search(MCTS)and deep reinforcement learning(DRL).The framework employs an action space of 25 enhancement operators,strategically grouped for basic attribute adjustment,color component balance,correction,and deblurring.Exploration within MCTS is guided by a dual-branch convolutional network,enabling intelligent sequential operator selection.Our core contributions include:(1)a multimodal state representation combining CIELab color histograms with deep perceptual features,(2)a dual-objective reward mechanism optimizing chromatic fidelity and perceptual consistency,and(3)an alternating training strategy co-optimizing enhancement sequences and network parameters.We further propose two inference schemes:an MCTS-based approach prioritizing accuracy at higher computational cost,and an efficient network policy enabling real-time processing with minimal quality loss.Comprehensive evaluations on the UIEB Dataset and Color correction and haze removal comparisons on the U45 Dataset demonstrate AquaTree’s superiority,significantly outperforming nine state-of-the-art methods across five established underwater image quality metrics. 展开更多
关键词 Underwater image enhancement(UIE) Monte Carlo tree search(MCTS) deep reinforcement learning(DRL) Markov decision process(MDP)
在线阅读 下载PDF
基于DRL的大规模定制装配车间调度研究
9
作者 屈新怀 张慧慧 +1 位作者 丁必荣 孟冠军 《合肥工业大学学报(自然科学版)》 北大核心 2025年第7期878-883,共6页
针对大规模定制装配车间中订单的随机性和偶然性问题,文章提出一种基于深度强化学习(deep reinforcement learning,DRL)的大规模定制装配车间作业调度优化方法。建立以最小化产品组件更换次数和最小化订单提前/拖期惩罚为目标的大规模... 针对大规模定制装配车间中订单的随机性和偶然性问题,文章提出一种基于深度强化学习(deep reinforcement learning,DRL)的大规模定制装配车间作业调度优化方法。建立以最小化产品组件更换次数和最小化订单提前/拖期惩罚为目标的大规模定制装配车间作业调度优化模型,基于调度模型建立马尔科夫决策过程,合理定义状态、动作和奖励函数;将调度模型优化问题与DRL方法相结合,并采用改进的D3QN算法进行模型求解;最后进行仿真实验验证。结果表明,文章所提方法能有效减少产品组件更换次数和降低订单提前/拖期惩罚。 展开更多
关键词 大规模定制 装配车间 深度强化学习(DRL) 车间作业调度 调度优化模型
在线阅读 下载PDF
极端事件中基于深度强化学习的电力系统主动控制策略
10
作者 熊婷婷 张勤 《廊坊师范学院学报(自然科学版)》 2025年第3期91-96,共6页
在电力系统中,极端事件如野火事件期间需进行庞大数量的线路和负荷切换,操作员很难在这种极端压力条件下做出可靠的决策来最小化电力系统受到的影响和损失。针对该问题,提出一种野火事件中深度强化学习辅助的电力系统主动控制策略。首先... 在电力系统中,极端事件如野火事件期间需进行庞大数量的线路和负荷切换,操作员很难在这种极端压力条件下做出可靠的决策来最小化电力系统受到的影响和损失。针对该问题,提出一种野火事件中深度强化学习辅助的电力系统主动控制策略。首先,将主动控制问题建模为马尔可夫决策过程,并建立野火传播模型和电力系统运行模型;然后,针对野火事件中电网的运行特性,进行状态空间转换、优化动作执行和定制奖励函数,以提升后续DRL训练效率;最后,利用DRL中深度确定策略梯度算法对智能体进行训练,以协助主动控制最大限度减少负荷中断。通过对IEEE 24节点系统进行仿真实验,验证了所提出的方法可以有效减少野火事件期间的负荷中断。 展开更多
关键词 电力系统 智能控制 主动控制 深度强化学习(DRL) 弹性
在线阅读 下载PDF
Diagnostic Reference Levels, Protection of Patients and the Environment against Harmful Effects of X-Rays: Practice of Pediatric Radiology in Six General Reference Hospitals of the Kongo Central Province, DRC
11
作者 Minga Barthelemy Bope Kwete Pembi Francy Pembi +13 位作者 Luwaya Ndombasi Blanchard Ipende Lansikub Jean Sokomoy Nankwa Joséphine Mukadi Mukadi Jules Thomas Byeka Mukambilwa Dorksin Kapia Patrice Milambo Binkedi Ngoma Richard Omombo Ngongo Timothée Mbiango Mabanza Francine Kafinga Ketibula Charly Nkwadi Katolo Adolphe Ngongo Mulemba Tchite Aya Nkole Benjamin Kafinga Luzolo Emery Masandi Milondo Alphonse 《Journal of Biosciences and Medicines》 2025年第1期47-59,共13页
The purpose of this research was to evaluate radiological safety in pediatric radiology in hospitals in the Kongo Central province of the DRC. To this end, we surveyed a convenience sample of 50 health professionals, ... The purpose of this research was to evaluate radiological safety in pediatric radiology in hospitals in the Kongo Central province of the DRC. To this end, we surveyed a convenience sample of 50 health professionals, including 10 radiologists working in the hospitals covered by the survey, to assess the practice of pediatric radiology and the degree of compliance with radiation protection principles for the safety of children and the environment. We collected radiophysical parameters to calculate entrance doses in pediatric radiology in radiology departments to determine the dosimetric level by comparison with the diagnostic reference levels of the International Commission on Radiological Protection (ICRP). All in all, we found that in Kongo Central in the DRC, many health personnel surveyed reported that more than 30% of requested radiological examinations are not justified. Also, after comparing the entrance doses produced in the surveyed departments with those of the International Commission on Radiological Protection (ICRP), a statistically significant difference was found in pediatric radiology between the average doses in five out of six surveyed departments and those of the ICRP. Therefore, almost all of the surveyed departments were found to be highly irradiating in children, while excessive X-ray irradiation in children can have significant effects due to their increased sensitivity to radiation. Among the risks are: increased cancer risks, damage to developing cells, potential genetic effects, and neurological effects. This is why support for implementing radiation protection principles is a necessity to promote the safety of patients and the environment against the harmful effects of X-rays in conventional radiology. 展开更多
关键词 Diagnostic Reference Levels (drls) Radiation Protection Environment and Pediatric Radiology
在线阅读 下载PDF
深度强化学习求解多目标旅行商问题的研究综述 被引量:1
12
作者 李成健 宋姝谊 +1 位作者 粟宇 陈智斌 《计算机工程与应用》 北大核心 2025年第12期28-44,共17页
多目标旅行商问题(MOTSP)是一个具有显著应用价值的组合优化问题(COP),在物流配送、生产调度和网络通信等领域广泛存在。MOTSP不仅需要在多个目标之间寻求平衡,还要求找到不同的帕累托解集,这些解集代表了MOTSP在不同目标之间的全局或... 多目标旅行商问题(MOTSP)是一个具有显著应用价值的组合优化问题(COP),在物流配送、生产调度和网络通信等领域广泛存在。MOTSP不仅需要在多个目标之间寻求平衡,还要求找到不同的帕累托解集,这些解集代表了MOTSP在不同目标之间的全局或局部最优解。传统的多目标优化算法在解决MOTSP时,通常面临计算复杂度高和求解效率低的挑战,尤其是在均衡决策空间和目标空间多样性时,难以有效找到多样化的帕累托最优解。近年来,深度强化学习(DRL)在处理复杂优化问题上展现了巨大的潜力,为解决MOTSP及其帕累托解集的多样化问题提供了一种新的方法。介绍了MOTSP的基本概念和求解方法;讨论了强化学习(RL)中的优化策略和深度学习(DL)的神经网络模型;总结了利用DRL求解MOTSP的理论方法,分析了各代表性模型的优化效果与时效性,突出不同DRL模型在大规模MOTSP问题中的性能表现,并探讨了其局限性、改进方向和适用场景,同时提出了应对局部最优问题的策略。最后,归纳了MOTSP的四大应用研究领域,并指出了MOTSP的未来研究方向。 展开更多
关键词 深度强化学习(DRL) 多目标旅行商问题(MOTSP) 帕累托最优解 优化策略 神经网络模型
在线阅读 下载PDF
一种基于DRL的分布式装备体系优选方法
13
作者 王子怡 张凯 +1 位作者 钱殿伟 刘玉贞 《系统仿真学报》 北大核心 2025年第6期1565-1573,共9页
针对传统算法在大规模场景中求解速度不足且适应性较差的问题,基于DRL对大规模分布式装备体系优选问题进行智能化求解。根据分布式装备体系作战的特点,利用复杂网络对其进行图形式建模,并基于注意力机制对装备间的连边关系进行表征,构... 针对传统算法在大规模场景中求解速度不足且适应性较差的问题,基于DRL对大规模分布式装备体系优选问题进行智能化求解。根据分布式装备体系作战的特点,利用复杂网络对其进行图形式建模,并基于注意力机制对装备间的连边关系进行表征,构建分布式装备体系数字仿真环境。仿真结果表明:与遗传进化算法相比,该模型在求解时间、适应性等方面优势明显,有效提高了大规模分布式装备体系优选决策模型的性能。 展开更多
关键词 DRL 图神经网络 注意力机制 复杂网络 分布式装备体系
原文传递
基于强化学习的新型电力系统优化策略应用综述 被引量:8
14
作者 闫正义 赵康 王凯 《发电技术》 2025年第3期508-520,共13页
【目的】随着电力系统向更高程度的智能化和自动化演进,强化学习(reinforcement learning,RL)作为人工智能领域的一项关键技术,在电力领域的智能化发展方向上展现出广阔前景。完善RL在电力领域的应用研究方案,对于深入挖掘其在电力系统... 【目的】随着电力系统向更高程度的智能化和自动化演进,强化学习(reinforcement learning,RL)作为人工智能领域的一项关键技术,在电力领域的智能化发展方向上展现出广阔前景。完善RL在电力领域的应用研究方案,对于深入挖掘其在电力系统运行、控制和优化等方面的潜力至关重要。为此,分析了RL在实际电气应用中的效能表现,并展望了未来可能的研究方向,以期为电力系统智能化进程提供助力。【方法】对RL在各类电气领域的关键应用进行了综述。系统性地介绍了RL的基本原理和标志性算法,详细探讨这些算法如何被应用于新型电力系统领域的实际问题中。对各研究中主流的RL算法进行归类,并对在这些算法中进行的结构化改进进行优缺点分析。【结果】相比于传统算法,RL显著提升了新型电力系统的智能化水平,并在多个应用场景中取得了显著成效,特别是在应对系统复杂性和不确定性方面表现出色。然而,尽管有诸多成功案例,但目前该领域仍存在一些亟待解决的问题,比如计算成本高、训练时间长、泛化能力不足等。【结论】RL为新型电力系统的智能化提供了新的解决方案,然而,要实现大规模应用,还需要克服一系列技术和实践上的挑战。研究成果可为电气工程领域的研究者和实践者提供参考和启示。 展开更多
关键词 新型电力系统 强化学习(RL) 深度强化学习(DRL) 智能电网 优化策略 能源管理 态势感知 优化调度 人工智能(AI)
在线阅读 下载PDF
基于体型特异性剂量估算值与管电流时间乘积预估儿童头颅CT诊断参考水平的研究
15
作者 陆洋 张见 +3 位作者 刘杰 张朋 边传振 王颖 《中国医学装备》 2025年第2期26-30,共5页
目的:探讨基于体型特异性剂量估算值(SSDE)的儿童头颅CT诊断参考水平(DRL)以及利用管电流时间乘积预估SSDE。方法:回顾性收集2023年1月至2023年12月在南京医科大学附属儿童医院行头颅CT检查的1 259例患儿头颅CT资料,根据患儿年龄将其分... 目的:探讨基于体型特异性剂量估算值(SSDE)的儿童头颅CT诊断参考水平(DRL)以及利用管电流时间乘积预估SSDE。方法:回顾性收集2023年1月至2023年12月在南京医科大学附属儿童医院行头颅CT检查的1 259例患儿头颅CT资料,根据患儿年龄将其分为<6个月、6个月至<1岁、1岁至<3岁、3岁至<6岁、6岁至<12岁及≥12岁6组;按照儿童头颅体径分为<12.5、12.5~<14、14~<15、15~<16和≥16cm的5组。分别测量记录不同年龄组头颅CT的容积CT剂量指数(CTDIVOL)、管电流时间乘积(mAs)、左右径(LRD)、感兴趣区域面积(AROI)及CT值(CTROI),计算水当量直径(DW)、转换因子(fH16)及基于DW的SSDE(SSDEDW),统计基于年龄及体型的DRLs分布,回归分析DW与管电流时间乘积(mAs)的相关性,并建立SSDEDW与管电流时间乘积(mAs)的回归模型,采用组内相关系数(ICC)分析其一致性。结果:各年龄组DRLs中CTDIVOL为12.32~21.66 mGy,SSDEDW为13.47~17.83 mGy;各体型组DRL中CTDIVOL为13.52~21.86 mGy,SSDEDW为13.91~17.92 mGy。不同年龄组患儿CTDIVOL的头颅辐射剂量DRL典型值(LDRLs)与SSDEDW偏离比率为-8.54%~21.48%。DW与管电流时间乘积(mAs)的100、120kVp均存在正向强相关(r=0.96、0.89,P<0.001)。SSDEDW的计算值与管电流时间乘积实测值有较强的一致性(ICC=0.98)。结论:在儿童头颅CT诊断中,SSDEDW更能准确反映辐射剂量;通过建立的SSDEDW与管电流时间乘积(mAs)的回归模型,可快速计算SSDEDW以控制辐射剂量。 展开更多
关键词 儿童头颅CT 管电流与时间乘积 体型特异性剂量值 诊断参考水平(DRL)
暂未订购
基于深度强化学习的天然气管网运行优化研究进展
16
作者 李琴 陈继 +3 位作者 任玉清 贾思琪 胡璐瑶 廖勇 《长江信息通信》 2025年第10期95-100,共6页
地面管网的运行直接影响着天然气的运输和分配,对天然气行业的高质量发展有着重要作用。深度强化学习(Deep Reinforcement Learning,DRL)是一类解决复杂优化问题的有效人工智能算法。针对天然气管网的优化需求,DRL可以给出更优的气体运... 地面管网的运行直接影响着天然气的运输和分配,对天然气行业的高质量发展有着重要作用。深度强化学习(Deep Reinforcement Learning,DRL)是一类解决复杂优化问题的有效人工智能算法。针对天然气管网的优化需求,DRL可以给出更优的气体运输和分配策略。因此,文章对基于DRL的天然气管网运行优化进了进展调研。首先描述了天然气管网的运行模型,其次介绍了三种基于DRL的天然气管网系统的优化方案并分析了其性能,最后对基于DRL的天然气管网运行优化的技术挑战进行了探讨以及对研究趋势进行了展望。 展开更多
关键词 深度强化学习(DRL) 管网运行 天然气 人工智能(AI)
在线阅读 下载PDF
NeOR: neural exploration with feature-based visual odometry and tracking-failure-reduction policy 被引量:1
17
作者 ZHU Ziheng LIU Jialing +2 位作者 CHEN Kaiqi TONG Qiyi LIU Ruyu 《Optoelectronics Letters》 2025年第5期290-297,共8页
Embodied visual exploration is critical for building intelligent visual agents. This paper presents the neural exploration with feature-based visual odometry and tracking-failure-reduction policy(Ne OR), a framework f... Embodied visual exploration is critical for building intelligent visual agents. This paper presents the neural exploration with feature-based visual odometry and tracking-failure-reduction policy(Ne OR), a framework for embodied visual exploration that possesses the efficient exploration capabilities of deep reinforcement learning(DRL)-based exploration policies and leverages feature-based visual odometry(VO) for more accurate mapping and positioning results. An improved local policy is also proposed to reduce tracking failures of feature-based VO in weakly textured scenes through a refined multi-discrete action space, keyframe fusion, and an auxiliary task. The experimental results demonstrate that Ne OR has better mapping and positioning accuracy compared to other entirely learning-based exploration frameworks and improves the robustness of feature-based VO by significantly reducing tracking failures in weakly textured scenes. 展开更多
关键词 intelligent visual agents deep reinforcement learning drl based embodied visual exploration feature based visual odometry tracking failure reduction policy neural exploration deep reinforcement learning
原文传递
结合优先经验回放机制的IQN算法
18
作者 王元昊 张国 王华川 《指挥信息系统与技术》 2025年第3期44-50,57,共8页
结合动态采样权重与分位数回归损失,使用时序差分(TD)误差作为优先级指标以优化经验选择,并应用重要性采样修正分布偏差,提出了结合优先经验回放的隐式分位数网络(P-IQN)算法,以提升在高维不确定环境下的性能。试验结果表明,与基线算法... 结合动态采样权重与分位数回归损失,使用时序差分(TD)误差作为优先级指标以优化经验选择,并应用重要性采样修正分布偏差,提出了结合优先经验回放的隐式分位数网络(P-IQN)算法,以提升在高维不确定环境下的性能。试验结果表明,与基线算法相比,P-IQN算法在多个任务中收敛速度提高46.7%~53.8%,样本利用效率提高40%~50%,特别是在高维不确定环境下。尽管P-IQN算法适用于高维不确定离散控制任务,但它仍面临计算资源需求高、超参数调优困难和泛化能力有限等问题,需进一步优化以适应资源受限或动态变化剧烈的场景。 展开更多
关键词 隐式分位数网络(IQN) 优先经验回放(PER) 分布式强化学习(DRL) 样本效率 收敛加速
在线阅读 下载PDF
基于深度强化学习的多节点测控链路切换策略
19
作者 金姣 李琦 +1 位作者 郑君丽 张国亭 《航天技术与工程学报》 2025年第5期37-44,共8页
为解决卫星测控需求随任务动态变化导致的天地一体化信息网络链路资源利用率受限问题,本文提出一种基于深度强化学习(DRL)的多目标优化测控链路切换策略。该方法通过将多节点测控链路优选问题转化为多目标优化问题,采用深度Q网络(DQN)... 为解决卫星测控需求随任务动态变化导致的天地一体化信息网络链路资源利用率受限问题,本文提出一种基于深度强化学习(DRL)的多目标优化测控链路切换策略。该方法通过将多节点测控链路优选问题转化为多目标优化问题,采用深度Q网络(DQN)算法实现测控节点的智能优选与动态切换,有效提升测控网络整体效能。仿真验证表明,相比于传统固定规则切换策略,基于DQN的多节点测控链路切换策略展现出更强的系统适应性与决策灵活性。基于FPGA硬件平台的实测结果显示,单次决策运行耗时仅需0.128 s,验证了方案的实时可行性,为测控系统的智能化工程应用提供了可靠技术路径。 展开更多
关键词 天地一体化信息网络 多节点测控链路 深度强化学习(DRL) 切换策略
在线阅读 下载PDF
巨桉叶片营养DRIS诊断研究 被引量:14
20
作者 冯茂松 张健 《四川农业大学学报》 CSCD 2003年第4期303-307,共5页
对巨桉叶片营养诊断的采样时间、诊断指标进行研究,结果表明:巨桉适宜的叶片诊断采样时间为24月龄,采用P/N、N/K、P/K作为诊断指标,得出N∶P∶K的适宜值为1∶0 064~0 067∶0 363~0 366。需肥顺序为:第三年为P>K>N,第四年为K>... 对巨桉叶片营养诊断的采样时间、诊断指标进行研究,结果表明:巨桉适宜的叶片诊断采样时间为24月龄,采用P/N、N/K、P/K作为诊断指标,得出N∶P∶K的适宜值为1∶0 064~0 067∶0 363~0 366。需肥顺序为:第三年为P>K>N,第四年为K>N=P。 展开更多
关键词 巨桉 叶片 诊断 采样时间 drls 营养
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部