期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于改进DDQN算法的复杂网络关键节点识别方法
1
作者 江宇楠 刘琳岚 舒坚 《计算机应用研究》 北大核心 2025年第4期1122-1127,共6页
为全面提取节点的全局特征,提高复杂网络关键节点识别结果的准确性,提出一种基于改进DDQN(double deep Q-network)算法的复杂网络关键节点识别方法。通过重构DDQN的初始奖励值、引入回退探索和优先访问方法,改进DDQN算法,提取节点全局特... 为全面提取节点的全局特征,提高复杂网络关键节点识别结果的准确性,提出一种基于改进DDQN(double deep Q-network)算法的复杂网络关键节点识别方法。通过重构DDQN的初始奖励值、引入回退探索和优先访问方法,改进DDQN算法,提取节点全局特征,从而提升全局特征提取的效率和提取结果的准确性。引入聚类系数获取节点的局部特征,通过网络性能均值实验得到全局特征和局部特征的融合参数,对全局特征和局部特征进行融合,得到节点的重要度排序,从而实现关键节点识别。在7个真实网络数据集上的实验结果表明,此方法在基于网络性能均值的评价指标以及SIR模型上均优于对比的基线方法。证明其可以更全面地提取节点全局特征,更准确地识别关键节点。 展开更多
关键词 复杂网络 关键节点 ddqn算法 回退探索 优先访问
在线阅读 下载PDF
基于DDQN的边缘算力融合网络资源管理
2
作者 董玉池 闫亚旗 +3 位作者 冉沛 王东 张阔 张文龙 《电信科学》 北大核心 2025年第8期197-206,共10页
边缘算力融合网络将算力下沉至近用户侧,通过分布式边缘算力节点相互协同以在本地完成计算任务,显著降低云端负担和传输时延。然而,随着用户接入密度提高和场景复杂化,如何动态优化网络资源以协同应对多样化服务需求和大规模数据处理任... 边缘算力融合网络将算力下沉至近用户侧,通过分布式边缘算力节点相互协同以在本地完成计算任务,显著降低云端负担和传输时延。然而,随着用户接入密度提高和场景复杂化,如何动态优化网络资源以协同应对多样化服务需求和大规模数据处理任务成为重大挑战。因此,提出了一种基于双深度Q网络(double deep Q network,DDQN)边缘算力融合网络资源管理方法,结合虚拟网络嵌入(virtual network embedding,VNE)技术,建立了以长期资源收益成本比最大化为目标的多约束优化模型。通过DDQN架构的在线学习能力,利用环境交互反馈实现动态优化决策。仿真实验表明,该方法在虚拟网络请求(virtual network request,VNR)接受成功率、长期嵌入收益和长期嵌入收益成本比3个指标上,较现有方法分别提升了13.3%、25.7%和8.5%。 展开更多
关键词 算力融合网络 算力下沉 双深度Q网络 资源管理
在线阅读 下载PDF
基于改进DDQN的移动机器人路径规划算法
3
作者 王艺霖 张烈平 +1 位作者 尹亚梦 冷忠涛 《桂林航天工业学院学报》 2025年第5期770-783,共14页
针对传统双深度Q网络(Double Deep Q Network, DDQN)算法样本利用率低、奖励稀疏等问题,论文提出了一种基于注意力机制的双采样双深度Q网络算法(Attention Mechanism Double Sampling-Double Deep Q Network, ATDS-DDQN)路径规划算法。... 针对传统双深度Q网络(Double Deep Q Network, DDQN)算法样本利用率低、奖励稀疏等问题,论文提出了一种基于注意力机制的双采样双深度Q网络算法(Attention Mechanism Double Sampling-Double Deep Q Network, ATDS-DDQN)路径规划算法。首先,引入双重采样机制,根据序列累计回报优先级采样,再按照时序误差优先级进行二次采样,提升了样本利用率。其次,设计了含注意力机制的新型网络结构,能更有效地提取关键特征信息,提升训练速度。此外,结合人工势场法设计了新的奖励函数,使机器人每一步都能获得反馈,从而有效缓解奖励稀疏问题。最后,对DDQN、双采样DDQN、自适应探索DDQN和本文提出的ATDS-DDQN算法的路径规划进行了仿真对比实验。实验结果表明,ATDS-DDQN算法获得的奖励值更高,收敛速度更快。 展开更多
关键词 路径规划 ddqn 注意力机制 双重采样机制 人工势场法
在线阅读 下载PDF
基于新型APF-DDQN算法的AUV路径规划研究
4
作者 姚兆烨 黄创霞 《湖南文理学院学报(自然科学版)》 2025年第3期1-8,共8页
存在诸多未知的障碍物以及频繁洋流扰动的海洋环境使自主水下航行器(AUV)在航行过程中极易发生碰撞而导致任务的失败,提高路径规划算法的规划成功率是保证AUV安全航行的前提。本文通过将APF斥力场叠加原理嵌入双重深度Q网络(DDQN)算法框... 存在诸多未知的障碍物以及频繁洋流扰动的海洋环境使自主水下航行器(AUV)在航行过程中极易发生碰撞而导致任务的失败,提高路径规划算法的规划成功率是保证AUV安全航行的前提。本文通过将APF斥力场叠加原理嵌入双重深度Q网络(DDQN)算法框架,重构智能体状态空间表征方式,并创新性地设计基于相邻航迹点距离演变的动态奖励机制,提出一种改进型路径规划算法APF-DDQN。仿真实验表明,APF-DDQN算法有效避免了APF陷入局部最小值的问题,路径规划成功率达到了93.88%,相比于传统的APF算法提高了16.67%,并且所规划路径的长度更短。新型APF-DDQN算法为动态海洋环境下AUV路径规划与自主导航提供可靠解决方案。 展开更多
关键词 自主水下航行器(AUV) 路径规划 双重深度Q网络(ddqn) 人工势场(APF)
在线阅读 下载PDF
基于DDQN-KRR动态重构策略的综合能源系统运行优化 被引量:7
5
作者 吉兴全 朱应业 +3 位作者 张玉敏 叶平峰 杨明 于一潇 《高电压技术》 EI CAS CSCD 北大核心 2023年第8期3195-3204,共10页
在电-气-热互联的综合能源系统优化中考虑配电网动态重构策略是提高系统灵活性和经济性的重要手段。针对考虑配电网动态重构之后模型复杂与求解效率低的问题,提出了基于双层深度Q网络(doubledeepQ network, DDQN)和内核岭回归(kernel ri... 在电-气-热互联的综合能源系统优化中考虑配电网动态重构策略是提高系统灵活性和经济性的重要手段。针对考虑配电网动态重构之后模型复杂与求解效率低的问题,提出了基于双层深度Q网络(doubledeepQ network, DDQN)和内核岭回归(kernel ridge regression, KRR)方法获取配电网动态重构策略,并将其纳入综合能源系统运行优化模型中,通过把耗时较多的模型学习过程转移到训练过程中,仅应用训练好的模型,进而快速得到运行优化结果。首先,建立包含综合能源系统状态与静态重构结果的数据库,依据时间序列并考虑开关动作成本,制定出动态重构策略;其次,提出KRR方法,用于预测耦合机组的最优出力;最后,基于DDQN挖掘综合能源系统状态与重构结果之间的映射关系,实现快速动态重构。以IEEE33节点配电网、20节点天然气网和16节点热网组成的E33-G20-H16系统以及E78-G40-H32系统为例,验证了所提模型和方法的有效性。 展开更多
关键词 电-气-热互联 综合能源系统 双层深度Q网络 内核岭回归 配电网 配电网动态重构
原文传递
基于DDQN的片上网络混合关键性消息调度方法 被引量:2
6
作者 李国梁 李峭 +1 位作者 徐亚军 熊华钢 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第7期1233-1241,共9页
对片上网络(NoC)承载的混合关键性消息进行实时调度是其应用于航空电子系统片上多核通信的关键。为解决可满足性模理论(SMT)法求解效率低、低优先级消息等待延迟大的问题,提出了一种基于双深度Q网络(DDQN)的混合关键性消息调度方法。将... 对片上网络(NoC)承载的混合关键性消息进行实时调度是其应用于航空电子系统片上多核通信的关键。为解决可满足性模理论(SMT)法求解效率低、低优先级消息等待延迟大的问题,提出了一种基于双深度Q网络(DDQN)的混合关键性消息调度方法。将虫孔交换机制下的消息调度问题建模为马尔可夫决策过程,建立包含环境、动作、状态、奖励的多层感知调度模型;随机生成多组分布不同的混合关键性消息作为训练样本,采用DDQN算法求解该调度模型;在此基础上,提出并实现了带孔隙DDQN算法,在保证时间触发(TT)消息可调度前提下为速率约束(RC)消息预留用于虫孔交换的时隙。算例研究表明:所提方法的求解时长及TT消息确定性端到端延迟的平均值均低于SMT法;带孔隙DDQN算法的RC消息延迟较不带孔隙DDQN算法和SMT法显著降低。 展开更多
关键词 片上网络(NoC) 时间触发(TT)机制 双深度Q网络(ddqn) 混合关键性消息 消息调度
原文传递
基于Double Deep Q Network的无人机隐蔽接敌策略 被引量:10
7
作者 何金 丁勇 高振龙 《电光与控制》 CSCD 北大核心 2020年第7期52-57,共6页
基于深度强化学习的连续状态空间无人机隐蔽接敌问题,提出了基于马尔可夫决策过程的隐蔽接敌双深度Q网络(DDQN)方法。利用DDQN生成目标值函数的方法解决了传统DQN的过拟合问题;采用按优先级随机抽样的方法获取训练样本,加速了神经网络... 基于深度强化学习的连续状态空间无人机隐蔽接敌问题,提出了基于马尔可夫决策过程的隐蔽接敌双深度Q网络(DDQN)方法。利用DDQN生成目标值函数的方法解决了传统DQN的过拟合问题;采用按优先级随机抽样的方法获取训练样本,加速了神经网络的训练速度;设定贪婪系数按照指数下降的方法,解决了传统强化学习的“探索利用窘境”;在势函数奖赏函数设计中引入角度因子,使其更加符合实际作战情况。仿真实验结果表明,DDQN具有较好的收敛性,能有效生成隐蔽接敌策略。 展开更多
关键词 隐蔽接敌策略 空战决策 马尔可夫决策过程 双神经网络结构 ddqn算法
在线阅读 下载PDF
未知环境下改进DDQN的无人机探索航迹规划研究 被引量:6
8
作者 唐嘉宁 杨昕 +2 位作者 周思达 李罗宇 安城安 《电光与控制》 CSCD 北大核心 2023年第4期23-27,33,共6页
对未知环境的探索,如搜救、追逃等场景,无人机需要一边探索(感知)环境一边完成当前的航迹规划(动作选择)。针对上述场景,为了提高无人机对未知环境的探索范围,提出了结合长短期记忆的改进深度双Q网络探索航迹规划方法:搭建仿真地图,以... 对未知环境的探索,如搜救、追逃等场景,无人机需要一边探索(感知)环境一边完成当前的航迹规划(动作选择)。针对上述场景,为了提高无人机对未知环境的探索范围,提出了结合长短期记忆的改进深度双Q网络探索航迹规划方法:搭建仿真地图,以无人机视野内的环境信息作为输入,引入长短期记忆网络,输出动作方向的选择;设置探索经验样本优先级,提高训练效率;加入飞行动力学约束,设计合理的状态、动作空间及单步奖励函数。运用所提算法,无人机可以自主规划出一条无碰撞且对环境探索范围大的航迹。仿真实验结果表明:在未知环境下,所提算法得到的探索面积比、单步探索平均奖励值等指标均优于传统的DDQN算法。 展开更多
关键词 无人机 长短期记忆网络 深度双Q网络 未知环境探索 航迹规划
在线阅读 下载PDF
基于引导Minimax-DDQN的无人机空战机动决策 被引量:7
9
作者 王昱 任田君 范子琳 《计算机应用》 CSCD 北大核心 2023年第8期2636-2643,共8页
针对无人机(UAV)空战环境信息复杂、对抗性强所导致的敌机机动策略难以预测,以及作战胜率不高的问题,设计了一种引导Minimax-DDQN(Minimax-Double Deep Q-Network)算法。首先,在Minimax决策方法的基础上提出了一种引导式策略探索机制;然... 针对无人机(UAV)空战环境信息复杂、对抗性强所导致的敌机机动策略难以预测,以及作战胜率不高的问题,设计了一种引导Minimax-DDQN(Minimax-Double Deep Q-Network)算法。首先,在Minimax决策方法的基础上提出了一种引导式策略探索机制;然后,结合引导Minimax策略,以提升Q网络更新效率为出发点设计了一种DDQN(Double Deep Q-Network)算法;最后,提出进阶式三阶段的网络训练方法,通过不同决策模型间的对抗训练,获取更为优化的决策模型。实验结果表明,相较于Minimax-DQN(Minimax-DQN)、Minimax-DDQN等算法,所提算法追击直线目标的成功率提升了14%~60%,并且与DDQN算法的对抗胜率不低于60%。可见,与DDQN、Minimax-DDQN等算法相比,所提算法在高对抗的作战环境中具有更强的决策能力,适应性更好。 展开更多
关键词 无人机空战 自主决策 深度强化学习 双重深度Q网络 多阶段训练
在线阅读 下载PDF
基于DDQN的长江新链网络切片资源分配算法 被引量:2
10
作者 沈建军 《电子设计工程》 2024年第21期176-180,共5页
针对长江新链网络为航运业务提供网络资源时能耗较高的问题进行了研究,采用了网络资源和算力资源统一建模为底层网络资源的方法,构建了网络切片环境下网络资源管理模型。根据长江新链网络切片资源的特点,构建了最小化能耗的目标函数。... 针对长江新链网络为航运业务提供网络资源时能耗较高的问题进行了研究,采用了网络资源和算力资源统一建模为底层网络资源的方法,构建了网络切片环境下网络资源管理模型。根据长江新链网络切片资源的特点,构建了最小化能耗的目标函数。通过构建马尔可夫决策模型,提出了基于双深度Q-Network(Double Deep Q-Network,DDQN)的长江新链网络切片资源分配算法。通过实验与相关算法进行了分析,验证了文中算法选择能耗低的网络资源为航运业务提供资源,降低了长江新链网络资源约13.7%的能耗,提升了约10.2%的资源分配成功率。 展开更多
关键词 长江新链网络 网络资源 资源分配 ddqn
在线阅读 下载PDF
基于动作注意策略的树形DDQN目标候选区域提取方法
11
作者 左国玉 杜婷婷 +2 位作者 马蕾 卢佳豪 龚道雄 《电子与信息学报》 EI CSCD 北大核心 2019年第3期666-673,共8页
针对机器人在家庭环境下的目标检测问题,该文提出一种基于动作注意策略的树形双深度Q网络(TDDQN)目标候选区域提取的方法,该方法将双深度Q网络(DDQN)的方法与树结构的方法相结合,通过执行改变检测框的动作以使目标逐渐集中在检测框内。... 针对机器人在家庭环境下的目标检测问题,该文提出一种基于动作注意策略的树形双深度Q网络(TDDQN)目标候选区域提取的方法,该方法将双深度Q网络(DDQN)的方法与树结构的方法相结合,通过执行改变检测框的动作以使目标逐渐集中在检测框内。首先采用DDQN方法在执行较少的动作后选择出当前状态的最佳动作,获取符合条件的候选区域。然后根据执行所选择动作之后所得到的状态重复执行上述过程,以此构成树结构的多条"最佳"路径。最后采用非极大值抑制的方法从多个符合条件的候选区域选择出最佳候选区域。在PascalVOC2007以及Pascal VOC2012上的实验结果表明,在不同数量的候选区域、不同阈值的IoU和不同大小以及不同种类对象的实验条件下,所提方法较其他方法都有着更好的检测性能,可以较好地实现目标检测。 展开更多
关键词 目标检测 候选区域 树结构 双深度Q网络 动作注意
在线阅读 下载PDF
基于DDQN的三元多级散列异步流量调度方法
12
作者 张皓瀚 易晶晶 《网络新媒体技术》 2024年第5期42-48,共7页
数据中心网络(DCNs)中Web访问和分布式计算的短消息业务占据大部分的流量,为解决数据中心短消息的长尾效应,提出一种接收端驱动的基于强化学习面向动态优先级的流量调度算法。该算法基于双重深度Q网络(DDQN)强化学习设置动态调度门限,... 数据中心网络(DCNs)中Web访问和分布式计算的短消息业务占据大部分的流量,为解决数据中心短消息的长尾效应,提出一种接收端驱动的基于强化学习面向动态优先级的流量调度算法。该算法基于双重深度Q网络(DDQN)强化学习设置动态调度门限,完成动态优先级分配,并在发送队列按照差额轮询极大地降低了低优先级长消息的尾部延时,在发送端将长度小于调度门限的短数据包直接发送,在接收端根据三元检测的信息给长度大于调度门限的数据包动态分配优先级队列,消除抢占延时,保证链路的高占用率和低传输时延。实验表明,本算法在链路95%以上的高负载情况下,对字节数小于Unscheduled Bytes的短消息流完成时间放缓比降低了85%。 展开更多
关键词 流量调度 数据中心网络 ddqn强化学习 带内优先级 三元检测
在线阅读 下载PDF
基于自调参深度双Q网络算法的配电网智能组网规划 被引量:1
13
作者 吉兴全 薛科壮 +4 位作者 叶平峰 翟鹤峰 杨建 于一潇 张玉敏 《智慧电力》 北大核心 2025年第11期48-55,共8页
为解决配电网规划中因区域用电差异较大而导致组网方式匹配度不高的问题,提出一种基于自调参深度双Q(AAP-DDQN)算法的配电网智能组网规划方法。首先,基于负荷密度指标对配电区域进行划分,针对不同区域制定相应的标定准则,提出基于层次... 为解决配电网规划中因区域用电差异较大而导致组网方式匹配度不高的问题,提出一种基于自调参深度双Q(AAP-DDQN)算法的配电网智能组网规划方法。首先,基于负荷密度指标对配电区域进行划分,针对不同区域制定相应的标定准则,提出基于层次分析法和核主成分分析的配电网规划核心特征提取方法,以提取核心指标并降低模型复杂度;其次,构建基于AAP-DDQN的配电网智能组网规划深度强化学习模型,实现组网方式的快速寻优与模型的精确建模;最后,以9种组网方式作为备选方案,并以某48节点待规划配电网为例进行测试,仿真结果表明,所提方法能够准确选择配电网区域的最优组网方式,并给出具体规划方案,验证了所提规划方案的有效性。 展开更多
关键词 深度强化学习 AAP-ddqn 核主成分分析法 配电网规划 智能组网
在线阅读 下载PDF
基于双深度Q网络算法的无人机辅助密集网络资源优化策略
14
作者 陈佳美 孙慧雯 +2 位作者 李玉峰 王宇鹏 别玉霞 《电子与信息学报》 北大核心 2025年第8期2621-2629,共9页
为顺应未来网络向密集化与空间化方向的发展趋势,该文提出构建一种多基站共存的空地结合超密集复杂网络,并开发半分布式方案以优化网络资源。首先,建立包括宏基站、微基站和无人机(UAV)空中基站在内的多种基站共存的超密集复杂网络构架... 为顺应未来网络向密集化与空间化方向的发展趋势,该文提出构建一种多基站共存的空地结合超密集复杂网络,并开发半分布式方案以优化网络资源。首先,建立包括宏基站、微基站和无人机(UAV)空中基站在内的多种基站共存的超密集复杂网络构架。在此基础上,针对传统完全集中式方案存在的计算负担重、响应速度慢以及分布式方案缺乏全局优化视角等问题,提出一种半分布式的双深度Q网络(DDQN)功率控制方案。该方案旨在优化网络能效,通过分布式决策与集中训练相结合的方式,有效平衡了计算复杂度和性能优化。具体而言,半分布式方案利用DDQN算法在基站侧进行分布式决策,同时引入集中式网络训练器以确保整体网络的能效最优。仿真结果表明,所提出的半分布式DDQN方案能够很好地适应密集复杂网络结构,与传统深度Q网络(DQN)相比,在能效和总吞吐量方面均取得了显著提升。 展开更多
关键词 空地密集网络 半分布式 双深度Q网络算法 资源优化
在线阅读 下载PDF
基于深度强化学习的柔性作业车间调度算法 被引量:1
15
作者 何其静 李学华 陈硕 《北京信息科技大学学报(自然科学版)》 2025年第2期74-84,共11页
传统车间调度算法通常依赖静态环境和固定问题规模的简化假设,在大规模复杂作业车间的适应性较低。针对动态柔性作业车间调度问题(dynamic flexible job shop scheduling problem,DFJSP),提出了一种多目标动态柔性作业车间调度算法(mult... 传统车间调度算法通常依赖静态环境和固定问题规模的简化假设,在大规模复杂作业车间的适应性较低。针对动态柔性作业车间调度问题(dynamic flexible job shop scheduling problem,DFJSP),提出了一种多目标动态柔性作业车间调度算法(multi-objective dynamic flexible job shop scheduling algorithm,MODFJSA)。以最小化累计延迟和最小化总碳排放量为优化目标,建立了多目标动态柔性作业车间调度模型。基于双重深度Q网络,建立了基于随机作业到达的分布式多智能体动态作业车间调度算法,将DFJSP转化为涉及机器选择、工序排序和速度控制的顺序决策问题,实现实时优化的调度决策。动态实例仿真分析结果验证了MODFJSA的有效性,与现有调度算法相比,所提算法性能表现更好。 展开更多
关键词 工业物联网 动态柔性作业车间调度 多目标优化 实时决策 强化学习 双重深度Q网络
在线阅读 下载PDF
基于双深度Q网络的多目标遥感产品生产任务调度算法
16
作者 周黎鸣 余汐 +2 位作者 范明虎 左宪禹 乔保军 《电子与信息学报》 北大核心 2025年第8期2819-2829,共11页
遥感产品的生产是一个涉及动态因素的多任务调度问题,任务之间存在资源竞争与冲突,且受生产环境实时变化的影响。如何实现自适应、多目标的高效调度成为问题关键。为此,该文创新性地提出一种基于双深度Q网络(DDQN)的多目标遥感产品生产... 遥感产品的生产是一个涉及动态因素的多任务调度问题,任务之间存在资源竞争与冲突,且受生产环境实时变化的影响。如何实现自适应、多目标的高效调度成为问题关键。为此,该文创新性地提出一种基于双深度Q网络(DDQN)的多目标遥感产品生产任务调度算法(MORS),该方法可以有效降低遥感产品的生产时间,并实现节点资源的负载均衡。首先将多个产品输入处理单元生成相应的遥感算法,然后基于价值驱动的并行可执行筛选策略得到算法子集。在此基础上,设计一个能够感知遥感算法特征和节点特征的深度神经网络模型。通过综合遥感算法生产时间和节点资源状态设计奖励函数,采用DDQN算法训练模型,以确定待处理子集中每个遥感算法的最佳执行节点。在不同数量产品的仿真实验中,将MORS与先来先服务(FCFS)、轮询调度(RR)、遗传算法(GA)以及基于深度Q网络(DQN)的任务调度算法和基于双流深度Q网络(Dueling DQN)的任务调度算法进行全面对比。实验结果表明,MORS在遥感任务调度上相较于其它算法具有有效性和优越性。 展开更多
关键词 遥感任务调度 多目标优化 双深度Q网络
在线阅读 下载PDF
基于深度Q学习的组网雷达闪烁探测调度方法
17
作者 林志康 施龙飞 +1 位作者 刘甲磊 马佳智 《系统工程与电子技术》 北大核心 2025年第5期1443-1452,共10页
组网雷达闪烁探测体制可以提高雷达的协同探测性能和生存率,选择合适的雷达协同探测开机并限制单部雷达的开机暴露时间适应不断变化的环境威胁是亟待解决的问题。对此,提出一种基于深度Q学习(deep Q-learning,DQL)强化学习算法的限制单... 组网雷达闪烁探测体制可以提高雷达的协同探测性能和生存率,选择合适的雷达协同探测开机并限制单部雷达的开机暴露时间适应不断变化的环境威胁是亟待解决的问题。对此,提出一种基于深度Q学习(deep Q-learning,DQL)强化学习算法的限制单部雷达开机时间的组网雷达闪烁探测调度方法。首先建立空中干扰机对组网雷达的威胁度模型和雷达对空中干扰机的组网雷达闪烁探测模型;然后提出威胁度、组网瞬时探测概率强化学习奖励函数;最后利用提出的DQL算法求取组网雷达最佳闪烁开机决策调度方案。仿真结果表明,所提DQL调度方法平均效益率均优于随机调度、人工蜂群调度、双深度Q网络调度方法,且调度响应耗时较少。 展开更多
关键词 组网雷达 闪烁探测 强化学习 深度Q学习 双深度Q网络
在线阅读 下载PDF
云边协同框架下视频处理任务实时调度算法
18
作者 李佳坤 谢雨来 冯丹 《计算机工程与科学》 北大核心 2025年第10期1767-1778,共12页
在云边协同的视频任务处理中,由于存在大量的处理和传输任务,需要考虑任务处理的成功率、任务的处理时间,以保证服务质量。同时,还需要考虑各种资源开销以节省系统运营成本。为了解决上述难题,对云边协同框架下的视频任务调度问题进行... 在云边协同的视频任务处理中,由于存在大量的处理和传输任务,需要考虑任务处理的成功率、任务的处理时间,以保证服务质量。同时,还需要考虑各种资源开销以节省系统运营成本。为了解决上述难题,对云边协同框架下的视频任务调度问题进行了形式化建模,将问题转化为多目标优化问题。针对上述问题,提出了OCES算法,以权衡任务的时延与其在不同节点上产生的开销,并适应不同的动态场景。该算法对相同时间片内的任务进行排序以确定任务优先级,对于每个任务,结合任务信息与当前各边缘节点、云中心节点的状态信息,通过神经网络判断选取Q值最大策略的方法进行调度,用于指定任务的具体执行节点。OCES是基于DDQN的算法,对奖励函数和策略选择方法进行了改进,通过在深度神经网络中结合噪声网络,避免算法过早收敛于局部最优解。相比目前国际先进的CPSA算法,所提出的算法在成功率与完成时间相近的情况下,执行开销在不同平均到达速率与不同任务类型比例的2个场景中分别降低了10.56%与5.85%。 展开更多
关键词 云边协同 任务调度 深度强化学习 ddqn算法 噪声网络
在线阅读 下载PDF
异构网络下的电力无线网络自适应选择方法研究
19
作者 李艳飞 樊灵孟 +3 位作者 吴新桥 方阳 陈远 冯俊懿 《国外电子测量技术》 2025年第9期100-106,共7页
为避免异构网络下的电力无线网络阻塞,提高电力无线网络传输的可靠性,提出一种异构网络下的电力无线网络自适应选择方法。首先建立以网络负载率、用户密度、平均信息年龄、用户满意度的电力无线网络评分,并构建电力无线网络评分最大化... 为避免异构网络下的电力无线网络阻塞,提高电力无线网络传输的可靠性,提出一种异构网络下的电力无线网络自适应选择方法。首先建立以网络负载率、用户密度、平均信息年龄、用户满意度的电力无线网络评分,并构建电力无线网络评分最大化的目标函数;然后采用双深度Q网络(Double Deep Q-Network,DDQN)对目标函数进行求解,并引入双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)对电力无线网络历史流量进行学习,并预测未来时刻量,将预测结果反馈到求解的优化策略中进行调整;最后通过仿真实验进行验证。结果表明,本方法不同业务量下,平均信息年龄为85.67 ms,网络切换率为36%,网络可靠性为99.58%,相较于对比方法,可明显减少网络频繁切换和网络拥塞等问题。由此得出,本方法能综合考虑异构网络下的电力无线网络网络负载率、用户密度、平均信息年龄、用户满意度,并及时调整电力无线网络流量,为不同业务分配更合适的接入网络,避免了电力无线网络阻塞和频繁切换,提高了电力无线网络传输的可靠性。 展开更多
关键词 异构网络 电力无线网络 自适应选择 双深度Q网络 双向长短期记忆网络
原文传递
深度强化学习的ME-STAR-RIS辅助无线抗干扰传输方法
20
作者 叶子绿 许魁 +3 位作者 张北华 周涛 曾铭聪 方志玉 《陆军工程大学学报》 2025年第4期53-60,共8页
6G时代无线设备的激增和恶意干扰的加剧使得传统半空间覆盖的固定阵元可重构智能表面(reconfigurable intelligent surface,RIS)难以满足室内外全场景抗干扰需求。提出了一种可移动阵元同时透射与反射可重构智能表面(movable elements b... 6G时代无线设备的激增和恶意干扰的加剧使得传统半空间覆盖的固定阵元可重构智能表面(reconfigurable intelligent surface,RIS)难以满足室内外全场景抗干扰需求。提出了一种可移动阵元同时透射与反射可重构智能表面(movable elements based simultaneous transmitting and reflecting reconfigurable intelligent surface,ME-STAR-RIS)辅助无线抗干扰传输方法,通过协同优化基站处的主动波束成形、发射功率以及ME-STAR-RIS处的柔性被动波束成形(包括阵元位置及相移系数)来实现抗干扰通信速率的最大化。针对ME-STAR-RIS辅助无线抗干扰传输方法设计面临的高维非凸联合优化难题,将优化问题描述为马尔可夫决策过程并采用双深度Q网络(double deep Q network,DDQN)算法进行求解,得到了优化的发射功率和柔性被动波束成形。仿真结果表明,ME-STAR-RIS抗干扰传输方法较传统方法能进一步提升系统的抗干扰性能。 展开更多
关键词 同时透射与反射智能表面 移动型阵元 双深度Q网络 抗干扰传输 波束成形
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部