期刊文献+
共找到536篇文章
< 1 2 27 >
每页显示 20 50 100
基于角度搜索和深度Q网络的移动机器人路径规划算法 被引量:2
1
作者 李宗刚 韩森 +1 位作者 陈引娟 宁小刚 《兵工学报》 北大核心 2025年第2期30-44,共15页
针对深度Q网络(Deep Q Network,DQN)算法在求解路径规划问题时存在学习时间长、收敛速度慢的局限性,提出一种角度搜索(Angle Searching,AS)和DQN相结合的算法(Angle Searching-Deep Q Network,AS-DQN),通过规划搜索域,控制移动机器人的... 针对深度Q网络(Deep Q Network,DQN)算法在求解路径规划问题时存在学习时间长、收敛速度慢的局限性,提出一种角度搜索(Angle Searching,AS)和DQN相结合的算法(Angle Searching-Deep Q Network,AS-DQN),通过规划搜索域,控制移动机器人的搜索方向,减少栅格节点的遍历,提高路径规划的效率。为加强移动机器人之间的协作能力,提出一种物联网信息融合技术(Internet Information Fusion Technology,IIFT)模型,能够将多个分散的局部环境信息整合为全局信息,指导移动机器人规划路径。仿真实验结果表明:与标准DQN算法相比,AS-DQN算法可以缩短移动机器人寻得到达目标点最优路径的时间,将IIFT模型与AS-DQN算法相结合路径规划效率更加显著。实体实验结果表明:AS-DQN算法能够应用于Turtlebot3无人车,并成功找到起点至目标点的最优路径。 展开更多
关键词 移动机器人 路径规划 深度Q网络 角度搜索策略 物联网信息融合技术
在线阅读 下载PDF
计及电力-通信-交通耦合网络不确定性的虚拟电厂鲁棒优化调度 被引量:1
2
作者 潘超 李梓铭 +3 位作者 龚榆淋 叶宇鸿 孙中伟 周振宇 《电工技术学报》 北大核心 2025年第15期4755-4769,共15页
电力-通信-交通耦合网络中,虚拟电厂(VPP)通过先进的控制、通信、信息采集技术对分布式资源进行规模化聚合调控并积极响应电网需求,能够提高电网运行的稳定性。然而,现有VPP优化调度方法忽略了电力-通信-交通耦合网络中不确定性因素对VP... 电力-通信-交通耦合网络中,虚拟电厂(VPP)通过先进的控制、通信、信息采集技术对分布式资源进行规模化聚合调控并积极响应电网需求,能够提高电网运行的稳定性。然而,现有VPP优化调度方法忽略了电力-通信-交通耦合网络中不确定性因素对VPP需求响应优化调度的影响,导致调度成本高、鲁棒性差。针对上述问题,首先,该文构建电力-通信-交通耦合网络模型,并以最小化网损、节点电压偏差、VPP经济成本的加权和为目标建立优化问题;其次,分析来自电力-通信-交通三个网络的不确定性因素,并构建计及电力-通信-交通耦合网络不确定性的VPP鲁棒优化调度问题;然后,提出一种基于联邦对抗深度Q网络(DQN)的VPP鲁棒优化调度求解算法,通过双智能体之间的不断迭代,实现鲁棒最优策略的对抗求解;最后,对所提算法进行仿真验证,仿真结果表明,所提算法能够有效降低不确定性因素对VPP优化调度的影响,提高电网运行的可靠性与稳定性。 展开更多
关键词 电力-通信-交通 虚拟电厂 不确定性 鲁棒优化调度 联邦对抗深度Q网络(DQN)
在线阅读 下载PDF
基于双深度Q网络的车联网安全位置路由 被引量:1
3
作者 米洪 郑莹 《无线电通信技术》 北大核心 2025年第1期96-105,共10页
作为智能交通系统中的支撑技术,车联网(Internet of Vehicle,IoV)已受到广泛关注。由于IoV网络拓扑结构的动态变化以及灰洞攻击,构建稳定的安全位置路由是一项挑战工作。为此,提出基于双深度Q网络的安全位置路由(Double DQN-based Secur... 作为智能交通系统中的支撑技术,车联网(Internet of Vehicle,IoV)已受到广泛关注。由于IoV网络拓扑结构的动态变化以及灰洞攻击,构建稳定的安全位置路由是一项挑战工作。为此,提出基于双深度Q网络的安全位置路由(Double DQN-based Secure Location Routing,DSLR)。DSLR通过防御灰洞攻击提升消息传递率(Message Delivery Ratio,MDR),并降低消息的传输时延。构建以丢包率和链路连通时间为约束条件的优化问题,利用双深度Q网络算法求解。为了提升DSLR的收敛性,基于连通时间、丢包率和传输时延构建奖励函数,引导智能体选择满足要求的转发节点。采用动态的探索因子机制,平衡探索与利用间的关系,进而加速算法的收敛。仿真结果表明,相比于同类算法,提出的DSLR提升了MDR,减少了传输时延。 展开更多
关键词 车联网 位置路由 灰洞攻击 双深度Q网络 动态的探索因子
在线阅读 下载PDF
基于DQN算法的直流微电网负载接口变换器自抗扰控制策略 被引量:1
4
作者 周雪松 韩静 +3 位作者 马幼捷 陶珑 问虎龙 赵明 《电力系统保护与控制》 北大核心 2025年第1期95-103,共9页
在直流微电网中,为了保证直流母线与负载之间能量流动的稳定性,解决在能量流动中不确定因素产生的扰动问题。在建立DC-DC变换器数学模型的基础上,设计了一种基于深度强化学习的DC-DC变换器自抗扰控制策略。利用线性扩张观测器对总扰动... 在直流微电网中,为了保证直流母线与负载之间能量流动的稳定性,解决在能量流动中不确定因素产生的扰动问题。在建立DC-DC变换器数学模型的基础上,设计了一种基于深度强化学习的DC-DC变换器自抗扰控制策略。利用线性扩张观测器对总扰动的估计补偿和线性误差反馈控制特性对自抗扰控制器结构进行简化设计,并结合深度强化学习对其控制器参数进行在线优化。根据不同工况下的负载侧电压波形,分析了DC-DC变换器在该控制策略、线性自抗扰控制与比例积分控制下的稳定性、抗扰性和鲁棒性,验证了该控制策略的正确性和有效性。最后,在参数摄动下进行了蒙特卡洛实验,仿真结果表明该控制策略具有较好的鲁棒性。 展开更多
关键词 直流微电网 深度强化学习 DQN算法 DC-DC变换器 线性自抗扰控制
在线阅读 下载PDF
缓存辅助的移动边缘计算任务卸载与资源分配 被引量:1
5
作者 李致远 陈品润 《计算机工程与设计》 北大核心 2025年第5期1248-1255,共8页
针对边缘计算网络环境下的计算任务卸载与资源分配问题,提出一种基于分层强化学习的联合优化缓存、卸载与资源分配(HRLJCORA)算法。以时延和能耗为优化目标,将原优化问题分解为两个子问题,下层利用深度Q-learning网络算法进行缓存决策,... 针对边缘计算网络环境下的计算任务卸载与资源分配问题,提出一种基于分层强化学习的联合优化缓存、卸载与资源分配(HRLJCORA)算法。以时延和能耗为优化目标,将原优化问题分解为两个子问题,下层利用深度Q-learning网络算法进行缓存决策,上层使用软动作评价算法进行计算任务卸载与资源分配决策。仿真实验结果表明,HRLJCORA算法与现有基线算法相比,有效降低了总开销,相较于联合优化计算任务卸载与资源分配(JORA)算法,卸载决策奖励值提高了13.11%,为用户提供了更优质的服务。 展开更多
关键词 移动边缘计算 缓存辅助 卸载决策 资源分配 分层强化学习 深度Q-learning网络算法 软动作评价算法
在线阅读 下载PDF
基于改进深度Q网络的无预测风电场日前拓扑优化
6
作者 黄晟 潘丽君 +3 位作者 屈尹鹏 周歧林 徐箭 柯德平 《电力系统自动化》 北大核心 2025年第2期122-132,共11页
风电场受风速变化等因素影响,出力易产生大幅波动,从而造成电压波动和网损增加等问题,影响风电场的安全高效运行。目前的风电场日前调控方案多基于传统的数学优化模型展开,且需要风机的日前出力预测数据,故无法完全避免的日前预测误差... 风电场受风速变化等因素影响,出力易产生大幅波动,从而造成电压波动和网损增加等问题,影响风电场的安全高效运行。目前的风电场日前调控方案多基于传统的数学优化模型展开,且需要风机的日前出力预测数据,故无法完全避免的日前预测误差的引入造成日前优化调控方案有效性的降低,增加了日内风机调控的难度。因此,文中充分发挥强化学习模型的决策能力,提出了一种基于改进深度Q网络(DQN)的无预测风电场拓扑重构决策方案,并以DQN为框架展开。首先,构建基于历史数据的状态空间;然后,提出基于生成树的动作价值对解耦的动作空间优化方法,以最小化电压偏差和网损为目标建立优化评价体系,完成由历史实际出力数据到决策的映射关系构建,在避免引入预测误差的情况下实现风电场日前优化调控;最后,设计一种基于多层次经验指导的经验回放策略,提升算法的训练性能,保证算法的适用性。根据实际的风电运行数据进行仿真,通过对比分析改进技术对DQN算法的影响和优化调控前后风电场的运行状态,验证了所提方法的创新性和有效性。 展开更多
关键词 风电场 预测 深度Q网络 拓扑重构 电压控制 优化 强化学习
在线阅读 下载PDF
基于深度强化学习的孤岛微电网二次频率控制
7
作者 王力 蒋宇翔 +2 位作者 曾祥君 赵斌 李均昊 《中国电力》 北大核心 2025年第5期176-188,共13页
随着分布式电源大量接入微电网,可再生能源发电波动性和系统随机扰动给孤岛微电网频率稳定和运行控制带来了严重威胁。为此,提出了基于深度强化学习的二次频率控制方法,分析孤岛微电网下垂控制特性,提出了基于深度Q网络的二次频率控制... 随着分布式电源大量接入微电网,可再生能源发电波动性和系统随机扰动给孤岛微电网频率稳定和运行控制带来了严重威胁。为此,提出了基于深度强化学习的二次频率控制方法,分析孤岛微电网下垂控制特性,提出了基于深度Q网络的二次频率控制器结构。将频率偏差作为状态输入变量,依次完成深度Q网络算法中状态空间、动作空间、奖励函数、神经网络和超参数的设计,其中奖励函数兼顾了频率恢复和各分布式电源功率分配的目标,实现各智能体动作选择一致性;通过离线学习训练生成深度强化学习二次频率控制器。在Matlab/Simulink中搭建孤岛微电网仿真模型,设置多场景源荷扰动验证控制器性能。结果表明,与传统PID控制和基于Q学习算法控制器相比,该控制方法能够快速实现更稳定的二次频率控制,并能自适应协调各分布式电源按自身容量进行功率分配,确保系统稳定运行。 展开更多
关键词 深度强化学习 孤岛微电网 下垂控制 深度Q网络 二次频率控制 功率分配
在线阅读 下载PDF
基于深度Q网络的平衡杆优化控制实验教学案例设计
8
作者 钟珊 杜鑫 +2 位作者 司亚利 刘井莲 严卫 《实验室研究与探索》 北大核心 2025年第1期146-152,190,共8页
为了使学生更深入地掌握采用强化学习求解任务最优策略的方法,基于深度Q网络设计了平衡杆的控制优化实验。将平衡杆实验环境建模为马尔可夫决策模型,从深度Q网络结构、探索策略、奖励函数、经验回放池更新和目标Q网络更新等角度进行了... 为了使学生更深入地掌握采用强化学习求解任务最优策略的方法,基于深度Q网络设计了平衡杆的控制优化实验。将平衡杆实验环境建模为马尔可夫决策模型,从深度Q网络结构、探索策略、奖励函数、经验回放池更新和目标Q网络更新等角度进行了实验方案的设计。实验评估综合考虑了算法有效性、Q值估计的准确性、样本效率和Q网络的损失估计。在此基础上,将其与基准算法Q学习算法在累计奖赏和学习效率上进行了对比。该实验不仅可以帮助学生学会综合应用强化学习知识,也能帮助其掌握采用深度Q网络算法来求解离散动作空间任务的最优策略。 展开更多
关键词 强化学习 深度Q网络 Q学习 平衡杆 实验设计
在线阅读 下载PDF
基于深度强化学习的无人机紫外光信息收集方法
9
作者 赵太飞 郭佳豪 +1 位作者 辛雨 王璐 《光子学报》 北大核心 2025年第1期43-58,共16页
针对电磁干扰环境下的无人机信息收集问题,使用深度强化学习算法实现了紫外光非直视通信收发仰角自适应调整的信息收集方法。建立了无人机的移动、通信、信息收集和能耗模型,以时间、能量和通信质量为目标函数,建立了多目标优化模型,使... 针对电磁干扰环境下的无人机信息收集问题,使用深度强化学习算法实现了紫外光非直视通信收发仰角自适应调整的信息收集方法。建立了无人机的移动、通信、信息收集和能耗模型,以时间、能量和通信质量为目标函数,建立了多目标优化模型,使用深度强化学习算法解决多目标优化问题。为了让无人机获得更优的飞行方向、飞行速度以及紫外光收发仰角的决策,设计了一套适合信息收集任务的奖励函数,并对经典的深度双Q网络算法加入双目标网络、熵正则化和优先经验回放等改进。仿真结果表明,改进的算法相比经典的深度双Q网络算法,在时间效率上至少提高了13%,能量消耗至少减少了14%。 展开更多
关键词 无人机 信息收集 紫外光非直视通信 深度强化学习 深度双Q网络
在线阅读 下载PDF
改进Deep Q Networks的交通信号均衡调度算法
10
作者 贺道坤 《机械设计与制造》 北大核心 2025年第4期135-140,共6页
为进一步缓解城市道路高峰时段十字路口的交通拥堵现象,实现路口各道路车流均衡通过,基于改进Deep Q Networks提出了一种的交通信号均衡调度算法。提取十字路口与交通信号调度最相关的特征,分别建立单向十字路口交通信号模型和线性双向... 为进一步缓解城市道路高峰时段十字路口的交通拥堵现象,实现路口各道路车流均衡通过,基于改进Deep Q Networks提出了一种的交通信号均衡调度算法。提取十字路口与交通信号调度最相关的特征,分别建立单向十字路口交通信号模型和线性双向十字路口交通信号模型,并基于此构建交通信号调度优化模型;针对Deep Q Networks算法在交通信号调度问题应用中所存在的收敛性、过估计等不足,对Deep Q Networks进行竞争网络改进、双网络改进以及梯度更新策略改进,提出相适应的均衡调度算法。通过与经典Deep Q Networks仿真比对,验证论文算法对交通信号调度问题的适用性和优越性。基于城市道路数据,分别针对两种场景进行仿真计算,仿真结果表明该算法能够有效缩减十字路口车辆排队长度,均衡各路口车流通行量,缓解高峰出行方向的道路拥堵现象,有利于十字路口交通信号调度效益的提升。 展开更多
关键词 交通信号调度 十字路口 Deep Q Networks 深度强化学习 智能交通
在线阅读 下载PDF
车载命名数据网络缓存污染攻击检测及抑制机制
11
作者 樊娜 李佳龙 +2 位作者 高宇昕 张俊辉 叶莉萍 《交通运输工程学报》 北大核心 2025年第3期330-345,共16页
为了在车载命名数据网络中准确检测并有效抑制缓存污染攻击,融合内容流行度预测,设计了一种基于深度强化学习的自适应攻击检测与抑制机制;针对缓存污染攻击的特点,基于支持向量机设计了一种网络状态判断方法,在识别出状态异常时,即触发... 为了在车载命名数据网络中准确检测并有效抑制缓存污染攻击,融合内容流行度预测,设计了一种基于深度强化学习的自适应攻击检测与抑制机制;针对缓存污染攻击的特点,基于支持向量机设计了一种网络状态判断方法,在识别出状态异常时,即触发缓存污染攻击的检测与抑制功能;同时,结合深度Q网络和K-means算法,设计了一种自适应攻击检测方法,该方法能够根据网络特征动态调整攻击检测的时间间隔,并由路侧单元依据车辆节点的内容流行度预测结果和请求记录,对缓存污染攻击产生的虚假流行内容进行筛选,从而实现攻击的精准快速检测;设计了一种基于动态黑名单的缓存污染攻击抑制方法,将攻击产生的虚假流行内容放入黑名单,并根据检测结果动态更新黑名单,车辆节点和路侧单元根据黑名单从缓存中剔除虚假流行内容,同时丢弃与其相应的兴趣包,从而有效抑制缓存污染攻击,减少对用户的影响;搭建了半实物仿真平台,通过半实物仿真试验进一步验证了所提方法对缓存污染攻击的检测性能。仿真结果表明:当面临高强度缓存污染攻击时,所提出的方法在低密度和高密度车载命名数据网络场景下,缓存污染攻击检测的准确率分别提升至0.91和0.92,车辆节点的内容获取延迟分别降低为0.113 s和0.112 s,表明该方法性能优于现有方法,能够有效地识别抑制缓存污染攻击,提升车载命名数据网络的安全性。 展开更多
关键词 智能交通 车载命名数据网络 深度Q网络 缓存污染攻击 安全机制 内容缓存 K-MEANS算法
原文传递
洋流干扰下低速欠驱动AUV的三维路径规划
12
作者 陈世同 鲁子瑜 《智能系统学报》 北大核心 2025年第2期425-434,共10页
海洋洋流对低速欠驱动水下运载器(automatic underwater vehicle,AUV)的航行影响巨大,会增加航行时间、增大能源消耗以及改变航行轨迹,故在洋流干扰的情况下规划出一条最优航行路线有着重要的意义。本文主要分析了洋流对AUV的影响机理,... 海洋洋流对低速欠驱动水下运载器(automatic underwater vehicle,AUV)的航行影响巨大,会增加航行时间、增大能源消耗以及改变航行轨迹,故在洋流干扰的情况下规划出一条最优航行路线有着重要的意义。本文主要分析了洋流对AUV的影响机理,由于传统的强化Q网络(deep Q-network,DQN)路径规划算法在复杂环境下存在过估计的问题,提出了基于优先经验回放方法的改进DQN路径规划算法,同时对动作设计和奖励函数进行优化。在基于S57海图数据建立的三维海洋环境下,利用地球与空间研究机构(earth&space research,ESR)提供的洋流数据进行路径规划仿真。实验结果表明,在充分考虑洋流干扰的情况下,改进后的DQN算法能够规划出较优的全局路径规划,提供一条时间最短且能耗最低的航行路线,为AUV水下航行提供参考。 展开更多
关键词 自主水下运载器 强化学习 洋流干扰 路径规划 三维海洋环境 强化Q网络 S57海图 奖励函数
在线阅读 下载PDF
基于深度强化学习的电力线与无线双模通信MAC层接入算法
13
作者 陈智雄 詹学滋 左嘉烁 《智能系统学报》 北大核心 2025年第2期344-354,共11页
针对无线和电力线通信混合组网的信道竞争接入问题,提出了一种基于深度强化学习的电力线与无线双模通信的MAC接入算法。双模节点根据网络广播信息和信道使用等数据自适应接入双媒质信道。首先建立了基于双模通信网络交互和统计信息的双... 针对无线和电力线通信混合组网的信道竞争接入问题,提出了一种基于深度强化学习的电力线与无线双模通信的MAC接入算法。双模节点根据网络广播信息和信道使用等数据自适应接入双媒质信道。首先建立了基于双模通信网络交互和统计信息的双模通信节点数据采集模型;接着定义了基于协作信息的深度强化学习(deep reinforcement learning,DRL)状态空间、动作空间和奖励,设计了联合α-公平效用函数和P坚持接入机制的节点决策流程,实现基于双深度Q网络(double deep Q-network,DDQN)的双模节点自适应接入算法;最后进行算法性能仿真和对比分析。仿真结果表明,提出的接入算法能够在保证双模网络和信道接入公平性的条件下,有效提高双模通信节点的接入性能。 展开更多
关键词 电力线通信 无线通信 双模节点 深度强化学习 双深度Q网络 MAC层接入 公平效用函数 P坚持接入
在线阅读 下载PDF
考虑订单交货期的柔性作业车间主动调度方法
14
作者 朱海华 陶帅 +3 位作者 王健杰 张毅 唐敦兵 刘长春 《工业工程》 2025年第2期58-68,共11页
随着物联网技术与工业基础设施的迅猛发展,制造现场数字化网络化能力不断攀升,为离散制造车间生产任务的智能调度与管控奠定了技术基础与保障。现阶段产品多品种、小批量、定制化的需求不断增加,导致生产现场的车间环境越来越复杂多变,... 随着物联网技术与工业基础设施的迅猛发展,制造现场数字化网络化能力不断攀升,为离散制造车间生产任务的智能调度与管控奠定了技术基础与保障。现阶段产品多品种、小批量、定制化的需求不断增加,导致生产现场的车间环境越来越复杂多变,订单交货期不确定性变大,而订单剩余完工时间则是影响交货期的关键因素之一。基于车间现场强大的数据感知与获取能力,提出一种考虑订单交货期的柔性作业车间主动调度方法。首先建立基于改进深度Q网络的调度决策模型,将订单剩余完工时间预测值作为决策模型的状态特征之一,增强调度模型的主动性;针对工件分派到机器以及机器缓冲区的工件选择问题设计复合调度规则动作集;然后,以最大完工时间、最大总延期时间、最大平均延期时间等为优化目标,根据实时数据通过预测网络和目标网络来训练决策模型选择最优动作,进而实现生产过程的主动调度,并保证多目标全局优化效果;最后,通过应用案例验证证明所提调度方法的有效性和优越性。 展开更多
关键词 订单交货期 柔性作业 主动调度 改进深度Q网络
在线阅读 下载PDF
分布式强化学习驱动的量子编译自动调优方法
15
作者 刘毅 朱雨 +3 位作者 许瑾晨 杜启明 连航 涂政 《信息工程大学学报》 2025年第4期462-469,共8页
针对强化学习模型应用到量子编译自动调优领域开销大的问题,提出一种分布式强化学习(DRL)驱动的量子编译自动调优方法,通过将经验生成与智能体训练解耦,基于分布式集群实现了并行经验生成。该方法通过建立具有稠密奖励特性的量子编译马... 针对强化学习模型应用到量子编译自动调优领域开销大的问题,提出一种分布式强化学习(DRL)驱动的量子编译自动调优方法,通过将经验生成与智能体训练解耦,基于分布式集群实现了并行经验生成。该方法通过建立具有稠密奖励特性的量子编译马尔可夫决策过程(MDP)模型,设计经验生成与智能体训练的解耦机制,结合动态经验加载策略,在保证优化效果的同时提升训练效率。实验结果表明,分布式训练框架训练耗时减少54.6%;优化性能方面,智能体在测试集77.3%的量子线路上表现优于Qiskit-O3编译器,对未见过的Shor算法线路平均减少17.4%量子门数量。 展开更多
关键词 强化学习 分布式系统 深度Q网络 量子编译优化 量子编译自动调优
在线阅读 下载PDF
基于深度强化学习的5G-LEO融合网络动态切换方法
16
作者 孙士兵 《空天预警研究学报》 2025年第5期356-359,374,共5页
针对5G-LEO融合网络中传统切换机制导致的系统信息速率劣化与服务质量(QoS)下降问题,提出基于深度Q网络(DQN)的动态切换(DQDH)方法.首先,构建最大化系统信息速率的目标优化问题,将目标优化问题转换成马尔可夫决策过程(MDP).然后,通过设... 针对5G-LEO融合网络中传统切换机制导致的系统信息速率劣化与服务质量(QoS)下降问题,提出基于深度Q网络(DQN)的动态切换(DQDH)方法.首先,构建最大化系统信息速率的目标优化问题,将目标优化问题转换成马尔可夫决策过程(MDP).然后,通过设置状态空间、动作空间以及奖励函数,使智能体能做出有利于优化系统信息速率的决策.仿真结果表明,与基准方法相比,本文提出的DQDH方法提升了系统的信息速率,降低了在LEO卫星与地面基站之间进行接入点切换时延. 展开更多
关键词 低轨卫星 切换方法 信息速率 深度Q网络 切换时延
在线阅读 下载PDF
强化学习和矩阵补全引导的多目标试卷生成
17
作者 邢长征 梁浚锋 +2 位作者 金海波 徐佳玉 乌海荣 《计算机应用》 北大核心 2025年第1期48-58,共11页
针对现有的试卷生成技术存在过多关注生成试卷的难易程度,而忽略了其他相关目标,例如质量、分数分布和技能覆盖范围的问题,提出一种强化学习和矩阵补全引导的多目标试卷生成方法,以优化试卷生成领域的特定目标。首先,运用深度知识追踪... 针对现有的试卷生成技术存在过多关注生成试卷的难易程度,而忽略了其他相关目标,例如质量、分数分布和技能覆盖范围的问题,提出一种强化学习和矩阵补全引导的多目标试卷生成方法,以优化试卷生成领域的特定目标。首先,运用深度知识追踪方法对学生之间的交互信息和响应日志进行建模以获取学生群体的技能熟练程度;其次,运用矩阵分解和矩阵补全方法对学生未做的习题进行得分预测;最后,基于多目标试卷生成策略,为提升Q网络的更新效率,设计一个Exam Q-Network函数逼近器以自动地选择合适的问题集来更新试卷组成。实验结果表明,相较于DEGA(Diseased-Enhanced Genetic Algorithm)、SSA-GA(Sparrow Search Algorithm-Genetic Algorithm)等模型,在试卷难度、合理性、准确性这3个指标上验证了所提模型在解决试卷生成场景的多重困境方面上效果显著。 展开更多
关键词 多目标试卷生成 深度知识追踪 Q网络 矩阵分解 矩阵补全
在线阅读 下载PDF
基于多目标优化算法的云计算调度任务分配及优化
18
作者 沈建国 《延边大学学报(自然科学版)》 2025年第1期19-24,共6页
为了优化计算机对队列任务的调度效率,将双深度Q网络和改进鲸鱼优化算法相结合提出了一种基于多目标决策优化的任务调度模型.在该模型中,双深度Q网络主要用于拟合计算机的任务调度过程,以实现更加高效的任务分配与优化.改进鲸鱼优化算... 为了优化计算机对队列任务的调度效率,将双深度Q网络和改进鲸鱼优化算法相结合提出了一种基于多目标决策优化的任务调度模型.在该模型中,双深度Q网络主要用于拟合计算机的任务调度过程,以实现更加高效的任务分配与优化.改进鲸鱼优化算法用于协同分配生成的任务队列,以提升任务分配的整体效率,研究结果显示,与蚁群算法、粒子群优化算法、灰狼优化算法相比,该调度模型在迭代过程中的收敛速率最高,最终任务执行时间为182ms,且任务执行效率比其他算法提升了15.71%~31.34%.另外,在低任务量状态下,该模型的调度效果也明显优于其他对比算法,且任务逾期时间范围不超过10ms.上述结果表明,该模型经过优化后能够保持较好的任务调度效果,且可有效提升计算机对服务器资源的利用率,因此该算法可为计算机的任务调度提供良好参考。 展开更多
关键词 多目标决策优化 双深度Q网络 改进鲸鱼优化算法 高斯收敛
在线阅读 下载PDF
基于超宽带定位技术的急救设备调度系统构建及应用
19
作者 奚肖玲 王景亮 +1 位作者 徐耀 翁玲 《中国医学装备》 2025年第7期92-98,共7页
目的:构建基于超宽带(UWB)定位技术的急救设备调度系统,以提升设备动态管理能力与临床响应效率。方法:急救设备调度系统包含智能医疗设备网络物联感知层、网络层、数据服务层和业务应用层,集成UWB厘米级定位技术与深度强化学习(DQN)算法... 目的:构建基于超宽带(UWB)定位技术的急救设备调度系统,以提升设备动态管理能力与临床响应效率。方法:急救设备调度系统包含智能医疗设备网络物联感知层、网络层、数据服务层和业务应用层,集成UWB厘米级定位技术与深度强化学习(DQN)算法,可实现设备实时定位与智能调度决策。选取宁波市医疗中心李惠利医院东部院区重症监护(ICU)病区2023年1月至2024年12月在用的35台急救设备,根据设备管理模式不同将2023年1月至6月采用传统人工调度管理的25台设备纳入对照组,2023年7月至12月采用基于UWB定位技术的调度系统管理的25台设备(含原对照组中的15台设备及后期新增10台)纳入观察组。比较两组设备调度效率、设备利用率、设备定位精度以及设备维护效率。结果:观察组设备平均调度时间为(7.2±0.8)min,显著短于对照组的(12.2±1.5)min,差异有统计学意义(t=18.34,P<0.05)。观察组平均移动距离、故障响应时间显著低于对照组,设备利用率显著高于对照组,差异具有统计学意义(t=15.67、14.28、6.92,P<0.05)。观察组故障修复率显著高于对照组,差异有统计学意义(x^(2)=7.80,P<0.05),定位误差为(35±10)cm。结论:基于UWB的调度系统显著优化了急救设备资源调配流程,提高了设备利用率与管理效率,为临床急救的快速响应提供了可靠技术支撑。 展开更多
关键词 超宽带(UWB)定位技术 急救设备调度 智能医疗设备网络 深度强化学习(DQN) 设备利用率
暂未订购
基于深度强化学习的柔性作业车间调度算法 被引量:1
20
作者 何其静 李学华 陈硕 《北京信息科技大学学报(自然科学版)》 2025年第2期74-84,共11页
传统车间调度算法通常依赖静态环境和固定问题规模的简化假设,在大规模复杂作业车间的适应性较低。针对动态柔性作业车间调度问题(dynamic flexible job shop scheduling problem,DFJSP),提出了一种多目标动态柔性作业车间调度算法(mult... 传统车间调度算法通常依赖静态环境和固定问题规模的简化假设,在大规模复杂作业车间的适应性较低。针对动态柔性作业车间调度问题(dynamic flexible job shop scheduling problem,DFJSP),提出了一种多目标动态柔性作业车间调度算法(multi-objective dynamic flexible job shop scheduling algorithm,MODFJSA)。以最小化累计延迟和最小化总碳排放量为优化目标,建立了多目标动态柔性作业车间调度模型。基于双重深度Q网络,建立了基于随机作业到达的分布式多智能体动态作业车间调度算法,将DFJSP转化为涉及机器选择、工序排序和速度控制的顺序决策问题,实现实时优化的调度决策。动态实例仿真分析结果验证了MODFJSA的有效性,与现有调度算法相比,所提算法性能表现更好。 展开更多
关键词 工业物联网 动态柔性作业车间调度 多目标优化 实时决策 强化学习 双重深度Q网络
在线阅读 下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部