受边缘节点在时间片内资源分配对抗关系的影响,利用单向收敛的方式求解信道资源分配方案时,易导致信道容量相对较低,因此提出基于势博弈的无线通信网络信道资源智能化分配方法。对时间片内边缘节点资源分配函数进行笛卡尔积运算,输出所...受边缘节点在时间片内资源分配对抗关系的影响,利用单向收敛的方式求解信道资源分配方案时,易导致信道容量相对较低,因此提出基于势博弈的无线通信网络信道资源智能化分配方法。对时间片内边缘节点资源分配函数进行笛卡尔积运算,输出所有边缘节点资源分配方案集合;以自身收益最大化为目标,构建信道资源分配势博弈模型;利用双竞争深度Q网络(Dueling Double Deep Q Network,D3QN)算法求解势模型,利用深度双Q网络(Double Deep Q-Network,DDQN)改进收敛过程中的损失函数,避免过度估计问题,并构造包含对抗关系的神经网络结构,在模型求解中实现多维收敛,经迭代输出信道资源分配的最优解。测试结果表明:该方法可以提升无线通信网络信道传输速率,使网络信道容量超过20 Mb/s。展开更多
如何在客户规定的时间内合理安排车辆运输路线,一直是物流领域亟待解决的问题。基于此,文章提出使用基于软更新策略的决斗双重深度Q网络(Dueling Double Deep Q-network,D3QN),设计动作空间、状态空间与奖励函数,对带时间窗的绿色车辆...如何在客户规定的时间内合理安排车辆运输路线,一直是物流领域亟待解决的问题。基于此,文章提出使用基于软更新策略的决斗双重深度Q网络(Dueling Double Deep Q-network,D3QN),设计动作空间、状态空间与奖励函数,对带时间窗的绿色车辆路径问题进行建模与求解。选择了小、中、大规模的总计18个算例,将三种算法的实验结果在平均奖励、平均调度车辆数、平均里程和运算时间四个维度进行比较。实验结果表明:在大多数算例中,与Double DQN和Dueling DQN相比,D3QN能在可接受的增加时间范围内,获得更高的奖励函数,调度更少的车辆数,运输更短的里程,实现绿色调度的目标。展开更多
在用户密集分布的蜂窝网络中,功率分配是决定系统性能和通信质量的重要因素之一。由于现有的功率分配算法往往达不到理想效果,而且泛化能力较差。在此基础上,提出一种基于D3QN(dueling double deep Q network)的功率分配算法来优化系统...在用户密集分布的蜂窝网络中,功率分配是决定系统性能和通信质量的重要因素之一。由于现有的功率分配算法往往达不到理想效果,而且泛化能力较差。在此基础上,提出一种基于D3QN(dueling double deep Q network)的功率分配算法来优化系统的传输速率。D3QN采用双神经网络和竞争网络优化神经网络的结构,通过解耦动作的选择和价值的评估,解决了DQN中出现的高估问题。仿真结果表明,该算法能够获得的平均速率比DQN高7.14%,在收敛速度和稳定性方面也有较好的表现,且泛化能力较强,可适用于不同实际场景。展开更多
文摘受边缘节点在时间片内资源分配对抗关系的影响,利用单向收敛的方式求解信道资源分配方案时,易导致信道容量相对较低,因此提出基于势博弈的无线通信网络信道资源智能化分配方法。对时间片内边缘节点资源分配函数进行笛卡尔积运算,输出所有边缘节点资源分配方案集合;以自身收益最大化为目标,构建信道资源分配势博弈模型;利用双竞争深度Q网络(Dueling Double Deep Q Network,D3QN)算法求解势模型,利用深度双Q网络(Double Deep Q-Network,DDQN)改进收敛过程中的损失函数,避免过度估计问题,并构造包含对抗关系的神经网络结构,在模型求解中实现多维收敛,经迭代输出信道资源分配的最优解。测试结果表明:该方法可以提升无线通信网络信道传输速率,使网络信道容量超过20 Mb/s。
文摘在用户密集分布的蜂窝网络中,功率分配是决定系统性能和通信质量的重要因素之一。由于现有的功率分配算法往往达不到理想效果,而且泛化能力较差。在此基础上,提出一种基于D3QN(dueling double deep Q network)的功率分配算法来优化系统的传输速率。D3QN采用双神经网络和竞争网络优化神经网络的结构,通过解耦动作的选择和价值的评估,解决了DQN中出现的高估问题。仿真结果表明,该算法能够获得的平均速率比DQN高7.14%,在收敛速度和稳定性方面也有较好的表现,且泛化能力较强,可适用于不同实际场景。