针对无监督环境下传统网络异常诊断算法存在异常点定位和异常数据分类准确率低等不足,通过设计一种基于改进Q-learning算法的无线网络异常诊断方法:首先基于ADU(Asynchronous Data Unit异步数据单元)单元采集无线网络的数据流,并提取数...针对无监督环境下传统网络异常诊断算法存在异常点定位和异常数据分类准确率低等不足,通过设计一种基于改进Q-learning算法的无线网络异常诊断方法:首先基于ADU(Asynchronous Data Unit异步数据单元)单元采集无线网络的数据流,并提取数据包特征;然后构建Q-learning算法模型探索状态值和奖励值的平衡点,利用SA(Simulated Annealing模拟退火)算法从全局视角对下一时刻状态进行精确识别;最后确定训练样本的联合分布概率,提升输出值的逼近性能以达到平衡探索与代价之间的均衡。测试结果显示:改进Q-learning算法的网络异常定位准确率均值达99.4%,在不同类型网络异常的分类精度和分类效率等方面,也优于三种传统网络异常诊断方法。展开更多
随着智能体在复杂动态环境中的路径规划需求日益增长,传统Q-Learning算法在收敛速度、避障效率及全局优化能力上的局限性逐渐凸显。针对Q-Learning算法在路径规划中的不足,本文提出一种结合动态学习率、自适应探索率与蒙特卡洛树搜索(Mo...随着智能体在复杂动态环境中的路径规划需求日益增长,传统Q-Learning算法在收敛速度、避障效率及全局优化能力上的局限性逐渐凸显。针对Q-Learning算法在路径规划中的不足,本文提出一种结合动态学习率、自适应探索率与蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)的改进方法。首先,通过引入指数衰减的动态学习率与探索率,以平衡算法在训练初期的探索能力与后期的策略稳定性;其次,将MCTS与Q-Learning结合,利用MCTS的全局搜索特性优化Q值更新过程;此外,融合启发式函数以改进奖励机制,引导智能体更高效地逼近目标。实验结果表明,改进算法的平均步数、收敛速度、稳定性等相较于传统算法提升显著,本研究为复杂环境下的智能体路径规划提供了一种高效、鲁棒的解决方案。展开更多
文摘针对无监督环境下传统网络异常诊断算法存在异常点定位和异常数据分类准确率低等不足,通过设计一种基于改进Q-learning算法的无线网络异常诊断方法:首先基于ADU(Asynchronous Data Unit异步数据单元)单元采集无线网络的数据流,并提取数据包特征;然后构建Q-learning算法模型探索状态值和奖励值的平衡点,利用SA(Simulated Annealing模拟退火)算法从全局视角对下一时刻状态进行精确识别;最后确定训练样本的联合分布概率,提升输出值的逼近性能以达到平衡探索与代价之间的均衡。测试结果显示:改进Q-learning算法的网络异常定位准确率均值达99.4%,在不同类型网络异常的分类精度和分类效率等方面,也优于三种传统网络异常诊断方法。
文摘随着智能体在复杂动态环境中的路径规划需求日益增长,传统Q-Learning算法在收敛速度、避障效率及全局优化能力上的局限性逐渐凸显。针对Q-Learning算法在路径规划中的不足,本文提出一种结合动态学习率、自适应探索率与蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)的改进方法。首先,通过引入指数衰减的动态学习率与探索率,以平衡算法在训练初期的探索能力与后期的策略稳定性;其次,将MCTS与Q-Learning结合,利用MCTS的全局搜索特性优化Q值更新过程;此外,融合启发式函数以改进奖励机制,引导智能体更高效地逼近目标。实验结果表明,改进算法的平均步数、收敛速度、稳定性等相较于传统算法提升显著,本研究为复杂环境下的智能体路径规划提供了一种高效、鲁棒的解决方案。