期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于强化学习算法的网络拥塞控制 被引量:2
1
作者 王春茹 吴捷 郭红霞 《计算机工程与应用》 CSCD 北大核心 2005年第3期18-20,共3页
论文将强化学习算法应用于网络的拥塞控制中,该网络拥塞控制器可以调节源端发送数据的速率,使网络中可能发生拥塞的节点的缓冲区队列长度逼近给定值,从而避免了拥塞的发生,保证了网络的稳定运行。仿真实验验证了算法的有效性。
关键词 强化学习 拥塞控制 缓冲区队列长度
在线阅读 下载PDF
一种基于神经元强化学习的网络拥塞控制方法 被引量:1
2
作者 周川 狄东杰 +1 位作者 陈庆伟 郭毓 《动力学与控制学报》 2011年第1期54-57,共4页
提出了一种基于神经元强化学习(Neuron-based Reinforcement Learning,NRL)的自适应AQM算法,采用链路速率和队列长度作为拥塞指示,可根据网络环境的变化在线自动调整神经元参数,从而保持良好的队列长度稳定性和对网络负载波动的鲁棒性.... 提出了一种基于神经元强化学习(Neuron-based Reinforcement Learning,NRL)的自适应AQM算法,采用链路速率和队列长度作为拥塞指示,可根据网络环境的变化在线自动调整神经元参数,从而保持良好的队列长度稳定性和对网络负载波动的鲁棒性.该算法结构简单、易于实现,且不依赖对象的模型.仿真结果表明,该算法尤其适合于解决复杂不确定性网络的拥塞控制问题,并具有更好的队列稳定性和鲁棒性. 展开更多
关键词 拥塞控制 主动队列管理(AQM) 神经元 强化学习
在线阅读 下载PDF
基于再励学习的主动队列管理算法 被引量:7
3
作者 张雁冰 杭大明 +1 位作者 马正新 曹志刚 《软件学报》 EI CSCD 北大核心 2004年第7期1090-1098,共9页
从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcementlearninggradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节... 从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcementlearninggradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性. 展开更多
关键词 拥塞控制 主动队列管理 再励学习
在线阅读 下载PDF
一种数据丢包情况下的交叉口排队长度均衡控制方法 被引量:5
4
作者 闫帅明 卜旭辉 +1 位作者 朱盼盼 梁嘉琪 《计算机工程》 CAS CSCD 北大核心 2021年第1期21-29,共9页
针对交通数据在传输过程中随机丢包造成交通拥堵的问题,提出一种新的交叉口排队长度均衡控制方法。考虑到交叉口交通控制的重复特性和强非线性,将无模型自适应迭代学习控制方案应用于交叉口排队长度控制中,通过实时调整各交叉口的信号... 针对交通数据在传输过程中随机丢包造成交通拥堵的问题,提出一种新的交叉口排队长度均衡控制方法。考虑到交叉口交通控制的重复特性和强非线性,将无模型自适应迭代学习控制方案应用于交叉口排队长度控制中,通过实时调整各交叉口的信号配时方案来调节路口车辆的排队长度,实现各交叉口排队长度的均衡。针对道路交通网络控制中排队长度差值数据在传输过程中存在的丢包现象,将数据丢失现象描述为概率已知的伯努利序列,提出数据丢失情况下的补偿算法,即利用上次迭代的输出数据、伪梯度的估计值和控制输入差值对丢失数据进行补偿,解决存在数据丢包情况下多交叉口排队长度均衡控制问题。仿真结果表明,该方法在数据丢包的情况下迭代100次左右能够收敛于期望值并达到期望控制效果,验证了补偿算法的有效性。 展开更多
关键词 交通拥堵 数据丢包 无模型自适应迭代学习控制 信号配时 排队长度均衡 补偿算法
在线阅读 下载PDF
基于强化学习的船舶网络数据传输拥塞控制方法 被引量:3
5
作者 董洁 《舰船科学技术》 北大核心 2023年第3期165-168,共4页
针对船舶网络数据量大、缓冲队列过长导致的拥塞问题,提出一种强化学习的船舶网络数据传输拥塞控制方法。针对链路拥塞节点的时延和数据流分散特点,建立拥塞问题模型,运用非线性微分法,计算拥塞前后可控和非可控数据流在预设节点处队列... 针对船舶网络数据量大、缓冲队列过长导致的拥塞问题,提出一种强化学习的船舶网络数据传输拥塞控制方法。针对链路拥塞节点的时延和数据流分散特点,建立拥塞问题模型,运用非线性微分法,计算拥塞前后可控和非可控数据流在预设节点处队列长度和数据传输滞留的变化,设定参考阈值,当滞留数值和队列长度超过该值时表明源端发送窗口与接收窗口间链路存在拥塞,按照数据传输平均往返时间确定具体出现拥塞的节点位置。利用强化学习算法,求得经过和未经过拥塞点的数据队列长度变化,根据数据的反馈回报,计算拥塞概率较高链路与正常链路间的窗口差值;根据数据队列长度、流量以及速率值,调节窗口大小补偿值,完成拥塞控制。实验结果表明,实施控制后船舶网络吞吐量增大,节点受限次数下降,控制效果较好。 展开更多
关键词 强化学习 船舶网络 数据传输拥塞 队列长度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部