-
题名基于强化学习算法的网络拥塞控制
被引量:2
- 1
-
-
作者
王春茹
吴捷
郭红霞
-
机构
华南理工大学电力学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第3期18-20,共3页
-
基金
国家自然科学基金资助(编号:60174025)
-
文摘
论文将强化学习算法应用于网络的拥塞控制中,该网络拥塞控制器可以调节源端发送数据的速率,使网络中可能发生拥塞的节点的缓冲区队列长度逼近给定值,从而避免了拥塞的发生,保证了网络的稳定运行。仿真实验验证了算法的有效性。
-
关键词
强化学习
拥塞控制
缓冲区队列长度
-
Keywords
reinforcement learning,congestion control,buffer queue length
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名一种基于神经元强化学习的网络拥塞控制方法
被引量:1
- 2
-
-
作者
周川
狄东杰
陈庆伟
郭毓
-
机构
南京理工大学自动化学院
-
出处
《动力学与控制学报》
2011年第1期54-57,共4页
-
基金
江苏省自然科学基金(BK2007206)
南京理工大学自主科研专项计划(2010GJPY066)
南京市留学回国启动基金资助项目~~
-
文摘
提出了一种基于神经元强化学习(Neuron-based Reinforcement Learning,NRL)的自适应AQM算法,采用链路速率和队列长度作为拥塞指示,可根据网络环境的变化在线自动调整神经元参数,从而保持良好的队列长度稳定性和对网络负载波动的鲁棒性.该算法结构简单、易于实现,且不依赖对象的模型.仿真结果表明,该算法尤其适合于解决复杂不确定性网络的拥塞控制问题,并具有更好的队列稳定性和鲁棒性.
-
关键词
拥塞控制
主动队列管理(AQM)
神经元
强化学习
-
Keywords
congestion control
Active queue Management
neuron
reinforcement learning
-
分类号
TP393.06
[自动化与计算机技术—计算机应用技术]
-
-
题名基于再励学习的主动队列管理算法
被引量:7
- 3
-
-
作者
张雁冰
杭大明
马正新
曹志刚
-
机构
清华大学电子工程系微波与数字通信国家重点实验室
-
出处
《软件学报》
EI
CSCD
北大核心
2004年第7期1090-1098,共9页
-
基金
国家高技术研究发展计划(863)~~
-
文摘
从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcementlearninggradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性.
-
关键词
拥塞控制
主动队列管理
再励学习
-
Keywords
congestion control
active queue management
reinforcement learning
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名一种数据丢包情况下的交叉口排队长度均衡控制方法
被引量:5
- 4
-
-
作者
闫帅明
卜旭辉
朱盼盼
梁嘉琪
-
机构
河南理工大学电气工程与自动化学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第1期21-29,共9页
-
基金
国家自然科学基金(61573129,U1804147)
河南省创新型科技团队项目(CXTD2016054)
河南理工大学创新型科技团队项目(T2019-2)。
-
文摘
针对交通数据在传输过程中随机丢包造成交通拥堵的问题,提出一种新的交叉口排队长度均衡控制方法。考虑到交叉口交通控制的重复特性和强非线性,将无模型自适应迭代学习控制方案应用于交叉口排队长度控制中,通过实时调整各交叉口的信号配时方案来调节路口车辆的排队长度,实现各交叉口排队长度的均衡。针对道路交通网络控制中排队长度差值数据在传输过程中存在的丢包现象,将数据丢失现象描述为概率已知的伯努利序列,提出数据丢失情况下的补偿算法,即利用上次迭代的输出数据、伪梯度的估计值和控制输入差值对丢失数据进行补偿,解决存在数据丢包情况下多交叉口排队长度均衡控制问题。仿真结果表明,该方法在数据丢包的情况下迭代100次左右能够收敛于期望值并达到期望控制效果,验证了补偿算法的有效性。
-
关键词
交通拥堵
数据丢包
无模型自适应迭代学习控制
信号配时
排队长度均衡
补偿算法
-
Keywords
traffic congestion
data packet dropout
Model-Free Adaptive Iterative learning control(MFAILC)
signal timing
queue length balance
compensation algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于强化学习的船舶网络数据传输拥塞控制方法
被引量:3
- 5
-
-
作者
董洁
-
机构
赤峰学院数学与计算机科学学院
-
出处
《舰船科学技术》
北大核心
2023年第3期165-168,共4页
-
基金
内蒙古自治区高等学校科学研究项目(NJZY22180)。
-
文摘
针对船舶网络数据量大、缓冲队列过长导致的拥塞问题,提出一种强化学习的船舶网络数据传输拥塞控制方法。针对链路拥塞节点的时延和数据流分散特点,建立拥塞问题模型,运用非线性微分法,计算拥塞前后可控和非可控数据流在预设节点处队列长度和数据传输滞留的变化,设定参考阈值,当滞留数值和队列长度超过该值时表明源端发送窗口与接收窗口间链路存在拥塞,按照数据传输平均往返时间确定具体出现拥塞的节点位置。利用强化学习算法,求得经过和未经过拥塞点的数据队列长度变化,根据数据的反馈回报,计算拥塞概率较高链路与正常链路间的窗口差值;根据数据队列长度、流量以及速率值,调节窗口大小补偿值,完成拥塞控制。实验结果表明,实施控制后船舶网络吞吐量增大,节点受限次数下降,控制效果较好。
-
关键词
强化学习
船舶网络
数据传输拥塞
队列长度
-
Keywords
reinforcement learning
ship network
data transmission congestion
queue length
-
分类号
TP157
[自动化与计算机技术—控制理论与控制工程]
-