基于深度强化学习的算网协同动态路由调度算法

Computing-network collaborative dynamic routing and scheduling algorithm based on deep reinforcement learning

下载PDF

导出

摘要针对算力网络中算网资源协同不足、任务需求适配性差的问题,将算力路由问题建模为序列决策问题,提出了基于深度强化学习的算网协同动态路由调度算法。该算法借鉴混合专家模型思想,针对时延敏感型、普通型以及计算密集型3类典型场景,设计了基于编码器-解码器结构的差异化专家网络进行专项优化,并通过动作屏蔽机制约束路由选择空间,实现高效的逐跳决策,输出包含最优计算节点的路径。仿真实验结果表明,相较于其他路由调度算法,该算法在服务成功率上提升约17%,降低了端到端时延,优化了节点间的负载均衡度,展现出良好的网络拓扑适应性,能够有效满足多样化计算任务的差异化需求。 To address the issues of insufficient collaboration among computing resources and poor adaptability to task requirements in computing power networks,the computing power routing problem was modeled as a sequential decision problem.A deep reinforcement learning-based computing-aware routing algorithm was proposed for dynamic routing scheduling of computing network collaboration.The idea of hybrid expert models was drawn on and a differentiated expert network was designed based on an encoder-decoder structure for specialized optimization in three typical scenarios:delay-sensitive,ordinary,and computationally intensive.The routing selection space was constrained through an action masking mechanism to achieve efficient hop-by-hop decision-making and output a path containing the optimal computing node.The simulation experiment results show that compared with other routing scheduling algorithms,the proposed algorithm improves service success rate by about 17%,reduces end-to-end latency,optimizes load balancing between nodes,demonstrates good network topology adaptability,and can effectively meet the differentiated needs of diverse computing tasks.

作者越奇强田乐魏帅胡宇翔冯旭董永吉陈博 YUE Qiqiang;TIAN Le;WEI Shuai;HU Yuxiang;FENG Xu;DONG Yongji;CHEN Bo(Information Engineering University,Zhengzhou 450002,China;National Key Laboratory of Advanced Communication Networks,Zhengzhou 450002,China;Key Laboratory of Cyberspace Security,Ministry of Education,Zhengzhou 450002,China)

机构地区信息工程大学信息技术研究所先进通信网全国重点实验室网络空间安全教育部重点实验室

出处《电信科学》北大核心 2025年第8期33-50,共18页 Telecommunications Science

基金国家重点研发计划项目(No.2024YFB2906704) 河南省重大专项课题项目(No.22110021090003)。

关键词算力路由算网融合多场景优化序列决策深度强化学习 computing-aware routing computing-network integration multi-scenario optimization sequential decision-making deep reinforcement learning

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1Sun Yukun,Lei Bo,Liu Junlin,Huang Haonan,Zhang Xing,Peng Jing,Wang Wenbo.Computing Power Network:A Survey[J].China Communications,2024,21(9):109-145. 被引量：24
2姚惠娟,陆璐,段晓东.算力感知网络架构与关键技术[J].中兴通讯技术,2021,27(3):7-11. 被引量：37
3庞冉,易昕昕,辛亮,曹畅,唐雄燕.算力网络路由调度技术研究[J].电信科学,2023,39(8):149-156. 被引量：15
4雷波,刘增义,王旭亮,杨明川,陈运清.基于云、网、边融合的边缘计算新方案:算力网络[J].电信科学,2019,35(9):44-51. 被引量：110
5杨烨.基于算网一体化演进的算力网络技术研究[J].现代传输,2022(4):45-48. 被引量：8
6贾庆民,丁瑞,刘辉,张晨,谢人超.算力网络研究进展综述[J].网络与信息安全学报,2021,7(5):1-12. 被引量：57
7段晓东,姚惠娟,付月霞,陆璐,孙滔.面向算网一体化演进的算力网络技术[J].电信科学,2021,37(10):76-85. 被引量：64
8任杰,王洪超,王钦定,熊豪,杨冬,张宏科,谭斌,郭勇,黄光平.服务感知网络[J].电子学报,2025,53(2):371-384. 被引量：1
9魏汝翔,刘琦,赵广,曹畅,唐雄燕.东数西算下面向业务的路由策略分析与探索[J].中兴通讯技术,2023,29(4):14-18. 被引量：2
10孙钰坤,张兴,雷波.边缘算力网络中智能算力感知路由分配策略研究[J].无线电通信技术,2022,48(1):60-67. 被引量：22

二级参考文献91

1车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：122
2张素香,文娟,秦颖,袁彩霞,钟义信.实体关系的自动抽取研究[J].哈尔滨工程大学学报,2006,27(B07):370-373. 被引量：10
3邓擘,樊孝忠,杨立公.用语义模式提取实体关系的方法[J].计算机工程,2007,33(10):212-214. 被引量：27
4董静,孙乐,冯元勇,黄瑞红.中文实体关系抽取中的特征选择研究[J].中文信息学报,2007,21(4):80-85. 被引量：55
5刘克彬,李芳,刘磊,韩颖.基于核函数中文关系自动抽取系统的实现[J].计算机研究与发展,2007,44(8):1406-1411. 被引量：61
6赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：106
7徐健,张智雄,吴振新.实体关系抽取的技术方法综述[J].现代图书情报技术,2008(8):18-23. 被引量：56
8虞欢欢,钱龙华,周国栋,朱巧明.基于合一句法和实体语义树的中文语义关系抽取[J].中文信息学报,2010,24(5):17-23. 被引量：19
9陈宇,郑德权,赵铁军.基于Deep Belief Nets的中文名实体关系抽取[J].软件学报,2012,23(10):2572-2585. 被引量：75
10康辉英,李明亮.基于降维BP神经网络的高维数据分类研究[J].计算机工程与应用,2013,49(20):183-187. 被引量：7

共引文献277

1任晓旭,仇超,邓辉,戴子明,刘泽军,王晓飞.边缘智能融合区块链:研究现状、应用及挑战[J].信息与控制,2024,53(1):1-16. 被引量：8
2王岩,张旭辉,曹现刚,赵友军,杨文娟,杜昱阳,石硕.掘进工作面数字孪生体构建与平行智能控制方法[J].煤炭学报,2022,47(S01):384-394. 被引量：22
3于清林.从边缘计算到算力网络[J].产业科技创新,2020(3):49-51. 被引量：1
4周亮,徐旭,张岱,姚渭菁,张成,杨杉,付伟,刘军,张磊.企业云平台算力开放和运营体系研究[J].长江技术经济,2021,5(S02):190-193. 被引量：1
5席政.西藏自治区开发思路[J].中国投资（中英文）,2000(5):32-32. 被引量：1
6唐魁玉.万物互联时代的兴起及其边缘算法效应[J].学术前沿,2020(9):33-39. 被引量：10
7潘三明,袁明强.基于边缘计算的视频监控系统及应用[J].电信科学,2020,36(6):64-69. 被引量：11
8蔡岳平,李天驰.面向算力匹配调度的泛在确定性网络研究[J].信息通信技术,2020,14(4):9-15. 被引量：6
9李明春,王威,倪西冰.边缘计算在铁路行业的应用和价值[J].信息通信技术,2020,14(4):37-44. 被引量：2
10包顺华.5G边缘云背景下的新媒体解决方案[J].通信电源技术,2020,37(11):169-171.

1王智文,卢玉梅,张海鹏,庞煜丽.多智能体序列决策的多交叉口交通信号协同控制方法[J].计算机工程与应用,2025,61(17):344-354. 被引量：1
2邓卜侨,谢岫峰,纪明阳,艾青,王康,冯光磊.基于改进GA和JAVPRS的数据中心网络设备能耗降低研究[J].自动化与仪器仪表,2024(1):112-115.
3上海建工四建:自主研发建筑人工智能产品服务平台“云工大模型”[J].施工企业管理,2025(7):118-119.
4四维图新 SA8620P中算力行泊一体解决方案[J].汽车观察,2025(3):104-104.
5张爱军,邹忠青.DeepSeek嵌入政治传播:风险与治理路径[J].辽宁师范大学学报(社会科学版),2025,48(4):30-37. 被引量：1
6朴明杰,张冬冬,卢鹄,李汝鹏,葛小丽.基于改进Transformer的多智能体供应链库存管理方法[J].计算机科学,2025,52(S1):186-195. 被引量：2
7白亚坤.核心素养视域下高中物理教学与职业生涯教育的耦合实践路径[J].中文科技期刊数据库(引文版)教育科学,2025(9):025-028.
8姚杜纯子.永志不忘[J].解放军文艺,2025(8):30-54.
9肖瑞,邵伟.面向多模态心脏影像的多分支协同分割模型[J].数据采集与处理,2025,40(4):887-900.
10陈美汐,张霞.从“工具依附”到“认知引擎”:DeepSeek的传播主体性重构[J].新闻爱好者,2025(7):83-85. 被引量：3

电信科学

2025年第8期

浏览历史

内容加载中请稍等...

基于深度强化学习的算网协同动态路由调度算法

参考文献16

二级参考文献91

共引文献277

相关作者

相关机构

相关主题

浏览历史