基于深度强化学习的车联网频谱分配研究

Deep Reinforcement Learning-based Spectrum Allocation in Vehicular Networks

下载PDF

导出

摘要为了缓解车联网中车辆用户数持续增长与频谱资源有限之间的矛盾,提出一种基于单调值函数分解结合自注意力机制的多智能体深度强化学习算法,旨在通过学习优化车联网中车对车链路(Vehicle-to-Vehicle,V2V)信道选择和功率控制的联合策略,实现车对基础设施链路(Vehicle-to-Infrastructure,V2I)总信道容量最大化,同时保证V2V链路传输时延和可靠性要求。针对车联网环境动态变化导致V2V链路无法实时收集完整信道状态信息的问题,为每条V2V链路构建深度循环Q网络,能使每条V2V链路基于自身局部观测信息自主决策。为了确保每条V2V链路局部策略的优化方向与全局利益最大化保持一致,设计了具有单调性约束的全局混合网络指引训练优化。此外,通过构建基于自注意力机制的信息交互模块,进一步优化V2V链路间的协作。仿真结果表明,与基线算法相比,本文所提出的算法在V2I链路总信道容量上提高了1.44~8.24个百分点,在V2V链路传输时延上缩短了1.93~15.04个百分点,能有效指导V2V链路根据环境的变化及时调整信道选择和功率控制的决策,从而保证了链路的通信质量。 A dynamic spectrum allocation scheme is proposed to address the growing number of vehicles and limited spectrum resources in vehicular networks.It integrates the self-attention mechanism and monotonic value function factorisation into deep multi-agent reinforcement learning to optimize channel selection and power levels for vehicle-to-vehicle(V2V)links.The global objective is to maximize the sum throughput of vehicle-toinfrastructure(V2I)links,while meeting the latency and reliability constraints of V2V links.To handle incomplete real-time channel state information due to dynamic environment,a deep recurrent Q-network is deployed for each V2V link,enabling autonomous decision-making based on local observations.To align the local strategy optimization of each V2V link with the global objective,a global mixing network with monotonicity constraints is designed to guide the algorithm training.Additionally,an information interaction model based on the self-attention mechanism further optimizes collaboration between V2V links.Compared with the baselines,the proposed algorithm increases the sum throughput of V2I links by 1.44~8.24 percentage point and reduces the transmission delay of V2V links by 1.93~15.04 percentage point.These results confirm its effectiveness in optimizing channel selection and power levels for improved communication quality.

作者林志聪王永华万频 Lin Zhicong;Wang Yonghua;Wan Pin(School of Automation,Guangdong University of Technology,Guangzhou 510006,China;School of Intelligent Manufacturing and Electrical Engineering,Guangzhou Institute of Science and Technology,Guangzhou 510540,China)

机构地区广东工业大学自动化学院广州理工学院智能制造与电气工程学院

出处《广东工业大学学报》 2025年第3期101-110,共10页 Journal of Guangdong University of Technology

基金国家自然科学基金资助项目(61971147) 广东省基础与应用基础研究基金资助项目(2023A1515011888) 广东省研究生教育创新计划项目(2024JGXM_049)。

关键词车联网频谱分配强化学习自注意力机制 vehicular networks spectrum allocation reinforcement learning self-attention mechanism

分类号 TN929.5 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1邓雨康,张磊,李晶.车联网隐私保护研究综述[J].计算机应用研究,2022,39(10):2891-2906. 被引量：28
2何一汕,王永华,万频,王磊,伍文韬.面向多用户动态频谱接入的改进双深度Q网络方法研究[J].广东工业大学学报,2023,40(4):85-93. 被引量：5
3王磊,王永华,何一汕,伍文韬.基于GRU和LSTM组合模型的车联网信道分配方法[J].电讯技术,2024,64(2):273-280. 被引量：4
4王为念,苏健,陈勇,张建照,唐震.基于多智能体深度强化学习的车联网频谱共享[J].电子学报,2024,52(5):1690-1699. 被引量：5
5方维维,王云鹏,张昊,孟娜.基于多智能体深度强化学习的车联网通信资源分配优化[J].北京交通大学学报,2022,46(2):64-72. 被引量：20

二级参考文献36

1张汝波,仲宇,顾国昌.A new accelerating algorithm for multi-agent reinforcement learning[J].Journal of Harbin Institute of Technology(New Series),2005,12(1):48-51. 被引量：1
2孟源,柴舒杨,罗正华,雷霖.车联网网络架构分析[J].成都大学学报（自然科学版）,2012,31(4):346-349. 被引量：8
3陈娜.车联网安全防护体系的设计与分析[J].电脑开发与应用,2014,27(10):32-34. 被引量：5
4孙晓雯,赵伟,何斌,刘建业.基于无线网络的物流车联网应用层设计研究[J].电子测量技术,2016,39(5):191-195. 被引量：8
5陈山枝,胡金玲,时岩,赵丽.LTE-V2X车联网技术、标准与应用[J].电信科学,2018,34(4):1-11. 被引量：97
6王晓,要婷婷,韩双双,曹东璞,王飞跃.平行车联网:基于ACP的智能车辆网联管理与控制[J].自动化学报,2018,44(8):1391-1404. 被引量：46
7李枫,张文政,胡建勇,陈宇翔.序列密码猜测确定攻击的现状研究[J].通信技术,2018,51(10):2443-2448. 被引量：1
8崔永泉,曹玲,张小宇,曾功贤.格基环签名的车联网隐私保护[J].计算机学报,2019,42(5):980-992. 被引量：9
9曹茂森,王蕾报,胡博,谢开贵,伏坚,温力力,周平,范璇,李博,曾意.考虑电-气耦合系统连锁故障的多阶段信息物理协同攻击策略[J].电力自动化设备,2019,39(8):128-136. 被引量：16
10金博,胡延明.C-V2X车联网产业发展综述与展望[J].电信科学,2020,36(3):93-99. 被引量：25

共引文献57

1王森.基于双线性对的车联网匿名身份认证[J].电子技术与软件工程,2022(12):29-33.
2陆升阳,赵怀林,刘华平.场景图谱驱动目标搜索的多智能体强化学习[J].智能系统学报,2023,18(1):207-215. 被引量：2
3葛斌,吴彩,张天浩,沐李亭,夏晨星.基于联邦学习的边缘计算隐私保护方法[J].安徽理工大学学报（自然科学版）,2022,42(6):79-86. 被引量：6
4郑丽萍,赵玉娟,费选.基于改进MOEA/D的车联网通信资源分配算法[J].计算机工程,2023,49(5):191-197. 被引量：5
5王雷,降华.基于移动边缘计算的车联网信息分发方法设计[J].信息与电脑,2023,35(4):215-217. 被引量：1
6何业锋,李国庆,刘继祥.车联网中基于雾计算和多TA的条件隐私保护认证方案[J].计算机应用研究,2023,40(6):1845-1849. 被引量：6
7林能波,陈青霞,郭俊滨,陈柱,方玉,叶绍雄.基于强化学习天地一体化网络无线资源管理研究[J].移动通信,2023,47(7):85-91. 被引量：3
8孙彦景,余政达,陈瑞瑞,李松.车联网中基于深度强化学习的高可靠资源分配算法[J].重庆邮电大学学报（自然科学版）,2023,35(4):706-714. 被引量：4
9张焱.物联网环境下船舶短包通信资源智能分配方法[J].舰船科学技术,2023,45(17):170-173. 被引量：1
10石琴,朱俊杰,程腾,杨泽,王川宿.基于车端量子密钥的车联网数据访问控制研究[J].汽车技术,2023(10):24-31. 被引量：3

1秦诗凡,兰雯竣,常梦鸽.基于物联网的农业机械智能控制系统设计[J].中国农机装备,2025(6):1-3. 被引量：2
2李长凯.大数据技术在通信工程项目资源优化配置中的实施价值分析[J].中国宽带,2025,21(5):118-120. 被引量：3
3王舒平.基于机器视觉的智能机器人路径规划系统设计[J].自动化技术与应用,2025,44(5):19-23. 被引量：3
4曹欣,徐梦辰.采用机器学习优化大气污染监测网络的设计与实施[J].科学技术创新,2025(14):14-17.
5王光辉,蒲浩,宋陶然,李伟,张洪,胡光常.基于强化学习-蒙特卡洛树搜索的铁路线路优化[J].铁道学报,2025,47(5):102-110. 被引量：3
6韦兰花,朱炯光.基于深度学习的柔性夹持器抓取策略优化及应用[J].装备制造技术,2025(4):138-141.
7杨晓辉,朱良莉.神经胶质细胞瘤治疗策略与新技术研究进展[J].护理学论坛,2025,2(2):18-20.
8马越.医疗器械无线数据传输模块的抗干扰设计与信号优化[J].长江信息通信,2025,38(4):114-116. 被引量：1
9网词[J].中国网信,2025(4):94-96.
10王宁,梁晓龙,李哲,张佳强,胡利平.SECA:一种无人系统自主决策机制设计方法[J].火力与指挥控制,2025,50(5):23-30. 被引量：1

广东工业大学学报

2025年第3期

浏览历史

内容加载中请稍等...

基于深度强化学习的车联网频谱分配研究

参考文献5

二级参考文献36

共引文献57

相关作者

相关机构

相关主题

浏览历史