一种基于强化学习的信道决策方法

A Channel Decision-Making Method Based on Reinforcement Learning

下载PDF

导出

摘要电磁环境的复杂多变对军用无线通信系统的抗干扰能力提出了更高的要求,传统的扩跳频抗干扰方式缺乏灵活性,难以抵挡动态变化的干扰信号。从抵抗动态干扰的需求出发,提出了基于改进Q-Learning的信道决策方法。在传统Q-Learning算法的基础上采用动态ε机制的动作选择策略,并设计了一种将误码率和能量消耗相结合的奖励函数。在固定模式干扰、扫频干扰、跟随式干扰下进行验证,仿真结果表明,所提算法能够较快速收敛,降低与干扰发生“碰撞”的可能性,有效地进行了干扰规避,适用于抗干扰动态决策。 The complexity and variability of the electromagnetic environment puts forward higher requirements for the anti-jamming capability of military wireless communication systems,and the traditional spread spectrum hopping anti-jamming method lacks flexibility to resist the dynami-cally changing jamming signals.From the demand of resisting dynamic jamming,a channel deci-sion-making method based on improved Q-Learning is proposed,which adopts the action selec-tion strategy of dynamicεmechanism on the basis of the traditional Q-Learning algorithm,and designs a reward function that combines the bit error rate and energy consumption.The proposed algorithm is validated under fixed mode jamming,frequency sweeping jamming and following jamming.Simulation results show that the proposed algorithm can converge quickly,reduce the possibility of“collision”with jamming,and effectively avoid jamming,which is suitable for anti-jamming dynamic decision-making.

作者侯艳丽贾怡霈崔惠敏 HOU Yanli;JIA Yipei;CUI Huimin(School of Information Science and Engineering,Hebei University of Science and Technology,Shijiazhuang 050018,China)

机构地区河北科技大学信息科学与工程学院

出处《电子信息对抗技术》 2025年第5期60-65,共6页 Electronic Information Warfare Technology

基金河北省重点研发计划项目(21355901D)。

关键词信道决策干扰规避 Q-Learning算法无线通信 channel decision-making jamming avoidance Q-Learning algorithm wireless communications

分类号 TN973 [电子电信—信号与信息处理]

引文网络
相关文献

参考文献8

1宋佰霖,许华,蒋磊,饶宁.一种基于深度强化学习的通信抗干扰智能决策方法[J].西北工业大学学报,2021,39(3):641-649. 被引量：25
2马海波,俞力,周新,冯熳.基于Q-learning及其改进算法的信道决策方法[J].现代信息科技,2020,4(20):81-84. 被引量：2
3吴志娟,林艳,张一晋,束锋,李骏.基于多智能体协同的无人机簇群多域节能抗干扰通信[J].中国科学：信息科学,2023,53(12):2511-2526. 被引量：11
4李芳,熊俊,赵肖迪,赵海涛,魏急波,苏曼.基于快速强化学习的无线通信干扰规避策略[J].电子与信息学报,2022,44(11):3842-3849. 被引量：9
5李博扬,刘洋,万诺天,许魁,夏晓晨,张月月,张咪.基于强化学习的无人机电磁干扰感知与抗干扰传输方法[J].电讯技术,2023,63(12):1855-1861. 被引量：10
6李思达,徐逸凡,刘杰,林凡迪,韩昊,易剑波,徐煜华.基于深度迁移学习的动态频谱快速适配抗干扰方法[J].信息对抗技术,2024,3(1):33-45. 被引量：4
7王小康,冀杰,刘洋,贺庆.基于改进Q学习算法的无人物流配送车路径规划[J].系统仿真学报,2024,36(5):1211-1221. 被引量：15
8朱芮,马永涛,南亚飞,张云蕾.融合改进强化学习的认知无线电抗干扰决策算法[J].计算机科学与探索,2019,13(4):693-701. 被引量：6

二级参考文献25

1江虹,伍春,刘勇.基于强化学习的频谱决策与传输算法[J].系统仿真学报,2013,25(3):565-570. 被引量：2
2Xin MA,Ya XU,Guo-qiang SUN,Li-xia DENG,Yi-bin LI.State-chain sequential feedback reinforcement learning for path planning of autonomous mobile robots[J].Journal of Zhejiang University-Science C(Computers and Electronics),2013,14(3):167-178. 被引量：5
3赵彪,李鸥,栾红志.Q学习算法在机会频谱接入信道选择中的应用[J].信号处理,2014,30(3):298-305. 被引量：4
4赵星宇,丁世飞.深度强化学习研究综述[J].计算机科学,2018,45(7):1-6. 被引量：66
5杨鸿杰,张君毅.基于强化学习的智能干扰算法研究[J].电子测量技术,2018,41(20):49-54. 被引量：17
6聂生鹏,刘金虎.基于小波去噪的联合频谱感知优化算法[J].计算机应用与软件,2020,37(2):73-77. 被引量：7
7Fandi Lin,Jin Chen,Jiachen Sun,Guoru Ding,Ling Yu.Cross-Band Spectrum Prediction Based on Deep Transfer Learning[J].China Communications,2020,17(2):66-80. 被引量：9
8卢光跃,施聪,吕少卿,周亮.基于LSTM神经网络的频谱感知算法[J].信号处理,2019,35(12):2070-2076. 被引量：9
9刘春玲,刘敏提,丁元明.基于多域联合的无人机集群认知抗干扰算法[J].计算机工程,2020,46(12):193-200. 被引量：11
10黄凯文,赵煜,黄玲,周金伟.基于机械视觉的Arduino智能物流配送车[J].河南科技,2021,40(22):19-23. 被引量：3

共引文献72

1夏重阳,张剑书,吴晓富,靳越.面向抗干扰跳频通信的混合改进DQN决策算法[J].电子测量技术,2023,46(20):50-57. 被引量：3
2董浩,丛伟杰,商锋.基于RLS算法的阵列天线抗干扰性能研究[J].宇航计测技术,2020,40(1):79-84. 被引量：5
3马海波,俞力,周新,冯熳.基于Q-learning及其改进算法的信道决策方法[J].现代信息科技,2020,4(20):81-84. 被引量：2
4朱佳璐,马永涛,刘开华.基于LSTM及DQN的多用户联合抗干扰决策算法[J].传感技术学报,2021,34(6):811-817. 被引量：5
5赵禄达,王斌,胡译舒元,曾威.战术电子干扰行动的NSGA-Ⅱ多目标决策建模与分析[J].电讯技术,2021,61(9):1093-1101.
6贾志超.无线电通信抗干扰方法研究[J].长江信息通信,2022,35(3):69-71. 被引量：3
7黎枫.基于NoC架构的网络通信抗干扰方法研究[J].数字通信世界,2022(8):44-46. 被引量：1
8李敏.基于嵌入式的通信信道抗干扰方法[J].长江信息通信,2022,35(10):85-87. 被引量：2
9陈海涛,龚广伟,张姣,赵海涛,熊俊,魏急波,詹德川.基于NS3-gym框架的智能干扰规避系统设计与实现[J].计算机工程与应用,2023,59(4):252-260.
10董秀娟,兰建平,梁西银.用于复杂环境的多径电子通信信号抗干扰仿真[J].计算机仿真,2023,40(1):218-222. 被引量：8

1姚昌华,万中妨,张建照,李家强,陈金立.基于动态联盟的无人机集群协同干扰方法[J].电讯技术,2024,64(9):1353-1360. 被引量：2
2孙轶峰,王惟青,王梓任.基于鸿蒙的电力设备频谱感知与干扰规避研究[J].电气技术与经济,2025(7):32-34.
3朱璇,魏巍.“星链”手机直连频率干扰规避能力分析[J].数字通信世界,2025(7):86-88.
4石爽,刘子威,张更新,张步阳,朱进.低轨卫星互联网链路受扰性能分析[J].移动通信,2025,49(6):19-26.
5师沙沙,周青松,钱佳龙,陈沁娴,李志汇.基于Dyan-Q的智能雷达组合抗干扰路径选择[J].现代雷达,2025,47(7):73-79.
6杨丹,胡琳,李茂光,张影,李小静,叶强,李敏.质量源于设计理念下多糖结合疫苗系统开发及全过程控制策略[J].中国生物制品学杂志,2025,38(8):1012-1018.
7杨本强,杨杰,王毅.机器人视觉伺服控制系统在自动化生产线中的应用[J].人工智能与机器人研究,2025,14(4):878-884.
8韩光洁,邹昕莹,张帆,徐政伟.Soft-DDPG算法驱动的综合能源系统优化调度方法[J].小型微型计算机系统,2025,46(9):2258-2265.
9任宇舟,高鹏,孔一诺,彭尧建珑,胡华全.连续波扫频干扰下多模导航接收机信噪比和干扰衰减度评估[J].航天工程大学学报,2025,2(4):87-92.
10张建峰,任显昊,魏际英.军事体育聚组体能训练的实践研究[J].当代体育科技,2025,15(23):14-16.

电子信息对抗技术

2025年第5期

浏览历史

内容加载中请稍等...

一种基于强化学习的信道决策方法

参考文献8

二级参考文献25

共引文献72

相关作者

相关机构

相关主题

浏览历史