基于领域自适应深度强化学习的跨分布车辆路径求解方法

Across-distribution vehicle routing method based on domain-adaptive deep reinforcement learning

下载PDF

导出

摘要现有基于神经网络的车辆路径求解方法通常假设训练和测试实例服从相同分布(即,均匀分布),从而导致跨分布场景的泛化能力弱。为此,本文提出一种基于领域自适应强化学习的跨分布车辆路径求解方法,核心在于领域自适应。该方法设计一种基于分布引导的自适应策略网络(DGATP),并将其嵌入端到端深度强化学习框架(DRL),以解决跨分布车辆路径求解问题。具体的是,首先,构建分布识别模块,以感知源域与目标域的差异并进行特征提取和分布识别;其次,建立门控融合网络,以自适应地加权与融合不同分布的特征;最后,设计感知注意力解码器,以生成路由策略。基于两个代表性深度模型的实验结果表明,与传统方法相比,DGATP性能在跨分布场景下取得显著提升,展现优异的泛化性和通用性。 Most existing neural network-based vehicle routing methods usually assume identical distributions(i.e.,a uniform distributions)across instances,which makes them difficult to generalize to cross-distribution scenarios.To this end,this paper proposes a cross-distribution vehicle routing approach based on domain-adaptive reinforcement learning,with domain adaptation as its core principle.The proposed method involves designing a Distribution-Guided Adaptive Policy Network(DGATP)and embedding it within an end-to-end deep reinforcement learning(DRL)framework to address cross-distribution vehicle routing problems.Specifically,a distribution recognition module is first constructed to perceive differences between the source and target domains by performing feature extraction and distribution identification.Then,a gated fusion network is established to adaptively weight and fuse features from different distributions.Finally,a perception-aware attention decoder is designed to generate routing policies.Experimental results based on two representative deep learning models demonstrate that the DGATP approach significantly outperforms traditional methods in cross-distribution scenarios,exhibiting excellent generalization and universality.

作者金友龙夏大文 JIN Youlong;XIA Dawen(School of Data Science and Information Engineering,Guizhou Minzu University,Guiyang 550025,China)

机构地区贵州民族大学数据科学与信息工程学院

出处《智能计算机与应用》 2025年第12期17-22,共6页 Intelligent Computer and Applications

基金贵州省高等学校大数据分析与智能计算重点实验室(黔教技[2023]012号)。

关键词车辆路径问题深度强化学习 DGATP 门控融合网络领域自适应 vehicle routing problems deep reinforcement learning DGATP gate-controlled fusion network domain adaptation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1顾艳鑫,赖红波.模糊时间窗下考虑动态需求的生鲜路径优化[J].智能计算机与应用,2023,13(2):53-59. 被引量：2
2杨威,周义棚.基于LSTM网络预测智能车辆变道的路径规划研究[J].智能计算机与应用,2023,13(7):144-149. 被引量：1

二级参考文献12

1滕玥,孙丽君,周雅娴.考虑危险品运输风险的多车型车辆路径优化方法[J].系统工程,2020,38(1):93-102. 被引量：14
2曾德全,余卓平,张培志,陈慧勇.三次B样条曲线的无人车避障轨迹规划[J].同济大学学报（自然科学版）,2019,47(S01):159-163. 被引量：16
3王崇伦,李振龙,陈阳舟,代桂平.考虑换道约束空间的车辆换道模型研究[J].公路交通科技,2012,29(1):121-127. 被引量：26
4张颖达,邵春福,李慧轩,马雪婧.基于NGSIM轨迹数据的换道行为微观特性分析[J].交通信息与安全,2015,33(6):19-24. 被引量：25
5张文博,苏秦,程光路.基于动态需求的带时间窗的车辆路径问题[J].工业工程与管理,2016,21(6):68-74. 被引量：46
6黄晶,蓟仲勋,彭晓燕,胡林.考虑驾驶人风格的换道轨迹规划与控制[J].中国公路学报,2019,32(6):226-239. 被引量：48
7王超,高扬,刘超,王明刚.基于回溯搜索优化算法求解带时间窗和同时送取货的车辆路径问题[J].计算机集成制造系统,2019,25(9):2237-2247. 被引量：18
8黄玲,郭亨聪,张荣辉,吴建平.人机混驾环境下基于LSTM的无人驾驶车辆换道行为模型[J].中国公路学报,2020,33(7):156-166. 被引量：41
9赵树恩,王金祥,李玉玲.基于多目标优化的智能车辆换道轨迹规划[J].交通运输工程学报,2021,21(2):232-242. 被引量：25
10吕佳,邱建岗.智能汽车避障路径规划与跟踪控制研究[J].机械设计与制造,2021(11):166-171. 被引量：12

共引文献1

1李明月.基于交通路况的生鲜产品物流配送路径优化研究[J].中国物流与采购,2025(4):47-48.

1王燕芬.爬电距离和电气间隙的路径分析[J].中国检验检测,2025,33(5):54-59.
2刘雷,霍永刚,周星.一种数字电视能效测试信号验证方法[J].电视技术,2025,49(10):7-10.
3宋蓓蓓,余战秋.无人机集群协同搜救任务智能分配方法研究[J].黑龙江工业学院学报(综合版),2025,25(10):118-123.
4单国强,李大鹏.基于注意力机制的多智能体强化学习算法[J].无线通信技术,2025,34(4):44-50.
5王东伟,黄德启,张阳婷,贺佳佳.基于多智能体通信的城市交通信号控制研究[J].东北师大学报(自然科学版),2025,57(4):57-63.
6吴声睿.分支定价算法优化多属性车辆路径问题[J].中国物流与采购,2025(22):45-47.
7孟浩,徐飞,符帅,孙鹏,郝玲,刘博宇,刘芷维.考虑温控型负荷特性影响的集群用户超短期负荷预测方法[J].中国电力,2025,58(12):63-72.
8张志锋.铁路机车牵引电机的状态维修分析研究[J].家电维修,2025(12):110-112.
9黄成,殷振凯,邢爱佳,于智龙.基于深度强化学习的空间捕获自主决策[J].仪器仪表学报,2025,46(9):198-211.
10马英,刘圆,刘海英,秦安妍,王安兴,张芷毓,冯景秋,何兴金,李娟.青藏高原特有中药太白米基原分类考证和资源调查[J].西南民族大学学报(自然科学版),2025,51(6):640-649.

智能计算机与应用

2025年第12期

浏览历史

内容加载中请稍等...

基于领域自适应深度强化学习的跨分布车辆路径求解方法

参考文献2

二级参考文献12

共引文献1

相关作者

相关机构

相关主题

浏览历史