期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于异构图表示学习和D3QN-PER的外卖即时配送问题的优化研究

Representation Learning and D3QN-PER

下载PDF

导出

摘要随着O2O外卖行业的快速发展,动态订单分配与路径优化已成为提升配送效率的核心挑战。针对外卖即时配送问题中订单动态生成、备餐时间不确定、骑手与订单间的跨类型交互特性,提出一种基于异构图表示学习模块(Heterogeneous Graph Representation Learning,HGRL)与带有优先经验回放机制的决斗双深度Q网络(Dueling Double Deep Q Network with Prioritized Experience Replay,D3QNPER)算法相结合的模型。首先,本文将外卖配送系统建模为异构图,通过异构图注意力网络捕捉骑手节点与订单节点的交互关系,构建基于路径的马尔可夫决策过程(Markov Decision Process,MDP),以刻画动态决策场景。对比实验结果表明:D3QN-PER算法对应的平均客户服务水平更高,平均配送距离和配送时间更短,订单延迟率更低,且该算法具有更好的收敛性、训练稳定性和泛化性。 With the rapid development of the O2O(Online-to-Offline)food delivery industry,dynamic order assignment and route optimization have become core challenges in improving delivery efficiency.To address the characteristics of on-demand food delivery,including dynamically arriving orders,uncertain meal preparation times,and cross-type interactions between couriers and orders,this study proposes an integrated optimization model that combines a Heterogeneous Graph Representation Learning(HGRL)module with a Dueling Double Deep Q-Network with Prioritized Experience Replay(D3QN-PER)algorithm.First,the food delivery system is modeled as a heterogeneous graph,in which a heterogeneous graph attention network is employed to capture the interaction relationships between courier nodes and order nodes.A path-based Markov Decision Process(MDP)is then constructed to characterize the dynamic decision-making environment.Comparative experimental results demonstrate that the D3QN-PER algorithm achieves higher average customer service levels,shorter average delivery distances and delivery times,and lower order delay rates,while exhibiting better convergence performance,training stability,and generalization ability.

作者张文强黄永生 ZHANG Wenqiang;HUANG Yongsheng(North China University of Science and Technology,Tangshan,Hebei 063210,China)

机构地区华北理工大学

出处《物流技术》 2026年第1期57-67,共11页 Logistics Technology

基金河北省教育厅重点社科项目“京津冀地区农产品物流资源管理与发展规划研究”(SD191014) 河北省科技厅重点研发计划项目“地铁车辆车顶智能检修机器人关键技术研究”(23311804D)。

关键词外卖配送深度学习强化学习异构图马尔可夫决策订单分配路径规划 food delivery deep learning reinforcement learning heterogeneous graph Markov decision process order assignment route planning

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] F252 [经济管理—国民经济]

引文网络
相关文献

参考文献8

1陈彦如,刘珂良,冉茂亮.基于深度强化学习的外卖即时配送实时优化[J].计算机工程,2025,51(9):328-339. 被引量：2
2葛斌,田文智,夏晨星,秦望博.基于端到端深度强化学习求解有能力约束的车辆路径问题[J].计算机应用研究,2024,41(11):3245-3250. 被引量：1
3靳志宏,鞠新诚,郭加佳,杨珍花.O2O模式下外卖骑手的配送路径优化[J].大连海事大学学报,2019,45(4):55-64. 被引量：15
4李桃迎,吕晓宁,李峰,陈燕.考虑动态需求的外卖配送路径优化模型及算法[J].控制与决策,2019,34(2):406-413. 被引量：59
5余海燕,蒋仁莲.基于众包平台的外卖实时配送订单分配与路径优化研究[J].工业工程与管理,2022,27(2):146-152. 被引量：22
6余海燕,唐婉倩,吴腾宇.带硬时间窗的O2O生鲜外卖即时配送路径优化[J].系统管理学报,2021,30(3):584-591. 被引量：33
7张力娅,张锦,肖斌.考虑顾客优先级的多目标O2O外卖即时配送路径优化研究[J].工业工程与管理,2021,26(2):196-204. 被引量：37
8张晓楠,张建雄,李相芊.动态随机餐食外卖配送在线决策模型与算法[J].系统工程理论与实践,2025,45(1):269-289. 被引量：2

二级参考文献59

1李兵,郑四发,曹剑东,杨扬,耿华,连小珉.求解客户需求动态变化的车辆路径规划方法[J].交通运输工程学报,2007,7(1):106-110. 被引量：30
2王晓文,田新,李凯.供应链治理结构的影响因素分析——基于集中式外卖模式的案例研究[J].软科学,2009,23(7):46-50. 被引量：10
3张景玲,赵燕伟,王海燕,介婧,王万良.多车型动态需求车辆路径问题建模及优化[J].计算机集成制造系统,2010,16(3):543-550. 被引量：56
4张涛,余绰娅,刘岚,邵志芳,张玥杰.同时送取货的随机旅行时间车辆路径问题方法[J].系统工程理论与实践,2011,31(10):1912-1920. 被引量：15
5潘立军,符卓.求解带时间窗取送货问题的遗传算法[J].系统工程理论与实践,2012,32(1):120-126. 被引量：34
6张旭梅,陈久梅,肖剑.随机动态多车辆装卸混合问题及求解策略研究[J].系统工程学报,2012,27(1):61-68. 被引量：2
7吴腾宇,陈嘉俊,蹇洁,余海燕.O2O模式下的配送车辆实时取送货路径选择问题[J].系统工程理论与实践,2018,38(11):2885-2891. 被引量：23
8马艳芳,闫芳,康凯,李宗敏.不确定同时取送货车辆路径问题及粒子群算法研究[J].运筹与管理,2018,27(12):73-83. 被引量：29
9李锋,魏莹.求解随机旅行时间的C-VRP问题的混合遗传算法[J].系统管理学报,2014,23(6):819-825. 被引量：15
10杨鹏,邹浩,徐贤浩.带时间窗集送货需求可分车辆路径问题的改进蚁群算法[J].系统工程,2015,33(9):58-62. 被引量：20

共引文献116

1朱桐,江欢.基于遗传算法的外卖配送路径优化研究[J].轻工科技,2020,36(12):51-53. 被引量：3
2徐肇元.基于两阶段启发式算法的多目标外卖配送优化分析[J].测试技术学报,2019,33(4):340-345. 被引量：5
3庞燕,罗华丽,邢立宁,任腾.车辆路径优化问题及求解方法研究综述[J].控制理论与应用,2019,36(10):1573-1584. 被引量：68
4蔡林,李英冰,邹子昕.路径优化算法在外卖配送中的应用[J].测绘通报,2019(11):22-25. 被引量：3
5许智宏,王怡峥,王利琴,董永峰.关于大数据的车辆动态线路遗传优化仿真研究[J].计算机仿真,2020,37(6):122-125. 被引量：2
6张玉州,张子为.考虑动态客户需求的物资配送问题求解方法[J].西安交通大学学报,2020,54(8):124-131. 被引量：6
7汤海林,张大斌.关于配送线路的混合禁忌搜索自整定仿真研究[J].计算机仿真,2020,37(9):415-418. 被引量：1
8王正武,向健,喻杰.响应型接驳公交系统基于关键点的动态路径优化[J].长沙理工大学学报（自然科学版）,2020,17(3):51-61. 被引量：6
9曹为刚,倪美玉.大数据条件下车辆路径动态优化仿真[J].信息技术,2020,44(10):106-111. 被引量：2
10王浩伟,吕明星,虞蕊娇,王浩文.“互联网+”背景下智能外卖订单分配研究[J].商场现代化,2020(21):26-28.

1陈萍,胡从旭.公交车和无人机联合赋能的农村快递“最后一公里”配送研究[J].交通企业管理,2026,41(1):128-131.
2张天雪,蒋洪伟.电动汽车配送问题研究综述[J].中国储运,2025(11):31-32.
3吕海利,王梓印,张艳伟.基于一种双层编码的协同配送路径研究[J].武汉理工大学学报(信息与管理工程版),2025,47(6):716-724.
4问晨璐,詹顺利.互联网背景下绵阳市智慧物流体系建设策略研究[J].物流科技,2025,48(23):100-102.
5周建坤,郭利泉,龙建成.危险化学品道路运输调度和配送优化:综述与研究展望[J].工程管理科技前沿,2025,44(6):57-65.
6李翊铭.业主码头数字化转型迈入快车道[J].中国商界,2025(22):116-117.
7李钢,杨正烨,俞礼军.考虑需求优先级的基站卡车-无人机应急物资配送模型[J].交通运输工程与信息学报,2025,23(4):62-74.
8任国庆.信息化时代国有企业工商管理创新路径探索[J].首席财务官,2025,21(21):222-224.
9亢宾川.抄核收“四位一体”智能化转型实践[J].中国电力企业管理,2025(29):38-39.
10倪冠群,张自然,高伟.前置仓模式下O2O即时订单在线配送策略及其竞争分析[J].系统工程理论与实践,2025,45(11):3873-3883. 被引量：1

物流技术

2026年第1期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部