摘要
基于深度强化学习,文章构建了一种网约车拼车调度双层协同优化模型。在该模型中,上层平台以总利润最大化为目标,统筹订单分配与路径规划;下层司机和乘客基于个体收益与出行效用自主响应,形成双向反馈机制。该模型充分考虑时间窗、车辆容量、佣金抽成与用户弹性定价等现实约束,通过多智能体DQN算法进行联合训练与决策。在Sioux Falls路网中的仿真结果表明,文章提出的方法能够有效提升平台收益、匹配成功率和系统运行效率,具有较强的收敛性与稳定性,对于优化拼车方式、便利乘客出行具有积极作用。
出处
《管理学家》
2025年第22期67-69,共3页
Master Management