期刊文献+
共找到822篇文章
< 1 2 42 >
每页显示 20 50 100
基于深度强化学习的路径规划算法综述 被引量:2
1
作者 黄鑫 张志佳 +2 位作者 孙平 唐延东 刘云鹏 《机器人》 北大核心 2026年第1期196-216,共21页
传统的路径规划方法在复杂多变的环境中存在明显的局限性,本文首先探讨了这些传统方法的不足,接着引入深度强化学习作为新的解决思路。全面总结了基于价值函数、基于策略和基于值策略混合3种深度强化学习方法的原理、优缺点以及近年来... 传统的路径规划方法在复杂多变的环境中存在明显的局限性,本文首先探讨了这些传统方法的不足,接着引入深度强化学习作为新的解决思路。全面总结了基于价值函数、基于策略和基于值策略混合3种深度强化学习方法的原理、优缺点以及近年来在各个应用领域上具有代表性的研究成果,并将代表性算法在统一平台上进行测试,给出了实际对比分析。最后对基于深度强化学习的路径规划技术面临的挑战和研究展望进行了总结。 展开更多
关键词 路径规划 深度学习 强化学习 深度强化学习
原文传递
基于树结构与深度强化学习的在线三维装箱算法
2
作者 张长勇 张宇浩 李铮 《包装工程》 北大核心 2026年第5期130-143,共14页
目的针对现有在线三维装箱算法在应对动态、复杂及大规模装箱场景时普遍存在的计算效率低、学习空间易爆炸等问题,提出一种融合树结构与深度强化学习(DRL)的在线装载方法。方法构建了分层耦合优化框架:在外层,引入缓冲区与临时备份空间... 目的针对现有在线三维装箱算法在应对动态、复杂及大规模装箱场景时普遍存在的计算效率低、学习空间易爆炸等问题,提出一种融合树结构与深度强化学习(DRL)的在线装载方法。方法构建了分层耦合优化框架:在外层,引入缓冲区与临时备份空间,利用树结构规划器生成包含货物选取、装载及“移除重排”的动作序列,突破传统方法无法修正历史决策的局限;在内层,设计拓扑-空间融合感知网络,结合卷积神经网络(CNN)与图卷积网络(GCN)提取容器几何剩余空间与货物支撑结构特征,利用DRL智能体输出最优落位并评估状态价值,引导树搜索进行高效剪枝。结果实验显示,在考虑物理支撑与稳定性等复杂现实约束下,该方法较现有主流DRL算法在容器的空间利用率上提升约15%,并在50~200件大规模货物序列下保持了稳定的实时响应能力。结论所提算法有效实现了在线装箱中长序列规划与局部空间优化的平衡,具有显著的工程应用价值。 展开更多
关键词 在线三维装箱 树结构规划 深度强化学习 拓扑感知 神经网络
在线阅读 下载PDF
基于a-PPO算法的列检机械臂在线运动规划方法
3
作者 赵舵 谢冠豪 +3 位作者 王叶文 赵文杰 黄晨 袁昭辉 《西南交通大学学报》 北大核心 2026年第1期167-177,共11页
为满足列车底部场景中巡检机械臂主动配合工作人员的人机协作需求,并提高PPO(proximal policy optimization)算法的收敛速度,提出一种自适应PPO(adaptive-PPO,a-PPO)算法,并将其应用于列检机械臂的在线运动规划.首先,设计系统模型,根据... 为满足列车底部场景中巡检机械臂主动配合工作人员的人机协作需求,并提高PPO(proximal policy optimization)算法的收敛速度,提出一种自适应PPO(adaptive-PPO,a-PPO)算法,并将其应用于列检机械臂的在线运动规划.首先,设计系统模型,根据当前环境状态即刻输出策略动作;然后,引入几何强化学习构建奖励函数,通过智能体的探索不断优化奖励值分布;接着,基于策略更新前后的相似度自适应地确定裁剪值,形成a-PPO算法;最后,通过在二维地图上对比分析a-PPO算法的改进效果,并验证其在仿真和真实列车场景中的可行性和有效性.结果表明:在二维平面仿真中,a-PPO算法在收敛速度上优于其他PPO算法,且路径稳定性显著提高,路径长度标准差平均比PPO算法低16.786%,比Informed-RRT*算法低66.179%;仿真与真实列车场景的应用实验中,机械臂可实现运动过程中动态更改目标点和主动规避动态障碍物,展现出对动态环境的适应能力. 展开更多
关键词 强化学习 深度学习 运动规划 机械臂 轨道列车
在线阅读 下载PDF
人-自然深度共生:风景园林生态规划的整合理论框架探索
4
作者 申佳可 王云才 《中国园林》 北大核心 2026年第2期15-22,共8页
面对人类世的复杂社会-生态挑战,风景园林生态规划在取得丰富成果的同时,也日益面临如何系统性整合多元研究路径以回应人居环境综合治理需求的挑战。基于此,构建了“人-自然深度共生”(DEEP-Symbiosis)整合理论框架。该框架借鉴深生态... 面对人类世的复杂社会-生态挑战,风景园林生态规划在取得丰富成果的同时,也日益面临如何系统性整合多元研究路径以回应人居环境综合治理需求的挑战。基于此,构建了“人-自然深度共生”(DEEP-Symbiosis)整合理论框架。该框架借鉴深生态学倡导的互利共生愿景,由“深度嵌套”(DEEPNesting)的系统认知论、“深度融合”(DEEP-Fitting)的设计过程论与“深度计算”(DEEP-Computing)的技术方法论三大支柱构成。该框架提炼了当前风景园林生态规划从格局到过程、从静态到动态、从物本到人本,这一不断从“表象”向“深度”演化的趋势,并为5种典型研究范式提供了系统性的理论指引。框架的提出旨在为风景园林生态规划提供一种系统性的理论指导与方法路径,推动人居环境的可持续发展。 展开更多
关键词 风景园林 风景园林生态规划 深度共生 整合理论框架 学科反思 人-自然耦合 生态感知
在线阅读 下载PDF
基于DQN的对地观测卫星调度算法
5
作者 许可 孙昌浩 +1 位作者 谢睿达 夏维 《空间控制技术与应用(中英文)》 北大核心 2026年第1期68-78,共11页
面向国土资源普查的卫星任务规划问题因卫星侧摆角连续可调、时间窗规模庞大而呈高维非线性解空间,叠加强耦合资源约束,极具挑战性.本文构建基于“观测机会”的离散决策模型,将原问题解耦为观测时序排列与成像条带优选这两个子问题.针... 面向国土资源普查的卫星任务规划问题因卫星侧摆角连续可调、时间窗规模庞大而呈高维非线性解空间,叠加强耦合资源约束,极具挑战性.本文构建基于“观测机会”的离散决策模型,将原问题解耦为观测时序排列与成像条带优选这两个子问题.针对现有算法在处理此类序列优化与参数选择耦合问题时存在的规则短视和搜索低效局限,提出一种嵌入深度强化学习的变邻域搜索(VNS)调度算法.该方法构建了分层调度模型,利用VNS的多重邻域结构在宏观层面优化观测序列以跳出局部最优,同时在微观层面引入结合多维状态特征空间的DQN(deep Q-network),实现对条带选择价值的自适应评估以替代人工设计规则.仿真试验表明,所提方法兼具优异的收敛速度与求解质量,在99%的测试样本中方案得分与理论总分差距小于15%. 展开更多
关键词 卫星任务规划 变邻域搜索 深度强化学习
在线阅读 下载PDF
基于深度Q网络的分布式车辆路径规划策略研究
6
作者 文家燕 王怡博 景永年 《工业控制计算机》 2026年第2期94-96,共3页
针对智能网联汽车在非结构化环境中路径规划存在学习效率低、泛化能力不足、数据隐私安全性不足等问题,提出一种基于深度Q网络(Deep Q-Network,DQN)的分布式车辆路径规划方法。设计了动态权重分配算法,结合本地数据归一化技术,对多源车... 针对智能网联汽车在非结构化环境中路径规划存在学习效率低、泛化能力不足、数据隐私安全性不足等问题,提出一种基于深度Q网络(Deep Q-Network,DQN)的分布式车辆路径规划方法。设计了动态权重分配算法,结合本地数据归一化技术,对多源车辆模型训练参数进行整合,平衡模型性能的同时保护隐私安全。引入云端共享经验池机制,消除跨场景数据分布偏移,加速全局模型收敛。仿真实验表明,相较于传统DQN算法,提出的算法在环境中路径规划成功率提升显著,模型达到成功率90%时所需的训练回合数减少77.6%。 展开更多
关键词 深度Q网络 路径规划 联邦学习 归一化
在线阅读 下载PDF
深空探索的战略规划、创新驱动与合作机制
7
作者 徐能武 《人民论坛·学术前沿》 北大核心 2026年第2期42-53,共12页
深空探索是人类航天活动的重要方向之一,既关涉国家战略目标,也关乎人类前途命运。加强深空探索、共创深空未来,要求进一步凝练重大科学问题并制定切实可行的探测计划,合理规划地月空间资源能源开发利用,统筹发展各类深空探索产业。深... 深空探索是人类航天活动的重要方向之一,既关涉国家战略目标,也关乎人类前途命运。加强深空探索、共创深空未来,要求进一步凝练重大科学问题并制定切实可行的探测计划,合理规划地月空间资源能源开发利用,统筹发展各类深空探索产业。深空探索的未来发展需以技术创新为核心动力,持续加大航天技术创新力度,加紧关键技术攻关突破,充分发挥重大项目牵引作用,促进深空探索协同创新发展,并以深空探索发展带动经济社会创新发展和人类文明的跃升进步。深空探索事业作为超大型工程,亟须汇聚各国人力、物力和财力,加大太空开发利用领域深空探索国际合作,努力推进深空探索标准化通用化,加大航天技术交流合作力度,积极完善深空探索国际合作机制。 展开更多
关键词 深空 探索利用 战略规划 创新驱动 国际合作
在线阅读 下载PDF
多维偏好增强型对抗深度强化学习驱动的行人路径规划
8
作者 冉耘博 杨雪 +4 位作者 周文豪 吴承恩 周宝定 唐炉亮 李清泉 《测绘学报》 北大核心 2026年第2期191-205,共15页
随着智慧城市与精准导航技术的发展,行人路径规划正从单一效率导向转向多维个性化需求驱动,旨在构建融合复杂城市环境与用户偏好的路径规划模型,提供高效灵活的个性化推荐。然而,现有研究仍面临群体差异建模不足、动态偏好机制缺失及复... 随着智慧城市与精准导航技术的发展,行人路径规划正从单一效率导向转向多维个性化需求驱动,旨在构建融合复杂城市环境与用户偏好的路径规划模型,提供高效灵活的个性化推荐。然而,现有研究仍面临群体差异建模不足、动态偏好机制缺失及复杂场景适应性有限等关键挑战。本文提出一种基于多维偏好建模与对抗深度强化学习的行人路径规划方法。该方法首先构建“情境感知-动态修正”多维偏好模型,为行人路径选择提供动态偏好权重,辅助深度强化学习网络奖励函数重塑,形成“效率-安全-舒适”多目标协同优化机制;然后,构建偏好增强型对抗深度强化学习算法(PEA-DQN),通过引入双经验池预训练策略和自适应训练机制,加速模型收敛并避免冗余计算。试验以武汉市为例,验证PEA-DQN训练得到的模型在混合路网动态干扰情况下的路径规划性能。结果表明:与DQN算法相比,PEA-DQN在路径规划任务中的避障成功率提升超过50%,平均路径长短缩短40.40%;在消融试验中,相较于Dueling DQN,引入多目标奖励函数后的路径质量提升100.4%,自适应机制使算法在动态障碍场景中的计算效率提升40%。PEA-DQN的综合性能显著优于动态A*算法及其他同类深度强化学习方法。 展开更多
关键词 行人路径规划 深度强化学习 多维偏好建模 个性化出行
在线阅读 下载PDF
融合GoT-SAC的领航—跟随式多车编队路径规划方法
9
作者 王越 段宏伟 +4 位作者 钟薇 杨路 何雷 柴福来 石晓杨 《汽车安全与节能学报》 北大核心 2026年第1期122-129,共8页
在多车集群协同搬运任务中,为提升未知环境下编队稳定性与作业效率,基于Mecanum Wheel智能底盘硬件平台,建立融合“目标导向型变换器(GoT)”和“柔性演员与评论家(SAC)”,GoT-SAC,的领航—跟随编队式路径规划方法;并结合微缩实验平台和G... 在多车集群协同搬运任务中,为提升未知环境下编队稳定性与作业效率,基于Mecanum Wheel智能底盘硬件平台,建立融合“目标导向型变换器(GoT)”和“柔性演员与评论家(SAC)”,GoT-SAC,的领航—跟随编队式路径规划方法;并结合微缩实验平台和Gazebo仿真环境开展实验验证。结果表明:本模型在训练约95~100回合后达到收敛稳定区;与人工遥控开环同步策略相比,本方法后编队的平均相对位姿误差由18 cm降低至6 cm,路径长度差异小于5%。从而,本方法在不依赖先验地图环境中,可较好地实现稳定编队和高效避障行驶。 展开更多
关键词 多车编队控制 领航—跟随编队式 路径规划 深度强化学习
在线阅读 下载PDF
面向飞机蒙皮覆盖检测的多无人机协同任务规划
10
作者 朴敏楠 李浩龙 +1 位作者 李海丰 范龙飞 《控制与决策》 北大核心 2026年第3期809-821,共13页
针对飞机蒙皮覆盖检测的场景下,传统人工检测存在的作业效率低下及检测时效性约束严格等瓶颈问题,现有研究多集中于多无人机协同作业的技术方案,其中面向飞机蒙皮盖检测的多无人机协同任务规划(MCMP)是描述多无人机协同检测的问题模型,... 针对飞机蒙皮覆盖检测的场景下,传统人工检测存在的作业效率低下及检测时效性约束严格等瓶颈问题,现有研究多集中于多无人机协同作业的技术方案,其中面向飞机蒙皮盖检测的多无人机协同任务规划(MCMP)是描述多无人机协同检测的问题模型,当前算法多采用启发式算法,但其求解速度和解的质量无法满足实际要求.为此,将MCMP问题建模为带有容量约束的车辆路径规划问题(CVRP),提出两阶段的深度强化学习(TSDRL)的求解模型:第1阶段根据节点数量,利用基于注意力机制的策略网络求解最优无人机数量;第2阶段设计一种新的编码器-解码器结构的策略网络,以构建每架无人机的路径.该模型通过策略梯度训练,能够快速求解每架无人机的高质量路径,为了解决三维环境碰撞问题,使用RRT^(*)算法优化路径以满足碰撞约束.仿真结果表明,所提模型在计算效率与求解质量上均优于现有的深度强化学习方法和启发式算法,并且模型具有良好的泛化性,可应用于不同机型. 展开更多
关键词 飞机蒙皮检测 任务规划 深度强化学习 注意力机制 策略梯度
原文传递
基于深度强化学习的园区级综合能源系统双层规划策略
11
作者 刘倩 王馨 +3 位作者 朱刘柱 靳幸福 贾健雄 杨军 《武汉大学学报(工学版)》 北大核心 2026年第2期248-257,共10页
为了提高可再生能源的利用效率同时促进多能协同运行,提出一种基于深度强化学习的园区级综合能源系统双层规划策略。首先构建计及碳排放的园区综合能源双层规划模型,上层以全寿命周期经济最优为目标函数,下层以典型场景日经济调度运行... 为了提高可再生能源的利用效率同时促进多能协同运行,提出一种基于深度强化学习的园区级综合能源系统双层规划策略。首先构建计及碳排放的园区综合能源双层规划模型,上层以全寿命周期经济最优为目标函数,下层以典型场景日经济调度运行为目标;接着提出一种应用于园区级综合能源系统规划问题的深度强化学习方法,并完成智能体的状态、动作空间与奖励函数设计;最后,通过仿真算例的对比验证所提方法的应用创新性与优越性:能够针对不同场景更加灵活地自适应源荷两侧的不确定性波动,同时计算效率高,能够快速求解出精度极高的全局最优解。 展开更多
关键词 综合能源 双层规划 深度强化学习 可再生资源 不确定性
原文传递
基于改进TD3算法的荔枝采摘机器人协同路径规划
12
作者 李振东 胡广华 《科学技术与工程》 北大核心 2026年第8期3367-3376,共10页
近年来,基于深度强化学习(deep reinforcement learning,DRL)的方法在采摘路径规划领域受到广泛关注,但是目前的研究只单独考虑采摘机械臂,忽视了移动底盘与机械臂之间紧密相连的关系,导致不能充分发挥采摘机器人兼顾移动性与操作性的... 近年来,基于深度强化学习(deep reinforcement learning,DRL)的方法在采摘路径规划领域受到广泛关注,但是目前的研究只单独考虑采摘机械臂,忽视了移动底盘与机械臂之间紧密相连的关系,导致不能充分发挥采摘机器人兼顾移动性与操作性的优势。为此,提出一种基于改进双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient,TD3)的荔枝采摘机器人协同路径规划方法。首先,通过深度强化学习对采摘机器人协同路径规划问题进行求解,根据协同路径规划任务设置状态空间与动作空间,并综合考虑位置、姿态与避障任务设计复合目标奖励函数;其次,引入双Actor网络与层归一化对TD3算法进行改进;最后在CoppeliaSim仿真平台内搭建非结构化荔枝采摘环境,对采摘机器人进行训练。仿真实验结果显示,深度强化学习能较好地处理协同路径规划任务,改进后的TD3算法收敛速度提升,在测试实验中路径规划成功率达96%,比原始算法提高了近69.9个百分点。结果表明:本系统能够较好地解决采摘机器人协同路径规划引起的高维度问题,能让移动底盘与机械臂进行协同规划,有助于提高采摘机器人的智能化水平,并在采摘路径规划成功率方面有一定的优势,可为采摘机器人路径规划的未来研究方向提供参考。 展开更多
关键词 采摘机器人 协同路径规划 深度强化学习(DRL) 荔枝采摘
在线阅读 下载PDF
基于RT-DETR视觉定位和机械臂路径规划的马铃薯分拣系统
13
作者 孔祥 吴英思 +2 位作者 刘飞 玄德正 张安斌 《内蒙古农业大学学报(自然科学版)》 北大核心 2026年第1期66-76,共11页
为了解决马铃薯收获环节仍依赖大量人工,且现有的分段收获机无法有效完成分选和清理工作等问题,设计了基于深度学习的目标检测与机械臂路径规划的马铃薯分拣系统。该系统由视觉定位和机械臂路径规划两部分组成。视觉定位由RT-DETR算法... 为了解决马铃薯收获环节仍依赖大量人工,且现有的分段收获机无法有效完成分选和清理工作等问题,设计了基于深度学习的目标检测与机械臂路径规划的马铃薯分拣系统。该系统由视觉定位和机械臂路径规划两部分组成。视觉定位由RT-DETR算法识别马铃薯、土块和石块,完成对应目标的定位。通过相机标定与手眼标定实现世界坐标系、相机坐标系、图像坐标系及像素坐标系之间的转换,并基于传送带高度获取目标空间位置坐标。运动学分析基于Denavit-Hartenberg参数建立机械臂连杆坐标系,通过齐次变换矩阵实现正运动学建模,并采用几何法简化逆运动学求解,推导出关节角解析表达式。路径规划选用三次多项式插值法,通过设定起始终止角度、速度边界条件,生成平滑轨迹,确保各关节加速度变化平缓。最终,马铃薯分拣系统基于PyTorch框架部署RT-DETR轻量化检测模型,模型数据集上准确率达到93.3%,召回率达到93.0%,在堆叠、覆土、强光条件下分别实现97.5%、90.3%、95%的识别准确率。集成OpenCV与Socket通信协议,系统定位误差≤1.342 mm。结合渐进式分拣策略与三次多项式轨迹规划,取得92.9%分拣成功率与1.3%误检率。马铃薯分拣系统能够在不同条件下对马铃薯与杂物精准识别,并协同机械臂实现马铃薯实验台分拣。 展开更多
关键词 马铃薯除杂 深度学习 目标检测 路径规划 机械臂分拣
原文传递
基于改进PPO算法的无人机航路规划 被引量:1
14
作者 姜智中 贺建良 《电光与控制》 北大核心 2026年第1期24-29,77,共7页
为提升无人机执行的可靠性,需要根据地形及敌方威胁规划出光滑连续的航路,并确保无人机在沿航路飞行过程中满足飞行性能约束。针对飞行性能约束下无人机连续航路规划问题,基于深度强化学习方法建立规划模型,在标准近端策略优化(PPO)算... 为提升无人机执行的可靠性,需要根据地形及敌方威胁规划出光滑连续的航路,并确保无人机在沿航路飞行过程中满足飞行性能约束。针对飞行性能约束下无人机连续航路规划问题,基于深度强化学习方法建立规划模型,在标准近端策略优化(PPO)算法的基础上引入门控循环单元(GRU)进行改进,实现了满足约束条件和平滑要求的无人机航路规划。通过仿真验证,证明了所提算法的有效性。 展开更多
关键词 深度强化学习 航路规划 近端策略优化 门控循环单元
在线阅读 下载PDF
基于多智能体深度强化学习的多星协同任务规划架构与算法研究
15
作者 吴昊恩 刘辉 +3 位作者 周一睿 陈昊 魏建宇 刘波 《上海航天(中英文)》 2026年第1期198-210,共13页
强化学习下的卫星任务规划通过“试错-反馈”机制,学习在资源、时间和轨道约束条件下获得最大化任务收益,并适应动态环境。为更贴近真实多卫星观测多目标的场景,需综合考虑目标成像、星上存储、能源状态、动量轮角动量等多种关键因素。... 强化学习下的卫星任务规划通过“试错-反馈”机制,学习在资源、时间和轨道约束条件下获得最大化任务收益,并适应动态环境。为更贴近真实多卫星观测多目标的场景,需综合考虑目标成像、星上存储、能源状态、动量轮角动量等多种关键因素。为此,本文提出一种面向复杂环境的多星协同任务规划(CE-MSCMP)框架,系统研究从卫星任务场景的马尔可夫决策过程(MDP)建模到协同规划策略求解的全流程问题。CE-MSCMP框架具有三方面优势:1)构建综合动态环境模型,提升仿真场景的真实性;2)将异构智能体近端策略优化(HAPPO)算法引入多星协同任务规划问题求解,为算法设计提供新范式;3)显著增强规划策略的泛化能力、实时适应性与多目标灵活性,克服传统方法在场景适应性和扩展性方面的局限。仿真结果表明:MDP建模的合理性以及HAPPO算法在卫星任务规划中的有效性得到验证,充分体现了CE-MSCMP框架性能的优越性。 展开更多
关键词 多卫星任务规划 深度强化学习 马尔可夫决策过程(MDP)建模 协同策略求解
在线阅读 下载PDF
基于值分布深度强化学习的桥式吊车轨迹规划与跟踪控制
16
作者 高永锹 徐萌 +2 位作者 辛增淼 王天雷 肖康利 《机电工程技术》 2026年第2期25-30,共6页
针对桥式吊车中传统轨迹规划方法在复杂模型中数学分析复杂、难以适应动态环境的问题,提出了一种基于值函数分布的深度强化学习算法(Distributional Soft Actor-critic with Three Refinements,DSACT),用于桥式吊车的实时轨迹规划。DSAC... 针对桥式吊车中传统轨迹规划方法在复杂模型中数学分析复杂、难以适应动态环境的问题,提出了一种基于值函数分布的深度强化学习算法(Distributional Soft Actor-critic with Three Refinements,DSACT),用于桥式吊车的实时轨迹规划。DSACT算法通过分布式值函数能够捕捉更丰富的状态-动作值分布信息,为决策提供更全面的表征学习;DSACT算法结合3项优化策略(期望价值替换、基于方差的临界梯度调整及双值分布学习),显著提升了模型的收敛速度、稳定性和鲁棒性。设计了滑模跟踪控制器以实现对规划轨迹的精确跟踪,提高系统的抗干扰能力和动态响应性能。仿真结果表明,与经典SAC和DDPG算法相比,DSACT算法在规划精度、收敛速度和控制稳定性方面表现更优;而滑模跟踪控制器相比传统PID控制器,在跟踪精度、抗干扰能力和动态响应方面具有显著优势。 展开更多
关键词 桥式吊车 轨迹规划 深度强化学习 值函数分布
在线阅读 下载PDF
融合三维体素重建和实例分割的无人机路径规划方法
17
作者 叶逸涛 王从庆 曾远超 《电光与控制》 北大核心 2026年第1期19-23,共5页
目前的无人机路径规划算法多数聚焦于静态环境,而现实室内环境中存在大量移动目标如行人、宠物等。针对无人机在动态环境下的路径规划问题,提出了一种融合三维体素重建和实例分割的无人机路径规划方法。采用降采样离散化三维模型的方式... 目前的无人机路径规划算法多数聚焦于静态环境,而现实室内环境中存在大量移动目标如行人、宠物等。针对无人机在动态环境下的路径规划问题,提出了一种融合三维体素重建和实例分割的无人机路径规划方法。采用降采样离散化三维模型的方式,将无人机的体积因素引入碰撞检测中。根据RGB-D深度相机传感器感知的二维图像,估计三维场景中体素的占据状态,同时判断场景内的静止/移动障碍物信息。融合实例分割网络和三维体素重建方法,精确提取场景内动态目标,并引入碰撞预期奖惩引导网络学习。最后,针对动态环境下的路径规划进行仿真,仿真对比实验结果表明,所提融合方法能够有效规避环境中的静态和动态障碍物,提高了无人机路径规划的性能。 展开更多
关键词 三维体素重建 深度强化学习 无人机路径规划 动态环境 实例分割
在线阅读 下载PDF
基于EDDPG的农业巡检机器人路径规划研究
18
作者 许寒琪 寇志伟 +1 位作者 李欣 李鄂阳 《中国农机化学报》 北大核心 2026年第4期187-194,F0003,共9页
针对农业巡检机器人在复杂作业环境中路径规划效率低、路径较长以及动态避障能力不足的问题,提出一种基于改进的深度确定性策略梯度算法(EDDPG)的路径规划方法。该方法引入旋量法(Screw Theory)优化路径规划效率,并结合人工势场法与A^(*... 针对农业巡检机器人在复杂作业环境中路径规划效率低、路径较长以及动态避障能力不足的问题,提出一种基于改进的深度确定性策略梯度算法(EDDPG)的路径规划方法。该方法引入旋量法(Screw Theory)优化路径规划效率,并结合人工势场法与A^(*)算法构建奖励函数,以提升动态避障能力并缩短最优路径长度。试验结果表明,在二维环境下,与对比算法相比,改进DRL算法的路径长度最短、路径平滑度最佳。在障碍物率为20%、40%、60%的条件下,其路径规划成功率分别达到0.936、0.931、0.918,均优于对比方法。此外,旋量法的使用频率越高,路径规划成功率越高。相比于其他路径规划模型,改进DRL算法的最短路径长度最大减少27.23%,平均规划时间最多缩短24.16 s。 展开更多
关键词 农业自动化 巡检机器人 路径规划 深度强化学习 智能算法
在线阅读 下载PDF
面向“十五五”:具身智能产业深海场景培育的图景诠释、现实梗阻及纾解之策——学习贯彻党的二十届四中全会精神
19
作者 王闻萱 王丹 《西北工业大学学报(社会科学版)》 2026年第1期32-39,共8页
党的二十届四中全会强调要培育壮大新兴产业和未来产业,实施新技术新产品新场景大规模应用示范行动。具身智能技术的不断迭代升级,可以在政策、技术、产业等维度上助推深海场景的培育,擘画出独特的图景。然而,在具身智能产业深海场景培... 党的二十届四中全会强调要培育壮大新兴产业和未来产业,实施新技术新产品新场景大规模应用示范行动。具身智能技术的不断迭代升级,可以在政策、技术、产业等维度上助推深海场景的培育,擘画出独特的图景。然而,在具身智能产业深海场景培育过程中,专业人才资源匮乏制约助推潜力所带来的人才梗阻、产业基础保障不足影响助推活力所带来的基础梗阻、技术实践新型风险阻滞助推动力所带来的安全梗阻需要引起高度重视。对此,应针对这些现实梗阻,从夯实人才队伍、完善基础保障、构建监管体系三个方面发力,以更好地推动具身智能产业在“十五五”时期为我国深海经济发展助力。 展开更多
关键词 具身智能 “十五五”时期 深海经济 场景培育 未来产业
在线阅读 下载PDF
侧风环境下城轨列车自动驾驶控制策略研究
20
作者 杨浩博 陈晓强 +2 位作者 郭佑民 胥如迅 李德仓 《铁道标准设计》 北大核心 2026年第3期190-197,共8页
为研究城市轨道交通系统中的列车自动驾驶问题,特别是针对侧风环境下的节能与安全控制策略。详细阐述列车动力学模型构建、多目标优化建模以及侧风环境对运行的影响,提出一种基于深度强化学习(Deep Reinforcement Learning,DRL)的列车... 为研究城市轨道交通系统中的列车自动驾驶问题,特别是针对侧风环境下的节能与安全控制策略。详细阐述列车动力学模型构建、多目标优化建模以及侧风环境对运行的影响,提出一种基于深度强化学习(Deep Reinforcement Learning,DRL)的列车自动驾驶策略。通过Tr(Time Redundancy)参考系统规划解决稀疏奖励问题,并设计详细的奖励函数来指导智能体的学习过程。此外,DQN-Tr算法结合Tr参考规划和深度Q网络,提高算法的收敛速度和稳定性。实验仿真部分以重庆某地铁线路为背景进行验证,结果显示,DQN-Tr算法在停车准确性与准时性上表现优异,并在能耗上实现显著节约。与传统PID控制算法相比,DQN-Tr不仅在准确性上提升0.05%,而且在能耗上节省11.45%,在确保行车安全的同时有效降低能耗,为城市轨道交通提供一种高效、节能的控制方法。 展开更多
关键词 城市轨道交通 列车自动驾驶系统 节能优化 深度强化学习 Tr参考规划 动力学模型 多目标优化 侧风环境
在线阅读 下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部