期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于改进PPO算法的机械臂动态路径规划 被引量:1
1
作者 万宇航 朱子璐 +3 位作者 钟春富 刘永奎 林廷宇 张霖 《系统仿真学报》 北大核心 2025年第6期1462-1473,共12页
针对非结构化环境下机械臂路径规划面临的环境不确定性因素增多、建模难度大等问题,提出了一种基于改进近端策略优化(PPO)算法的机械臂动态路径规划方法。针对由于动态环境中障碍物数量变化而导致的状态空间输入长度不固定的问题,提出... 针对非结构化环境下机械臂路径规划面临的环境不确定性因素增多、建模难度大等问题,提出了一种基于改进近端策略优化(PPO)算法的机械臂动态路径规划方法。针对由于动态环境中障碍物数量变化而导致的状态空间输入长度不固定的问题,提出了基于LSTM网络的环境状态输入处理方法,并对PPO算法的网络结构进行了改进;基于人工势场法设计了奖励函数,并建立机械臂碰撞检测模型。实验结果表明:改进算法能够适应场景中障碍物数量和位置的变化,具有更快的收敛速度和稳定性。 展开更多
关键词 动态路径规划 改进PPO算法 LSTM网络 人工势场法 ml-agents
原文传递
基于DRL的港口起重机自主运动控制方法研究
2
作者 陈桂利 陈夕松 《工业控制计算机》 2025年第4期9-11,共3页
在传统港口中,集装箱的转运依赖于人工操作,这限制了港口的自动化进展。因此,提出了一种基于DRL的港口起重机自主运动控制方法,旨在提升起重机转运效率和减少负载摆动。首先,在Unity3D中创建一个高度相似于真实港口的仿真场景;其次,设... 在传统港口中,集装箱的转运依赖于人工操作,这限制了港口的自动化进展。因此,提出了一种基于DRL的港口起重机自主运动控制方法,旨在提升起重机转运效率和减少负载摆动。首先,在Unity3D中创建一个高度相似于真实港口的仿真场景;其次,设计变绳长下的起重机自主运动控制任务,实现起重机在虚拟环境中的运动;最后,基于ML-Agents框架将PPO算法应用于起重机自主运动控制任务。仿真结果表明,基于DRL的起重机模型可以快速准确地转运集装箱,累积奖励和价值网络损失值达到收敛,且每个回合均能完成集装箱转运任务。 展开更多
关键词 深度强化学习 起重机控制 Unity ml-agents
在线阅读 下载PDF
AI Safety Approach for Minimizing Collisions in Autonomous Navigation 被引量:1
3
作者 Abdulghani M.Abdulghani Mokhles M.Abdulghani +1 位作者 Wilbur L.Walters Khalid H.Abed 《Journal on Artificial Intelligence》 2023年第1期1-14,共14页
Autonomous agents can explore the environment around them when equipped with advanced hardware and software systems that help intelligent agents minimize collisions.These systems are developed under the term Artificia... Autonomous agents can explore the environment around them when equipped with advanced hardware and software systems that help intelligent agents minimize collisions.These systems are developed under the term Artificial Intelligence(AI)safety.AI safety is essential to provide reliable service to consumers in various fields such asmilitary,education,healthcare,and automotive.This paper presents the design of an AI safety algorithmfor safe autonomous navigation using Reinforcement Learning(RL).Machine Learning Agents Toolkit(ML-Agents)was used to train the agentwith a proximal policy optimizer algorithmwith an intrinsic curiositymodule(PPO+ICM).This training aims to improve AI safety and minimize or prevent any mistakes that can cause dangerous collisions by the intelligent agent.Four experiments have been executed to validate the results of our research.The designed algorithmwas tested in a virtual environment with four differentmodels.A comparison was presented in four cases to identify the best-performing model for improvingAI safety.The designed algorithmenabled the intelligent agent to perform the required task safely using RL.A goal collision ratio of 64%was achieved,and the collision incidents were minimized from 134 to 52 in the virtual environment within 30min. 展开更多
关键词 Artificial intelligence AI safety autonomous robots unmanned systems Unity simulations reinforcement learning RL machine learning ml-agents human-machine teaming
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部