期刊文献+
共找到230篇文章
< 1 2 12 >
每页显示 20 50 100
Boundary Gap Based Reactive Navigation in Unknown Environments 被引量:2
1
作者 Zhao Gao Jiahu Qin +1 位作者 Shuai Wang Yaonan Wang 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2021年第2期468-477,共10页
Due to the requirements for mobile robots to search or rescue in unknown environments,reactive navigation which plays an essential role in these applications has attracted increasing interest.However,most existing rea... Due to the requirements for mobile robots to search or rescue in unknown environments,reactive navigation which plays an essential role in these applications has attracted increasing interest.However,most existing reactive methods are vulnerable to local minima in the absence of prior knowledge about the environment.This paper aims to address the local minimum problem by employing the proposed boundary gap(BG)based reactive navigation method.Specifically,the narrowest gap extraction algorithm(NGEA)is proposed to eliminate the improper gaps.Meanwhile,we present a new concept called boundary gap which enables the robot to follow the obstacle boundary and then get rid of local minima.Moreover,in order to enhance the smoothness of generated trajectories,we take the robot dynamics into consideration by using the modified dynamic window approach(DWA).Simulation and experimental results show the superiority of our method in avoiding local minima and improving the smoothness. 展开更多
关键词 Boundary gap local minima reactive navigation unknown environments
在线阅读 下载PDF
Safe Navigation for UAV-Enabled Data Dissemination by Deep Reinforcement Learning in Unknown Environments 被引量:1
2
作者 Fei Huang Guangxia Li +3 位作者 Shiwei Tian Jin Chen Guangteng Fan Jinghui Chang 《China Communications》 SCIE CSCD 2022年第1期202-217,共16页
Unmanned aerial vehicles(UAVs) are increasingly considered in safe autonomous navigation systems to explore unknown environments where UAVs are equipped with multiple sensors to perceive the surroundings. However, how... Unmanned aerial vehicles(UAVs) are increasingly considered in safe autonomous navigation systems to explore unknown environments where UAVs are equipped with multiple sensors to perceive the surroundings. However, how to achieve UAVenabled data dissemination and also ensure safe navigation synchronously is a new challenge. In this paper, our goal is minimizing the whole weighted sum of the UAV’s task completion time while satisfying the data transmission task requirement and the UAV’s feasible flight region constraints. However, it is unable to be solved via standard optimization methods mainly on account of lacking a tractable and accurate system model in practice. To overcome this tough issue,we propose a new solution approach by utilizing the most advanced dueling double deep Q network(dueling DDQN) with multi-step learning. Specifically, to improve the algorithm, the extra labels are added to the primitive states. Simulation results indicate the validity and performance superiority of the proposed algorithm under different data thresholds compared with two other benchmarks. 展开更多
关键词 Unmanned aerial vehicles(UAVs) safe autonomous navigation unknown environments data dissemination dueling double deep Q network(dueling DDQN)
在线阅读 下载PDF
Path Planning Approach in Unknown Environment 被引量:1
3
作者 Ting-Kai Wang Quan Dang Pei-Yuan Pan 《International Journal of Automation and computing》 EI 2010年第3期310-316,共7页
This paper presents a new algorithm of path planning for mobile robots,which utilises the characteristics of the obstacle border and fuzzy logical reasoning.The environment topology or working space is described by th... This paper presents a new algorithm of path planning for mobile robots,which utilises the characteristics of the obstacle border and fuzzy logical reasoning.The environment topology or working space is described by the time-variable grid method that can be further described by the moving obstacles and the variation of path safety.Based on the algorithm,a new path planning approach for mobile robots in an unknown environment has been developed.The path planning approach can let a mobile robot find a safe path from the current position to the goal based on a sensor system.The two types of machine learning:advancing learning and exploitation learning or trial learning are explored,and both are applied to the learning of mobile robot path planning algorithm.Comparison with A*path planning approach and various simulation results are given to demonstrate the efficiency of the algorithm.This path planning approach can also be applied to computer games. 展开更多
关键词 Path planning fuzzy reasoning unknown environment mobile robot learning algorithm
在线阅读 下载PDF
A State Estimation Method for Sound Environment System with Unknown Observation Mechanism by Introducing Fuzzy Inference
4
作者 Hisako Orimoto Akira Ikuta 《Intelligent Information Management》 2012年第4期115-122,共8页
The observed phenomena in real sound environment system often contain uncertainty such as the additional external noise with unknown statistics. Furthermore, there is complex nonlinear relationship between the specifi... The observed phenomena in real sound environment system often contain uncertainty such as the additional external noise with unknown statistics. Furthermore, there is complex nonlinear relationship between the specific signal and the observations, and it cannot be exactly expressed in any definite functional form. In these situations, it is one of reasonable analysis methods to treat the objective sound environment system as a fuzzy system. In this study, a state estimation method for a specific signal under the existence of an unknown observation mechanism and external noise of unknown statistics is proposed by introducing fuzzy inference. The effectiveness of the proposed theoretical method is experimentally confirmed by applying it to the actually observed data in the sound environment. 展开更多
关键词 State Estimation SOUND environment SYSTEM unknown OBSERVATION MECHANISM Fuzzy INFERENCE
暂未订购
基于新型贪心-D^(*)算法的无人机全覆盖路径规划
5
作者 周映江 谢明慧 +2 位作者 蒋国平 徐丰羽 高辉 《南京邮电大学学报(自然科学版)》 北大核心 2026年第1期111-123,共13页
针对动态未知环境中全覆盖路径规划面临的路径冗余率高和环境适应性差等难题,提出一种基于新型贪心-D^(*)算法(Novel Greedy-D^(*)Algorithm,NG-D^(*))的无人机全覆盖路径规划。首先,构建动态增量式环境建模系统,实现障碍物分布实时更... 针对动态未知环境中全覆盖路径规划面临的路径冗余率高和环境适应性差等难题,提出一种基于新型贪心-D^(*)算法(Novel Greedy-D^(*)Algorithm,NG-D^(*))的无人机全覆盖路径规划。首先,构建动态增量式环境建模系统,实现障碍物分布实时更新与矩阵化栅格状态精准映射,增强系统环境感知能力。其次,设计最小值优先三元组贪心决策函数,通过评估曼哈顿距离、横向优先级与纵向优先级,生成结构化有序覆盖路径。最后,引入关键节点导向D^(*)逃离算法,在检测到局部死区时高效规划平滑脱离路径。实验结果表明,相较于传统方法,NG-D^(*)算法在保持覆盖完整性的前提下,将路径冗余率降低至3.0%以下。 展开更多
关键词 D^(*)算法 贪心策略 全覆盖路径规划 未知环境 无人机
在线阅读 下载PDF
基于动态行为树的无人机自主环境探索算法设计
6
作者 徐小斌 顾程毓 +1 位作者 林时尧 范军芳 《兵工学报》 北大核心 2026年第1期272-281,共10页
未知、全球定位系统拒止环境下,针对无人机自主探索时面临的环境动态性与实时复杂决策挑战,提出一种基于动态行为树(Dynamic Behavior Tree,DBT)的自主探索算法。该算法前端构建轻量化时变体素概率地图模型,并融合轻量化地图引导的改进... 未知、全球定位系统拒止环境下,针对无人机自主探索时面临的环境动态性与实时复杂决策挑战,提出一种基于动态行为树(Dynamic Behavior Tree,DBT)的自主探索算法。该算法前端构建轻量化时变体素概率地图模型,并融合轻量化地图引导的改进切线爬虫实时路径规划器,通过环境感知优化实现安全高效导航。后端核心采用基于DBT的自适应决策机制,创新性地引入动态权重驱动的拓扑重构,采用层次化设计和模块化管理,赋予系统算法调度能力与主动响应环境变化的智能决策能力。通过ROS2/Gazebo平台的仿真验证,DBT在感知、决策与响应方面均表现出较好的性能,与有限状态机方法相比,DBT算法的探索覆盖率提升了2.33%~12%,平均探索覆盖率提升了1%~13%,有效提升了无人机在未知环境中自主探索的效率、鲁棒性和智能化水平。 展开更多
关键词 动态行为树 未知环境 自适应决策 改进Tangent Bug
在线阅读 下载PDF
基于IL-TD3的轮式机器人无地图导航研究
7
作者 秦源赛 牟海明 +1 位作者 刘元基 李清都 《电子科技》 2026年第2期38-44,共7页
针对轮式机器人导航方法对高精地图的依赖以及在动态复杂场景中的适应性问题,文中提出了一种基于IL-TD3(Imitation Learning Enhanced Twin Delayed Deep Deterministic Policy Gradient)的无地图导航方法。将导航任务建模为POMDP(Parti... 针对轮式机器人导航方法对高精地图的依赖以及在动态复杂场景中的适应性问题,文中提出了一种基于IL-TD3(Imitation Learning Enhanced Twin Delayed Deep Deterministic Policy Gradient)的无地图导航方法。将导航任务建模为POMDP(Partially Observable Markov Decision Process),并结合LSTM(Long Short-Term Memory)处理历史信息,以改进环境状态建模。机器人通过模仿学习迅速获得了有限的无地图导航能力,不断探索和训练TD3深度强化学习网络从而提高导航技能。仿真实验结果表明,IL-TD3在未知动态环境中的导航轨迹稳定、连续、安全,具有较好的导航性能。Sim2Real(Simulation to Reality)测试结果表明,未经调整的IL-TD3模型在现实世界的导航任务中表现较好,证明了所提模型的鲁棒性和泛化能力。 展开更多
关键词 机器人 无地图导航 POMDP LSTM 模仿学习 深度强化学习 未知动态环境 Sim2Real
在线阅读 下载PDF
基于IL-TD3的轮式机器人无地图导航研究
8
作者 秦源赛 牟海明 +1 位作者 刘元基 李清都 《电子科技》 2026年第1期57-63,共7页
针对轮式机器人导航方法对高精地图的依赖以及在动态复杂场景中的适应性问题,文中提出了一种基于IL-TD3(Imitation Learning Enhanced Twin Delayed Deep Deterministic Policy Gradient)的无地图导航方法。将导航任务建模为POMDP(Parti... 针对轮式机器人导航方法对高精地图的依赖以及在动态复杂场景中的适应性问题,文中提出了一种基于IL-TD3(Imitation Learning Enhanced Twin Delayed Deep Deterministic Policy Gradient)的无地图导航方法。将导航任务建模为POMDP(Partially Observable Markov Decision Process),并结合LSTM(Long Short-Term Memory)处理历史信息,以改进环境状态建模。机器人通过模仿学习迅速获得了有限的无地图导航能力,不断探索和训练TD3深度强化学习网络从而提高导航技能。仿真实验结果表明,IL-TD3在未知动态环境中的导航轨迹稳定、连续、安全,具有较好的导航性能。Sim2Real(Simulation to Reality)测试结果表明,未经调整的IL-TD3模型在现实世界的导航任务中表现较好,证明了所提模型的鲁棒性和泛化能力。 展开更多
关键词 机器人 无地图导航 POMDP LSTM 模仿学习 深度强化学习 未知动态环境 Sim2Real
在线阅读 下载PDF
未知环境下基于突变定位SAC算法的移动机器人路径规划 被引量:1
9
作者 胡立坤 韦春有 《计算机应用研究》 北大核心 2025年第2期455-461,共7页
针对缺乏完整环境信息的条件下移动机器人局部路径规划算法性能提升及深度强化学习智能体训练速度慢的问题,提出了突变定位算法和改进的soft actor-critic(SAC)算法,并将两者结合为突变定位SAC算法。突变定位算法能够在缺乏完备环境信... 针对缺乏完整环境信息的条件下移动机器人局部路径规划算法性能提升及深度强化学习智能体训练速度慢的问题,提出了突变定位算法和改进的soft actor-critic(SAC)算法,并将两者结合为突变定位SAC算法。突变定位算法能够在缺乏完备环境信息的情况下计算子目标点位置,减少移动机器人规划路径的长度。同时,通过引入基于虚拟势场的critic网络改进损失函数和多阶段训练方法,提高SAC智能体的训练速度。实验结果表明,与DDPG、SAC、PER-SAC和HER-TD3相比,突变定位SAC算法在训练时间上分别减少了46.68%、39.50%、20.18%和27.79%。此外,突变定位SAC算法在不同环境下规划路径的长度平均减少了13.71%、10.26%、10.90%和15.89%。 展开更多
关键词 移动机器人 路径规划 深度强化学习算法 SAC算法 激光雷达 未知环境
在线阅读 下载PDF
未知环境下激光雷达网络通信数据加密传输研究
10
作者 魏爽 杨明 龙草芳 《激光杂志》 北大核心 2025年第11期141-148,共8页
由于未知环境可能引入多种不确定因素,如信号衰减、多径效应及潜在的恶意攻击等,传统的单一加密方法难以全面应对,导致数据极易遭受未知环境干扰、窃听或篡改的风险。为了有效防止激光雷达网络通信数据在传输过程中被泄露,提出一种未知... 由于未知环境可能引入多种不确定因素,如信号衰减、多径效应及潜在的恶意攻击等,传统的单一加密方法难以全面应对,导致数据极易遭受未知环境干扰、窃听或篡改的风险。为了有效防止激光雷达网络通信数据在传输过程中被泄露,提出一种未知环境下激光雷达网络通信数据加密传输方法。采用多混沌映射加密方法对未知环境下的激光雷达网络通信数据展开首轮加密,通过生成混沌序列作为密钥,结合密文回馈机制,有效增强了数据的抗破解能力。其次,依据通信数据传输的实际需求和标准,采集并转换初始通信数据,设定通信数据传输节点传输索引值,构建最小叠交多路径传输结构,确保首轮加密数据在复杂环境中的稳定传输。在上述基础上,利用同态加密算法对通信数据展开二次加密,同时组建未知环境下激光雷达网络通信数据加密传输模型,通过模型有效实现通信数据传输加密。实验结果表明,所提方法可以显著降低误比特率,提升激光雷达网络通信数据的安全系数和数据包投递率,有效保证通信数据的安全传输。 展开更多
关键词 未知环境 激光雷达网络 通信数据 多混沌映射加密 同态加密 数据传输安全
原文传递
基于深度强化学习的无人机自主感知−规划−控制策略 被引量:5
11
作者 吕茂隆 丁晨博 +1 位作者 韩浩然 段海滨 《自动化学报》 北大核心 2025年第6期1305-1319,共15页
近年来,随着深度强化学习(DRL)方法快速发展,其在无人机(UAV)自主导航上的应用也受到越来越广泛的关注.然而,面对复杂未知的环境,现存的基于DRL的UAV自主导航算法常受限于对全局信息的依赖和特定训练环境的约束,极大地限制了其在各种场... 近年来,随着深度强化学习(DRL)方法快速发展,其在无人机(UAV)自主导航上的应用也受到越来越广泛的关注.然而,面对复杂未知的环境,现存的基于DRL的UAV自主导航算法常受限于对全局信息的依赖和特定训练环境的约束,极大地限制了其在各种场景中的应用潜力.为解决上述问题,提出多尺度输入用于平衡感受野与状态维度,以及截断操作来使智能体能够在扩张后的环境中运行.此外,构建自主感知−规划−控制架构,赋予UAV在多样复杂环境中自主导航的能力. 展开更多
关键词 无人机 深度强化学习 自主导航 复杂未知环境
在线阅读 下载PDF
火灾环境交互条件下应急疏散路径最优决策算法 被引量:1
12
作者 洪妍灵 江辉仙 张明锋 《福建师范大学学报(自然科学版)》 北大核心 2025年第2期65-73,共9页
大型公共建筑物结构和设计复杂,在火灾应急疏散中存在人群因火势扩散找不到有效疏散路径的难题。基于两种深度Q网络(DQN)算法,针对不同年龄段人员的紧急疏散速度,在烟雾扩散影响下的火灾仿真环境中寻找不同被困人员的有效疏散引导路径,... 大型公共建筑物结构和设计复杂,在火灾应急疏散中存在人群因火势扩散找不到有效疏散路径的难题。基于两种深度Q网络(DQN)算法,针对不同年龄段人员的紧急疏散速度,在烟雾扩散影响下的火灾仿真环境中寻找不同被困人员的有效疏散引导路径,从而得到不同被困人员在大型建筑物室内的有效疏散方案。实验结果表明:(1)DQN算法在火灾环境中的应用能更高效地获得低成本的室内火灾最优引导疏散路径;(2)Dueling DQN算法搜索最优疏散路径成功率和安全性高于DQN算法,更适合火灾最优引导疏散路径规划;(3)火灾最优疏散路径规划中,应该适当考虑不同年龄疏散人群的紧急疏散速度,为不同年龄群体提供合适的火灾最优疏散路径引导。 展开更多
关键词 DQN算法 不同年龄人群 未知环境模型 疏散速度 Dueling DQN算法
在线阅读 下载PDF
铁路外部环境无人机图像未知风险检测方法 被引量:3
13
作者 孟凡腾 秦勇 +3 位作者 崔京 吴云鹏 张紫城 魏少伟 《航空学报》 北大核心 2025年第11期224-238,共15页
铁路外部环境的常见隐患以及未知风险(包括泥石流、落石、动物入侵等)严重威胁着铁路安全运行,需要巡检人员耗时费力地频繁检查,但巡检范围仍十分有限。目前,低空经济已成为国家新质生产力代表,无人机凭借其高空作业能力、远距离覆盖优... 铁路外部环境的常见隐患以及未知风险(包括泥石流、落石、动物入侵等)严重威胁着铁路安全运行,需要巡检人员耗时费力地频繁检查,但巡检范围仍十分有限。目前,低空经济已成为国家新质生产力代表,无人机凭借其高空作业能力、远距离覆盖优势,以及不受地形限制和铁路维修天窗影响的特点,在巡检领域具有得天独厚的技术优势。针对铁路外部环境未知风险样本稀疏且具有随机不确定性的挑战,利用无人机进行沿线遥感图像采集,并基于Faster RCNN提出了一种未知风险检测框架。首先,设计了一种目标性与多分类解耦训练策略,并融合在未知风险检测框架中,显著提升了通用目标检测性能,避免将未知风险目标错分为背景。其次,改进了VOS的虚拟特征合成方法,提出了基于相似度的特征空间采样,在构建实例级目标特征空间基础上进行多元高斯分布参数估计与重采样,获得泛化性的未知风险目标特征表示。再次,利用基于能量的不确定性度量,对实例级特征进行不确定性度量,并据此计算损失以诱导网络优化常见类别和未知风险类别的决策边界。最后,在采集的铁路外部环境数据集、开源无人机数据集以及泛化性测试数据上进行了定量与定性实验分析,本文方法在常见隐患识别上取得了95.7%的mAP50,同时在测试集和泛化性测试数据上分别取得了98%和80.8%的Recall50,实验结果表明本文方法在保证常见隐患类别高识别率的基础上对于未知风险目标也有较高的检测能力。 展开更多
关键词 无人机 遥感图像 低空经济 深度学习 铁路外部环境 未知风险目标检测
原文传递
基于分层仿生神经网络的多机器人协同区域搜索算法 被引量:3
14
作者 陈波 张辉 +2 位作者 江一鸣 钟杭 王耀南 《自动化学报》 北大核心 2025年第4期890-902,共13页
针对多机器人系统在战场、灾难现场等复杂未知环境下的区域搜索问题,提出一种基于分层仿生神经网络的多机器人协同区域搜索算法.首先将仿生神经网络(Bio-inspired neural network,BNN)和不同分辨率下的区域栅格地图结合,构建分层仿生神... 针对多机器人系统在战场、灾难现场等复杂未知环境下的区域搜索问题,提出一种基于分层仿生神经网络的多机器人协同区域搜索算法.首先将仿生神经网络(Bio-inspired neural network,BNN)和不同分辨率下的区域栅格地图结合,构建分层仿生神经网络信息模型,其中包括区域搜索神经网络信息模型(Area search neural network information model,AS-BNN)和区域覆盖神经网络信息模型(Area coverage neural network information model,AC-BNN).机器人在任务区域内实时探测到的环境信息将转换为AS-BNN和AC-BNN中神经元的动态活性值.其次,在分层仿生神经网络信息模型基础上引入分布式模型预测控制(Distributed model predictive control,DMPC)框架,并设计多机器人分层协同决策机制.当机器人处于正常搜索状态时,基于AS-BNN进行搜索路径滚动优化决策;当机器人陷入局部最优状态时,则启用ACBNN引导机器人快速找到新的未搜索区域.最后,在复杂未知环境下进行多机器人区域搜索仿真实验,并与该领域内的3种算法进行比较.仿真结果验证了所提算法能够在复杂未知环境下引导多机器人系统高效地完成区域搜索任务. 展开更多
关键词 未知环境 多机器人系统 区域搜索 仿生神经网络 分布式模型预测控制
在线阅读 下载PDF
基于分层边界与可视图的移动机器人自主探索算法 被引量:1
15
作者 曹路阳 周乐来 +2 位作者 戴骁蒙 张文鹤 李贻斌 《控制与决策》 北大核心 2025年第4期1207-1216,共10页
为了减少机器人在探索过程中容易忽视局部狭小区域、路径重复度高、探索效率低下的问题,提出一种基于分层边界与可视图的自主探索算法.首先,根据三维地图中状态变化的体素,实时提取局部边界并增量构建全局边界,对边界聚类得到候选目标点... 为了减少机器人在探索过程中容易忽视局部狭小区域、路径重复度高、探索效率低下的问题,提出一种基于分层边界与可视图的自主探索算法.首先,根据三维地图中状态变化的体素,实时提取局部边界并增量构建全局边界,对边界聚类得到候选目标点;其次,基于增量更新的可视图对候选目标点进行综合指标的评价,采用一种指数衰减形式的评估函数;再次,将可视图与D*Lite算法结合,基于动态规划的思想,引导机器人快速完成对未知环境的探索,避免重复路径;最后,在不同环境下进行仿真实验,通过数据验证所提出方法在移动距离、运行时间、探索效率方面都优于次优视图规划器(NBVP)、基于图的探索规划器2 (GBP2)和双阶段视点规划器(DSVP)算法.结果表明,该算法可以有效解决机器人在探索时忽视局部狭小区域、路径重复度高的问题,提高了机器人自主探索的效率. 展开更多
关键词 自主探索 未知环境 边界检测 代价评价 可视图 机器人操作系统
原文传递
基于深度强化学习的未知越野环境空地协同路径搜索方法
16
作者 王容川 宋文杰 +3 位作者 毛梓豪 王凯 杨毅 付梦印 《中国惯性技术学报》 北大核心 2025年第4期394-401,共8页
面对先验信息未知、地形复杂的越野环境,传统空地协同方法采用贪婪策略易陷入局部最优,且缺乏对地形风险信息考虑,难以实现无人车安全、高效的自主行驶。针对以上问题,提出一种基于深度强化学习的空地协同路径搜索方法。首先,采用栅格... 面对先验信息未知、地形复杂的越野环境,传统空地协同方法采用贪婪策略易陷入局部最优,且缺乏对地形风险信息考虑,难以实现无人车安全、高效的自主行驶。针对以上问题,提出一种基于深度强化学习的空地协同路径搜索方法。首先,采用栅格地图构建方法,引入几何特征分析以实现地形风险信息精确刻画。其次,提出一种无人机视角下基于柔性演员-评论家强化学习的决策方法,通过构建增量式节点拓扑图,结合多级Transformer编码-解码网络提取特征,确保高效选择局部目标点以引导无人车。最后,使用贝塞尔曲线,结合无人车局部地形分析结果,生成安全、平滑的行驶轨迹。仿真结果表明,与三种典型空地协同路径搜索方法相比,所提方法使无人车的平均路径风险值减少约20.8%,局部目标点决策步骤的平均计算时间减少约82.6%,有效提升了无人车在未知越野环境中的自主行驶能力。 展开更多
关键词 强化学习 地形风险分析 未知越野环境 空地协同 路径搜索
在线阅读 下载PDF
未知环境应用OSPGB的清洁机器人全覆盖路径规划
17
作者 张方方 蔡一飞 +2 位作者 辛健斌 彭金柱 刘艳红 《计算机工程与应用》 北大核心 2025年第20期105-113,共9页
针对多机器人在未知环境下执行清洁任务路径重复率高以及转弯次数多的问题,提出了一种障碍物与起始点引导并融合回溯机制(OSPGB)的全覆盖算法,算法中添加了局部栅格活性值(LRA)函数辅助决策,应用于清洁机器人路径规划中。利用栅格地图... 针对多机器人在未知环境下执行清洁任务路径重复率高以及转弯次数多的问题,提出了一种障碍物与起始点引导并融合回溯机制(OSPGB)的全覆盖算法,算法中添加了局部栅格活性值(LRA)函数辅助决策,应用于清洁机器人路径规划中。利用栅格地图表示需要清洁的区域,并通过障碍物与起始点的引导对工作环境进行覆盖,在算法中添加了回溯机制,用于帮助机器人脱离“死区”,同时避免机器人之间回溯区域冲突以及较长回溯路径的出现。引入LRA函数进行优化,减少机器人的转弯次数和路径覆盖的长度。在不同环境下进行仿真实验,得到的路径长度与生物激励神经网络算法(BINN)和牛耕式A*算法(BA*)相比分别减少了17.9%、17.6%,转弯次数与BA*算法和分散捕食者猎物模型算法(R-DPPCPP)相比分别减少了18.0%、34.7%,验证了所提算法在清洁机器人全覆盖路径规划中的有效性。 展开更多
关键词 多机器人 未知环境 全覆盖算法 回溯机制 活性值函数 路径规划
在线阅读 下载PDF
面向未知目标收集的移动机器人规划方法研究
18
作者 陈彦杰 范俊炜 +3 位作者 张丽萍 江文圣 赖镇南 王耀南 《控制与决策》 北大核心 2025年第9期2654-2662,共9页
移动机器人在执行未知目标收集任务时通常面临环境未知、目标信息缺失等挑战.针对未知环境目标收集任务时易忽视探索角落边界、过度拓展覆盖范围而产生的任务完成效率低、路径冗余等问题,提出一种同时探索和覆盖的运动规划方法(SECPP).... 移动机器人在执行未知目标收集任务时通常面临环境未知、目标信息缺失等挑战.针对未知环境目标收集任务时易忽视探索角落边界、过度拓展覆盖范围而产生的任务完成效率低、路径冗余等问题,提出一种同时探索和覆盖的运动规划方法(SECPP).首先,SECPP算法通过由环境信息量和移动代价构成的信息增益函数,从边界采样的候选探索点中选择信息增益最大的为实际探索点.然后,考虑机器人探索后地图信息的变化,搭建平衡框架来判断局部环境探明情况.若局部环境未探明,则使得机器人持续根据选定探索点执行环境探索任务;若局部环境已探明,则提取任务区域信息,通过由路径探索因子和覆盖引导点构成的覆盖奖励函数,生成区域覆盖路径,使得机器人沿路径移动并同步执行目标采集,以实现区域目标的完全收集.最后,将SECPP算法与其他同类先进算法进行仿真和实验对比,仿真和实验结果表明,SECPP能够以更短的重复路径长度、更少的转角数量以及更短的时间完成未知目标收集任务. 展开更多
关键词 未知环境 目标收集 自主探索 全覆盖路径规划 栅格地图 移动机器人
原文传递
Graph-based multi-agent reinforcement learning for collaborative search and tracking of multiple UAVs 被引量:2
19
作者 Bocheng ZHAO Mingying HUO +4 位作者 Zheng LI Wenyu FENG Ze YU Naiming QI Shaohai WANG 《Chinese Journal of Aeronautics》 2025年第3期109-123,共15页
This paper investigates the challenges associated with Unmanned Aerial Vehicle (UAV) collaborative search and target tracking in dynamic and unknown environments characterized by limited field of view. The primary obj... This paper investigates the challenges associated with Unmanned Aerial Vehicle (UAV) collaborative search and target tracking in dynamic and unknown environments characterized by limited field of view. The primary objective is to explore the unknown environments to locate and track targets effectively. To address this problem, we propose a novel Multi-Agent Reinforcement Learning (MARL) method based on Graph Neural Network (GNN). Firstly, a method is introduced for encoding continuous-space multi-UAV problem data into spatial graphs which establish essential relationships among agents, obstacles, and targets. Secondly, a Graph AttenTion network (GAT) model is presented, which focuses exclusively on adjacent nodes, learns attention weights adaptively and allows agents to better process information in dynamic environments. Reward functions are specifically designed to tackle exploration challenges in environments with sparse rewards. By introducing a framework that integrates centralized training and distributed execution, the advancement of models is facilitated. Simulation results show that the proposed method outperforms the existing MARL method in search rate and tracking performance with less collisions. The experiments show that the proposed method can be extended to applications with a larger number of agents, which provides a potential solution to the challenging problem of multi-UAV autonomous tracking in dynamic unknown environments. 展开更多
关键词 Unmanned aerial vehicle(UAV) Multi-agent reinforcement learning(MARL) Graph attention network(GAT) Tracking Dynamic and unknown environment
原文传递
上一页 1 2 12 下一页 到第
使用帮助 返回顶部