期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
面向Option的k-聚类Subgoal发现算法 被引量:8
1
作者 王本年 高阳 +2 位作者 陈兆乾 谢俊元 陈世福 《计算机研究与发展》 EI CSCD 北大核心 2006年第5期851-855,共5页
在学习过程中自动发现有用的Subgoal并创建Option,对提高强化学习的学习性能有着重要意义.提出了一种基于k-聚类的Subgoal自动发现算法,该算法能通过对在线获取的少量路径数据进行聚类的方法抽取出Subgoal.实验表明,该算法能有效地发现... 在学习过程中自动发现有用的Subgoal并创建Option,对提高强化学习的学习性能有着重要意义.提出了一种基于k-聚类的Subgoal自动发现算法,该算法能通过对在线获取的少量路径数据进行聚类的方法抽取出Subgoal.实验表明,该算法能有效地发现所有符合要求的Subgoal,与Q-学习和基于多样性密度的强化学习算法相比,用该算法发现Subgoal并创建Option的强化学习算法能有效提高A-gent的学习速度. 展开更多
关键词 分层强化学习 OPTION 子目标
在线阅读 下载PDF
Autonomic discovery of subgoals in hierarchical reinforcement learning 被引量:1
2
作者 XIAO Ding LI Yi-tong SHI Chuan 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2014年第5期94-104,共11页
Option is a promising method to discover the hierarchical structure in reinforcement learning (RL) for learning acceleration. The key to option discovery is about how an agent can find useful subgoals autonomically ... Option is a promising method to discover the hierarchical structure in reinforcement learning (RL) for learning acceleration. The key to option discovery is about how an agent can find useful subgoals autonomically among the passing trails. By analyzing the agent's actions in the trails, useful heuristics can be found. Not only does the agent pass subgoals more frequently, but also its effective actions are restricted in subgoals. As a consequence, the subgoals can be deemed as the most matching action-restricted states in the paths. In the grid-world environment, the concept of the unique-direction value reflecting the action-restricted property was introduced to find the most matching action-restricted states. The unique-direction-value (UDV) approach is chosen to form options offline and online autonomically. Experiments show that the approach can find subgoals correctly. Thus the Q-learning with options found on both offline and online process can accelerate learning significantly. 展开更多
关键词 hierarchical reinforcement learning OPTION Q-LEARNING subgoal UDV
原文传递
动态未知环境中移动机器人的滚动路径规划及安全性分析 被引量:32
3
作者 张纯刚 席裕庚 《控制理论与应用》 EI CAS CSCD 北大核心 2003年第1期37-44,共8页
借鉴预测控制滚动优化原理 ,研究了全局环境未知且存在动态障碍物情况下的机器人路径规划问题 .提出的基于滚动窗口的移动机器人路径规划方法充分利用机器人实时测得的局部环境信息 ,以滚动方式进行在线规划 ,合理结合了优化与反馈 ,对... 借鉴预测控制滚动优化原理 ,研究了全局环境未知且存在动态障碍物情况下的机器人路径规划问题 .提出的基于滚动窗口的移动机器人路径规划方法充分利用机器人实时测得的局部环境信息 ,以滚动方式进行在线规划 ,合理结合了优化与反馈 ,对动态环境具有良好的适应性 . 展开更多
关键词 动态未知环境 移动机器人 滚动路径规划 安全性分析
在线阅读 下载PDF
利用机器人行为动力学与滚动窗口路径规划 被引量:9
4
作者 傅卫平 张鹏飞 杨世强 《计算机工程与应用》 CSCD 北大核心 2009年第2期212-215,236,共5页
针对存在静态障碍物的未知环境下移动机器人路径规划问题,提出运用行为动力学与滚动窗口相结合进行路径规划的方法。首先根据所获得的窗口(局部环境)信息,采用启发式函数进行局部子目标优化选择;然后将路径规划问题即导航行为分解为趋... 针对存在静态障碍物的未知环境下移动机器人路径规划问题,提出运用行为动力学与滚动窗口相结合进行路径规划的方法。首先根据所获得的窗口(局部环境)信息,采用启发式函数进行局部子目标优化选择;然后将路径规划问题即导航行为分解为趋于目标行为和避障行为,并对这两种行为分别建立了行为状态和行为模式动力学模型;在此基础上,以窗口为单位,利用导航行为动力学模型进行在线自主路径规划;将一系列窗口中的规划轨迹按照连续性条件首尾相接,最终完成了一条全局规划任务。该方法原理简单,计算量小,规划路径光滑,具有较强的实际应用价值。通过计算机实例仿真验证了该方法的有效性和适应性。 展开更多
关键词 移动机器人 滚动窗口 动力学模型 路径规划 子目标
在线阅读 下载PDF
样例的子目标编码对新问题解决中原理运用的作用研究 被引量:10
5
作者 邢强 莫雷 《心理发展与教育》 CSSCI 北大核心 2003年第1期55-59,共5页
运用排列和组合原理 ,通过三个实验研究了样例解题步骤的编码方式对原理运用的作用。实验 1和实验 2分别探讨了样例解题步骤的不同编码方式对解决表面概貌变化和表面对应变化的新问题时原理运用的影响 ;实验 3探讨了不同编码条件下原理... 运用排列和组合原理 ,通过三个实验研究了样例解题步骤的编码方式对原理运用的作用。实验 1和实验 2分别探讨了样例解题步骤的不同编码方式对解决表面概貌变化和表面对应变化的新问题时原理运用的影响 ;实验 3探讨了不同编码条件下原理运用概化的形成。结果表明 :用子目标编码样例的解题步骤有利于消除新问题解决中由于表面概貌和表面对应变化带来的消极影响 ;用子目标编码样例的解题步骤促进了学习者对原理的理解和获得原理的概化图式。 展开更多
关键词 新问题解决 原理运用 子目标 原理概化 样例学习 概化图式 教育心理学
在线阅读 下载PDF
复杂环境下解决势场法局部极小问题的路径规划方法 被引量:8
6
作者 刘传领 梁咏梅 杨静宇 《哈尔滨理工大学学报》 CAS 2012年第4期78-82,共5页
多年来势场法路径规划的局部极小问题就一直被广泛关注,针对人工势场法所固有的缺陷提出了一种改进的移动机器人路径规划方法.方法利用膨胀与腐蚀算法对机器人的工作空间进行预处理,来优化工作环境,并使用改进的势场法进行机器人导航,... 多年来势场法路径规划的局部极小问题就一直被广泛关注,针对人工势场法所固有的缺陷提出了一种改进的移动机器人路径规划方法.方法利用膨胀与腐蚀算法对机器人的工作空间进行预处理,来优化工作环境,并使用改进的势场法进行机器人导航,以改善其运动轨迹;另外通过设置子目标点使陷入局部极小的机器人快速"逃离"极小状态.仿真结果表明本文算法在复杂环境下解决机器人路径规划的局部极小问题是有效的. 展开更多
关键词 势场法 路径规划 局部极小 膨胀与腐蚀算法 子目标点
在线阅读 下载PDF
基于路径匹配的在线分层强化学习方法 被引量:4
7
作者 石川 史忠植 王茂光 《计算机研究与发展》 EI CSCD 北大核心 2008年第9期1470-1476,共7页
如何在线找到正确的子目标是基于option的分层强化学习的关键问题.通过分析学习主体在子目标处的动作,发现了子目标的有效动作受限的特性,进而将寻找子目标的问题转化为寻找路径中最匹配的动作受限状态.针对网格学习环境,提出了单向值... 如何在线找到正确的子目标是基于option的分层强化学习的关键问题.通过分析学习主体在子目标处的动作,发现了子目标的有效动作受限的特性,进而将寻找子目标的问题转化为寻找路径中最匹配的动作受限状态.针对网格学习环境,提出了单向值方法表示子目标的有效动作受限特性和基于此方法的option自动发现算法.实验表明,基于单向值方法产生的option能够显著加快Q学习算法,也进一步分析了option产生的时机和大小对Q学习算法性能的影响. 展开更多
关键词 强化学习 分层强化学习 OPTION 子目标 路径匹配
在线阅读 下载PDF
一种克服振荡与死循环的机器人实时路径规划方法(英文) 被引量:8
8
作者 张纯刚 席裕庚 《自动化学报》 EI CSCD 北大核心 2003年第2期197-205,共9页
本文研究了一般障碍环境下全局信息未知的机器人路径规划问题 ,分析了基于实时探测信息的滚动路径规划算法可能遇到的振荡和死循环现象 ,提出了增加适量记忆的改进滚动路径规划算法 ,不仅有效地克服了振荡和死循环的发生 ,而且保证了机... 本文研究了一般障碍环境下全局信息未知的机器人路径规划问题 ,分析了基于实时探测信息的滚动路径规划算法可能遇到的振荡和死循环现象 ,提出了增加适量记忆的改进滚动路径规划算法 ,不仅有效地克服了振荡和死循环的发生 ,而且保证了机器人对全局目标的可达性 ,为移动机器人在一般未知障碍环境下的路径规划提供了快速。 展开更多
关键词 机器人 实时路径规划 滚动规则 局部规划 振荡 死循环 可达性
在线阅读 下载PDF
目标设置对写作困难儿童议论文说服力的促进效应研究 被引量:5
9
作者 吴洪珺 刘翔平 杜英 《心理发展与教育》 CSSCI 北大核心 2006年第1期69-73,共5页
将写作困难儿童随机分入三个不同的目标设置组,总目标设置条件要求儿童根据话题写议论文,目标为文章应能说服读者赞同他们的观点;分目标设置条件对儿童有同样的要求,但给儿童提供了以议论文的基本构成为基础的分目标;辩论加分目标设置... 将写作困难儿童随机分入三个不同的目标设置组,总目标设置条件要求儿童根据话题写议论文,目标为文章应能说服读者赞同他们的观点;分目标设置条件对儿童有同样的要求,但给儿童提供了以议论文的基本构成为基础的分目标;辩论加分目标设置除了与分目标设置组相同的条件外,还要求儿童在写作前进行辩论。研究结果表明,分目标设置组儿童的议论文比总目标设置组和辩论加分目标设置组儿童的议论文更具说服力度。在文章构成成分上,分目标设置组和辩论加分目标设置组要好于总目标设置组。这三种目标设置中,分目标对写作困难儿童的议论文说服力有很大的促进作用。 展开更多
关键词 目标设置 分目标设置 写作困难
在线阅读 下载PDF
智能规划中的可纳子目标排序 被引量:2
10
作者 梁瑞仕 姜云飞 +1 位作者 边芮 吴向军 《软件学报》 EI CSCD 北大核心 2011年第5期914-928,共15页
提出了一种称为可纳子目标排序(admissible subgoal ordering,简称ASO)的排序关系,给出了可纳排序的形式化定义并讨论其对增量式规划的重要性.随后介绍了原子依赖关系理论和原子依赖图技术,能够在多项式时间内近似求解可纳子目标排序关... 提出了一种称为可纳子目标排序(admissible subgoal ordering,简称ASO)的排序关系,给出了可纳排序的形式化定义并讨论其对增量式规划的重要性.随后介绍了原子依赖关系理论和原子依赖图技术,能够在多项式时间内近似求解可纳子目标排序关系.最后给出了一种计算可纳子目标序列的算法.其所有思想已经在规划系统ASOP中实现.通过在国际规划大赛标准测试领域问题上的实验,其结果表明,该方法能够有效地求解大规模的规划问题,并能极大地改善规划性能. 展开更多
关键词 智能规划 子目标排序 可纳排序关系 增量式规划 原子依赖图技术
在线阅读 下载PDF
基于滚动窗口的移动机器人路径规划 被引量:14
11
作者 张纯刚 《系统工程与电子技术》 EI CSCD 北大核心 2002年第6期63-65,69,共4页
借鉴预测控制滚动优化原理 ,研究了全局环境未知且存在动态障碍物情况下的移动机器人路径规划问题。提出的基于滚动窗口的移动机器人路径规划方法充分利用机器人实时测得的局部环境信息 ,并通过有效的场景预测 ,以滚动方式进行在线规划 ... 借鉴预测控制滚动优化原理 ,研究了全局环境未知且存在动态障碍物情况下的移动机器人路径规划问题。提出的基于滚动窗口的移动机器人路径规划方法充分利用机器人实时测得的局部环境信息 ,并通过有效的场景预测 ,以滚动方式进行在线规划 ,结合了优化和反馈机制 ,具有计算量小、反应迅速的特点。大量仿真结果表明 ,该方法能很好地适应动态不确定环境。 展开更多
关键词 机器人路径规划 滚动规划 预测控制 子目标
在线阅读 下载PDF
样例的子目标编码对新问题解决中原理通达的作用 被引量:3
12
作者 邢强 莫雷 《应用心理学》 CSSCI 2002年第4期13-18,共6页
通过 3个实验 ,分别研究了样例的不同编码对消除由于表面概貌和表面对应变化对原理通达带来的消极影响的作用以及样例学习中原例概化的形成阶段。实验结果表明 :样例解题步骤的子目标编码有助于消除由于表面内容变化对原理通达带来的消... 通过 3个实验 ,分别研究了样例的不同编码对消除由于表面概貌和表面对应变化对原理通达带来的消极影响的作用以及样例学习中原例概化的形成阶段。实验结果表明 :样例解题步骤的子目标编码有助于消除由于表面内容变化对原理通达带来的消极影响 ;子目标学习使学习者在样例学习阶段就形成了关于原理的概化。 展开更多
关键词 子目标 表面概貌 表面对应 原理通达
在线阅读 下载PDF
未知环境中智能体的路径规划 被引量:2
13
作者 张纯刚 《测控技术》 CSCD 2002年第4期55-57,共3页
用滚动规划方法解决全局环境未知时的智能体路径规划问题。该法充分利用智能体实时探测的局部环境信息 ,以滚动方式进行在线规划 ,大大减小了在线运算量 ;通过适当加入记忆 ,能保证规划的全局可达性。
关键词 机器人 未知环境 智能体 路径规划 滚动规划 局部规划 滚动窗口 可达性
在线阅读 下载PDF
基于层次地图的子目标点的选择与更新策略
14
作者 刘宏 王健 王闯奇 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S2期208-211,共4页
为了适应较大场景下多自由度移动机器人的路径规划,建立了一种新型的分层采样地图.利用第1层二维地图进行子目标点的选择和更新,从而实现子目标点对路径规划的全局引导.然后结合局部规划器和第2层九维地图进行路径搜索得到路径.考虑当... 为了适应较大场景下多自由度移动机器人的路径规划,建立了一种新型的分层采样地图.利用第1层二维地图进行子目标点的选择和更新,从而实现子目标点对路径规划的全局引导.然后结合局部规划器和第2层九维地图进行路径搜索得到路径.考虑当前局部空间的子目标点存在被运动障碍物遮挡的情况,若当前子目标点被遮挡,则选取下一个子目标点为当前子目标点进行规划;若不能找到有效子目标点,则反馈到第1层进行子目标点更新,更新后再继续进行路径搜索.通过上层引导、下层更新反馈的机制对概率地图进行改进,在保证概率完备性的同时,提高了路径搜索的速度.仿真实验表明该方法能达到很好的实时性和鲁棒性. 展开更多
关键词 路径规划 分层采样 子目标点 局部规划 实时性
原文传递
基于禁忌搜索的option自动构造
15
作者 徐明亮 苏晓萍 须文波 《系统仿真学报》 CAS CSCD 北大核心 2009年第23期7479-7482,共4页
通过在环境中设置禁忌状态,agent能够在与环境的交互过程中发现瓶颈状态,以及瓶颈状态之间的毗邻关系。agent根据瓶颈状态之间的毗邻关系,自动地从毗邻的瓶颈状态中挑选合适的瓶颈状态作为option子目标。同时在交互过程中获得Option的... 通过在环境中设置禁忌状态,agent能够在与环境的交互过程中发现瓶颈状态,以及瓶颈状态之间的毗邻关系。agent根据瓶颈状态之间的毗邻关系,自动地从毗邻的瓶颈状态中挑选合适的瓶颈状态作为option子目标。同时在交互过程中获得Option的初始集,实现option的自动构造。网格环境中的导航实验验证了该方法无需人工干预就可以自动构造有用的option,即可以加快agent学习速度,也便于知识迁移,加快相关任务的学习。 展开更多
关键词 分层强化学习 OPTION 子目标 禁忌搜索 Q-LEARNING
原文传递
基于实时滚动亚目标的遥控移动机器人局部路径规划方法
16
作者 章小兵 宋爱国 唐鸿儒 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第1期58-62,共5页
在机器人前部一定范围内虚拟出8个亚目标,采集前部8个超声波传感器数据,根据工作场所障碍物分布情况,分析指定范围内有无障碍物,结合机器人航向偏离目标的角度,选择最佳亚目标.若机器人航向在一个规定的小角度范围内对准目标且机器人正... 在机器人前部一定范围内虚拟出8个亚目标,采集前部8个超声波传感器数据,根据工作场所障碍物分布情况,分析指定范围内有无障碍物,结合机器人航向偏离目标的角度,选择最佳亚目标.若机器人航向在一个规定的小角度范围内对准目标且机器人正前方无障碍物,机器人作直线运动;其他情况下,机器人以圆弧接近最佳亚目标.在运动过程中,最佳亚目标滚动更新,运动轨迹随之变化.该方法克服了机器人避障时速度慢的缺点,避障流畅,路径平滑且能以较短路径接近目标,实用快捷. 展开更多
关键词 遥控移动机器人 局部路径规划 实时滚动亚目标
在线阅读 下载PDF
New coordination scheme for multi-robot systems based on state space models
17
作者 Xie Wenlong Su Jianbo Lin Zongli 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第4期722-734,共13页
A new coordination scheme for multi-robot systems is proposed. A state space model of the multi- robot system is defined and constructed in which the system's initial and goal states are included along with the task ... A new coordination scheme for multi-robot systems is proposed. A state space model of the multi- robot system is defined and constructed in which the system's initial and goal states are included along with the task definition and the system's internal and external constraints. Task accomplishment is considered a transition of the system state in its state space (SS) under the system's constraints. Therefore, if there exists a connectable path within reachable area of the SS from the initial state to the goal state, the task is realizable. The optimal strategy for the task realization under constraints is investigated and reached by searching for the optimal state transition trajectory of the robot system in the SS. Moreover, if there is no connectable path, which means the task cannot be performed Successfully, the task could be transformed to be realizable by making the initial state and the goal state connectable and finding a path connecting them in the system's SS. This might be done via adjusting the system's configuration and/or task constraints. Experiments of multi-robot formation control with obstacles in the environment are conducted and simulation results show the validity of the proposed method. 展开更多
关键词 multi-robot system COORDINATION state space formation maneuver subgoal
在线阅读 下载PDF
用于分层强化学习的最小k-聚类算法
18
作者 王本年 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第5期533-535,共3页
在学习过程中自动发现有用的Subgoal,对于分层强化学习有着重要的意义。文章提出了一种最小k-聚类算法,该算法能通过对在线获取的少量路径数据进行聚类的方法,抽取出有用的Subgoal;实验表明,该算法能有效地发现所有符合要求的Subgoal,... 在学习过程中自动发现有用的Subgoal,对于分层强化学习有着重要的意义。文章提出了一种最小k-聚类算法,该算法能通过对在线获取的少量路径数据进行聚类的方法,抽取出有用的Subgoal;实验表明,该算法能有效地发现所有符合要求的Subgoal,较多样性密度算法和FD算法有更强的Subgoal发现能力。 展开更多
关键词 k-聚类算法 分层强化学习 子目标
在线阅读 下载PDF
分析逻辑程序的一种有效工具——推导格式
19
作者 陈火炎 《暨南大学学报(自然科学与医学版)》 CAS CSCD 1990年第1期20-27,共8页
本文提出逻辑程序阿部推理机制的一种格式化描述方法——推导格式。这种描述方法是分析逻辑程序的一种有效的工具,它可帮助我们理解和调试给定的逻辑程序。
关键词 逻辑程序 推导格式 回溯
在线阅读 下载PDF
基于核密度估计的分层强化学习自动分层算法
20
作者 陆军 付成伟 《自动化技术与应用》 2008年第5期6-10,共5页
分层强化学习中自动分层问题目前仍未得到有效的解决,本文针对Option方法,研究了基于核密度估计的Option自动生成算法,该算法根据分层强化学习的特点并结合改进后的核密度估计层次聚类方法,实现分层强化学习的自动分层,生成子目标,并在... 分层强化学习中自动分层问题目前仍未得到有效的解决,本文针对Option方法,研究了基于核密度估计的Option自动生成算法,该算法根据分层强化学习的特点并结合改进后的核密度估计层次聚类方法,实现分层强化学习的自动分层,生成子目标,并在此基础上构建出Options。实验结果表明这种算法可以大大加快学习的效率。 展开更多
关键词 分层强化学习 OPTION 核密度估计 子目标
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部