期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于KL散度和迁移强化学习的AMR路径规划算法
1
作者 李聪 张震 刘鹏昌 《电光与控制》 北大核心 2026年第1期78-83,90,共7页
在军事或民用仓库进行货物搬运和仓储物流时,重点是解决自主移动机器人(AMR)的路径规划问题。为了更快地得到最优路径,提出了一种基于KL散度的迁移强化学习(KL-TRL)算法。KL-TRL算法通过计算源任务与目标任务之间的Kullback-Leibler(KL... 在军事或民用仓库进行货物搬运和仓储物流时,重点是解决自主移动机器人(AMR)的路径规划问题。为了更快地得到最优路径,提出了一种基于KL散度的迁移强化学习(KL-TRL)算法。KL-TRL算法通过计算源任务与目标任务之间的Kullback-Leibler(KL)散度,将此散度与一项衰减因子整合进目标任务的Q值更新过程中,以此来引导目标任务的学习。这种算法更充分地利用了先前任务的经验,加快了目标任务的学习速度,从而更快地得到最优路径。KL-TRL算法的有效性在AMR协作搬运任务仿真中得到了证实。相比其他传统迁移强化学习算法,该算法具有更快的启动速度和收敛速度。通过快速找到最优路径,AMR可以在军事领域中快速部署装备,在民用领域提高物流效率。 展开更多
关键词 自主移动机器人 机器人控制 迁移学习 强化学习 KL散度
在线阅读 下载PDF
地铁不落轮镟床轮对无法装夹故障分析
2
作者 王宁宁 于洋 《设备管理与维修》 2024年第3期56-58,共3页
针对某地铁不落轮镟床镟修车轴时轮对出现无法装夹的问题,根据设备故障现象与故障过程,分析轮对无法装夹的原因,并结合实际情况提出改进措施,保证不落轮镟床进行轮对测量及镟修作业时电客车轮对正常装夹。
关键词 不落轮镟床 轮对装夹 轮架压力
在线阅读 下载PDF
基于多智能体强化学习和信息信用值的机器人路径规划方法
3
作者 张飞龙 张震 宋婷婷 《自动化与仪表》 2025年第9期73-77,88,共6页
多智能体系统可以通过智能体通信来提升整体的协同效能。传统的多智能体通信算法在利用通信信息时难以评估不同来源通信信息重要性,难以平衡自身局部观测数据和通信信息对决策的影响。针对这一问题,提出了一种基于多智能体强化学习和信... 多智能体系统可以通过智能体通信来提升整体的协同效能。传统的多智能体通信算法在利用通信信息时难以评估不同来源通信信息重要性,难以平衡自身局部观测数据和通信信息对决策的影响。针对这一问题,提出了一种基于多智能体强化学习和信息信用值的机器人路径规划方法(Cre-MARL)。通过设计一个信用生成模块,为每个机器人生成一个信用值,以此量化不同来源通信数据的价值。通过引入注意力机制以优化机器人自身传感器数据与接收到的通信信息之间的融合,确保决策过程既能充分利用环境感知也能有效整合队友提供的关键情报,实现了对通信信息的高效利用,有效解决了上述问题。将Cre-MARL算法在机器人合作围猎任务中进行测试,与其他算法相比,Cre-MARL算法的性能更优,证明了算法的有效性。 展开更多
关键词 多智能体强化学习 马尔科夫决策 智能体通信 通信信息利用 信用值 信息融合 路径规划 注意力机制
在线阅读 下载PDF
基于图卷积神经网络的疲劳驾驶检测方法
4
作者 刘恺玢 张震 +1 位作者 宋婷婷 刘玮 《自动化与仪表》 2025年第11期86-92,共7页
疲劳驾驶是导致交通事故的主要因素之一,因此设计有效的疲劳状态检测方法对提升交通安全具有重要意义。该文提出一种基于脑电信号的检测方法,结合功率谱特征和微分熵特征,并引入长短期记忆网络(LSTM)和图卷积神经网络(GCN)构建分类模型... 疲劳驾驶是导致交通事故的主要因素之一,因此设计有效的疲劳状态检测方法对提升交通安全具有重要意义。该文提出一种基于脑电信号的检测方法,结合功率谱特征和微分熵特征,并引入长短期记忆网络(LSTM)和图卷积神经网络(GCN)构建分类模型。基于SEED-VIG数据集的两个频带上的实验表明,模型在疲劳状态分类上的准确率最高可达98.3%。微分熵特征在多种分类器上具有最佳的训练效果,研究提出的RGCN-LSTM模型在4种特征处理的数据集上平均准确率达94.7%,整体优于主流方法。 展开更多
关键词 疲劳检测 脑电信号 图卷积神经网络 深度学习
在线阅读 下载PDF
基于谐波注入法的差分式非接触电压测量 被引量:1
5
作者 张耀 叶永杰 +1 位作者 李昊 熊思宇 《科学技术与工程》 北大核心 2024年第1期245-251,共7页
当前基于电容耦合的传感器尚无有效、便捷的耦合电容动态校准方法,影响测量精度。因此,提出了基于谐波注入的差分式非接触电压测量方法,首先,利用感应探头与跨阻运算放大器将基频信号引入测量系统;其次,通过屏蔽罩,减小外界杂散电容变... 当前基于电容耦合的传感器尚无有效、便捷的耦合电容动态校准方法,影响测量精度。因此,提出了基于谐波注入的差分式非接触电压测量方法,首先,利用感应探头与跨阻运算放大器将基频信号引入测量系统;其次,通过屏蔽罩,减小外界杂散电容变化带来的干扰,改进探头并引入差分式电路结构,消除运放输入电容的影响;再次,对测量电路注入谐波,并利用离散傅里叶变换(discrete Fourier transformation,DFT)实现对响应信号中基波信号与谐波信号的提取,通过计算谐波源与谐波响应信号的比值,求解出耦合电容参数,实现其动态校准;最后,将校准的电容参数代入基波方程,实现基波电压信号的测量。通过仿真结果表明,所提的测量方法可在10 kV的应用场景中满足对变化的耦合电容校正要求,且最大的电压测量误差小于0.4%。 展开更多
关键词 非接触测量 谐波注入 差分式 分布电容 电压传感器
在线阅读 下载PDF
一种基于策略迁移和强化学习的AMR路径规划方法 被引量:1
6
作者 刘明阳 张震 +1 位作者 宋婷婷 周维庆 《控制工程》 CSCD 北大核心 2024年第7期1195-1202,共8页
自主移动机器人(autonomous mobile robot,AMR)路径规划是货物搬运、仓储物流等领域的一项关键技术。当工厂内的工作环境发生变化时,AMR单纯使用强化学习算法重新学习最优路径的速度慢。针对此问题,在Q学习算法的基础上提出了一种策略... 自主移动机器人(autonomous mobile robot,AMR)路径规划是货物搬运、仓储物流等领域的一项关键技术。当工厂内的工作环境发生变化时,AMR单纯使用强化学习算法重新学习最优路径的速度慢。针对此问题,在Q学习算法的基础上提出了一种策略迁移强化学习算法。该算法使用源任务保存的相邻状态转移和目标任务保存的相邻状态转移计算相似度。根据相似度的大小和权重选择性地迁移源任务的策略,并以一定概率进行随机探索和使用目标任务新学习的策略。所提算法的有效性在AMR合作搬运任务中得到了验证。与其他方法相比,该算法的启动能力更强,收敛速度更快。 展开更多
关键词 迁移学习 强化学习 状态转移 策略迁移 相似度
原文传递
基于情景记忆式强化学习的协作运输方法 被引量:1
7
作者 周维庆 张震 +2 位作者 宋光乐 刘明阳 宋婷婷 《控制工程》 CSCD 北大核心 2024年第7期1203-1210,共8页
针对情景记忆算法中记忆池中的样本利用率低的问题,提出了一种基于情景记忆和值函数分解框架相结合的合作型多智能体强化学习算法,即情景记忆值分解(episodic memory value decomposition,EMVD)算法。EMVD算法在情景记忆部分以时间差分... 针对情景记忆算法中记忆池中的样本利用率低的问题,提出了一种基于情景记忆和值函数分解框架相结合的合作型多智能体强化学习算法,即情景记忆值分解(episodic memory value decomposition,EMVD)算法。EMVD算法在情景记忆部分以时间差分误差平方为依据来更新记忆池,使记忆池中一直保留对学习效果提升更重要的情景记忆样本,并将情景记忆算法与神经网络相结合,提高了算法的收敛速度。为了将EMVD算法应用于机器人协作运输任务中,设定机器人和运输目标的位置为状态,并且设计了回报函数。仿真结果表明,EMVD算法可以探索出机器人协作运输任务的最优策略,提高了算法的收敛速度。 展开更多
关键词 强化学习 多智能体强化学习 情景记忆 机器人协作运输 时间差分误差
原文传递
自动售检票系统设备维保策略
8
作者 高翔 万凯 +2 位作者 林倩 陈浩 盛逵 《今日制造与升级》 2023年第6期83-85,共3页
随着青岛地铁新线路的开通,自动售检票系统设备的数量不断增加。目前,AFC设备的维保周期只与运行时间相关,不利于设备指标管控,且浪费人力,存在过度修的现象。为更加科学高效、有的放矢地进行AFC设备的维保,以青岛地铁8号线AFC设备在202... 随着青岛地铁新线路的开通,自动售检票系统设备的数量不断增加。目前,AFC设备的维保周期只与运行时间相关,不利于设备指标管控,且浪费人力,存在过度修的现象。为更加科学高效、有的放矢地进行AFC设备的维保,以青岛地铁8号线AFC设备在2021年期间的故障次数、使用次数等为基础,研究制定AFC设备的维保策略,在降本增效的前提下实现AFC设备指标再提升。 展开更多
关键词 AFC设备 维保策略 故障次数 使用次数 降本增效
在线阅读 下载PDF
某线路洗车机、镟床运用评估分析及建议
9
作者 王宁宁 张扬 《设备管理与维修》 2024年第6期102-104,共3页
针对某地铁线路洗车机、不落轮镟床的使用情况,对设备规划、设计、选型,设备安装、调试,设备运行可靠性,设备维护便利性,设备操作使用及同前期已开通线路设备对比等6个方面进行全面评价,进一步评估洗车机和不落轮镟床的运用情况,并提出... 针对某地铁线路洗车机、不落轮镟床的使用情况,对设备规划、设计、选型,设备安装、调试,设备运行可靠性,设备维护便利性,设备操作使用及同前期已开通线路设备对比等6个方面进行全面评价,进一步评估洗车机和不落轮镟床的运用情况,并提出优化措施,为后续新线提供参考。 展开更多
关键词 洗车机 不落轮镟床 优化措施
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部