期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
基于多智能体强化学习的博弈综述 被引量:5
1
作者 李艺春 刘泽娇 +4 位作者 洪艺天 王继超 王健瑞 李毅 唐漾 《自动化学报》 北大核心 2025年第3期540-558,共19页
多智能体强化学习(Multi-agent reinforcement learning,MARL)作为博弈论、控制论和多智能体学习的交叉研究领域,是多智能体系统(Multi-agent systems,MASs)研究中的前沿方向,赋予智能体在动态多维的复杂环境中通过交互和决策完成多样... 多智能体强化学习(Multi-agent reinforcement learning,MARL)作为博弈论、控制论和多智能体学习的交叉研究领域,是多智能体系统(Multi-agent systems,MASs)研究中的前沿方向,赋予智能体在动态多维的复杂环境中通过交互和决策完成多样化任务的能力.多智能体强化学习正在向应用对象开放化、应用问题具身化、应用场景复杂化的方向发展,并逐渐成为解决现实世界中博弈决策问题的最有效工具.本文对基于多智能体强化学习的博弈进行系统性综述.首先,介绍多智能体强化学习的基本理论,梳理多智能体强化学习算法与基线测试环境的发展进程.其次,针对合作、对抗以及混合三种多智能体强化学习任务,从提高智能体合作效率、提升智能体对抗能力的维度来介绍多智能体强化学习的最新进展,并结合实际应用探讨混合博弈的前沿研究方向.最后,对多智能体强化学习的应用前景和发展趋势进行总结与展望. 展开更多
关键词 多智能体强化学习 多智能体系统 博弈决策 均衡求解
在线阅读 下载PDF
基于PI结构的多智能体系统容错一致性控制 被引量:1
2
作者 郜晨 何潇 周东华 《自动化学报》 北大核心 2025年第3期570-576,共7页
针对无领航者多智能体系统(Multi-agent systems,MASs)以及领航-跟随多智能体系统执行器故障问题,设计基于PI结构的容错控制律.考虑到传统的比例型控制律无法消除加性干扰影响下的稳态误差,引入积分环节,在一致性控制律中融入状态的积分... 针对无领航者多智能体系统(Multi-agent systems,MASs)以及领航-跟随多智能体系统执行器故障问题,设计基于PI结构的容错控制律.考虑到传统的比例型控制律无法消除加性干扰影响下的稳态误差,引入积分环节,在一致性控制律中融入状态的积分项,用于改善多智能体系统一致性过程的稳态性能.针对领航者输入不为零的情况,设计非线性的一致性控制律,并借助黎卡提方程以及Lyapunov函数,进行多智能体系统在故障情况下的一致性分析和控制律设计.最后,通过一系列对比仿真,说明了所设计控制律在改善系统稳态性能方面的优势. 展开更多
关键词 多智能体系统 容错一致性 PI控制 执行器故障
在线阅读 下载PDF
带有反应扩散项的多智能体系统在边界控制下的平均一致性
3
作者 杨梓鹏 张荣强 刘琛 《南华大学学报(自然科学版)》 2025年第1期62-68,共7页
为解决一类抛物型偏微分方程在多智能体系统中的复杂控制问题,提出了一种创新的边界控制策略,旨在提升系统的稳定性和一致性。该策略设计了作用于边界点的智能控制器,并考虑了有无输入约束的两种情况。通过利用Lyapunov泛函和线性矩阵... 为解决一类抛物型偏微分方程在多智能体系统中的复杂控制问题,提出了一种创新的边界控制策略,旨在提升系统的稳定性和一致性。该策略设计了作用于边界点的智能控制器,并考虑了有无输入约束的两种情况。通过利用Lyapunov泛函和线性矩阵不等式技术,给出了系统取得平均一致性的充分条件。数值算例和仿真验证显示,该方法在有无输入约束下均能实现系统的稳定与一致,具有较快的收敛速度和较高的控制精度,证明了其在实际应用中的可行性和有效性。 展开更多
关键词 多智能体系统 边界控制 平均一致性
在线阅读 下载PDF
DoS攻击下非线性多智能体系统分布式模糊控制
4
作者 张磊 张骜 +1 位作者 卞鹏 陈侠 《火力与指挥控制》 北大核心 2025年第9期27-35,44,共10页
在拒绝服务攻击下,对一类高阶非线性多智能体系统的分布式模糊控制问题进行了研究。引入一种基于数据驱动的在线学习算法,学习参考系统的未知动态。针对Dos攻击设计一种弹性分布式观测器来观测参考系统状态。进一步设计基于高阶滤波器... 在拒绝服务攻击下,对一类高阶非线性多智能体系统的分布式模糊控制问题进行了研究。引入一种基于数据驱动的在线学习算法,学习参考系统的未知动态。针对Dos攻击设计一种弹性分布式观测器来观测参考系统状态。进一步设计基于高阶滤波器的改进观测器,并利用该观测器的状态和反步法设计分散自适应模糊控制器。通过理论分析证明所提出的方法,能够有效解决分布式弹性跟踪问题。最后,通过仿真实例验证了所提方法的有效性。 展开更多
关键词 自适应模糊控制 弹性分布式控制 反步法 DOS攻击 多智能体
在线阅读 下载PDF
执行器饱和的离散时间多智能体系统有限时域一致性控制
5
作者 王巍 王珂 +2 位作者 黄自鑫 王乐君 穆朝絮 《自动化学报》 北大核心 2025年第3期617-630,共14页
针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控... 针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控制问题的求解转化为执行器饱和的单智能体有限时域最优控制问题的求解,并证明可以通过求解修正的时变黎卡提方程(Modified time-varying Riccati equation,MTVRE)实现有限时域最优控制.随后,引入时变参数化Q函数(Time-varying parameterized Q-function,TVPQF),并提出基于Q学习的模型无关后向时间迭代算法,可以更新低增益参数,同时实现逼近求解MTVRE.另外,证明所提迭代求解算法得到的LGF控制矩阵收敛于MTVRE的最优解,也可以实现全局有限时域一致性控制.最后,通过仿真实验结果验证了该方法的有效性. 展开更多
关键词 有限时域一致性控制 执行器饱和 Q函数 模型无关 多智能体系统
在线阅读 下载PDF
弧形多层悬吊楼盖舒适度分析与振动控制
6
作者 杨卓颖 《建筑钢结构进展》 北大核心 2025年第9期101-109,共9页
对弧形长悬挑桁架下的三层悬吊楼盖,开展人行荷载作用下的舒适度分析,并针对性采取振动控制措施。采用midas Gen软件建立整体计算模型,结合办公兼连廊的使用功能和悬吊楼盖协同受力的结构特点,设定多人自由行走与单位面积人群行走两种荷... 对弧形长悬挑桁架下的三层悬吊楼盖,开展人行荷载作用下的舒适度分析,并针对性采取振动控制措施。采用midas Gen软件建立整体计算模型,结合办公兼连廊的使用功能和悬吊楼盖协同受力的结构特点,设定多人自由行走与单位面积人群行走两种荷载,将其分别作用于悬吊中间层和悬吊三层的三种工况中。对获取的楼盖振动响应进行分析,结果表明:激励荷载的选择、荷载作用的层数及作用人数对楼盖振动峰值的加速度有显著影响。进一步地,针对最不利工况,采用设置多调频质量阻尼器(Multi-TMD)的减振措施,基于DEN HARTOG提出的双自由度有阻尼减振器理论模型,结合感应质量法计算主结构一阶模态质量,得到阻尼器最优参数。最终,对比分析一定总质量的阻尼器,在悬挑端部集中布置与沿弧形悬挑部位均匀布置两种方案。结果表明:两种方案均可有效控制楼盖振动响应,且阻尼器在悬挑端部集中布置的方案其减振效率更高。 展开更多
关键词 弧形悬挑 多层悬吊楼盖 人行荷载 振动响应 调频质量阻尼器 阻尼器最优参数
原文传递
多智能体系统事件触发固定时间最优一致性 被引量:3
7
作者 甘勤涛 李瑞鸿 茹怡珊 《陆军工程大学学报》 2024年第2期28-38,共11页
针对多智能体系统(multi-agent systems,MASs)固定时间最优领导-跟随一致性问题,基于性能优化目标,设计了一种基于事件触发机制的最优控制策略,兼顾固定时间最优一致性控制目标和有限的系统通信计算资源。为了近似求解Hamilton-Jacobi-B... 针对多智能体系统(multi-agent systems,MASs)固定时间最优领导-跟随一致性问题,基于性能优化目标,设计了一种基于事件触发机制的最优控制策略,兼顾固定时间最优一致性控制目标和有限的系统通信计算资源。为了近似求解Hamilton-Jacobi-Bellman(HJB)方程获得最优值函数的表达式,提出一种仅包含Critic神经网络结构的自适应动态规划(adaptive dynamic programming,ADP)在线学习算法,结合梯度下降法和经验重放方法,利用历史记录数据和当前数据更新神经网络权重向量近似最优值函数及其梯度。采用基于无人地面车辆的无人集群系统验证了该方法的可行性。 展开更多
关键词 多智能体系统 最优控制 固定时间一致性 自适应动态规划 事件触发机制
在线阅读 下载PDF
非线性广义分数阶多智能体系统迭代学习趋同控制
8
作者 周星宇 王广旭 戴喜生 《中国科技论文》 CAS 2024年第7期820-830,共11页
针对一类含有扰动的非线性广义分数阶多智能体系统,研究其在不同通信拓扑协议下闭环Dα型迭代学习一致性趋同跟踪问题。首先,基于分数阶微积分特性及广义的Gronwall不等式,给出非线性广义分数阶多智能体系统在固定通信拓扑下一致性趋同... 针对一类含有扰动的非线性广义分数阶多智能体系统,研究其在不同通信拓扑协议下闭环Dα型迭代学习一致性趋同跟踪问题。首先,基于分数阶微积分特性及广义的Gronwall不等式,给出非线性广义分数阶多智能体系统在固定通信拓扑下一致性趋同误差收敛的充分条件。然后,将所得到的理论结果推广到通信拓扑随迭代变轴变化的情形,并分析了被控多智能体系统趋同跟踪误差的收敛特性。最后,通过2个数值仿真实例验证了所提闭环Dα型迭代学习趋同控制协议的有效性。 展开更多
关键词 迭代学习控制 非线性广义分数阶多智能体系统 收敛性分析 趋同跟踪
在线阅读 下载PDF
多尺度人口空间大数据聚合模型在地图可视化中的研究与应用 被引量:3
9
作者 李亚云 忻静 丛婧 《测绘通报》 CSCD 北大核心 2024年第3期145-150,共6页
为解决海量人口和建筑物数据导致的地图渲染时间长、页面卡顿无响应等技术问题,本文提出了一种多尺度人口空间大数据聚合模型,通过研究海量数据逐级嵌套的树型逻辑架构和可视域内的空间关系,实现了超大城市多尺度行政区域的人口空间数... 为解决海量人口和建筑物数据导致的地图渲染时间长、页面卡顿无响应等技术问题,本文提出了一种多尺度人口空间大数据聚合模型,通过研究海量数据逐级嵌套的树型逻辑架构和可视域内的空间关系,实现了超大城市多尺度行政区域的人口空间数据统计分析与可视化,并在多源异构属性融合方面得到了较好的应用,更好地满足了超大城市精细化管理需求。 展开更多
关键词 人口普查 海量数据 地理信息系统 多尺度空间
原文传递
基于LabVIEW的摩擦电式多参数传感系统设计
10
作者 赵靖 李伟 +6 位作者 王东明 王俊浩 马飞龙 赵岚驰 冯龙龙 张文文 于鑫 《电子测试》 2024年第5期16-21,共6页
早期的小型传送带参数监测方法,普遍存在灵敏度低、响应速度慢、功耗高以及安装维护复杂等问题。为突破这些技术局限,设计了一种基于LabVIEW与摩擦电效应的多参数传感系统,实现了对传送带运行速度、载体质量的同步监测与显示。系统结合... 早期的小型传送带参数监测方法,普遍存在灵敏度低、响应速度慢、功耗高以及安装维护复杂等问题。为突破这些技术局限,设计了一种基于LabVIEW与摩擦电效应的多参数传感系统,实现了对传送带运行速度、载体质量的同步监测与显示。系统结合数据采集与信号处理技术,构建了具备实时数据分析能力的智能监测平台。实验结果表明,在低速传送带监测方面,系统有效监测速度范围0.1~0.4 m/s,频率拟合优度高达R2=0.992 43,检测误差率控制在1.9%以内;在传送带载体质量监测方向,可覆盖300~1 200 g的质量区间,当载体质量为300 g时,系统峰值功率达160.04μW,检测误差小于1.67%。该系统配合PC端口的实时数据展示功能,为传送带工况监测提供了低功耗、高稳定性的解决方案,在工业自动化领域展现出显著的技术优势与广阔的应用前景。 展开更多
关键词 多参数 传感系统 监控系统 摩擦电式 速度监测 质量监测 工业自动化
在线阅读 下载PDF
基于冻干机传热传质特性的多参数校准系统研制
11
作者 韦越 徐亚迪 +2 位作者 王珂 崔宁 祝天宇 《计量与测试技术》 2024年第5期108-111,共4页
本文针对药用真空冷冻干燥机在传热传质过程中的特性和参数,结合国内外行业标准和技术方法,研制了多参数校准系统。同时,采用无线双通道设计,对西林瓶内冻干过程实际温度及冻干室内真空参数进行校准,并进行实验验证。实验证明:该系统基... 本文针对药用真空冷冻干燥机在传热传质过程中的特性和参数,结合国内外行业标准和技术方法,研制了多参数校准系统。同时,采用无线双通道设计,对西林瓶内冻干过程实际温度及冻干室内真空参数进行校准,并进行实验验证。实验证明:该系统基于实际校准工作需求,能使校准过程更加高效便利,具有可行性和有效性,可为量值溯源提供更有效的标准器。 展开更多
关键词 药用冻干机 传热传质特性 多参数校准系统 温度 真空
在线阅读 下载PDF
基于特定振动反馈的柔性系统振动抑制方法 被引量:4
12
作者 巫佩军 马少康 +2 位作者 陈乔 杨耕 李旭春 《电工技术学报》 EI CSCD 北大核心 2017年第2期188-194,共7页
提出一种基于特定振动反馈的柔性系统振动抑制方法。该方法在传统的电机三环控制结构的基础上使用滤波器将系统末端位移的主要振动提取出来,并反馈到系统的输入端以对振动自身进行抑制,结构和参数设计简单。首先以三质量块系统为例,分... 提出一种基于特定振动反馈的柔性系统振动抑制方法。该方法在传统的电机三环控制结构的基础上使用滤波器将系统末端位移的主要振动提取出来,并反馈到系统的输入端以对振动自身进行抑制,结构和参数设计简单。首先以三质量块系统为例,分析了该方法的闭环传递函数和设计步骤,并讨论了该方法的本质;然后将此方法扩展到模型为更多质量块甚至为不均匀质量块的柔性系统的振动抑制问题;最后设计了抑制负载终端扰动的补偿方法,并通过仿真证明了上述方法的有效性。 展开更多
关键词 柔性系统 振动抑制 多质量块系统 带阻滤波器
在线阅读 下载PDF
基于空间算子代数理论计算多体系统动力学建模 被引量:24
13
作者 方喜峰 吴洪涛 +2 位作者 刘云平 陆宇平 汪通悦 《机械工程学报》 EI CAS CSCD 北大核心 2009年第1期228-234,共7页
为了提高计算多体系统动力学正、反向动力学建模效率,应用空间算子代数理论,在通用计算机符号演算软件Mathematica6.0的环境下,对计算多体系统正、反向动力学进行设计与实现。广义质量是联系旋量力和旋量加速度的的重要参量,据此可形成... 为了提高计算多体系统动力学正、反向动力学建模效率,应用空间算子代数理论,在通用计算机符号演算软件Mathematica6.0的环境下,对计算多体系统正、反向动力学进行设计与实现。广义质量是联系旋量力和旋量加速度的的重要参量,据此可形成正、反向动力学高效递推算法,用空间算子代数理论求出广义质量、正、反向动力学具有形式简洁、物理意义明确、编程效率高和直观等特征。运用VB.NET编程软件实现与Mathematica6.0软件无缝集成,对计算多体系统动力学仿真及正、反向动力学进行参数化分析与计算,给出编程实施过程及建模IDEFO方法。根据分析结果,对PUMA560机器人典型多体系统进行正、反向动力学建模,并与结果进行对比,通过算例验证结果的正确性和有效性。 展开更多
关键词 空间算子代数 正、反向动力学 广义质量 多体系统 建模
在线阅读 下载PDF
分布多质量转子系统的不平衡响应特征 被引量:10
14
作者 郝建山 韩磊 +2 位作者 张智伟 韩清凯 闻邦椿 《机械设计与制造》 北大核心 2006年第7期34-36,共3页
质量不平衡响应分析是转子系统动力特性计算与设计中的重要环节。这里以某汽轮机的涡轮轴系为研究对象,建立一个具有多个分布质量的力学模型,选择具有良好数值稳定性的Riccati传递矩阵法,进行轴系的不平衡响应分析,得到在工作转速和不... 质量不平衡响应分析是转子系统动力特性计算与设计中的重要环节。这里以某汽轮机的涡轮轴系为研究对象,建立一个具有多个分布质量的力学模型,选择具有良好数值稳定性的Riccati传递矩阵法,进行轴系的不平衡响应分析,得到在工作转速和不同转速下,不同偏心质量处于轴系不同位置上时,轴系的不平衡响应。通过分析各种情况下不平衡响应的特性,考察轴系上各点对不平衡量的敏感程度,为该类转子的设计提供参考。 展开更多
关键词 分布多质量转子系统 不平衡响应 Riccati传递矩阵法
在线阅读 下载PDF
基于等效质量的太空机械臂多体系统碰撞分析 被引量:5
15
作者 贾庆轩 张龙 +1 位作者 陈钢 孙汉旭 《宇航学报》 EI CAS CSCD 北大核心 2015年第12期1356-1362,共7页
从等效质量角度出发,针对不同的操作环境,提出多体系统离散碰撞动力学建模及连续碰撞动力学建模方法,并分析碰撞对系统造成的影响。首先,由系统动力学方程及能量方程推导出太空机械臂末端等效质量,在此基础上,针对刚/柔环境,分别建立多... 从等效质量角度出发,针对不同的操作环境,提出多体系统离散碰撞动力学建模及连续碰撞动力学建模方法,并分析碰撞对系统造成的影响。首先,由系统动力学方程及能量方程推导出太空机械臂末端等效质量,在此基础上,针对刚/柔环境,分别建立多体系统离散碰撞动力学模型和连续碰撞动力学模型,并针对七种连续碰撞模型提出选取标准,以便更真实地模拟实际碰撞过程。最后,以典型的太空七自由度机械臂为例开展仿真试验,两种方法的对比结果校验了该算法的正确性。 展开更多
关键词 太空机械臂 等效质量 多体系统 碰撞动力学
在线阅读 下载PDF
基于收敛速率的多智能体系统一致性研究综述 被引量:13
16
作者 蒋国平 周映江 《南京邮电大学学报(自然科学版)》 北大核心 2017年第3期15-25,共11页
深入探讨基于收敛速率的分布式多智能体系统一致性问题及相关应用。首先,讨论带有时滞、切换拓扑、牵制控制、采样数据情况下的多智能体系统渐近时间一致性问题;然后,分别介绍并分析一阶、二阶及高阶多智能体系统的有限时间收敛问题,进... 深入探讨基于收敛速率的分布式多智能体系统一致性问题及相关应用。首先,讨论带有时滞、切换拓扑、牵制控制、采样数据情况下的多智能体系统渐近时间一致性问题;然后,分别介绍并分析一阶、二阶及高阶多智能体系统的有限时间收敛问题,进一步引入并分析限定时间一致性问题;最后,介绍并分析编队控制及几类实际应用。 展开更多
关键词 一致性 编队控制 多智能体系统 牵制控制 收敛速度
在线阅读 下载PDF
多组分传质过程的Maxwell-Stefan方法模拟 被引量:3
17
作者 谷伟 张虎 +1 位作者 李增耀 陶文铨 《工程热物理学报》 EI CAS CSCD 北大核心 2012年第4期681-684,共4页
为定量研究多组分系统在多孔介质内传质过程中组分之间的交互作用现象,本文基于Maxwell-Stefan模型对CH_4/Ar/H_2混合气体在单个直孔道内的纯扩散过程和C_2H_6/C_3H_8/N_2混合气体在活性炭上的吸附扩散过程进行了模拟,定量地描述和分析... 为定量研究多组分系统在多孔介质内传质过程中组分之间的交互作用现象,本文基于Maxwell-Stefan模型对CH_4/Ar/H_2混合气体在单个直孔道内的纯扩散过程和C_2H_6/C_3H_8/N_2混合气体在活性炭上的吸附扩散过程进行了模拟,定量地描述和分析了多组分系统中组分之间在传质过程中的交互作用。研究表明:对于扩散过程,组分之间的交互作用表现为大分子对小分子的拖带;对于吸附过程,这种作用表现为强吸附质能够替代已被吸附在吸附剂表面的弱吸附质;主体扩散为主要的传质形式。 展开更多
关键词 多组分系统 传质过程 Maxwell-Stefan模型 多孔介质
原文传递
多质点弹性体系的地震反应分析 被引量:4
18
作者 孙武 杨树标 袁颖 《河北建筑科技学院学报》 2002年第2期37-40,共4页
本文利用MATLAB高效的计算功能和强大的图形显示功能编制了振型分解反应谱法计算程序。在此基础上 ,结合具体实例对多质点弹性体系的特性参数周期和振型进行了计算。通过对两特性参数的影响因素质量和刚度的分析 ,得出了一些有益的结论 。
关键词 振型分解反应谱法 多质点弹性体系 地震反应 程序 特性参数周期
在线阅读 下载PDF
钢铁制造过程的多维物流控制系统 被引量:50
19
作者 殷瑞钰 《金属学报》 SCIE EI CAS CSCD 北大核心 1997年第1期29-38,共10页
本文将钢铁制造流程模化为物态转变、物性控制和物流控制相互融合的多维物流控制系统。该系统是由“刚性组元”、“柔性组元”的集合和各级元间关系集合组成的“粘性”系统,其运行方式为“准连续/间歇”性质的“弹性链/半弹性链”的... 本文将钢铁制造流程模化为物态转变、物性控制和物流控制相互融合的多维物流控制系统。该系统是由“刚性组元”、“柔性组元”的集合和各级元间关系集合组成的“粘性”系统,其运行方式为“准连续/间歇”性质的“弹性链/半弹性链”的稳定或非稳定谐报系统在外界“刺激”作用下,将产生不同类型、不同滞后度的“响应”在此基础上提出了钢铁制造流程系统集成描述的理论框架。 展开更多
关键词 钢铁制造过程 多维物流控制 控制系统
在线阅读 下载PDF
基于混合仿真的群体性事件演化机理建模分析研究 被引量:8
20
作者 张鼎华 李卫俊 申世飞 《情报杂志》 CSSCI 北大核心 2019年第7期131-137,130,共8页
[目的/意义]群体性事件是重大社会风险的表现形式之一,如何从纷繁复杂的矛盾中把握其演化机理是建立健全社会风险研判和决策风险评估机制的基础,对社会风险的防范和化解具有重要的意义。[方法/过程]提取了影响群体性事件的四类相关主体... [目的/意义]群体性事件是重大社会风险的表现形式之一,如何从纷繁复杂的矛盾中把握其演化机理是建立健全社会风险研判和决策风险评估机制的基础,对社会风险的防范和化解具有重要的意义。[方法/过程]提取了影响群体性事件的四类相关主体:公众、政府、媒体和社区,建立了适用于群体性事件演化机理的模型,并利用系统动力学和多Agent方法对群体性事件进行混合仿真,以此捕捉群体性事件的演化机理。[结果/结论]仿真实验的结果表明,该建模研究能反映出群体性事件的演化机理,并为应急管理提供了理论支持。 展开更多
关键词 群体性事件 系统动力学 多AGENT 混合仿真 应急管理
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部