期刊文献+
共找到571篇文章
< 1 2 29 >
每页显示 20 50 100
Improving consensual performance of multi-agent systems in weighted scale-free networks
1
作者 祁伟 许新建 汪映海 《Chinese Physics B》 SCIE EI CAS CSCD 2009年第10期4217-4221,共5页
This paper studies consensus problems in weighted scale-free networks of asymmetrically coupled dynamical units, where the asymmetry in a given link is deter:mined by the relative degree of the involved nodes. It sho... This paper studies consensus problems in weighted scale-free networks of asymmetrically coupled dynamical units, where the asymmetry in a given link is deter:mined by the relative degree of the involved nodes. It shows that the asymmetry of interactions has a great effect on the consensus. Especially, when the interactions are dominant from higher- to lower-degree nodes, both the convergence speed and the robustness to communication delay are enhanced. 展开更多
关键词 consensus problems multi-agent systems scale-free networks
原文传递
面向装配的多agent排产模型研究 被引量:2
2
作者 范颖晖 张兴伟 王亚会 《控制与决策》 EI CSCD 北大核心 2020年第2期403-409,共7页
拖期罚金带来的成本问题使中小规模离散制造企业在竞争中面临巨大压力.为此,采用多agent技术设计面向装配的三层排产框架模型;利用多agent的自治和协同,结合经验规则,将复杂的大规模排产逐层分解,转化为可用算法优化的子问题,再自底向... 拖期罚金带来的成本问题使中小规模离散制造企业在竞争中面临巨大压力.为此,采用多agent技术设计面向装配的三层排产框架模型;利用多agent的自治和协同,结合经验规则,将复杂的大规模排产逐层分解,转化为可用算法优化的子问题,再自底向上归并更新,迭代寻优完成生产排产,并可依计划执行情况进行动态调度.以合作企业凹印机历史订单数据进行排产仿真,结果表明,通过对设备空闲时间分布的有效管理,此三层模型能够有效解决订单拖期问题,对中小企业的成本控制具有重要意义. 展开更多
关键词 车间排产 大规模优化 agent技术 离散制造业
原文传递
一种面向Agent的智能大系统 被引量:3
3
作者 陈桂香 周兴斌 《南昌大学学报(理科版)》 CAS 2000年第4期377-381,共5页
从Agent理论出发 ,构造了一种面向Agent的智能大系统。系统由一个协调控制子系统和多个Agent组成的多Agent系统 ;协调控制子系统为系统的全局数据库和监控、协调、优化中心。Agent之间的协作有任务分担和结果共享两种方式 ,它们之间的... 从Agent理论出发 ,构造了一种面向Agent的智能大系统。系统由一个协调控制子系统和多个Agent组成的多Agent系统 ;协调控制子系统为系统的全局数据库和监控、协调、优化中心。Agent之间的协作有任务分担和结果共享两种方式 ,它们之间的冲突是通过多轮协商法来解决的。大系统的优化、控制就是通过上述多Agent系统实施 ,以达到对大系统进行动态优化、控制和模型的自适应的目的。 展开更多
关键词 agent 大系统 协调控制系统 智能控制 自动控制
在线阅读 下载PDF
DP-Q(λ):大规模Web3D场景中Multi-agent实时路径规划算法 被引量:4
4
作者 闫丰亭 贾金原 《系统仿真学报》 CAS CSCD 北大核心 2019年第1期16-26,共11页
大规模场景中Multi-agent可视化路径规划算法,需要在Web3D上实现实时、稳定的碰撞避让。提出了动态概率单链收敛回溯DP-Q(λ)算法,采用方向启发约束,使用高奖赏或重惩罚训练方法,在单智能体上采用概率p(0-1随机数)调节奖罚值,决定下一... 大规模场景中Multi-agent可视化路径规划算法,需要在Web3D上实现实时、稳定的碰撞避让。提出了动态概率单链收敛回溯DP-Q(λ)算法,采用方向启发约束,使用高奖赏或重惩罚训练方法,在单智能体上采用概率p(0-1随机数)调节奖罚值,决定下一步的寻路策略,同时感知下一位置是否空闲,完成行走过程的避碰行为,将单智能体的路径规划方案扩展到多智能体路径规划方案中,并进一步在Web3D上实现了这一方案。实验结果表明:该算法实现的多智能体实时路径规划具备了在Web3D上自主学习的高效性和稳定性的要求。 展开更多
关键词 WEB3D 大规模未知环境 多智能体 强化学习 动态奖赏p 路径规划
原文传递
基于Multi-agent的大型会展活动的游客协调控制方法 被引量:6
5
作者 李金华 朱道立 《系统工程学报》 CSCD 北大核心 2010年第4期499-505,共7页
从活动组织者的角度出发提出了两种基于multi-agent的应用于大型会展活动的游客协调控制方法,其中,方法一是基于个体决策-群体协调机制的游客行程的全路线设计,方法二是基于择优选择机制的逐次决定游客下一参观点的路线设计.对两种协调... 从活动组织者的角度出发提出了两种基于multi-agent的应用于大型会展活动的游客协调控制方法,其中,方法一是基于个体决策-群体协调机制的游客行程的全路线设计,方法二是基于择优选择机制的逐次决定游客下一参观点的路线设计.对两种协调控制方法进行了计算机仿真检验,仿真结果表明两种方法都能在满足实时响应要求的情况下显著改善排队拥挤状况,同时得出两种方法各有不同的适用情境,方法一更适用于客流量适中或稍多的场景,而方法二更适用于客流量很大的场景,两种方法的结合应用可以带来更好的效果. 展开更多
关键词 大型会展活动 协调控制 MULTI-agent 仿真
在线阅读 下载PDF
一种基于多Agent和GIS的麦蚜种群动态模拟方法研究初报 被引量:6
6
作者 陈林 程登发 +5 位作者 陆庆光 田喆 姜玉英 孙京瑞 张云慧 乔红波 《植物保护》 CAS CSCD 北大核心 2006年第6期33-38,共6页
利用Agent模型对昆虫及其寄主、环境之间的关系进行计算机模拟,比传统种群模型更为直观的体现三者之间的信息交互过程。本文建立了麦长管蚜(Sitobionavenae)、小麦(TriticumaestivumL.)、天敌组合、环境4种类型Agent对象,观察了多种组... 利用Agent模型对昆虫及其寄主、环境之间的关系进行计算机模拟,比传统种群模型更为直观的体现三者之间的信息交互过程。本文建立了麦长管蚜(Sitobionavenae)、小麦(TriticumaestivumL.)、天敌组合、环境4种类型Agent对象,观察了多种组合下的对象行为。以北京地区的历史日值均温、湿度、降雨量数据为主要环境数据,进行了区域模拟验证,与北京地区实际调查数据进行了对比研究。在GIS平台上,以小麦生长季节的气象数据对宁夏、陇东、陕西3个地区进行了模拟,以环境数据进行驱动的4类Agent对象运行,得到了初步模拟结果。 展开更多
关键词 MULTI—agent System(MAS)多智能体系统 大区预测预报 GIS Logistic曲线 计算机仿真
在线阅读 下载PDF
基于Agent的计算经济学及其在电力市场理论中的应用综述 被引量:17
7
作者 袁家海 丁伟 胡兆光 《电网技术》 EI CSCD 北大核心 2005年第7期47-51,共5页
作者在方法论层面上讨论了基于Agent的计算经济学(Agent based computational Economics,ACE)在电力市场研究中的理论价值和不足,通过分析经济学方法从数学演绎到仿真归纳的演变以及它们的内在关联性,阐明了基于Agent的计算经济学在方... 作者在方法论层面上讨论了基于Agent的计算经济学(Agent based computational Economics,ACE)在电力市场研究中的理论价值和不足,通过分析经济学方法从数学演绎到仿真归纳的演变以及它们的内在关联性,阐明了基于Agent的计算经济学在方法论层面上的独特优越性。进一步有选择地对已有文献的综述表明,基于Agent的计算经济模型能够在更深的层次上和更广的范围内去洞察电力市场化过程。最后提出了应用ACE进行电力市场理论研究时应注意的要点以供今后的理论发展参考。 展开更多
关键词 电力市场化 经济学方法 经济模型 应用综述 理论发展 层面 计算 演绎 文献 要点
在线阅读 下载PDF
新型低温硫化亚铁垢溶垢剂的研究
8
作者 栾传昊 陈世军 +3 位作者 钦伟 段晓雷 杜红梅 何传健 《化工技术与开发》 2026年第1期37-43,共7页
硫化亚铁垢为油气田生产过程中一种较难处理的堵塞物,它的存在会导致油气井产量降低,集输管道堵塞而效率降低。本文研制了一种新型低温溶硫化亚铁垢的溶垢剂,以四羟甲基硫酸磷(THPS)为主剂,EDTA、DTPA、十二烷基苯磺酸钠(SDBS)、氨水为... 硫化亚铁垢为油气田生产过程中一种较难处理的堵塞物,它的存在会导致油气井产量降低,集输管道堵塞而效率降低。本文研制了一种新型低温溶硫化亚铁垢的溶垢剂,以四羟甲基硫酸磷(THPS)为主剂,EDTA、DTPA、十二烷基苯磺酸钠(SDBS)、氨水为助剂,研究了各成分对溶垢率的影响,获得了最佳配方,配方为:THPS15%、EDTA1.5%、DTPA1.5%、SDBS0.5%、氨水5%,余量为水。结果表明:该溶垢剂在常温下对硫化亚铁垢具有良好的溶解效果,溶垢率高,在此配方下,进行多次溶垢实验,溶垢率稳定在95%以上。且能有效抑制硫化氢气体的产生,对设备腐蚀性小,具有广阔的应用前景。 展开更多
关键词 硫化亚铁垢 溶垢剂 四羟甲基硫酸磷 低温溶垢
在线阅读 下载PDF
基于全生命周期的大型工程Multi-Agent动态决策研究
9
作者 廖瑞辉 陈星光 鞠鹏 《科技与经济》 2016年第3期95-98,110,共5页
决策活动贯穿于大型工程项目整个生命周期,采用Multi-Agent建模方法,从全生命周期视角对大型工程决策活动进行Agent抽象分类,并对协商框架进行了设定,通过分析Multi-Agent的动态决策过程,为大型工程项目的建设管理提供参考。
关键词 全生命周期 大型工程 MULTI-agent 动态决策
在线阅读 下载PDF
渤海某油田绿色复合防垢剂的筛选及应用
10
作者 童宝春 尹晓鹏 《精细石油化工进展》 2026年第1期11-14,共4页
基于渤海某油田的污水系统结垢问题及阻垢剂的绿色环保要求,针对该污水系统垢样的主要组分为碳酸盐垢的特点,采用静态和动态评级方法,模拟水样对6种低磷及无磷防垢剂样品进行阻垢性能评价。结果表明:防垢剂YFFG-06展现出良好的防垢效果... 基于渤海某油田的污水系统结垢问题及阻垢剂的绿色环保要求,针对该污水系统垢样的主要组分为碳酸盐垢的特点,采用静态和动态评级方法,模拟水样对6种低磷及无磷防垢剂样品进行阻垢性能评价。结果表明:防垢剂YFFG-06展现出良好的防垢效果,当加注质量浓度为13 mg/L时,静态防垢率达98%,动态防垢率达86.97%,而且其压力变化率小于有机膦防垢剂。采用多重光散射法表征加注防垢剂后的防垢过程,其防垢机制以分散为主。现场应用结果表明,当防垢剂YFFG-06加注质量浓度为13 mg/L时,斜板除油器与注水缓冲罐中污水的Ca^(2+)无明显变化,展现出良好的防垢性能。 展开更多
关键词 海上油田 绿色防垢剂 污水系统 结垢 无磷防垢剂 有机膦防垢剂
在线阅读 下载PDF
基于多Agent系统的大型电网电压暂降评估 被引量:8
11
作者 黄佳铭 张逸 +3 位作者 陈晶腾 高漩 贾荣 吴逸帆 《电力系统保护与控制》 EI CSCD 北大核心 2023年第10期45-53,共9页
面向实际大型电网的暂降评估需要考虑覆盖全网特征的线路故障仿真,其仿真计算速度和稳定性是制约其实用化的主要因素。为此提出了一种基于多Agent系统的大型电网电压暂降评估方法。该方法根据仿真需求构造多Agent系统并制定协同交互规... 面向实际大型电网的暂降评估需要考虑覆盖全网特征的线路故障仿真,其仿真计算速度和稳定性是制约其实用化的主要因素。为此提出了一种基于多Agent系统的大型电网电压暂降评估方法。该方法根据仿真需求构造多Agent系统并制定协同交互规则。首先,由网架解析和故障设置Agent自主生成仿真任务。其次,由仿真管理和计算Agent动态执行海量仿真。最后,由数据处理和分析Agent异步存储仿真数据并生成评估结果。目前该方法已应用在某省级电网电压暂降评估工作中,取得了较好效果。实例证明所提方法加速比高,运行稳定,可为大型电网电压暂降评估实用化提供技术支撑。 展开更多
关键词 大型电网 agent系统 电压暂降评估 协同规则
在线阅读 下载PDF
光伏发电与储能系统协同优化策略研究
12
作者 徐震 《内燃机与配件》 2026年第2期111-113,共3页
光伏发电与储能系统协同优化对提升可再生能源消纳水平、增强电网运行稳定性具有重要意义。研究构建多维度协同优化体系,基于多时空尺度耦合特性,剖析秒级至年级功率平抑、能量调度及容量规划的协同作用机理;针对多目标优化挑战,建立含... 光伏发电与储能系统协同优化对提升可再生能源消纳水平、增强电网运行稳定性具有重要意义。研究构建多维度协同优化体系,基于多时空尺度耦合特性,剖析秒级至年级功率平抑、能量调度及容量规划的协同作用机理;针对多目标优化挑战,建立含多变量约束的目标函数模型,设计改进型粒子群算法与随机场景模拟融合的鲁棒寻优方法;围绕多主体协同需求,提出源-储-网-荷互动控制架构、分层分布式优化策略及区块链可信协同机制。其成果为光储系统综合效能提升及新型电力系统构建提供理论支持与技术路径。 展开更多
关键词 光伏发电 储能系统 协同优化 多时空尺度 多目标算法 多主体控制
在线阅读 下载PDF
基于多智能体的大规模场景自适应协同算法研究
13
作者 刘伟 《计算机应用文摘》 2026年第1期88-90,共3页
随着大规模复杂系统中多智能体协作需求的不断增加,如何在动态、不确定、结构多样的环境中实现高效、稳定且自适应的协同控制已成为智能体研究的重要方向。文章围绕大规模场景下的多智能体系统(Multi-Agent System,MAS),提出了一种面向... 随着大规模复杂系统中多智能体协作需求的不断增加,如何在动态、不确定、结构多样的环境中实现高效、稳定且自适应的协同控制已成为智能体研究的重要方向。文章围绕大规模场景下的多智能体系统(Multi-Agent System,MAS),提出了一种面向环境变化、自主学习与策略共享的自适应协同算法框架。该框架融合分布式强化学习、图神经网络(GNN)及层次化策略规划,以实现对复杂任务的快速响应与鲁棒协作。实验结果表明,所提算法在通信开销、收敛速度与任务完成质量方面均具有显著优势,可为智能制造、工厂车间协同调度、工业无人集群作业、产线能源优化等制造领域核心场景提供有效参考。 展开更多
关键词 多智能体系统 自适应协同 大规模场景 强化学习 图神经网络
在线阅读 下载PDF
基于Agent动态加权二部无标度网络的异性HIV传播与政策调控模型
14
作者 何晓力 毕贵红 王海瑞 《计算机科学》 CSCD 北大核心 2014年第1期72-79,共8页
HIV的传播是个体的行为、疾病的干预措施和个体之间的社会网络协同演化的结果。提出了基于agent的动态加权二部无标度网络方法的异性HIV传播和干预仿真模型。二部网络中的女性人群根据高危行为不同分为普通人群和女性性工作者(Female Se... HIV的传播是个体的行为、疾病的干预措施和个体之间的社会网络协同演化的结果。提出了基于agent的动态加权二部无标度网络方法的异性HIV传播和干预仿真模型。二部网络中的女性人群根据高危行为不同分为普通人群和女性性工作者(Female Sex Workers,FSW),男性人群根据高危行为不同分为普通人群和女性性工作者客户(Clients of female sex worker,CSW)。给出了利用配置模型快速生成指数可调的异性二部无标度网络的生成算法,其根据异性二部网络中单位时间内性行为次数的分配算法确定二部网络中边的权值,构成二部加权无标度网络。网络中的伙伴关系有固定关系、偶然关系型和临时关系,二部网络中的边可随边的维持时间的结束而断开和重连,网络具有动态特性。个体/agent模型描述了个体高危行为、病程、个体社会结构与干预措施之间的相互影响关系。仿真实验分析了个体高危行为是否采用安全措施、是否参加自愿咨询检测和是否参加抗病毒治疗等干预措施对疾病传播的影响。 展开更多
关键词 agent 二部图无标度网络 干预措施 HIV
在线阅读 下载PDF
人机协同视域下基于AI智能体的新型个性化学习探究
15
作者 方海光 邓洋 +1 位作者 李泽宇 洪心 《现代教育技术》 2026年第2期40-50,共11页
新型个性化学习以“扬长”为导向,强调培育学生独特而完整的人格特质,但其在大规模教学实践中仍面临诊断维度窄化、技术介入失衡、应用浅表化等潜在风险。为推动大规模教学中新型个性化学习的有效落地,文章首先以系统论和人机协同教育... 新型个性化学习以“扬长”为导向,强调培育学生独特而完整的人格特质,但其在大规模教学实践中仍面临诊断维度窄化、技术介入失衡、应用浅表化等潜在风险。为推动大规模教学中新型个性化学习的有效落地,文章首先以系统论和人机协同教育理论为理论基础,引入AI智能体,设计了基于AI智能体的新型个性化学习系统。之后,参考经典的个性化学习模式,文章构建了包含元学习、元路径、元诊断三个要素的基于AI智能体的新型个性化学习元模式:元学习是学生构建自适应新型个性化学习模式的基础,元路径是构成学生不同学习路径的基本单元,元诊断是对学生新型个性化学习成效进行整体性诊断的过程。最后,文章在“教育大数据思维与分析技术”课程中开展了基于AI智能体的新型个性化学习元模式的应用实验,发现采用元模式的学生在数据素养、学习路径丰富程度方面的表现更优。文章的研究回应了人机协同视域下如何基于AI智能体开展新型个性化学习的问题,为大规模因材施教的落地提供了新思路,对于推动学习范式的转型也具有重要启示。 展开更多
关键词 人机协同 AI智能体 个性化学习 元模式 大规模教学
在线阅读 下载PDF
共聚物缓蚀阻垢剂性能与应用研究
16
作者 黄靖瑶 孙荣博 《广东化工》 2026年第1期17-19,7,共4页
本研究聚焦共聚物缓蚀阻垢剂的综合性能,通过实验分析了其在工业循环水系统中的应用效果。共聚物缓蚀阻垢剂PAA+ATMP在低磷含量下仍保持优异的阻垢性和缓蚀性,膦酸基团和羧酸基团之间的协同作用大幅提升了药剂性能。在实际应用中采用分... 本研究聚焦共聚物缓蚀阻垢剂的综合性能,通过实验分析了其在工业循环水系统中的应用效果。共聚物缓蚀阻垢剂PAA+ATMP在低磷含量下仍保持优异的阻垢性和缓蚀性,膦酸基团和羧酸基团之间的协同作用大幅提升了药剂性能。在实际应用中采用分步加药的方式,最大程度地提高了药剂的利用效率。共聚物缓蚀阻垢剂在确保使用效果不降低的基础上,有效减少了含磷药剂的用量,进而降低了后续水处理的难度以及二次污染的风险,同时也增强了其对复杂水质条件的适应性。 展开更多
关键词 缓蚀阻垢剂 共聚物 协同效应 水处理 低磷药剂
在线阅读 下载PDF
基于AGENT动态加权无标度网络的双语竞争模型
17
作者 李张强 王海瑞 毕贵红 《计算机与数字工程》 2016年第5期884-889,共6页
近年来,濒危语言的灭亡速度越来越快,为了寻求濒危语言的保护措施,提出了以同一区域内的双语竞争为研究对象,利用基于agent的无标度网络构建接近实际的语言网络模型。模型以agent为网络节点生成无标度网络,agent的language等于1、2、3... 近年来,濒危语言的灭亡速度越来越快,为了寻求濒危语言的保护措施,提出了以同一区域内的双语竞争为研究对象,利用基于agent的无标度网络构建接近实际的语言网络模型。模型以agent为网络节点生成无标度网络,agent的language等于1、2、3分别表示单语1agent、单语2agent和双语3agent。语言网络通过agent之间的短期连接、长期连接、无连接三种关系之间的演化维持网络的动态特性,语言之间的传播竞争只存在于有连接的agent之间,语言的传播竞争分为语言学习和语言遗忘,引入了语言地位S1、S2和agent语言密度σ之间的乘积作为语言学习和语言遗忘的概率。仿真结果表明,提高弱势语言的地位、降低语言网络中agent个体的度和降低语言网络的动态性保证语言网络的稳定性,更有利于保护弱势语言。 展开更多
关键词 agent 语言竞争 动态网络 无标度网络
在线阅读 下载PDF
Synthesis and Evaluation of CQC-1—An Oil Field Scale Inhibitor
18
作者 Qichao Cao Xintong Li +1 位作者 Xiong Wang Song Wang 《Open Journal of Yangtze Oil and Gas》 2022年第1期13-25,共13页
Most of the oil wells enter the middle and late stages of extraction. After one oil extraction, water injection is needed for secondary extraction. With a large amount of calcium and magnesium ions in the water, which... Most of the oil wells enter the middle and late stages of extraction. After one oil extraction, water injection is needed for secondary extraction. With a large amount of calcium and magnesium ions in the water, which is easy to form a large amount of insoluble scale, its formed barium sulfate and strontium sulfate scale are more difficult to handle than carbonate scale. In order to reduce the difficulty of oil production work, this paper mainly targeted the sulfate scale for experiments, and prepared the scale retardant agent CQC-1. Through orthogonal experimental screening, the mass ratio of itaconate acid:methacrylic acid:AMPS:sodium acrylic sulfonate was 2:1:1:1, increase the amount of evocating agent was 8% and the reaction time was 4h, the sulfate scale inhibitor synthesized at the temperature of 80°C had the best performance. Using scale resistance rate, degradation and salt-resistance, the experimental results showed that the scale resistance rate of CQC-1 reached 90.46%. In the four-week degradation experiment, the degradation rate reached over 71% and was maintained by 80.65% at 150°C, while the scale resistance rate still reached 80.35% in simulated saline. It has excellent scale resistance, temperature resistance, salt-resistance and degradation, and has good development prospects. 展开更多
关键词 scale Resistance agent Synthetic Monomer Synthetic Conditions Performance Evaluation scale Resistance Rate
在线阅读 下载PDF
低分子量聚丙烯酸-镧离子在热水驱防垢缓蚀中的应用 被引量:1
19
作者 汪成 龙卫红 +3 位作者 龚页境 宋宏志 王少华 冯宇 《全面腐蚀控制》 2025年第2期147-152,159,共7页
以渤海某油田热水驱地热井水样为依据,选取低分子量聚丙烯酸阻垢剂,复配镧离子作为阻垢组分,采用经典静态失重法,及静态阻垢实验研究了不同单一及复合阻垢缓蚀剂垢样形成过程与对N80钢腐蚀的影响。采用扫描电镜(SEM)分析了不同阻垢缓蚀... 以渤海某油田热水驱地热井水样为依据,选取低分子量聚丙烯酸阻垢剂,复配镧离子作为阻垢组分,采用经典静态失重法,及静态阻垢实验研究了不同单一及复合阻垢缓蚀剂垢样形成过程与对N80钢腐蚀的影响。采用扫描电镜(SEM)分析了不同阻垢缓蚀剂添加后形成的垢样的形貌和晶体结构。有机酸类阻垢剂阻垢率大于聚合物类阻垢剂。阻垢剂和缓蚀剂复配使用可进一步提高阻垢性能,在低分子量丙烯酸浓度为50mg/L,镧离子浓度为15mg/L时,其阻垢率为95%,同时腐蚀速率为0.055mm•a-1。岩心伤害评价及现场应用表明,该体系能很好解决现场因为结垢与腐蚀导致的注水问题。 展开更多
关键词 防垢剂 热水驱 缓蚀剂
在线阅读 下载PDF
基于角色的自适应参数共享方法
20
作者 方宝富 王琼 +1 位作者 王浩 王在俊 《模式识别与人工智能》 北大核心 2025年第3期193-204,共12页
在大规模异构多智能体强化学习中,参数共享常用于减少训练参数并加速训练过程,但传统完全参数共享方法容易导致智能体行为过度一致,而独立参数训练方法却受到计算复杂度和内存限制.因此,文中提出基于角色的自适应参数共享方法(Role-Base... 在大规模异构多智能体强化学习中,参数共享常用于减少训练参数并加速训练过程,但传统完全参数共享方法容易导致智能体行为过度一致,而独立参数训练方法却受到计算复杂度和内存限制.因此,文中提出基于角色的自适应参数共享方法(Role-Based Adaptive Parameter Sharing Method,RAPS).首先,根据智能体的任务特性进行角色分组.然后,在同一网络结构下,结合非结构化网络剪枝技术,为不同角色的智能体生成稀疏化的子网络结构,并引入动态调整机制,根据任务需求自适应优化共享参数与独立参数的比例.此外,通过角色间的协作损失函数,进一步增强异构智能体间的协调能力,在有效降低计算复杂度的同时,保持异构智能体的行为差异性.实验表明,在不同多智能体任务上,RAPS都能提升多智能体系统的性能和可扩展性. 展开更多
关键词 大规模异构多智能体强化学习 参数共享 非结构化网络剪枝 角色分组
在线阅读 下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部