期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
Optimal synchronization control formulti-agent systems with input saturation:a nonzero-sum game 被引量:1
1
作者 Hongyang LI Qinglai WEI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2022年第7期1010-1019,共10页
This paper presents a novel optimal synchronization control method for multi-agent systems with input saturation.The multi-agent game theory is introduced to transform the optimal synchronization control problem into ... This paper presents a novel optimal synchronization control method for multi-agent systems with input saturation.The multi-agent game theory is introduced to transform the optimal synchronization control problem into a multi-agent nonzero-sum game.Then,the Nash equilibrium can be achieved by solving the coupled Hamilton–Jacobi–Bellman(HJB)equations with nonquadratic input energy terms.A novel off-policy reinforcement learning method is presented to obtain the Nash equilibrium solution without the system models,and the critic neural networks(NNs)and actor NNs are introduced to implement the presented method.Theoretical analysis is provided,which shows that the iterative control laws converge to the Nash equilibrium.Simulation results show the good performance of the presented method. 展开更多
关键词 Optimal synchronization control multi-agent systems Nonzero-sum game Adaptive dynamic programming Input saturation Off-policy reinforcement learning Policy iteration
原文传递
一个基于博弈学习的多主体竞价模型 被引量:4
2
作者 唐亮贵 程代杰 《计算机工程与应用》 CSCD 北大核心 2006年第17期76-78,104,共4页
根据多主体撮合交易模型,把整个撮合交易看成各交易主体的动态交互过程,设计了基于Multi-Agent的电子商务交易市场中交易主体动态竞价策略,提出了博弈学习的概念,并建立了基于博弈学习的动态竞价模型,根据撮合密度的定义,分析了所建立... 根据多主体撮合交易模型,把整个撮合交易看成各交易主体的动态交互过程,设计了基于Multi-Agent的电子商务交易市场中交易主体动态竞价策略,提出了博弈学习的概念,并建立了基于博弈学习的动态竞价模型,根据撮合密度的定义,分析了所建立模型的性能和效率,试验表明,基于博弈学习的多主体动态竞价模型使多主体撮合交易系统具有一定的自均衡和自学习能力和良好的交易性能。 展开更多
关键词 Muhi-Agent系统 撮合 动态竞标 博弈学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部