期刊文献+
共找到574篇文章
< 1 2 29 >
每页显示 20 50 100
Real-time Life-cycle Modular Design Method Based on Game Theory for Jack-up
1
作者 郑玄亮 王运龙 林焰 《Journal of Shanghai Jiaotong university(Science)》 EI 2010年第4期504-511,共8页
To study an entity the entire jack-up performs as a total system with close interdependency and high level of integration of a myriad of subsystems supporting each individual function. All subsystems should be arrange... To study an entity the entire jack-up performs as a total system with close interdependency and high level of integration of a myriad of subsystems supporting each individual function. All subsystems should be arranged in regular geometric space with clear regional division according to their respective functions. The "building block" such as arrangement makes it feasible to apply modular design method while the integration and conflicts among subsystems offer an arena for game theoretic analysis. All the contradictions between subsystems should be resolved bye the designer. Here we present a game theoretic analysis methodology, which based on the basic principles of game theory, through the establishment of matrix-mode game models to describe and analyze engineering design tasks. By using this method the optimization process in various fields of expertise can be effectively coordinated and controlled, and the parallel design patterns can be achieved to some extent. Taking account of the impact of commercial or technical activities in platform's life cycle, time line is considered in the early stage of design process which provides more convenience for efficient upgrade and reconfiguration. Some second-hand three-legged jack-up upgrade design process is used as an example to illustrate the utility of the method. 展开更多
关键词 jack up life cycle design modular design real time game model
原文传递
Hybrid Estimation of State and Input for Linear Discrete Time-varying Systems: A Game Theory Approach 被引量:5
2
作者 YOU Fu-Qiang WANG Fu-Li GUAN Shou-Ping 《自动化学报》 EI CSCD 北大核心 2008年第6期665-669,共5页
为线性分离变化时间的系统的 H 混合评价问题在这份报纸被调查,在估计的信号是状态和输入的线性联合的地方。设计目的从骚乱要求最坏的精力获得到是的评价错误不到规定水平。混合评价问题的最佳的答案是僵绳点一二播放器零和微分游戏... 为线性分离变化时间的系统的 H 混合评价问题在这份报纸被调查,在估计的信号是状态和输入的线性联合的地方。设计目的从骚乱要求最坏的精力获得到是的评价错误不到规定水平。混合评价问题的最佳的答案是僵绳点一二播放器零和微分游戏。根据微分比赛途径,为混合评价问题的必要、足够的可解决的条件以一个 Riccati 微分方程的答案被提供。而且,如果可解决的条件满足,一个可能的评估者被建议。评估者被印射矩阵的一个获得矩阵和产量描绘,在后者反映在未知输入和输出评价错误之间的内部关系的地方。最后,一个数字例子被提供说明建议途径。 展开更多
关键词 博奕论 线性离散系统 时间变化系统 智能化系统
在线阅读 下载PDF
Hybrid Estimation of State and Input for Linear Continuous Time-varying Systems:A Game Theory Approach 被引量:1
3
作者 YANGXiao-Jun WENGZheng-Xin TIANZuo-Hua SHISong-Jiao 《自动化学报》 EI CSCD 北大核心 2005年第4期549-554,共6页
The H∞ hybrid estimation problem for linear continuous time-varying systems is in-vestigated in this paper, where estimated signals are linear combination of state and input. Designobjective requires the worst-case e... The H∞ hybrid estimation problem for linear continuous time-varying systems is in-vestigated in this paper, where estimated signals are linear combination of state and input. Designobjective requires the worst-case energy gain from disturbance to estimation error be less than a pre-scribed level. Optimal solution of the hybrid estimation problem is the saddle point of a two-playerzero sum di?erential game. Based on the di?erential game approach, necessary and su?cient solvableconditions for the hybrid estimation problem are provided in terms of solutions to a Riccati di?e-rential equation. Moreover, one possible estimator is proposed if the solvable conditions are satisfied.The estimator is characterized by a gain matrix and an output mapping matrix that re?ects theinternal relations between the unknown input and output estimation error. Both state and unknowninputs estimation are realized by the proposed estimator. Thus, the results in this paper are alsocapable of dealing with fault diagnosis problems of linear time-varying systems. At last, a numericalexample is provided to illustrate the proposed approach. 展开更多
关键词 时变系统 混合估计 竞赛理论 RICCATI方程
在线阅读 下载PDF
One-Time Rational Secret Sharing Scheme Based on Bayesian Game 被引量:8
4
作者 TIAN Youliang MA Jianfeng +2 位作者 PENG Changgen CHEN Xi JI Wenjiang 《Wuhan University Journal of Natural Sciences》 CAS 2011年第5期430-434,共5页
The rational secret sharing cannot be realized in the case of being played only once, and some punishments in the one-time rational secret sharing schemes turn out to be empty threats. In this paper, after modeling 2-... The rational secret sharing cannot be realized in the case of being played only once, and some punishments in the one-time rational secret sharing schemes turn out to be empty threats. In this paper, after modeling 2-out-of-2 rational secret sharing based on Bayesian game and considering different classes of protocol parties, we propose a 2-out-of-2 secret sharing scheme to solve cooperative problem of a rational secret sharing scheme being played only once. Moreover, we prove that the strategy is a perfect Bayesian equilibrium, adopted only by the parties in their decision-making according to their belief system (denoted by the probability distribution) and Bayes rule, without requiring simultaneous channels. 展开更多
关键词 rational secret sharing one-time rational secret sharing Bayesian game perfect Bayesian equilibrium
原文传递
Influences of Network Delay on Quality of Experience for Soft Objects in Networked Real-Time Game with Haptic Sense
5
作者 Mya Sithu Yutaka Ishibashi +1 位作者 Pingguo Huang Norishige Fukushima 《International Journal of Communications, Network and System Sciences》 2015年第11期440-445,共6页
In this paper, we investigate the influences of network delay on QoE (Quality of Experience) such as the operability of haptic interface device and the fairness between players for soft objects in a networked real-tim... In this paper, we investigate the influences of network delay on QoE (Quality of Experience) such as the operability of haptic interface device and the fairness between players for soft objects in a networked real-time game subjectively and objectively. We handle a networked balloon bursting game in which two players burst balloons (i.e., soft objects) in a 3D virtual space by using haptic interface devices, and the players compete for the number of burst balloons. As a result, we find that the operability depends on the network delay from the local terminal to the other terminal, and the fairness is mainly dependent on the difference in network delay between the players’ terminals. We confirm that there exists a trade-off relationship between the operability and the fairness. We also see that the contribution of the fairness is larger than that of the operability to the comprehensive quality (i.e., the weighted sum of the operability and fairness). Assessment results further show that the output timing of terminals should be adjusted to the terminal which has the latest output timing to maintain the fairness when the difference in network delay between the terminals is large. In this way, the comprehensive quality at each terminal can be maintained as high as possible. 展开更多
关键词 NETWORKED REAL-time game Virtual Environment Balloon BURSTING game HAPTIC Interface Devices Network Delay Quality of Experience OPERABILITY Fairness
在线阅读 下载PDF
Polynomial Time Method for Solving Nash Equilibria of Zero-Sum Games
6
作者 Yoshihiro Tanaka Mitsuru Togashi 《American Journal of Computational Mathematics》 2021年第1期23-30,共8页
There are a few studies that focus on solution methods for finding a Nash equilibrium of zero-sum games. We discuss the use of Karmarkar’s interior point method to solve the Nash equilibrium problems of a zero-sum ga... There are a few studies that focus on solution methods for finding a Nash equilibrium of zero-sum games. We discuss the use of Karmarkar’s interior point method to solve the Nash equilibrium problems of a zero-sum game, and prove that it is theoretically a polynomial time algorithm. We implement the Karmarkar method, and a preliminary computational result shows that it performs well for zero-sum games. We also mention an affine scaling method that would help us compute Nash equilibria of general zero-sum games effectively. 展开更多
关键词 Zero-Sum games Nash Equilibria Karmarkar’s Method Polynomial time
在线阅读 下载PDF
突防弹道技术研究进展综述
7
作者 孙瑞胜 陈洁卿 +1 位作者 陆宇 刘宣廷 《南京理工大学学报》 北大核心 2025年第1期1-14,共14页
世界主要军事强国的反导拦截技术正在快速发展。发展有效地应对导弹防御武器的突防技术和方法,具有十分重要的战略意义。针对威胁回避、程序机动、自主机动和饱和攻击四大突防方法对突防弹道技术的研究进展进行了综合评述。首先,归纳了... 世界主要军事强国的反导拦截技术正在快速发展。发展有效地应对导弹防御武器的突防技术和方法,具有十分重要的战略意义。针对威胁回避、程序机动、自主机动和饱和攻击四大突防方法对突防弹道技术的研究进展进行了综合评述。首先,归纳了威胁回避突防问题的数学模型和求解方法,重点概述了基于凸优化的在线弹道规划求解方法。其次,给出了典型程序机动形式的数学模型和改进方向。接着,重点介绍了最优控制突防和博弈机动突防两大自主机动突防方法的数学模型和研究进展,详细讨论了弹群协同自主突防的建模和求解技术。然后,详细讨论了集中式和分布式协同饱和攻击的研究现状,介绍了复杂通信环境下的一致性方法研究进展。最后,讨论了突防弹道技术有待解决的问题和未来研究方向。 展开更多
关键词 突防 弹道规划 微分博弈 时间协同
在线阅读 下载PDF
虚拟电厂与电动汽车用户的主从博弈定价策略
8
作者 马永翔 马少洁 +2 位作者 闫群民 孔志战 淡文国 《华北电力大学学报(自然科学版)》 北大核心 2025年第5期68-78,共11页
虚拟电厂(VPP)是指将风光等分布式能源、可控负荷、储能系统和电动汽车等分布式能源视为一个特殊的电厂参与电力供应,通过合理制定电价减少峰值负荷对电网可靠性的影响。文中提出了一种考虑VPP与电动汽车(EV)用户双方经济效益的主从博... 虚拟电厂(VPP)是指将风光等分布式能源、可控负荷、储能系统和电动汽车等分布式能源视为一个特殊的电厂参与电力供应,通过合理制定电价减少峰值负荷对电网可靠性的影响。文中提出了一种考虑VPP与电动汽车(EV)用户双方经济效益的主从博弈定价策略,上层模型中运营商通过主从博弈模型制定电价来优化电网负荷,下层模型以电动汽车用户端充电费用最少为目标,双层博弈模型通过利用线性化方法和Karush-Kuhn-Tucker(KKT)条件将问题转化为单层混合整数线性规划进行求解。该模型考虑了电动汽车入网技术(V2G)对整个系统的影响,同时通过条件风险价值(CVaR)理论解决风光带来的不确定性。最后,算例给出运营商在V2G方式下的出力计划和最优定价策略,并分析了不同充电方式、不同EV参与比例和风险偏好系数对整个系统的影响。结果表明所建模型能够很好的平抑电网负荷波动、降低负荷峰谷差,并使参与V2G服务的用户经济收益最大化。 展开更多
关键词 虚拟电厂 电动汽车 主从博弈 实时电价 V2G 可再生能源
在线阅读 下载PDF
计及风、光、荷时序波动特性的配电网线路脆弱性评估
9
作者 鲁玲 蒲秋平 +5 位作者 张瑶瑶 李欣 张鑫 许鸿卫 鲁洋 卜得利 《可再生能源》 北大核心 2025年第4期499-509,共11页
文章对多类型分布式电源接入的配电线路脆弱性评估进行了研究。首先,针对分布式电源的不确定性,采用拉丁超立方抽样和同步回代法生成风、光经典出力场景,从电网结构、运行状态及故障影响3方面出发,基于复杂网络理论与潮流分析,提出改进... 文章对多类型分布式电源接入的配电线路脆弱性评估进行了研究。首先,针对分布式电源的不确定性,采用拉丁超立方抽样和同步回代法生成风、光经典出力场景,从电网结构、运行状态及故障影响3方面出发,基于复杂网络理论与潮流分析,提出改进线路介数、改进线路度数、线路电压稳定性、故障损失等脆弱性评估指标;其次,提出了基于时序波动特性修正权重的博弈论-VIKOR的综合评价模型,对线路的脆弱性进行评价;再次,基于IEEE33节点系统的算例进行仿真验证,结果表明,所构建指标及评价模型能准确反映线路实时脆弱状态,符合源、荷时序波动特性;最后,基于各时段线路综合脆弱性,结合时段内线路脆弱性分布特性,进一步分析了不同时段系统线路整体的真实脆弱性,为含分布式电源配电网风险规避提供理论依据。 展开更多
关键词 分布式电源 脆弱性评估 时序波动特性 博弈论
在线阅读 下载PDF
考虑新能源就地消纳的综合园区电动汽车时空优化调度
10
作者 刘俊峰 李国璋 +2 位作者 曾婧瑶 赵紫昱 曾君 《控制理论与应用》 北大核心 2025年第7期1345-1355,共11页
大规模无序充电的电动汽车(EV),相当于在时间上和空间上无序的电力负荷,可能会造成局部过负荷、线路堵塞等问题,给电网的运行带来巨大冲击.本文以综合园区内电动汽车时空优化调度为研究目标,建立了空间维度和时间维度的双层优化调度模型... 大规模无序充电的电动汽车(EV),相当于在时间上和空间上无序的电力负荷,可能会造成局部过负荷、线路堵塞等问题,给电网的运行带来巨大冲击.本文以综合园区内电动汽车时空优化调度为研究目标,建立了空间维度和时间维度的双层优化调度模型.在空间维度上,以电动汽车综合等待时间最短的目标,为其分配最优充电站;在时间维度上,在充分考虑新能源就地消纳的前提下,建立综合园区管理系统(CPMS)与主动EV之间的主从博弈模型,实现电动汽车充电成本降低,最小化CPMS互动成本以及维持整个综合园区的功率平衡的目标,从而完成电动汽车的时空优化调度.最后通过算例验证所提优化调度策略的有效性. 展开更多
关键词 电动汽车 时空优化调度 主从博弈 新能源消纳
在线阅读 下载PDF
基于时变需求的异质网约车平台竞合行为分析 被引量:1
11
作者 李嫚嫚 孙加辉 +1 位作者 付颖斌 凃强 《山东大学学报(工学版)》 北大核心 2025年第1期30-40,共11页
为明晰异质网约车平台竞合行为,以利他因子连续量化平台合作意愿,考虑网约车需求的时变特性,基于时空网络构建异质平台竞合均衡模型,描述异质平台竞合行为与其收益的耦合关系。根据模型的非线性特征,以利他因子、司机工资率以及出行服... 为明晰异质网约车平台竞合行为,以利他因子连续量化平台合作意愿,考虑网约车需求的时变特性,基于时空网络构建异质平台竞合均衡模型,描述异质平台竞合行为与其收益的耦合关系。根据模型的非线性特征,以利他因子、司机工资率以及出行服务价格为局部搜索对象,设计迭代局部搜索算法求解模型,解析异质平台竞合行为。通过算例分析发现,迭代局部搜索算法的求解性能优于遗传算法,且能够识别出好解特征;轻资产平台单方面将利他因子从0增加到1,系统总收益降低,而重资产平台单方面将利他因子从0增加到1,系统总收益提高;网约车需求量和时变特性都会影响异质平台竞合行为;轻资产平台利他因子会随网约车需求的增加从0变为1。 展开更多
关键词 网约车 竞合博弈 时变需求 利他因子 迭代局部搜索算法
原文传递
计及电能质量的虚拟电厂分时电价主从博弈优化方法
12
作者 戚军 王浚潇 +2 位作者 胡伟俊 张晓峰 谢路耀 《电力系统自动化》 北大核心 2025年第21期64-73,共10页
配电网运营商直接控制海量分散柔性资源存在通信、计算及市场组织等难题。面向柔性资源广泛物联与智能控制场景,构建了分时电价引导下用户自主调控所辖柔性资源实现利益最大化的优化模型,以充分发挥柔性资源响应电网调控的能力。基于主... 配电网运营商直接控制海量分散柔性资源存在通信、计算及市场组织等难题。面向柔性资源广泛物联与智能控制场景,构建了分时电价引导下用户自主调控所辖柔性资源实现利益最大化的优化模型,以充分发挥柔性资源响应电网调控的能力。基于主从博弈理论,以分时电价为纽带,建立包含虚拟电厂功率跟踪目标和用户利益最大化目标的主从博弈模型,并引入Kriging模型加速博弈问题的求解。仿真结果表明,主从博弈求解的分时电价能够在引导虚拟电厂实现较高精度的功率跟踪的同时改善其电能质量。该模型适用于不同柔性资源类型、天气类型、舒适度需求、功率跟踪目标、电价参数等应用场景。与遗传算法和粒子群算法相比,所提模型求解方法实现提速超10倍。 展开更多
关键词 虚拟电厂 柔性资源 功率跟踪 分时电价 主从博弈 KRIGING模型
在线阅读 下载PDF
跨国制造链协同低碳技术采纳决策
13
作者 赖新峰 陈馨怡 陈志祥 《系统管理学报》 北大核心 2025年第4期1078-1088,共11页
近年来,减少碳排放是全球共同面临的挑战之一,亟须广泛的国际合作与协调。跨国企业可通过采纳低碳技术降低生产碳排放,而采纳低碳技术的最优时机问题又成为企业关注的焦点。基于碳税政策下的离岸外包跨国生产网络,构建了一个由原始设备... 近年来,减少碳排放是全球共同面临的挑战之一,亟须广泛的国际合作与协调。跨国企业可通过采纳低碳技术降低生产碳排放,而采纳低碳技术的最优时机问题又成为企业关注的焦点。基于碳税政策下的离岸外包跨国生产网络,构建了一个由原始设备制造商(OEM)和两个合同制造商(CM)组成的跨国制造链模型,运用最优停止等待和博弈理论,分析了协同决策与Stackelberg决策下企业采纳低碳技术的临界产量与最优产量,探讨了低碳技术的最优采纳时机。为减轻碳税和汇率上涨过快的压力,设计了成本分担契约,该契约能有效降低国际贸易风险成本,推动供应链实现最优状态。研究发现:协同决策情形下,企业最优停止的临界产量受碳税和市场波动率影响。政府提高碳税税率能降低企业投资低碳技术的临界产量,从而加快低碳技术的采纳;市场稳定有助于促进企业采用低碳技术。在Stackelberg决策中,企业最优产量受汇率、碳税、碳排放量及低碳技术碳减排率共同影响,碳税、汇率和碳减排率的提高均促使企业更倾向于采纳低碳技术。研究表明,政府在推动企业通过低碳技术降低碳排放的过程中发挥着更为重要的作用。 展开更多
关键词 碳税 低碳技术 采纳时机 最优停止等待 STACKELBERG博弈
在线阅读 下载PDF
基于心理账户理论的车-站-网协同优化策略
14
作者 王楚迪 王琪玮 +4 位作者 马少华 颜宁 董雁楠 李相俊 李洋 《沈阳工业大学学报》 北大核心 2025年第1期37-44,共8页
【目的】随着电动汽车数量大幅度增长,交通运输正逐步向电气化转型。电动汽车负荷兼具有交通和电力双重属性,导致充电负荷具有更为复杂的时空随机性,使得充电负荷的变化规律更难以挖掘。而电动汽车负荷大规模无序接入电网,无疑会导致电... 【目的】随着电动汽车数量大幅度增长,交通运输正逐步向电气化转型。电动汽车负荷兼具有交通和电力双重属性,导致充电负荷具有更为复杂的时空随机性,使得充电负荷的变化规律更难以挖掘。而电动汽车负荷大规模无序接入电网,无疑会导致电压波动过大,影响电力系统的稳定性,给配电网调度带来隐患。挖掘电动汽车用户的出行规律,并制定有效的充电引导策略势在必行。【方法】针对区域负荷分布失衡问题,提出了一种基于心理账户理论的车-站-网协同优化策略,充分考虑了用户的有限理性心理,从用户侧调控电动汽车用户的充电行为。研究立足于行为经济学,综合分析影响电动汽车用户充电决策行为的各种因素,构建单属性价值函数。在此基础上根据心理账户理论整合多维属性对属性赋权,从而构建考虑用户有限理性心理的充电决策模型。【结果】考虑电压波动指标和用户充电成本的非合作博弈电价机制,通过价格引导用户有序充电,从而在优化电网电能质量的同时降低用户充电成本,并保障充电站运营商的基本利益。仿真结果验证了所提出协同策略的有效性和优越性。【结论】提出了一种车-站-网耦合作用下有限理性充电引导策略,通过构建电网和充电用户之间的非合作博弈模型制定各充电站的实时充电价格,引导用户的充电决策行为,从而改变快充负荷的时空分布,对提高充电站运营商的效率、减少用户的等待时间、提高配电网的电能质量具有显著作用,对于平抑负荷波动、维护电网稳定和经济运行具有重要意义。本文创新点在于构建了基于心理账户的多属性有限理性充电决策模型,模拟用户有限理性心理及学习过程,将行为决策理论与电力系统、交通学深度融合,可以更高效地引导电动汽车用户有序充电,助力电网安全、稳定运行。 展开更多
关键词 电动汽车 充电引导 协同优化 非合作博弈 实时电价 行为经济学 心理账户 有限理性 路-电耦合
在线阅读 下载PDF
基于零和微分博弈的仿射非线性系统预设时间容错控制 被引量:1
15
作者 杨朋昕 张爽 于欣波 《工程科学学报》 北大核心 2025年第12期2527-2538,共12页
针对一类带有执行器故障的仿射非线性系统,本文提出了一种基于零和微分博弈的预设时间最优容错控制策略.该方法通过辅助函数构建具有时间以及空间约束性能的状态方程.基于此状态方程,将控制信号以及偏置故障作为博弈双方,构建微分博弈模... 针对一类带有执行器故障的仿射非线性系统,本文提出了一种基于零和微分博弈的预设时间最优容错控制策略.该方法通过辅助函数构建具有时间以及空间约束性能的状态方程.基于此状态方程,将控制信号以及偏置故障作为博弈双方,构建微分博弈模型.结合纳什-庞特里亚金最大最小原理,系统地推导了Hamilton-Jacobi-Isaacs(HJI)方程,以求解鞍点平衡,从而获得最优控制策略和偏差故障的边界值.为了解决求解高阶偏微分方程时固有的“维数灾难”,基于神经网络技术提出了自适应动态规划算法.设计的最优容错控制策略可以保证系统在执行器故障的情况下具有预设时间稳定性以及最优性能,并且该预设时间是显性的,可以由用户进行自行调整.仿真结果表明了本文设计算法的可行性与有效性. 展开更多
关键词 零和微分博弈 预设时间 执行器故障 仿射非线性系统 自适应动态规划
在线阅读 下载PDF
The Game Analysis of Environmental Protection at Scenic Spots 被引量:1
16
作者 宋健峰 吴艳 《Journal of Landscape Research》 2011年第10期24-27,共4页
Game model of environmental protection at scenic spots is established in this paper in order to carry out analysis of the equilibrium between one-time game and infinitely repeated game, disclose the reasons why the en... Game model of environmental protection at scenic spots is established in this paper in order to carry out analysis of the equilibrium between one-time game and infinitely repeated game, disclose the reasons why the environment of scenic spots are destroyed, and propose the countermeasures to ensure the equilibrium of the game. The study also reveals that during the one-time game between tourists and tour operators, it is tour operators' dominant strategy not to control environmental pollution that leads to the destruction of environment at scenic spots. While, during the infinitely repeated game between tourists and tour operators, the realization of Pareto optimality equilibrium (The strategy of tourist is traveling, and the strategy of tour operators are controlling environmental pollution) is dependent upon the choice of players (tourists or operators) of triggering strategy (traveling or controlling environmental pollution). The supervision of the government upon operators can force them to control environmental pollution, which can consequently improve the efficiency of equilibrium in the game, and promote environmental protection at tourism scenic spots and sustainable development of tourism. 展开更多
关键词 TOURISM ENVIRONMENTAL PROTECTION One-time game Repeated game
在线阅读 下载PDF
基于多智能体Actor-double-critic深度强化学习的源-网-荷-储实时优化调度方法 被引量:3
17
作者 徐业琰 姚良忠 +4 位作者 廖思阳 程帆 徐箭 蒲天骄 王新迎 《中国电机工程学报》 北大核心 2025年第2期513-526,I0010,共15页
为保证新型电力系统的安全高效运行,针对模型驱动调度方法存在的调度优化模型求解困难、实时决策求解速度慢等问题,该文提出一种基于多智能体Actor-double-critic深度强化学习的源-网-荷-储实时优化调度方法。通过构建考虑调节资源运行... 为保证新型电力系统的安全高效运行,针对模型驱动调度方法存在的调度优化模型求解困难、实时决策求解速度慢等问题,该文提出一种基于多智能体Actor-double-critic深度强化学习的源-网-荷-储实时优化调度方法。通过构建考虑调节资源运行约束和系统安全约束的实时优化调度模型和引入Vickey-Clark-Groves拍卖机制,设计带约束马尔科夫合作博弈模型,将集中调度模型转换为多智能体间的分布式优化问题进行求解。然后,提出多智能体Actor-double-critic算法,分别采用Self-critic和Cons-critic网络评估智能体的动作-价值和动作-成本,降低训练难度、避免即时奖励和安全约束成本稀疏性的影响,提高多智能体训练收敛速度,保证实时调度决策满足系统安全运行约束。最后,通过仿真算例验证所提方法可大幅缩短实时调度决策时间,实现保证系统运行安全可靠性和经济性的源-网-荷-储实时调度。 展开更多
关键词 源-网-荷-储 实时调度 带约束马尔科夫合作博弈 多智能体深度强化学习
原文传递
异质决策下具有延迟结构和随机成本的Cournot博弈动力学分析
18
作者 许迪 杨光惠 《广西师范大学学报(自然科学版)》 北大核心 2025年第6期140-151,共12页
本文首先建立具有随机成本的动态Cournot博弈模型;然后,基于延迟和梯度调整的异质决策机制建立相应非线性动力系统,进一步求解该系统平衡点并分析Nash均衡点的稳定性;最后,通过数值仿真,研究延迟参数、产品差异参数以及随机变量等对系... 本文首先建立具有随机成本的动态Cournot博弈模型;然后,基于延迟和梯度调整的异质决策机制建立相应非线性动力系统,进一步求解该系统平衡点并分析Nash均衡点的稳定性;最后,通过数值仿真,研究延迟参数、产品差异参数以及随机变量等对系统稳定性的影响。本文结论如下:①延迟参数对系统稳定性的影响非单调,随着延迟参数的增加,系统稳定区域先增加,当延迟参数增加到一定程度后,系统的稳定性逐渐减弱;②随机变量越大,系统的稳定性也越强;③两局中人对初始值扰动敏感程度不同,具有延迟理性行为的局中人抗初始值扰动能力更强。 展开更多
关键词 Cournot博弈 时间延迟 随机成本 非线性动力系统 异质决策
在线阅读 下载PDF
电碳耦合市场中多主体竞价随机延迟演化博弈及应用
19
作者 张帅博 赫飞 宗德敬 《电力科学与技术学报》 北大核心 2025年第4期121-133,共13页
随着碳排放权交易对推进电力系统低碳经济转型愈发重要,电碳市场中新能源发电商、化石能源发电商和社区聚合商之间的竞价策略出现显著变化。针对市场中不同主体竞价行为表现出的随机波动以及碳配额产生的效益等存在滞后的情况,通过建立... 随着碳排放权交易对推进电力系统低碳经济转型愈发重要,电碳市场中新能源发电商、化石能源发电商和社区聚合商之间的竞价策略出现显著变化。针对市场中不同主体竞价行为表现出的随机波动以及碳配额产生的效益等存在滞后的情况,通过建立随机延迟微分方程(stochastic delay differential equation,SDDE)模型,引入高斯白噪声和时滞项,对3类不同企业间的竞价过程进行动态演化仿真,并探讨滞后时间阈值的变化规律以及干扰强度和滞后时间等参数变化对策略选择产生的影响。在此基础上,基于三方主体之间的供需关系,设置不同类型的柔性负荷,并通过SDDE方程模拟在电碳市场中供给侧的分时电价策略与需求侧的柔性负荷策略之间的演化博弈过程,证明在纳什均衡过程中对各方主体利益产生的影响以及实现削峰填谷的有效性。 展开更多
关键词 电碳市场 碳配额 随机延迟微分方程 随机演化博弈 分时电价 需求响应
在线阅读 下载PDF
国际制裁:一个研究框架 被引量:1
20
作者 富景筠 张宇燕 《东北亚论坛》 北大核心 2025年第2期3-21,127,共20页
随着大国博弈的加剧,国际制裁成为一国向全球投射实力和影响力的重要工具。国际制裁的核心要素包括制裁的概念和动因、制裁主体与制裁客体、制裁内容及制裁手段、制裁时间以及制裁有效性。它们相互影响、彼此作用,构成了统一完整的制裁... 随着大国博弈的加剧,国际制裁成为一国向全球投射实力和影响力的重要工具。国际制裁的核心要素包括制裁的概念和动因、制裁主体与制裁客体、制裁内容及制裁手段、制裁时间以及制裁有效性。它们相互影响、彼此作用,构成了统一完整的制裁实施过程与效果评估。制裁目标的设定是选取相应制裁内容和制裁类型的基本依据,而制裁时间和次序则决定了制裁的实施路径和效用边界。制裁有效性不是由制裁国单向决定的,制裁与反制裁之间的策略互动极大地影响到制裁效果。本项研究旨在对国际制裁的既有文献进行全面梳理和系统总结,特别是追踪国际制裁的政治经济研究的最新进展,力求提炼出与制裁相关的命题,进而引发对制裁理论与实践的进一步思考。 展开更多
关键词 国际制裁 制裁动因 制裁时间 制裁有效性 大国博弈
原文传递
上一页 1 2 29 下一页 到第
使用帮助 返回顶部