期刊文献+
共找到37,218篇文章
< 1 2 250 >
每页显示 20 50 100
区块链应用背景下新能源汽车闭环供应链的微分博弈模型 被引量:1
1
作者 徐健腾 马柯柯 +1 位作者 柏庆国 张玉忠 《运筹学学报(中英文)》 北大核心 2026年第1期41-60,共20页
将区块链技术应用到新能源汽车供应链能够在一定程度上解决废旧电池利用率不高和回收难等问题。在这一背景下,本文考虑了由一个投资区块链技术的动力电池供应商、一个普通零件供应商和一个新能源汽车制造商组成的闭环供应链,重点研究系... 将区块链技术应用到新能源汽车供应链能够在一定程度上解决废旧电池利用率不高和回收难等问题。在这一背景下,本文考虑了由一个投资区块链技术的动力电池供应商、一个普通零件供应商和一个新能源汽车制造商组成的闭环供应链,重点研究系统在动态决策环境下的情形。将区块链技术应用到动力电池的全生命周期追溯过程,刻画了新能源汽车动力电池可追溯水平动态变化的随机演化过程。在动力电池供应商和新能源汽车制造商分别作为回收主体以及两者垂直整合模式下,构建了三个主从随机微分博弈模型。通过求解三个模型下的反馈均衡解,比较了供应链在达到稳态情形下的状态变量、决策变量和反馈利润。最后,结合数值算例检验了新能源汽车闭环供应链在静态和动态下的运营绩效。本文得出的研究结论能够为新能源汽车企业应用区块链技术、回收废旧动力电池和供应链整合提供一定的参考。 展开更多
关键词 闭环供应链 新能源汽车 微分博弈 区块链技术
在线阅读 下载PDF
联盟结构合作博弈的平等盈余分配
2
作者 于晓辉 王文举 +2 位作者 张强 张志强 商盈润 《系统工程学报》 北大核心 2026年第1期28-45,共18页
在联盟结构合作博弈中,探讨了优先联盟议价能力对其局中人收益分配的影响,构建了基于“平等盈余分配”(即ESD解)的分配方法.首先,基于ESD解及其扩展形式,将优先联盟的议价能力转化为其收益分配的动态权重.然后,基于Owen型值二步法构建... 在联盟结构合作博弈中,探讨了优先联盟议价能力对其局中人收益分配的影响,构建了基于“平等盈余分配”(即ESD解)的分配方法.首先,基于ESD解及其扩展形式,将优先联盟的议价能力转化为其收益分配的动态权重.然后,基于Owen型值二步法构建了体现局中人加入大联盟前后收益差异的联盟结构合作博弈“解”(即:两种广义加权平等盈余分配),并进行了公理化论证.通过对比两种广义加权平等盈余分配方案,分析可知:企业自身实力的增强会降低其加入到联盟结构合作的意愿,但是必然会提高大联盟中其他优先联盟的合作意愿,而不一定会增强其同一优先联盟中其他伙伴的合作意愿;当企业经济实力的增强时,应该通过合理地设置优先联盟的动态权重来保证其同一优先联盟伙伴的合作意愿.因此,广义平等盈余分配可以帮助局中人评估可能的合作分配和合作方式,从而选择最优的合作形式. 展开更多
关键词 联盟结构 平等盈余分配 加权解 合作博弈
在线阅读 下载PDF
基于改进集的参数集优化问题Lipschitz连续性
3
作者 孟旭东 郭林 张传美 《大连理工大学学报》 北大核心 2026年第2期209-215,共7页
在拓扑线性空间中研究一类改进集的参数集优化问题Lipschitz连续性.借助改进集的集上(下)序给出参数集优化问题解映射和最优值映射,在目标函数与约束函数具有Lipschitz连续性基本假设条件下,运用分析方法获得参数集优化问题解映射和最... 在拓扑线性空间中研究一类改进集的参数集优化问题Lipschitz连续性.借助改进集的集上(下)序给出参数集优化问题解映射和最优值映射,在目标函数与约束函数具有Lipschitz连续性基本假设条件下,运用分析方法获得参数集优化问题解映射和最优值映射的Lipschitz连续性定理,给出实例检验所得结果的有效性. 展开更多
关键词 集优化问题 LIPSCHITZ连续性 解映射 最优值映射 改进集
在线阅读 下载PDF
含参集值Ky Fan不等式和对偶问题解映射的Lipschitz连续性
4
作者 孟旭东 郭林 张传美 《安徽大学学报(自然科学版)》 北大核心 2026年第2期1-8,共8页
在赋范空间中讨论了含参集值Ky Fan不等式与对偶问题解映射的Lipschitz连续性.首先,介绍了含参集值Ky Fan不等式与对偶问题解的概念.其次,给出了集值映射强锥-半拟(类)凸(凹)性.最后,建立了含参集值Ky Fan不等式与对偶问题解映射Lipsch... 在赋范空间中讨论了含参集值Ky Fan不等式与对偶问题解映射的Lipschitz连续性.首先,介绍了含参集值Ky Fan不等式与对偶问题解的概念.其次,给出了集值映射强锥-半拟(类)凸(凹)性.最后,建立了含参集值Ky Fan不等式与对偶问题解映射Lipschitz连续性基本定理,并举例加以说明. 展开更多
关键词 LIPSCHITZ连续性 Ky Fan不等式 对偶问题 解映射
在线阅读 下载PDF
具有修正的Min(N,D)-策略和单重休假的Geo/G/1离散时间排队分析
5
作者 魏瑛源 余玅妙 唐玉玲 《应用数学》 北大核心 2026年第1期108-128,共21页
本文研究服务员具有单重休假和系统采用修正的Min(N,D)-策略的离散时间Geo/G/1排队系统,运用更新过程理论、全概率分解技术和z-变换工具,从任意初始状态开始,研究队长的瞬时性态和平稳性态,得到了任意时刻n^(+)处队长瞬态分布的z-变换... 本文研究服务员具有单重休假和系统采用修正的Min(N,D)-策略的离散时间Geo/G/1排队系统,运用更新过程理论、全概率分解技术和z-变换工具,从任意初始状态开始,研究队长的瞬时性态和平稳性态,得到了任意时刻n^(+)处队长瞬态分布的z-变换表达式和稳态分布的递推表达式,同时给出了不同时刻n^(-)、n、n^(+)和外部观测点处队长稳态分布之间的重要关系.进一步借助于数值实例,讨论了系统的空闲率与稳态平均队长关于系统参数的敏感性,并且阐述了便于作数值计算的队长稳态分布的递推公式在系统容量优化设计中的重要价值.最后,运用更新报酬过程定理,建立了费用结构模型,获得了系统长期运行下单位时间内所产生的期望费用的显示表达式,并通过数值算例,寻求使期望费用最小的最优控制策略(N^(*),D^(*)). 展开更多
关键词 离散时间排队 修正的Min(N D)-策略 单重休假 队长分布 系统容量优化设计 最优控制策略
在线阅读 下载PDF
单机供应链排序问题动态规划算法
6
作者 陈荣军 刘永财 +1 位作者 黄河 唐国春 《运筹学学报(中英文)》 北大核心 2026年第1期171-178,共8页
本文研究单机供应链排序问题,即研究供应链的上游如何安排工件在一台机器上加工,并把加工后的工件分批发送给下游客户,使得生产排序费用和发送费用总和最少,其中,生产排序费用是用工件送到时间的函数来表示;发送费用是由固定费用和与运... 本文研究单机供应链排序问题,即研究供应链的上游如何安排工件在一台机器上加工,并把加工后的工件分批发送给下游客户,使得生产排序费用和发送费用总和最少,其中,生产排序费用是用工件送到时间的函数来表示;发送费用是由固定费用和与运输路径有关的可变费用组成。本文分别研究以工件带权送达时间与工件延迟为生产排序费用的单机供应链排序问题,对于前者,证明了一般情形的强NP困难性,并对长度和权重有一致性约束的特殊情形给出了动态规划算法;对于后者,分析了问题NP困难性,并设计动态规划算法。 展开更多
关键词 供应链排序 供应商问题 单台机器 动态规划
在线阅读 下载PDF
一种自适应步长的随机递归梯度算法
7
作者 段复建 秦晓风 李向利 《应用数学》 北大核心 2026年第2期494-500,共7页
随机优化问题是机器学习与优化交叉领域的一大研究热点,其中经验风险最小化问题尤为突出.提出了一种自适应步长的随机递归梯度算法,结合重要性采样并使用BB方法动态调整步长参数,通过降低随机梯度方差,从而有效地提高了收敛速度.在强凸... 随机优化问题是机器学习与优化交叉领域的一大研究热点,其中经验风险最小化问题尤为突出.提出了一种自适应步长的随机递归梯度算法,结合重要性采样并使用BB方法动态调整步长参数,通过降低随机梯度方差,从而有效地提高了收敛速度.在强凸假设下算法具有线性收敛速度,数值实验表明该算法是有效可行的. 展开更多
关键词 经验风险最小化问题 随机递归梯度算法 BB方法
在线阅读 下载PDF
不确定环境下城市居民出行方式选择的演化博弈分析
8
作者 余孝军 陈亦开 《科学技术与工程》 北大核心 2026年第7期2724-2736,共13页
针对城市居民出行方式选择在不确定环境下的演化问题,基于演化博弈理论研究了城市居民和交通部门策略选择的演化过程。考虑到博弈双方演化过程中的随机扰动,引入高斯白噪声来反映博弈双方受到的随机扰动,构建了不确定环境下城市居民和... 针对城市居民出行方式选择在不确定环境下的演化问题,基于演化博弈理论研究了城市居民和交通部门策略选择的演化过程。考虑到博弈双方演化过程中的随机扰动,引入高斯白噪声来反映博弈双方受到的随机扰动,构建了不确定环境下城市居民和交通部门随机演化博弈模型,分析了城市居民和交通部门选择行为策略的稳定性。并运用计算机仿真,分析了各关键因素对博弈主体策略选择的影响。结果表明:随机扰动带来的不确定性能加快城市居民和交通部门的演化速率;降低城市居民的绿色出行成本和增加交通部门的补贴能更有效地加快城市居民向均衡策略收敛;提升城市居民的绿色出行意识能够有效提高城市居民选择绿色出行方式的比例;减少交通部门积极推广的成本和提升其综合效益能够提高交通部门选择积极推广策略的比例;政府的处罚虽对提高交通部门选择积极推广策略有促进作用,但处罚过大亦会降低交通部门选择积极推广策略的主动性。在此基础上,提出了提高城市居民绿色出行意愿的对策建议。 展开更多
关键词 城市交通 出行方式选择 随机演化博弈模型 计算机仿真 绿色出行
在线阅读 下载PDF
新发展理念视域下省际初始碳配额分配研究
9
作者 令狐大智 彭源源 +1 位作者 武新丽 朱帮助 《中国管理科学》 北大核心 2026年第2期348-356,共9页
深入剖析新发展理念下区域主体特征及其碳排放权力和责任范畴的新变化,拓展公平、效率、可持续和可行原则的内涵和边界,构建3层30维初始碳配额分配体系,采用最大化离差法综合衡量区域差异和测算未来15年我国30个省域的初始碳配额,并从... 深入剖析新发展理念下区域主体特征及其碳排放权力和责任范畴的新变化,拓展公平、效率、可持续和可行原则的内涵和边界,构建3层30维初始碳配额分配体系,采用最大化离差法综合衡量区域差异和测算未来15年我国30个省域的初始碳配额,并从公平、效率和减排成本的综合维度进行绩效评价。研究结果表明:新发展理念从区域协调发展、要素流动配置、社会共建共享以及绿色低碳发展等领域拓展了区域主体特征和现有分配原则的内涵、边界;区域主体特征及其碳排放权力和责任范畴界定的变化会显著影响初始碳配额的分配结果,进而影响分配方案的公平、效率和减排成本;新方案能够更好地体现现有分配原则,具有更优的分配绩效;区域生态禀赋和绿色可持续发展能力等区域特征对各区域初始碳配额的使用盈余和赤字情况产生显著影响,有助于推动区域协同降碳和绿色可持续发展。 展开更多
关键词 初始碳配额分配 指标体系 新发展理念 效果评价 省域
原文传递
基于排队理论的区块链双重支付行为分析
10
作者 田瑞玲 陈心怡 《应用数学》 北大核心 2026年第2期531-542,共12页
本文根据区块链技术中双重支付的实现过程,提出了一个两阶段服务的排队模型.结合真实背景,将恶意节点发布交易信息阶段定义为广播阶段执行基本服务;将诚实节点接收交易信息并形成区块阶段定义为区块生成阶段,提供可选服务并在此阶段执... 本文根据区块链技术中双重支付的实现过程,提出了一个两阶段服务的排队模型.结合真实背景,将恶意节点发布交易信息阶段定义为广播阶段执行基本服务;将诚实节点接收交易信息并形成区块阶段定义为区块生成阶段,提供可选服务并在此阶段执行清算服务.在系统稳定条件下,利用矩阵几何解法和谱展开法,得到该系统的平稳分布,并给出平均交易数量等性能指标的表达式.进一步通过数值分析讨论各参数对系统性能指标的影响,同时构建收益函数研究恶意节点的收益情况.根据数值分析结果和区块链实际情况提出预防双重支付的优化建议,为优化区块链系统提高安全性提供理论依据. 展开更多
关键词 区块链 双重支付 两阶段服务 可选服务 清算服务
在线阅读 下载PDF
带有异质信息顾客和差异化休假的排队系统最优策略
11
作者 田瑞玲 宋涛 +2 位作者 黄艳玲 王腾 陈小娟 《应用数学》 北大核心 2026年第1期198-208,共11页
本文研究了带有异质信息顾客和差异化休假的排队系统.当系统为空时,服务台开始休假,休假回来后如果系统中有顾客等待则进入忙期.否则服务台将进行多重休假直到某次休假回来系统中有顾客存在.到达顾客根据被告知信息程度的不同分为完全... 本文研究了带有异质信息顾客和差异化休假的排队系统.当系统为空时,服务台开始休假,休假回来后如果系统中有顾客等待则进入忙期.否则服务台将进行多重休假直到某次休假回来系统中有顾客存在.到达顾客根据被告知信息程度的不同分为完全告知顾客和完全不告知顾客.本文首先通过构建差分方程解平衡方程,获得系统稳态概率及性能指标.然后考虑顾客均衡和社会最优两种情况,对完全告知顾客求解阈值策略,对完全不告知顾客求解其混合加入策略.之后通过数值分析考察参数对顾客策略及社会收益的影响.本文考虑更复杂的现实,希望能丰富对排队问题的研究. 展开更多
关键词 异质信息 差异化休假 均衡策略 社会最优收益 排队
在线阅读 下载PDF
共享汽车的出行方式选择的重复博弈分析
12
作者 肖海燕 吴新林 《湖北第二师范学院学报》 2026年第2期6-11,共6页
出行者在共享汽车和私家车出行选择下的囚徒困境在现实中并非一次性的,而是多次长期重复的博弈过程。当博弈方都比较注重长远利益时会选择合作策略。在实际中,出行者在选择共享汽车时可能会犯错误,产生“颤抖效应”,从而影响重复博弈的... 出行者在共享汽车和私家车出行选择下的囚徒困境在现实中并非一次性的,而是多次长期重复的博弈过程。当博弈方都比较注重长远利益时会选择合作策略。在实际中,出行者在选择共享汽车时可能会犯错误,产生“颤抖效应”,从而影响重复博弈的收益。这种情况更符合实际。在都比较注重长远利益的情况下参与者均会采取触发策略,参与者在重复博弈过程中会出现“失误”,证明了只要参与者比较看重长远的收益,且犯错的可能性比较小,则稳定的合作均衡可以达到。 展开更多
关键词 出行方式 共享汽车 私家车 重复博弈 颤抖效应
在线阅读 下载PDF
《最优化方法》的选择性考核探索
13
作者 王鑫 赵弘欣 孔令臣 《教育进展》 2026年第1期1005-1010,共6页
《最优化方法》作为一门重要的公共基础课,随着多学科的交叉融合以及大类招生模式的广泛实行,其教学对象已经从单一的数学专业学生扩展至经管、计算机、交通运输等多个学科专业学生。这一变化使得传统闭卷考核与多元化学生背景之间产生... 《最优化方法》作为一门重要的公共基础课,随着多学科的交叉融合以及大类招生模式的广泛实行,其教学对象已经从单一的数学专业学生扩展至经管、计算机、交通运输等多个学科专业学生。这一变化使得传统闭卷考核与多元化学生背景之间产生了考核不公平的矛盾。本文分析了学科融合及大类招生背景下《最优化方法》课程考核体系的不公平问题,提出了“选择性考核”的公平考核方案。该方案将课程部分总评成绩的权重重新分配到各专业领域紧密连接的课题实践,允许学生根据自己的兴趣、优势和未来规划,选择擅长的实践题目,从而达到考核的公平性。 展开更多
关键词 《最优化方法》 学科融合 大类招生 选择性考核
在线阅读 下载PDF
创造性破坏、集聚与内生增长
14
作者 郑长德 陈星宇 《西南民族大学学报(自然科学版)》 2026年第2期228-236,共9页
基于创造性破坏的两区域增长模型分析表明,质量创新驱动的经济增长会重塑空间结构:核心区凭借知识溢出形成增长极,贸易自由度超过临界值将触发产业向核心区集聚,而企业迁移与劳动力流动的耦合效应进一步强化该格局.但市场自发的创新速... 基于创造性破坏的两区域增长模型分析表明,质量创新驱动的经济增长会重塑空间结构:核心区凭借知识溢出形成增长极,贸易自由度超过临界值将触发产业向核心区集聚,而企业迁移与劳动力流动的耦合效应进一步强化该格局.但市场自发的创新速度可能长期低于社会最优.因此,政策应围绕“创新-集聚-增长”循环进行设计:核心区需加强知识产权保护与基础研究投入,以弥补市场动力不足;边缘区则应通过数字基建与跨区合作提升技术吸收能力,并实施差异化产业政策嵌入高价值链条.同时,需动态优化一体化政策,在高贸易自由度阶段辅以对边缘区的定向补偿,并优化要素流动制度,引导形成功能互补的区域生态,从而在促进效率的同时维护空间平衡,实现长期协调发展. 展开更多
关键词 创造性破坏 垂直创新 空间集聚 内生增长 多要素流动
在线阅读 下载PDF
向量组等价的一个新定义——以三维向量为例
15
作者 解顺强 《大学数学》 2026年第1期83-89,共7页
以三维向量为例,从两个线性方程组同解出发,给出了两个向量组等价的一种新定义,并证明了此定义与现有教材中的向量组等价的定义是等价的.此新定义将向量组等价与求解线性方程组紧密的联系起来,完善了用求解线性方程组将线性代数的几大理... 以三维向量为例,从两个线性方程组同解出发,给出了两个向量组等价的一种新定义,并证明了此定义与现有教材中的向量组等价的定义是等价的.此新定义将向量组等价与求解线性方程组紧密的联系起来,完善了用求解线性方程组将线性代数的几大理论(如矩阵、行列式、向量组、线性方程组)串联起来的线条,便于学生理解和掌握.同时也为抽象的向量组等价的概念找到了应用的背景. 展开更多
关键词 线性代数 线性方程组 向量组 等价
在线阅读 下载PDF
LightX-UNet:基于Mamba的轻量级医学图像分割模型
16
作者 庞丽萍 杜岳峰 田玉铢 《辽宁师范大学学报(自然科学版)》 2026年第1期1-8,共8页
医学图像分割技术在计算机辅助诊断和智能医疗中发挥着至关重要的作用,但现有的UNet模型受限于CNN无法建模长距离依赖关系,Transformer的自注意力机制大幅增加了模型参数.近年来,以Mamba为代表的状态空间模型能够以极低的计算效率大幅... 医学图像分割技术在计算机辅助诊断和智能医疗中发挥着至关重要的作用,但现有的UNet模型受限于CNN无法建模长距离依赖关系,Transformer的自注意力机制大幅增加了模型参数.近年来,以Mamba为代表的状态空间模型能够以极低的计算效率大幅提高模型的序列建模能力,逐渐成为轻量化模型的重要基础.基于Mamba提出了一种轻量级医学图像分割模型Light X-UNet,使用了一种新型扫描机制——X-Scan来替代Mamba中的四向扫描机制(SS2D),大幅减少因扫描路径所导致的图像细节丢失,从而更全面地建模图像中的复杂结构.在3个公开的皮肤病变分割数据集上与多个分割模型进行了比较和消融实验,Light X-UNet均取得了最优异的分割性能,同时大幅降低了计算成本. 展开更多
关键词 医学图像分割 轻量级 深度学习 X-SCAN
在线阅读 下载PDF
关于Fibonacci方法的教学设计
17
作者 张晓伟 杜安萍 《大学数学》 2026年第1期108-112,共5页
以创新型人才培养为目标,基于Fibonacci方法的传统教学设计中存在的问题,探索出一个行之有效的新思路.通过逐层引导和设问等方式,利用初等数学知识解决了一个约束最优化问题.基于此教学设计,让学生充分理解Fibonacci方法以及黄金分割法... 以创新型人才培养为目标,基于Fibonacci方法的传统教学设计中存在的问题,探索出一个行之有效的新思路.通过逐层引导和设问等方式,利用初等数学知识解决了一个约束最优化问题.基于此教学设计,让学生充分理解Fibonacci方法以及黄金分割法的基本思想. 展开更多
关键词 Fibonacci法 黄金分割法 教学设计
在线阅读 下载PDF
随机能量多覆盖问题
18
作者 曹梦涵 丁红林 《电子科技大学学报》 北大核心 2026年第2期224-231,共8页
该文研究随机能量多覆盖问题:给定一些用户和基站,以及几种可能发生的场景和每种场景发生的概率,每种场景下需要被覆盖的用户以及覆盖次数需求已知,不同场景的用户集需要使用不同的信号覆盖,每个基站发射信号消耗的能量都满足一个能量... 该文研究随机能量多覆盖问题:给定一些用户和基站,以及几种可能发生的场景和每种场景发生的概率,每种场景下需要被覆盖的用户以及覆盖次数需求已知,不同场景的用户集需要使用不同的信号覆盖,每个基站发射信号消耗的能量都满足一个能量方程。其目标是要为每一个基站确定发射信号的类型及其覆盖半径,满足所有场景中需要被覆盖用户的覆盖次数需求,并且期望消耗能量总和达到最小。该问题是最小能量覆盖问题的一种推广形式,具有两阶段随机优化问题中的有限场景特征,与点覆盖和集合覆盖等经典优化问题关系密切。利用点覆盖与集合覆盖问题中的“度权”函数与“分层”策略,把问题实例中每个圆盘的权重分解为一系列度权,分而治之地优先选择各场景中度权较小的圆盘,运用该策略设计出求解随机能量多覆盖问题的一个多项式时间近似算法。 展开更多
关键词 多覆盖 随机优化 有限场景 度权函数 近似算法
在线阅读 下载PDF
一种基于拓扑骨架分布的子结构划分方法
19
作者 马秉新 杜文风 +2 位作者 王超 高博青 董石麟 《计算力学学报》 北大核心 2026年第1期116-123,共8页
基于传统子结构划分的拓扑优化方法有利于解决工程结构拓扑结果材料富集、布局不合理的问题,但其子结构划分过于依赖设计者的经验和尝试,耗时费力效率低。为此,本文提出一种基于拓扑骨架分布的子结构划分方法,可以快速获得布局合理的子... 基于传统子结构划分的拓扑优化方法有利于解决工程结构拓扑结果材料富集、布局不合理的问题,但其子结构划分过于依赖设计者的经验和尝试,耗时费力效率低。为此,本文提出一种基于拓扑骨架分布的子结构划分方法,可以快速获得布局合理的子结构划分。该方法首先通过拓扑优化计算得到设计区域的骨架分布,然后将骨架分布映射至原始工程结构指导子结构的划分,将可设计区域划分为骨架子结构与其他次要子结构,最后使骨架子结构与其他次要子结构在不同体积比约束下达到整体刚度最大。应用于十字板式节点,得到了三种兼具性能佳与结构美的新构型,分别降低了34.81%~36.68%的结构自重、5.61%~8.52%的结构最大位移、26.95%~33.69%的结构最大等效应力,提升了十字板式节点的优化水平。本方法不仅可以直接快速进行合理子结构的划分,提升拓扑优化效率,而且可以得到更加优化的拓扑结果,提升拓扑优化质量。 展开更多
关键词 子结构 拓扑优化 悬臂板 十字板式节点
在线阅读 下载PDF
通信受限的双网络零和博弈分布式在线优化
20
作者 廖岚 于湛 +2 位作者 袁德明 张保勇 徐胜元 《自动化学报》 北大核心 2026年第1期108-120,共13页
研究双网络零和博弈中的分布式优化问题,其中两个网络代表两个对立的玩家.每个网络由一组具有时变损失函数的智能体组成,智能体通过通信和协作来优化己方网络在博弈中的收益.考虑到现实优化场景中通信资源受限和信息反馈受限两种通信受... 研究双网络零和博弈中的分布式优化问题,其中两个网络代表两个对立的玩家.每个网络由一组具有时变损失函数的智能体组成,智能体通过通信和协作来优化己方网络在博弈中的收益.考虑到现实优化场景中通信资源受限和信息反馈受限两种通信受限情形,设计基于事件触发通信和两点Bandit反馈的分布式在线优化算法,并采用动态纳什均衡遗憾评估算法的性能.在某些假设条件下,建立相对于总博弈次数为次线性的动态纳什均衡遗憾界,从而验证了算法的有效性.此外,将设计的算法拓展为多周期版本并建立次线性的动态纳什均衡遗憾界.最后,通过双线性矩阵博弈的仿真算例进一步验证了所设计的两个算法的性能. 展开更多
关键词 零和博弈 分布式在线优化 动态纳什均衡遗憾 Bandit反馈 事件触发通信
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部