检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到7篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于网络学习空间的CTDE创新能力培养模式研究: 1; 作者李媛唐章蔚《教育信息技术》 2020年第6期58-63,共6页; 21世纪核心素养强调对学生学习及创新能力的培养,网络学习空间作为开放交互的个性化学习环境,可以为创新能力培养提供有效支持。文章在文献研究的基础上,通过对智力结构模式、创造与情致教学模式等理论进行分析,提出了以"CTDE"... 展开更多; 关键词创新能力网络学习空间 ctde模式; 原文传递

特征–奖励对齐的深度强化学习架构设计: 2; 作者火久元黄腾飞《兰州交通大学学报》 2026年第2期53-60,共8页; 针对深度强化学习在多智能体环境中普遍存在的特征与奖励机制难以匹配、从而导致算法有效性与适用性不足的问题,提出了一种架构–特征–奖励协同设计框架(AFRD),用于系统性地指导单智能体方法向多智能体场景扩展。该框架依托CTDE(centra... 展开更多; 关键词深度强化学习特征与奖励机制边缘计算任务卸载 ctde; 在线阅读下载PDF 职称材料

MARCS:A Mobile Crowdsensing Framework Based on Data Shapley Value Enabled Multi-Agent Deep Reinforcement Learning: 3; 作者 Yiqin Wang Yufeng Wang +1 位作者 Jianhua Ma Qun Jin 《Computers, Materials & Continua》 2025年第3期4431-4449,共19页; Opportunistic mobile crowdsensing(MCS)non-intrusively exploits human mobility trajectories,and the participants’smart devices as sensors have become promising paradigms for various urban data acquisition tasks.Howeve... 展开更多; 关键词 Mobile crowdsensing online data acquisition data Shapley value multi-agent deep reinforcement learning centralized training and decentralized execution(ctde); 在线阅读下载PDF 职称材料

基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法被引量：12: 4; 作者赵知劲朱家晟 +1 位作者叶学义尚俊娜《电子与信息学报》 EI CSCD 北大核心 2022年第8期2814-2823,共10页; 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为... 展开更多; 关键词异步组网多智能体深度强化学习集中式学习和分散式执行模糊推理系统; 在线阅读下载PDF 职称材料

协同空战与多智能体强化学习下的关键问题被引量：2: 5; 作者谢育星陆屹 +1 位作者管聪纪德东《飞机设计》 2023年第1期6-10,共5页; 自从协同作战的概念提出后,各军事强国在协同空战领域均取得了重大进展,协同成为提升作战能力的倍增器。近数十年来,作为解决序列问题的现代智能方法,强化学习在各领域高速发展。然而,面对高维变量问题时,传统的单智能体强化学习往往表... 展开更多; 关键词协同空战多智能体强化学习训练范式集中式训练分布式执行(ctde); 原文传递

引入通信与探索的多智能体强化学习QMIX算法被引量：7: 6; 作者邓晖奕李勇振尹奇跃《计算机应用》 CSCD 北大核心 2023年第1期202-208,共7页; 非平稳性问题是多智能体环境中深度学习面临的主要挑战之一,它打破了大多数单智能体强化学习算法都遵循的马尔可夫假设,使每个智能体在学习过程中都有可能会陷入由其他智能体所创建的环境而导致无终止的循环。为解决上述问题,研究了中... 展开更多; 关键词多智能体环境深度强化学习中心式训练分布式执行架构好奇心机制智能体通信; 在线阅读下载PDF 职称材料

部分可观测条件下的策略迁移强化学习方法: 7; 作者王忠禹徐晓鹏王东《现代防御技术》北大核心 2024年第2期63-71,共9页; 针对多智能体强化学习算法在部分可观测条件下难以形成有效协同策略的问题,基于集中式训练与分散式执行范式(CTDE)提出一种策略迁移强化学习方法。该方法在全局观测下训练可以探索到良好协同策略的教师模块,在部分可观测条件下,学生模... 展开更多; 关键词多智能体强化学习部分观测策略迁移集中式训练与分散式执行; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于网络学习空间的CTDE创新能力培养模式研究	李媛唐章蔚	《教育信息技术》	2020	0	原文传递
2	特征–奖励对齐的深度强化学习架构设计	火久元黄腾飞	《兰州交通大学学报》	2026	0	在线阅读下载PDF 职称材料
3	MARCS:A Mobile Crowdsensing Framework Based on Data Shapley Value Enabled Multi-Agent Deep Reinforcement Learning	Yiqin Wang Yufeng Wang Jianhua Ma Qun Jin	《Computers, Materials & Continua》	2025	0	在线阅读下载PDF 职称材料
4	基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法	赵知劲朱家晟叶学义尚俊娜	《电子与信息学报》 EI CSCD 北大核心	2022	12	在线阅读下载PDF 职称材料
5	协同空战与多智能体强化学习下的关键问题	谢育星陆屹管聪纪德东	《飞机设计》	2023	2	原文传递
6	引入通信与探索的多智能体强化学习QMIX算法	邓晖奕李勇振尹奇跃	《计算机应用》 CSCD 北大核心	2023	7	在线阅读下载PDF 职称材料
7	部分可观测条件下的策略迁移强化学习方法	王忠禹徐晓鹏王东	《现代防御技术》北大核心	2024	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部