检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

高级检索
期刊导航

共找到274篇文章

< 1 2 … 14 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

	题名	作者	出处	发文年	被引量	操作
1	Variable reward function-driven strategies for impulsive orbital attack-defense games under multiple constraints and victory conditions	Liran Zhao Sihan Xu Qinbo Sun Zhaohui Dang	《Defence Technology(防务技术)》	2025	0	在线阅读下载PDF 职称材料
2	Reward Function Design Method for Long Episode Pursuit Tasks Under Polar Coordinate in Multi-Agent Reinforcement Learning	DONG Yubo CUI Tao ZHOU Yufan SONG Xun ZHU Yue DONG Peng	《Journal of Shanghai Jiaotong university(Science)》 EI	2024	0	原文传递
3	DDPG优化算法的改进型自抗扰风电机组桨距角控制	徐晓宁范召强周雪松陶珑问虎龙杨风霞	《太阳能学报》北大核心	2026	0	原文传递
4	基于SAC3Q-HDM的强化学习机器人路径规划	李德权熊婉	《系统仿真学报》北大核心	2026	0	原文传递
5	改进DDPG的磁浮控制研究	张振利宋成林汪永壮杨杰	《工程科学学报》北大核心	2026	0	在线阅读下载PDF 职称材料
6	流奖赏引导的基于模型学习的策略优化方法	王义钟珊龚声蓉	《计算机工程与设计》北大核心	2026	0	在线阅读下载PDF 职称材料
7	基于SAC改进的机器人路径规划算法	姚博远黄志勇	《计算机工程与设计》北大核心	2026	0	在线阅读下载PDF 职称材料
8	男性甲基苯丙胺依赖者奖赏功能的行为表现及前额叶激活特征	李沙邓晓琴胥国华陈俊琦彭文程孙姣王瑜王成黄伟郑松波	《中国心理卫生杂志》北大核心	2026	0	暂未订购
9	基于规则与改进wall-following的多智能体协同围捕策略	王佳旭冀承慧胡创业丁男	《计算机仿真》	2026	0	在线阅读下载PDF 职称材料
10	基于深度强化学习的永磁同步电机控制算法研究	范慧妍王爽	《电机与控制应用》	2026	0	在线阅读下载PDF 职称材料
11	基于深度强化学习智能制导的研究思考	郭威常远程芳王清云王冲	《现代防御技术》北大核心	2026	0	在线阅读下载PDF 职称材料
12	基于改进深度强化学习算法的电网侧储能系统调峰控制策略	杨瑞锋韩昱	《储能科学与技术》北大核心	2026	0	在线阅读下载PDF 职称材料
13	基于复合回报函数的空战指向控制策略研究	徐俊邓向阳付宇鹏岳圣智宋婧菡林远山	《现代电子技术》北大核心	2026	0	在线阅读下载PDF 职称材料
14	基于随机集成网络-TD3的四足机器人步态学习方法	朱晓庆朱晓宇阮晓钢南博睿毕兰越	《北京工业大学学报》北大核心	2026	0	在线阅读下载PDF 职称材料
15	中国草畜平衡制度的结构优化与体系完善	陈宝山姜贺天麻芦苇丁梦茹	《自然资源学报》北大核心	2026	0	原文传递
16	基于对抗强化学习的无人机逃离路径规划方法	黄湘松王梦宇潘大鹏	《航空学报》北大核心	2025	1	原文传递
17	基于深度强化学习的游戏智能引导算法	白天吕璐瑶李储何加亮	《吉林大学学报(理学版)》北大核心	2025	2	在线阅读下载PDF 职称材料
18	如何实现真正的智能?——关于智能体中事实性计算与价值性算计深度融合的思考	刘伟龙擎天马楠	《电子科技大学学报(社科版)》	2025	1	在线阅读下载PDF 职称材料
19	基于改进深度强化学习的交通信号灯控制	韦敏蔡常健	《计算机工程与设计》北大核心	2025	0	在线阅读下载PDF 职称材料
20	基于人工势场的防疫机器人改进近端策略优化算法	伍锡如沈可扬	《智能系统学报》北大核心	2025	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部