检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

高级检索
期刊导航

共找到280篇文章

< 1 2 … 14 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

	题名	作者	出处	发文年	被引量	操作
1	Variable reward function-driven strategies for impulsive orbital attack-defense games under multiple constraints and victory conditions	Liran Zhao Sihan Xu Qinbo Sun Zhaohui Dang	《Defence Technology(防务技术)》	2025	0	在线阅读下载PDF 职称材料
2	Reward Function Design Method for Long Episode Pursuit Tasks Under Polar Coordinate in Multi-Agent Reinforcement Learning	DONG Yubo CUI Tao ZHOU Yufan SONG Xun ZHU Yue DONG Peng	《Journal of Shanghai Jiaotong university(Science)》 EI	2024	0	原文传递
3	A Study on the Addictive Feature of Nonsuicidal Self-Injury in Adolescents With Depression Disorders and Its Correlation With Serum Beta-Endorphin Concentration and Neural Reward Responsiveness	Jie Li Xiaogang Zhu Peiwen Zhang Yuxing Wang Jian Zhong Yiming Wang Lixia Yang	《iRADIOLOGY》	2025	0	暂未订购
4	DDPG优化算法的改进型自抗扰风电机组桨距角控制	徐晓宁范召强周雪松陶珑问虎龙杨风霞	《太阳能学报》北大核心	2026	0	原文传递
5	改进DDPG的磁浮控制研究	张振利宋成林汪永壮杨杰	《工程科学学报》北大核心	2026	0	在线阅读下载PDF 职称材料
6	基于SAC改进的机器人路径规划算法	姚博远黄志勇	《计算机工程与设计》北大核心	2026	0	在线阅读下载PDF 职称材料
7	流奖赏引导的基于模型学习的策略优化方法	王义钟珊龚声蓉	《计算机工程与设计》北大核心	2026	0	在线阅读下载PDF 职称材料
8	基于规则与改进wall-following的多智能体协同围捕策略	王佳旭冀承慧胡创业丁男	《计算机仿真》	2026	0	在线阅读下载PDF 职称材料
9	基于深度强化学习智能制导的研究思考	郭威常远程芳王清云王冲	《现代防御技术》北大核心	2026	0	在线阅读下载PDF 职称材料
10	中国草畜平衡制度的结构优化与体系完善	陈宝山姜贺天麻芦苇丁梦茹	《自然资源学报》北大核心	2026	0	原文传递
11	基于改进深度强化学习算法的电网侧储能系统调峰控制策略	杨瑞锋韩昱	《储能科学与技术》北大核心	2026	0	在线阅读下载PDF 职称材料
12	基于复合回报函数的空战指向控制策略研究	徐俊邓向阳付宇鹏岳圣智宋婧菡林远山	《现代电子技术》北大核心	2026	0	在线阅读下载PDF 职称材料
13	ACR-MLM:a privacy-preserving framework for anonymous and confidential rewarding in blockchain-based multi-level marketing	Saeed Banaeian Far Azadeh Imani Rad Maryam Rajabzadeh Asaar	《Data Science and Management》	2022	0	在线阅读下载PDF 职称材料
14	基于对抗强化学习的无人机逃离路径规划方法	黄湘松王梦宇潘大鹏	《航空学报》北大核心	2025	1	原文传递
15	基于深度强化学习的游戏智能引导算法	白天吕璐瑶李储何加亮	《吉林大学学报(理学版)》北大核心	2025	2	在线阅读下载PDF 职称材料
16	如何实现真正的智能?——关于智能体中事实性计算与价值性算计深度融合的思考	刘伟龙擎天马楠	《电子科技大学学报(社科版)》	2025	1	在线阅读下载PDF 职称材料
17	基于功能磁共振技术探讨首发抑郁症奖赏网络功能异常研究	肖雪田静孙绪任渝棠徐辉余学李明山孙继飞侯小兵	《精神医学杂志》	2025	0	暂未订购
18	基于多代理深度强化学习的战术无线网络安全路由算法研究	谢英辉刘亮	《传感技术学报》北大核心	2025	0	在线阅读下载PDF 职称材料
19	基于改进深度强化学习的交通信号灯控制	韦敏蔡常健	《计算机工程与设计》北大核心	2025	0	在线阅读下载PDF 职称材料
20	基于人工势场的防疫机器人改进近端策略优化算法	伍锡如沈可扬	《智能系统学报》北大核心	2025	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部