检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于时间尺度分离理论的空战深度强化学习分层算法: 1; 作者谭泰江泰民 +3 位作者黎博文李杰李辉化晨昊《工程科学与技术》北大核心 2026年第2期69-83,共15页; 六自由度无人机空战是一个具有复杂多维状态、耦合连续动作和高度非线性动力学的挑战性场景。深度强化学习不需要标签数据,仅通过与环境交互优化策略,在自主空战机动决策中的应用受到广泛关注。然而,高维度的状态和动作空间导致端到端... 展开更多; 关键词时间尺度分离比例-积分-微分近端策略优化两阶段训练两阶段时间尺度状态分离近端策略优化; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于时间尺度分离理论的空战深度强化学习分层算法	谭泰江泰民黎博文李杰李辉化晨昊	《工程科学与技术》北大核心	2026	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部