期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
面向随机并发任务的杀伤网建模与最优控制方法 被引量:14
1
作者 吴克宇 冯旸赫 +1 位作者 黄金才 刘忠 《指挥与控制学报》 CSCD 2023年第4期487-494,共8页
围绕随机并发任务场景,开展杀伤网建模和最优控制方法研究,提出了基于随机受控Petri网模型的杀伤网形式化建模方法,用以描述随机并发目标打击任务下的杀伤网的运行逻辑,以及在不同杀伤链选择动作下杀伤网状态的动态变化过程;针对最优杀... 围绕随机并发任务场景,开展杀伤网建模和最优控制方法研究,提出了基于随机受控Petri网模型的杀伤网形式化建模方法,用以描述随机并发目标打击任务下的杀伤网的运行逻辑,以及在不同杀伤链选择动作下杀伤网状态的动态变化过程;针对最优杀伤链选择策略求解问题,提出了基于马尔科夫决策过程的最优策略构造范式和基于深度强化学习的最优策略求解方法.研究结果可为复杂对抗场景下的作战体系建模分析和优化控制的相关工作提供理论模型基础. 展开更多
关键词 杀伤网 建模分析 优化控制 PETRI 强化学习
在线阅读 下载PDF
基于时间差分误差的离线强化学习采样策略 被引量:5
2
作者 张龙飞 冯旸赫 +3 位作者 梁星星 刘世旋 程光权 黄金才 《工程科学学报》 EI CSCD 北大核心 2023年第12期2118-2128,共11页
离线强化学习利用预先收集的专家数据或其他经验数据,在不与环境交互的情况下离线学习动作策略.与在线强化学习相比,离线强化学习具有样本效率高、交互成本低的优势.强化学习中通常使用Q值估计函数或Q值估计网络表示状态-动作的价值.因... 离线强化学习利用预先收集的专家数据或其他经验数据,在不与环境交互的情况下离线学习动作策略.与在线强化学习相比,离线强化学习具有样本效率高、交互成本低的优势.强化学习中通常使用Q值估计函数或Q值估计网络表示状态-动作的价值.因无法通过与环境交互及时修正Q值估计误差,离线强化学习往往面临外推误差严重、样本利用率低的问题.为此,提出基于时间差分误差的离线强化学习采样方法,使用时间差分误差作为样本优先采样的优先度度量,通过使用优先采样和标准采样相结合的采样方式,提升离线强化学习的采样效率并缓解分布外误差问题.同时,在使用双Q值估计网络的基础上,根据目标网络的不同计算方法,比较了3种时间差分误差度量所对应的算法的性能.此外,为消除因使用优先经验回放机制的偏好采样产生的训练偏差,使用了重要性采样机制.通过在强化学习公测数据集—深度数据驱动强化学习数据集上与已有研究成果相比,基于时间差分误差的离线强化学习采样方法在最终性能、数据效率和训练稳定性上均有更好的表现.消融实验表明,优先采样和标准采样相结合的采样方式对算法性能的发挥至关重要,同时,使用最小化双目标Q值估计的时间差分误差优先度度量所对应的算法,在多个任务上具有最优的性能.基于时间差分误差的离线强化学习采样方法可与任何基于Q值估计的离线强化学习方法结合,具有性能稳定、实现简单、可扩展性强的特点. 展开更多
关键词 离线 强化学习 采样策略 经验回放 时间差分误差
在线阅读 下载PDF
一种基于少样本数据的在线主动学习与分类方法 被引量:2
3
作者 杨静 赵文仓 +2 位作者 徐越 冯旸赫 黄金才 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第5期757-766,共10页
深度学习技术往往需要大量的标记训练样本,然而真实环境中获得大量标记样本的代价昂贵,甚至难以获得.提出一种新的深度主动识别框架,借鉴人类逐步学习并获取新知识的认知过程,在基于少量样本分析模型认知错误的基础上首先定义认知错误转... 深度学习技术往往需要大量的标记训练样本,然而真实环境中获得大量标记样本的代价昂贵,甚至难以获得.提出一种新的深度主动识别框架,借鉴人类逐步学习并获取新知识的认知过程,在基于少量样本分析模型认知错误的基础上首先定义认知错误转化,得到相应的知识来主动增强模型的认知信息.基于认知知识,选取敏感样本对模型进行在线微调,同时为了避免遗忘先前学习的知识选取先前的训练样本作为刷新样本.在通用数据集上的实验表明,敏感样本有利于提高目标识别能力,提出的认知学习机制能有效提高深度模型的性能;认知信息的特征化能有效抑制其他样本对模型认知的干扰,在线训练方法能明显节省大量训练时间.提供了一个有效的认知学习在少量数据样本情境中的应用. 展开更多
关键词 深度学习 主动认知 感知学习 少量样本 感知信息
在线阅读 下载PDF
基于兵棋推演的空战编组对抗智能决策方法 被引量:1
4
作者 陈晓轩 冯旸赫 +2 位作者 黄金才 刘忠 徐越 《指挥与控制学报》 CSCD 北大核心 2024年第2期213-219,共7页
基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大... 基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大时,算法收敛慢,且对仿真平台有较高的要求。针对上述问题,提出了一种融合知识数据和强化学习的空战编组对抗智能决策方法,该决策方法的输入是战场融合态势,使用分层决策框架控制算子选择并执行任务,上层包含使用专家知识驱动的动作选择器,下层包含使用专家知识和作战规则细化的避弹动作执行器、侦察动作执行器和使用强化学习算法控制的打击动作执行器。最后基于典型作战场景进行实验,验证了该方法的可行性和实用性,且具有建模准确、训练高效的优点。 展开更多
关键词 空战编组对抗 多算子的协作与控制 多智能体深度强化学习算法 分层决策模型
在线阅读 下载PDF
任务级兵棋智能决策技术框架设计与关键问题分析 被引量:3
5
作者 张驭龙 范长俊 +2 位作者 冯旸赫 张龙飞 刘忠 《指挥与控制学报》 CSCD 北大核心 2024年第1期19-25,共7页
在梳理总结当前兵棋智能决策方法研究现状的基础上,明确指出了开展任务级兵棋智能决策研究的8项难点,从博弈活动中智能体定位、信息流转与知识流转等问题出发,设计给出了任务级兵棋智能博弈框架、智能策略生成优化框架以及多智能体策略... 在梳理总结当前兵棋智能决策方法研究现状的基础上,明确指出了开展任务级兵棋智能决策研究的8项难点,从博弈活动中智能体定位、信息流转与知识流转等问题出发,设计给出了任务级兵棋智能博弈框架、智能策略生成优化框架以及多智能体策略协同演进框架,进而分析了高维度下长时序的态势信息数据综合、异步策略分布式学习优化、基于语义模板的任务指令生成、多智能体训练营博弈调度等4项关键问题,并给出了基本解决方案,点明了开展任务级兵棋智能决策研究的技术要点与基本路线,为后续任务级兵棋智能体设计提供了有益参考。 展开更多
关键词 兵棋 博弈 决策 智能 强化学习
在线阅读 下载PDF
面向多类别分类问题的子抽样主动学习方法 被引量:2
6
作者 施伟 黄红蓝 +1 位作者 冯旸赫 刘忠 《系统工程与电子技术》 EI CSCD 北大核心 2021年第3期700-708,共9页
由于传统主动学习方法的计算量随着问题规模的增大呈指数增长,因此很难应用于大规模多类数据分类任务中。为解决该问题,设计了一种基于子抽样的主动学习(subsampling-based active learning,SBAL)算法。该算法将无监督聚类算法与传统主... 由于传统主动学习方法的计算量随着问题规模的增大呈指数增长,因此很难应用于大规模多类数据分类任务中。为解决该问题,设计了一种基于子抽样的主动学习(subsampling-based active learning,SBAL)算法。该算法将无监督聚类算法与传统主动学习方法整合,在二者之间增加了子抽样操作,该操作能够显著降低算法的时间复杂度,在保证实验准确率的基础上减少实验耗时,从而更加高效地处理大规模数据集的分类问题。实验结果显示,采用SBAL算法的实验性能优于传统主动学习算法,证明了所提算法可以突破传统主动学习方法不能处理大规模数据集多类别分类问题的局限性。 展开更多
关键词 子抽样 主动学习 无监督聚类 多类别分类问题
在线阅读 下载PDF
军事人工智能导论课程建设思考 被引量:5
7
作者 冯旸赫 王涛 +1 位作者 黄金才 刘忠 《科教文汇》 2018年第32期62-65,共4页
近些年随着数据的积累、计算能力的提升和算法的创新,人工智能技术正在以极快的速度深刻影响着各个行业的发展。军事智能化是继信息化后的重大变革,武器装备和指挥控制能否实现智能化是军队发展的重要战略问题。虽然人工智能技术的教学... 近些年随着数据的积累、计算能力的提升和算法的创新,人工智能技术正在以极快的速度深刻影响着各个行业的发展。军事智能化是继信息化后的重大变革,武器装备和指挥控制能否实现智能化是军队发展的重要战略问题。虽然人工智能技术的教学已有较长时间的实践和积累,然而这些课程往往侧重于通用技术的介绍,很难紧扣军事应用,课程内容距离战斗力提升这一目标存在差距。本文面向联合作战保障人才的培养需求,构建了军事人工智能导论课程的教学内容,提出了面向军事应用的人工智能教育模式建议,供相关人员参考。 展开更多
关键词 军队院校 人工智能 教学方案
在线阅读 下载PDF
Sequential quadratic programming-based non-cooperative target distributed hybrid processing optimization method 被引量:3
8
作者 SONG Xiaocheng WANG Jiangtao +3 位作者 WANG Jun SUN Liang feng yanghe LI Zhi 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2023年第1期129-140,共12页
The distributed hybrid processing optimization problem of non-cooperative targets is an important research direction for future networked air-defense and anti-missile firepower systems. In this paper, the air-defense ... The distributed hybrid processing optimization problem of non-cooperative targets is an important research direction for future networked air-defense and anti-missile firepower systems. In this paper, the air-defense anti-missile targets defense problem is abstracted as a nonconvex constrained combinatorial optimization problem with the optimization objective of maximizing the degree of contribution of the processing scheme to non-cooperative targets, and the constraints mainly consider geographical conditions and anti-missile equipment resources. The grid discretization concept is used to partition the defense area into network nodes, and the overall defense strategy scheme is described as a nonlinear programming problem to solve the minimum defense cost within the maximum defense capability of the defense system network. In the solution of the minimum defense cost problem, the processing scheme, equipment coverage capability, constraints and node cost requirements are characterized, then a nonlinear mathematical model of the non-cooperative target distributed hybrid processing optimization problem is established, and a local optimal solution based on the sequential quadratic programming algorithm is constructed, and the optimal firepower processing scheme is given by using the sequential quadratic programming method containing non-convex quadratic equations and inequality constraints. Finally, the effectiveness of the proposed method is verified by simulation examples. 展开更多
关键词 non-cooperative target distributed hybrid processing multiple constraint minimum defense cost sequential quadratic programming
在线阅读 下载PDF
基于人类先验知识的强化学习综述 被引量:3
9
作者 国子婧 冯旸赫 +1 位作者 姚晨蝶 许乃夫 《计算机应用》 CSCD 北大核心 2021年第S02期1-4,共4页
强化学习通过智能体与环境互动以实现预期目标最大化,通常被用于解决关于连续决策的任务规划问题。当前任务规划主要使用规则或者运筹方法进行求解。这类方法的时间复杂度和空间复杂度随问题规模增长呈指数级增长,难以求解大规模问题;... 强化学习通过智能体与环境互动以实现预期目标最大化,通常被用于解决关于连续决策的任务规划问题。当前任务规划主要使用规则或者运筹方法进行求解。这类方法的时间复杂度和空间复杂度随问题规模增长呈指数级增长,难以求解大规模问题;并且对于动态任务规划问题也束手无策,只能求解静态的确定性问题。强化学习中的值函数近似等近似算法解决了这类方法的"维度灾难"问题,同时强化学习在智能体与环境的交互过程中加入随机因素,使其广泛应用于解决动态与随机性问题。然而强化学习需要智能体不断与环境交互来得到最优策略,当状态空间较大时,需要更多的采样和探索对策略进行梯度更新,收敛速度较慢,难以在实际中应用。人类在学习时利用先验知识保证了学习的快速开始,并减少了问题的探索时间,因此研究人类先验知识和强化学习的意义重大,可有效减少智能体对环境的采样和探索,帮助智能体更快地找到最优策略。基于人类先验知识与智能体交互的时间节点进行分类,对整合人类先验知识到强化学习的方法进行综述,最后对其发展方向进行展望。 展开更多
关键词 强化学习 人类先验知识 人类反馈 人类建议 人类示范
在线阅读 下载PDF
针对视频分类模型的共轭梯度攻击
10
作者 戴扬 冯旸赫 黄金才 《工程科学学报》 EI CSCD 北大核心 2024年第9期1630-1637,共8页
基于深度神经网络的视频分类模型目前应用广泛,然而最近的研究表明,深度神经网络极易受到对抗样本的欺骗.这类对抗样本含有对人类来说难以察觉的噪声,而其存在对深度神经网络的安全性构成严重威胁.尽管目前已经针对图像的对抗样本产生... 基于深度神经网络的视频分类模型目前应用广泛,然而最近的研究表明,深度神经网络极易受到对抗样本的欺骗.这类对抗样本含有对人类来说难以察觉的噪声,而其存在对深度神经网络的安全性构成严重威胁.尽管目前已经针对图像的对抗样本产生了相当多的研究,针对视频的对抗攻击仍存在复杂性.通常的对抗攻击采用快速梯度符号方法(FGSM),然而该方法生成的对抗样本攻击成功率低,以及易被察觉,隐蔽性不足.为解决这两个问题,本文受非线性共轭梯度下降法(FR–CG)启发,提出一种针对视频模型的非线性共轭梯度攻击方法.该方法通过松弛约束条件,令搜索步长满足强Wolfe条件,保证了每次迭代的搜索方向与目标函数损失值上升的方向一致.针对UCF-101的实验结果表明,在扰动上界设置为3/255时,本文攻击方法具有91%的攻击成功率.同时本文方法在各个扰动上界下的攻击成功率均比FGSM方法高,且具有更强的隐蔽性,在攻击成功率与运行时间之间实现了良好的平衡. 展开更多
关键词 对抗样本 深度学习安全性 视频攻击 白盒攻击 共轭梯度算法
在线阅读 下载PDF
关于目标工程专业人才培养的思考
11
作者 胡星辰 陈超 +2 位作者 吴克宇 冯旸赫 黄金才 《科教文汇》 2020年第33期88-90,共3页
新一轮的国防和军队改革需要培养德才兼备的高素质、专业化人才,从而为适应新军事革命发展趋势的联合火力打击行动提供智力保障。其中,围绕目标的信息获取处理、分析研判等一系列工作,急须熟练掌握相关专业领域知识和技能的新型军事人才... 新一轮的国防和军队改革需要培养德才兼备的高素质、专业化人才,从而为适应新军事革命发展趋势的联合火力打击行动提供智力保障。其中,围绕目标的信息获取处理、分析研判等一系列工作,急须熟练掌握相关专业领域知识和技能的新型军事人才,目标工程专业应运而生。该文首先分析了面向联合作战保障的目标工程专业建设需求,通过建立需求能力素质模型,研究了该专业的培养方案设计和课程教学规划,随后进一步分析了目标工程专业本科人才培养的关键问题。 展开更多
关键词 军队院校 目标工程 人才培养 课程体系
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部