期刊文献+
共找到176篇文章
< 1 2 9 >
每页显示 20 50 100
Customizing Service Path Based on Polymorphic Routing Model in Future Networks
1
作者 Wanwei Huang Chunfeng Du +1 位作者 Jianwei Zhang Changhai Wang 《China Communications》 SCIE CSCD 2019年第7期207-228,共22页
The current Internet has evolved during the last decade to a global provider of diverse applications. However, the underlying structure of routing and addressing has not evolved in the same pace and is somewhat inflex... The current Internet has evolved during the last decade to a global provider of diverse applications. However, the underlying structure of routing and addressing has not evolved in the same pace and is somewhat inflexible. How to provide diverse routing services, support emerging communication paradigms based on limited and definite network resources has become an urgent challenge. This paper investigates the adaptive matching between routing and application through network function decomposition and composition, and proposes a polymorphic routing model to support diverse applications and emerging communication paradigms. The model splits complex routing functions into its constituents, and derives customized routing mechanisms supporting various applications by composing the routing constituents. The derivation process is modeled as a Markov Decision Process (MDP), and a polymorphic derivation algorithm is also proposed to derive customized routing instances for diverse applications. The model enables the network to self-adjust routing services dynamically to adapt to the different requirements of applications, supports coexistence of multiple routing modes and communication paradigms, and provides a feasible solution for the network compatibility and evolvement. We describe the key design and demonstrate the feasibility of polymorphic derivation by simulations. We also present case studies that demonstrate key functionalities the polymorphic routing model enables. 展开更多
关键词 POLYMORPHIC base state ROUTING model MDP REINFORCEMENT learning
在线阅读 下载PDF
Feedback Scheduling of Model-based Networked Control Systems with Flexible Workload 被引量:4
2
作者 Xian-Ming Tang Jin-Shou Yu 《International Journal of Automation and computing》 EI 2008年第4期389-394,共6页
In this paper,a novel control structure called feedback scheduling of model-based networked control systems is proposed to cope with a flexible network load and resource constraints.The state update time is adjusted a... In this paper,a novel control structure called feedback scheduling of model-based networked control systems is proposed to cope with a flexible network load and resource constraints.The state update time is adjusted according to the real-time network congestion situation.State observer is used under the situation where the state of the controlled plant could not be acquired.The stability criterion of the proposed structure is proved with time-varying state update time.On the basis of the stability of the novel system structure,the compromise between the control performance and the network utilization is realized by using feedback scheduler. Examples are provided to show the advantage of the proposed control structure. 展开更多
关键词 model-based networked control system state update time stability criterion feedback scheduling.
在线阅读 下载PDF
Time-triggered State-machine Reliable Software Architecture for Micro Turbine Engine Control 被引量:2
3
作者 ZHANG Qi XU Guoqiang DING Shuiting 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2012年第6期839-845,共7页
Time-triggered (TT) embedded software pattern is well accepted in aerospace industry for its high reliability. Fi-nite-state-machine (FSM) design method is widely used for its high efficiency and predictable behav... Time-triggered (TT) embedded software pattern is well accepted in aerospace industry for its high reliability. Fi-nite-state-machine (FSM) design method is widely used for its high efficiency and predictable behavior. In this paper, the time-triggered and state-machine combination software architecture is implemented for a 25 kg thrust micro turbine engine (MTE) used for unmanned aerial vehicle (UAV) system; also model-based-design development workflow for airworthiness software directive DO-178B is utilized. Experimental results show that time-triggered state-machine software architecture and development method could shorten the system development time, reduce the system test cost and make the turbine engine easily comply with the airworthiness rules. 展开更多
关键词 airworthiness time-triggered finite-state-machine model-based-design turbine engine control
原文传递
Temperature Prediction of Aluminum Alloy Work-Pieces in Aging Furnaces Based on Improved Case-Based Reasoning 被引量:1
4
作者 Qi Zhu Ling Shen +1 位作者 Jianjun He Weihua Gui 《International Journal of Nonferrous Metallurgy》 2017年第4期47-59,共13页
The temperature of aluminum alloy work-pieces in the aging furnace directly affects the quality of aluminum alloy products. Since the temperature of aluminum alloy work-pieces cannot be measured directly, a temperatur... The temperature of aluminum alloy work-pieces in the aging furnace directly affects the quality of aluminum alloy products. Since the temperature of aluminum alloy work-pieces cannot be measured directly, a temperature prediction model based on improved case-based reasoning (CBR) method is established to realize the online measurement of the work-pieces temperature. More specifically, the model is constructed by an advanced case-based reasoning method in which a state transition algorithm (STA) is firstly used to optimize the weights of feature attributes. In other words, STA is utilized to find the suitable attribute weights of the CBR model that can improve the accuracy of the case retrieval process. Finally, the CBR model based on STA (STCBR) was applied to predict the temperature of aluminum alloy work-pieces in the aging furnace. The results of the experiments indicated that the developed model can realize high-accuracy prediction of work-pieces temperature and it has good application prospects in the industrial field. 展开更多
关键词 Prediction model Aluminum Alloy Case-based REASONING state TRANSITION Algorithm AGING FURNACE
暂未订购
Test Selection on Extended Finite State Machines with Provable Guarantees
5
作者 Bo Guo Mahadevan Subramaniam 《Journal of Software Engineering and Applications》 2013年第9期500-510,共11页
Building high confidence regression test suites to validate new system versions is a challenging problem. A modelbased approach to build a regression test suite from a given test suite is described. The generated test... Building high confidence regression test suites to validate new system versions is a challenging problem. A modelbased approach to build a regression test suite from a given test suite is described. The generated test suite includes every test that will traverse a change performed to produce the new version, and consists of only such tests to reduce the testing costs. Finite state machines extended with typed variables (EFSMs) are used to model systems and system changes are mapped to EFSM transition changes adding/deleting/replacing EFSM transitions and states. Tests are a sequence of input and expected output messages with concrete parameter values over the supported data types. An invariant is formulated to characterize tests whose runtime behavior can be accurately predicted by analyzing their descriptions along with the model. Incremental procedures to efficiently evaluate the invariant and to select tests for regression are developed. Overlaps among the test descriptions are exploited to extend the approach to simultaneously select multiple tests to reduce the test selection costs. Effectiveness of the approach is demonstrated by applying it to several protocols, Web services, and model programs extracted from a popular testing benchmark. Our experimental results show that the proposed approach is economical for regression test selection in all these examples. For all these examples, the proposed approach is able to identify all tests exercising changes more efficiently than brute-force symbolic evaluation. 展开更多
关键词 FORMAL Methods model-baseD Software TESTING Regression TESTING Extended FINITE state MACHINES
暂未订购
基于系统模型的三相PWM逆变器复合控制
6
作者 张艳丽 周克亮 +2 位作者 何青青 唐超 王重 《电源学报》 北大核心 2025年第8期52-59,共8页
对于电力电子变换器、电机等控制对象模型明确的系统,提出1个由全状态反馈FSF(full state feedback)控制器和广义积分GI(generalized integrator)相结合的基于系统模型的复合控制策略。相较于比例-积分-微分PID(proportional-integral-d... 对于电力电子变换器、电机等控制对象模型明确的系统,提出1个由全状态反馈FSF(full state feedback)控制器和广义积分GI(generalized integrator)相结合的基于系统模型的复合控制策略。相较于比例-积分-微分PID(proportional-integral-derivative)和比例-谐振PR(proportional-resonant)控制器,此控制策略能够充分利用系统模型的知识与信息,简化控制器的设计并提高系统的控制性能。基于系统的控制对象模型,参考干扰信号模型和FSF闭环系统模型为复合控制提供了1种无需反复试错、简单通用的设计方法。最后将控制策略应用于1台3 kVA的三相PWM逆变器,验证了复合控制策略的有效性。 展开更多
关键词 复合控制 基于系统模型 全状态反馈 广义积分
在线阅读 下载PDF
六基态产品竞争战略模型研究
7
作者 谭旭光 梁昌勇 陈增明 《中国管理科学》 北大核心 2025年第1期335-344,共10页
装备制造业是国家工业实力的重要标志,装备制造业竞争力则取决于制造企业的产品竞争力,制造产品竞争战略是装备制造企业发展的核心基础。本文在分析现有产品战略管理理论及其不足基础上,基于潍柴产品竞争战略演化发展成功实践的内在逻辑... 装备制造业是国家工业实力的重要标志,装备制造业竞争力则取决于制造企业的产品竞争力,制造产品竞争战略是装备制造企业发展的核心基础。本文在分析现有产品战略管理理论及其不足基础上,基于潍柴产品竞争战略演化发展成功实践的内在逻辑,提出了一套全新的战略分析工具——六基态产品竞争战略。该战略的核心思想,是从客户价值偏好出发,将产品与同类市场中的竞争产品(竞品)比较,从技术表现和市场表现两大维度,提出了技术表现六基态和市场表现六基态,并分析这两种基态的影响因素。通过这两种基态分析出产品所处的竞争状态。根据公司的产品发展目标,给出产品战略的优化策略与路径。最后,以潍柴集团WP12产品为案例,进行案例分析验证。该产品竞争战略模型对于装备制造企业的产品战略管理具有重要的借鉴意义和价值。 展开更多
关键词 六基态产品竞争战略 战略管理 理论模型 潍柴
原文传递
循证护理模式在降低血透室内瘘针滑脱风险中的临床应用观察
8
作者 张楣楣 《中外健康》 2025年第3期117-119,共3页
探讨循证护理模式在降低血透室内瘘针滑脱风险中的临床应用效果。选取2024年1月—2025年1月扬州大学附属南通瑞慈医院收治的70例血液透析患者作为研究对象,将其随机分为对照组和观察组,每组35例。对照组实施常规护理模式,观察组实施循... 探讨循证护理模式在降低血透室内瘘针滑脱风险中的临床应用效果。选取2024年1月—2025年1月扬州大学附属南通瑞慈医院收治的70例血液透析患者作为研究对象,将其随机分为对照组和观察组,每组35例。对照组实施常规护理模式,观察组实施循证护理模式,比较两组内瘘针滑脱发生率、心理状态及生活质量。结果显示,观察组患者的内瘘针滑脱总发生率显著低于对照组(P<0.05);护理后,观察组HAMA评分及HAMD评分均显著低于对照组(P<0.05);观察组患者的生活质量显著高于对照组(P<0.05)。研究发现,循证护理模式可有效降低血透室血液透析患者的内瘘针滑脱发生风险,并改善患者的心理状态和生活质量。 展开更多
关键词 血透室 内瘘针滑脱 循证护理模式 心理状态 生活质量
暂未订购
基于可解释Shapelets的锂离子电池健康状态估计
9
作者 李沂洹 郑涵晋 +1 位作者 王玮 王燕霞 《太阳能学报》 北大核心 2025年第12期76-84,共9页
针对基于机器学习的锂离子电池电池健康状态(SOH)估计可解释性差、对数据的依赖性强等问题,提出一种具有可解释性的锂电池SOH估计方法。首先,研究分析随着电池老化,充电电压与首次充电电压之间的距离呈现出较好的趋势性,基于Shapelets... 针对基于机器学习的锂离子电池电池健康状态(SOH)估计可解释性差、对数据的依赖性强等问题,提出一种具有可解释性的锂电池SOH估计方法。首先,研究分析随着电池老化,充电电压与首次充电电压之间的距离呈现出较好的趋势性,基于Shapelets概念提出能够捕捉电池退化趋势的距离度量,进一步通过相关性分析确定Shapelets候选集范围以提高特征提取效率,结合减法平均优化算法(SABO)的BP模型,进行Shapelets的选择。最后,设计基于Shapelets的SABO-BP模型,实现电池SOH的有效估计。在斯坦福大学与麻省理工学院(Stanford-MIT)提供的数据集上对所提方法进行验证,通过使用不同充电策略的电池进行测试,得到电池SOH估计的平均绝对误差(MAE)均维持在0.5%以内,最低可达0.19%;均方根误差(RMSE)也均保持在0.6%以内,最低可达0.26%;决定系数R^(2)保持在0.98以上,最高可达0.995。实验结果表明,所提方法能在数据有限的情况下准确预测锂电池SOH,证实了所提算法的泛化性与实用价值。 展开更多
关键词 锂离子电池 状态估计 神经网络模型 Shapelets 减法平均优化算法
原文传递
心肌梗死患者在急诊救治过程中开展基于护理角色定位模式护理干预的价值
10
作者 王路洁 《智慧健康》 2025年第28期180-182,共3页
目的探究心肌梗死患者在急诊救治过程中开展基于护理角色定位模式护理干预的价值。方法选择80例心肌梗死患者作为研究对象,患者均于2022年1月—2024年6月在本院急诊接受治疗,根据单双数法进行分组,单数分到观察组(n=40例),行基于护理角... 目的探究心肌梗死患者在急诊救治过程中开展基于护理角色定位模式护理干预的价值。方法选择80例心肌梗死患者作为研究对象,患者均于2022年1月—2024年6月在本院急诊接受治疗,根据单双数法进行分组,单数分到观察组(n=40例),行基于护理角色定位模式护理,双数分到对照组(n=40例),行常规急诊急救护理。对两组救治环节用时、心理状态评分、不良事件发生情况进行观察和对比。结果与对照组比较,观察组病情评估时间、心电图采集时间、静脉采血时间均明显较短(P<0.05);护理前,比较组间的SAS、SDS评分,两组差异无统计学意义(P>0.05),护理后,观察组分值更低(P<0.05);比较组间的不良事件发生率,观察组更低(P<0.05)。结论基于护理角色定位模式护理干预应用在心肌梗死患者的急诊救治过程中效果较好,可明显缩短患者的急救时间,稳定其心理状态,防止不良事件的发生。 展开更多
关键词 心肌梗死 急诊救治 基于护理角色定位模式 心理状态
暂未订购
循证医学模式下围术期综合护理对股骨粗隆间骨折患者的影响
11
作者 庞苗 杨改丽 《临床研究》 2025年第5期150-154,共5页
目的探讨循证医学模式下围术期综合护理在股骨粗隆间骨折(IFF)患者中的应用效果。方法选取2021年8月至2024年5月西安北里王中医正骨医院收治的62例IFF患者,按随机数表法分2组,各31例。对照组行常规护理,观察组行循证医学模式下围术期综... 目的探讨循证医学模式下围术期综合护理在股骨粗隆间骨折(IFF)患者中的应用效果。方法选取2021年8月至2024年5月西安北里王中医正骨医院收治的62例IFF患者,按随机数表法分2组,各31例。对照组行常规护理,观察组行循证医学模式下围术期综合护理。对比两组心理状态、疼痛程度、并发症发生率、康复进程、髋关节功能及生活质量。结果护理后,观察组焦虑自评量表(SAS)评分、抑郁自评量表(SDS)评分、视觉模拟评分法(VAS)评分、并发症发生率,低于对照组,差异有统计学意义(P<0.05);胃肠功能恢复时间、下床活动时间、住院时间,短于对照组,差异均有统计学意义(P<0.05);术后3个月的髋关节功能量表(HHS)、健康调查简表(SF-36)评分高于对照组,差异有统计学意义(P<0.05)。结论循证医学模式下围术期综合护理可以减轻IFF患者的不良情绪与疼痛程度,减少并发症的发生,提升髋关节功能与生活质量。 展开更多
关键词 股骨粗隆间骨折 循证医学模式 围术期综合护理 心理状态 疼痛程度
暂未订购
CO_(2)混合工质的气液相平衡预测方法对比研究 被引量:2
12
作者 徐畅 张楠 胡芃 《计量学报》 北大核心 2025年第4期614-620,共7页
为了研究适用于CO_(2)混合工质气液相平衡性质的预测方法的性能和可靠性,建立了3种预测模型(PR-vdW状态方程法、PSRK基团贡献法、COSMO方法)对17种含CO_(2)混合工质的气液相平衡性质进行预测,并与公开发表的实验数据进行对比。计算结果... 为了研究适用于CO_(2)混合工质气液相平衡性质的预测方法的性能和可靠性,建立了3种预测模型(PR-vdW状态方程法、PSRK基团贡献法、COSMO方法)对17种含CO_(2)混合工质的气液相平衡性质进行预测,并与公开发表的实验数据进行对比。计算结果表明,PSRK模型和PR-vdW模型预测精度接近,较优于COSMO模型。对于CO_(2)+HCs类混合工质,COSMO模型的计算误差随着另一工质碳原子数的增加而增大,通过对超额吉布斯自由能的模拟分析了误差来源。最后,使用3种模型结合共沸点判据成功用于CO_(2)+ethane混合工质的共沸点预测。 展开更多
关键词 热物性计量 CO_(2)混合工质 气液相平衡 状态方程 基团贡献法 COSMO模型 超额吉布斯自由能 共沸点
在线阅读 下载PDF
基于PERMA模型的护理干预在PCI术后患者中的应用效果
13
作者 杨美蓉 《智慧健康》 2025年第32期227-230,共4页
目的 观察基于PERMA模型的护理干预在急诊经皮冠状动脉介入治疗(PCI)术后患者中的应用效果。方法 选取2023年8月—2025年1月在本院行急诊PCI术的53例急性心肌梗死患者为研究对象,按照随机数表法将其分为对照组(n=26,行常规护理)与观察组... 目的 观察基于PERMA模型的护理干预在急诊经皮冠状动脉介入治疗(PCI)术后患者中的应用效果。方法 选取2023年8月—2025年1月在本院行急诊PCI术的53例急性心肌梗死患者为研究对象,按照随机数表法将其分为对照组(n=26,行常规护理)与观察组(n=27,行基于PERMA模型的护理干预),比较两组护理效果。结果 护理后,观察组依从率、整体遵医占比均高于对照组(P<0.05);护理后,观察组自我管理水平显著高于对照组(P<0.05);护理后观察组焦虑自评量表(SAS)、抑郁自评量表(SDS)评分均低于对照组(P<0.05)。结论 基于PERMA模型的心理护理是一种值得临床推广的方法,可以提高PCI术后患者的遵医行为和自我管理能力,同时改善患者的情绪状态。 展开更多
关键词 基于PERMA模型的护理干预 急性心肌梗死 心理状态 遵医行为
暂未订购
城市基础空间数据库更新方法研究 被引量:15
14
作者 刘勇 李成名 《测绘科学》 CSCD 北大核心 2006年第4期103-105,共3页
随着空间信息技术的发展和城市对空间信息的日益增长的需求,国内许多城市都开展了基础空间数据的建库工作。城市发展日新月异,对于城市基础空间数据库而言,更新是至关重要的环节,也是城市基础空间数据库建设成败的关键。本文根据目前城... 随着空间信息技术的发展和城市对空间信息的日益增长的需求,国内许多城市都开展了基础空间数据的建库工作。城市发展日新月异,对于城市基础空间数据库而言,更新是至关重要的环节,也是城市基础空间数据库建设成败的关键。本文根据目前城市基础空间数据库建设的情况和对时空数据库的最新研究成果,分析了城市基础空间数据库更新的要求,提出了完整的基于基态修正模型的空间数据库组织和完整的更新流程,最后通过试验数据验证了更新方法的实用性。 展开更多
关键词 城市基础空间数据库 更新 时空数据库 基态修正模型
在线阅读 下载PDF
基于动态基态方法的基态修正时空数据模型 被引量:8
15
作者 刘睿 周晓光 李晓蕾 《测绘科学》 CSCD 北大核心 2009年第1期130-132,224,共4页
本文在分析现有时空数据基态修正模型的基础上,提出一种基于动态基态的时空数据基态修正方法,引入了动态基态数据与动态数据存储区域的概念。解决了重复检索历史数据以及对时间段的检索效率低下的问题,具有基态数据占用空间较小,数据检... 本文在分析现有时空数据基态修正模型的基础上,提出一种基于动态基态的时空数据基态修正方法,引入了动态基态数据与动态数据存储区域的概念。解决了重复检索历史数据以及对时间段的检索效率低下的问题,具有基态数据占用空间较小,数据检索速度快的特点,且当历史年代久远时,存储空间最小。 展开更多
关键词 时态GIS 动态基态 时空数据模型 基态修正
原文传递
面向土地利用调查的时空数据库构建技术 被引量:7
16
作者 郜允兵 潘瑜春 +3 位作者 高秉博 张晓东 郜俊霞 张翼鹏 《测绘科学》 CSCD 北大核心 2015年第5期49-54,88,共7页
为了满足"一调""二调"等不同时期土地利用变化数据管理与分析的需要,文章在分析时态数据库构建中存在的问题的基础上,引入变更事件、重建事件和多基态,建立了基于事件组的多基态修正模型,实现了"一调"&qu... 为了满足"一调""二调"等不同时期土地利用变化数据管理与分析的需要,文章在分析时态数据库构建中存在的问题的基础上,引入变更事件、重建事件和多基态,建立了基于事件组的多基态修正模型,实现了"一调""二调"土地利用数据一体化存储;针对"一调""二调"空间数据不一致的几何重建和语义转换问题,提出通过重建事件表实现重建前后要素归档及查询;同时,针对土地利用数据管理的现状以及数据形态,提出了土地利用变更增量提取、时态拓扑关系构建的方法,实现了土地利用时空数据库的构建。最后,以武汉市汉南区数据为例开发了原型系统,实验结果表明本文提出的模型、方法具有较强的实用性。 展开更多
关键词 土地利用 基于事件的基态修正模型 时态拓扑关系 时空数据库
原文传递
改进的时空数据基态修正方法 被引量:30
17
作者 张保钢 朱重光 王润生 《测绘学报》 EI CSCD 北大核心 2005年第3期252-256,共5页
分析已有基于基态修正模型的5种数据存储方式,在此基础上提出多基态多级差文件修正方法、多基态单级差文件修正方法。与已有方法相比,提出的两种方法具有节省存储空间,历史数据恢复快而且不受历史久远影响的特点。多基态多级差文件修正... 分析已有基于基态修正模型的5种数据存储方式,在此基础上提出多基态多级差文件修正方法、多基态单级差文件修正方法。与已有方法相比,提出的两种方法具有节省存储空间,历史数据恢复快而且不受历史久远影响的特点。多基态多级差文件修正方法与多基态单级差文件修正方法相比没有增加存储空间,但提高了数据恢复速度。讨论基态距阈值的确定方法,认为基态距阈值与时空数据库每次更新的目标数相关,更新目标数大时基态距阈值较小,目标数小时基态距阈值相对较大。 展开更多
关键词 地理信息系统 时空数据模型 基态 差文件 修正
在线阅读 下载PDF
对象关系型GIS中改进基态修正时空数据模型的实现 被引量:12
18
作者 程昌秀 周成虎 陆锋 《中国图象图形学报(A辑)》 CSCD 北大核心 2003年第6期697-702,共6页
通过对几种典型时空数据模型特性的分析 ,提出了一种改进的基态修正模型 .此模型以空间数据的现状作为基态 ,从而避免了系统频繁载入现状数据的开销 ;同时 ,在对象关系型 GIS的支持下 ,该模型利用关系运算来实现“非起始”状态的随机整... 通过对几种典型时空数据模型特性的分析 ,提出了一种改进的基态修正模型 .此模型以空间数据的现状作为基态 ,从而避免了系统频繁载入现状数据的开销 ;同时 ,在对象关系型 GIS的支持下 ,该模型利用关系运算来实现“非起始”状态的随机整合 ,因而提高了系统的执行效率 .最后还从“时空快照恢复”、“时态拓扑分析”和“空间对象的历史沿革”等 3个方面阐述了此模型在对象关系型 GIS中的实现方法 ,并以大兴县的村边界变更为例给出了所提出模型在 Geo Media3.0环境中的具体应用过程 .经验证 ,此模型在对象关系型 展开更多
关键词 GIS 地理信息系统 数据存储 数据模型 时态拓扑关系
在线阅读 下载PDF
基态修正时空数据模型的进一步扩展 被引量:18
19
作者 余志文 张利田 邬永宏 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第1期100-103,共4页
引入超图模型的部分理论 ,建立了基于基态修正的面向对象时空数据模型 ,很好地解决了时空对象的空间关系和时空对象之间的关系。提出了时空对象的索引结构 ,并引入基态距因子和等比系数 ,从而大大提高了查询效率 ,并缩短了查询时间。
关键词 数据模型 超图模型 基态 索引
在线阅读 下载PDF
模型化强化学习研究综述 被引量:15
20
作者 赵婷婷 孔乐 +2 位作者 韩雅杰 任德华 陈亚瑞 《计算机科学与探索》 CSCD 北大核心 2020年第6期918-927,共10页
深度强化学习(DRL)作为机器学习的重要分支,在AlphaGo击败人类后受到了广泛关注。DRL以一种试错机制与环境进行交互,并通过最大化累积奖赏最终得到最优策略。强化学习可分为无模型强化学习和模型化强化学习。无模型强化学习方法的训练... 深度强化学习(DRL)作为机器学习的重要分支,在AlphaGo击败人类后受到了广泛关注。DRL以一种试错机制与环境进行交互,并通过最大化累积奖赏最终得到最优策略。强化学习可分为无模型强化学习和模型化强化学习。无模型强化学习方法的训练过程需要大量样本,当采样预算不足,无法收集大量样本时,很难达到预期效果。然而,模型化强化学习可以充分利用环境模型,降低真实样本需求量,在一定程度上提高样本效率。将以模型化强化学习为核心,介绍该领域的研究现状,分析其经典算法,并探讨未来的发展趋势和应用前景。 展开更多
关键词 深度强化学习(DRL) 模型化强化学习 状态转移模型 样本利用率
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部