期刊文献+
共找到395篇文章
< 1 2 20 >
每页显示 20 50 100
Convergence of Markov decision processes with constraints and state-action dependent discount factors 被引量:2
1
作者 Xiao Wu Xianping Guo 《Science China Mathematics》 SCIE CSCD 2020年第1期167-182,共16页
This paper is concerned with the convergence of a sequence of discrete-time Markov decision processes(DTMDPs)with constraints,state-action dependent discount factors,and possibly unbounded costs.Using the convex analy... This paper is concerned with the convergence of a sequence of discrete-time Markov decision processes(DTMDPs)with constraints,state-action dependent discount factors,and possibly unbounded costs.Using the convex analytic approach under mild conditions,we prove that the optimal values and optimal policies of the original DTMDPs converge to those of the"limit"one.Furthermore,we show that any countablestate DTMDP can be approximated by a sequence of finite-state DTMDPs,which are constructed using the truncation technique.Finally,we illustrate the approximation by solving a controlled queueing system numerically,and give the corresponding error bound of the approximation. 展开更多
关键词 discrete-time Markov decision processes state-action dependent discount factors unbounded costs CONVERGENCE
原文传递
基于组合赋权和改进TOPSIS的绝缘纸老化状态评估 被引量:3
2
作者 耿江海 祝建昊 +4 位作者 姚嘉欣 王平 汪鑫宇 高树国 俞华 《绝缘材料》 北大核心 2025年第2期129-138,共10页
为实现变压器绝缘纸老化状态的准确评估,提出一种基于组合赋权和改进TOPSIS的绝缘纸老化状态评估方法。首先,为克服单一特征量评估的不足,选取聚合度、抗张强度、断裂伸长率、击穿电压和介质损耗因数作为老化特征量,建立绝缘纸老化状态... 为实现变压器绝缘纸老化状态的准确评估,提出一种基于组合赋权和改进TOPSIS的绝缘纸老化状态评估方法。首先,为克服单一特征量评估的不足,选取聚合度、抗张强度、断裂伸长率、击穿电压和介质损耗因数作为老化特征量,建立绝缘纸老化状态评价体系;其次,利用组合赋权模型计算特征量的组合权重值;最后,提出一种改进TOPSIS模型,构建欧氏-灰色关联距离测度,利用改进TOPSIS模型计算贴近度,并设置贴近度区间对绝缘纸的老化状态进行分级评估。结果表明:基于组合赋权和改进TOPSIS的绝缘纸老化状态评估方法既考虑了专家主观经验赋权,又利用特征量数据自身特征进行了权重修正,赋权更加科学合理;同时弥补了传统TOPSIS模型的距离判据缺陷,使计算得到的贴近度更加合理;通过电-热-力联合老化试验实例验证了该评估方法能准确、有效地判断绝缘纸的老化状态,且通过设置贴近度区间可以实现老化状态的分级评估。 展开更多
关键词 绝缘纸 电-热-力-联合作用 组合赋权 改进TOPSIS 状态评估
在线阅读 下载PDF
基于多通道特征融合的人体动作识别方法
3
作者 陶志勇 郭希俊 +2 位作者 任晓奎 刘影 王泽民 《工程科学与技术》 北大核心 2025年第1期68-79,共12页
现阶段,深度学习已在基于WiFi的人体动作识别领域得到广泛应用且取得显著成果。然而,在利用多输入、多输出(MIMO)系统强大的空间分集特性进行动作识别时,受多径效应影响,获得信道状态信息(CSI)存在对相同动作的特征描述存在差异、不同... 现阶段,深度学习已在基于WiFi的人体动作识别领域得到广泛应用且取得显著成果。然而,在利用多输入、多输出(MIMO)系统强大的空间分集特性进行动作识别时,受多径效应影响,获得信道状态信息(CSI)存在对相同动作的特征描述存在差异、不同动作的特征描述存在类似、特征提取不完整和动作分类复杂的问题。为解决上述问题,本文提出一种基于双重注意力机制和多通道、多尺度的时间卷积网络的动作识别方法。首先,根据MIMO系统的空间分集特性,构建多通道信息提取模型,从各个天线接收到的信道中提取出有关动作的特性信息。然后,设计多尺度的统合机制,强化同一动作在不同通道接收数据的表征,通过整合不同尺度的动作特征,增强对动作的表征能力。再次,采用特征图融合注意力机制和特征通道注意力机制对各通道的动作特征进行聚合。注意力机制能有效地找出对最终动作识别有重要贡献的特征,使模型可以更好地进行特征聚焦。与此同时,将时间卷积网络应用于特征处理过程,使不同时间步的动作特征间的长期依赖关系得以维持,增加对复杂和连续动作的识别能力。最终,利用全局平均池化层(GAP)将各通道的特征图与动作分类器进行连接,以便多通道的动作特性能有效聚合在一起,进一步提高动作识别的精度。本文提出的模型在公共数据集7种动作测试中,实现98.72%的平均准确率。同时在自行搭建的实验室、教室和走廊等真实环境下进行测试时,10种不同的动作分别获得97.94%、97.28%和95.66%的识别准确率。实验结果充分证明了本文所提出的基于WiFi的人体动作识别模型在不同环境的有效性和优越性。 展开更多
关键词 动作识别 深度学习 信道状态信息 TCN 注意力
在线阅读 下载PDF
污染场地修复义务的继受
4
作者 刘静 《中国土地科学》 北大核心 2025年第4期49-57,共9页
研究目的:研究污染场地修复义务的继受问题,以期定分止争,对未来的土地开发建设活动提供指引。研究方法:规范分析法、比较分析法和案例分析法。研究结果:(1)我国立法未能全面回答责任主体变更和土地权利转移时,修复义务人的认定这一难题... 研究目的:研究污染场地修复义务的继受问题,以期定分止争,对未来的土地开发建设活动提供指引。研究方法:规范分析法、比较分析法和案例分析法。研究结果:(1)我国立法未能全面回答责任主体变更和土地权利转移时,修复义务人的认定这一难题。(2)在主体变更情形下,应由继受者承担修复的行为义务和财务负担,企业组织形态或出资人的变动不影响修复义务的承担。(3)在个别继受方面,对于发生在《土壤污染防治法》生效后的土地使用权转让或收购,受让人同时承担修复的行为义务和财务负担;此前的土地使用权转移,受让人承担默示的修复义务后,可向土壤污染责任人或土壤污染防治基金求偿;(4)在政府征收土地或收回土地使用权情形下,不论其发生时间,都应由政府承担修复义务和费用。研究结论:应综合考虑修复的有效性、合比例性,以及对潜在义务主体的行为激励效果,在类型化的基础上完善土壤污染修复义务人的认定规则。 展开更多
关键词 污染场地修复 行为责任 状态责任 概括继受 个别继受
在线阅读 下载PDF
中医药治疗肝硬化腹水的作用机制及临床应用概述 被引量:6
5
作者 梅梦如 李雨 +7 位作者 陈炳东 刘美燕 卢昌林 刘志芳 黄小桃 林镛 颜耿杰 龙富立 《辽宁中医杂志》 北大核心 2025年第1期195-199,共5页
腹水的产生是肝硬化从代偿期进入失代偿期的标志,是肝硬化失代偿期最主要的并发症之一,其发病机制尚未完全明晰。中医学认为其病病位在肝、脾、肾三脏,基本病机为水停、气结、血瘀相互夹杂致病。近年来,国内学者运用中医药防治肝硬化腹... 腹水的产生是肝硬化从代偿期进入失代偿期的标志,是肝硬化失代偿期最主要的并发症之一,其发病机制尚未完全明晰。中医学认为其病病位在肝、脾、肾三脏,基本病机为水停、气结、血瘀相互夹杂致病。近年来,国内学者运用中医药防治肝硬化腹水取得了一定的临床疗效,在缩小腹围、减轻腹胀、增加尿量及改善肝功能等方面展现出独特优势;其作用机制主要集中在降低门静脉高压、利尿、改善炎症介质水平、调节肠道菌群、调控水通道蛋白表达等方面。文章就近年来中医药防治肝硬化腹水相关作用机制及临床应用进行综述,旨在为该病的临床防治提供思路与参考。 展开更多
关键词 肝硬化腹水 中医药治疗 作用机制 临床应用
原文传递
“象思维”视角下小建中汤的主治、作用机制及应用探讨 被引量:1
6
作者 王一珂 杨涛 谷松 《中西医结合慢性病杂志》 2025年第2期1-6,共6页
“象思维”是中医学的核心思维模式,其特指在彻底开放且保留事物自然整体性的前提下,对事物现象、表现进行概括,探索事物整体规律的思维,是中医理论的主导思维模式。黄元御、张元素等医家基于“象思维”分别提出“一气周流”及“法象药... “象思维”是中医学的核心思维模式,其特指在彻底开放且保留事物自然整体性的前提下,对事物现象、表现进行概括,探索事物整体规律的思维,是中医理论的主导思维模式。黄元御、张元素等医家基于“象思维”分别提出“一气周流”及“法象药理”学术思想,认为人体生理与中药药理均应该统一于天地一理。谷松教授基于“象思维”以及后世医家的学术思想,将小建中汤灵活应用于临床治疗各类疾病。基于“象思维”以及谷松教授的临床经验,结合后世各医家的学术思想对小建中汤“酸甘化阴,辛甘化阳”的配伍规律和“养血达木,调和肝脾,燮理阴阳”的核心功效进行深入的剖析。立足于对脾胃与肝胆气机升降出入的密切联系与相互影响进行探讨。同时,对小建中汤中各药物作用机制以及药物中醇类、有机酸、糖苷及多糖等有效成分的作用进行探讨,以求为中医学发展开创新方向,为后世医家对小建中汤等经方的解读提供新思路。 展开更多
关键词 象思维 一气周流 法象药理 小建中汤 作用机制
暂未订购
基于微服务架构的教学效果评价系统的设计与实现 被引量:1
7
作者 张欢 李俊 戚娜 《信息与电脑》 2025年第17期230-232,共3页
为实现对课堂教学效果的科学评价,文章设计并实现了一种基于微服务架构的教学效果评价系统。该系统基于微服务架构,将功能拆分成多个小服务模块,利用基于位置坐标注意力机制的检测方法提高学生面部动作单元的识别率,并将学生的面部动作... 为实现对课堂教学效果的科学评价,文章设计并实现了一种基于微服务架构的教学效果评价系统。该系统基于微服务架构,将功能拆分成多个小服务模块,利用基于位置坐标注意力机制的检测方法提高学生面部动作单元的识别率,并将学生的面部动作单元组合与心理状态进行关联,从而提高学生上课效果评价结果的准确性。系统提供对课堂所有学生心理状态的多样化统计结果,通过多重鉴权保证学生数据存储的安全性,为提高教育教学质量提供科学化、数据化的依据。 展开更多
关键词 教学效果评价 微服务架构 面部动作单元 学生心理状态
在线阅读 下载PDF
基于强化学习的铁路列车运行图编制与优化研究综述
8
作者 陈昂扬 范家铭 +3 位作者 徐辉章 齐昕 李博 张新 《铁道运输与经济》 北大核心 2025年第11期36-51,共16页
列车运行图编制是铁路运输组织的核心决策问题,与强化学习中马尔可夫决策过程建模具有内在适配性。首先从理论层面论证强化学习应用于编图任务的可行性和优劣势,总结研究过程需要解决的组件设计、算法设计等关键问题;通过对既有文献进... 列车运行图编制是铁路运输组织的核心决策问题,与强化学习中马尔可夫决策过程建模具有内在适配性。首先从理论层面论证强化学习应用于编图任务的可行性和优劣势,总结研究过程需要解决的组件设计、算法设计等关键问题;通过对既有文献进行调研,认为目前研究仍处于探索阶段;在核心组件层面,归纳提出5类状态空间设计方式以及要素变更、过程控制、编图动作等动作空间设计方式,给出基于问题特性的神经网络模型和强化学习算法匹配推荐方案;在技术层面,分析目前面临的高维状态空间表征和多维组合空间探索等挑战和突破路径;最后从行业视角展望未来的技术趋势和发展方向,可为后续研究的建模方式、技术方案和行业落地提供系统性参考。 展开更多
关键词 列车运行图编制 强化学习 马尔可夫决策过程 状态空间 动作空间
在线阅读 下载PDF
科技驱动美国饲草产业发展:演变历程、作用机制及启示
9
作者 赵宸 崔姹 王明利 《中国饲料》 北大核心 2025年第19期199-208,共10页
我国饲草产业关键核心技术“卡脖子”以及产业科技贡献率不高等问题是制约饲草产业发展的关键因素。为探寻适合我国科技促进饲草发展的机制及路径,本研究选取饲草产业较为发达的国家美国,对其科技驱动饲草产业发展的演变历程、作用机制... 我国饲草产业关键核心技术“卡脖子”以及产业科技贡献率不高等问题是制约饲草产业发展的关键因素。为探寻适合我国科技促进饲草发展的机制及路径,本研究选取饲草产业较为发达的国家美国,对其科技驱动饲草产业发展的演变历程、作用机制进行剖析,并得出有益启示。主要研究结论如下:(1)科技驱动美国饲草产业发展着力点存在阶段性差异。科技驱动饲草产业在生产力提升阶段、可持续发展阶段及全面发展阶段的着力点为饲草种子研发与认证、全产业链发展及苜蓿产业研究的演变;(2)现阶段科技驱动美国饲草产业通过品种改进机制、质量认证机制等直接作用及人才保障机制、科技研发机制、推广机制等间接作用,全方位、多层次推动饲草产业的持续发展。最后基于我国饲草产业发展过程中出现的保障机制尚不完善、研发推广机制协同性有待提高及饲草品种培育起步较晚等典型问题,并结合科技驱动美国饲草产业的相关经验,提出增强我国饲草产业发展的保障性措施出台及完善饲草产业研发与应用协同机制等启示。 展开更多
关键词 美国 饲草产业 科技驱动 作用机制
在线阅读 下载PDF
基于信道状态信息的高鲁棒性动作识别方法
10
作者 王文华 梁泉泉 +2 位作者 于智杰 张琨 吴庆哲 《计算机应用与软件》 北大核心 2025年第12期165-171,共7页
基于Wi-Fi技术的方法以其无需穿戴、易于部署等优点日益成为动作识别领域的热门研究方向。然而在有干扰的情况下,Wi-Fi设备易受到影响从而造成识别精度的下降。据此设计一种基于信道状态信息(Channel Status Information,CSI)的高鲁棒... 基于Wi-Fi技术的方法以其无需穿戴、易于部署等优点日益成为动作识别领域的热门研究方向。然而在有干扰的情况下,Wi-Fi设备易受到影响从而造成识别精度的下降。据此设计一种基于信道状态信息(Channel Status Information,CSI)的高鲁棒性动作识别方法。提出动态子载波选择算法,动态地选取与动作相关性最大的子载波;针对无线设备在干扰情况下数据采集质量不佳、分割不精确导致动作识别准确率下降的问题,提出分割辅助算法,有效提高动作区间的分割精度和分类准确性。实验结果显示,该方法在无干扰和有干扰的环境下对五种动作的识别准确度分别可达到92%和81%,具有较强的鲁棒性。 展开更多
关键词 信道状态信息 动作识别 高鲁棒性 动态子载波选择 分割辅助算法
在线阅读 下载PDF
RB模式下挡土墙地震非极限被动土压力计算 被引量:1
11
作者 杨宇哲 吴文兵 +1 位作者 倪芃芃 梅国雄 《工程力学》 北大核心 2025年第7期129-136,共8页
地震条件下挡土墙的被动土压力分布是一个重要的研究方向,而挡土墙的土压力分布和位移模式相关。针对RB模式下挡土墙地震被动土压力的分布情况,根据拟动力法和水平层分析法,考虑了土体内外摩擦角随深度的变化,提出了RB模式下挡土墙地震... 地震条件下挡土墙的被动土压力分布是一个重要的研究方向,而挡土墙的土压力分布和位移模式相关。针对RB模式下挡土墙地震被动土压力的分布情况,根据拟动力法和水平层分析法,考虑了土体内外摩擦角随深度的变化,提出了RB模式下挡土墙地震非极限被动土压力计算方法,并推导出合力大小以及合力作用点高度计算公式,将公式所得数值解与试验实测数据以及其他方法进行对比,验证了该文公式的合理性,分析了摩擦角、位移大小和地震加速度对土压力分布的影响。结果表明:RB模式下挡土墙的被动土压力随深度呈现先增大后减小的趋势,不同挡土墙位移墙底处土压力大小基本相同,研究成果对发展非极限被动土压力有一定参考价值。 展开更多
关键词 挡土墙 地震作用 位移模式 被动土压力 非极限状态
在线阅读 下载PDF
基于数据增强的实时人体动作识别
12
作者 俞秀文 张文哲 +2 位作者 刘钝 何飞 王昱洁 《科技创新与应用》 2025年第18期9-16,共8页
基于信道状态信息的人体动作识别在人机交互、医疗健康、入侵检测等领域有重要应用前景。虽然目前此类研究在识别的动作种类和识别精度方面已经取得很大进展,但需要较大数量的动作样本训练识别模型,同时模型识别动作的实时性方面有待提... 基于信道状态信息的人体动作识别在人机交互、医疗健康、入侵检测等领域有重要应用前景。虽然目前此类研究在识别的动作种类和识别精度方面已经取得很大进展,但需要较大数量的动作样本训练识别模型,同时模型识别动作的实时性方面有待提升。因此,该文设计一个基于数据增强的实时人体动作识别系统CSI-FHAR。通过对少量真实样本进行样本增强,以此合成一些伪样本来降低训练模型时对真实样本的需求量。对完整的动作样本进行样本分片,加快模型的识别速度以优化实时性。为增大不同动作的类间特征差异,CSI-FHAR给动作样本显示添加时间编码从而提高模型的识别精度。卷积注意力模块CBAM被嵌入CNN中,进一步提升网络对于动作样本中有效特征的提取能力。通过实验证明CSI-FHAR的有效性,在学习10类动作每类动作只提供5个样本的条件下,所提模型对手势和身体动作的识别精度分别达到95.1%和92.5%。 展开更多
关键词 人体动作识别 信道状态信息 数据增强 时间编码 注意力机制
在线阅读 下载PDF
“基于规则的国际秩序”:美国控制北极的政策与行动 被引量:1
13
作者 宋晗 《战略决策研究》 2025年第2期105-128,132,共25页
随着北极战略价值的凸显,美国将“基于规则的国际秩序”应用于北极,改变对“开放的北极国际合作”的积极支持,构建在北极地区的价值观联盟,意图控制北极。美国通过提升北极外交地位、构筑北极经济联盟、控制北极关键要素维持和增强在北... 随着北极战略价值的凸显,美国将“基于规则的国际秩序”应用于北极,改变对“开放的北极国际合作”的积极支持,构建在北极地区的价值观联盟,意图控制北极。美国通过提升北极外交地位、构筑北极经济联盟、控制北极关键要素维持和增强在北极的“领导力”,以实现对北极这一联通欧亚的战略通道的控制,排斥中国和俄罗斯在北极扩展影响力。“基于规则的国际秩序”并非“基于国际法的国际秩序”,美国利用该术语将自身抬升到一般国际规则的优越地位。以北极外大陆架划界为例,美国利用“基于规则的国际秩序”的主张,希望以外交策略绕过国际法的约束参与北极资源争夺。北极“基于规则的国际秩序”作为竞争性国际关系思维,破坏了共同保护北极的国际合力。北极是“关乎人类未来生存与发展的关键区域”,应倡导构建“北极命运共同体”,促进“基于国际法的北极秩序”。 展开更多
关键词 美国 基于规则的国际秩序 北极政策 北极行动 北极命运共同体
在线阅读 下载PDF
基于行为的访问控制模型及其行为管理 被引量:46
14
作者 李凤华 王巍 +1 位作者 马建峰 梁晓艳 《电子学报》 EI CAS CSCD 北大核心 2008年第10期1881-1890,共10页
访问控制模型是对信息资源进行授权决策的重要方法之一.首先给出了环境的定义,结合角色、时态和环境的概念,给出了行为的定义.在不同的信息系统中,行为可以用来综合角色、时态状态和环境状态的相关安全信息.然后介绍了行为、时态状态和... 访问控制模型是对信息资源进行授权决策的重要方法之一.首先给出了环境的定义,结合角色、时态和环境的概念,给出了行为的定义.在不同的信息系统中,行为可以用来综合角色、时态状态和环境状态的相关安全信息.然后介绍了行为、时态状态和环境状态的层次结构,提出了基于行为的访问控制模型ABAC(Action-Based AccessControl Model),并讨论了在ABAC模型中角色、时态状态和环境状态之间的相互关系.在此基础上,通过引入受限的时态状态和环境状态,给出了管理行为的定义和ABAC管理模型的结构;描述了ABAC管理模型下用户-管理行为、管理行为-管理权限的控制关系,使用Z-符号形式化地描述了行为状态管理中使用的管理函数AddAction、ModifyAction和DeleteAction,以及和ABAC管理模型相关的管理方法.与已有其他模型相比,ABAC模型更加适用于解决网络环境下支持移动计算的信息系统中的访问控制问题. 展开更多
关键词 访问控制 行为 环境状态 时态状态 管理行为
在线阅读 下载PDF
模型检测规划中的状态分层方法 被引量:14
15
作者 文中华 黄巍 +1 位作者 刘任任 姜云飞 《软件学报》 EI CSCD 北大核心 2009年第4期858-869,共12页
基于模型检测的规划方法是最近发展起来的新方法,它可以处理带有不确定性的规划问题.分别设计了对求弱规划解、强规划解和强循环规划解的问题中的状态进行分层的方法.状态被分层后,求规划解只需要在从上层到其下一层状态之间寻找状态动... 基于模型检测的规划方法是最近发展起来的新方法,它可以处理带有不确定性的规划问题.分别设计了对求弱规划解、强规划解和强循环规划解的问题中的状态进行分层的方法.状态被分层后,求规划解只需要在从上层到其下一层状态之间寻找状态动作序偶就可以了,其他状态动作序偶都可以去掉.分别获得了求弱规划解、强规划解和强循环规划解时状态被分层后的一些重要性质,这些性质是关于一些状态动作序偶是否可以不参与构成弱规划解、强规划解和强循环规划解的结论.通过所获得的性质可以将大量的状态动作序偶直接去掉,从而减少问题规模.以往的对基于模型检测规划的研究都是采用从目标状态开始的反向搜索方法,在状态被分层以后可以采用正向搜索技术展开相应的研究. 展开更多
关键词 模型检测 状态分层 不确定规划 正向搜索 状态动作序偶
在线阅读 下载PDF
足球机器人决策系统推理模型 被引量:38
16
作者 吴丽娟 张春晖 徐心和 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第6期597-599,共3页
介绍了足球机器人系统的组成及决策系统的六步推理模型和四层决策结构 ,并用人工智能的状态空间表示方法将比赛场上瞬息万变的态势 ,通过选择少量的有代表性的离散状态构成状态空间 ,根据系统完成的任务 ,为机器人确定有限的动作集合 ,... 介绍了足球机器人系统的组成及决策系统的六步推理模型和四层决策结构 ,并用人工智能的状态空间表示方法将比赛场上瞬息万变的态势 ,通过选择少量的有代表性的离散状态构成状态空间 ,根据系统完成的任务 ,为机器人确定有限的动作集合 ,使积累的知识程序化 ;通过决策系统的正向推理 ,使每个机器人选择合适的动作 ,以命令的形式输出机器人的左右轮速 ,实现对系统的实时控制· 展开更多
关键词 足球机器人 状态空间 动作空间 正向推理 决策系统 推理模型 人工智能
在线阅读 下载PDF
一种具有个性的Agent实现机制 被引量:5
17
作者 徐晋晖 张伟 +1 位作者 路海明 石纯一 《计算机研究与发展》 EI CSCD 北大核心 2001年第6期648-652,共5页
建立具有个性的 Agent在基于 Agent的计算中具有重要的意义 .现有研究对于个性的定义和个性对Agent影响的分析比较片面 ,缺少对个性程度和目标自主产生的描述 .给出了有程度描述的结合倾向和特质的个性定义 ,形式化地描述了具有个性的 A... 建立具有个性的 Agent在基于 Agent的计算中具有重要的意义 .现有研究对于个性的定义和个性对Agent影响的分析比较片面 ,缺少对个性程度和目标自主产生的描述 .给出了有程度描述的结合倾向和特质的个性定义 ,形式化地描述了具有个性的 Agent的结构和有关算法 ,分析了个性对 Agent交互与组织的影响 ,改进了Rizzo和 Castelfranchi等人的具有个性的 展开更多
关键词 AGENT 个性 思维状态 人工智能
在线阅读 下载PDF
正向搜索方法求强规划解 被引量:6
18
作者 陈建林 文中华 +1 位作者 朱江 常青 《计算机工程与应用》 CSCD 北大核心 2011年第6期52-54,130,共4页
以规划领域中的不确定状态转移系统作为研究对象,设计了求强规划解问题中的状态分层方法,状态被分层以后,求强规划解只需要从初始状态出发,逐次向下层状态转移到目标状态就可以了,在此基础上,设计了用正向搜索方法求强规划解的算法。实... 以规划领域中的不确定状态转移系统作为研究对象,设计了求强规划解问题中的状态分层方法,状态被分层以后,求强规划解只需要从初始状态出发,逐次向下层状态转移到目标状态就可以了,在此基础上,设计了用正向搜索方法求强规划解的算法。实验结果表明:所设计的算法比用反向搜索方法求强规划解算法的效率高。 展开更多
关键词 正向搜索 不确定规划 状态动作序偶 强规划解
在线阅读 下载PDF
基于状态-动作图测地高斯基的策略迭代强化学习 被引量:6
19
作者 程玉虎 冯涣婷 王雪松 《自动化学报》 EI CSCD 北大核心 2011年第1期44-51,共8页
在策略迭代强化学习中,基函数构造是影响动作值函数逼近精度的一个重要因素.为了给动作值函数逼近提供合适的基函数,提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法.首先,根据离策略方法建立马尔可夫决策过程的状态-动作图... 在策略迭代强化学习中,基函数构造是影响动作值函数逼近精度的一个重要因素.为了给动作值函数逼近提供合适的基函数,提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法.首先,根据离策略方法建立马尔可夫决策过程的状态-动作图论描述;然后,在状态-动作图上定义测地高斯核函数,利用基于近似线性相关的核稀疏方法自动选择测地高斯核的中心;最后,在策略评估阶段利用基于状态-动作图的测地高斯核逼近动作值函数,并基于估计的值函数进行策略改进.10×10格子世界的仿真结果表明,与基于状态图普通高斯基和测地高斯基的策略迭代强化学习方法相比,本文所提方法能以较少的基函数、高精度地逼近具有光滑且不连续特性的动作值函数,从而有效地获得最优策略. 展开更多
关键词 状态-动作图 测地高斯核 基函数 策略迭代 强化学习
在线阅读 下载PDF
基于微信平台的病友互助式宣教结合知信行干预对重症肌无力患者心理状态及自护能力的影响
20
作者 彭艳 《智慧健康》 2025年第36期135-138,共4页
目的探究基于微信平台的病友互助式宣教结合知信行干预对重症肌无力患者心理状态及自护能力的影响。方法选取本院2023年1月—2024年1月收治的重症肌无力患者80例,采用随机数字抽签法分为对照组和观察组,每组40例。对照组采取常规护理干... 目的探究基于微信平台的病友互助式宣教结合知信行干预对重症肌无力患者心理状态及自护能力的影响。方法选取本院2023年1月—2024年1月收治的重症肌无力患者80例,采用随机数字抽签法分为对照组和观察组,每组40例。对照组采取常规护理干预,观察组采取基于微信平台的病友互助式宣教结合知信行干预。对比分析不同干预方式对患者自护能力、心理状态的影响及价值。结果与对照组相比,观察组的自护能力评分均更高(P<0.05),心理状态评分均更低(P<0.05)。结论实施基于微信平台的病友互助式宣教结合知信行干预可有效改善患者的不良情绪,提升自护能力,优化身体状态,具有一定实际应用价值及护理合理性、创新性。 展开更多
关键词 基于微信平台 病友互助式宣教 知信行干预 重症肌无力 心理状态 自护能力
暂未订购
上一页 1 2 20 下一页 到第
使用帮助 返回顶部