期刊文献+
共找到81篇文章
< 1 2 5 >
每页显示 20 50 100
基于深度强化学习NoisyNet-A3C算法的自动化渗透测试方法
1
作者 董卫宇 刘鹏坤 +2 位作者 刘春玲 唐永鹤 马钰普 《郑州大学学报(工学版)》 北大核心 2025年第5期60-68,共9页
在自动化渗透测试领域,现有攻击路径决策算法大多基于部分可观测马尔可夫决策过程(POMDP),存在算法复杂度过高、收敛速度慢、易陷入局部最优解等问题。针对这些问题,提出了一种基于马尔可夫决策过程(MDP)的强化学习算法NoisyNet-A3C,并... 在自动化渗透测试领域,现有攻击路径决策算法大多基于部分可观测马尔可夫决策过程(POMDP),存在算法复杂度过高、收敛速度慢、易陷入局部最优解等问题。针对这些问题,提出了一种基于马尔可夫决策过程(MDP)的强化学习算法NoisyNet-A3C,并用于自动化渗透测试领域。该算法通过多线程训练actor-critic,每个线程的运算结果反馈到主神经网络中,同时从主神经网络中获取最新的参数更新,充分利用计算机性能,减少数据相关性,提高训练效率。另外,训练网络添加噪声参数与权重网络训练更新参数,增加了行为策略的随机性,利于更快探索有效路径,减少了数据扰动的影响,从而增强了算法的鲁棒性。实验结果表明:与A3C、Q-learning、DQN和NDSPI-DQN算法相比,NoisyNet-A3C算法收敛速度提高了30%以上,验证了所提算法的收敛速度更快。 展开更多
关键词 渗透测试 攻击路径决策 a3c算法 深度强化学习 METASPLOIT
在线阅读 下载PDF
基于随机博弈与A3C深度强化学习的网络防御策略优选 被引量:1
2
作者 胡浩 赵昌军 +3 位作者 刘璟 宋昱欣 姜迎畅 张玉臣 《指挥与控制学报》 CSCD 北大核心 2024年第1期47-58,共12页
网络资源的有限性和攻防对抗的动态性导致最优防御策略难以选取,将深度强化学习引入攻防随机博弈建模领域,通过构建网络攻防actor策略网络和critic价值网络,结合随机博弈模型构建了网络攻防博弈决策模型总体结构,在此基础上引入异步优... 网络资源的有限性和攻防对抗的动态性导致最优防御策略难以选取,将深度强化学习引入攻防随机博弈建模领域,通过构建网络攻防actor策略网络和critic价值网络,结合随机博弈模型构建了网络攻防博弈决策模型总体结构,在此基础上引入异步优势演员评论家算法(asynchronous advantage actor-critic,A3C)智能体学习框架设计了防御策略选取算法;针对现有方法未考虑攻击方群体间的共谋攻击,引入群智能体性格特征,建立合作系数μ来刻画攻击者之间的合作对攻防策略收益的影响,进而得出对防御策略选取的影响,构建的博弈决策模型更符合攻防实际情况。实验结果表明,该方法的策略求解速度要优于现有方法,同时由于考虑了攻击合作关系,能够用于分析攻击者群体间合作关系对防御者决策的影响,防御策略选取更有针对性,期望防御收益更高。 展开更多
关键词 网络攻防 最优防御决策 随机博弈 多智能体 a3c算法
在线阅读 下载PDF
基于GRU-A3C的四旋翼无人机视觉避障系统 被引量:2
3
作者 马澳华 邢关生 《电子测量技术》 北大核心 2024年第21期46-52,共7页
针对基于深度强化学习的四旋翼无人机视觉避障系统,模型训练速度慢、计算量大和响应不及时的问题,设计了一种轻量化且模型训练速度快的系统。该系统首先以深度图像和无人机自身状态信息作为输入,然后使用一种基于GRU结构的A3C算法(GRU-A... 针对基于深度强化学习的四旋翼无人机视觉避障系统,模型训练速度慢、计算量大和响应不及时的问题,设计了一种轻量化且模型训练速度快的系统。该系统首先以深度图像和无人机自身状态信息作为输入,然后使用一种基于GRU结构的A3C算法(GRU-A3C),输出连续动作空间并结合课程学习的方法进行训练加速。最后,以A3C为基线进行消融实验。实验结果为:在训练1000轮次时,利用课程学习方法训练的GRU-A3C算法成功率为0.28,A3C算法成功率为0.2;在训练5000轮次时,利用课程学习方法训练的GRU-A3C算法成功率为0.72,A3C算法成功率0.62。数据表明,该系统可以有效加快模型收敛速度,缩短训练时间并提高训练效果。 展开更多
关键词 深度强化学习 四旋翼无人机 a3c 课程学习 视觉避障
原文传递
基于A3C的认知物联网通信干扰消除算法 被引量:1
4
作者 刘新梦 谢健骊 +1 位作者 李翠然 王亦鸣 《计算机工程》 CAS CSCD 北大核心 2024年第10期281-290,共10页
针对频谱资源干扰管理的智能化需求,提出一种基于异步优势行动者-评论家(A3C)的干扰消除算法,旨在应对认知物联网(CIoT)通信系统中由频谱资源共享引起的干扰问题。通过智能体的学习和优化,帮助次级用户(SU)在受到干扰影响时做出最优的决... 针对频谱资源干扰管理的智能化需求,提出一种基于异步优势行动者-评论家(A3C)的干扰消除算法,旨在应对认知物联网(CIoT)通信系统中由频谱资源共享引起的干扰问题。通过智能体的学习和优化,帮助次级用户(SU)在受到干扰影响时做出最优的决策,从而改善通信质量和系统性能。在该算法中,当SU遭受干扰影响通信质量时,智能体通过学习和优化,使SU能够根据当前的位置信息、发射功率、接收功率以及干扰程度选择最低干扰程度的行动,并执行该行动后获得的奖励。智能体通过尝试不同减少干扰的行动,并根据奖励的反馈调整策略,达到最大化定义干扰程度指标和信号质量指标的奖励函数的目的,从而最大程度地减少干扰对通信质量的影响。实验结果表明,与传统k-means算法以及深度递归Q网络(DRQN)和深度Q网络(DQN)优化算法相比,基于A3C的干扰消除算法具有更短的收敛时间、更高的执行效率以及更高的系统吞吐量,较3种基准方法在吞吐量性能上至少提高7%,能够有效地减少干扰对通信质量的不利影响。 展开更多
关键词 认知物联网 干扰消除 异步优势行动者-评论家算法 干扰程度 信号质量 吞吐量
在线阅读 下载PDF
O型口蹄疫病毒P1-2A3C基因在家蚕杆状病毒表达系统中的表达 被引量:4
5
作者 张韵 易咏竹 +2 位作者 李志勇 张志芳 柳纪省 《蚕业科学》 CAS CSCD 北大核心 2008年第1期148-153,共6页
口蹄疫是一种严重危害畜牧业生产的烈性传染病。为了促进O型口蹄疫病毒(FMDV)基因工程活载体疫苗的研制,选取O型FMDV编码序列中的衣壳蛋白前体P1-2A基因和蛋白酶3C基因,插入家蚕杆状病毒转移载体pVL1393中,构建重组载体pVL-P1-2A3C,并... 口蹄疫是一种严重危害畜牧业生产的烈性传染病。为了促进O型口蹄疫病毒(FMDV)基因工程活载体疫苗的研制,选取O型FMDV编码序列中的衣壳蛋白前体P1-2A基因和蛋白酶3C基因,插入家蚕杆状病毒转移载体pVL1393中,构建重组载体pVL-P1-2A3C,并与线性化病毒Bm-BacPAK6 DNA共转染家蚕BmN细胞,获得重组病毒Bm-P1-2A3C。将重组病毒感染家蚕5龄幼虫,以双抗体夹心ELISA法和间接血凝方法检测血淋巴中的表达产物:目的蛋白在感染病毒后120 h的蚕血淋巴中表达量最高,抗原表达呈阳性的最大稀释倍数为1∶128。结果显示O型FMDV的P1-2A3C基因已在家蚕体内获得表达。 展开更多
关键词 O型口蹄疫病毒 基因工程疫苗 P1-2a3c基因 家蚕杆状病毒表达系统
在线阅读 下载PDF
融合表达牛疱疹病毒Ⅰ型VP22基因和O型口蹄疫病毒P12A3C基因的DNA疫苗的构建及其免疫应答 被引量:3
6
作者 陈关平 吴涛 +1 位作者 黄勤锋 陈焕春 《中国兽医学报》 CAS CSCD 北大核心 2009年第8期973-977,共5页
用小鼠模型评价融合表达牛疱疹病毒Ⅰ型VP22基因和O型口蹄疫病毒P12A3C基因的DNA疫苗和不同免疫策略的免疫应答。用PCR方法扩增牛疱疹病毒Ⅰ型VP22基因和O型口蹄疫病毒P12A3C基因,分别克隆到pMD18-T载体并测序验证正确后将其克隆到质粒p... 用小鼠模型评价融合表达牛疱疹病毒Ⅰ型VP22基因和O型口蹄疫病毒P12A3C基因的DNA疫苗和不同免疫策略的免疫应答。用PCR方法扩增牛疱疹病毒Ⅰ型VP22基因和O型口蹄疫病毒P12A3C基因,分别克隆到pMD18-T载体并测序验证正确后将其克隆到质粒pcDNA的相应位点获得质粒pcDNA-VP22-P12A3C。然后将BALB/c小鼠分成7组进行免疫。结果表明,DNA疫苗pcDNA-VP22-P12A3C诱导的细胞免疫水平超过了灭活疫苗,DNA疫苗与灭活疫苗联合免疫组体液免疫水平接近灭活疫苗组而细胞免疫水平远高于灭活疫苗组,为进一步研究VP22和P12A3C融合表达的基因工程疫苗奠定了基础。 展开更多
关键词 牛疱疹病毒Ⅰ型VP22基因 O型口蹄疫病毒P12a3c基因 DNA疫苗 免疫应答
在线阅读 下载PDF
Asia I口蹄疫病毒组合基因P1-2A3C在不同家蚕品种中的表达 被引量:3
7
作者 张韵 张金卫 +5 位作者 易咏竹 李志勇 李江涛 鱼南洋 丁农 柳纪省 《安徽农业科学》 CAS 北大核心 2011年第33期20490-20491,20510,共3页
[目的]研究Asia I口蹄疫病毒组合基因P1-2A3C在不同家蚕品种中的表达,以期筛选出较适合表达该组合基因的家蚕品种。[方法]将已经获得高效表达的重组家蚕杆状病毒rBmNPV(P1-2A3C)基因,分别注射原种及杂交家蚕蚕蛹。利用ELISA方法对其进... [目的]研究Asia I口蹄疫病毒组合基因P1-2A3C在不同家蚕品种中的表达,以期筛选出较适合表达该组合基因的家蚕品种。[方法]将已经获得高效表达的重组家蚕杆状病毒rBmNPV(P1-2A3C)基因,分别注射原种及杂交家蚕蚕蛹。利用ELISA方法对其进行抗原表达量检测,并对表达结果进行差异比较。[结果]不同家蚕品种对rBmNPV(P1-2A3C)的表达存在着明显差异;秋丰×TQ78和秋丰×丝胶茧杂交组合可考虑作为高效表达的家蚕生物反应器专用品种。[结论]为AsiaΙFMDV目的蛋白的高效表达专用品种的选育提供了依据。 展开更多
关键词 AsiaI口蹄疫病毒 P1-2a3c 家蚕品种
在线阅读 下载PDF
强化学习A3C算法在电梯调度中的建模及应用 被引量:16
8
作者 刘宇 张聪 李涛 《计算机工程与设计》 北大核心 2022年第1期196-202,共7页
为让电梯调度算法在电梯电力能耗、用户乘梯体验和算法适应性方面具备更好表现,在目前主流的电梯调度算法基础之上,提出对调度环境、电梯行为和调度目标3个方面进行统一建模的基于强化学习A3C的电梯智能调度算法。让调度电梯在不断地和... 为让电梯调度算法在电梯电力能耗、用户乘梯体验和算法适应性方面具备更好表现,在目前主流的电梯调度算法基础之上,提出对调度环境、电梯行为和调度目标3个方面进行统一建模的基于强化学习A3C的电梯智能调度算法。让调度电梯在不断地和环境交互学习过程中逐渐学习得到最优电梯调度策略,与基于具体环境建模的相关电梯调度算法进行对比实验,基于A3C的调度算法具有建模简单规范、适应性强和控制目标多样的优势,对比A3C算法与部分强化学习算法在电梯调度中的优劣,实验结果表明,A3C算法具备较好的调度性能。 展开更多
关键词 智能调度 电梯调度算法 电梯节能 强化学习 a3c
在线阅读 下载PDF
Expression of Recombinant Gene P1-2A3C of FMDV Asia I in Different Bombyx mori Varieties 被引量:1
9
作者 张韵 张金卫 +5 位作者 易咏竹 李志勇 李江涛 鱼南洋 丁农 柳纪省 《Agricultural Science & Technology》 CAS 2011年第10期1528-1530,共3页
[Objective] The aim was to investigate the expression level of recombinant gene P1-2A3C of FMDV Asia I in different Bombyx mori varieties,so as to screen out the B.mori varieties suitable for the foreign gene expressi... [Objective] The aim was to investigate the expression level of recombinant gene P1-2A3C of FMDV Asia I in different Bombyx mori varieties,so as to screen out the B.mori varieties suitable for the foreign gene expression.[Method] The recombinant B.mori baculovirus rBmNPV(P1-2A3C) are injected into pupae of original species and hybrids of B.mori respectively.Then,the expression of antigen is detected by ELISA method and compared.[Result] The expression level of P1-2A3C significantly differed in different B.mori varieties,in which,the hybrids of Qiufeng×TQ78 and Qiufeng×Sijiaojian could be considered as the effective bioreactors for high-level expression of foreign genes.[Conclusion] This study provided the basis for breeding special B.mori varieties which can highly express target protein of Asia I FMDV. 展开更多
关键词 Asia I FMDV P1-2a3c Bombyx mori varieties
在线阅读 下载PDF
基于CLISEP28-A3c建立济南地区AFP、CEA参考区间的探讨 被引量:3
10
作者 郭绪晓 李英杰 +1 位作者 柏淑美 李金星 《医学检验与临床》 2015年第4期47-50,共4页
目的:通过统计分析初步建立济南地区健康人群肿瘤标志物AFP和CEA的参考区间,为临床诊疗肿瘤标志物提供依据。方法:使用Roche cobas8000检测系统检测来自山东中医药大学附属医院和齐鲁医院查体中心共3928例健康体检者的AFP和CEA,依据... 目的:通过统计分析初步建立济南地区健康人群肿瘤标志物AFP和CEA的参考区间,为临床诊疗肿瘤标志物提供依据。方法:使用Roche cobas8000检测系统检测来自山东中医药大学附属医院和齐鲁医院查体中心共3928例健康体检者的AFP和CEA,依据CLSI EP28-A3c,统计分析并建立参考区间。结果:AFP无需根据性别和年龄分组,参考区间是0-6.84ng/ml;CEA无需根据性别分组但需根据年龄进行分组,中青年组和老年组参考范围分别是0-4.40ng/ml和0-5.30ng/ml。结论:初步建立了济南地区AFP和CEA的参考区间,非常有必要统一各检测系统的参考区间。 展开更多
关键词 EP28-a3c 参考区间 甲胎蛋白 癌胚抗原
暂未订购
基于A3C的无线异构网络自适应视频流传输控制方法 被引量:8
11
作者 罗志强 王伟 朱晓荣 《电信科学》 2020年第12期65-76,共12页
比特率自适应(ABR)算法已经成为视频传输中研究的热点之一。然而,由于5G无线异构网络具有信道带宽波动大、不同网络间差异明显等特点,多终端协同的自适应视频流传输面临着巨大挑战。提出了一种基于深度强化学习的自适应视频流传输控制... 比特率自适应(ABR)算法已经成为视频传输中研究的热点之一。然而,由于5G无线异构网络具有信道带宽波动大、不同网络间差异明显等特点,多终端协同的自适应视频流传输面临着巨大挑战。提出了一种基于深度强化学习的自适应视频流传输控制方法。首先,建立了视频流动态规划模型,对传输码率以及分流策略进行联合优化。由于该优化问题的求解依赖于精确的信道估计,这在信道状态动态变化的网络中很难实现。因此,将动态规划问题改进为强化学习任务,并采用A3C算法,动态决策视频码率和分流策略。最后,根据实测的网络数据进行仿真,与传统的优化方法相比,本文所提的方法较好地提高了用户QoE。 展开更多
关键词 无线异构网络 a3c 码率自适应 多终端协同 QOE
在线阅读 下载PDF
基于A3C的有序充电算法 被引量:1
12
作者 张文龙 张洁 《计算机技术与发展》 2023年第1期173-177,199,共6页
由于电动汽车的日益普及,其充电问题已成为电力系统的新的用电挑战。实际生活中,充电站一般都被认为是电动汽车有序充电行为的调度主体。为解决传统模型驱动的充电算法无法应用于电动汽车随机进站的问题,提出将数据驱动的无模型深度强... 由于电动汽车的日益普及,其充电问题已成为电力系统的新的用电挑战。实际生活中,充电站一般都被认为是电动汽车有序充电行为的调度主体。为解决传统模型驱动的充电算法无法应用于电动汽车随机进站的问题,提出将数据驱动的无模型深度强化学习算法A3C(Asynchronous Advantage Actor-critic,异步演员评论家算法)应用于有序充电。该算法利用特征函数来近似模型所需要的价值函数和策略函数,解决因随机进站而引起的空间维度变化的问题。通过需求响应机制关联充电费用和需求,实现两者的动态调度。为避免因为经验回放而导致的数据相关性过强,利用多线程实现模型与多个环境进行互动,提高了模型的收敛性。最后以某地区充电站实测数据为例进行仿真分析。结果表明,该算法在只基于历史充电数据的情况下能优化充电行为,较大程度地抑制充电负荷方差,实现削峰填谷,同时在满足用户需求的基础上提高充电站收益。 展开更多
关键词 有序充电 数据驱动 强化学习 深度学习 a3c
在线阅读 下载PDF
强化学习A3C算法应用于电梯调度中的价值分析
13
作者 黄刚 郭贝 《今日自动化》 2022年第4期86-88,共3页
电梯使用量的增加,让电梯的用户体验、电力能耗及算法适应性的要求更高。在电梯常规调度算法上,提出了基于调度环境、调度目标、电梯行为的强化学习A3C智能调度算法。让电梯在不断地与环境交互学习中获得最优电梯调度策略,使其更具适应... 电梯使用量的增加,让电梯的用户体验、电力能耗及算法适应性的要求更高。在电梯常规调度算法上,提出了基于调度环境、调度目标、电梯行为的强化学习A3C智能调度算法。让电梯在不断地与环境交互学习中获得最优电梯调度策略,使其更具适应性和实现目标多样性。本文就对电梯调度、强化学习进行了概述,分析了强化学习A3C算法在电梯调度中的建模价值,以进一步优化算法。 展开更多
关键词 强化a3c算法 电梯调度 价值分析
在线阅读 下载PDF
狂玩曙光单屏2A3C
14
作者 锦华 《音响世界》 2005年第3期60-63,共4页
自2A3单端胆前级在国庆节完成后,倒是静心地听了一段时间的音乐,但不久就旧“疾”重犯,心痒难熬,又盘算着怎样把这款前级的音效再提升一下。在笔者的上一篇2A3前级制作文稿中,就已提到前级的电位器将来是要升级的,所以首先想到的... 自2A3单端胆前级在国庆节完成后,倒是静心地听了一段时间的音乐,但不久就旧“疾”重犯,心痒难熬,又盘算着怎样把这款前级的音效再提升一下。在笔者的上一篇2A3前级制作文稿中,就已提到前级的电位器将来是要升级的,所以首先想到的就是动电位器。环顾广州市场,最高档的电位器只有瑞士的ELMA和丹麦的DACT。两者都是用ELMA的24档镀金开关,但开关型号以及所配的电阻却有所不同:ELMA级进电位器配的是英国汉高电阻,而DACT配的是无感晶片电阻。 展开更多
关键词 曙光公司 2a3c 单端放大器 硬件改造 音质
在线阅读 下载PDF
曙光2A3B和2A3C
15
作者 许国 《实用影音技术》 2006年第9期20-24,共5页
关键词 光电子管 直热式三极管 2A3B 2a3c
在线阅读 下载PDF
基于A3C的特征重构工艺路线规划方法 被引量:1
16
作者 陶鑫钰 王艳 纪志成 《现代制造工程》 CSCD 北大核心 2023年第10期15-26,共12页
针对柔性加工系统中零件发生特征重构的工艺路线规划问题,结合异步优势演员-评论家(A3C)算法的并行、异步、响应速度快以及决策经验可复用性、可扩展性的特点,提出了基于A3C算法的特征重构工艺路线规划方法。在零件发生特征重构的背景下... 针对柔性加工系统中零件发生特征重构的工艺路线规划问题,结合异步优势演员-评论家(A3C)算法的并行、异步、响应速度快以及决策经验可复用性、可扩展性的特点,提出了基于A3C算法的特征重构工艺路线规划方法。在零件发生特征重构的背景下,基于马尔可夫决策过程定义了状态、动作空间和奖励函数。针对A3C智能体在选取机床、刀具和进刀方向时可能会陷入局部最优,提出了随机贪婪策略,以扩大解的空间、提高解的质量,且为了避免A3C智能体在零件发生特征重构时陷入大量的试错中,提出了快失败策略,以加快智能体规避特征约束的能力,提高响应速度。仿真实验证明,所提方法能有效解决零件发生特征重构的工艺路线规划问题,且相比基于遗传、蚁群和模拟退火算法的工艺路线规划方法,所提方法在零件发生特征重构时响应速度更快,解的质量更高。 展开更多
关键词 异步优势演员-评论家 特征重构 工艺路线 深度强化学习 马尔可夫决策过程
在线阅读 下载PDF
基于注意力机制的A3C量化交易策略
17
作者 符甲鑫 刘磊 钱成 《南通大学学报(自然科学版)》 CAS 2023年第2期43-49,74,共8页
针对传统交易策略无法有效长期消除市场噪声和非线性影响的问题,提出一种基于注意力机制的异步优势动作评价(squeeze-and-excitation asynchronous advantage actor-critic,SE-A3C)量化交易策略。以历史技术指标因子为环境状态,利用卷... 针对传统交易策略无法有效长期消除市场噪声和非线性影响的问题,提出一种基于注意力机制的异步优势动作评价(squeeze-and-excitation asynchronous advantage actor-critic,SE-A3C)量化交易策略。以历史技术指标因子为环境状态,利用卷积网络和注意力机制模块提取数据特征,判断交易动作,并采用异步训练的方式将多智能体与环境进行交互,有效提升策略的自适应能力。采用该策略对沪深300和上证50股指期货进行交易,结果表明:在测试阶段,沪深300的收益率为12.23%,胜率为58.82%,最大回撤率为2.47%;上证50的收益率为18.82%,胜率为57.56%,最大回撤率为1.05%。 展开更多
关键词 深度强化学习 异步优势动作评价 注意力机制 定量交易
在线阅读 下载PDF
复杂环境下基于边缘计算的RFID相控阵定位方法
18
作者 庄宇峰 霍政界 +1 位作者 黄申茂 张馨 《电子测量技术》 北大核心 2025年第17期125-131,共7页
为了提升RFID定位技术在复杂环境中的精度、鲁棒性和实时性,本文提出了一种基于多节点边缘计算协同的RFID相控阵智能定位方法。该方法利用相控阵天线实现波束动态控制,结合多节点边缘计算处理大规模标签数据,从而降低多路径效应和信号... 为了提升RFID定位技术在复杂环境中的精度、鲁棒性和实时性,本文提出了一种基于多节点边缘计算协同的RFID相控阵智能定位方法。该方法利用相控阵天线实现波束动态控制,结合多节点边缘计算处理大规模标签数据,从而降低多路径效应和信号衰减的影响。同时,系统集成A3C强化学习算法,根据环境变化动态优化定位参数,提高系统适应性和稳定性。实验分别在标准环境和复杂环境下进行测试,复杂环境中模拟了大量金属货架、多路径效应和动态干扰源,并对比RSSI、TDOA及本文方法的定位误差和准确率。实验结果表明,在标准环境中,本文方法的定位误差降低至0.8~0.9m,准确率达到92%;在复杂环境中,误差控制在1m以内,准确率保持在90%以上,显著优于传统方法。此外,在智能仓储资产管理系统中的实际应用验证进一步证明了该方法的高精度和鲁棒性,盘点准确率从85%提升至96%,误判率降至1.5%。本文研究为RFID定位技术在智慧城市、电网资产管理和物流仓储等领域的应用提供了可靠的技术支撑,展现出优异的环境适应性和高效的定位能力。 展开更多
关键词 RFID定位 边缘计算 相控阵天线 a3c算法 复杂环境 多路径效应
原文传递
智能仓储交通信号与多AGV路径规划协同控制方法 被引量:5
19
作者 司明 邬伯藩 +1 位作者 胡灿 邢伟强 《计算机工程与应用》 CSCD 北大核心 2024年第11期290-297,共8页
针对智能仓储多AGV(automated guided vehicle)路径规划实时性差,障碍物识别能力弱,多AGV碰撞、死锁和拥堵等问题,提出了一种智能仓储交通信号控制与多AGV路径规划协同控制方法,将交通信号与多AGV路径规划视为一个整体,设计一种交通信... 针对智能仓储多AGV(automated guided vehicle)路径规划实时性差,障碍物识别能力弱,多AGV碰撞、死锁和拥堵等问题,提出了一种智能仓储交通信号控制与多AGV路径规划协同控制方法,将交通信号与多AGV路径规划视为一个整体,设计一种交通信号与多AGV路径规划协同控制框架,并提出LS-A3C(long short-asynchronous advantage actor-critic)算法和Bi-LSTM-CBAM(bi-long short-term memory-convolutional block attention module)算法作为框架的核心算法。LS-A3C算法使用长短时编码器和注意力机制分别对交通信号的长期信息和短期信息进行编码,以学习元特征表示,并使用A3C框架计算元Q值和控制策略,实现交通信号时间自适应AGV流量,解决多AGV碰撞、死锁和拥堵等问题。Bi-LSTM-CBAM算法通过计算本时刻和前置时刻状态特征,对输出结果进行拼接处理,可以有效解决神经网络梯度消失和爆炸的问题,提高AGV路径规划实时性;引入注意力机制模块CBAM,根据输入信息重要程度分配权重,加强AGV对障碍物识别能力。在Sumo和Gazebo联合仿真平台进行仿真实验,实验结果表明,该协同控制方法使AGV碰撞、死锁及拥堵情况明显降低,障碍物识别能力显著提高,路径规划实时性大幅增强,达到提升AGV作业效率的目的。 展开更多
关键词 智能仓储 深度强化学习 路径规划 Bi-LSTM a3c CBAM
在线阅读 下载PDF
当慧星飞临地球
20
作者 张唯诚 《科学24小时》 2025年第4期23-26,共4页
一颗彗星,在黎明或傍晚的天空中若隐若现——它正在飞临地球。这是2024年最壮观的天文景观:彗星C/2023 A3(Tsuchinshan-ATLAS)闪耀天穹。星C/2023A3由中国科学院紫金山天文台近地天体望远镜于2023年1月9日首次发现,南非阿特拉斯(ATLAS)... 一颗彗星,在黎明或傍晚的天空中若隐若现——它正在飞临地球。这是2024年最壮观的天文景观:彗星C/2023 A3(Tsuchinshan-ATLAS)闪耀天穹。星C/2023A3由中国科学院紫金山天文台近地天体望远镜于2023年1月9日首次发现,南非阿特拉斯(ATLAS)观测计划于2023年2月22日报告其存在彗星特征。 展开更多
关键词 C2023 A3 天文景观
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部