期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于拟牛顿法的深度强化学习在车联网边缘计算中的研究 被引量:4
1
作者 章坚武 芦泽韬 +1 位作者 章谦骅 詹明 《通信学报》 EI CSCD 北大核心 2024年第5期90-100,共11页
为了解决车联网中由于多任务和资源限制导致的任务卸载决策不理想的问题,提出了拟牛顿法的深度强化学习双阶段在线卸载(QNRLO)算法。该算法首先引入批归一化技术优化深度神经网络的训练过程,随后采用拟牛顿法进行优化,有效逼近最优解。... 为了解决车联网中由于多任务和资源限制导致的任务卸载决策不理想的问题,提出了拟牛顿法的深度强化学习双阶段在线卸载(QNRLO)算法。该算法首先引入批归一化技术优化深度神经网络的训练过程,随后采用拟牛顿法进行优化,有效逼近最优解。通过此双阶段优化,算法显著提升了在多任务和动态无线信道条件下的性能,提高了计算效率。通过引入拉格朗日算子和重构的对偶函数,将非凸优化问题转化为对偶函数的凸优化问题,确保算法的全局最优性。此外,算法考虑了车联网模型中的系统传输时间分配,增强了模型的实用性。与现有算法相比,所提算法显著提高了任务卸载的收敛性和稳定性,并能有效处理车联网中的任务卸载问题,具有较高的实用性和可靠性。 展开更多
关键词 车联网 任务卸载 深度强化学习 拟牛顿法
在线阅读 下载PDF
基于深度强化学习的无人机博弈路径规划 被引量:1
2
作者 薛均晓 张世文 +2 位作者 陆亚飞 严笑然 付玮 《郑州大学学报(理学版)》 北大核心 2025年第4期8-14,共7页
针对深度强化学习方法在复杂环境下面对无人机博弈任务时学习效率较低的问题,提出了知识和数据联合驱动的深度强化学习模型。首先,借鉴了模仿学习的思想,将遗传算法作为启发式搜索策略,并收集专家经验知识;其次,通过深度强化学习与环境... 针对深度强化学习方法在复杂环境下面对无人机博弈任务时学习效率较低的问题,提出了知识和数据联合驱动的深度强化学习模型。首先,借鉴了模仿学习的思想,将遗传算法作为启发式搜索策略,并收集专家经验知识;其次,通过深度强化学习与环境进行交互,收集在线经验数据;最后,构建了知识和数据联合驱动的深度强化学习模型,用于优化无人机博弈策略。实验结果表明,所提模型有效提升了收敛速度和学习稳定性,经过训练的智能体具有较好的自主博弈路径规划能力。 展开更多
关键词 深度强化学习 无人机博弈 路径规划 遗传算法
在线阅读 下载PDF
元宇宙多模态触觉感知与交互的数据手套技术研究 被引量:2
3
作者 任弘毅 刘畅 +3 位作者 陈铭 杨文珍 MUKHERJEE M 潘志庚 《测控技术》 2024年第4期50-55,99,共7页
为了提升元宇宙虚拟手交互的逼真性,研发了一种多模态触觉感知与交互的数据手套系统,该系统具有硬件集成度高、响应速度快、数据采集精确和轻便易穿戴的特点。人手穿戴此数据手套后,系统能够采集人手操作时的温度、指尖按压力和手指弯... 为了提升元宇宙虚拟手交互的逼真性,研发了一种多模态触觉感知与交互的数据手套系统,该系统具有硬件集成度高、响应速度快、数据采集精确和轻便易穿戴的特点。人手穿戴此数据手套后,系统能够采集人手操作时的温度、指尖按压力和手指弯曲程度等数据,并把这些数据实时赋予给虚拟环境中的虚拟手,让虚拟手具有类似人手的动作行为和感知。提出了一种多通道循环采集数据方法,该方法可以高效且准确地捕捉温度、指尖按压力和手指弯曲程度等异构多模态数据,减轻了数据手套的硬件电路复杂性。实验结果表明,此数据手套在获取实时手指动作信息方面精度较高,提升了虚拟手动作的灵活性、直观性和自然性。 展开更多
关键词 数据手套 人机交互 嵌入式系统 虚拟现实 元宇宙
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部