期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
Cooperative Caching for Scalable Video Coding Using Value-Decomposed Dimensional Networks 被引量:2
1
作者 Youjia Chen Yuekai Cai +2 位作者 Haifeng Zheng Jinsong Hu Jun Li 《China Communications》 SCIE CSCD 2022年第9期146-161,共16页
Scalable video coding(SVC)has been widely used in video-on-demand(VOD)service,to efficiently satisfy users’different video quality requirements and dynamically adjust video stream to timevariant wireless channels.Und... Scalable video coding(SVC)has been widely used in video-on-demand(VOD)service,to efficiently satisfy users’different video quality requirements and dynamically adjust video stream to timevariant wireless channels.Under the 5G network structure,we consider a cooperative caching scheme inside each cluster with SVC to economically utilize the limited caching storage.A novel multi-agent deep reinforcement learning(MADRL)framework is proposed to jointly optimize the video access delay and users’satisfaction,where an aggregation node is introduced helping individual agents to achieve global observations and overall system rewards.Moreover,to cope with the large action space caused by the large number of videos and users,a dimension decomposition method is embedded into the neural network in each agent,which greatly reduce the computational complexity and memory cost of the reinforcement learning.Experimental results show that:1)the proposed value-decomposed dimensional network(VDDN)algorithm achieves an obvious performance gain versus the traditional MADRL;2)the proposed VDDN algorithm can handle an extremely large action space and quickly converge with a low computational complexity. 展开更多
关键词 cooperative caching multi-agent deep reinforcement learning scalable video coding value-decomposition network
在线阅读 下载PDF
基于APIQ算法的多无人机攻防对抗策略
2
作者 符小卫 王辛夷 乔哲 《系统工程与电子技术》 北大核心 2025年第7期2205-2215,共11页
在多无人机(unmanned aerial vehicles,UAVs)对抗环境中,由于UAV的数量较大,使用常规深度强化学习方法处理此类问题时可能存在值函数维度爆炸、策略网络难收敛等问题。对此,提出一种基于值分解思想与注意力机制的策略交互Q学习(attentio... 在多无人机(unmanned aerial vehicles,UAVs)对抗环境中,由于UAV的数量较大,使用常规深度强化学习方法处理此类问题时可能存在值函数维度爆炸、策略网络难收敛等问题。对此,提出一种基于值分解思想与注意力机制的策略交互Q学习(attention policy interaction Q-learning,APIQ)集群对抗算法,引入值分解思想,缓解了值函数维度爆炸的问题,并基于注意力机制对值分解中的各值进行权重分配,促进了策略网络的收敛。为验证APIQ算法在多UAV对抗问题中的可行性,建立较为真实的环境模型,并通过仿真验证了该算法的可行性。与其他算法对比结果表明,APIQ算法控制下的UAV具有更高的对抗胜率。 展开更多
关键词 多无人机 强化学习 值分解网络 注意力机制 机动决策
在线阅读 下载PDF
利用虚拟网络光驱建设多媒体素材库
3
作者 李书明 陈云红 甘兴勋 《湖北师范学院学报(自然科学版)》 2001年第1期54-57,共4页
多媒体素材库是计算机和计算机网络教学应用的一个重要前提和保障。文章介绍了一种新型的 CD-ROM服务器软件 ( Virtual Drive Network,VDN) ,并结合应用实践 ,阐述实现共享学校教育技术中心的音像多媒体教育资源的方法。
关键词 vdn 计算机网络 多媒体素材库 教育技术
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部