期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于PYNQ框架的人体目标跟踪系统 被引量:9
1
作者 卫建华 刘润利 +1 位作者 许佳豪 尚晓峰 《国外电子测量技术》 北大核心 2021年第12期89-95,共7页
为了解决传统HDL语言编写现场可编程门阵列(FPGA)部署神经网络算法时存在的开发难度高、周期长、可移植性差的问题,设计了一种基于PYNQ框架的人体目标跟踪系统。该系统将加速的SSD算法部署在低功耗ARM+FPGA的异构计算平台Mizar Z7开发板... 为了解决传统HDL语言编写现场可编程门阵列(FPGA)部署神经网络算法时存在的开发难度高、周期长、可移植性差的问题,设计了一种基于PYNQ框架的人体目标跟踪系统。该系统将加速的SSD算法部署在低功耗ARM+FPGA的异构计算平台Mizar Z7开发板上,对基于卷积神经网络的SSD算法进行软硬件协同开发。PL端设计卷积层加速器,移植PYNQ框架后通过PS端Jupyter Notebook调用综合设计完成ARM与FPGA间高速的信息交互,实现对摄像头采集的图像进行人体目标检测与运动轨迹显示的功能。经过实际测试,该系统可以实现实时识别人体目标、采集人体运动轨迹的功能,可适用于人体目标跟踪相关领域。 展开更多
关键词 pynq框架 目标跟踪 SSD算法 Zynq平台
原文传递
基于PYNQ框架的深度卷积特征异构跟踪系统 被引量:3
2
作者 崔洲涓 安军社 +1 位作者 陈长龙 崔天舒 《计算机工程与应用》 CSCD 北大核心 2021年第4期120-126,共7页
针对深度卷积特征目标跟踪算法中特征提取计算量大、速度慢、难以在嵌入式平台上应用的问题,提出了一种基于PYNQ框架的目标跟踪方案,并将其部署在Zynq异构平台。首先设计基于深度卷积特征的目标跟踪算法;根据算法的特点进行软硬件划分,... 针对深度卷积特征目标跟踪算法中特征提取计算量大、速度慢、难以在嵌入式平台上应用的问题,提出了一种基于PYNQ框架的目标跟踪方案,并将其部署在Zynq异构平台。首先设计基于深度卷积特征的目标跟踪算法;根据算法的特点进行软硬件划分,完成片上系统的构建;然后针对深度卷积特征提取的计算过程进行并行优化,导出加速IP核;最后在PYNQ框架中通过Jupyter Notebooks,使用Python语言调用加速IP核作为硬件协处理器,实现底层到顶层的数据交互。实验结果表明,算法在通用数据集OTB-2015、UAV123上取得了良好的跟踪精度;跟踪速度与未集成加速IP核时相比,提升可达30倍。在兼顾跟踪稳健性的情况下,异构跟踪系统执行效率高,可移植性好,具有工程应用价值。 展开更多
关键词 pynq框架 目标跟踪 深度卷积特征 Zynq 加速
在线阅读 下载PDF
PEST:由PYNQ集群实现的高能效NEST类脑仿真器 被引量:4
3
作者 李佩琦 郁龚健 +2 位作者 华夏 刘家航 柴志雷 《计算机科学与探索》 CSCD 北大核心 2021年第11期2127-2141,共15页
高性能且低功耗地进行大规模类脑仿真是类脑计算所需解决的最具挑战的问题之一。目前类脑计算的实现方式主要分为硬件实现和软件实现两种。通过硬件实现的专用类脑计算芯片与系统可以提供更佳的能效指标,但代价高、适应性差;基于软件方... 高性能且低功耗地进行大规模类脑仿真是类脑计算所需解决的最具挑战的问题之一。目前类脑计算的实现方式主要分为硬件实现和软件实现两种。通过硬件实现的专用类脑计算芯片与系统可以提供更佳的能效指标,但代价高、适应性差;基于软件方式的仿真(如NEST)拥有完整的应用生态,可用性好但存在计算速度慢的问题。如果将两种实现方式相结合,通过软硬件协同设计,可以在保证良好应用生态的同时获得更高的计算能效,提出了一种基于FPGA异构平台PYNQ集群的NEST类脑仿真器的高能效实现(PEST)。通过构建大规模PYNQ集群,设计软硬件数据交互接口实现基于NEST仿真器的规模可伸缩类脑计算系统,针对IAF神经元进行FPGA硬件电路设计,利用MPI分布式计算等方式提升了NEST计算效率。实验结果表明:针对不同的计算模型,在PYNQ集群最佳适配情况下,PEST上神经元更新部分的性能相比AMD 3600X提升超过4.6倍,相比Xeon 2620提升超过7.5倍;PEST的更新能效比相比3600X提升超过5.3倍,相比Xeon 2620提升超过7.9倍。 展开更多
关键词 类脑计算 脉冲神经网络 NEST仿真器 现场可编程门阵列(FPGA) pynq框架
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部