期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于PYNQ的轻量化实时目标检测技术
1
作者 郭向楠 《信息技术与信息化》 2025年第3期42-44,50,共4页
针对边缘端设备在资源受限条件下部署深度学习目标检测算法的需求,文章提出了一种基于PYNQ(python productivity for zynq)框架的轻量化实时目标检测技术,开展YOLOv5n目标检测算法研究及适应FPGA部署的模型优化,完成PYNQ环境下的软硬件... 针对边缘端设备在资源受限条件下部署深度学习目标检测算法的需求,文章提出了一种基于PYNQ(python productivity for zynq)框架的轻量化实时目标检测技术,开展YOLOv5n目标检测算法研究及适应FPGA部署的模型优化,完成PYNQ环境下的软硬件协同设计,并在ZCU104开发板上完成了系统验证。结果表明,所提技术能够实现轻量化深度学习目标检测算法的快速部署与验证,具有良好的检测精度与实时性,能效比达到10.5帧/(s·W),在低成本实时目标检测领域具有较高的应用价值。 展开更多
关键词 目标检测 pynq YOLOv5n 轻量化 边缘端设备
在线阅读 下载PDF
基于Pynq的半全局立体匹配算法实现
2
作者 赵鑫 孟令军 刘威宏 《舰船电子工程》 2024年第2期40-44,共5页
立体匹配算法作为双目立体视觉技术的核心算法,具有运算复杂度高、资源占用率高、实时性差的特点。而现有的基于FPGA实现方法多采用高性能FPGA芯片,利用其板卡丰富的资源进行纯verilog语言开发。这样做虽然实时性效果不错,但存在开发难... 立体匹配算法作为双目立体视觉技术的核心算法,具有运算复杂度高、资源占用率高、实时性差的特点。而现有的基于FPGA实现方法多采用高性能FPGA芯片,利用其板卡丰富的资源进行纯verilog语言开发。这样做虽然实时性效果不错,但存在开发难度较大、周期较长、成本较高的弊端。论文针对该问题,提出了一种基于相对低廉的Pynq-z2开发板在PL+PS端协同开发的SGM立体匹配算法,将运算量大的部分在FPGA端进行硬件加速,部分代价优化算法在ARM端利用Python语言实现。实验表明,该算法可有效降低资源占用率,基本满足在相对低廉的嵌入式设备中实现的要求。 展开更多
关键词 双目立体视觉 资源占用率 半全局立体匹配算法 pynq-z2
在线阅读 下载PDF
一种基于PYNQ的神经网络加速系统 被引量:3
3
作者 赖嘉伟 魏洪健 +1 位作者 孙科学 王艳 《电子设计工程》 2024年第17期16-21,共6页
针对传统卷积神经网络计算复杂度高,耗时较长,难以应用到嵌入式移动端的问题,提出了一种以ZYNQ芯片作为主控的FPAG联合ARM实现的的神经网络加速系统。该系统的PL部分采用纯RTL开发,对卷积层的输入层和输出层进行了全并行化,对卷积窗口... 针对传统卷积神经网络计算复杂度高,耗时较长,难以应用到嵌入式移动端的问题,提出了一种以ZYNQ芯片作为主控的FPAG联合ARM实现的的神经网络加速系统。该系统的PL部分采用纯RTL开发,对卷积层的输入层和输出层进行了全并行化,对卷积窗口进行完全的展开,在一个时钟周期内可以同时完成81次乘法运算,同时对池化层和全连接层采用流水线的优化方式。相比常用的使用高层次综合工具进行优化的方法,该系统使用RTL语言从零开始设计卷积神经网络各个模块,进行了细粒度的优化,避免了冗余逻辑资源的产生,充分利用了片上资源。针对MINIST手写数字识别的网络模型,该系统的DSP利用率达到了95%,在100 MHz时钟频率下,硬件单帧图像处理时间仅为0.81 ms,功耗仅为1.601 W。 展开更多
关键词 pynq ARM处理器 神经网络 现场可编程门阵列 硬件加速器
在线阅读 下载PDF
基于PYNQ的传感器数据采集系统实验案例设计 被引量:8
4
作者 刘玉梅 綦俊炜 +2 位作者 任立群 侯长波 于蕾 《实验技术与管理》 CAS 北大核心 2021年第1期58-64,共7页
为了加强嵌入式系统设计实践教学的效果,提高学生解决复杂工程问题的能力,采用自顶向下的设计方法设计了传感器数据采集系统的实验案例。该案例采用ZYNQ-7000系列为核心的PYNQ-Z2硬件平台,通过Arduino接口连接传感器,利用Xilinx公司的Vi... 为了加强嵌入式系统设计实践教学的效果,提高学生解决复杂工程问题的能力,采用自顶向下的设计方法设计了传感器数据采集系统的实验案例。该案例采用ZYNQ-7000系列为核心的PYNQ-Z2硬件平台,通过Arduino接口连接传感器,利用Xilinx公司的Vivado及SDK进行软、硬件设计与开发。通过该实验案例,使学生深入理解ZYNQ-7000软硬件协同设计原理和方法,以及通过Arduino的模拟、数字、I2C、UART总线通信接口采集传送数据的方法,激发学生对"微处理器结构与嵌入式系统设计"课程的学习兴趣,提升实践教学效果。 展开更多
关键词 嵌入式系统设计 pynq ZYNQ-7000 ARDUINO 自顶向下设计
在线阅读 下载PDF
基于PYNQ框架的人体目标跟踪系统 被引量:9
5
作者 卫建华 刘润利 +1 位作者 许佳豪 尚晓峰 《国外电子测量技术》 北大核心 2021年第12期89-95,共7页
为了解决传统HDL语言编写现场可编程门阵列(FPGA)部署神经网络算法时存在的开发难度高、周期长、可移植性差的问题,设计了一种基于PYNQ框架的人体目标跟踪系统。该系统将加速的SSD算法部署在低功耗ARM+FPGA的异构计算平台Mizar Z7开发板... 为了解决传统HDL语言编写现场可编程门阵列(FPGA)部署神经网络算法时存在的开发难度高、周期长、可移植性差的问题,设计了一种基于PYNQ框架的人体目标跟踪系统。该系统将加速的SSD算法部署在低功耗ARM+FPGA的异构计算平台Mizar Z7开发板上,对基于卷积神经网络的SSD算法进行软硬件协同开发。PL端设计卷积层加速器,移植PYNQ框架后通过PS端Jupyter Notebook调用综合设计完成ARM与FPGA间高速的信息交互,实现对摄像头采集的图像进行人体目标检测与运动轨迹显示的功能。经过实际测试,该系统可以实现实时识别人体目标、采集人体运动轨迹的功能,可适用于人体目标跟踪相关领域。 展开更多
关键词 pynq框架 目标跟踪 SSD算法 Zynq平台
原文传递
基于PYNQ平台的人脸检测系统设计
6
作者 王洁 李鹏飞 《实验室科学》 2023年第4期40-43,47,共5页
ZYNQ平台提供了ARM+FPGA架构用以提高系统执行效率。PYNQ平台在ZYNQ基础上添加了linux+python环境,降低使用异构平台开发计算机视觉算法难度,因此对基于PYNQ的人脸检测系统进行研究。使用vivado工具链设计并实现人脸检测核心算法、使用... ZYNQ平台提供了ARM+FPGA架构用以提高系统执行效率。PYNQ平台在ZYNQ基础上添加了linux+python环境,降低使用异构平台开发计算机视觉算法难度,因此对基于PYNQ的人脸检测系统进行研究。使用vivado工具链设计并实现人脸检测核心算法、使用高层次综合工具将检测算法定制为可复用IP核、添加粘合逻辑将定制的IP核与ZYNQ硬核相连、编写上位机驱动程序控制实现ARM和FPGA数据交互过程、实现数据采集并以视频流输入结果等步骤。此实验案例以软硬件协同设计为指导思想,充分发挥FPGA的并行计算性能和ARM程序设计灵活性,有效提高人脸检测系统执行效率。 展开更多
关键词 pynq平台 人脸检测 软硬件协同设计
在线阅读 下载PDF
基于PYNQ开发板的二值神经网络分类模型研究 被引量:3
7
作者 崔毅 殳国华 李丹 《电气自动化》 2019年第5期53-56,共4页
对人工神经网络(artificial neural network,ANN)、卷积神经网络(convolutional neural network,CNN)以及二值神经网络(binary neural network,BNN)模型的原理进行了深入研究,对二值神经网络的特点和优势进行了说明。为了应用在PYNQ开... 对人工神经网络(artificial neural network,ANN)、卷积神经网络(convolutional neural network,CNN)以及二值神经网络(binary neural network,BNN)模型的原理进行了深入研究,对二值神经网络的特点和优势进行了说明。为了应用在PYNQ开发板上,首先根据传统卷积神经网络的结构搭建了具有适当规模的网络模型,分别在现有的公开数据集如MNIST、CIFAR10、SVHN上进行了训练,取得了良好的分类效果。硬件方面,首先通过HLS综合生成PYNQ开发板可调用的硬件库,再将训练完的权重生成二进制文件进行移植并在开发板上进行分类的预测。测试结果表明,分类模型能在计算资源有限的情况下较为理想地完成分类任务。 展开更多
关键词 现场可编程门阵列(FPGA) pynq开发板 卷积神经网络 二值神经网络
在线阅读 下载PDF
基于HLS和PYNQ图像缩放的硬件加速器设计 被引量:1
8
作者 赵思捷 高尚尚 +3 位作者 王如刚 王媛媛 周锋 郭乃宏 《盐城工学院学报(自然科学版)》 CAS 2023年第2期55-60,共6页
针对CPU进行图像处理已经无法满足系统实时性需求这一情况,提出了一种基于HLS和PYNQ的图像处理硬件加速器设计。该设计利用了FPGA具有数据并行处理的优势,克服了FPGA不易开发、移植性较差的缺陷。首先选择图像缩放处理算法作为实验的测... 针对CPU进行图像处理已经无法满足系统实时性需求这一情况,提出了一种基于HLS和PYNQ的图像处理硬件加速器设计。该设计利用了FPGA具有数据并行处理的优势,克服了FPGA不易开发、移植性较差的缺陷。首先选择图像缩放处理算法作为实验的测试对象;然后在ZYNQ平台上根据软硬件协同的特点分配不同的系统任务,通过HLS开发工具使用C++实现和优化图像处理算法,并转化成RTL文件,再打包成IP核输出;在Vivado2018.3上搭建硬件实验平台,通过JupyterLab对实验进行验证和分析。结果表明,缩放算法的处理速度由CPU端的1110ms缩减为FPGA端的213ms,执行速度提升了5倍。 展开更多
关键词 FPGA 缩放算法 HLS pynq Jupyter Lab
在线阅读 下载PDF
基于PYNQ框架的深度卷积特征异构跟踪系统 被引量:3
9
作者 崔洲涓 安军社 +1 位作者 陈长龙 崔天舒 《计算机工程与应用》 CSCD 北大核心 2021年第4期120-126,共7页
针对深度卷积特征目标跟踪算法中特征提取计算量大、速度慢、难以在嵌入式平台上应用的问题,提出了一种基于PYNQ框架的目标跟踪方案,并将其部署在Zynq异构平台。首先设计基于深度卷积特征的目标跟踪算法;根据算法的特点进行软硬件划分,... 针对深度卷积特征目标跟踪算法中特征提取计算量大、速度慢、难以在嵌入式平台上应用的问题,提出了一种基于PYNQ框架的目标跟踪方案,并将其部署在Zynq异构平台。首先设计基于深度卷积特征的目标跟踪算法;根据算法的特点进行软硬件划分,完成片上系统的构建;然后针对深度卷积特征提取的计算过程进行并行优化,导出加速IP核;最后在PYNQ框架中通过Jupyter Notebooks,使用Python语言调用加速IP核作为硬件协处理器,实现底层到顶层的数据交互。实验结果表明,算法在通用数据集OTB-2015、UAV123上取得了良好的跟踪精度;跟踪速度与未集成加速IP核时相比,提升可达30倍。在兼顾跟踪稳健性的情况下,异构跟踪系统执行效率高,可移植性好,具有工程应用价值。 展开更多
关键词 pynq框架 目标跟踪 深度卷积特征 Zynq 加速
在线阅读 下载PDF
PEST:由PYNQ集群实现的高能效NEST类脑仿真器 被引量:4
10
作者 李佩琦 郁龚健 +2 位作者 华夏 刘家航 柴志雷 《计算机科学与探索》 CSCD 北大核心 2021年第11期2127-2141,共15页
高性能且低功耗地进行大规模类脑仿真是类脑计算所需解决的最具挑战的问题之一。目前类脑计算的实现方式主要分为硬件实现和软件实现两种。通过硬件实现的专用类脑计算芯片与系统可以提供更佳的能效指标,但代价高、适应性差;基于软件方... 高性能且低功耗地进行大规模类脑仿真是类脑计算所需解决的最具挑战的问题之一。目前类脑计算的实现方式主要分为硬件实现和软件实现两种。通过硬件实现的专用类脑计算芯片与系统可以提供更佳的能效指标,但代价高、适应性差;基于软件方式的仿真(如NEST)拥有完整的应用生态,可用性好但存在计算速度慢的问题。如果将两种实现方式相结合,通过软硬件协同设计,可以在保证良好应用生态的同时获得更高的计算能效,提出了一种基于FPGA异构平台PYNQ集群的NEST类脑仿真器的高能效实现(PEST)。通过构建大规模PYNQ集群,设计软硬件数据交互接口实现基于NEST仿真器的规模可伸缩类脑计算系统,针对IAF神经元进行FPGA硬件电路设计,利用MPI分布式计算等方式提升了NEST计算效率。实验结果表明:针对不同的计算模型,在PYNQ集群最佳适配情况下,PEST上神经元更新部分的性能相比AMD 3600X提升超过4.6倍,相比Xeon 2620提升超过7.5倍;PEST的更新能效比相比3600X提升超过5.3倍,相比Xeon 2620提升超过7.9倍。 展开更多
关键词 类脑计算 脉冲神经网络 NEST仿真器 现场可编程门阵列(FPGA) pynq框架
在线阅读 下载PDF
基于PYNQ的图像分类识别技术研究与实现 被引量:6
11
作者 陈禹 谷文成 +3 位作者 渠吉庆 蒋志鹏 张瑛 孙科学 《计算机技术与发展》 2021年第12期73-77,共5页
为了实现低功耗的图像分类识别系统,设计一种基于卷积神经网络的图像分类识别系统方案,该方案研究基于ARM+FPGA异构系统的实现方法,系统搭载于Xilinx的PYNQ嵌入式开发平台。在电脑端对待测试的数据集搭建卷积神经网络模型并完成MNIST和C... 为了实现低功耗的图像分类识别系统,设计一种基于卷积神经网络的图像分类识别系统方案,该方案研究基于ARM+FPGA异构系统的实现方法,系统搭载于Xilinx的PYNQ嵌入式开发平台。在电脑端对待测试的数据集搭建卷积神经网络模型并完成MNIST和CIFAR-10数据集的训练验证。随后设计特征参数提取函数完成权重和偏执参数的提取及格式转换,转换为硬件平台可以进行读取的二进制格式。接着使用Xilinx VIVADO HLS设计工具,设计实现图像分类识别系统中卷积神经网络的自定义IP核模块。完成自定义IP核的设计之后,以IP核模块和ZYNQ模块为主实现整体系统的通路搭建,完成验证后在Jupyter Notebook中通过上位机程序调用控制。最后,完成驱动程序及系统上位机的设计。测试结果表明,系统对MNIST和CIFAR-10数据集的识别可以实现分类,系统功耗仅为1.54 W。该系统具有通用性好、硬件功耗低等优点,可广泛应用于边缘计算环境中。 展开更多
关键词 卷积神经网络 软硬件协同设计 pynq VIVADO Jupyter Notebook
在线阅读 下载PDF
基于PYNQ-Z2人工智能开发平台的人脸追踪检测系统设计 被引量:5
12
作者 王海鹏 李夫玲 +1 位作者 余斌 阮伟华 《科技创新与应用》 2020年第1期12-14,共3页
文章提出一种基于赛灵思嵌入式人工智能FPGA开发平台PYNQ-Z2的人脸追踪检测原型系统。通过搭建Linux环境并运行Jupyter Notebook交互式在线编译器,调用IPython内核和PYNQ的硬件库,导入OpenCV库编写并且编译执行Python程序,可实现在线控... 文章提出一种基于赛灵思嵌入式人工智能FPGA开发平台PYNQ-Z2的人脸追踪检测原型系统。通过搭建Linux环境并运行Jupyter Notebook交互式在线编译器,调用IPython内核和PYNQ的硬件库,导入OpenCV库编写并且编译执行Python程序,可实现在线控制PYNQ-Z2来获得视频流输入并对视频数据进行传输和处理,从而实现人脸图像的分析与检测。本设计利用了PYNQ-Z2的可编程系统(PS)和可编程逻辑(PL)的交互式数据传输处理,尽可能的发挥ARM和FPGA的优势,从而实时的进行人脸检测。 展开更多
关键词 现场可编程门阵列(FPGA) 深度学习 人脸识别 PYTHON OPENCV pynq
在线阅读 下载PDF
基于SSD算法与PYNQ-Z2平台的智能收银系统 被引量:3
13
作者 杨清勇 韩进 +1 位作者 管明星 王全秀 《单片机与嵌入式系统应用》 2019年第9期66-68,72,共4页
设计了一款智能超市收银系统。系统由商品信息采集模块、商品检测模块、上位机计价模块三部分组成。商品信息采集模块通过摄像头采集检测区域内商品的图像,通过USB接口传输到PYNQ的ARM端;商品检测模块负责将采集的商品图像在PYNQ平台上... 设计了一款智能超市收银系统。系统由商品信息采集模块、商品检测模块、上位机计价模块三部分组成。商品信息采集模块通过摄像头采集检测区域内商品的图像,通过USB接口传输到PYNQ的ARM端;商品检测模块负责将采集的商品图像在PYNQ平台上进行图像尺寸、格式调整等预处理工作,并传输给上位机,上位机将预处理后的商品图像与已训练好的商品模型进行匹配识别,并将检测结果反馈给计价模块;计价模块展示识别出的商品图像以及商品相关信息,同时实现结算、清零等功能。测试结果表明,本系统能一次检测多个商品并同步结算,为超市收银方式提供了一种新方案。 展开更多
关键词 深度学习 收银系统 pynq 物联网 SSD
在线阅读 下载PDF
基于PYNQ的运动目标检测系统 被引量:1
14
作者 陈支鹏 张霞 +1 位作者 白鹏 李超 《电子设计工程》 2023年第24期172-176,共5页
运动目标检测技术作为计算机视觉领域的研究热点之一,在智能安防、重点场所监控等领域应用广泛。为了在PYNQ-Z2开发平台上实现运动目标检测系统,基于软硬件协同设计的思想进行了系统功能划分。在可编程逻辑PL部分,使用Xilinx Vitis HLS... 运动目标检测技术作为计算机视觉领域的研究热点之一,在智能安防、重点场所监控等领域应用广泛。为了在PYNQ-Z2开发平台上实现运动目标检测系统,基于软硬件协同设计的思想进行了系统功能划分。在可编程逻辑PL部分,使用Xilinx Vitis HLS工具进行图像处理模块硬件加速IP核的开发和整合。在处理系统PS端,通过Jupyter Notebook平台使用Python语言进行视频数据的读取以及硬件的调用。实验结果表明,在PYNQ-Z2平台上实现了运动目标检测系统,可同时对多个运动目标进行检测,在输入视频分辨率为800×600时的处理速度为14.3帧/秒,基本能满足实时性要求。 展开更多
关键词 pynq 运动目标检测 帧间差分法 软硬件协同设计 IP核
在线阅读 下载PDF
PYNQ中实现SoftMax函数加速器 被引量:3
15
作者 孙齐伟 《电子产品世界》 2019年第6期69-73,76,共6页
SoftMax函数通常在深度学习中作为激活函数使用,但其计算涉及自然指数和除法运算,传统PC机上计算较慢,拖累了一个神经网络的训练。本文针对自然指数运算的特点,提出了一种名为基底拆分法的新方法。该方法将SoftMax函数中自然指数计算拆... SoftMax函数通常在深度学习中作为激活函数使用,但其计算涉及自然指数和除法运算,传统PC机上计算较慢,拖累了一个神经网络的训练。本文针对自然指数运算的特点,提出了一种名为基底拆分法的新方法。该方法将SoftMax函数中自然指数计算拆分为多个由查找表实现的特定基底上,通过这种方法,一个复杂的自然指数计算过程即可由查找表过程和乘法过程实现。这种方法有效的降低了硬件复杂度以及逻辑传播延时。由于该方法中使用了自定义的数据结构,因此本文采用了CPU+FPGA的架构,通过合理分工,加速SoftMax函数计算。同时,本文将基于这种方法设计的IP核在PYNQ-Z2开发板上进行了板级调试。 展开更多
关键词 pynq ZYNQ SoftMax AXI总线 异构计算
在线阅读 下载PDF
基于PYNQ和STM32的自主式宠物跟随陪护系统
16
作者 朱平平 胡乃瑞 +2 位作者 王富帅 焦东海 伯丽欣 《自动化技术与应用》 2023年第3期175-178,183,共5页
研究了一款基于PYNQ和STM32的自主式宠物跟随陪护系统,实现对宠物的实时陪护及自动喂食等功能。系统以STM32为主控芯片,在PYNQ上搭载改进型YOLO算法对图像进行实时处理,通过GPRS模块将宠物健康信息传送至PC端监测,并可通过PC端监测软件... 研究了一款基于PYNQ和STM32的自主式宠物跟随陪护系统,实现对宠物的实时陪护及自动喂食等功能。系统以STM32为主控芯片,在PYNQ上搭载改进型YOLO算法对图像进行实时处理,通过GPRS模块将宠物健康信息传送至PC端监测,并可通过PC端监测软件远程向终端下达指令。测试表明系统对宠物的识别准确率为82.3%,最高帧率可达11帧/秒;2小时内跟丢宠物次数平均为1.8次,跟丢后找回率为88.9%,具有较好的宠物识别及跟踪效果。 展开更多
关键词 宠物陪护 Tiny-YOLO算法 STM32 pynq
在线阅读 下载PDF
基于PYNQ的智能识别心电图机设计研究
17
作者 唐月 韩东起 孙启航 《信息与电脑》 2021年第6期174-176,共3页
在当今社会,心血管疾病仍然是威胁人类健康的主要疾病之一。例如,心脏病具有突发性强、不易被人察觉的特点,对病人来说,早一刻接受医生的诊断和治疗,脱离危险的机会就越大。笔者采用PYNQ电子芯片技术,基于RegNet模型、ResNeSt模型、Effi... 在当今社会,心血管疾病仍然是威胁人类健康的主要疾病之一。例如,心脏病具有突发性强、不易被人察觉的特点,对病人来说,早一刻接受医生的诊断和治疗,脱离危险的机会就越大。笔者采用PYNQ电子芯片技术,基于RegNet模型、ResNeSt模型、EfficientNet模型设计了一个智能识别心电图机,不仅可以大大减少医生的工作强度,还能提高诊断的准确率。 展开更多
关键词 pynq电子芯片 算法融合 心电信号智能识别
在线阅读 下载PDF
一种改进型LeNet的交通标识多分类异构加速器的实现 被引量:1
18
作者 杨永杰 郑君泰 +1 位作者 马立 杨昊 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期1001-1008,共8页
提出一种基于改进型LeNet的交通标志多分类异构加速器的实现方案。该加速器利用ARM+FPGA异构平台,将改进型LeNet的前向推理部署到FPGA上,实现并行计算。在FPGA端,采用AXI-Stream协议,通过DMA实现数据高速流转,使用数组分区和多级流水线... 提出一种基于改进型LeNet的交通标志多分类异构加速器的实现方案。该加速器利用ARM+FPGA异构平台,将改进型LeNet的前向推理部署到FPGA上,实现并行计算。在FPGA端,采用AXI-Stream协议,通过DMA实现数据高速流转,使用数组分区和多级流水线等技术实现数据的并行处理。在ARM端使用PYNQ框架进行数据更新和加速器调度。在GTSRB数据集上的实验结果显示,该设计方案在工作时钟频率为50 MHz时,平均推理时间为14.489 ms,在MCU上的推理时间为710 ms,加速比可达49,对于实现交通标识多分类的边缘端应用具有显著的作用。 展开更多
关键词 LeNet FPGA pynq 异构计算
在线阅读 下载PDF
基于FPGA的图像处理硬件加速系统的设计 被引量:3
19
作者 张灿宇 封岸松 +2 位作者 张华良 易星 王俊彭 《计算机工程与设计》 北大核心 2024年第3期723-731,共9页
为解决图像处理算法越来越复杂,普通的计算平台已满足不了当前需求的问题,根据现场可编程门阵列(field programmable gate array, FPGA)的并行计算特点对FAST角点检测算法和Sobel边缘检测算法进行硬件加速,采用HLS(high-level synthesis... 为解决图像处理算法越来越复杂,普通的计算平台已满足不了当前需求的问题,根据现场可编程门阵列(field programmable gate array, FPGA)的并行计算特点对FAST角点检测算法和Sobel边缘检测算法进行硬件加速,采用HLS(high-level synthesis, HLS)高层次综合技术对两种算法进行设计并进行相应的优化。为提升系统整体性能,在FPGA上实现全部视频输入输出接口和图像算法的完整通路,通过FPGA算法电路与OpenCV算法程序进行对比,前者的图像处理速度快于后者9~11倍,系统功耗也仅为1.9 W,图像检测可达56 fps,满足实时图像处理要求,为以后设计复杂的图像处理系统提供了参考。 展开更多
关键词 现场可编程门阵列 硬件加速 高层次综合技术 图像处理 pynq-Z2 角点检测 边缘检测
在线阅读 下载PDF
轻量化高效目标检测平台的设计
20
作者 谢凯亮 张华君 +3 位作者 陈文鑫 陈思贇 黄启俊 常胜 《电子设计工程》 2024年第15期1-6,共6页
基于人工智能的目标检测算法作为安防监控、辅助驾驶等方向的核心技术,其在边缘端的应用落地已成为研究热点。一方面,目标检测网络计算量大、参数量多,往往占据器件的大量资源;另一方面,目标检测应用的落地普遍需要满足高效、实时性等... 基于人工智能的目标检测算法作为安防监控、辅助驾驶等方向的核心技术,其在边缘端的应用落地已成为研究热点。一方面,目标检测网络计算量大、参数量多,往往占据器件的大量资源;另一方面,目标检测应用的落地普遍需要满足高效、实时性等要求。针对实际应用场景中以上问题的考量,提出了可增强小目标检测能力的带有旁路(Bypass)的目标检测网络模型,并面向边缘端落地对该模型进行了轻量化和高效并行化设计。其中,轻量化设计方面,运用了深度可分离卷积、BRAM复用、多精度参数等多种优化策略;高效并行化方面,在多尺度上对输入输出通道、卷积核进行了并行化设计。在PYNQ框架下,完成了轻量化高效目标检测平台的搭建,实现帧率达到44.5 FPS、IoU为0.68的检测性能,满足了边缘端落地的需求。 展开更多
关键词 目标检测 硬件加速 pynq 现场可编程逻辑门阵列 轻量化设计
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部