期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于蜂鸟E203的多级动态分支预测器 被引量:1
1
作者 魏一 杨智杰 +5 位作者 铁俊波 石伟 周理 王耀 王蕾 徐炜遐 《计算机工程与科学》 CSCD 北大核心 2024年第5期785-793,共9页
近年来,以蜂鸟E203为代表的开源RISC-V微处理器由于功耗低、性能好等优势,受到了学术界和工业界的广泛关注和应用。为提高微处理器性能,降低分支指令造成的流水线停顿,指令分支预测技术成为现代微处理器中广泛应用的重要技术之一。然而... 近年来,以蜂鸟E203为代表的开源RISC-V微处理器由于功耗低、性能好等优势,受到了学术界和工业界的广泛关注和应用。为提高微处理器性能,降低分支指令造成的流水线停顿,指令分支预测技术成为现代微处理器中广泛应用的重要技术之一。然而,蜂鸟E203现采用的分支预测器是轻量级的静态分支预测器,面临分支预测准确率较低的挑战。由于使用预测准确率较高的动态分支预测器,可以进一步降低由于预测错误导致的重定向取指所产生的开销,因此,针对上述挑战,在原微架构的基础上探索了多种动态分支预测器的实现,提高了分支预测精度并且兼顾了资源开销。实验结果表明,多种动态分支预测器中获得最优结果的是使用静态分支预测结合基于分支历史寄存器BHR的自适应动态分支预测器,在Dhrystone基准测试程序上其分支预测精度可从原来的84.6%最高提升至94.8%,分数从原来的1.296463提高到1.314418,在Coremark基准测试程序上其分支预测精度可从原来的67%提升至78.7%,分数从原来的2.120000提升至2.138008。 展开更多
关键词 动态分支预测 蜂鸟e203 RISC-V 流水线 微架构
在线阅读 下载PDF
基于RISC-V的LMS算法加速方案
2
作者 叶岸茏 马令坤 曲宗一 《集成电路与嵌入式系统》 2025年第5期52-59,共8页
LMS算法作为基本的自适应滤波算法,在噪声抑制领域得到了广泛应用,其实现方式主要基于通用处理器,但存在运算效率和性能较低的问题。RISC-V架构具有开源、精简、扩展性强等优势,适用于专用型处理器的实现。本文针对LMS算法设计了基于RIS... LMS算法作为基本的自适应滤波算法,在噪声抑制领域得到了广泛应用,其实现方式主要基于通用处理器,但存在运算效率和性能较低的问题。RISC-V架构具有开源、精简、扩展性强等优势,适用于专用型处理器的实现。本文针对LMS算法设计了基于RISC-V的专用处理器。采用自定义指令集F扩展处理浮点数,并且在协处理器中加入MAC指令完成针对LMS算法的加速。实验结果表明,该处理器能够实现噪声的有效抵消,当输入信噪比为5 dB时,消噪后信噪比为17.5 dB;系统使用FPU执行LMS算法,指令执行数为220354,执行周期为586221;当采用本设计方案时,工作在FPU+MAC方式下,指令执行数为31621,执行周期为89412,效率明显提高。 展开更多
关键词 RISC-V 协处理器 LMS FPU 蜂鸟e203
在线阅读 下载PDF
基于RISC-V的高效访存指令扩展与硬件实现
3
作者 徐俊杰 张加宏 +3 位作者 魏敬和 刘国柱 何健 尤兴宇 《电子科技》 2025年第6期45-51,共7页
MCU(Micro Control Unit)是神经网络模型硬件端在部署推理时常用的数据流控制手段,访存操作是MCU数据流控制中的主要执行内容。针对传统指令集架构的MCU所支持的访存指令存在效率低、灵活性差等问题,文中基于RISC-V(Reduced Instruction... MCU(Micro Control Unit)是神经网络模型硬件端在部署推理时常用的数据流控制手段,访存操作是MCU数据流控制中的主要执行内容。针对传统指令集架构的MCU所支持的访存指令存在效率低、灵活性差等问题,文中基于RISC-V(Reduced Instruction Set Computer V)指令集展开了SIMD(Single Instruction Multiple Data)扩展研究。根据RISC-V官方预留的指令扩展编码空间设计了高效的访存指令。为支持新扩展指令的正确执行,基于芯来科技开源的蜂鸟E203内核扩展相关硬件电路。通过对比基本内核和扩展内核针对相同功能软件负载的执行结果来评估扩展内核的性能。结果表明扩展E203内核在16 Byte地址空间连续访存时,指令数同比缩减了65.23%,执行周期缩减了66.12%,并且随着访存数量的增加,扩展内核的能效比也越高。 展开更多
关键词 指令集扩展 RISC-V指令集架构 SIMD 蜂鸟e203 高效访存 硬件部署 数据流 指令缩减
在线阅读 下载PDF
基于RISC-V扩展指令的车牌识别协处理器设计
4
作者 赵晨旭 曲英杰 王海婷 《集成电路与嵌入式系统》 2025年第4期47-53,共7页
随着智能交通系统的发展,车牌识别系统已经从传统PC平台转为便携式的嵌入式终端,对现有的车牌识别系统的精度、速度以及安全性提出了更高的要求。RISC-V是一款具有开源、精简、高效、低功耗、模块化等优点的指令集架构,具有高度灵活性... 随着智能交通系统的发展,车牌识别系统已经从传统PC平台转为便携式的嵌入式终端,对现有的车牌识别系统的精度、速度以及安全性提出了更高的要求。RISC-V是一款具有开源、精简、高效、低功耗、模块化等优点的指令集架构,具有高度灵活性。本文设计了一种基于蜂鸟E203 RISC-V处理器的车牌识别系统,并采用改进的基于八方向的Sobel算子高精度边缘检测算法,在达芬奇PRO开发板上搭建系统进行硬件实现。实验结果表明,该系统识别正确率为97%,平均识别时间在46 ms左右,具有较高的识别准确率和实时性,与传统的车牌识别系统相比,该系统具有较高性价比。 展开更多
关键词 蜂鸟e203 RISC-V 车牌识别 边缘检测 FPGA
在线阅读 下载PDF
基于蜂鸟E203 RISC-V处理器的QR码识别系统设计
5
作者 王宇 王法翔 《单片机与嵌入式系统应用》 2023年第5期7-10,共4页
针对日常生活中常见的QR码应用,基于蜂鸟E203 RISC-V处理器架构设计了一款QR码识别系统。通过对系统内部关键组成单元进行定制化的硬件设计以及配套软件算法的实现,完成整体系统环境的搭建,并通过了系统功能验证。另外,本文还对不同情... 针对日常生活中常见的QR码应用,基于蜂鸟E203 RISC-V处理器架构设计了一款QR码识别系统。通过对系统内部关键组成单元进行定制化的硬件设计以及配套软件算法的实现,完成整体系统环境的搭建,并通过了系统功能验证。另外,本文还对不同情形下的QR码进行相应的测试。测试结果表明,在系统工作频率为32 MHz时,平均识别耗时为705 ms,正确识别率为96%,证实了该系统的可行性。 展开更多
关键词 蜂鸟e203 QR码 SOC FPGA RISC-V
在线阅读 下载PDF
基于RISC-V指令扩展方式的国密算法SM2、SM3和SM4的高效实现 被引量:6
6
作者 王明登 严迎建 +1 位作者 郭朋飞 张帆 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2850-2865,共16页
基于指令扩展的密码算法实现是兼顾性能和面积的轻量级实现方式,特别适用于日益普及的物联网设备.SM2、SM3和SM4等国密算法有利于提高自主可控设备的安全性,但针对这些算法进行指令扩展的相关研究还不够充分.RISC-V由于其开源、简洁及... 基于指令扩展的密码算法实现是兼顾性能和面积的轻量级实现方式,特别适用于日益普及的物联网设备.SM2、SM3和SM4等国密算法有利于提高自主可控设备的安全性,但针对这些算法进行指令扩展的相关研究还不够充分.RISC-V由于其开源、简洁及可扩展等优点已成为业界最流行的指令集架构之一,本文主要基于国产开源RISC-V处理器对国密算法SM2、SM3和SM4进行指令扩展和高效实现.本文基于软硬件协同的理念提出总体指令的扩展方案.对相关密码算法进行深入分析和方案对比,分别设计了硬件单元,提出高效的实现方式.设计实现的协处理器具有2级流水线结构,顺序派遣、乱序执行和顺序写回的指令执行模式,以及独立内存访问单元和大位宽寄存器.协处理器统一接管了密码算法的部分控制逻辑,降低硬件资源消耗.实验结果表明,本文设计的密码协处理器硬件结构精简,资源利用率高.SM2、SM3和SM4算法占用资源少,但执行速率相比纯硬件有一定程度下降,资源面积和花费时间的乘积与其他相关文献相比有不同程度的优势. 展开更多
关键词 RISC-V 协处理器 国密算法 指令扩展 蜂鸟e203 嵌入式系统
在线阅读 下载PDF
基于RISC-V的神经网络卷积算法的研究与优化 被引量:3
7
作者 苗瑞霞 张雪兰 +1 位作者 谭星浩 方华启 《计算机工程与设计》 北大核心 2022年第3期668-676,共9页
为加速嵌入式平台ARM CMSIS-NN上的神经网络卷积算法,提出一种面向开源RISC-V(精简指令级架构第五代)的卷积算法。采用RISC-V的P拓展指令集中特有的8位数据操作指令,优化ARM CMSIS-NN(微处理器软件接口标准)库中因为缺少DSP指令8位数据... 为加速嵌入式平台ARM CMSIS-NN上的神经网络卷积算法,提出一种面向开源RISC-V(精简指令级架构第五代)的卷积算法。采用RISC-V的P拓展指令集中特有的8位数据操作指令,优化ARM CMSIS-NN(微处理器软件接口标准)库中因为缺少DSP指令8位数据操作指令而带来的内存使用效率不高的不足。经实验仿真和下板验证,在蜂鸟E203 FPGA开发板上以16 MHz的时钟频率完成功能验证,与同等实验室实验情况下的arm-cortex-m3等设备相比,性能提升约12倍。 展开更多
关键词 ARM CMSIS-NN RISC-V 神经网络卷积算法 DSP指令集 蜂鸟e203 FPGA
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部