期刊文献+
共找到501篇文章
< 1 2 26 >
每页显示 20 50 100
UNI-SPEC:An Instruction Set Description Language 被引量:2
1
作者 朱德新 Cheng +2 位作者 Xu Song Chuanhua 《High Technology Letters》 EI CAS 2003年第4期33-38,共6页
Microprocessor development emphasizes hardware and software co design. Hw/Sw co design is a modern technique aimed at shortening the time to market in designing the real time and embedded systems. Key feature of this ... Microprocessor development emphasizes hardware and software co design. Hw/Sw co design is a modern technique aimed at shortening the time to market in designing the real time and embedded systems. Key feature of this approach is simultaneous development of the program tools and the target processor to match software application. An effective co design flow must therefore support automatic software toolkits generation, without loss of optimizing efficiency. This has resulted in a paradigm shift towards a language based design methodology for microprocessor optimization and exploration. This paper proposes a formal grammar, UNI SPEC, which supports the automatic generation of assemblers, to describe the translation rules from assembly to binary. Based on UNI SPEC, it implements two typical applications, i.e., automatically generating the assembler and the test suites. 展开更多
关键词 formal grammar retargetable assembler generator instruction set architecture
在线阅读 下载PDF
Asynchronous Complex Pipeline Design Based on ARM Instruction Set 被引量:1
2
作者 王兵 王琴 +1 位作者 彭瑞华 付宇卓 《Journal of Shanghai Jiaotong university(Science)》 EI 2008年第5期568-573,共6页
This paper proposes an asynchronous complex pipeline based on ARM-V3 instruction set. Muller pipeline structure is used as prototype, and the factors which may affect pipeline performance are analyzed. To balance the ... This paper proposes an asynchronous complex pipeline based on ARM-V3 instruction set. Muller pipeline structure is used as prototype, and the factors which may affect pipeline performance are analyzed. To balance the difficulty of asynchronous design and performance analysis, both complete asynchronous and partial asynchronous structures aere designed and compared. Results of comparison with the well-Rnown industrial product ARM922T verify that about 30% and 40% performance improvement of the partiM and complete asynchronous complex pipelines can be obtained respectively. The design methodologies can also be used in the design of other asynchronous pipelines. 展开更多
关键词 asynchronous pipeline ARM instruction set pipeline stall instruction prediction
原文传递
Analyzing and Seeking Minimum Test Instruction Set of Digital Signal Processor for Motor Control
3
作者 严伟 曹家麟 龚幼民 《Journal of Shanghai University(English Edition)》 CAS 2005年第2期147-152,共6页
The relativity of instructions of motor control digital signal processor (MCDSP) in the design is analyzed. A method for obtaining a minimum instruction set in plac e of the complete instruction set during generatio... The relativity of instructions of motor control digital signal processor (MCDSP) in the design is analyzed. A method for obtaining a minimum instruction set in plac e of the complete instruction set during generation of testing procedures is giv en in terms of the processor presentation matrix between micro-operators and in structions of MCDSP. 展开更多
关键词 minimum instruction set functional test digital signal processor(DSP).
在线阅读 下载PDF
Verification of instruction set specification for an ASIP
4
作者 纪金松 MAIER Stefan +1 位作者 聂晓宁 周学海 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2008年第4期482-486,共5页
In order to gain the great performance of ASIP, this paper discusses different aspects of an ASIP instruction set specification like syntax, encoding, constraints as welt as behaviors, and introduces our ADL model bas... In order to gain the great performance of ASIP, this paper discusses different aspects of an ASIP instruction set specification like syntax, encoding, constraints as welt as behaviors, and introduces our ADL model based methodology to check them. The automatic generation of test cases based on our straight-forward instruction representation is shown, and the efficient generation of them with good coverage is shown as well. The verification of the constraint checker, a very important tool for programmer, is performed. Results show that the toolkit can find some errors in previous delivery tools, and the introduced methodology verifies the feasibility of our instruction set specification. 展开更多
关键词 VERIFICATION ASIP instruction set specification ADL
在线阅读 下载PDF
An efficient adapting virtual intermediate instruction set towards optimized dynamic binary translator (DBT) system
5
作者 杨吟冬 管海兵 《Journal of Central South University》 SCIE EI CAS 2012年第11期3118-3128,共11页
A new efficient adapting virtual intermediate instruction set,V-IIS,is designed and implemented towards the optimized dynamic binary translator (DBT) system.With the help of this powerful but previously little-studied... A new efficient adapting virtual intermediate instruction set,V-IIS,is designed and implemented towards the optimized dynamic binary translator (DBT) system.With the help of this powerful but previously little-studied component,DBTs can not only get rid of the dependence of machine(s),but also get better performance.From our systematical study and evaluation,experimental results demonstrate that if V-IIS is well designed,without affecting the other optimizing measures,this could make DBT's performance close to those who do not have intermediate instructions.This study is an important step towards the grand goal of high performance "multi-source" and "multi-target" dynamic binary translation. 展开更多
关键词 binary translation virtual intermediate instruction set dynamic binary translator (DBT)
在线阅读 下载PDF
基于多操作数的RISC-V指令集设计与功能优化方法 被引量:2
6
作者 张钰儿 席宇浩 刘鹏 《计算机工程与科学》 北大核心 2025年第6期968-975,共8页
RISC-V架构凭借其开放性和模块化的指令集架构(ISA)设计,为特定应用及其软件生态系统的定制指令集成提供了良好支持,使其能够高效处理复杂算法并执行重复性操作。然而,由于操作数数量的限制,为RISC-V处理器设计加速指令仍面临挑战。传... RISC-V架构凭借其开放性和模块化的指令集架构(ISA)设计,为特定应用及其软件生态系统的定制指令集成提供了良好支持,使其能够高效处理复杂算法并执行重复性操作。然而,由于操作数数量的限制,为RISC-V处理器设计加速指令仍面临挑战。传统处理器加速方法通常采用“2输入1输出”模型,这在一定程度上限制了复杂操作的灵活性与执行效率。为突破该限制,提出了一种多操作数增强指令集的设计方法。该方法通过引入多操作数加速机制,突破了传统模型的结构性约束,为多输入多输出任务提供了灵活的指令接口。为验证所提机制的有效性,基于Western Digital开源的RISC-V VeeR EH1处理器核实现了该设计,并在FPGA平台上进行了基准测试,涵盖SHA-256,SHA-1以及FIR/IIR滤波器等典型算法。实验结果表明,在FPGA平台上的逻辑资源开销控制在3%以内的情况下,处理器性能最高提升可达14%。与传统“2输入1输出”加速方法相比,所提出的增强指令集设计能够显著提升RISC-V在复杂任务处理中的性能,展示了其在嵌入式计算和专用加速领域的潜在优势。 展开更多
关键词 risc-v 自定义指令 软硬件协同设计
在线阅读 下载PDF
NA-ROB:基于RISC-V超标量处理器的改进 被引量:2
7
作者 景超霞 刘杰 +1 位作者 李洪奎 刘红海 《计算机应用研究》 北大核心 2025年第2期519-522,共4页
重排序缓存(ROB)是超标量处理器中的重要模块,用于确保乱序执行的指令能够正确地完成和提交。然而,在大规模超标量处理器中,存在ROB阻塞以及ROB容量有限的问题。为了解决上述问题并提高处理器性能,提出了零寄存器分配策略,通过将没有目... 重排序缓存(ROB)是超标量处理器中的重要模块,用于确保乱序执行的指令能够正确地完成和提交。然而,在大规模超标量处理器中,存在ROB阻塞以及ROB容量有限的问题。为了解决上述问题并提高处理器性能,提出了零寄存器分配策略,通过将没有目的寄存器的指令单独存储来避免占用ROB表项。同时,引入容量可动态调整的缓存结构(AROB),将长延时指令与普通指令分别存储在ROB和AROB中,以降低长延时指令导致的阻塞。改进后的超标量处理器被命名为NA-ROB,经过SPEC 2006基准测试程序的实验评估,结果表明,NA-ROB超标量处理器相比于传统的ROB超标量处理器,平均IPC提升了66%,同时ROB的阻塞概率降低了48%。因此,所提出的改进方法显著提升了处理器的整体性能和效率。 展开更多
关键词 risc-v指令集 超标量处理器 ROB AROB 零寄存器分配策略
在线阅读 下载PDF
基于RISC-V Matrix指令集扩展的LLM矢量点积加速研究 被引量:1
8
作者 陈煦豪 胡思鹏 +3 位作者 刘洪超 刘伯然 唐丹 赵地 《计算机科学》 北大核心 2025年第5期83-90,共8页
鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效... 鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效大语言模型(LLM)推理计算的需求。针对大语言模型的特性,基于RISC-V指令集扩展了自定义指令完成矢量点积计算,在专用的矢量点积加速硬件上进行大语言模型的运算加速;基于开源高性能RISC-V处理器核“香山”nanhu版本架构,实现了矢量点积专用指令集处理器nanhu-vdot,其在高性能处理器“香山”(nanhu版本)的基础上增加了矢量点积计算单元以及流水线处理逻辑;对nanhu-vdot进行FPGA硬件测试,在几乎没有增加额外的硬件资源和功耗消耗的前提下,矢量点积运算速度相比标量方法提高4倍以上,使用软硬件协同方案进行第二代生成式预训练(Generative Pre-Trained-2,GPT-2)模型推理,相比纯软件实现,速度提高了约30%。 展开更多
关键词 指令集扩展 矢量点积 软硬件协同 大语言模型推理
在线阅读 下载PDF
基于RISC-V指令扩展的神经网络计算加速架构
9
作者 蔡成欢 王一品 +5 位作者 许嘉滨 张逢喆 周学功 曹伟 张帆 余新胜 《计算机科学》 北大核心 2025年第12期1-8,共8页
针对现阶段以RISC-V为核心的神经网络加速器对Transformer架构模型中矩阵计算及非线性计算加速不足的问题,开展了基于RISC-V指令扩展的神经网络计算加速架构研究,提出名为Taurus的神经网络加速器架构。针对模型架构特点,进行了矩阵指令... 针对现阶段以RISC-V为核心的神经网络加速器对Transformer架构模型中矩阵计算及非线性计算加速不足的问题,开展了基于RISC-V指令扩展的神经网络计算加速架构研究,提出名为Taurus的神经网络加速器架构。针对模型架构特点,进行了矩阵指令扩展,并使用脉动阵列进行矩阵乘累加计算;为支持非线性计算加速,进行向量指令扩展,并设计特殊向量单元完成LayerNorm和Softmax的计算;为保证数据供给平衡,优化访存指令扩展,以保证矩阵计算单元、向量计算单元的数据供给,在进行指令扩展时采用标量寄存器的扩展方式,将运算数据信息存入寄存器中增大了寻址空间,以保证进行大规模数据运算时生成较少的指令条数。Taurus神经网络加速器架构在Gem5平台上完成了周期精确的模拟仿真,与开源加速器Gemmini相比,进行通用矩阵乘法运算时,脉动阵列利用率提高80%;在ResNet50和BERT模型推理中,Taurus与Gemmini相比,分别获得1.3倍和31.3倍的加速;与RISC-V相比,性能分别获得1467倍和4513倍的加速。 展开更多
关键词 神经网络 矩阵计算 非线性计算 指令扩展
在线阅读 下载PDF
全球RISC-V标准发展路径比较分析研究
10
作者 倪皖京 黄然 +2 位作者 尹航 王一刚 刘羽炎 《标准科学》 2025年第S1期206-211,共6页
本文旨在探讨和分析全球范围内RISC-V标准发展的不同路径,特别是比较分析中国、欧洲和美国在RISC-V标准制定和推广方面的策略、进展和挑战。RISC-V作为一种开源指令集架构,具有显著的灵活性和可扩展性优势,其标准化进程对于全球半导体... 本文旨在探讨和分析全球范围内RISC-V标准发展的不同路径,特别是比较分析中国、欧洲和美国在RISC-V标准制定和推广方面的策略、进展和挑战。RISC-V作为一种开源指令集架构,具有显著的灵活性和可扩展性优势,其标准化进程对于全球半导体产业和科技创新具有重要意义。通过对不同地区政策法规、推动主体、主要成就和未来挑战的深入研究,本文揭示了各区域发展路径的异同,并提出了推进全球RISC-V标准化的建议。 展开更多
关键词 risc-v 指令集 标准发展路径 国际比较 开源技术
在线阅读 下载PDF
支持FPGA动态重构的RISC-V扩展指令集设计与实现
11
作者 周炫锦 蔡刚 黄志洪 《计算机工程》 北大核心 2025年第5期229-238,共10页
目前实现动态重构的常用方法是通过片上接口进行配置,一般采用现场可编程门阵列(FPGA)官方提供的动态重构控制知识产权(IP)核,并通过系统总线与处理器相连。这种方法会占用较多静态部分的逻辑资源,并且限制了片上接口的运行频率。针对... 目前实现动态重构的常用方法是通过片上接口进行配置,一般采用现场可编程门阵列(FPGA)官方提供的动态重构控制知识产权(IP)核,并通过系统总线与处理器相连。这种方法会占用较多静态部分的逻辑资源,并且限制了片上接口的运行频率。针对这些问题,提出将FPGA抽象为大规模存储器的设计理念,构建DPRC动态重构控制指令集及配套应用程序编程接口(API),以优化逻辑资源占用量,消除缓冲延迟。指令集的实现以原有RV32IMC为基础,采用微指令序列控制片上接口部分,通过与数据通路紧密耦合来减少逻辑资源使用量,使用参数化多周期方案优化时序并确保通用性。实验结果表明,与传统方法相比,该系统中动态重构功能相关逻辑资源占用量减少84%,频率提高312%。相较于原有处理器,添加扩展指令集后处理器自身资源占用量仅增加5%,最差情况下扩展部分对时钟周期的影响小于0.2 ns,表明该动态重构控制方案具有低成本、高主频的特性。 展开更多
关键词 risc-v指令集 扩展指令集 动态重构 FPGA技术 大规模存储器
在线阅读 下载PDF
RISC-V指令集架构及其应用综述
12
作者 刘小罗 林洪怡 刘盼 《中国集成电路》 2025年第3期16-20,49,共6页
传统指令集架构(Instruction Set Architecturem,ISA)因为高昂的版权、指令复杂性和兼容性的问题,越来越限制了计算机技术广泛应用。而精简指令集计算-V(Reduced Instruction Set Computer-Five,RISC-V)是一种全新的免费开源指令集,因... 传统指令集架构(Instruction Set Architecturem,ISA)因为高昂的版权、指令复杂性和兼容性的问题,越来越限制了计算机技术广泛应用。而精简指令集计算-V(Reduced Instruction Set Computer-Five,RISC-V)是一种全新的免费开源指令集,因其开放性、灵活性和高效性受到广泛关注。通过对比分析,我们揭示了RISC-V与传统指令集的区别,系统回顾了RISC-V指令集的发展历程及主要特性,重点探讨了其在不同领域中的强大潜力与广发的应用价值。 展开更多
关键词 risc-v芯片 开源指令集 计算机体系结构 risc-v应用
在线阅读 下载PDF
开放指令集架构驱动的微处理器结构与设计教学改革
13
作者 孙彩霞 王俊辉 +3 位作者 郑重 雷国庆 隋兵才 王永文 《计算机教育》 2026年第4期28-33,共6页
针对微处理器结构与设计课程教学过程中存在的问题,结合开放指令集架构带来的机遇和挑战,从“如何做到理论知识的聚焦凝练、如何做到课程实验的学以致用、如何做到各类学生的因材施教”着手,提出课程教学改革方案,介绍2022—2024学年的... 针对微处理器结构与设计课程教学过程中存在的问题,结合开放指令集架构带来的机遇和挑战,从“如何做到理论知识的聚焦凝练、如何做到课程实验的学以致用、如何做到各类学生的因材施教”着手,提出课程教学改革方案,介绍2022—2024学年的改革实践,最后说明改革成效,旨在为全国高校微处理器设计领域人才培养提供参考。 展开更多
关键词 开放指令集架构 微处理器结构与设计 教学改革
在线阅读 下载PDF
“结构化与情境化”体育教学课程模式的国际镜鉴与启示
14
作者 王立清 李焕玉 +5 位作者 李敏 李宜霖 李卫东 陈雨婷 兰存蓉 闫金 《成都体育学院学报》 北大核心 2026年第1期74-86,共13页
运用文献资料法、逻辑分析法,深刻阐述和分析国外“领会式教学、游戏性与小战术配合与实战情境”三大课程模式的理论、异同点与研究现状,并系统提出教学实施的推进路径。研究发现,三大课程模式体现了“结构化与情境化”特征,在教学目标... 运用文献资料法、逻辑分析法,深刻阐述和分析国外“领会式教学、游戏性与小战术配合与实战情境”三大课程模式的理论、异同点与研究现状,并系统提出教学实施的推进路径。研究发现,三大课程模式体现了“结构化与情境化”特征,在教学目标、教学设计核心理念及学生主体等方面具有相同性,而在理论基础、能力迁移、教学流程与环节,以及“小比赛”定义等方面也存在差异性。研究结果为推进我国“结构化—情境化”体育教学提供有效途径,有利于深化我国基础教育体育与健康课程以及大单元教学的改革,有助于学生在真实比赛情景中学习和应用体育技能,确保体育课程教学的质量和效果,进而全面提升学生的核心素养。 展开更多
关键词 大单元教学 课程模式 领会式教学 游戏性与小战术配合 实战情境课程
在线阅读 下载PDF
基于RISC-V的图卷积神经网络加速器设计 被引量:4
15
作者 周理 赵祉乔 +2 位作者 潘国腾 铁俊波 赵王 《计算机工程与科学》 CSCD 北大核心 2023年第12期2113-2120,共8页
图卷积神经网络GCN当前主要在PyTorch等深度学习框架上基于GPU实现加速。然而GCN的运算过程包含多层嵌套的矩阵乘法和数据访存操作,使用GPU虽然可以满足实时性需求,但是部署代价大、能效比低。为了提高GCN算法的计算性能并保持软件灵活... 图卷积神经网络GCN当前主要在PyTorch等深度学习框架上基于GPU实现加速。然而GCN的运算过程包含多层嵌套的矩阵乘法和数据访存操作,使用GPU虽然可以满足实时性需求,但是部署代价大、能效比低。为了提高GCN算法的计算性能并保持软件灵活性,提出一种基于RSIC-V SoC的定制GCN加速器,在蜂鸟E203的SoC平台中通过点积运算扩展指令和硬件加速器软硬件协同的方法实现了针对GCN的加速,通过神经网络参数分析确定了从浮点数到32位定点数的硬件量化方案。实验结果表明,在Cora数据集上运行GCN算法时,该加速器没有精度损失,速度最高提高了6.88倍。 展开更多
关键词 risc-v 图卷积神经网络 硬件加速器 指令集
在线阅读 下载PDF
RISC-V指令集子集RV32I的译码电路设计与优化 被引量:1
16
作者 陈勇 毛宇鹏 +2 位作者 朱玉全 黄盛杰 陈宇宸 《电子器件》 CAS 北大核心 2023年第2期297-302,共6页
面向RISC-V处理器五级流水线数据通路,设计了基于FPGA的RISC-V指令集子集RV32I的指令译码电路。电路分为主译码电路和程序计数器输入选择(PCSel)译码电路,使用Verilog HDL编程设计,并进行了系列优化:使用时序约束工具分析时序状态,设定... 面向RISC-V处理器五级流水线数据通路,设计了基于FPGA的RISC-V指令集子集RV32I的指令译码电路。电路分为主译码电路和程序计数器输入选择(PCSel)译码电路,使用Verilog HDL编程设计,并进行了系列优化:使用时序约束工具分析时序状态,设定约束后对电路进行综合,降低电路延迟;利用无关项化简组合逻辑,减少模块输入输出项,减少电路级联;构建独立的32位串并行数值比较器;插入流水线,提高电路工作频率。电路基于FPGA芯片CycloneⅣEP4CE6F17C6进行设计,使用Quartus Prime 17.1对电路进行仿真,仿真结果表明:在Slow 1200 m V 85℃条件下,指令译码电路达到295.6 MHz的工作频率,相比同类设计具有高速和低资源消耗的特点。 展开更多
关键词 risc-v RV32I指令集 指令译码电路
在线阅读 下载PDF
面向遥感视觉问答的跨模态知识引入与提示推理框架
17
作者 董欣 俞鹏飞 顾晶晶 《计算机科学与探索》 北大核心 2026年第3期760-772,共13页
随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以... 随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以及文本问题表达形式多样等挑战。为了应对这些挑战,提出一种面向RSVQA的跨模态知识引入与提示推理框架(CMKIP)。针对遥感图像的高复杂度,CMKIP为大语言模型LLaMA构建可学习的图像特征适配器,以具备对复杂图像的表征能力;针对遥感图像-文本对齐数据稀缺问题,构建自动化数据生成管道,从公开遥感数据集中生成高质量的图像-文本对,实现高效的遥感领域知识注入;针对问题表达的多样性,创新性地提出一种大小模型协同推理机制,利用小模型进行知识库检索与中间推理校正,显著提升大语言模型对多样化问题的理解能力与推理准确性。此外,CMKIP支持根据任务需求灵活更换小模型,可广泛应用于遥感领域的多项下游任务。实验结果表明,CMKIP在RSVQA基准数据集上的性能显著优于现有方法,特别是在低样本场景下表现尤为突出,展示了其在RSVQA任务中的有效性和泛化性。 展开更多
关键词 遥感视觉问答 大语言模型 跨模态扩展 遥感微调指令集 轻量级模型 提示推理
在线阅读 下载PDF
面向分布式计算的类脑智能处理器指令集架构设计
18
作者 冯烁 路冬冬 +6 位作者 尹飞 杨剑新 班冬松 何军 颜世云 李媛 雎浩宇 《计算机研究与发展》 北大核心 2026年第1期1-14,共14页
作为分布式计算的典型体现之一,端边云协同计算系统能够有效推动物联网、大模型、数字孪生等人工智能技术的垂直落地应用。类脑计算是一种受大脑工作方式启发而提出的智能计算技术,具有能效高、速度快、容错度高、可扩展性强等优点。通... 作为分布式计算的典型体现之一,端边云协同计算系统能够有效推动物联网、大模型、数字孪生等人工智能技术的垂直落地应用。类脑计算是一种受大脑工作方式启发而提出的智能计算技术,具有能效高、速度快、容错度高、可扩展性强等优点。通过利用脉冲神经网络的事件驱动机制和脉冲稀疏发放等特性,类脑计算能够极大地提升分布式端边云系统的实时处理能力和能量效率。针对分布式终端设备的高实时、低功耗、强异构等特点,聚焦于指令集架构这一软硬件的交互界面,给出了一种立足现有系统、易于部署升级、安全自主可控、异构融合兼容的硬件设计方案,一共提出了12条类脑计算指令,完成了基于某国产指令系统的类脑指令集和对应微结构的定制化设计,为类脑计算赋能分布式计算系统奠定了技术基础。 展开更多
关键词 分布式计算 类脑智能 脉冲神经网络 指令集架构 处理器微结构 神经拟态芯片
在线阅读 下载PDF
基于RISC-V的卷积神经网络专用指令集处理器 被引量:5
19
作者 廖汉松 吴朝晖 李斌 《计算机工程》 CAS CSCD 北大核心 2021年第7期196-204,共9页
针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器。通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,... 针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器。通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,提高终端设备能效。在此过程中,配置CNN各层信息控制加速器进行分组运算,以适应不同大小的输入数据,同时调整加速器的数据通路,对耗时操作进行单独或结合运算,以适应不同的轻量化网络。FPGA平台验证结果表明,该处理器在100 MHz工作频率下推理Squeeze Net网络,耗时约40.89 ms,功耗为1.966 W,较手机处理器单核计算速度更快,与AMD Ryzen7 3700X、NVIDIA RTX2070 Super和Qualcomm Snapdragon 835平台相比,其消耗资源少、功耗低,在性能功耗比上也具有优势。 展开更多
关键词 risc-v指令集 卷积神经网络 领域专用架构 专用指令集处理器 硬件加速
在线阅读 下载PDF
开源芯片、RISC-V与敏捷开发 被引量:9
20
作者 王诲喆 唐丹 +3 位作者 余子濠 刘志刚 解壁伟 包云岗 《大数据》 2019年第4期50-66,共17页
随着摩尔定理的几近失效,传统的追求通用性能的芯片开发策略将难以持续,但芯片领域过高的门槛和商业限制阻碍了进一步的创新和对市场的响应速度。因此需要通过开源芯片、统一的生态平台和现代化的设计方法激发芯片领域的创造力和生产效... 随着摩尔定理的几近失效,传统的追求通用性能的芯片开发策略将难以持续,但芯片领域过高的门槛和商业限制阻碍了进一步的创新和对市场的响应速度。因此需要通过开源芯片、统一的生态平台和现代化的设计方法激发芯片领域的创造力和生产效率。介绍了开源芯片的作用和发展历史,讨论了有望成为下一代芯片开发根基的RISC-V指令集架构的特点和影响以及前端设计中的敏捷开发实践,并对芯片开发的新发展与不足做出了总结。 展开更多
关键词 开源芯片 敏捷开发 计算机架构 指令集架构
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部