期刊文献+
共找到494篇文章
< 1 2 25 >
每页显示 20 50 100
UNI-SPEC:An Instruction Set Description Language 被引量:2
1
作者 朱德新 Cheng +2 位作者 Xu Song Chuanhua 《High Technology Letters》 EI CAS 2003年第4期33-38,共6页
Microprocessor development emphasizes hardware and software co design. Hw/Sw co design is a modern technique aimed at shortening the time to market in designing the real time and embedded systems. Key feature of this ... Microprocessor development emphasizes hardware and software co design. Hw/Sw co design is a modern technique aimed at shortening the time to market in designing the real time and embedded systems. Key feature of this approach is simultaneous development of the program tools and the target processor to match software application. An effective co design flow must therefore support automatic software toolkits generation, without loss of optimizing efficiency. This has resulted in a paradigm shift towards a language based design methodology for microprocessor optimization and exploration. This paper proposes a formal grammar, UNI SPEC, which supports the automatic generation of assemblers, to describe the translation rules from assembly to binary. Based on UNI SPEC, it implements two typical applications, i.e., automatically generating the assembler and the test suites. 展开更多
关键词 formal grammar retargetable assembler generator instruction set architecture
在线阅读 下载PDF
Asynchronous Complex Pipeline Design Based on ARM Instruction Set 被引量:1
2
作者 王兵 王琴 +1 位作者 彭瑞华 付宇卓 《Journal of Shanghai Jiaotong university(Science)》 EI 2008年第5期568-573,共6页
This paper proposes an asynchronous complex pipeline based on ARM-V3 instruction set. Muller pipeline structure is used as prototype, and the factors which may affect pipeline performance are analyzed. To balance the ... This paper proposes an asynchronous complex pipeline based on ARM-V3 instruction set. Muller pipeline structure is used as prototype, and the factors which may affect pipeline performance are analyzed. To balance the difficulty of asynchronous design and performance analysis, both complete asynchronous and partial asynchronous structures aere designed and compared. Results of comparison with the well-Rnown industrial product ARM922T verify that about 30% and 40% performance improvement of the partiM and complete asynchronous complex pipelines can be obtained respectively. The design methodologies can also be used in the design of other asynchronous pipelines. 展开更多
关键词 asynchronous pipeline ARM instruction set pipeline stall instruction prediction
原文传递
Analyzing and Seeking Minimum Test Instruction Set of Digital Signal Processor for Motor Control
3
作者 严伟 曹家麟 龚幼民 《Journal of Shanghai University(English Edition)》 CAS 2005年第2期147-152,共6页
The relativity of instructions of motor control digital signal processor (MCDSP) in the design is analyzed. A method for obtaining a minimum instruction set in plac e of the complete instruction set during generatio... The relativity of instructions of motor control digital signal processor (MCDSP) in the design is analyzed. A method for obtaining a minimum instruction set in plac e of the complete instruction set during generation of testing procedures is giv en in terms of the processor presentation matrix between micro-operators and in structions of MCDSP. 展开更多
关键词 minimum instruction set functional test digital signal processor(DSP).
在线阅读 下载PDF
Verification of instruction set specification for an ASIP
4
作者 纪金松 MAIER Stefan +1 位作者 聂晓宁 周学海 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2008年第4期482-486,共5页
In order to gain the great performance of ASIP, this paper discusses different aspects of an ASIP instruction set specification like syntax, encoding, constraints as welt as behaviors, and introduces our ADL model bas... In order to gain the great performance of ASIP, this paper discusses different aspects of an ASIP instruction set specification like syntax, encoding, constraints as welt as behaviors, and introduces our ADL model based methodology to check them. The automatic generation of test cases based on our straight-forward instruction representation is shown, and the efficient generation of them with good coverage is shown as well. The verification of the constraint checker, a very important tool for programmer, is performed. Results show that the toolkit can find some errors in previous delivery tools, and the introduced methodology verifies the feasibility of our instruction set specification. 展开更多
关键词 VERIFICATION ASIP instruction set specification ADL
在线阅读 下载PDF
An efficient adapting virtual intermediate instruction set towards optimized dynamic binary translator (DBT) system
5
作者 杨吟冬 管海兵 《Journal of Central South University》 SCIE EI CAS 2012年第11期3118-3128,共11页
A new efficient adapting virtual intermediate instruction set,V-IIS,is designed and implemented towards the optimized dynamic binary translator (DBT) system.With the help of this powerful but previously little-studied... A new efficient adapting virtual intermediate instruction set,V-IIS,is designed and implemented towards the optimized dynamic binary translator (DBT) system.With the help of this powerful but previously little-studied component,DBTs can not only get rid of the dependence of machine(s),but also get better performance.From our systematical study and evaluation,experimental results demonstrate that if V-IIS is well designed,without affecting the other optimizing measures,this could make DBT's performance close to those who do not have intermediate instructions.This study is an important step towards the grand goal of high performance "multi-source" and "multi-target" dynamic binary translation. 展开更多
关键词 binary translation virtual intermediate instruction set dynamic binary translator (DBT)
在线阅读 下载PDF
面向分布式计算的类脑智能处理器指令集架构设计
6
作者 冯烁 路冬冬 +6 位作者 尹飞 杨剑新 班冬松 何军 颜世云 李媛 雎浩宇 《计算机研究与发展》 北大核心 2026年第1期1-14,共14页
作为分布式计算的典型体现之一,端边云协同计算系统能够有效推动物联网、大模型、数字孪生等人工智能技术的垂直落地应用。类脑计算是一种受大脑工作方式启发而提出的智能计算技术,具有能效高、速度快、容错度高、可扩展性强等优点。通... 作为分布式计算的典型体现之一,端边云协同计算系统能够有效推动物联网、大模型、数字孪生等人工智能技术的垂直落地应用。类脑计算是一种受大脑工作方式启发而提出的智能计算技术,具有能效高、速度快、容错度高、可扩展性强等优点。通过利用脉冲神经网络的事件驱动机制和脉冲稀疏发放等特性,类脑计算能够极大地提升分布式端边云系统的实时处理能力和能量效率。针对分布式终端设备的高实时、低功耗、强异构等特点,聚焦于指令集架构这一软硬件的交互界面,给出了一种立足现有系统、易于部署升级、安全自主可控、异构融合兼容的硬件设计方案,一共提出了12条类脑计算指令,完成了基于某国产指令系统的类脑指令集和对应微结构的定制化设计,为类脑计算赋能分布式计算系统奠定了技术基础。 展开更多
关键词 分布式计算 类脑智能 脉冲神经网络 指令集架构 处理器微结构 神经拟态芯片
在线阅读 下载PDF
基于CPU-FPGA的SoC实验系统设计
7
作者 王丽杰 钱俊宏 +4 位作者 何俊峰 王蕊 贺媛 刘凤敏 张彤 《吉林大学学报(信息科学版)》 2025年第3期518-523,共6页
针对现有微电子与集成电路专业课程大多以理论为主,缺少仿真实验,FPGA(Field Progra mmable Gate Array)实操类实验项目严重不足的问题,设计了一套基于CPU(Central Processing Unit)-FPGA的SoC(System on Chip)实验系统。利用ModelSim... 针对现有微电子与集成电路专业课程大多以理论为主,缺少仿真实验,FPGA(Field Progra mmable Gate Array)实操类实验项目严重不足的问题,设计了一套基于CPU(Central Processing Unit)-FPGA的SoC(System on Chip)实验系统。利用ModelSim等仿真工具,以FPGA为开发平台实现CPU系统功能。以RISC-V(Reduced Instruction Set Computer)精简指令集为该CPU的指令集,以模块化为设计思想,从微处理器的局部到总体设计5级流水线CPU。系统融合了软硬件开发,能激发学生的学习兴趣。搭建的实验平台逐步实现CPU的配置与指令集至整个CPU的架构、编程、仿真、下载与调试,使学生对FPGA实现集成电路系统设计有深入理解,有助于专业理论课程的学习。通过将OBE(Outcomes-Based Education)教学理论应用于集成电路EDA(Electronic Design Automation)课程的仿真实验结果表明,这种设计方法与内容适用于产学研相结合,并能提高学生创新创业能力。 展开更多
关键词 中央处理器 现场可编程门阵列 实验系统 流水线技术
在线阅读 下载PDF
面向PyTorch的RVV优化
8
作者 王凡 张飞 +1 位作者 宋甫元 于佳耕 《计算机系统应用》 2025年第4期266-275,共10页
RISC-V软件生态正在加速发展,国际开源社区积极投入RISC-V软件生态,针对RISC-V主动适配和优化,积极推动RISC-V软件生态系统向前发展.PyTorch是一个开源的Python机器学习库,其在性能、开源生态、研究领域都有非常大的优势,其对x86、ARM、... RISC-V软件生态正在加速发展,国际开源社区积极投入RISC-V软件生态,针对RISC-V主动适配和优化,积极推动RISC-V软件生态系统向前发展.PyTorch是一个开源的Python机器学习库,其在性能、开源生态、研究领域都有非常大的优势,其对x86、ARM、PowerPC以及CUDA等指令集架构都提供了较好的支持.但是,在目前的RISC-V架构上,软件生态移植集中在对RISC-V标准指令集的适配,尚不能充分利用RISC-V扩展指令集优化软件生态,距离ARM、x86等成熟软件生态存在较大差距.PyTorch因缺少RISC-V V扩展(RVV)的支持,使得RISC-V平台的推理性能与同规格ARM平台差距较大.针对上述问题,本文提出了一种面向PyTorch RVV 1.0的高效开发方案,并使用RVV扩展指令集对PyTorch深度卷积算子进行针对性优化,并在K230开发板上进行了对比分析,实验结果表明,相比标量实现,利用RVV优化的深度卷积算子性能提升约1.35–3.8倍. 展开更多
关键词 RISC-V PyTorch RVV扩展指令集 深度卷积
在线阅读 下载PDF
基于数据流架构的NTT蝶式计算加速 被引量:1
9
作者 石泓博 范志华 +4 位作者 李文明 张志远 穆宇栋 叶笑春 安学军 《计算机研究与发展》 北大核心 2025年第6期1547-1561,共15页
全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限... 全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限等问题,导致其在实际应用中的性能严重受限.其中,快速数论变换(number theoretic transform,NTT)作为FHE中关键的基础算子,其性能对整个系统的效率具有决定性影响.针对NTT中的核心计算模式--蝶式(butterfly)计算,提出一种基于数据流计算模型的NTT加速架构.首先,设计面向NTT蝶式计算的RVFHE扩展指令集,定制高效的模乘与模加/模减运算单元,以提升模运算处理效率.其次,提出一种NTT数据重排方法,并结合结构化的蝶式地址生成策略,以降低跨行列数据交换的控制复杂度与访问冲突.最后,设计融合数据流驱动机制的NTT加速架构,通过数据依赖触发方式实现高效的片上调度与数据复用,从而充分挖掘操作级并行性.实验结果表明,与NVIDIA GPU相比,提出的架构获得了8.96倍的性能提升和8.53倍的能效提升;与现有的NTT加速器相比,所提架构获得了1.37倍的性能提升. 展开更多
关键词 数据流 全同态加密 NTT算法 蝶式计算 RISC-V指令集
在线阅读 下载PDF
NA-ROB:基于RISC-V超标量处理器的改进 被引量:2
10
作者 景超霞 刘杰 +1 位作者 李洪奎 刘红海 《计算机应用研究》 北大核心 2025年第2期519-522,共4页
重排序缓存(ROB)是超标量处理器中的重要模块,用于确保乱序执行的指令能够正确地完成和提交。然而,在大规模超标量处理器中,存在ROB阻塞以及ROB容量有限的问题。为了解决上述问题并提高处理器性能,提出了零寄存器分配策略,通过将没有目... 重排序缓存(ROB)是超标量处理器中的重要模块,用于确保乱序执行的指令能够正确地完成和提交。然而,在大规模超标量处理器中,存在ROB阻塞以及ROB容量有限的问题。为了解决上述问题并提高处理器性能,提出了零寄存器分配策略,通过将没有目的寄存器的指令单独存储来避免占用ROB表项。同时,引入容量可动态调整的缓存结构(AROB),将长延时指令与普通指令分别存储在ROB和AROB中,以降低长延时指令导致的阻塞。改进后的超标量处理器被命名为NA-ROB,经过SPEC 2006基准测试程序的实验评估,结果表明,NA-ROB超标量处理器相比于传统的ROB超标量处理器,平均IPC提升了66%,同时ROB的阻塞概率降低了48%。因此,所提出的改进方法显著提升了处理器的整体性能和效率。 展开更多
关键词 RISC-V指令集 超标量处理器 ROB AROB 零寄存器分配策略
在线阅读 下载PDF
基于多操作数的RISC-V指令集设计与功能优化方法 被引量:1
11
作者 张钰儿 席宇浩 刘鹏 《计算机工程与科学》 北大核心 2025年第6期968-975,共8页
RISC-V架构凭借其开放性和模块化的指令集架构(ISA)设计,为特定应用及其软件生态系统的定制指令集成提供了良好支持,使其能够高效处理复杂算法并执行重复性操作。然而,由于操作数数量的限制,为RISC-V处理器设计加速指令仍面临挑战。传... RISC-V架构凭借其开放性和模块化的指令集架构(ISA)设计,为特定应用及其软件生态系统的定制指令集成提供了良好支持,使其能够高效处理复杂算法并执行重复性操作。然而,由于操作数数量的限制,为RISC-V处理器设计加速指令仍面临挑战。传统处理器加速方法通常采用“2输入1输出”模型,这在一定程度上限制了复杂操作的灵活性与执行效率。为突破该限制,提出了一种多操作数增强指令集的设计方法。该方法通过引入多操作数加速机制,突破了传统模型的结构性约束,为多输入多输出任务提供了灵活的指令接口。为验证所提机制的有效性,基于Western Digital开源的RISC-V VeeR EH1处理器核实现了该设计,并在FPGA平台上进行了基准测试,涵盖SHA-256,SHA-1以及FIR/IIR滤波器等典型算法。实验结果表明,在FPGA平台上的逻辑资源开销控制在3%以内的情况下,处理器性能最高提升可达14%。与传统“2输入1输出”加速方法相比,所提出的增强指令集设计能够显著提升RISC-V在复杂任务处理中的性能,展示了其在嵌入式计算和专用加速领域的潜在优势。 展开更多
关键词 RISC-V 自定义指令 软硬件协同设计
在线阅读 下载PDF
基于RISC-V Matrix指令集扩展的LLM矢量点积加速研究 被引量:1
12
作者 陈煦豪 胡思鹏 +3 位作者 刘洪超 刘伯然 唐丹 赵地 《计算机科学》 北大核心 2025年第5期83-90,共8页
鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效... 鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效大语言模型(LLM)推理计算的需求。针对大语言模型的特性,基于RISC-V指令集扩展了自定义指令完成矢量点积计算,在专用的矢量点积加速硬件上进行大语言模型的运算加速;基于开源高性能RISC-V处理器核“香山”nanhu版本架构,实现了矢量点积专用指令集处理器nanhu-vdot,其在高性能处理器“香山”(nanhu版本)的基础上增加了矢量点积计算单元以及流水线处理逻辑;对nanhu-vdot进行FPGA硬件测试,在几乎没有增加额外的硬件资源和功耗消耗的前提下,矢量点积运算速度相比标量方法提高4倍以上,使用软硬件协同方案进行第二代生成式预训练(Generative Pre-Trained-2,GPT-2)模型推理,相比纯软件实现,速度提高了约30%。 展开更多
关键词 指令集扩展 矢量点积 软硬件协同 大语言模型推理
在线阅读 下载PDF
基于RISC-V指令扩展的神经网络计算加速架构
13
作者 蔡成欢 王一品 +5 位作者 许嘉滨 张逢喆 周学功 曹伟 张帆 余新胜 《计算机科学》 北大核心 2025年第12期1-8,共8页
针对现阶段以RISC-V为核心的神经网络加速器对Transformer架构模型中矩阵计算及非线性计算加速不足的问题,开展了基于RISC-V指令扩展的神经网络计算加速架构研究,提出名为Taurus的神经网络加速器架构。针对模型架构特点,进行了矩阵指令... 针对现阶段以RISC-V为核心的神经网络加速器对Transformer架构模型中矩阵计算及非线性计算加速不足的问题,开展了基于RISC-V指令扩展的神经网络计算加速架构研究,提出名为Taurus的神经网络加速器架构。针对模型架构特点,进行了矩阵指令扩展,并使用脉动阵列进行矩阵乘累加计算;为支持非线性计算加速,进行向量指令扩展,并设计特殊向量单元完成LayerNorm和Softmax的计算;为保证数据供给平衡,优化访存指令扩展,以保证矩阵计算单元、向量计算单元的数据供给,在进行指令扩展时采用标量寄存器的扩展方式,将运算数据信息存入寄存器中增大了寻址空间,以保证进行大规模数据运算时生成较少的指令条数。Taurus神经网络加速器架构在Gem5平台上完成了周期精确的模拟仿真,与开源加速器Gemmini相比,进行通用矩阵乘法运算时,脉动阵列利用率提高80%;在ResNet50和BERT模型推理中,Taurus与Gemmini相比,分别获得1.3倍和31.3倍的加速;与RISC-V相比,性能分别获得1467倍和4513倍的加速。 展开更多
关键词 神经网络 矩阵计算 非线性计算 指令扩展
在线阅读 下载PDF
Architecture Design of a Variable Length Instruction Set VLIW DSP 被引量:11
14
作者 沈钲 何虎 +2 位作者 杨旭 贾迪 孙义和 《Tsinghua Science and Technology》 SCIE EI CAS 2009年第5期561-569,共9页
The cost of the central register file and the size of the program code limit the scalability of very long instruction word(VLIW) processors with increasing numbers of functional units.This paper presents the archite... The cost of the central register file and the size of the program code limit the scalability of very long instruction word(VLIW) processors with increasing numbers of functional units.This paper presents the architectural design of a six-way VLIW digital signal processor(DSP) with clustered register files.The architecture uses a variable length instruction set and supports dynamic instruction dispatching.The one-level memory system architecture of the processor includes 16-KB instruction and data caches and 16-KB instruction and data on-chip RAM.A compiler based on the Open64 was developed for the system.Evaluations show that the processor is suitable for high performance applications with a high code density and small program code size. 展开更多
关键词 digital signal processor(DSP) very long instruction word(VLIW) variable length instruction set clustered register file
原文传递
中西医治疗缓慢性心律失常的不良事件/反应报告分析
15
作者 关之玥 张心怡 +2 位作者 张晓维 邱瑞瑾 商洪才 《中药新药与临床药理》 北大核心 2025年第8期1393-1403,共11页
目的系统回顾缓慢性心律失常临床研究及药品说明书中的不良事件/反应的情况,并分析不良事件/反应报告的问题及对策。方法系统检索中国知网(CNKI)、万方数据知识服务平台、中国生物医学文献数据库(SinoMed)、Embase、PubMed及Cochrane Li... 目的系统回顾缓慢性心律失常临床研究及药品说明书中的不良事件/反应的情况,并分析不良事件/反应报告的问题及对策。方法系统检索中国知网(CNKI)、万方数据知识服务平台、中国生物医学文献数据库(SinoMed)、Embase、PubMed及Cochrane Library等数据库,检索时间范围为2012年1月—2022年5月,收集、筛选、提取缓慢性心律失常临床研究中报告的不良事件/反应信息,形成缓慢性心律失常临床常见不良事件/反应的初步清单。从2017年及2021年《国家医疗保险目录》、2018年《国家基本药物目录》和《世界卫生组织基本药物清单》中选择适应症包含缓慢性心律失常的药物,从药品说明书中提取药物不良反应信息。最后,综合系统评价与西药/中成药药品说明书信息提取结果,对结局指标进行规范化处理及合并。结果最终纳入85篇文献,提取得到107个不良事件/反应;纳入2种西药和4种中成药,提取37种不良反应;对结局指标进行规范化处理及合并后获得70个不良事件/反应,形成了缓慢性心律失常临床常见不良事件/反应清单。发现临床研究及药品说明书中的不良事件/反应存在指标表述不规范、分类不明确、报告有缺失等问题。结论建立缓慢性心律失常临床研究安全性评价核心指标集具有重要意义,可为研究者报告不良事件/反应提供参考,减少临床研究不良事件/反应报告的异质性,以及促进临床研究质量的提高。 展开更多
关键词 缓慢性心律失常 不良事件 不良反应 临床研究 药品说明书 安全性评价 核心指标集
原文传递
基于龙芯的EPICS实时控制器在超高温熔盐泵测试装置上的应用
16
作者 邓琦 杨峥翰 +2 位作者 韩利峰 黄丽 戴志敏 《核技术》 北大核心 2025年第8期181-188,共8页
超高温熔盐泵测试装置是一套用于研究泵、阀、换热器等关键设备在高温熔盐工况下性能的装置。为增强其控制系统的国产化程度及核心控制器的自主可控性,在国产自主指令架构LoongArch上设计研发了基于实验物理与工业控制系统(Experimental... 超高温熔盐泵测试装置是一套用于研究泵、阀、换热器等关键设备在高温熔盐工况下性能的装置。为增强其控制系统的国产化程度及核心控制器的自主可控性,在国产自主指令架构LoongArch上设计研发了基于实验物理与工业控制系统(Experimental Physics and Industrial Control System,EPICS)的实时控制器。首先将EPICS、IgH EtherCAT Master等软件移植到基于LoongArch的嵌入式开发板上,解决软件与指令架构不适配的问题,实现控制程序的编写与执行、EtherCAT主从站通讯等功能,并对控制器的最小总线扫描周期进行测试;然后,针对超高温熔盐泵测试装置的控制需求,利用自主研发的EPICS扩展插件在该控制器上实现了PID温度控制、气路流量监测等功能;最后,在实际工况下对控制器的实时性、CPU使用率等指标进行测试分析,评估控制器的性能表现。实验数据表明:该控制器的最小总线扫描周期为50 ms,控制任务执行的延迟时间最大为12.85 ms,CPU性能表现良好,满足该项目的应用需求。该控制器已成功融入超高温熔盐泵测试装置的控制系统,取代了原x86服务器,目前在稳定运行中。 展开更多
关键词 实时控制器 国产自主指令集 LoongArch 实验物理与工业控制系统 超高温熔盐泵
原文传递
ISA真的重要么?——基于Gem5的仿真调查
17
作者 李华 王永文 《计算机工程与科学》 北大核心 2025年第11期1945-1952,共8页
指令集体系结构(ISA)是芯片最底层、最核心的部分,已有的关于ISA对性能影响的研究工作通常基于物理硬件平台实现,但不同的硬件实现方案使得无法直接对比分析ISA对性能的影响。基于以上原因,使用Gem5模拟器,采用相同的硬件配置与相同版... 指令集体系结构(ISA)是芯片最底层、最核心的部分,已有的关于ISA对性能影响的研究工作通常基于物理硬件平台实现,但不同的硬件实现方案使得无法直接对比分析ISA对性能的影响。基于以上原因,使用Gem5模拟器,采用相同的硬件配置与相同版本的编译器,对ARM,RISC-V和x86这3种ISA进行了仿真对比。采用CoreMark,Dhrystone和Whetstone作为基准测试程序。同时,利用McPAT对功耗进行了评估。模拟结果表明,ARM ISA在性能和功耗方面优于RISC-V和x86 ISA,但ARM和RISC-V之间的差异非常细微,而ARM和x86之间的性能差距可能是由实验中使用相对较低的硬件配置引起的,并且可以通过更积极的硬件方法将差距缩小甚至逆转。研究表明,ISA并不能从根本上提高效率。 展开更多
关键词 指令集体系结构(ISA) Gem5模拟器 McPAT模拟器 微架构 仿真
在线阅读 下载PDF
Design and Application of Instruction Set Simulator on Multi-Core Verification 被引量:3
18
作者 胡向东 郭勇 +2 位作者 朱英 郭昕 王鹏 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第2期267-273,共7页
Instruction Set Simulator (ISS) is a highly abstracted and executable model of micro architecture. It is widely used in the fields of verification and debugging during the development of microprocessors. However, wi... Instruction Set Simulator (ISS) is a highly abstracted and executable model of micro architecture. It is widely used in the fields of verification and debugging during the development of microprocessors. However, with the emergence of Chip Multi-Processors, the single-core ISS cannot meet the needs of microprocessor development. In this paper, we introduce our multi-core chip architecture first, after that a general methodology to expand a single-core ISS to a multi- core ISS (MCISS) is proposed. On this basis, a real-time comparison environment is created for multi-core verification, and the problems of multi-core communication and synchronization are addressed gracefully. With the "save and restore" mechanism, the verification procedure and the debugging are speeding up greatly. 展开更多
关键词 processor design chip multi-processors (CMP) instruction set simulator (ISS) SIMULATION parallel stimulus
原文传递
基于双向搜索的指令候选集生成算法
19
作者 范旺 刘勤让 +2 位作者 赵博 高彦钊 祁晓峰 《信息工程大学学报》 2025年第2期182-188,共7页
指令候选集生成是扩展指令集处理器设计中必不可缺的一部分,但该过程也是一种计算密集型任务。为提升候选集生成效率,提出一种双向搜索后融合的算法。首先,基于数据流图的邻接表提出一种高效的连通子图搜索树建立算法;其次,在搜索树遍... 指令候选集生成是扩展指令集处理器设计中必不可缺的一部分,但该过程也是一种计算密集型任务。为提升候选集生成效率,提出一种双向搜索后融合的算法。首先,基于数据流图的邻接表提出一种高效的连通子图搜索树建立算法;其次,在搜索树遍历过程中整体采用双向并行搜索的思路来提升搜索效率,针对由不同树节点构成的子图,应用多约束裁剪优化技术来提升搜索速度。实验结果表明,所提算法能够适应多种约束条件,且性能为已有算法的1~2倍。 展开更多
关键词 候选集生成 扩展指令集 子图搜索 数据流图 指令设计
在线阅读 下载PDF
一种片上操作系统虚拟机指令集设计与实践
20
作者 付睿 尤洪松 +3 位作者 王文峰 韩劢之 曹国顺 路倩 《信息技术与标准化》 2025年第11期8-12,共5页
针对资源受限身份识别安全设备片上操作系统面临的虚拟机指令执行效率低、字节码空间利用率不足等问题,在分析了Java Card、WebAssembly系统虚拟机指令集技术的基础上,提出了一种新型的虚拟机指令集。该指令集基于32位栈式架构虚拟机,... 针对资源受限身份识别安全设备片上操作系统面临的虚拟机指令执行效率低、字节码空间利用率不足等问题,在分析了Java Card、WebAssembly系统虚拟机指令集技术的基础上,提出了一种新型的虚拟机指令集。该指令集基于32位栈式架构虚拟机,通过复合指令集、增强指令寻址、CPU同位宽指令等设计,达到缩减字节码大小,提高指令执行效率的目标。测试结果表明,与Java Card指令集相比,复合指令集在字节码空间消耗和指令执行效率方面均具有优势,对片上操作系统的虚拟机设计与优化具有参考价值。 展开更多
关键词 片上操作系统 JAVA CARD WebAssembly 虚拟机指令集 复合指令集
在线阅读 下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部