期刊文献+
共找到258篇文章
< 1 2 13 >
每页显示 20 50 100
针对VLIW DSP编译器弊端及异常处理方案
1
作者 韦凯 洪泽 《电子技术应用》 2026年第1期92-95,共4页
随着高性能处理器并行度要求的提高,VLIW编译器的弊端也逐步显现,如何平衡代码的正确性和性能成为首要目标。VLIW编译器无法通过有限的代码信息去深度挖掘指令并行性,从而导致指令资源冲突等问题。因此,提出一种基于内核的异常处理方案... 随着高性能处理器并行度要求的提高,VLIW编译器的弊端也逐步显现,如何平衡代码的正确性和性能成为首要目标。VLIW编译器无法通过有限的代码信息去深度挖掘指令并行性,从而导致指令资源冲突等问题。因此,提出一种基于内核的异常处理方案,在保证代码运行正确性的同时,提高指令的并行度。以C6000系列DSP为例,针对C6000编译器的弊端,开发内核异常处理方案,通过内核异常中断确保代码优化的正确性。最后通过C66x内核资源冲突的典型案例,验证了该异常处理方案的实用性,为VLIW架构处理器程序优化提供方向。 展开更多
关键词 vliw 编译器 资源冲突 C6000 异常处理
在线阅读 下载PDF
基于RISC-V VLIW架构的混合指令调度算法
2
作者 李奕瑾 杜绍敏 +3 位作者 赵家程 王雪莹 查永权 崔慧敏 《软件学报》 北大核心 2025年第9期3937-3953,共17页
指令级并行是处理器体系结构研究的经典难题.VLIW架构是数字信号处理器领域中提升指令级并行的一种常用架构.VLIW架构的指令发射顺序是由编译器决定的,因此其指令级并行的性能强依赖于编译器的指令调度.为了探索RISC-V VLIW架构的扩展潜... 指令级并行是处理器体系结构研究的经典难题.VLIW架构是数字信号处理器领域中提升指令级并行的一种常用架构.VLIW架构的指令发射顺序是由编译器决定的,因此其指令级并行的性能强依赖于编译器的指令调度.为了探索RISC-V VLIW架构的扩展潜力,丰富RISC-V生态,研究RISC-V VLIW架构的指令调度算法优化.针对单个调度区域,整数线性规划调度算法能够得到调度最优解但复杂度较高,表调度算法复杂度较低但无法得到调度最优解.为了结合两种调度算法的优点,提出了一种IPC理论模型指导的混合指令调度算法,即通过IPC理论模型定位到表调度未达最优解的调度区域,再对该调度区域进一步实施整数线性规划调度算法.该理论模型基于数据流分析技术协同考虑指令依赖和硬件资源,能够以线性复杂度给出IPC的理论上界.混合调度的核心在于IPC理论模型的准确性,理论模型准确率为95.74%.在给定的测评基准上,提出的理论模型应用于混合指令调度时,能够平均认定94.62%的调度区域在表调度下已达最优解,因此仅有5.38%的调度区域需再进行整数线性规划调度.该混合调度算法能够以接近表调度的复杂度达到整数线性规划调度的调度效果. 展开更多
关键词 RISC-V 超长指令字(vliw) 整数线性规划(ILP) 表调度 理论模型
在线阅读 下载PDF
融合循环展开的向量VLIW体系结构软件流水研究
3
作者 汤卓悠 胡勇华 +1 位作者 程奥博 刘澎 《软件导刊》 2025年第6期95-101,共7页
基于超长指令字(VLIW)体系结构的处理器具有丰富的寄存器与计算资源,充分利用这些资源可以极大地提升程序运行速度。软件流水是位于编译器后端的一项优化技术,可以提高硬件资源利用率。目前的软件流水算法对原循环次数的考虑往往不够周... 基于超长指令字(VLIW)体系结构的处理器具有丰富的寄存器与计算资源,充分利用这些资源可以极大地提升程序运行速度。软件流水是位于编译器后端的一项优化技术,可以提高硬件资源利用率。目前的软件流水算法对原循环次数的考虑往往不够周全,得到的新循环体对寄存器资源的利用率有待提高。因此,提出一种融合循环展开的软件流水优化方法。该方法首先将循环展开,然后进行软件流水处理。一方面改进软件流水序言、主体与尾声排列方式,另一方面分析在不同启动间距下经过软件流水优化后循环主体内执行包的数量,确定最佳的软件流水启动间距。使用该方法优化后的循环体具有更高的指令调度自由度,有利于得到运行速度更快的目标代码。经过实验验证,该方法优化后的代码与仅进行循环展开优化的代码相比,平均速度提升了5%。 展开更多
关键词 vliw体系结构 高性能处理器 编译优化 软件流水 指令级并行优化
在线阅读 下载PDF
基于流体系结构的VLIW二维压缩及并行解压 被引量:2
4
作者 李功丽 戴紫彬 +3 位作者 徐进辉 王寿成 朱玉飞 李丹 《电子学报》 EI CAS CSCD 北大核心 2017年第9期2256-2262,共7页
VLIW(Very Long Instruction Word)指令因为含有较多的空操作导致严重的代码体积膨胀问题,代码压缩是解决这一问题的有效措施.VLIW代码压缩需要解决三个关键问题,一是提高压缩率;二是降低解压操作对性能的影响;三是分支目标重定位.针对... VLIW(Very Long Instruction Word)指令因为含有较多的空操作导致严重的代码体积膨胀问题,代码压缩是解决这一问题的有效措施.VLIW代码压缩需要解决三个关键问题,一是提高压缩率;二是降低解压操作对性能的影响;三是分支目标重定位.针对流体系结构上的VLIW指令特点,提出了二维压缩,对VLIW进行垂直与水平两个方向上的压缩,且水平解压可以与代码执行并行,并通过设置堆栈寄存器缓存循环入口地址.实验结果表明二维压缩有效解决了VLIW代码体积膨胀问题,可以使指令存储器的面积减少36.48%,并使得整个CISP系统面积减少了7.85%. 展开更多
关键词 流处理器 vliw 二维压缩 并行解压
在线阅读 下载PDF
VLIW体系CPU仿真器MCS的设计与实现 被引量:2
5
作者 李锋 王雷 +1 位作者 刘又诚 周伯生 《计算机工程与应用》 CSCD 北大核心 2001年第21期165-168,共4页
仿真器是进行硬件设计评估,系统软件设计开发和计算机体系结构研究的有力工具。文章以一款VLIW(超长指令字)结构的CPU仿真器———MCS为实例,讨论了指令集仿真器设计的一般原理和关键技术。在对目标CPU进行仿真的基础上,通过模拟部分操... 仿真器是进行硬件设计评估,系统软件设计开发和计算机体系结构研究的有力工具。文章以一款VLIW(超长指令字)结构的CPU仿真器———MCS为实例,讨论了指令集仿真器设计的一般原理和关键技术。在对目标CPU进行仿真的基础上,通过模拟部分操作系统功能,MCS可以导入并且运行经过目标机编译器编译的目标可执行代码,进行可配置的数据收集和数据分析,从而达到评估CPU设计,分析指令效率,支持编译系统调试的目的。 展开更多
关键词 CPU 仿真器 vliw MCS 设计
在线阅读 下载PDF
MVSim:面向VLIW多核向量处理器的快速、可扩展和精确的体系结构模拟器 被引量:2
6
作者 刘仲 李程 +3 位作者 田希 刘胜 邓让钰 钱程东 《计算机工程与科学》 CSCD 北大核心 2024年第2期191-199,共9页
设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟... 设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟,采用多线程技术实现了多核处理器的高效和可扩展模拟。实验结果表明,MVSim能够准确模拟多核处理器的目标程序执行,模拟结果完全正确,具有良好的可扩展性。MVSim的平均模拟速度分别是RTL模拟和CCS的227倍和5倍,平均性能误差约为2.9%。 展开更多
关键词 体系结构模拟器 vliw 多核向量处理器模型 性能模型 节拍精准模拟器
在线阅读 下载PDF
基于VLIW体系结构的DSP寄存器堆的设计 被引量:2
7
作者 胡正伟 韩月秋 +1 位作者 陈禾 张晓明 《华北电力大学学报(自然科学版)》 CAS 北大核心 2006年第3期66-69,共4页
在研究了基于VLIW体系结构DSP的特点基础上,通过对寄存器堆的组织结构、组成单元、功能实现等方面的分析,提出了该结构寄存器堆的设计方案。该方案实现了多组数据的正确并行读写操作,满足了VLIW体系结构的CPU对多数据流处理的要求。该... 在研究了基于VLIW体系结构DSP的特点基础上,通过对寄存器堆的组织结构、组成单元、功能实现等方面的分析,提出了该结构寄存器堆的设计方案。该方案实现了多组数据的正确并行读写操作,满足了VLIW体系结构的CPU对多数据流处理的要求。该方案针对VLIW体系结构采用流水线操作、条件执行的特点,通过对写入数据分别采用写控制信号的方法,实现流水线阻塞和指令的条件执行。由于VLIW体系结构具有很多共性,该方案可以根据具体的硬件进行修改,具有很好的可移植性。 展开更多
关键词 vliw 数字信号处理器 寄存器堆 流水线阻塞
在线阅读 下载PDF
VLIW处理器ISA建模与辅助软件优化技术 被引量:3
8
作者 严迎建 叶建森 +1 位作者 刘军伟 徐劲松 《计算机工程与设计》 CSCD 北大核心 2009年第11期2727-2729,2752,共4页
在基于VLIW结构的分组密码专用处理器设计过程中,研究了VLIW处理器的指令集体系结构建模技术。设计了一个指令精确的指令集模拟器,通过附加一个流水线相关及停顿统计模块,实现了周期精确的程序运行统计和流水线停顿统计。结合指令集模... 在基于VLIW结构的分组密码专用处理器设计过程中,研究了VLIW处理器的指令集体系结构建模技术。设计了一个指令精确的指令集模拟器,通过附加一个流水线相关及停顿统计模块,实现了周期精确的程序运行统计和流水线停顿统计。结合指令集模拟器、汇编器以及调试器,设计了一个面向VLIW处理器的辅助程序优化环境。利用模拟器和调试器来评估程序的指令级并行度以及资源占用情况,辅助程序开发者优化VLIW处理器程序,从而达到软硬件协作开发VLIW处理器指令级并行性的最终目的。 展开更多
关键词 超长指令字(vliw) 处理器建模 指令集体系结构 指令集模拟器 指令级并行
在线阅读 下载PDF
VLIW DSP体系结构及其性能优化的软件方法 被引量:6
9
作者 章立生 韩承德 《计算机工程与应用》 CSCD 北大核心 2001年第5期25-27,31,共4页
影响DSP系统性能的因素主要有DSP处理器的体系结构、存储器系统、外设接口等硬件技术和程序优化等软件技术,其中软件的优化设计在DSP性能优化中起着越来越重要的作用。文章简要介绍了常见DSP系统的体系结构和存储器组织方法,并通过实... 影响DSP系统性能的因素主要有DSP处理器的体系结构、存储器系统、外设接口等硬件技术和程序优化等软件技术,其中软件的优化设计在DSP性能优化中起着越来越重要的作用。文章简要介绍了常见DSP系统的体系结构和存储器组织方法,并通过实例说明了对VLIW DSP系统进行软件优化的几种技术。 展开更多
关键词 DSP 体系结构 软件流水 vliw 数字信号处理器 性能优化 软件方法
在线阅读 下载PDF
VLIW体系结构微处理器的控制流分析与其模拟软件设计 被引量:2
10
作者 霍玉梅 王沁 《小型微型计算机系统》 CSCD 北大核心 2001年第5期513-516,共4页
本文在研究超长指令字 (VL IW)体系结构的基础上 ,总结了 VL IW体系结构的指令结构特征、处理器结构特征和执行特征 ,通过比较 VL IW体系结构微处理器模拟器的两种设计方案 ,选定以结构为基础设计模拟器的方案 ,并解决了模拟器的设计难... 本文在研究超长指令字 (VL IW)体系结构的基础上 ,总结了 VL IW体系结构的指令结构特征、处理器结构特征和执行特征 ,通过比较 VL IW体系结构微处理器模拟器的两种设计方案 ,选定以结构为基础设计模拟器的方案 ,并解决了模拟器的设计难点——串并行冲突的问题 . 展开更多
关键词 vliw 体系结构 微处理器 控制流分析 模拟软件 指令部件
在线阅读 下载PDF
VLIW处理器系统级验证平台的设计与实现 被引量:3
11
作者 杨焱 侯朝焕 《电子测量与仪器学报》 CSCD 2007年第2期81-85,共5页
本文提出了一种新的VLIW处理器验证平台的实现方法。采用寄存器跟踪技术,建立了一个与RTL模型一致的抽象功能验证模型,基于VXI总线测试技术,实现了高度集成化的系统芯片验证平台,弥补了单一验证技术的不足,设计期功能仿真满足测试覆盖... 本文提出了一种新的VLIW处理器验证平台的实现方法。采用寄存器跟踪技术,建立了一个与RTL模型一致的抽象功能验证模型,基于VXI总线测试技术,实现了高度集成化的系统芯片验证平台,弥补了单一验证技术的不足,设计期功能仿真满足测试覆盖率的要求,并与板级功能测试仿真保持一致,充分证明了方法的有效性。 展开更多
关键词 功能验证 vliw处理器 寄存器跟踪 测试
在线阅读 下载PDF
VLIW体系结构微处理器的一种设计方法 被引量:2
12
作者 王昭顺 张建林 曹文彬 《计算机科学》 CSCD 北大核心 2000年第8期40-42,共3页
微处理器体系结构的发展经历了三个不同的阶段,以Intel早期X86产品为代表的CISC体系结构微处理器;以MIPS、PA-RISC、SPARC、ALPHA、PowerPC等为代表的RISC体系结构微处理器;以Intel近期产品为代表的CISC—RISC混合型体系结构微处理器。R... 微处理器体系结构的发展经历了三个不同的阶段,以Intel早期X86产品为代表的CISC体系结构微处理器;以MIPS、PA-RISC、SPARC、ALPHA、PowerPC等为代表的RISC体系结构微处理器;以Intel近期产品为代表的CISC—RISC混合型体系结构微处理器。RISC和CISC由于其实现技术的复杂性。 展开更多
关键词 微处理器 体系结构 vliw 设计方法
在线阅读 下载PDF
面向能耗有效高性能嵌入式微处理器的VLIW调度 被引量:1
13
作者 管茂林 杨乾明 +1 位作者 张春元 文梅 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第6期26-33,共8页
为了降低功耗,目前能耗有效的嵌入式微处理器一般都采用分布式与层次化的寄存器文件结构。第一层的超小寄存器文件(TORF)的极小容量使得很多数据必须存放到第二层的通用寄存器文件(GRF)中,这给编译器带来了新的挑战。通过分析程序特征,... 为了降低功耗,目前能耗有效的嵌入式微处理器一般都采用分布式与层次化的寄存器文件结构。第一层的超小寄存器文件(TORF)的极小容量使得很多数据必须存放到第二层的通用寄存器文件(GRF)中,这给编译器带来了新的挑战。通过分析程序特征,提出了新的VLIW调度算法,通过在编译时对变量进行检测,在恰当的时机插入虚拟的copy操作并进行指令与通信调度,为对寄存器需求较大的全局变量与软流水变量构建了新的包含GRF的数据传输路由,将对TORF的压力转移到GRF中。实验结果表明,新的VLIW调度算法符合处理器的设计初衷。与不使用GRF相比,在程序性能只降低约8%的情况下,降低了约51%的寄存器访问能耗,43%的处理器能耗。最关键的是避免了程序员手工分配优化的难题。 展开更多
关键词 能耗有效 分布式与层次化寄存器文件 vliw调度
在线阅读 下载PDF
分簇VLIW结构下利用数据依赖图优化调度的研究 被引量:1
14
作者 杨旭 何虎 孙义和 《计算机学报》 EI CSCD 北大核心 2011年第1期182-192,共11页
应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非... 应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非常困难的事情,这是因为,当指令级并行度足够高时,在单一寄存器堆情况下,寄存器堆访问端口数目的限制会使得对寄存器堆的访问时间成为制约性能提高的关键因素.为了在利用高的指令级并行度的同时维持高的运行时钟频率,可以将寄存器堆和功能单元划分到不同的簇中.每一个簇中的功能单元可以直接访问簇内的寄存器堆,而簇间的数据交互则需要占用专用的资源来进行.因此,分簇结构下的编译器不仅要通过调度实现最大程序的指令级并行度,还应该对指令的分簇进行细致的安排以限制簇间的数据交互.该文致力于通过对数据依赖图(Data Dependence Graph)分析和划分,从而在最小化簇间的数据交互的同时,平衡各簇的利用情况,提高能够获得的指令级并行度,从而优化分簇式VLIW结构的调度性能.实验结果证明,该文所提出的方法可以极大地减少簇间的数据交互量,提高所能获得的指令级并行度,从而对调度结果的性能加以改善. 展开更多
关键词 分簇 vliw结构 数据依赖图 指令调度 簇间数据交互
在线阅读 下载PDF
VLIW微处理器模拟器仿真实现的几个关键问题 被引量:1
15
作者 王新辉 彭巨 王许书 《计算机工程与应用》 CSCD 北大核心 2000年第10期11-13,共3页
文章就一种VLIW体系微处理器模拟器仿真实现的几个关键问题(如模型建立、串并行的转换和数据相关等)进行了简要讨论,并提出了行之有效的解决方法.
关键词 vliw 模拟器 微处理器 仿真
在线阅读 下载PDF
基于最小操作单元的VLIW微处理器设计 被引量:1
16
作者 王昭顺 王许书 王俊宇 《计算机工程》 CAS CSCD 北大核心 2001年第2期43-44,120,共3页
提出一种微处理器体系结构发展的分析方法—粒度分析方法,并用这种方法分析了微处理器体系结构的发展趋势。在此基础上提出基于最小操作单元MOUB微处理器体系结构的设计思想,并设计实现了一个这种结构的微处理器模型。
关键词 微处理器 vliw 体系结构 设计 粒度分析 操作单元
在线阅读 下载PDF
消除VLIW结构上的循环体间冗余流相关 被引量:1
17
作者 容红波 汤志忠 《软件学报》 EI CSCD 北大核心 2000年第1期126-132,共7页
数据相关是并行处理的基本依据 .该文指出 ,VLIW(very long instruction word)特有的锁步性质使其数据相关性分析具有与众不同的特点 .同一体差上的流相关形成一个线序集合 ,多体差上的特征流相关之间也存在包含关系 .据此 ,提出一种用... 数据相关是并行处理的基本依据 .该文指出 ,VLIW(very long instruction word)特有的锁步性质使其数据相关性分析具有与众不同的特点 .同一体差上的流相关形成一个线序集合 ,多体差上的特征流相关之间也存在包含关系 .据此 ,提出一种用于 VL IW的消除循环体间冗余流相关的方法 .该方法是完备的 ,可以去除所有冗余的体间流相关 ,从而减轻循环调度的负担 .文章给出判定单体差和多体差存在冗余的充分必要条件 ,以及消除冗余的线性复杂度的算法 .这种方法具有普遍意义 ,可作为 VL IW上软件流水和多指令流调度的基础 . 展开更多
关键词 vliw 循环调度 数据相关 冗余 并行处理
在线阅读 下载PDF
VLIW微处理器特征与编译技术支持 被引量:2
18
作者 郑飞 陆鑫达 《微处理机》 1996年第3期1-4,共4页
VLIW是一种早已出现但一直未能广泛使用而现今又被重新重点研究的微处理器设计思想与技术,它跟超标量技术一样支持每周期执行多条指令,但并行度更高。本文将详细介绍VLIW的概念及其发展历程,讨论VLIW微处理器的特征与所需的编译技术... VLIW是一种早已出现但一直未能广泛使用而现今又被重新重点研究的微处理器设计思想与技术,它跟超标量技术一样支持每周期执行多条指令,但并行度更高。本文将详细介绍VLIW的概念及其发展历程,讨论VLIW微处理器的特征与所需的编译技术支持,并与超标量微处理器进行比较分析。 展开更多
关键词 微处理器 vliw 超标量 编译器
在线阅读 下载PDF
VLIW体系结构微处理器设计考虑 被引量:5
19
作者 王沁 《微计算机信息》 1999年第5期6-7,共2页
本文分析VLIW体系结构微处理器的特点和问题,介绍VLIW微处理器体系结构及其相关研究的动态,并提出设计VLIW体系结构微处理器的技术路线,建议将VLIW体系结构作为我国CPU芯片设计采用的体系结构。
关键词 微处理器 vliw CPU 体系结构 设计
在线阅读 下载PDF
面向高性能计算的流VLIW编译技术研究
20
作者 管茂林 伍楠 +3 位作者 文梅 吴伟 柴俊 张春元 《计算机工程与科学》 CSCD 2008年第7期100-104,124,共6页
本文基于斯坦福大学设计的KernelC编译器ISCD[1],针对64位流处理器体系结构,设计实现了其核心VLIW编译器,并针对高性能计算应用需求进行优化,实现了分布式寄存器负载均衡和指令自动合并技术。实验结果表明,该编译器能够很好地开发程序... 本文基于斯坦福大学设计的KernelC编译器ISCD[1],针对64位流处理器体系结构,设计实现了其核心VLIW编译器,并针对高性能计算应用需求进行优化,实现了分布式寄存器负载均衡和指令自动合并技术。实验结果表明,该编译器能够很好地开发程序中的并行性,具有较高的效率。 展开更多
关键词 流处理器 vliw 编译 指令合并 寄存器负载
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部