期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
四级流水线堆栈处理器研究与设计
1
作者 朱恒宇 周永录 +1 位作者 刘宏杰 代红兵 《计算机工程与设计》 北大核心 2025年第1期265-273,共9页
针对现有堆栈处理器主频较低的问题,设计一种16位的四级流水线堆栈处理器ZP16。采用冯诺伊曼结构与J1指令集,具有数据堆栈和返回堆栈两个独立堆栈。四级流水线包括取指、译码、执行和回写。通过合理的结构设计与流水线冲刷技术解决ZP16... 针对现有堆栈处理器主频较低的问题,设计一种16位的四级流水线堆栈处理器ZP16。采用冯诺伊曼结构与J1指令集,具有数据堆栈和返回堆栈两个独立堆栈。四级流水线包括取指、译码、执行和回写。通过合理的结构设计与流水线冲刷技术解决ZP16中流水线冒险问题。实验结果表明,在Xilinx XC7A100T FPGA目标芯片上,ZP16的运行主频稳定在230 MHz。与J1堆栈处理器相比,ZP16流水线加速比为1.3,资源占用率基本相当,功耗增加8%,主频提升130%。与其它同类型堆栈处理器在不同的目标芯片上进行比较,ZP16主频有较为明显的提升。 展开更多
关键词 堆栈处理器 流水线 现场可编程门阵列 主频 加速比 资源占用率 功耗
在线阅读 下载PDF
多核堆栈处理器中多核调度机制研究与设计
2
作者 刘自昂 周永录 +1 位作者 代红兵 刘宏杰 《计算机应用与软件》 北大核心 2025年第9期263-269,共7页
多核堆栈处理器作为Forth领域的研究热点之一,目前已取得了一定的研究进展,但多核堆栈处理器面临着缺乏高效Forth系统支撑的问题。针对Forth多核堆栈处理器的特性,研究并设计一种多核调度机制,该多核调度机制的多核调度算法使用全局调度... 多核堆栈处理器作为Forth领域的研究热点之一,目前已取得了一定的研究进展,但多核堆栈处理器面临着缺乏高效Forth系统支撑的问题。针对Forth多核堆栈处理器的特性,研究并设计一种多核调度机制,该多核调度机制的多核调度算法使用全局调度,Forth任务调度算法使用可变时间片轮转调度算法和EDF(Earliest Deadline First)调度算法,重点解决多核堆栈处理器平台的Forth任务调度问题。实验表明,多核调度机制能够在基于FPGA实现和工作于100 MHz频率的多核堆栈处理器上可靠运行,实现任务的正确调度,普通任务响应时间最低为0.5 ms,实时任务的平均响应最长为9.36μs。 展开更多
关键词 多核堆栈处理器 Forth系统 多核调度机制 全局调度 可变时间片轮转调度算法 EDF调度算法
在线阅读 下载PDF
功耗感知下基于堆栈处理器的存取任务调度系统
3
作者 梁锦来 骆国铭 《电子设计工程》 2025年第7期172-176,共5页
不同存取任务功耗情况影响了最终的调度效果,导致存取任务调度响应时间与实际不符。为此,在功耗感知下设计基于堆栈处理器的存取任务调度系统。硬件结构使用基于StackProcessor-1000的堆栈处理器和FlashMemory-2000的存取设备,输入到基... 不同存取任务功耗情况影响了最终的调度效果,导致存取任务调度响应时间与实际不符。为此,在功耗感知下设计基于堆栈处理器的存取任务调度系统。硬件结构使用基于StackProcessor-1000的堆栈处理器和FlashMemory-2000的存取设备,输入到基于CPU的任务调度设备中,以帮助系统执行数据存取操作,同时合理调度和管理任务,确保系统稳定运行。软件部分在计算任务于最大电压下的堆栈执行时间,获取堆栈处理器最大功率下任务产生能耗。依据功耗结果,获取调度任务开始时间和结束时间,并根据优先级判断的结果,更新堆栈中任务信息,保证任务正确调度和执行。测试结果表明,设计系统任务调度与实际调度存在最大为1 min的误差,优化了存取任务调度效果。 展开更多
关键词 功耗感知 堆栈处理器 存取任务 调度系统 优先级判断
在线阅读 下载PDF
基于交叉开关互连的多核堆栈处理器架构设计
4
作者 刘欢庆 周永录 +1 位作者 刘宏杰 代红兵 《计算机工程与设计》 北大核心 2024年第7期2212-2219,共8页
为满足堆栈处理器对于并行化程序应用的需求,提出一种多核堆栈处理器架构。在单核堆栈处理器的基础上,以交叉开关作为核间互连结构,通过对指令集、高速缓存器、一致性协议以及中断机制的设计,可在一个时钟周期内完成取指、译码、执行、... 为满足堆栈处理器对于并行化程序应用的需求,提出一种多核堆栈处理器架构。在单核堆栈处理器的基础上,以交叉开关作为核间互连结构,通过对指令集、高速缓存器、一致性协议以及中断机制的设计,可在一个时钟周期内完成取指、译码、执行、核间数据传输和中断响应操作。在Xilinx FPGA芯片上进行单核、双核和四核堆栈处理器的实现,通过矩阵乘法计算进行性能实验验证,在100 MHz时钟频率的情况下,四核堆栈处理器的最大性能相当于单核堆栈处理器的3.99倍。实验结果表明,基于交叉开关互连的多核堆栈处理器架构可较好发挥多核堆栈处理器中每一个核心的性能。 展开更多
关键词 堆栈处理器 多核处理器 交叉开关 高速缓存 一致性协议 中断控制器 现场可编程门阵列
在线阅读 下载PDF
多核堆栈处理器研究与设计
5
作者 刘自昂 周永录 +1 位作者 代红兵 刘宏杰 《计算机工程与设计》 北大核心 2024年第4期1256-1263,共8页
为满足日趋复杂的嵌入式环境对堆栈处理器和Forth技术的应用需求,在单核堆栈处理器模型研究的基础上,设计一种多核堆栈处理器模型。基于J1单核堆栈处理器模型,针对多核目标,增加计时器、中断等功能,形成新的L32单核堆栈处理器模型,并以... 为满足日趋复杂的嵌入式环境对堆栈处理器和Forth技术的应用需求,在单核堆栈处理器模型研究的基础上,设计一种多核堆栈处理器模型。基于J1单核堆栈处理器模型,针对多核目标,增加计时器、中断等功能,形成新的L32单核堆栈处理器模型,并以该单核模型为内核,引入共享总线和十字开关互联方式的Wishbone总线、多端口存储器和面向多任务Forth系统的指令集,建立一种多核堆栈处理器模型L32-MC。利用该多核模型,在FPGA上实现4核和8核的L32-MC原型多核堆栈处理器。实验结果表明,4核和8核的L32-MC原型堆栈处理器满足高性能低功耗的多核处理器设计目标。 展开更多
关键词 多核堆栈处理器 Forth技术 Wishbone片上总线 多端口存储器 指令集 现场可编程门阵列 嵌入式
在线阅读 下载PDF
面向飞腾迈创DSP的自主软件栈设计
6
作者 时洋 陈照云 +3 位作者 孙海燕 王耀华 文梅 扈啸 《计算机工程与科学》 CSCD 北大核心 2024年第6期968-976,共9页
飞腾迈创DSP是国防科技大学计算机学院为了突破卡脖子技术,解决我国相关重点领域内芯片长久受制于人的现实问题而自主设计的高性能数字信号处理器。由于该系列芯片采用全自主设计的指令集,无法兼容已有的软件,一套自主完备且高效的软件... 飞腾迈创DSP是国防科技大学计算机学院为了突破卡脖子技术,解决我国相关重点领域内芯片长久受制于人的现实问题而自主设计的高性能数字信号处理器。由于该系列芯片采用全自主设计的指令集,无法兼容已有的软件,一套自主完备且高效的软件栈是决定飞腾迈创DSP生命力的关键。基于团队长期以来的持续工作,系统阐述了飞腾迈创DSP软件栈的设计原则与层次化架构,重点介绍了包括支持层、编译层以及工具层在内的相关软件工具的创新功能、实现方法以及性能。同时,结合用户的反馈与团队的思考,还讨论了飞腾迈创DSP软件栈未来需要探索的相关问题。 展开更多
关键词 DSP 软件栈 编译器 调试器 自主芯片
在线阅读 下载PDF
申威平台高速网络数据处理框架的设计与实现
7
作者 曹建军 佘平 聂世强 《计算机技术与发展》 2024年第7期184-191,共8页
随着大数据时代网络流量的激增,传统内核网络协议栈由于内核切换开销占比高等原因导致现有基于内核的网络数据处理系统无法充分利用10 Gb乃至100 Gb的高速网卡收发能力。为了降低内核切换开销,开源DPDK用户态网络开发套件被提出以支持... 随着大数据时代网络流量的激增,传统内核网络协议栈由于内核切换开销占比高等原因导致现有基于内核的网络数据处理系统无法充分利用10 Gb乃至100 Gb的高速网卡收发能力。为了降低内核切换开销,开源DPDK用户态网络开发套件被提出以支持高速网络流量处理,并在x86平台得到大规模应用和部署。为了满足国产化信创和网络安全的要求,面向国产申威处理器平台设计并实现了一套基于DPDK的网络流量组包解析框架,充分利用DPDK的大页内存、无锁队列等机制,设计多线程并行以发挥申威处理器多核性能,支持常见基于TCP/UDP的多种应用层协议解析,并具有轻量化和可扩展特点。基于真实硬件平台实验结果表明,该框架性能比现有主流软件提高10%左右,为基于国产处理器平台的高速网络数据处理做了初步探索。 展开更多
关键词 DPDK 协议分析 高速网络 TCP/IP协议栈 国产处理器
在线阅读 下载PDF
NP防火墙协议栈驱动模块的设计与实现 被引量:1
8
作者 韩志耕 罗军舟 《计算机工程》 EI CAS CSCD 北大核心 2006年第21期136-138,共3页
彻底打通网络处理器光口到本地协议栈间通路需要协议栈驱动提供支持。针对协议栈驱动基本组成和内在驱动机制,同时确保遵循Intel IXA软件架构分层设计原则,该文提出了在Linux平台上的实现方案并进行了分析,指出了实现过程中牵涉的关键... 彻底打通网络处理器光口到本地协议栈间通路需要协议栈驱动提供支持。针对协议栈驱动基本组成和内在驱动机制,同时确保遵循Intel IXA软件架构分层设计原则,该文提出了在Linux平台上的实现方案并进行了分析,指出了实现过程中牵涉的关键技术。Enp2611评估板上硬件光口打通测试表明设计达到了预先要求。 展开更多
关键词 协议栈驱动 防火墙 网络处理器 包分类 主动式安全防范系统
在线阅读 下载PDF
分支指令特性与分支预测器的性能研究 被引量:1
9
作者 喻明艳 张祥建 王晨旭 《微电子学与计算机》 CSCD 北大核心 2010年第6期8-12,共5页
根据分支指令的特性,分析了分支行为与分支预测技术对单发射嵌入式处理器CPI栈(CPI stacks)组成的影响,并在RTL级设计了分支预测器的时序精确模型,通过硬件模拟方法对分支指令特性和分支预测器的性能进行了研究.实验考察了分支指令在分... 根据分支指令的特性,分析了分支行为与分支预测技术对单发射嵌入式处理器CPI栈(CPI stacks)组成的影响,并在RTL级设计了分支预测器的时序精确模型,通过硬件模拟方法对分支指令特性和分支预测器的性能进行了研究.实验考察了分支指令在分支预测器命中或缺失时的不同跳转统计特性,验证了分支预测器对CPI栈影响的理论推导,为单发射嵌入式处理器中分支预测器的设计与优化提供了精确的实验依据. 展开更多
关键词 CPI栈 分支预测器 单发射嵌入式处理器 硬件模型
在线阅读 下载PDF
基于DM9000A的嵌入式以太网接口设计与实现 被引量:26
10
作者 施勇 温阳东 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期519-524,共6页
文章提出了一种基于32位ARM处理器LPC2468和以太网控制器DM9000A的嵌入式以太网接口设计方法。硬件方面主要涉及以太网网络接口电路的设计,软件方面主要涉及以太网控制芯片驱动程序和上层网路协议。该嵌入式系统网络接入方案具有硬件接... 文章提出了一种基于32位ARM处理器LPC2468和以太网控制器DM9000A的嵌入式以太网接口设计方法。硬件方面主要涉及以太网网络接口电路的设计,软件方面主要涉及以太网控制芯片驱动程序和上层网路协议。该嵌入式系统网络接入方案具有硬件接口简单、外围器件少、价格低廉、开发周期短等特点。 展开更多
关键词 嵌入式系统 LPC2468处理器 DM9000A控制器 网络驱动 TCP/IP网络协议栈
在线阅读 下载PDF
基于NP策略路由中源地址路由功能的设计与实现 被引量:2
11
作者 易著梁 《广西民族大学学报(自然科学版)》 CAS 2013年第3期64-67,共4页
阐述了一种基于网络处理器的源地址路由解决方案.该方案能够在不影响IP报文的承载效率的情况下,透明的实现大容量报文的转发能力,是一种行之有效的方案.
关键词 源地址路由 网络处理器 IP协议栈
在线阅读 下载PDF
基于网络处理器的新型IPv6转发系统的设计与实现
12
作者 苏金树 时向泉 吴纯青 《国防科技大学学报》 EI CAS CSCD 北大核心 2005年第5期6-11,共6页
转发与控制分离结构的提出和网络处理器的发展对路由器的扩展性、灵活性、性能具有重要的影响,而IPv6作为下一代互联网协议的核心,是路由器研究的重要对象。简要阐述了基于转发与控制分离结构ForCES的IPv6路由器的系统结构,重点论述了... 转发与控制分离结构的提出和网络处理器的发展对路由器的扩展性、灵活性、性能具有重要的影响,而IPv6作为下一代互联网协议的核心,是路由器研究的重要对象。简要阐述了基于转发与控制分离结构ForCES的IPv6路由器的系统结构,重点论述了基于网络处理器的IPv6路由器的转发结构、双栈转发系统的流程设计和隧道机制设计的实现,给出IPv6路由器原型系统的实际测试结果。 展开更多
关键词 IPV6 转发与控制分离 网络处理器 双栈 隧道
在线阅读 下载PDF
C环境下DSP程序存储空间访问技术 被引量:2
13
作者 易龙强 戴瑜兴 《湖南工程学院学报(自然科学版)》 2006年第4期1-3,19,共4页
针对TMS320C2xx系列DSP的C编译器未提供程序存储器数据操作的C运行库函数的问题,介绍了该项技术的解决方法.通过介绍函数功能实现所用汇编指令以及TI的C编译环境软堆栈结构和C语言调用规范,详细描述了C可调用DSP程序存储空间访问技术的... 针对TMS320C2xx系列DSP的C编译器未提供程序存储器数据操作的C运行库函数的问题,介绍了该项技术的解决方法.通过介绍函数功能实现所用汇编指令以及TI的C编译环境软堆栈结构和C语言调用规范,详细描述了C可调用DSP程序存储空间访问技术的程序实现方法.该技术可用于具有大量数据常量的工程应用中,以解决其数据存储单元资源紧缺问题.利用该技术还可以在程序存储空间上开辟一段空间用作非易失性存储空间存储用户掉电保护数据,这样有利于简化系统并提高系统性能.实践证明,该技术具有极高的实用价值. 展开更多
关键词 DSP C编译器 堆栈
在线阅读 下载PDF
利用硬件抽象机模拟执行技术设计JAVA处理器
14
作者 王海晨 赵祥模 《微电子学与计算机》 CSCD 北大核心 2011年第1期104-107,共4页
提出了一个基于硬件抽象机的流水线微处理器设计框架,创造性地使用了一种基于标签结构的模拟执行技术.基于这一框架,描述了一个堆栈抽象机的工作原理,实现了一个Java指令级并行处理器.利用堆栈硬件抽象机和堆栈指令折叠技术的组合解决了... 提出了一个基于硬件抽象机的流水线微处理器设计框架,创造性地使用了一种基于标签结构的模拟执行技术.基于这一框架,描述了一个堆栈抽象机的工作原理,实现了一个Java指令级并行处理器.利用堆栈硬件抽象机和堆栈指令折叠技术的组合解决了Java处理器中的堆栈依赖瓶颈问题.软件模拟证明了该处理器能够最大限度地挖掘出Java程序中的指令级并行,并且拥有更高的处理能力. 展开更多
关键词 抽象机 Java微处理器 堆栈 指令级并行 超长指令字
在线阅读 下载PDF
支持程序无缝切换的高性能硬件堆栈
15
作者 陈志坚 孟建熠 +1 位作者 葛海通 严晓浪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第9期1587-1592,共6页
针对函数调用中上下文切换产生的性能损失,提出一种支持程序无缝切换的嵌入式处理器高性能硬件堆栈.高性能硬件堆栈包括数据栈和返回栈,采用动态可重构的两级缓存机制,消除程序切换的性能开销.数据栈实现单周期多数据压栈/出栈,隐藏程... 针对函数调用中上下文切换产生的性能损失,提出一种支持程序无缝切换的嵌入式处理器高性能硬件堆栈.高性能硬件堆栈包括数据栈和返回栈,采用动态可重构的两级缓存机制,消除程序切换的性能开销.数据栈实现单周期多数据压栈/出栈,隐藏程序切换中的堆栈操作;返回栈实现指令超前预取,消除程序返回时流水线气泡.数据栈与返回栈分别复用数据和指令高速暂存器,实现用户可重构的二级缓存.实验结果显示:本方法平均提升性能10%以上,功耗降低2%. 展开更多
关键词 硬件堆栈 无缝切换 嵌入式处理器 高速暂存器
在线阅读 下载PDF
基于SOPC的以太网实时数据采集系统设计与实现 被引量:5
16
作者 梅大成 柴志勇 《计算机应用》 CSCD 北大核心 2009年第B12期108-109,112,共3页
设计了一个基于SOPC技术的实时数据采集系统。系统采用NiosⅡ软核处理器为主控制器,以嵌入式实时操作系统μC/OS-Ⅱ为软件运行平台,以LWIP为以太网通信协议,实现了数据采集系统的以太网传输及控制。整个系统在CycloneⅡ EP2C35开发板上... 设计了一个基于SOPC技术的实时数据采集系统。系统采用NiosⅡ软核处理器为主控制器,以嵌入式实时操作系统μC/OS-Ⅱ为软件运行平台,以LWIP为以太网通信协议,实现了数据采集系统的以太网传输及控制。整个系统在CycloneⅡ EP2C35开发板上实现并通过验证。 展开更多
关键词 NiosⅡ软核处理器 SOPC μC/OS-Ⅱ LWIP协议栈 实时数据采集
在线阅读 下载PDF
基于FPGA的16位堆栈处理器的设计 被引量:3
17
作者 储昭贤 施慧彬 《微电子学与计算机》 CSCD 北大核心 2012年第2期22-26,共5页
设计了一款面向嵌入式控制领域的16位堆栈处理器,该处理器包含两个堆栈:执行数学表达式的数据堆栈和支持子程序调用的返回堆栈,其指令集含35条堆栈指令.详细给出了该堆栈处理器的体系结构及设计方法;不仅采用简单有效的指令编码方式缩... 设计了一款面向嵌入式控制领域的16位堆栈处理器,该处理器包含两个堆栈:执行数学表达式的数据堆栈和支持子程序调用的返回堆栈,其指令集含35条堆栈指令.详细给出了该堆栈处理器的体系结构及设计方法;不仅采用简单有效的指令编码方式缩小了代码体积,同时给出了单周期操作多个堆栈元素的解决方法.该处理器采用FPGA实现,在XC5VLX110T芯片上的运行时钟频率最高达到146.7MHz.最后给出了设计的软件仿真与硬件综合结果. 展开更多
关键词 堆栈处理器 嵌入式 FPGA
在线阅读 下载PDF
基于堆栈处理器的实时多任务调度机制研究与实现 被引量:8
18
作者 郭金辉 刘宏杰 +1 位作者 代红兵 周永录 《计算机应用研究》 CSCD 北大核心 2021年第9期2752-2756,2772,共6页
针对堆栈处理器特殊架构,为提高实时性,引入多任务堆栈技术,采用Forth自生成器技术,提出一种基于堆栈处理器的抢占式与时间片轮转调度方法,实现了在Forth堆栈处理器中实时多任务的运行,弥补了Forth堆栈处理器在实时多任务操作系统方面... 针对堆栈处理器特殊架构,为提高实时性,引入多任务堆栈技术,采用Forth自生成器技术,提出一种基于堆栈处理器的抢占式与时间片轮转调度方法,实现了在Forth堆栈处理器中实时多任务的运行,弥补了Forth堆栈处理器在实时多任务操作系统方面的的不足。实验表明,与当前基于寄存器处理器的嵌入式Forth实时系统相比,本文方法在最大关中断时间、任务上下文切换时间和任务响应时间三项重要的实时任务性能指标方面,实时性能有明显提升,从而保证了Forth系统应用的高效性和安全性,满足人们对Forth堆栈处理器实时多任务操作系统方面的应用需求。 展开更多
关键词 实时多任务 Forth堆栈处理器 Forth自生成器技术 抢占式与时间片轮转调度
在线阅读 下载PDF
堆栈处理器代码生成器的设计与实现 被引量:1
19
作者 赵小东 施慧彬 《计算机技术与发展》 2013年第4期163-167,共5页
堆栈处理器是一种面向嵌入式控制领域的处理器,其执行过程不依赖于通用寄存器而是硬件堆栈。文中以一款基于FPGA设计的16位堆栈处理器为平台,研究如何将一个C源代码转换成能够被目标处理器汇编器识别的汇编指令。为了能够迅速有效地实... 堆栈处理器是一种面向嵌入式控制领域的处理器,其执行过程不依赖于通用寄存器而是硬件堆栈。文中以一款基于FPGA设计的16位堆栈处理器为平台,研究如何将一个C源代码转换成能够被目标处理器汇编器识别的汇编指令。为了能够迅速有效地实现代码生成器,文中选用LCC。LCC是一款可变目标的C编译器,通过重新书写目标处理器的描述文件,LCC可以生成特定处理器的汇编指令。文章的最后通过一个简单的测试证明了C语言是可以移植到堆栈处理器上的。 展开更多
关键词 堆栈处理器 代码生成器 LCC
在线阅读 下载PDF
多核网络协议栈可扩展性解耦设计 被引量:1
20
作者 尚秋里 王劲林 +1 位作者 陈晓 叶晓舟 《网络新媒体技术》 2017年第5期15-19,共5页
高速网络环境下,多核网络协议栈的性能可扩展性尤为重要。针对多核可扩展性问题,本文提出了一种多核网络协议栈可扩展性解耦设计方案,包括数据包和网卡队列两个层面的解耦。其中,数据包层面解耦通过数据流分流映射的方法来实现多核全并... 高速网络环境下,多核网络协议栈的性能可扩展性尤为重要。针对多核可扩展性问题,本文提出了一种多核网络协议栈可扩展性解耦设计方案,包括数据包和网卡队列两个层面的解耦。其中,数据包层面解耦通过数据流分流映射的方法来实现多核全并行无锁处理;网卡队列层面通过多虚拟队列来解决多核的网卡队列竞争。实验表明,本文提出的解耦方案在20GE实验平台上实现了多达14个处理核心的线性网络性能扩展,比传统多核并发方案具有更优的可扩展性。 展开更多
关键词 多核处理器 网络协议栈 可扩展性
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部