期刊文献+
共找到177篇文章
< 1 2 9 >
每页显示 20 50 100
An FPGA Implementation of GF(p)Elliptic Curve Cryptographic Coprocessor 被引量:1
1
作者 LIU Yu-zhen QIN Zhong-ping ZHANG Huan-guo 《Wuhan University Journal of Natural Sciences》 CAS 2005年第1期31-34,共4页
A GF(p)elliptic curve cryptographic coprocessor is proposed and implemented on Field Programmable Gate Array(FPGA).The focus of the coprocessor is on the most critical,complicated and time-consuming point multiplicati... A GF(p)elliptic curve cryptographic coprocessor is proposed and implemented on Field Programmable Gate Array(FPGA).The focus of the coprocessor is on the most critical,complicated and time-consuming point multiplications.The technique of coordinates conversion and fast multiplication algorithm of two large integers are utilized to avoid frequent inversions and to accelerate the field multiplications used in point multiplications.The characteristic of hardware parallelism is considered in the implementation of point multiplications.The coprocessor implemented on XILINX XC2V3000 computes a point multiplication for an arbitrary point on a curve defined over GF(2192?264?1)with the frequency of 10 MHz in 4.40 ms in the average case and 5.74 ms in the worst case.At the same circumstance,the coprocessor implemented on XILINX XC2V4000 takes 2.2 ms in the average case and 2.88 ms in the worst case. 展开更多
关键词 elliptic curve cryptosystems cryptographic coprocessor CRYPTOGRAPHY information security
在线阅读 下载PDF
An IEEE 1149.x Embedded Test Coprocessor 被引量:1
2
作者 Ukbagiorgis Iyasu Gebremeskel José Manuel Martins Ferreira 《Circuits and Systems》 2014年第7期170-180,共11页
This paper describes a microprogrammed architecture for an embedded coprocessor that is able to control IEEE 1149.1 to IEEE 1149.7 test infrastructures, and explains how to expand the supported test command set. The c... This paper describes a microprogrammed architecture for an embedded coprocessor that is able to control IEEE 1149.1 to IEEE 1149.7 test infrastructures, and explains how to expand the supported test command set. The coprocessor uses a fast simplex link (FSL) channel to interface a 32-bit MicroBlaze CPU, but it can work with any microprocessor core that accepts this simple FIFO-based interface method. The implementation cost (logic resource usage for a Xilinx Spartan-6 FPGA) and the performance data (operating frequency) are presented for a test command set comprising two parts: 1) the full IEEE 1149.1 structural test operations;2) a subset of IEEE 1149.7 operations selected to illustrate the implementation of advanced scan formats. 展开更多
关键词 BUILT-IN Test Boundary-Scan EMBEDDED coprocessorS MICROBLAZE IEEE 1149.1 IEEE 1149.7
暂未订购
A Coprocessor Architecture for 80/112-bit Security Related Applications
3
作者 Muhammad Rashid Majid Alotaibi 《Computers, Materials & Continua》 SCIE EI 2023年第3期6849-6865,共17页
We have proposed a flexible coprocessor key-authentication architecture for 80/112-bit security-related applications over GF(2m)field by employing Elliptic-curve Diffie Hellman(ECDH)protocol.Towards flexibility,a seri... We have proposed a flexible coprocessor key-authentication architecture for 80/112-bit security-related applications over GF(2m)field by employing Elliptic-curve Diffie Hellman(ECDH)protocol.Towards flexibility,a serial input/output interface is used to load/produce secret,public,and shared keys sequentially.Moreover,to reduce the hardware resources and to achieve a reasonable time for cryptographic computations,we have proposed a finite field digit-serial multiplier architecture using combined shift and accumulate techniques.Furthermore,two finite-statemachine controllers are used to perform efficient control functionalities.The proposed coprocessor architecture over GF(2^(163))and GF(2^(233))is programmed using Verilog and then implemented on Xilinx Virtex-7 FPGA(field-programmable-gate-array)device.For GF(2^(163))and GF(2^(233)),the proposed flexible coprocessor use 1351 and 1789 slices,the achieved clock frequency is 250 and 235MHz,time for one public key computation is 40.50 and 79.20μs and time for one shared key generation is 81.00 and 158.40μs.Similarly,the consumed power over GF(2^(163))and GF(2^(233))is 0.91 and 1.37mW,respectively.The proposed coprocessor architecture outperforms state-of-the-art ECDH designs in terms of hardware resources. 展开更多
关键词 coprocessor design key-authentication wireless sensor nodes RFID ECDH FPGA
在线阅读 下载PDF
Intel^(■) Math Kernel Library PARDISO* forIntel^(■) Xeon Phi^(TM) Manycore Coprocessor
4
作者 Alexander Kalinkin Anton Anders Roman Anders 《Applied Mathematics》 2015年第8期1276-1281,共6页
The paper describes an efficient direct method to solve an equation Ax = b, where A is a sparse matrix, on the Intel&reg;Xeon PhiTM coprocessor. The main challenge for such a system is how to engage all available ... The paper describes an efficient direct method to solve an equation Ax = b, where A is a sparse matrix, on the Intel&reg;Xeon PhiTM coprocessor. The main challenge for such a system is how to engage all available threads (about 240) and how to reduce OpenMP* synchronization overhead, which is very expensive for hundreds of threads. The method consists of decomposing A into a product of lower-triangular, diagonal, and upper triangular matrices followed by solves of the resulting three subsystems. The main idea is based on the hybrid parallel algorithm used in the Intel&reg;Math Kernel Library Parallel Direct Sparse Solver for Clusters [1]. Our implementation exploits a static scheduling algorithm during the factorization step to reduce OpenMP synchronization overhead. To effectively engage all available threads, a three-level approach of parallelization is used. Furthermore, we demonstrate that our implementation can perform up to 100 times better on factorization step and up to 65 times better in terms of overall performance on the 240 threads of the Intel&reg;Xeon PhiTM coprocessor. 展开更多
关键词 Multifrontal Method Direct Method Sparse Linear System HPC OpenMP* Intel^(■) MKL Intel^(■) Xeon Phi^(TM) coprocessor
在线阅读 下载PDF
A Novel Defibrillator-Specific Coprocessor Capable of Running Entropy and CNN Integration Algorithms
5
作者 Xuelong Wang Peng Xia +4 位作者 Changjiang Zhou Zhenyi Huang Hao Zhao Haipo Cui Shiju Yan 《Journal of Biosciences and Medicines》 2024年第11期310-322,共13页
It is difficult for the existing Automated External Defibrillator (AED) on-board microprocessors to accurately classify electrocardiographic signals (ECGs) mixed with Cardiopulmonary Resuscitation artifacts in real-ti... It is difficult for the existing Automated External Defibrillator (AED) on-board microprocessors to accurately classify electrocardiographic signals (ECGs) mixed with Cardiopulmonary Resuscitation artifacts in real-time. In order to improve recognition speed and accuracy of electrocardiographic signals containing Cardiopulmonary Resuscitation artifacts, a new special coprocessor system-on-chip (SoC) for defibrillators was designed. In this study, a microprocessor was designed based on the RISC-V architecture to achieve hardware acceleration for ECGs classification;Besides, an Approximate Entropy (ApEn) and Convolutional neural networks (CNNs) integrated algorithm capable of running on it was designed. The algorithm differs from traditional electrocardiographic (ECG) classification algorithms. It can be used to perform ECG classification while chest compressions are applied. The proposed co-processor can be used to accelerate computation rate of ApEn by 34 times compared with pure software computation. It can also be used to accelerate the speed of CNNs ECG recognition by 33 times. The combined algorithm was used to classify ECGs with CPR artifacts. It achieved a precision of 96%, which was significantly superior to that of simple CNNs. The coprocessor can be used to significantly improve the recognition efficiency and accuracy of ECGs containing CPR artifacts. It is suitable for automatic external defibrillator and other medical devices in which one-dimensional physiological signals. 展开更多
关键词 DEFIBRILLATOR SoC ENTROPY Vector Multiplication coprocessor RISCV ECG Classification
在线阅读 下载PDF
基于RISC-V的SM3密码协处理器设计
6
作者 魏余浩 高树静 王海婷 《电子设计工程》 2025年第18期6-10,共5页
为了实现物联网领域低面积低延迟加密,文中采用硬件复用、循环结构以及关键路径加法器设计优化SM3加密算法核的面积和性能,并通过3条自定义扩展指令在蜂鸟E203上扩展了SM3密码协处理器,组成了异构计算的RISC-V SOC,以此实现数据加密的... 为了实现物联网领域低面积低延迟加密,文中采用硬件复用、循环结构以及关键路径加法器设计优化SM3加密算法核的面积和性能,并通过3条自定义扩展指令在蜂鸟E203上扩展了SM3密码协处理器,组成了异构计算的RISC-V SOC,以此实现数据加密的硬件加速。在搭建的基于FPGA的SOC平台上进行验证,结果表明与无扩展指令进行加密相比,在保证减少设计面积的基础上吞吐率提高64倍。在UMC28 nm工艺下,SM3加密核综合后面积为7466.3μm^(2),时钟频率最高可达133 MHz。SM3协处理器在时钟频率为100 MHz下数据吞吐率可达584 Mb/s。 展开更多
关键词 RISC-V SM3 SOC 协处理器 扩展指令
在线阅读 下载PDF
基于RISC-V的LMS算法加速方案
7
作者 叶岸茏 马令坤 曲宗一 《集成电路与嵌入式系统》 2025年第5期52-59,共8页
LMS算法作为基本的自适应滤波算法,在噪声抑制领域得到了广泛应用,其实现方式主要基于通用处理器,但存在运算效率和性能较低的问题。RISC-V架构具有开源、精简、扩展性强等优势,适用于专用型处理器的实现。本文针对LMS算法设计了基于RIS... LMS算法作为基本的自适应滤波算法,在噪声抑制领域得到了广泛应用,其实现方式主要基于通用处理器,但存在运算效率和性能较低的问题。RISC-V架构具有开源、精简、扩展性强等优势,适用于专用型处理器的实现。本文针对LMS算法设计了基于RISC-V的专用处理器。采用自定义指令集F扩展处理浮点数,并且在协处理器中加入MAC指令完成针对LMS算法的加速。实验结果表明,该处理器能够实现噪声的有效抵消,当输入信噪比为5 dB时,消噪后信噪比为17.5 dB;系统使用FPU执行LMS算法,指令执行数为220354,执行周期为586221;当采用本设计方案时,工作在FPU+MAC方式下,指令执行数为31621,执行周期为89412,效率明显提高。 展开更多
关键词 RISC-V 协处理器 LMS FPU 蜂鸟E203
在线阅读 下载PDF
基于RISC-V的IDEA协处理器设计
8
作者 石永超 高树静 +1 位作者 秋小强 杨海钢 《电子设计工程》 2025年第6期6-9,15,共5页
文中通过扩展指令,在芯来蜂鸟E203 MCU上实现了IDEA(International Data Encryption Algorithm)加解密算法的协处理器,并对算法核进行改进,将用辗转相除法求模乘逆元换成了基于费马小定理的实现方式,在此基础上组成了异构计算的RISC-V ... 文中通过扩展指令,在芯来蜂鸟E203 MCU上实现了IDEA(International Data Encryption Algorithm)加解密算法的协处理器,并对算法核进行改进,将用辗转相除法求模乘逆元换成了基于费马小定理的实现方式,在此基础上组成了异构计算的RISC-V SOC。与无扩展指令的IDEA加解密相比,IDEA的运算速度提升了319倍,在联华28 nm工艺下,其面积是14977μm^(2),吞吐率可达740 Mbps,最大时钟频率可达104 MHz。IDEA协处理器在时钟频率100 MHz下,数据吞吐率可达116.364 Mbps。 展开更多
关键词 RISC-V 协处理器 扩展指令 IDEA算法
在线阅读 下载PDF
三角函数协处理器的设计与实现
9
作者 胡玉婷 袁甲 张加宏 《中国电子科学研究院学报》 2025年第3期321-330,共10页
在实时处理和边缘计算应用中,三角函数作为基础计算广泛使用,仅依靠性能有限的微处理器会面临实时性和功耗的问题。为应对这些挑战,设计了一种基于CORDIC算法的协处理器,用以提升运算速度和效率。该协处理器采用直接内存访问技术快速获... 在实时处理和边缘计算应用中,三角函数作为基础计算广泛使用,仅依靠性能有限的微处理器会面临实时性和功耗的问题。为应对这些挑战,设计了一种基于CORDIC算法的协处理器,用以提升运算速度和效率。该协处理器采用直接内存访问技术快速获取数据,并具备灵活的配置能力。核心模块以CORDIC算法为基础,通过查找表替代法、固定高位动态处理低位法以及改进的混合迭代法优化运算过程。整体架构采用流水线结构,显著减少迭代周期和硬件资源占用。仿真结果显示,协处理器平均相对误差为1×10^(-5),综合结果的总资源消耗LUT数1103、FF数571,其中改进的算法模块相较传统算法节省约46.72%资源,最大频率达315.36 MHz。该设计具有高运行频率和低资源占用,适用于实时处理芯片等高计算需求场景,具有广泛的应用前景。 展开更多
关键词 协处理器 CORDIC算法 三角函数 混合迭代法
在线阅读 下载PDF
基于RISC-V指令扩展的双线性对协处理器设计
10
作者 于斌 闵玉新 +2 位作者 张自豪 刘志伟 黄海 《电子与信息学报》 北大核心 2025年第9期3137-3145,共9页
双线性对运算是基于身份的标识密码算法的核心运算,而在边缘设备中实现该运算需要在性能与面积两方面进行折衷。采用指令扩展方式进行软硬件协同设计是具备灵活性和可扩展性的设计方式,但在双线性对运算方面的研究忽略了数据交互过程的... 双线性对运算是基于身份的标识密码算法的核心运算,而在边缘设备中实现该运算需要在性能与面积两方面进行折衷。采用指令扩展方式进行软硬件协同设计是具备灵活性和可扩展性的设计方式,但在双线性对运算方面的研究忽略了数据交互过程的时间损耗。该文结合双线性对算法与软硬件协同设计的特点,提出了适配总线传输的模乘运算模式用于减少数据交互过程中的时间损耗,同时设计适配该模式的模乘单元与阔域运算的时序排布,完成基于国产RISC-V处理器进行素数域运算和扩域运算的自定义指令扩展,并使用C语言调度硬件指令实现软硬件协同设计方案。所设计的协处理器在Xilinx ZYNQ-7000 FPGA平台上实现,共消耗8.3k个Slice与134个数字处理单元(DSP),素数域模乘的执行时间为0.3μs,2次扩域模乘的执行时间为0.6μs,双线性对的执行时间约为17.5 ms。实验结果表明,该文设计的协处理器兼顾性能与面积,与同类设计在性能上相比提升6.7%,能够高效地实现双线性对运算。 展开更多
关键词 RISC-V 双线性对运算 协处理器 模乘
在线阅读 下载PDF
基于协处理器的HBase区域级第二索引研究与实现 被引量:16
11
作者 丁飞 陈长松 +2 位作者 张涛 杨涛 张岩峰 《计算机应用》 CSCD 北大核心 2014年第A01期181-185,共5页
针对HBase全表扫描查询效率问题,对HBase第二索引功能进行研究,实现一种基于HBase协处理器的服务端区域级第二索引扩展功能。通过将索引维护与查询放到服务端完成,极大地减少了网络通信开销。索引文件使用HFile格式组织。利用HFile成熟... 针对HBase全表扫描查询效率问题,对HBase第二索引功能进行研究,实现一种基于HBase协处理器的服务端区域级第二索引扩展功能。通过将索引维护与查询放到服务端完成,极大地减少了网络通信开销。索引文件使用HFile格式组织。利用HFile成熟的编程接口以及高效的读写性能,使得索引维护变得简单易行,也保证了索引读写的效率,提供了高效的查询性能。实践表明,该索引扩展机制能有效地满足集群应用中对大数据集的第二索引查询功能需求。 展开更多
关键词 HBase数据库 区域级 第二索引 协处理器 HFile格式
在线阅读 下载PDF
高性能可扩展公钥密码协处理器研究与设计 被引量:12
12
作者 黎明 吴丹 +1 位作者 戴葵 邹雪城 《电子学报》 EI CAS CSCD 北大核心 2011年第3期665-670,共6页
本文提出了一种高效的点乘调度策略和改进的双域高基Montgomery模乘算法,在此基础上设计了一种新型高性能可扩展公钥密码协处理器体系结构,并采用0.18μm 1P6M标准CMOS工艺实现了该协处理器,以支持RSA和ECC等公钥密码算法的计算加速.该... 本文提出了一种高效的点乘调度策略和改进的双域高基Montgomery模乘算法,在此基础上设计了一种新型高性能可扩展公钥密码协处理器体系结构,并采用0.18μm 1P6M标准CMOS工艺实现了该协处理器,以支持RSA和ECC等公钥密码算法的计算加速.该协处理器通过扩展片上高速存储器和使用以基数为处理字长的方法,具有良好的可扩展性和较强的灵活性,支持2048位以内任意大数模幂运算以及576位以内双域任意椭圆曲线标量乘法运算.芯片测试结果表明其具有很好的加速性能,完成一次1024位模幂运算仅需197μs、GF(p)域192位标量乘法运算仅需225μs、GF(2m)域163位标量乘法运算仅需200.7μs. 展开更多
关键词 协处理器 椭圆曲线密码体制 MONTGOMERY模乘 可扩展性
在线阅读 下载PDF
可重构密码协处理器指令系统的设计方法 被引量:11
13
作者 曲英杰 刘卫东 战嘉瑾 《计算机工程与应用》 CSCD 北大核心 2004年第2期10-12,22,共4页
可重构密码协处理器是采用可重构体系结构的思想和方法设计而成的,用于对数据进行加/解密处理的集成电路芯片,它能够灵活、快速地实现多种不同的密码算法。文章提出了可重构密码协处理器的指令系统的设计方法,并评估了按照该方法所设计... 可重构密码协处理器是采用可重构体系结构的思想和方法设计而成的,用于对数据进行加/解密处理的集成电路芯片,它能够灵活、快速地实现多种不同的密码算法。文章提出了可重构密码协处理器的指令系统的设计方法,并评估了按照该方法所设计的指令系统的特性。 展开更多
关键词 可重构 密码 协处理器 指令系统
在线阅读 下载PDF
一种新型硬件可配置公钥制密码协处理器的VLSI实现 被引量:9
14
作者 陈超 曾晓洋 章倩苓 《通信学报》 EI CSCD 北大核心 2005年第1期6-11,26,共7页
提出了一种新型的硬件可配置的密码协处理器,同时适用于 GF(p)和 GF(2m)两种域,可以实现 RSA和 ECC 两种目前主流的加密算法。同时又具备硬件可配置的特点,可以完成 32~512bit 的模乘运算而无需对硬件做任何修改。本文的密码协处理芯片... 提出了一种新型的硬件可配置的密码协处理器,同时适用于 GF(p)和 GF(2m)两种域,可以实现 RSA和 ECC 两种目前主流的加密算法。同时又具备硬件可配置的特点,可以完成 32~512bit 的模乘运算而无需对硬件做任何修改。本文的密码协处理芯片用 TSMC 0.35μm 标准单元库综合,可以工作在 100MHz 时钟下,等效单元 45k 等效门,512bit 的模乘运算速度可以达到 190kbit/s,一次椭圆曲线上的 233bit 的点加运算只需 18μs。 展开更多
关键词 密码系统 协处理器 RSA 椭圆曲线密码
在线阅读 下载PDF
变电设备状态监测大数据的查询优化方法 被引量:24
15
作者 王德文 李静芳 《电力系统自动化》 EI CSCD 北大核心 2017年第2期165-172,共8页
变电设备状态监测数据体积大、价值密度低,传统数据处理方法不能很好地满足状态监视、评估与诊断等应用快速查询的需要。文中通过对状态监测数据特点和分布式列数据存储方法的分析,给出了变电设备状态监测的大数据处理框架。通过对监测... 变电设备状态监测数据体积大、价值密度低,传统数据处理方法不能很好地满足状态监视、评估与诊断等应用快速查询的需要。文中通过对状态监测数据特点和分布式列数据存储方法的分析,给出了变电设备状态监测的大数据处理框架。通过对监测时间、监测设备编号和设备编号等数据属性的组合,设计了3种状态监测数据复合行键结构,以提高状态监测数据行键查询的灵活性。为了解决在行键未知情况下全表扫描效率低下的问题,提出基于协处理器的二级索引构建方法,实现在非行键约束条件下的快速查询。实验结果表明,基于协处理器的二级索引方法在查询效率上比无索引和IHBase二级索引方式有了明显提高,对状态监测数据写入速度影响较小,能够较好地满足大数据环境下变电设备状态监测大数据快速、灵活查询的需要。 展开更多
关键词 状态监测 大数据 行键 协处理器 二级索引
在线阅读 下载PDF
可重构密码协处理器简介及其特性 被引量:7
16
作者 曲英杰 刘卫东 战嘉瑾 《计算机工程》 CAS CSCD 北大核心 2004年第13期166-168,共3页
可重构密码协处理器是采用可重构体系结构的思想和方法设计而成的,用于对数据进行加/解密处理的集成电路芯片,它能够灵活、快速地实现多种不同的密码算法。文章简要介绍了可重构密码协处理器的设计方法和使用方法,并对其灵活性、安全性... 可重构密码协处理器是采用可重构体系结构的思想和方法设计而成的,用于对数据进行加/解密处理的集成电路芯片,它能够灵活、快速地实现多种不同的密码算法。文章简要介绍了可重构密码协处理器的设计方法和使用方法,并对其灵活性、安全性、性能和规模进行了分析。 展开更多
关键词 可重构 密码 协处理器
在线阅读 下载PDF
数值预报产品分布式处理与存储系统设计 被引量:7
17
作者 王建荣 华连生 +2 位作者 唐怀瓯 王云 王静 《计算机技术与发展》 2018年第2期167-172,共6页
气象数值预报产品数据日益增长,传统的关系型数据库对其存储和管理能力不足,查询规模较大的历史数据时效率较低。针对上述问题,设计了分布式的数值预报产品处理与存储系统。通过Quartz任务调度定时采集数值预报产品文件;运用Kafka分布... 气象数值预报产品数据日益增长,传统的关系型数据库对其存储和管理能力不足,查询规模较大的历史数据时效率较低。针对上述问题,设计了分布式的数值预报产品处理与存储系统。通过Quartz任务调度定时采集数值预报产品文件;运用Kafka分布式消息队列解耦数值预报产品解码与入库程序;将解码日志文件、原始产品文件和解码得到的要素GRIB文件写入HDFS分布式文件系统,应用MapReduce分布式程序将解码日志记录存入HBase。因HBase对Rowkey的一级索引支持较好,而对多条件查询支持不足,需辅助Solr索引加以优化。HBase接收数据时自动触发协处理器同步记录到Solr索引库,实现了HBase的二级索引。测试结果表明,产品文件写入Hadoop文件系统平均速度为82.54 MB/s,而HBase最快入库速度可达每秒13 677条,数据检索结果返回时效达到毫秒级,能够满足业务应用中对数值预报产品存储和检索时效的要求。 展开更多
关键词 QUARTZ 解码日志文件 Kafka HBASE SOLR 协处理器
在线阅读 下载PDF
实时嵌入式软件仿真测试平台的体系结构设计 被引量:14
18
作者 崔小乐 刘斌 +2 位作者 钟德明 阮镰 高小鹏 《测控技术》 CSCD 2003年第7期38-40,共3页
从实时嵌入式软件测试平台的需求出发 ,分析了实时嵌入式软件测试对计算机体系结构的要求 。
关键词 实时嵌入式软件测试平台 硬实时任务 实时协处理器 多机系统
在线阅读 下载PDF
基于安全协处理器保护软件可信运行框架 被引量:4
19
作者 魏强 金然 +1 位作者 寇晓蕤 王清贤 《计算机工程与设计》 CSCD 北大核心 2008年第15期3846-3848,共3页
软件可信运行是许多应用领域的基础,但恶意主机问题使得很难保证一个软件可信运行。在传统的基于硬件加密平台保护软件可信运行机制中,运行于安全硬件中的代码和运行于主机中的代码不在同一个执行上下文中,因此难以给用户提供完善的保... 软件可信运行是许多应用领域的基础,但恶意主机问题使得很难保证一个软件可信运行。在传统的基于硬件加密平台保护软件可信运行机制中,运行于安全硬件中的代码和运行于主机中的代码不在同一个执行上下文中,因此难以给用户提供完善的保护策略。为此,提出了一种新的基于安全协处理器保护软件可信运行的框架,在该框架下,软件设计者可以根据待保护软件特点和自身要求定制更加完善和灵活的保护。 展开更多
关键词 安全协处理器 可信运行 软件保护 恶意主机问题 可信计算
在线阅读 下载PDF
一种改进的嵌入式SIMD协处理器设计 被引量:3
20
作者 周国昌 王忠 +1 位作者 车德亮 冯国臣 《计算机工程与应用》 CSCD 北大核心 2004年第31期13-16,共4页
论文介绍的SIMD协处理器是用于低层图像理解的16位定点嵌入式阵列处理器。该协处理器采用load/store体系结构,并且除SIMD固有的数据并行性外,还具有三级流水和三组指令并发执行的并行性。三组指令并发执行使数据交换操作和其它类型操作... 论文介绍的SIMD协处理器是用于低层图像理解的16位定点嵌入式阵列处理器。该协处理器采用load/store体系结构,并且除SIMD固有的数据并行性外,还具有三级流水和三组指令并发执行的并行性。三组指令并发执行使数据交换操作和其它类型操作并发执行,从而实现了数据交换操作的隐含执行,大大减少了通信和I/O操作的开销。 展开更多
关键词 SIMD阵列协处理器 load/store 流水线 超大规模集成电路
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部