期刊文献+
共找到84篇文章
< 1 2 5 >
每页显示 20 50 100
A Unified Co-Processor Architecture for Matrix Decomposition 被引量:1
1
作者 窦勇 周杰 +3 位作者 邬贵明 姜晶菲 雷元武 倪时策 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第4期874-885,共12页
QR and LU decompositions are the most important matrix decomposition algorithms. Many studies work on accelerating these algorithms by FPGA or ASIC in a case by case style. In this paper, we propose a unified framewor... QR and LU decompositions are the most important matrix decomposition algorithms. Many studies work on accelerating these algorithms by FPGA or ASIC in a case by case style. In this paper, we propose a unified framework for the matrix decomposition algorithms, combining three QR decomposition algorithms and LU algorithm with pivoting into a unified linear array structure. The QR and LU decomposition algorithms exhibit the same two-level loop structure and the same data dependency. Utilizing the similarities in loop structure and data dependency of matrix decomposition, we unify a fine-grained algorithm for all four matrix decomposition algorithms. Furthermore, we present a unified co-processor structure with a scalable linear array of processing elements (PEs), in which four types of PEs are same in the structure of memory channels and PE connections, but the only difference exists in the internal structure of data path. Our unified co-processor, which is IEEE 32-bit floating-point precision, is implemented and mapped onto a Xilinx Virtex5 FPGA chip. Experimental results show that our co-processors can achieve speedup of 2.3 to 14.9 factors compared to a Pentium Dual CPU with double SSE threads. 展开更多
关键词 co-processor matrix decomposition fine-grained parallel FPGA
原文传递
基于RISC-V指令扩展方式的国密算法SM2、SM3和SM4的高效实现 被引量:6
2
作者 王明登 严迎建 +1 位作者 郭朋飞 张帆 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2850-2865,共16页
基于指令扩展的密码算法实现是兼顾性能和面积的轻量级实现方式,特别适用于日益普及的物联网设备.SM2、SM3和SM4等国密算法有利于提高自主可控设备的安全性,但针对这些算法进行指令扩展的相关研究还不够充分.RISC-V由于其开源、简洁及... 基于指令扩展的密码算法实现是兼顾性能和面积的轻量级实现方式,特别适用于日益普及的物联网设备.SM2、SM3和SM4等国密算法有利于提高自主可控设备的安全性,但针对这些算法进行指令扩展的相关研究还不够充分.RISC-V由于其开源、简洁及可扩展等优点已成为业界最流行的指令集架构之一,本文主要基于国产开源RISC-V处理器对国密算法SM2、SM3和SM4进行指令扩展和高效实现.本文基于软硬件协同的理念提出总体指令的扩展方案.对相关密码算法进行深入分析和方案对比,分别设计了硬件单元,提出高效的实现方式.设计实现的协处理器具有2级流水线结构,顺序派遣、乱序执行和顺序写回的指令执行模式,以及独立内存访问单元和大位宽寄存器.协处理器统一接管了密码算法的部分控制逻辑,降低硬件资源消耗.实验结果表明,本文设计的密码协处理器硬件结构精简,资源利用率高.SM2、SM3和SM4算法占用资源少,但执行速率相比纯硬件有一定程度下降,资源面积和花费时间的乘积与其他相关文献相比有不同程度的优势. 展开更多
关键词 RISC-V 协处理器 国密算法 指令扩展 蜂鸟E203 嵌入式系统
在线阅读 下载PDF
基于轻量级的RISC-V异构处理器的安全模型研究 被引量:1
3
作者 罗云鹏 吴晋成 +1 位作者 王正 王铜柱 《通信技术》 2024年第9期973-980,共8页
面对物联网的快速发展,需要低延时、高性能的处理器来实现关键数据的传输和保护,同时要提高处理器的硬件安全,减少非法用户对处理器的攻击。结合当前开源第五代精简指令集(Reduced Instruction Set Computing-Five,RISC-V)处理器架构优... 面对物联网的快速发展,需要低延时、高性能的处理器来实现关键数据的传输和保护,同时要提高处理器的硬件安全,减少非法用户对处理器的攻击。结合当前开源第五代精简指令集(Reduced Instruction Set Computing-Five,RISC-V)处理器架构优点,与现场可编程门阵列(Field Programmable Gate Array,FPGA)相结合,设计了异构处理器,提出了基于密码的安全启动模型。首先,细化RISC-V异构处理器的体系结构,设计轻量级密码启动安全模型TrustZone,实现处理器性能与安全的平衡,并结合FPGA的优点,实现定制化的专用协议与业务通信。其次,提出当前RISC-V异构处理器可实现的便捷途径,并基于此进行模型搭建和测试验证。验证结果表明,虽然采用TrustZone安全度量后处理器启动时间有所增加,但针对轻量级的处理器应用场景,在增强处理器安全的前提下,该启动时间开销是可以接受的。 展开更多
关键词 RISC-V 异构处理器 可信启动 密码协处理 TrustZone认证
在线阅读 下载PDF
基于EDA技术的图像边缘检测协处理器的设计 被引量:7
4
作者 谭会生 桂卫华 刘展良 《包装工程》 CAS CSCD 北大核心 2004年第6期102-104,107,共4页
在嵌入式图形系统处理领域 ,图像处理的速度问题一直是一个很难突破的设计瓶颈。文章在介绍一种全新的DSP +CPLD图像处理系统工作原理的基础上 ,阐述了一个基于EDA技术的、用FPGA实现的 80 0× 6 0 0像素的图像边缘检测协处理器的设... 在嵌入式图形系统处理领域 ,图像处理的速度问题一直是一个很难突破的设计瓶颈。文章在介绍一种全新的DSP +CPLD图像处理系统工作原理的基础上 ,阐述了一个基于EDA技术的、用FPGA实现的 80 0× 6 0 0像素的图像边缘检测协处理器的设计 ,包括边缘检测算法选择、系统的FPGA实现设计和有关仿真结果等。该协处理器的像素处理方式采用全硬件并行及流水线技术 ,比单独采用单片机和DSP的系统 ,其处理速度分别提高了 4 0 0倍和 10倍 ,同时该系统集成在一块集成芯片上 ,体积小 ,功耗低 ,可靠性高 ,并可现场编程 。 展开更多
关键词 EDA技术 图像边缘检测协处理器 SOBEL算法 DSP+CPLD 并行流水技术
在线阅读 下载PDF
飞机座舱综合图形显示系统设计的一种新方法 被引量:6
5
作者 朱耀东 张焕春 经亚枝 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2002年第5期488-492,共5页
针对飞机座舱图形显示的特点 ,本文提出了一种高速帧存结构和可重构协处理器的设计方法。该高速帧存结构具有自动消隐和背景颜色可编程的功能 ,所设计的基于 FPGA技术的可重构协处理器能在系统动态改变其所实现的算法。这些方法大大减... 针对飞机座舱图形显示的特点 ,本文提出了一种高速帧存结构和可重构协处理器的设计方法。该高速帧存结构具有自动消隐和背景颜色可编程的功能 ,所设计的基于 FPGA技术的可重构协处理器能在系统动态改变其所实现的算法。这些方法大大减少了处理器的工作量 ,提高图形生成和显示速度 ,解决了在图形显示中的速度瓶颈。 展开更多
关键词 飞机 座舱 图形显示 设计
在线阅读 下载PDF
基于FPGA的航空发动机电子控制器设计技术研究 被引量:6
6
作者 刘冬冬 张天宏 +1 位作者 黄向华 陈建 《测控技术》 CSCD 北大核心 2012年第1期57-61,65,共6页
基于FPGA的并行运行、可重配置以及采用软/硬件协同设计的技术特点,提出了一种基于FPGA的片内分布式航空发动机电子控制器设计方法。重点研究了FPGA内嵌处理器选型、硬件协处理器及同步数据总线设计等3个关键技术问题。在此基础上,基于A... 基于FPGA的并行运行、可重配置以及采用软/硬件协同设计的技术特点,提出了一种基于FPGA的片内分布式航空发动机电子控制器设计方法。重点研究了FPGA内嵌处理器选型、硬件协处理器及同步数据总线设计等3个关键技术问题。在此基础上,基于Altera FPGA-EP2C35设计了控制器原理样机,并进行了硬件性能测试,结果表明该控制器设计方法在当前的技术条件下具有实施的可行性。所提出的发动机电子控制器设计方法有利于克服当前集中式电子控制器设计时存在的软件高度定制、可重用性差、并行实时任务开发难度大、开发效率低等缺点,降低了FADEC系统的全寿命周期费用。 展开更多
关键词 航空发动机 片内分布式电子控制器 FPGA 硬件协处理器 同步数据总线 控制器原理样机
在线阅读 下载PDF
空间机器人专用控制计算机体系结构研究 被引量:2
7
作者 史国振 孙汉旭 +2 位作者 贾庆轩 郑一力 程时端 《计算机集成制造系统》 EI CSCD 北大核心 2008年第9期1810-1817,共8页
空间机器人自主控制要求控制计算机具有高处理能力,而传统的星载计算机处理器只有低运算能力。为解决该矛盾,提出了一种基于传统的处理器和专用协处理器的新型星载计算机体系结构。该计算机采用了双机冷热备份的冗余容错策略,基于现场... 空间机器人自主控制要求控制计算机具有高处理能力,而传统的星载计算机处理器只有低运算能力。为解决该矛盾,提出了一种基于传统的处理器和专用协处理器的新型星载计算机体系结构。该计算机采用了双机冷热备份的冗余容错策略,基于现场可编程门阵列器件设计的专用协处理器处理机器人运动规划,同时具备纠检错功能的计算机存储系统。通过仿真及原理样机地面试验证明了本设计的正确性和有效性。该设计将运动学计算时间降低了两个数量级,提高了系统的有效处理速度。 展开更多
关键词 空间机器人 计算机体系结构 协处理器 可编程门阵列 纠检错 运动学
在线阅读 下载PDF
多边形填充硬件算法的研究与实现 被引量:5
8
作者 刘洋 李庆诚 白振轩 《天津师范大学学报(自然科学版)》 CAS 北大核心 2010年第1期19-22,共4页
提出一种多边形填充的硬件算法,并通过在Xilinx公司生产的Vertex2 Pro实验板上进行验证,证明该算法的可行性及其良好高效性.
关键词 多边形填充算法 硬件加速算法 协处理IP核 VERILOG语言 嵌入式开发套件(EDK)
在线阅读 下载PDF
高速双有限域加密协处理器设计 被引量:14
9
作者 史焱 吴行军 《微电子学与计算机》 CSCD 北大核心 2005年第5期8-12,16,共6页
文章提出了一种能够同时在有限域GF(P)和GF(2m)中高速实现椭圆曲线密码算法(ECC)的协处理器。该协处理器能够高速完成椭圆曲线密码算法中各种基本的运算。通过调用这些基本的模运算指令,可以实现各种ECC上的加密算法。该协处理器支持51... 文章提出了一种能够同时在有限域GF(P)和GF(2m)中高速实现椭圆曲线密码算法(ECC)的协处理器。该协处理器能够高速完成椭圆曲线密码算法中各种基本的运算。通过调用这些基本的模运算指令,可以实现各种ECC上的加密算法。该协处理器支持512位以下任意长度的模运算。协处理器工作速度很快,整个协处理器综合采用了多种加速结构和算法并采用了流水线结构设计。根据物理综合的结果,协处理器可以工作在300MHz的频率,运算时间比此前的一些同类芯片快4到10倍左右。 展开更多
关键词 椭圆曲线 加密协处理器 MONTGOMERY模乘 模逆 流水线
在线阅读 下载PDF
基于Cell多核处理器的层次化运行时支持技术 被引量:2
10
作者 董小社 冯国富 +2 位作者 王旭昊 冯景华 胡雷钧 《计算机研究与发展》 EI CSCD 北大核心 2010年第4期561-570,共10页
基于Cell处理器的异构多核架构及软件显式管理的多级存储层次,使其面临编程困难和性能难以有效发挥等问题.现有基于Cell/B.E.的编程模型多侧重于支持类似于流处理的"批量访存"(bulk data transfer)应用,传统非规则访存应用性... 基于Cell处理器的异构多核架构及软件显式管理的多级存储层次,使其面临编程困难和性能难以有效发挥等问题.现有基于Cell/B.E.的编程模型多侧重于支持类似于流处理的"批量访存"(bulk data transfer)应用,传统非规则访存应用性能较低.通过扩展Cell/B.E.访存库增强协处理单元的自主作用,以协处理单元为中心建立Cell计算平台上的MPI和弱一致性Pthread分层并行编程运行时支持.分层的运行时支持结构及扩展后的Cell/B.E.访存库使模型具有更好的效率和可扩展性,并且提高了非规则应用的性能;模型中的MPI方便了大量传统并行应用向新架构的移植及开发,而弱一致性Pthread则为MPI提供高效的任务运行时管理支持及为系统级用户提供对架构全面控制的编程接口.实验结果表明,提出的运行时支持技术不仅可适应不同应用的要求,同时借助访存库中的剖分优化机制可有效地挖掘Cell/B.E.架构性能. 展开更多
关键词 协处理单元为中心 运行时支持库 异构多核 Cell/B.E. 分层结构
在线阅读 下载PDF
一种基于串口通信的DSP调试平台设计 被引量:4
11
作者 薛志远 朱浩 +2 位作者 张铁军 王东辉 侯朝焕 《微电子学与计算机》 CSCD 北大核心 2013年第12期57-60,共4页
给出了一种基于串口的DSP调试平台设计方法.通过该方法,DSP调试平台实现了对应用程序的加载、上传、执行与校验.同时,通过对SuperV处理器中执行信息的实时反馈,调试平台与模拟器完成协同调试.
关键词 DSP 串口 协同调试 SuperV处理器
在线阅读 下载PDF
神经网络的数据分类算法在物联网中的应用 被引量:6
12
作者 冯秀芳 肖文炳 《计算机技术与发展》 2012年第8期245-248,共4页
物联网中的基站将世界各地具有传感能力的事物结点连接到一起。它的基站需要负责处理大量数据,所以必须具备能够处理这些数据的计算能力。网络处理器(net processor)正将取代传统的基站处理器,它能在信息处理中表现出更高一级别的能力... 物联网中的基站将世界各地具有传感能力的事物结点连接到一起。它的基站需要负责处理大量数据,所以必须具备能够处理这些数据的计算能力。网络处理器(net processor)正将取代传统的基站处理器,它能在信息处理中表现出更高一级别的能力。文中讨论了公共处理器(co-processor)的设计,它能帮助网络处理器分类数据包。这项工作中,基于数据的性质使用神经网络来分类数据包从而克服物联网中高维、海量数据的传输瓶颈。试验中通过对不同结构的前馈反向传播网络(BP)的误差分析,得出用于某特定物联网数据分类的最优BP网络结构。 展开更多
关键词 数据分类 物联网 人工神经网络 公共处理器
在线阅读 下载PDF
异构系统中的Web服务器软件框架研究 被引量:2
13
作者 尤国华 刘媛 高东 《计算机工程与应用》 CSCD 北大核心 2020年第11期33-38,共6页
在服务器端加入GPU或MIC等协处理器可以提升性能。但是,传统Web服务器端软件不能充分发挥多核CPU+MIC协处理器异构硬件体系的性能。为解决该问题,针对该硬件体系提出了一种新的Web服务器软件框架。该软件框架基于分阶段事件驱动模型,将... 在服务器端加入GPU或MIC等协处理器可以提升性能。但是,传统Web服务器端软件不能充分发挥多核CPU+MIC协处理器异构硬件体系的性能。为解决该问题,针对该硬件体系提出了一种新的Web服务器软件框架。该软件框架基于分阶段事件驱动模型,将部分动态请求调度至MIC协处理器执行,并可在多核CPU和MIC协处理器上并行处理动态请求。同时,通过采用自适应调度算法兼顾了CPU和MIC协处理器间的负载均衡。仿真实验表明,该模型在平均响应时间、吞吐量等方面均优于传统的基于先到先服务(First Come First Served,FCFS)的Web服务器软件模型。 展开更多
关键词 异构系统 MIC协处理器 动态请求 调度 WEB服务器
在线阅读 下载PDF
稀疏矩阵向量乘的FPGA设计与实现 被引量:3
14
作者 宋庆增 顾军华 《计算机工程》 CAS CSCD 北大核心 2011年第23期214-216,共3页
针对传统的通用处理器(GPP)平台上执行稀疏矩阵向量乘计算效率低的问题,提出一种基于可重构计算平台的SpMXV协处理器设计。方案采用二叉树结构高度流水的数据流、IEEE-754的32 bit浮点数数据格式和对角存储格式。数据通路以流水线方式... 针对传统的通用处理器(GPP)平台上执行稀疏矩阵向量乘计算效率低的问题,提出一种基于可重构计算平台的SpMXV协处理器设计。方案采用二叉树结构高度流水的数据流、IEEE-754的32 bit浮点数数据格式和对角存储格式。数据通路以流水线方式进行组织,能够优化计算性能。仿真结果表明,与GPP平台上的软件实现相比,通过硬件实现的设计能达到最高2.69倍的性能加速。 展开更多
关键词 可重构计算 协处理器 稀疏线性方程组 稀疏矩阵向量乘 归约阵列
在线阅读 下载PDF
基于SHA-1引擎的嵌入式安全协处理器设计 被引量:1
15
作者 刘政林 郭超 霍文捷 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第8期72-75,共4页
针对嵌入式系统中广泛存在的安全威胁以及嵌入式系统空间有限、资源宝贵等特点,在分析纯软件保护方法的缺点基础上,采用安全协处理器的方法保护嵌入式系统中软件的安全,提出了基于SHA-1引擎的嵌入式安全协处理器结构,并对其中关键运算... 针对嵌入式系统中广泛存在的安全威胁以及嵌入式系统空间有限、资源宝贵等特点,在分析纯软件保护方法的缺点基础上,采用安全协处理器的方法保护嵌入式系统中软件的安全,提出了基于SHA-1引擎的嵌入式安全协处理器结构,并对其中关键运算模块进行小面积、低功耗优化,在华虹NEC 0.35μm工艺库下综合等效门数为1.637×104门,功耗为0.582 mW,测试结果表明该安全协处理器能够满足嵌入式系统安全保护要求. 展开更多
关键词 嵌入式系统 集成电路 安全协处理器 认证 安全散列算法
原文传递
基于协处理器的无线传感器网络MAC设计 被引量:1
16
作者 雷鑑铭 姜天杰 +1 位作者 邹雪城 刘政林 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第3期29-32,共4页
提出了一种基于协处理器的媒介访问控制(MAC)体系结构,将不同MAC协议的信道争用机制映射为协处理器内部的软件程序,其特点是兼容IEEE802.15.4协议,利用可编程协处理器增强MAC的可重用性,能支持自适应睡眠媒介访问控制(S-MAC)、超时... 提出了一种基于协处理器的媒介访问控制(MAC)体系结构,将不同MAC协议的信道争用机制映射为协处理器内部的软件程序,其特点是兼容IEEE802.15.4协议,利用可编程协处理器增强MAC的可重用性,能支持自适应睡眠媒介访问控制(S-MAC)、超时媒介访问控制(T-MAC)等无线传感器网络MAC协议.阐述了基于协处理器实现避免冲突的载波侦听多路访问(CSMA-CA)算法、S-MAC和T-MAC协议的方法,并在此基础上分析了CSMA-CA算法的软件时延.在现场可编程门阵列(FPGA)上实现整个MAC,实际测试结果表明:该MAC支持多协议,数据传输速率达20~250 Kbit/s,适应IEEE802.15.4协议要求,面积仅为30 567个等效门. 展开更多
关键词 传感器 网络 协处理器 避免冲突的载波侦听多路访问 媒介访问控制 自适应睡眠媒介访问控制
原文传递
LS MPP协处理器的通信机制及其VLSI实现 被引量:1
17
作者 李莉 钱刚 沈绪榜 《微电子学与计算机》 CSCD 北大核心 2002年第9期52-56,共5页
文章首先介绍了LSMPP协处理器的通信机制,即通信网络、通信部件及通信调度的设计。通信网络采用网格互连并补充沿行或沿列的播送互连,非常适合图像匹配算法;通信部件穴路由器雪把位并行互连转换为位串行互连,从而减少芯片的设计复杂度... 文章首先介绍了LSMPP协处理器的通信机制,即通信网络、通信部件及通信调度的设计。通信网络采用网格互连并补充沿行或沿列的播送互连,非常适合图像匹配算法;通信部件穴路由器雪把位并行互连转换为位串行互连,从而减少芯片的设计复杂度及实现小型化目标;同时通过适当的指令调度策略实现路由器指令和其它指令的并行执行,指令的并行可以使数据交换隐含的实现,较好的解决了PE间的通信瓶颈问题,着重讨论了在版图设计中时钟控制信号的走线问题。 展开更多
关键词 LS-MPP协处理器 通信机制 VLSI 16位定点阵列处理器 超大规模集成电路
在线阅读 下载PDF
无线通信系统MAC层通用安全协处理器的实现 被引量:1
18
作者 封斌 齐德昱 韩海雯 《微电子学与计算机》 CSCD 北大核心 2013年第10期33-37,共5页
IEEE802.11i和802.16e无线通信标准的媒体访问控制层(MAC)都使用了基于高级加密算法(AES)的计数器模式(CTR)和密码分组链接消息验证码(CBC-MAC)作为安全机制,其以AES算法为核心,采用CTR模式保证数据机密性,采用CBC-MAC模式对MAC帧头的... IEEE802.11i和802.16e无线通信标准的媒体访问控制层(MAC)都使用了基于高级加密算法(AES)的计数器模式(CTR)和密码分组链接消息验证码(CBC-MAC)作为安全机制,其以AES算法为核心,采用CTR模式保证数据机密性,采用CBC-MAC模式对MAC帧头的公开信息进行认证.设计了通用AES-CCM安全协议协处理器,给出高吞吐量的并行AES模块和低成本的复用AES模块两种实现方案,并遵循Avalon片内总线接口,在Altera公司EP1C4F324C6的FPGA上进行了验证.该安全协议协处理器的设计与实现,符合软件无线电技术采用通用模块化硬件平台满足多种无线空中接口标准的思想,对无线通信终端底层硬件平台的通用化具有一定的价值. 展开更多
关键词 无线通信标准 AES-CCM MAC协处理器 AVALON总线
在线阅读 下载PDF
基于协处理器的H.264解码器SOC架构及设计 被引量:2
19
作者 张志勋 王永栋 王娟 《自动化与仪器仪表》 2014年第1期42-44,共3页
描述了一种H.264解码器SOC系统架构和实现。该SOC系统采用基于协处理器的软硬件划分方式,通过分析H.264解码过程中的各运算环节,设计了相应协处理器的硬件运算单元及软件指令,在满足一定性能的条件下,具有很高的灵活性,便于系统的后续... 描述了一种H.264解码器SOC系统架构和实现。该SOC系统采用基于协处理器的软硬件划分方式,通过分析H.264解码过程中的各运算环节,设计了相应协处理器的硬件运算单元及软件指令,在满足一定性能的条件下,具有很高的灵活性,便于系统的后续升级和扩展。验证结果表明该SOC系统将解码时间提高了约75%以上,有效的加速了解码器的运行速度。 展开更多
关键词 H 264 协处理器 SOC
在线阅读 下载PDF
基于片上多核的版面加速器系统优化研究 被引量:2
20
作者 刘洋 《计算机应用研究》 CSCD 北大核心 2011年第10期3731-3734,共4页
利用软硬件协同设计方法以及片上多核技术,对传统的文档解析架构进行优化,提出了基于异构片上多核的版面加速器体系架构并设计实现了图像解析硬件加速引擎。结果表明,运用该方法所设计的相应架构能够较好地满足屏幕印刷对复杂版面的显... 利用软硬件协同设计方法以及片上多核技术,对传统的文档解析架构进行优化,提出了基于异构片上多核的版面加速器体系架构并设计实现了图像解析硬件加速引擎。结果表明,运用该方法所设计的相应架构能够较好地满足屏幕印刷对复杂版面的显示要求。 展开更多
关键词 版面加速器 软硬件协同设计 异构多核处理器 JPEG协处理器 移动阅读
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部