期刊文献+
共找到595篇文章
< 1 2 30 >
每页显示 20 50 100
一种可配置乘法器的设计和优化
1
作者 王润柏 谭勋琼 白创 《中国集成电路》 2025年第11期35-40,45,共7页
针对DSP(Digital Signal Processor)中乘法部件指令集错综复杂的问题,该文提出了由16个低精度16位宽乘法器构成的一种新型乘法电路。允许配置乘法器模式实现8位、16位、32位、64位乘法,支持定点、浮点乘法操作。通过搭建基于Systemveri... 针对DSP(Digital Signal Processor)中乘法部件指令集错综复杂的问题,该文提出了由16个低精度16位宽乘法器构成的一种新型乘法电路。允许配置乘法器模式实现8位、16位、32位、64位乘法,支持定点、浮点乘法操作。通过搭建基于Systemverilog语言实现的UVM验证平台,对乘法电路进行了随机测试和定向测试,确保了功能完备性。并基于逻辑综合得出多个路径的违反,采用基于预处理和结构调整的思想对关键路径进行时序优化,基于复用思想对非关键路径进行面积优化。在55nmCMOS(Complementary Metal Oxide Semiconductor)工艺下使用综合工具完成逻辑综合。结果表明,关键路径的延时减少了370ps,时序性能提高了22%;面积减少了50776.16μm^(2),减少了20.6%。 展开更多
关键词 乘法器 子字并行 优化 UVM方法 运算单元 硬件共享
在线阅读 下载PDF
Posit浮点部件实现
2
作者 陈子钰 何军 +4 位作者 尹飞 颜世云 杨剑新 文周旺 马启皓 《计算机应用》 北大核心 2025年第S1期163-169,共7页
首先,介绍Posit浮点格式及相关研究现状;其次,设计并实现一组Posit浮点运算指令,包含7条算术运算指令、3条比较指令和14条格式转换指令;最后,实现一个能全流水执行的Posit浮点部件,并评估它的实现性。该部件支持Posit(32,2)、Posit(32,3... 首先,介绍Posit浮点格式及相关研究现状;其次,设计并实现一组Posit浮点运算指令,包含7条算术运算指令、3条比较指令和14条格式转换指令;最后,实现一个能全流水执行的Posit浮点部件,并评估它的实现性。该部件支持Posit(32,2)、Posit(32,3)和Posit(32,6)这3种格式,包含5级流水的Posit浮点融合乘加(PFMA)子部件和3级流水的Posit浮点格式转换(PFCVT)子部件。相较于支持FP32格式的浮点部件,所提Posit浮点部件在Posit(32,2)格式下的操作数尾数和结果尾数的最大位宽增加了4 bit,并在Posit(32,6)格式下的指数的动态范围提升了近1 072 decades,显著提高了数据表示范围和灵活性;同时,在Posit(32,6)格式下支持的数据动态范围比FP64大了近524 decades。可见,所提部件可用于探索Posit(32,6)在特定领域和应用中替代FP64的可行性,以减少计算系统的存储、访存和通信开销,从而提高计算能效。 展开更多
关键词 Posit 浮点算术 融合乘加 浮点转换 指令集
在线阅读 下载PDF
应用于eFPGA的乘加运算单元设计
3
作者 李春锋 卢丽珍 +2 位作者 余彬 舒毅 范迪 《山东科技大学学报(自然科学版)》 北大核心 2025年第2期104-114,共11页
针对当前嵌入式可编程逻辑阵列(eFPGA)中实现神经网络模型时资源利用率低的问题,提出一种新型乘加运算单元设计结构,以提升乘加单元资源利用率,充分发挥eFPGA高空间并行性。乘加运算单元在保留传统eFPGA的数字信号处理单元核心乘加功能... 针对当前嵌入式可编程逻辑阵列(eFPGA)中实现神经网络模型时资源利用率低的问题,提出一种新型乘加运算单元设计结构,以提升乘加单元资源利用率,充分发挥eFPGA高空间并行性。乘加运算单元在保留传统eFPGA的数字信号处理单元核心乘加功能基础上,增加了对常用INT8/16/32量化位宽数据的单指令多数据SIMD运算结构支持,并对位宽扩展后的部分积生成器、压缩树分割方法及并行前缀加法器结构进行了优化,以降低核心乘加单元通路延迟。乘加运算单元采用UMC 28 nm工艺实现,仿真与实验结果表明,乘加单元满足功能正确性要求,在神经网络应用测试电路综合结果上的资源利用率提升1.37~3.05倍。 展开更多
关键词 嵌入式可编程逻辑阵列 数字运算单元 乘加器 BOOTH算法
在线阅读 下载PDF
一种32位异步乘法器的研究与实现 被引量:12
4
作者 李勇 王蕾 +2 位作者 龚锐 戴葵 王志英 《计算机研究与发展》 EI CSCD 北大核心 2006年第12期2152-2157,共6页
提出基于宏单元(macrocell)的异步电路设计流程,由于在流程中尽量与现有的同步电路设计EDA工具兼容,降低了技术难度,提高了开发效率·基于该流程实现了0·35μm工艺条件下的32位异步乘法器·经过与相同工艺条件下,具有相同... 提出基于宏单元(macrocell)的异步电路设计流程,由于在流程中尽量与现有的同步电路设计EDA工具兼容,降低了技术难度,提高了开发效率·基于该流程实现了0·35μm工艺条件下的32位异步乘法器·经过与相同工艺条件下,具有相同数据通路结构的同步乘法器比较,异步乘法器的性能与同步乘法器相当,而且面积更小、功耗更低· 展开更多
关键词 异步乘法器 设计流程 宏单元 功耗 性能
在线阅读 下载PDF
基于FPGA的实时双精度浮点矩阵乘法器设计 被引量:22
5
作者 田翔 周凡 +2 位作者 陈耀武 刘莉 陈耀 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2008年第9期1611-1615,共5页
设计了一个并行结构双精度浮点矩阵乘法器以提高矩阵乘法的计算性能,并在Xilinx Virtex-4 SX55现场可编程门阵列(FPGA)上完成了方案的实现.乘法器中的处理单元采用阵列结构,在单个FPGA芯片中可集成25个处理单元,峰值计算性能达到3000 MF... 设计了一个并行结构双精度浮点矩阵乘法器以提高矩阵乘法的计算性能,并在Xilinx Virtex-4 SX55现场可编程门阵列(FPGA)上完成了方案的实现.乘法器中的处理单元采用阵列结构,在单个FPGA芯片中可集成25个处理单元,峰值计算性能达到3000 MFLOPS.针对工程实际中大量存在的包含稀疏矩阵的乘法问题,增加了预处理模块以避免零元素块参与计算,从而缩短了计算时间.通过对不同维数的稠密矩阵乘法以及稀疏矩阵乘法实验结果的分析,证实了本设计达到了较高的计算性能. 展开更多
关键词 矩阵乘法 现场可编程门阵列 双精度浮点矩阵 并行结构 稀疏矩阵
在线阅读 下载PDF
一种高性能大数模幂协处理器SEA 被引量:7
6
作者 赵学秘 陆洪毅 +2 位作者 戴葵 童元满 王志英 《计算机研究与发展》 EI CSCD 北大核心 2005年第6期924-929,共6页
大数模幂是许多公钥算法中的主要操作和计算瓶颈.SEA是一种针对大数模幂的高性能协处理器,其主要采用如下3种加速方法:①采用二进制并行模幂算法(PBME)和以基数长度为处理字长的高基数Montgomery算法(RBHRMMM);②将算法映射到脉动阵列... 大数模幂是许多公钥算法中的主要操作和计算瓶颈.SEA是一种针对大数模幂的高性能协处理器,其主要采用如下3种加速方法:①采用二进制并行模幂算法(PBME)和以基数长度为处理字长的高基数Montgomery算法(RBHRMMM);②将算法映射到脉动阵列处理结构,并交替计算平方和乘以掩盖RBHRMMM算法中的相关,同时应用定向技术消除PBME算法中的相关;③基于“先拆分乘法、后将累加压缩”的思想优化关键路径.SEA完成1024b完整大数模幂仅需72738个时钟周期,采用基于标准单元的正向设计流程实现,其面积为4.2×4.2mm2,等效门数为739933.目前,SEA已经在0.18μm1P6MCMOS工艺上流片成功,主频133MHz,峰值功耗为962.26mW,使用SEA后,完成一次1024bRSA签名仅需316.9μs. 展开更多
关键词 模幂协处理器 高基数Montgomery算法 脉动阵列 重定向 乘法器
在线阅读 下载PDF
面向移动设备的3D图形处理器设计 被引量:8
7
作者 杨毅 郭立 +1 位作者 史鸿声 郭安泰 《小型微型计算机系统》 CSCD 北大核心 2009年第8期1668-1674,共7页
提出一种面向移动设备的3D图形处理器的设计方法,从图形算法和硬件架构两个层次进行优化.对图形算法进行C语言的仿真模拟,并设计高效的具有并行和流水线结构的图形处理器架构.该架构采用定点的数据通道,拥有一个可编程的顶点处理器和基... 提出一种面向移动设备的3D图形处理器的设计方法,从图形算法和硬件架构两个层次进行优化.对图形算法进行C语言的仿真模拟,并设计高效的具有并行和流水线结构的图形处理器架构.该架构采用定点的数据通道,拥有一个可编程的顶点处理器和基于像素块的光栅扫描转换模块,降低电路复杂度的同时提高了整体性能.该设计已经在FPGA上验证,并给出了实验结果.实验结果显示该图形处理器结构可以满足移动设备的图形应用要求,具有可行性. 展开更多
关键词 图形处理器 可编程顶点处理器 光栅阶段 FPGA验证
在线阅读 下载PDF
基于AT89C51的室内智能化控制系统设计 被引量:7
8
作者 任成伟 师剑军 +1 位作者 刘俊杰 张勇 《火力与指挥控制》 CSCD 北大核心 2017年第6期179-182,共4页
基于AT89C51单片机设计了一套不依赖智能开关,即用即加的室内智能化控制系统,通用的部分分门禁系统、智能电器、智能感知3个模块,分别以电子密码锁、ZigBee组网和红外接、发设备、各类传感器为主,旨在使用户摆脱对安防问题的困扰,方便... 基于AT89C51单片机设计了一套不依赖智能开关,即用即加的室内智能化控制系统,通用的部分分门禁系统、智能电器、智能感知3个模块,分别以电子密码锁、ZigBee组网和红外接、发设备、各类传感器为主,旨在使用户摆脱对安防问题的困扰,方便对智能设备的使用。 展开更多
关键词 AT89C51 智能化 红外设备
在线阅读 下载PDF
基于TTA的异步微处理器设计及其VLSI实现 被引量:3
9
作者 石伟 陈芳园 +4 位作者 王志英 任洪广 苏博 王友瑞 陆洪毅 《电子学报》 EI CAS CSCD 北大核心 2011年第2期395-401,共7页
本文针对传输触发体系结构设计了一款异步微处理器.由于异步TTA采用分布式的控制方式,数据相关会导致程序执行错误,因此提出了一种数据源选择技术来保证程序执行的正确性,并给出了异步TTA的微体系结构与电路实现.最后,在0.18μm工艺下... 本文针对传输触发体系结构设计了一款异步微处理器.由于异步TTA采用分布式的控制方式,数据相关会导致程序执行错误,因此提出了一种数据源选择技术来保证程序执行的正确性,并给出了异步TTA的微体系结构与电路实现.最后,在0.18μm工艺下采用基于宏单元的异步集成电路设计方法实现了该异步微处理器.实验结果表明提出的数据源选择技术能够有效保证异步TTA微处理器正确执行,同时异步TTA计算内核功耗仅为相应同步计算内核功耗的40%左右. 展开更多
关键词 传输触发结构 异步电路 低功耗 VLSI设计
在线阅读 下载PDF
异步超前进位加法器设计 被引量:3
10
作者 杨银堂 徐阳扬 +1 位作者 周端 弥晓华 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2009年第1期33-37,共5页
提出了一种新的高速加法器电路.该加法器采用混合握手协议,将超前进位与异步自定时技术相结合,根据进位链出现的概率大小来分配进位路径,可以在保持异步结构低功耗的同时提高运算速度.仿真结果表明,在SMIC 0.18μm工艺下,32位异步超前... 提出了一种新的高速加法器电路.该加法器采用混合握手协议,将超前进位与异步自定时技术相结合,根据进位链出现的概率大小来分配进位路径,可以在保持异步结构低功耗的同时提高运算速度.仿真结果表明,在SMIC 0.18μm工艺下,32位异步超前进位加法器平均运算完成时间为0.880932 ns,其速度是同步串行加法器的7.33倍,是异步串行加法器的1.364倍和异步进位选择加法器的1.123倍,且电路面积和功耗开销小于异步进位选择加法器. 展开更多
关键词 异步 并行 超前进位 加法器 自定时
在线阅读 下载PDF
关于一种变参数PID控制器的分析与研究 被引量:18
11
作者 陈永红 朱从乔 +1 位作者 李京 万艳玲 《微计算机信息》 北大核心 2005年第10S期47-48,共2页
分析了变参数PID控制器各个参数随着误差信号的变化趋势,得到它们的关系表达式。通过这个关系式去实现变参数PID控制器的参数校正。仿真结果表明能得到比常规非变参数PID控制器性能更好。
关键词 PID控制器 变参数 误差信号
在线阅读 下载PDF
一种空间阵列式处理器内核设计
12
作者 刘玉 张杰 刘谷 《集成电路与嵌入式系统》 2025年第10期75-81,共7页
提出一种空间阵列式处理器内核设计,处理器运算单元通过互联总线进行数据通信,基于本地存储完成运算,无需通过集中式寄存器文件,本地运算单元的处理结果通过广播总线传播给其他运算单元使用。这种运算单元组织形式具有线性可扩展的特点... 提出一种空间阵列式处理器内核设计,处理器运算单元通过互联总线进行数据通信,基于本地存储完成运算,无需通过集中式寄存器文件,本地运算单元的处理结果通过广播总线传播给其他运算单元使用。这种运算单元组织形式具有线性可扩展的特点,运算单元规模不受限于集中式部件,同时具有灵活的广播和规约机制,更符合算法的数据通信特点,易于算法映射与物理实现。基于该设计实现的运算单元阵列具有较好的可扩展性,单位面积性能可以达到1.4 TOPS/mm^(2)@INT8,性能功耗比达到2.47 TOPS/W,适合作为高算力处理器运算核心进行大量部署。 展开更多
关键词 处理器 内核 阵列 扩展性 数字信号
在线阅读 下载PDF
一种面向高算力处理器的运算单元设计
13
作者 刘玉 张杰 周乐 《集成电路与嵌入式系统》 2025年第9期57-62,共6页
提出一种应用于大算力处理器的存算融合运算单元设计方案,存算融合运算单元包含支持多精度运算的运算器,并在内部集成了本地存储,运算单元可以基于本地存储完成运算,避免访问外部总线,同时针对存算融合运算单元结构特点设计了硬件流水线... 提出一种应用于大算力处理器的存算融合运算单元设计方案,存算融合运算单元包含支持多精度运算的运算器,并在内部集成了本地存储,运算单元可以基于本地存储完成运算,避免访问外部总线,同时针对存算融合运算单元结构特点设计了硬件流水线,处理器算力具备多维度可扩展性。文中提出的运算单元设计方案具有良好的性能功耗比优势,该方案的性能功耗比达到2.47 TOPS/W@INT8,显著优于其他存算融合处理器架构,适合作为高算力处理器运算核心进行大量部署。 展开更多
关键词 高算力处理器 运算单元 扩展性 流水线 FPGA
在线阅读 下载PDF
基于自适应CSA的多操作数加法器设计
14
作者 王立华 崔可欣 +1 位作者 付文杰 刘晨光 《鲁东大学学报(自然科学版)》 2025年第3期222-232,共11页
多操作数加法器是数字集成电路设计的基本算术单元之一,其逻辑优化是逻辑综合流程中至关重要的一部分。为了在逻辑综合过程中尽可能地提升多操作数加法器的性能,降低延迟,本文设计了一种基于自适应进位保留加法器(carry-save adder, CSA... 多操作数加法器是数字集成电路设计的基本算术单元之一,其逻辑优化是逻辑综合流程中至关重要的一部分。为了在逻辑综合过程中尽可能地提升多操作数加法器的性能,降低延迟,本文设计了一种基于自适应进位保留加法器(carry-save adder, CSA)的多操作数加法器架构。该架构采用Wallace树结构实现多操作数加法器的设计,降低加法操作导致的延迟,并在此基础上,通过改进Wallace树结构中的CSA压缩部分,进一步降低延迟。本文以SMIC 28nm工艺库为目标库,运用上述算法对多个多操作数相加的RTL(register-transfer level)设计执行逻辑综合,得到多操作数加法器。实验结果表明,在16~128位宽输入下,本加法器可显著优化性能,延迟时间平均降低31.2%,面积平均减少36.5%,功耗平均降低70.98%。 展开更多
关键词 多操作数加法器 carry-save adder 自适应方法 Wallace树结构 逻辑综合
在线阅读 下载PDF
低功耗微处理器中异步流水线设计 被引量:2
15
作者 石伟 王友瑞 +3 位作者 陈芳园 任洪广 陆洪毅 王志英 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第5期33-37,共5页
随着工艺的不断进步及芯片上资源的不断增加,微处理器设计遇到了一系列问题:为芯片提供一个全局时钟网络越来越困难,时钟扭曲等问题越来越突出,芯片的功耗问题越来越严重。上述这些因素促使人们将注意力逐渐转向异步电路设计。在设计异... 随着工艺的不断进步及芯片上资源的不断增加,微处理器设计遇到了一系列问题:为芯片提供一个全局时钟网络越来越困难,时钟扭曲等问题越来越突出,芯片的功耗问题越来越严重。上述这些因素促使人们将注意力逐渐转向异步电路设计。在设计异步微处理器过程中,异步流水线的设计是一个非常重要的问题。首先总结了微处理器设计中出现的各种流水线结构,并给出了相应的异步实现;然后提出了一种异步流水线设计流程,用于加速异步流水线的设计;最后利用提出的流程设计实现了几种异步功能单元,实验结果表明异步电路能够有效降低电路的功耗。 展开更多
关键词 低功耗 流水线 异步电路 设计流程
在线阅读 下载PDF
基于FPGA的单精度浮点数乘法器设计 被引量:3
16
作者 旷捷 毛雪莹 +2 位作者 彭俊淇 黄启俊 常胜 《电子技术应用》 北大核心 2010年第5期17-19,共3页
设计了一个基于FPGA的单精度浮点数乘法器。设计中采用改进的带偏移量的冗余Booth3算法和跳跃式Wallace树型结构,并提出对Wallace树产生的2个伪和采用部分相加的方式,提高了乘法器的运算速度;加入对特殊值的处理模块,完善了乘法器的功... 设计了一个基于FPGA的单精度浮点数乘法器。设计中采用改进的带偏移量的冗余Booth3算法和跳跃式Wallace树型结构,并提出对Wallace树产生的2个伪和采用部分相加的方式,提高了乘法器的运算速度;加入对特殊值的处理模块,完善了乘法器的功能。本设计在AlteraDE2开发板上进行了验证。 展开更多
关键词 改进的带偏移量的冗余Booth3算法 跳跃式Wallace树 单精度浮点数乘法器 FPGA
在线阅读 下载PDF
时序逻辑除法器设计
17
作者 罗海涛 《电脑编程技巧与维护》 2025年第11期32-34,60,共4页
计算机硬件系统按照“存储程序”和“程序控制”的方式工作,执行程序和处理数据时将程序与数据从外存储器装入主存储器中,中央处理单元(CPU)自动地从主存逐条取出指令并执行。CPU芯片的运算器(ALU)部件完成算术和逻辑运算,其中,除法运算... 计算机硬件系统按照“存储程序”和“程序控制”的方式工作,执行程序和处理数据时将程序与数据从外存储器装入主存储器中,中央处理单元(CPU)自动地从主存逐条取出指令并执行。CPU芯片的运算器(ALU)部件完成算术和逻辑运算,其中,除法运算是ALU的基本算术运算功能之一。在Quartus II平台,用原理图输入的方式,采用时序逻辑电路设计实现了除法器。 展开更多
关键词 计算机硬件系统 存储程序 程序控制 除法器
在线阅读 下载PDF
基于FPGA的32位并行乘法器的设计与实现 被引量:2
18
作者 蒋勇 罗玉平 +1 位作者 马晏 叶新 《计算机工程》 CAS CSCD 北大核心 2005年第23期222-224,共3页
首先分析比较了几种典型的乘法器实现结构,然后采用树型组合方式,对其结构进行了优化,最后在FPGA上设计并实现了一个高性能的32位并行乘法器。
关键词 乘法器 现场可编程逻辑门阵列 硬件描述语言 BOOTH算法
在线阅读 下载PDF
铝基覆铜板导热系数测试方法改进分析 被引量:2
19
作者 任成伟 师剑军 +1 位作者 马卫东 张勇 《电子元件与材料》 CAS CSCD 2017年第1期80-84,共5页
为方便准确地测量铝基覆铜板的导热系数,设计了一种改进的导热系数测试方法。该方法用样本试件作为参照,利用两试件随环境变化导热系数比值近似不变的原理,求出待测试件的导热系数。经过理论分析与仿真验证后,搭建了一种新的铝基覆铜板... 为方便准确地测量铝基覆铜板的导热系数,设计了一种改进的导热系数测试方法。该方法用样本试件作为参照,利用两试件随环境变化导热系数比值近似不变的原理,求出待测试件的导热系数。经过理论分析与仿真验证后,搭建了一种新的铝基覆铜板导热系数测试平台。实验结果显示,该平台有效减少了测量误差,简化了操作流程,节约了实验成本。 展开更多
关键词 铝基覆铜板 导热系数 测试方法 热阻 热板 散热
在线阅读 下载PDF
基4BOOTH编码的高速32×32乘法器的设计与实现 被引量:5
20
作者 周婉婷 李磊 《电子科技大学学报》 EI CAS CSCD 北大核心 2008年第S1期106-108,132,共4页
介绍并实现了一种高速32×32有符号/无符号二进制乘法器。该乘法器采用改进基4BOOTH算法编码方式,所产生的电路与传统相比减小了延时与面积,并采用符号补偿技术对每个部分积进行符号位补偿,进一步简化电路。该乘法器在关键路径上采... 介绍并实现了一种高速32×32有符号/无符号二进制乘法器。该乘法器采用改进基4BOOTH算法编码方式,所产生的电路与传统相比减小了延时与面积,并采用符号补偿技术对每个部分积进行符号位补偿,进一步简化电路。该乘法器在关键路径上采用改进混合Wallace树压缩器阵列进行优化,其压缩器阵列对称有利于布局布线。该乘法器插入流水后能运行到250MHz,可用作专用数据通道的乘法单元。 展开更多
关键词 BOOTH编码 压缩器 乖法器 WALLACE树
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部