期刊文献+
共找到842篇文章
< 1 2 43 >
每页显示 20 50 100
scanf:floating point formats not linked解决方法综述
1
作者 曹凤雪 《现代计算机》 2010年第8期88-90,共3页
简要分析在Turbo C 2.0编译环境下使用scanf函数时,浮点数格式不能连接的原因。许多资料给出了不同的解决方法,参阅了大量文献后,大致归结五类解决问题的方法,以便在使用时根据自己的需要灵活选择合适的方法。
关键词 TURBO C 2.0 SCANF函数 浮点类型
在线阅读 下载PDF
ASIC Design of Floating-Point FFT Processor 被引量:2
2
作者 陈禾 赵忠武 《Journal of Beijing Institute of Technology》 EI CAS 2004年第4期389-393,共5页
An application specific integrated circuit (ASIC) design of a 1024 points floating-point fast Fourier transform(FFT) processor is presented. It can satisfy the requirement of high accuracy FFT result in related fields... An application specific integrated circuit (ASIC) design of a 1024 points floating-point fast Fourier transform(FFT) processor is presented. It can satisfy the requirement of high accuracy FFT result in related fields. Several novel design techniques for floating-point adder and multiplier are introduced in detail to enhance the speed of the system. At the same time, the power consumption is decreased. The hardware area is effectively reduced as an improved butterfly processor is developed. There is a substantial increase in the performance of the design since a pipelined architecture is adopted, and very large scale integrated (VLSI) is easy to realize due to the regularity. A result of validation using field programmable gate array (FPGA) is shown at the end. When the system clock is set to 50 MHz, 204.8 μs is needed to complete the operation of FFT computation. 展开更多
关键词 application specific integrated circuit(ASIC) fast Fourier transform(FFT) floatING-point PIPELINE very large scale integrated(VLSI)
在线阅读 下载PDF
Optimization of block-floating-point realizations for digital controllers with finite-word-length considerations
3
作者 吴俊 胡协和 +1 位作者 陈生 褚健 《Journal of Zhejiang University Science》 EI CSCD 2003年第6期651-657,共7页
The closed-loop stability issue of finite-precision realizations was investigated for digital control-lers implemented in block-floating-point format. The controller coefficient perturbation was analyzed resultingfrom... The closed-loop stability issue of finite-precision realizations was investigated for digital control-lers implemented in block-floating-point format. The controller coefficient perturbation was analyzed resultingfrom using finite word length (FWL) block-floating-point representation scheme. A block-floating-point FWL closed-loop stability measure was derived which considers both the dynamic range and precision. To facilitate the design of optimal finite-precision controller realizations, a computationally tractable block-floating-point FWL closed-loop stability measure was then introduced and the method of computing the value of this measure for a given controller realization was developed. The optimal controller realization is defined as the solution that maximizes the corresponding measure, and a numerical optimization approach was adopted to solve the resulting optimal realization problem. A numerical example was used to illustrate the design procedure and to compare the optimal controller realization with the initial realization. 展开更多
关键词 Digital controller Finite word length Block floating point Closed loop stability OPTIMIZATION
在线阅读 下载PDF
Performance Analysis of OFDM Synchronization Using Customized Floating Point for Low Complexity
4
作者 V. Janakiraman M. Kannan 《Circuits and Systems》 2016年第10期3112-3120,共9页
Orthogonal frequency-division multiplexing (OFDM) is a multi carrier modulation scheme mainly used for digital communications. The performance of OFDM system heavily depends on the synchronization scheme used. In most... Orthogonal frequency-division multiplexing (OFDM) is a multi carrier modulation scheme mainly used for digital communications. The performance of OFDM system heavily depends on the synchronization scheme used. In most cases, the accuracy level of synchronization will be worsened by the error caused in fixed point arithmetic involved. In this paper, we analyze the impact of the fixed point arithmetic on the performance of the coarse timing and frequency synchronization. Here with an analytical approach through numerical simulations bit length of IEEE 754 standard single precision format is optimized according to the required degree of accuracy for low complexity. Also, a complete precision level requirement for FFT computations with all possible modulation types is obtained. The proposed precision model is compared with IEEE standard single precision model and its efficiency in OFDM synchronization process is proved through MATLAB simulations. Finally, the complexity reduction of proposed precision model in both addition and subtraction is proved against single precision format using hardware synthesis. Here we proved that more than 50% complexity reduction is achieved as compared to standard precision models without compromising quality. The quality retention of proposed model is proved in both timing and frequency synchronization process. 展开更多
关键词 OFDM Fast Fourier Transform floating point Aithmetic SYNCHRONIZATION CUSTOMIZATION
在线阅读 下载PDF
一种异构系统下计算软件性能数据采集方法
5
作者 顾蓓蓓 邱霁岩 +2 位作者 王宁 陈健 迟学斌 《计算机研究与发展》 北大核心 2025年第9期2382-2395,共14页
超级计算已从传统CPU集群向异构平台快速发展,随着硬件平台的类型转换,对于计算软件程序调优及性能测评等都面临着重大挑战.当前一些国际主流并行程序性能分析工具及软件普遍存在与国产超算异构系统处理器产品兼容性低、往往需要进行插... 超级计算已从传统CPU集群向异构平台快速发展,随着硬件平台的类型转换,对于计算软件程序调优及性能测评等都面临着重大挑战.当前一些国际主流并行程序性能分析工具及软件普遍存在与国产超算异构系统处理器产品兼容性低、往往需要进行插桩及重编译代码的方式,且单节点性能数据采集准确度不高等问题.为了改进这些不足,提出了一种异构系统计算软件浮点性能数据采集方法.该方法基于国产超算系统验证平台对浮点性能采集原型进行开发及验证.目前已实现单节点和多节点性能指标数据的有效采集,且对原程序无侵入性,该方法无需修改需要被监控程序的代码,且无需采用插桩的方式进行监控,通用性强.最后,与rocHPL,Cannon,mixbench这3类程序进行对比实验分析,并针对人工智能(artificial intelligence,AI)计算,在残差网络(residual network,Res Net)程序上开展了性能数据采集方面的监测研究.证明提出的采集方法准确度较高,采集效果达到实验预期,且对程序调优具有较好的参考价值,验证了该方法的有效性. 展开更多
关键词 异构系统 性能指标 浮点数据 采集程序 性能测评
在线阅读 下载PDF
基于SCADE的安全级DCS浮点数运算误差分析
6
作者 陈杰 靳津 +2 位作者 肖安洪 曾辉 于佼 《仪表技术》 2025年第3期46-49,77,共5页
基于高安全应用开发环境(SCADE)开发的核电厂安全级数字控制系统(DCS)应用组态软件,针对浮点数运算舍入误差,结合具体案例,分析了误差是否被设计放大及其对软件功能和基于SCADE平台的仿真测试影响,探讨了仿真平台与目标平台浮点数精度... 基于高安全应用开发环境(SCADE)开发的核电厂安全级数字控制系统(DCS)应用组态软件,针对浮点数运算舍入误差,结合具体案例,分析了误差是否被设计放大及其对软件功能和基于SCADE平台的仿真测试影响,探讨了仿真平台与目标平台浮点数精度不一致时的仿真结果差异及影响,并提出了控制措施,以期为后续项目提供借鉴。 展开更多
关键词 高安全应用开发环境 安全级 数字控制系统 浮点数运算 误差分析
原文传递
筋膜触发点浮针联合中医正骨手法治疗腰椎间盘突出症患者的临床效果研究
7
作者 李德科 《反射疗法与康复医学》 2025年第10期21-24,共4页
目的分析筋膜触发点浮针联合中医正骨手法治疗腰椎间盘突出症患者的临床效果。方法选择2023年1月—2024年12月达州职业技术学院附属医院收治的48例腰椎间盘突出症患者为研究对象,按随机数字表法将其分为对照组和观察组,各24例。对照组... 目的分析筋膜触发点浮针联合中医正骨手法治疗腰椎间盘突出症患者的临床效果。方法选择2023年1月—2024年12月达州职业技术学院附属医院收治的48例腰椎间盘突出症患者为研究对象,按随机数字表法将其分为对照组和观察组,各24例。对照组采用中医正骨手法治疗,观察组采用筋膜触发点浮针联合中医正骨手法治疗。对比两组的临床疗效、疼痛程度、腰椎功能、血清炎症指标。结果观察组治疗总有效率为95.83%,高于对照组的75.00%,差异有统计学意义(P<0.05)。治疗2周后,两组疼痛视觉模拟评分、Oswestry功能障碍指数评分均低于治疗前,且观察组均低于对照组,差异有统计学意义(P<0.05);两组肿瘤坏死因子-α、白细胞介素1β、环氧合酶-2水平均低于治疗前,且观察组均低于对照组,差异有统计学意义(P<0.05)。结论筋膜触发点浮针联合中医正骨手法治疗腰椎间盘突出症患者的疗效确切,可缓解疼痛,改善腰椎功能,降低血清炎症指标水平,值得临床推广。 展开更多
关键词 腰椎间盘突出症 筋膜触发点浮针 中医正骨手法 疼痛程度 腰椎功能
原文传递
一种可重构的单精度近似浮点乘法器设计
8
作者 李鹏程 黄立波 +5 位作者 陈刚 赖明澈 邓林 刘威 杨乾明 王永文 《计算机研究与发展》 北大核心 2025年第6期1581-1593,共13页
人工智能(AI)和物联网(IoT)技术的迅速发展,对计算能效提出了更高的要求,终端设备在硬件资源开销方面同样面临巨大挑战.为了应对能效问题,新型低功耗近似计算单元的设计得到了广泛研究.在数字信号处理和图像处理等应用场景中,存在大量... 人工智能(AI)和物联网(IoT)技术的迅速发展,对计算能效提出了更高的要求,终端设备在硬件资源开销方面同样面临巨大挑战.为了应对能效问题,新型低功耗近似计算单元的设计得到了广泛研究.在数字信号处理和图像处理等应用场景中,存在大量的浮点运算.这些应用消耗了大量的硬件资源,但它们具有一定的容错性,没有必要进行完全精确的计算.据此,提出了一种基于移位近似算法MTA(multiplication to shift addition)和非对称截断的单精度可重构近似浮点乘法器设计方法.首先,采用了一种低功耗的近似算法MTA,将部分操作数的乘法运算转换为移位加法.其次,为了在精度和成本之间取得平衡,设计了针对操作数高有效位的非对称截断处理,并对截断后保留的部分进行精确计算.通过采用不同位宽的MTA近似计算和改变截断后部分积阵列的行数,生成了广阔的设计空间,从而可以在精度和成本之间进行多种权衡调整.与精确浮点乘法器相比,所提出设计MTA5T5的精度损失(MRED)仅约为0.32%,功耗降低了85.80%,面积减少了79.53%.对于精度较低的MTA3T3,其精度损失约为1.92%,而功耗和面积分别降低了90.55%和85.80%.最后,进行了FIR滤波和图像处理的应用测试,结果表明所提出的设计在精度和开销方面具有显著优势. 展开更多
关键词 近似浮点乘法器 MTA 非对称截断 精度 开销
在线阅读 下载PDF
SIMD-to-RVV动态二进制翻译中的跨架构编程模型适配优化
9
作者 赖远明 李亚龙 +3 位作者 胡瀚之 谢梦瑶 王喆 武成岗 《计算机研究与发展》 北大核心 2025年第6期1469-1491,共23页
RISC-V因其开源和模块化设计等特性,已在嵌入式领域取得显著成功,并逐步向高性能计算(HPC)领域拓展.面向HPC的RISC-V硬件(如Sophon SG2042多核处理器)已展现出与x86/ARM同类型产品相当的性能水平,但不完善的软件生态是阻碍其发展的最大... RISC-V因其开源和模块化设计等特性,已在嵌入式领域取得显著成功,并逐步向高性能计算(HPC)领域拓展.面向HPC的RISC-V硬件(如Sophon SG2042多核处理器)已展现出与x86/ARM同类型产品相当的性能水平,但不完善的软件生态是阻碍其发展的最大障碍之一.开发了面向RISC-V的进程级动态二进制翻译(DBT)器RVBT,用于将成熟的x86软件生态移植到RISC-V平台,加速RISC-V在HPC领域的应用进程.针对HPC程序广泛依赖SIMD指令的特性,聚焦于解决SIMD与RVV间显著的编程模型差异导致的翻译性能瓶颈问题,提出了3项创新的优化方案.x86SIMD将数据类型硬编码于操作码,而RVV需动态配置vtype和掩码寄存器,这导致直接翻译产生了大量冗余操作,严重拉低了翻译运行的效率.通过充分利用程序数据类型的局部性,优化方案可删除跨架构适配编程模型导致的冗余设置,混合使用浮点扩展和向量扩展翻译SIMD指令并按需同步数据,大幅提升了SIMD指令的翻译运行效率.3项优化方案具备通用性,也适用于ARM平台的SIMD到RVV的翻译.实验表明,以SPECCPU2006作为测试集,优化方案对csrr,vsetvl,vsetvli指令的平均动态消除率分别达到了100%,100%和56.31%,在浮点测试集上,掩码设置操作的平均动态消除率达到了74.66%,数据的平均动态同步率为67.35%.优化后的RVBT在整点和浮点测试集上的平均运行效率达到了本地执行的47.39%和40.06%,相比优化前的加速比分别为1.21和8.31,并远超QEMU18.84%和4.81%,展现出了应用于部分HPC场景的潜力. 展开更多
关键词 二进制翻译 RISC-V向量扩展 x86SIMD 跨架构编程模型适配 浮点计算 冗余设置消除 混合翻译
在线阅读 下载PDF
多功能套针浮刺治疗颈性眩晕的疗效观察 被引量:1
10
作者 王鑫蕊 陈英华 +1 位作者 孙玮 杨建宇 《上海针灸杂志》 2025年第5期556-562,共7页
目的基于经筋理论观察多功能套针浮刺治疗颈性眩晕的临床疗效。方法将180例颈性眩晕患者采用随机数字表法随机分为套针浮刺组与常规针刺组,每组90例。套针浮刺组采用多功能套针浮刺疗法,常规针刺组则采用常规针刺疗法。观察两组治疗前... 目的基于经筋理论观察多功能套针浮刺治疗颈性眩晕的临床疗效。方法将180例颈性眩晕患者采用随机数字表法随机分为套针浮刺组与常规针刺组,每组90例。套针浮刺组采用多功能套针浮刺疗法,常规针刺组则采用常规针刺疗法。观察两组治疗前后颈性眩晕评估量表(evaluation scale for cervical vertigo,ESCV)、眩晕残障程度评定量表(dizziness handicap inventory,DHI)、眩晕症状量表(vertigo symptom scale,VSS)评分变化,采用经颅多普勒超声检测双侧椎动脉血流速度,并比较两组临床疗效。结果套针浮刺组总有效率、愈显率分别为96.7%、81.1%,常规针刺组分别为88.9%、62.2%,且套针浮刺组均优于常规针刺组(P<0.05)。治疗后,两组ESCV评分较治疗前均升高(P<0.05),且套针浮刺组高于常规针刺组(P<0.05)。治疗后,两组DHI评分较治疗前均降低(P<0.05),且套针浮刺组低于常规针刺组(P<0.05)。治疗后,两组VSS评分较治疗前均降低(P<0.05),且套针浮刺组评分低于常规针刺组(P<0.05)。治疗后,两组双侧椎动脉血流速度较治疗前均增快(P<0.05),且套针浮刺组双侧椎动脉血流速度均快于常规针刺组(P<0.05)。结论多功能套针浮刺治疗颈性眩晕临床疗效更优,可以减轻眩晕症状和眩晕程度,改善椎动脉血流速度。 展开更多
关键词 眩晕 颈椎病 经筋理论 针刺疗法 浮刺 风池 手三里
暂未订购
CNFED:一种基于条件数的浮点表达式误差检测工具
11
作者 王盼龙 王磊 +2 位作者 英津瑞 刘博文 高志勇 《计算机科学》 北大核心 2025年第S1期902-909,共8页
浮点数使用有限的精度来表示实数,其固有的舍入误差会在计算过程中累积,可能导致严重错误,从而危及程序的安全性和可靠性。理论上,最精准的浮点误差检测方法是穷举搜索所有可能的浮点数输入,以确定实际计算结果与理论值之间的最大误差,... 浮点数使用有限的精度来表示实数,其固有的舍入误差会在计算过程中累积,可能导致严重错误,从而危及程序的安全性和可靠性。理论上,最精准的浮点误差检测方法是穷举搜索所有可能的浮点数输入,以确定实际计算结果与理论值之间的最大误差,但搜索空间巨大,因此有效且高效地检测最大浮点误差一直是一个挑战。基于对条件数的研究,设计并实现了一种用于浮点表达式的误差检测工具CNFED。CNFED将输入区间划分成多个子区间,对每个子区间进行随机采样和评估,快速定位多个热点子区间;然后分层对这些热点子区间调用全局搜索算法和局部搜索算法,并结合相应评估函数进行筛选,最终找到可能的浮点误差极大值及相应的输入值并报告。实验选取FPBench标准测试集中26个表达式作为测试用例,并与先进检测工具ATOMU和HSED进行了比较。实验结果表明,CNFED检测效果优于ATOMU的比例为96.15%(25/26)。与针对浮点表达式的检测工具HSED相比,CNFED检测效果优于HSED的比例为34.62%(9/26),同时HSED所花平均时间是CNFED的4.8倍。 展开更多
关键词 误差检测 浮点运算 条件数 动态分析 分层搜索
在线阅读 下载PDF
基于RISC⁃V的五级流水线浮点SoC设计
12
作者 刘兴通 汤永华 +3 位作者 张志鹏 王腾川 荣弘扬 周程堉 《现代电子技术》 北大核心 2025年第14期57-62,共6页
RISC-V是一种开源指令集架构,其高度可定制化的特性在嵌入式系统领域展现出较强的应用潜力与优势。针对目前嵌入式处理器在视频解码和音频处理等方面对浮点数运算的需求,设计一种包含浮点处理单元(FPU)的片上系统(SoC)。SoC中的CPU是基... RISC-V是一种开源指令集架构,其高度可定制化的特性在嵌入式系统领域展现出较强的应用潜力与优势。针对目前嵌入式处理器在视频解码和音频处理等方面对浮点数运算的需求,设计一种包含浮点处理单元(FPU)的片上系统(SoC)。SoC中的CPU是基于RISC-V指令集设计的五级流水线结构,其中包括RV32I基本指令集、M和F扩展指令集,以AXI4-Lite为片内总线并挂载UART、SPI、TIMER等基本外设。在FPGA上对SoC功能进行软硬件协同仿真测试,测试结果显示,CPU CoreMark跑分结果为3.31 CoreMark/MHz,并能完整运行外设程序,实现了完整的SoC功能设计。 展开更多
关键词 RISC-V 浮点处理单元 片上系统 五级流水线 FPGA AXI4-Lite
在线阅读 下载PDF
浮点时序数据压缩综述
13
作者 朱明辉 李政 +2 位作者 李瑞远 陈超 郑宇 《软件学报》 北大核心 2025年第6期2844-2874,共31页
物联网技术的发展产生了海量的浮点时序数据,这给数据存储和传输带来了巨大挑战.为此,浮点时序数据压缩变得至关重要,其按数据可逆性分为有损压缩和无损压缩.有损压缩方法通过舍弃部分数据信息以实现较好的压缩率,适用于对精确性要求较... 物联网技术的发展产生了海量的浮点时序数据,这给数据存储和传输带来了巨大挑战.为此,浮点时序数据压缩变得至关重要,其按数据可逆性分为有损压缩和无损压缩.有损压缩方法通过舍弃部分数据信息以实现较好的压缩率,适用于对精确性要求较低的应用.无损压缩方法在减小数据大小的同时保留了所有数据信息,这对于需要保持数据完整性和准确性的应用至关重要.此外为满足边缘设备的实时监控需求,流式压缩算法应运而生.当前时序压缩综述论文存在梳理不全面、脉络不清晰、分类标准单一、未归纳较新的具有代表性算法等问题.对历年来的时序数据压缩算法按有损压缩和无损压缩进行划分,并进一步区分不同的算法框架,包括基于数据表示、基于预测、基于机器学习、基于变换等,同时对流式与批式的压缩特征进行归纳.然后对各种压缩算法的设计思路进行深入分析,并给出各算法的发展脉络图.接着结合实验比较各类算法的优势与不足.最后总结算法常见的应用场景,并对未来研究进行展望. 展开更多
关键词 无损压缩 有损压缩 浮点时序压缩 数据压缩
在线阅读 下载PDF
高精度浮点数在电场积分方程低频崩溃时的应用
14
作者 陈翔 张铭轩 +1 位作者 樊振宏 丁大志 《电波科学学报》 北大核心 2025年第5期933-939,共7页
电场积分方程(electric field integral equation,EFIE)“低频崩溃”现象是指当电磁波波长远大于离散单元的尺寸时,分析结果不准确的现象。它的发生与计算机浮点数的字长有关,高精度浮点数的普及有助于缓解低频崩溃现象的发生,但目前还... 电场积分方程(electric field integral equation,EFIE)“低频崩溃”现象是指当电磁波波长远大于离散单元的尺寸时,分析结果不准确的现象。它的发生与计算机浮点数的字长有关,高精度浮点数的普及有助于缓解低频崩溃现象的发生,但目前还没有关于不同精度的浮点数的低频崩溃临界阈值的研究报道。本文定量研究了不同字长浮点数的EFIE不发生低频崩溃的适用范围,以便在该适用范围内,研究人员仅须简单地修改现有EFIE代码的浮点数字长就可以进行电磁特性的准确分析而不发生低频崩溃,避免现有低频问题都需要修改基函数或积分方程等分析技术,为低频电磁分析增加了一种可选择的简便解决办法。经过数值算例的验证,高精度浮点数的EFIE可以将低频崩溃现象发生的离散网格的电尺寸降低到2.5×10^(−13),这已经能够处理我们常见的低频崩溃问题。 展开更多
关键词 电场积分方程(EFIE) 低频崩溃 16字节浮点数 连续伽辽金 电磁分析
在线阅读 下载PDF
基于局部性原理的最大误差并行检测方法
15
作者 冀立光 杨鸿儒 +3 位作者 周玉畅 崔梦琦 何昊天 许瑾晨 《计算机科学》 北大核心 2025年第9期152-159,共8页
浮点数采用有限的位数来表示无限的实数进行计算,因此浮点数计算天然具有不准确性,这种不准确性可以用最大误差来度量。传统浮点数最大误差检测算法采用串行计算思维并结合经典搜索算法,当采样点数量较少时,容易将局部极大值作为全局最... 浮点数采用有限的位数来表示无限的实数进行计算,因此浮点数计算天然具有不准确性,这种不准确性可以用最大误差来度量。传统浮点数最大误差检测算法采用串行计算思维并结合经典搜索算法,当采样点数量较少时,容易将局部极大值作为全局最大值处理,从而遗漏最大误差值。如果大规模提升采样点数量,那么检测程序用时大幅增加,检测性能降低。通过应用并行计算模式指数级增加采样点数量,同步结合局部性原理在误差热点附近采用浮点动态采样策略,大幅提高检测结果的准确性。这种方法可以最大限度地发挥并行计算的算力,不仅可以提升浮点数最大误差的检测精度,还可以压缩检测程序的执行时间并提升性能,加速比可以达到1136.3,检测出的最大误差值优于当前主流检测工具,这为衡量浮点数计算指标提供了新的检测方法。 展开更多
关键词 浮点运算 并行优化 区间采样 误差检测 申威异构架构
在线阅读 下载PDF
深水FPSO单点系泊系统内转塔加强结构设计与评估
16
作者 荆海东 钱笠君 +1 位作者 迟少艳 杨玥 《中国海洋平台》 2025年第2期79-86,共8页
以设计的多型浮式生产储卸油装置(Floating Production Storage and Offloading,FPSO)为基础,介绍目前主流内转塔FPSO设计理念和界面形式,分析对比不同内转塔式单点系泊系统载荷传递理念。对典型的内转塔FPSO系泊系统加强设计进行对比分... 以设计的多型浮式生产储卸油装置(Floating Production Storage and Offloading,FPSO)为基础,介绍目前主流内转塔FPSO设计理念和界面形式,分析对比不同内转塔式单点系泊系统载荷传递理念。对典型的内转塔FPSO系泊系统加强设计进行对比分析,给出不同内转塔FPSO系泊系统加强结构设计重点。对比主流船级社对系泊系统强度和疲劳设计的要求,阐述结构强度分析和疲劳分析的基本流程和关注重点。结果表明:不同内转塔系统的界面形式、载荷形式和加强结构形式各不相同;加强结构强度评估应特别注意扭矩影响;加强结构疲劳评估应考虑波频载荷和低频载荷的影响。 展开更多
关键词 浮式生产储卸油装置 单点系泊 内转塔 加强结构 设计 强度评估 疲劳评估 系泊载荷
在线阅读 下载PDF
粗粒度可重构浮点处理单元四则运算性能评估
17
作者 李抗 陈乃金 +2 位作者 韩承浩 胡宇杨 沈宇阳 《天津理工大学学报》 2025年第5期77-86,共10页
粗粒度可重构计算系统具有低功耗、高性能特点,已经在加速等多个领域获得了广泛的应用,但是其浮点四则运算的结温、动态功耗等参数的获取仍然是粗粒度可重构计算系统编译映射要解决的关键问题。针对这一问题,文中对可重构带符号浮点四... 粗粒度可重构计算系统具有低功耗、高性能特点,已经在加速等多个领域获得了广泛的应用,但是其浮点四则运算的结温、动态功耗等参数的获取仍然是粗粒度可重构计算系统编译映射要解决的关键问题。针对这一问题,文中对可重构带符号浮点四则运算单元进行了设计,并提出了相关参数求解算法,同时对4,8,16,32,64位浮点运算所消耗的结温、动态功耗、时延等进行了分析比较。实验结果表明,就4位和64位浮点操作数运算而言,加法、减法、乘法、除法的结温依次增加了17.1 ,18.5 ,313.598 ,619.803℃,动态功耗依次增加了171.458 ,186.662 ,3 136.339,6 197.403 W,查找表(look up table,LUT)个数依次增加了181,242,2 301,4 294,I/O个数依次增加了419,486,9 299,9 000。除64位乘除法结温等参数消耗较大外,实验验证获得结温、动态功耗、LUT和I/O等参数均在合理的范围之内,因而文中方法具有可行性。 展开更多
关键词 粗粒度可重构系统 浮点 结温 动态功耗 查找表
在线阅读 下载PDF
Posit浮点部件实现
18
作者 陈子钰 何军 +4 位作者 尹飞 颜世云 杨剑新 文周旺 马启皓 《计算机应用》 北大核心 2025年第S1期163-169,共7页
首先,介绍Posit浮点格式及相关研究现状;其次,设计并实现一组Posit浮点运算指令,包含7条算术运算指令、3条比较指令和14条格式转换指令;最后,实现一个能全流水执行的Posit浮点部件,并评估它的实现性。该部件支持Posit(32,2)、Posit(32,3... 首先,介绍Posit浮点格式及相关研究现状;其次,设计并实现一组Posit浮点运算指令,包含7条算术运算指令、3条比较指令和14条格式转换指令;最后,实现一个能全流水执行的Posit浮点部件,并评估它的实现性。该部件支持Posit(32,2)、Posit(32,3)和Posit(32,6)这3种格式,包含5级流水的Posit浮点融合乘加(PFMA)子部件和3级流水的Posit浮点格式转换(PFCVT)子部件。相较于支持FP32格式的浮点部件,所提Posit浮点部件在Posit(32,2)格式下的操作数尾数和结果尾数的最大位宽增加了4 bit,并在Posit(32,6)格式下的指数的动态范围提升了近1 072 decades,显著提高了数据表示范围和灵活性;同时,在Posit(32,6)格式下支持的数据动态范围比FP64大了近524 decades。可见,所提部件可用于探索Posit(32,6)在特定领域和应用中替代FP64的可行性,以减少计算系统的存储、访存和通信开销,从而提高计算能效。 展开更多
关键词 Posit 浮点算术 融合乘加 浮点转换 指令集
在线阅读 下载PDF
虚实融合的液压支架浮动连接机构位姿监测方法
19
作者 马凯 谢嘉成 +3 位作者 郭鑫颖 王学文 王雪松 王丽杰 《工矿自动化》 北大核心 2025年第7期158-163,共6页
针对液压支架浮动连接机构(FCM)无法直接获取各部件位姿且整体位姿获取精度受限的问题,提出了一种虚实融合的液压支架FCM位姿监测方法。通过安装在液压支架顶梁的相机采集FCM深度图像和RGB图像,生成真实点云的三维坐标信息并存储在指定... 针对液压支架浮动连接机构(FCM)无法直接获取各部件位姿且整体位姿获取精度受限的问题,提出了一种虚实融合的液压支架FCM位姿监测方法。通过安装在液压支架顶梁的相机采集FCM深度图像和RGB图像,生成真实点云的三维坐标信息并存储在指定文件中;文件转换后由Unity读取并创建对应坐标数据的方块,实现真实点云的映射;构建液压支架、FCM和刮板输送机的数字孪生体,在Unity中添加父子关系、物理引擎和碰撞体,创建虚拟相机来获取FCM推杆上表面的虚拟点云,使用迭代最近点(ICP)算法将推杆上表面虚拟点云和裁剪后的真实点云配准得到推杆平移旋转矩阵,将其转换为Unity驱动数据后驱动推杆运动并在父子关系、物理引擎和碰撞体的限制下带动FCM其余部件运动,实现FCM所有部件的位姿监测。实验结果表明:该方法监测的FCM推移量误差在3.5cm以内,推杆俯仰角误差在1.1°以内,推杆偏转角误差在0.5°以内,连接头偏转角误差在0.8°以内,FCM位姿整体监测精度较高。 展开更多
关键词 数字孪生 虚实融合 液压支架 浮动连接机构 位姿监测 点云
在线阅读 下载PDF
基于半精度浮点数的并行计算优化研究与实证分析
20
作者 王瑞星 吴克坚 《内蒙古师范大学学报(自然科学版)》 2025年第5期496-505,共10页
选取五种具有代表性的并行计算算法,包括矩阵乘法、卷积神经网络训练、快速傅里叶变换、粒子模拟和蒙特卡罗模拟,系统评估半精度浮点数(FP16)在计算效率、资源利用率和数值精度上的表现。实验结果表明,FP16在特定任务中可明显提升计算效... 选取五种具有代表性的并行计算算法,包括矩阵乘法、卷积神经网络训练、快速傅里叶变换、粒子模拟和蒙特卡罗模拟,系统评估半精度浮点数(FP16)在计算效率、资源利用率和数值精度上的表现。实验结果表明,FP16在特定任务中可明显提升计算效率,同时在混合精度策略下可有效平衡性能与精度。 展开更多
关键词 半精度浮点数 并行计算 性能 实证分析
在线阅读 下载PDF
上一页 1 2 43 下一页 到第
使用帮助 返回顶部