期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
MW-DLA:a dynamic bit width deep learning accelerator 被引量:1
1
作者 Li Zhen Zhi Tian +2 位作者 Liu Enhe Liu Shaoli Chen Tianshi 《High Technology Letters》 EI CAS 2020年第2期145-151,共7页
Deep learning algorithms are the basis of many artificial intelligence applications.Those algorithms are both computationally intensive and memory intensive,making them difficult to deploy on embedded systems.Thus var... Deep learning algorithms are the basis of many artificial intelligence applications.Those algorithms are both computationally intensive and memory intensive,making them difficult to deploy on embedded systems.Thus various deep learning accelerators(DLAs)are proposed and applied to achieve better performance and lower power consumption.However,most deep learning accelerators are unable to support multiple data formats.This research proposes the MW-DLA,a deep learning accelerator supporting dynamic configurable data-width.This work analyzes the data distribution of different data types in different layers and trains a typical network with per-layer representation.As a result,the proposed MW-DLA achieves 2X performance and more than 50%memory requirement for AlexNet with less than 5.77%area overhead. 展开更多
关键词 deep learning accelerator(DLA) per-layer representation multiple-precision arithmetic unit
在线阅读 下载PDF
多策略算术优化算法
2
作者 刘勇 赵启巍 陈茵理 《智能计算机与应用》 2025年第6期32-42,共11页
针对算术优化算法寻优精度低和计算速度慢等缺点,提出一种多策略算术优化算法。首先,结合一种动态莱维飞行优化策略对当前最优解进行动态更新,并用于算法所有的解更新方程;其次,采用Sigmoid函数设计非线性的数学优化加速器函数,实现全... 针对算术优化算法寻优精度低和计算速度慢等缺点,提出一种多策略算术优化算法。首先,结合一种动态莱维飞行优化策略对当前最优解进行动态更新,并用于算法所有的解更新方程;其次,采用Sigmoid函数设计非线性的数学优化加速器函数,实现全局探索和局部开发两种优化阶段的选择;最后,引入基于正余弦函数的动态权重,较大的权重使算法在优化过程前期具有较强的全局探索能力,而较小的权重使算法在优化过程后期具有较强的局部开发能力。通过实验验证了3种策略组合的有效性。采用30维、500维和1 000维的函数进行数值实验,并将新算法与基本算术优化算法、灰狼优化算法、鲸鱼优化算法、麻雀搜索算法和正余弦优化算法进行对比,并进行Wilcoxon秩和检验。实验结果表明新算法具有更好的优化性能。 展开更多
关键词 算术优化算法 动态莱维飞行优化策略 数学优化加速器函数 动态权重
在线阅读 下载PDF
炸弹空气阻力加速度的仿真与实现 被引量:6
3
作者 王勇亮 赵成仁 卢颖 《弹箭与制导学报》 CSCD 北大核心 2006年第S1期251-252,256,共3页
文中在平方阻力定律、1950年航空炸弹阻力定律的基础上,针对领航轰炸仿真的特点,根据牛顿第二运动定律和几何学等,给出了炸弹在空中运动时空气阻力加速度的仿真算法,重点讨论了速度函数与炸弹速度和空气阻力加速度的关系、阻力系数与马... 文中在平方阻力定律、1950年航空炸弹阻力定律的基础上,针对领航轰炸仿真的特点,根据牛顿第二运动定律和几何学等,给出了炸弹在空中运动时空气阻力加速度的仿真算法,重点讨论了速度函数与炸弹速度和空气阻力加速度的关系、阻力系数与马赫数的关系。利用这个仿真算法,对某型轰炸机领航轰炸模拟器进行了软件编程和调试,实际应用表明,该算法的解算精度高、计算的弹着点准确。 展开更多
关键词 空气阻力加速度 航空炸弹 仿真算法
在线阅读 下载PDF
基于FPGA的高精度科学计算加速器研究 被引量:10
4
作者 雷元武 窦勇 郭松 《计算机学报》 EI CSCD 北大核心 2012年第1期112-122,共11页
探索了FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基... 探索了FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基于全展开方法的全流水四精度浮点乘累加单元(QPMAC):提出两级存储策略精确存储乘累加和;采用保留进位累加策略减少定点加法器位宽、简化进位处理、优化关键路径;引入累加和划分策略,实现流水吞吐率.最后,在XC5VLX330FPGA芯片上设计一个LU分解和MGS-QR分解加速器原型来验证QPMAC的性能.实验结果表明,与运行在Intel四核处理器上的基于OpenMP的并行算法相比,集成4个QP-MAC单元的加速器能获得42倍到97倍的性能提升,并且能获得更高结果精度和更低能量消耗. 展开更多
关键词 四精度浮点算术 LU分解 MGS-QR分解 FPGA 硬件加速器 E量级计算
在线阅读 下载PDF
实现基于FPGA的硬件算法加速器 被引量:2
5
作者 叶淑群 陈鸿鹏 梁士坤 《宝鸡文理学院学报(自然科学版)》 CAS 2006年第2期154-155,168,共3页
目的通过具体的方法和示例,说明使用FPGA来实现硬件算法加速是一种较好的方法。方法通过采用FPGA实现CRC算法的硬件加速器与采用传统的软件优化相比较,说明FPGA的优越性。结果基于FPGA的硬件算法加速器,既可提高系统的计算能力,也可节... 目的通过具体的方法和示例,说明使用FPGA来实现硬件算法加速是一种较好的方法。方法通过采用FPGA实现CRC算法的硬件加速器与采用传统的软件优化相比较,说明FPGA的优越性。结果基于FPGA的硬件算法加速器,既可提高系统的计算能力,也可节约成本,缩小系统体积。结论根据目标系统的功能需求,使用FPGA来实现硬件算法加速是一种有效、简便、经济的方法。 展开更多
关键词 硬件算法加速器 FPGA处理器 CRC外围电路
在线阅读 下载PDF
一种相场法微观组织模拟加速算法的研究与实现 被引量:1
6
作者 朱昌盛 冯力 +1 位作者 王智平 肖荣振 《热加工工艺》 CSCD 北大核心 2008年第15期6-9,共4页
针对相场法微观组织模拟计算量大的特点,设计了基于动态计算区域的加速算法,该算法可大大减少计算时间,降低计算模拟对计算机硬件的依赖性,加速效果明显。使用该算法成功实现了二元合金枝晶生长过程,计算结果表明,该算法精确度合理,计... 针对相场法微观组织模拟计算量大的特点,设计了基于动态计算区域的加速算法,该算法可大大减少计算时间,降低计算模拟对计算机硬件的依赖性,加速效果明显。使用该算法成功实现了二元合金枝晶生长过程,计算结果表明,该算法精确度合理,计算效率高。 展开更多
关键词 相场法 加速算法 微观组织 数值模拟
在线阅读 下载PDF
基于算术傅里叶变换的滤波反投影算法的滤波过程的加速 被引量:1
7
作者 乔志伟 魏学业 韩焱 《计量学报》 CSCD 北大核心 2010年第5期385-389,共5页
滤波反投影算法是解析法图像重建的经典算法,其加速方法的研究是目前研究的热点之一。利用算术傅里叶变换和分段卷积的组合可实现滤波加速的方法:首先将斜变滤波器的单位冲激响应分为两段,然后每一段与投影信号采用算术傅里叶变换的... 滤波反投影算法是解析法图像重建的经典算法,其加速方法的研究是目前研究的热点之一。利用算术傅里叶变换和分段卷积的组合可实现滤波加速的方法:首先将斜变滤波器的单位冲激响应分为两段,然后每一段与投影信号采用算术傅里叶变换的方法间接实现线性卷积,最后利用重叠相加法求得滤波投影。实验表明,此方法可以有效地提高滤波反投影算法的运算速度,可比直接卷积的运算速度快390倍,比采用快速傅里叶变换方法的速度快约30%,是一种有效的加速方法。 展开更多
关键词 计量学 图像重建 加速 滤波反投影 算术傅里叶变换
在线阅读 下载PDF
多场协同求解的预测-跳跃加速算法 被引量:1
8
作者 宋少云 李世其 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第8期85-87,共3页
阐述了多场协同求解中的一种加速算法.该算法计算一定数目的启动步以后,用分区预测的方式得到下一时间步的耦合节点值,并同时启动仿真线和预测线,在仿真线结束后,使用分层抽样算法对预测的结果进行判断,从而决定仿真过程的跳跃.阐述了... 阐述了多场协同求解中的一种加速算法.该算法计算一定数目的启动步以后,用分区预测的方式得到下一时间步的耦合节点值,并同时启动仿真线和预测线,在仿真线结束后,使用分层抽样算法对预测的结果进行判断,从而决定仿真过程的跳跃.阐述了该算法的基本步骤,算法中涉及到3个关键技术:节点分区算法、分区预测算法和分层抽样算法,最后用一个感应加热的算例进行验证,证明本算法高效而且精确. 展开更多
关键词 多场耦合 协同求解 预测-跳跃加速算法 仿真 分区
原文传递
强散射介质中子输运计算的角度相关附加再平衡加速算法 被引量:1
9
作者 巨海涛 吴宏春 《原子能科学技术》 EI CAS CSCD 北大核心 2009年第1期56-61,共6页
利用最小二乘有限元离散坐标方法,对一阶中子输运方程进行离散求解,给出了基于非结构网格的角度相关附加再平衡加速算法,采用附加修正量的办法达到再平衡的原理加速计算过程,同时也给出了其外推算法。将算法应用到强散射介质中子输... 利用最小二乘有限元离散坐标方法,对一阶中子输运方程进行离散求解,给出了基于非结构网格的角度相关附加再平衡加速算法,采用附加修正量的办法达到再平衡的原理加速计算过程,同时也给出了其外推算法。将算法应用到强散射介质中子输运方程的计算中,一些基准问题的数值结果表明,计算速度可加速到原来的1.5~2倍。 展开更多
关键词 角度相关附加再平衡 中子输运 强散射 加速算法
在线阅读 下载PDF
非结构网格中子输运方程角度相关再平衡加速算法
10
作者 巨海涛 吴宏春 《核动力工程》 EI CAS CSCD 北大核心 2008年第5期33-37,42,共6页
利用最小二乘有限元离散纵标方法,对一阶中子输运方程进行离散求解,给出了基于非结构网格的角度相关再平衡加速算法及其外推算法。基准问题的计算结果表明,求解问题的计算时间可减少到原来的34%~50%,对强散射问题也同样有效。
关键词 角度相关再平衡 中子输运 非结构网格 加速算法
在线阅读 下载PDF
一个并行计算多项式全部零点的圆盘迭代法
11
作者 孙方裕 《浙江大学学报(理学版)》 CAS CSCD 2000年第4期355-360,共6页
运用加速技巧 ,提出了求解复多项式全部零点的圆盘算术法 ,考虑了其收敛定理和收敛条件 ,使收敛价提高到 7阶 ,而计算工作量增加不多 .
关键词 多项式 零点 收敛阶 圆盘迭代法 并行计算
在线阅读 下载PDF
基于区间泰勒展开的不确定性潮流分析 被引量:33
12
作者 廖小兵 刘开培 +2 位作者 张亚超 张志轩 王坤 《电工技术学报》 EI CSCD 北大核心 2018年第4期750-758,共9页
区间算法已经在电力系统不确定性潮流计算中得到了成功应用。然而,迭代法类的区间潮流计算方法由于将区间运算嵌入到了牛顿迭代过程中,使得区间潮流计算过程复杂、计算量大,为此提出基于区间泰勒展开的不确定性潮流计算方法。该方法在... 区间算法已经在电力系统不确定性潮流计算中得到了成功应用。然而,迭代法类的区间潮流计算方法由于将区间运算嵌入到了牛顿迭代过程中,使得区间潮流计算过程复杂、计算量大,为此提出基于区间泰勒展开的不确定性潮流计算方法。该方法在建立含区间变量潮流计算数学模型的基础上,利用区间泰勒展开将采用直角坐标系的区间潮流方程求解问题等价转化为三个确定性的代数方程组求解。算例测试结果表明了所提算法在计算精度上高于区间迭代法,与区间迭代法和蒙特卡洛法相比,可以获得良好的加速效果。 展开更多
关键词 区间算法 不确定性 区间潮流 区间泰勒展开 加速效果
在线阅读 下载PDF
三维波动方程正演的三级并行加速 被引量:8
13
作者 唐佳 王凡 刘福烈 《石油地球物理勘探》 EI CSCD 北大核心 2016年第5期1049-1054,840,共6页
在常规并行方案的基础上,继续挖掘CPU计算潜力,从CPU指令级优化入手,借用CPU的矢量运算单元(VALU)和SSE指令集,实现了在一个指令周期内并行完成四个浮点数据运算,得到以下认识:1对有限差分类方法的波动方程正演而言,使用SSE指令集可以... 在常规并行方案的基础上,继续挖掘CPU计算潜力,从CPU指令级优化入手,借用CPU的矢量运算单元(VALU)和SSE指令集,实现了在一个指令周期内并行完成四个浮点数据运算,得到以下认识:1对有限差分类方法的波动方程正演而言,使用SSE指令集可以取得较好的加速效果,能够实现CPU的二次加速;2引入SSE后的加速比会随着正演模型数据量的增大而缓慢增大,但因其一次最多完成4个浮点型数据运算,理论加速比最大不会超过4;3SSE加速不需要额外增加硬件配置就可实现计算效率提升,加速成本低,有很广泛的适用性;4单机执行三级并行能够获得最佳的执行效率,多机间执行三级并行效率与机间数据传输网络速度有关。通过数值模拟实验发现,新的并行方案较常规并行方案在运算速度上有大幅提升,获得了明显的加速效果。 展开更多
关键词 三维波动方程正演模拟 并行计算 VALU加速 SSE指令集
在线阅读 下载PDF
高性能子字并行运算单元的设计与实现 被引量:3
14
作者 董冕 吴丹 +3 位作者 饶金理 黄威 戴葵 邹雪城 《计算机工程》 CAS CSCD 2012年第16期249-252,共4页
通过硬件共享的方式实现一套高性能子字并行运算单元,运算单元采用流水线设计,可以一个周期进行1个64-bit、2个32-bit、4个16-bit或8个8-bit定点运算,1个双精度或2个单精度浮点运算。运算单元采用Verilog HDL设计,在0.18μm标准CMOS工... 通过硬件共享的方式实现一套高性能子字并行运算单元,运算单元采用流水线设计,可以一个周期进行1个64-bit、2个32-bit、4个16-bit或8个8-bit定点运算,1个双精度或2个单精度浮点运算。运算单元采用Verilog HDL设计,在0.18μm标准CMOS工艺库下实现,并针对实际多媒体应用程序基于ESCA系统进行性能评测。实验结果表明,该运算单元可以在硬件开销和性能上获得较好的平衡。 展开更多
关键词 多媒体技术 子字并行 硬件共享 运算单元 ESCA系统 协处理器
在线阅读 下载PDF
抗目标大机动的制导指令校正算法研究 被引量:4
15
作者 候冰 张金鹏 +1 位作者 曹有亮 赵阳 《航空兵器》 北大核心 2018年第2期29-33,共5页
针对寻的末制导中对抗大机动目标的情况,同时考虑导弹制导系统动力学及重力影响,提出了一种新的制导算法,即在制导回路中加入指令校正环节。该制导算法通过引入校正环节,并在制导律中引入导弹加速度,可以弥补弹体动态响应引起的延迟,减... 针对寻的末制导中对抗大机动目标的情况,同时考虑导弹制导系统动力学及重力影响,提出了一种新的制导算法,即在制导回路中加入指令校正环节。该制导算法通过引入校正环节,并在制导律中引入导弹加速度,可以弥补弹体动态响应引起的延迟,减小脱靶量,在一定程度上提升系统快速性,提高制导控制系统对抗目标大机动的能力。 展开更多
关键词 目标机动 动力学滞后 制导律 导弹加速度 校正算法
在线阅读 下载PDF
用 TMS320C5X 评价模块实现的 PC 运算加速器 被引量:1
16
作者 张颖璐 张秀彬 +1 位作者 马殿光 王宇 《上海交通大学学报》 EI CAS CSCD 北大核心 1998年第6期110-114,共5页
在分析TMS320C5X评价模块基本性能的基础上,提出了一种利用该评价模块(EVM)实现PC运算加速器的思想和方法.以矩阵运算为例演示了运算加速的过程:将两个矩阵从PC机传送到EVM;EVM进行高速矩阵相乘,并将结果... 在分析TMS320C5X评价模块基本性能的基础上,提出了一种利用该评价模块(EVM)实现PC运算加速器的思想和方法.以矩阵运算为例演示了运算加速的过程:将两个矩阵从PC机传送到EVM;EVM进行高速矩阵相乘,并将结果送回PC机.实验结果显示在高维数矩阵运算中,采用本文的方法可使信息处理的时间大为缩短,EVM所需时间仅为原PC机的1/10~1/5,对于处理大容量图形信息过程具有较高的应用价值.同时,对微机中央处理器的设计也具有参考价值. 展开更多
关键词 运算加速器 数字信号处理器 评价模块 计算机
在线阅读 下载PDF
静态灰度图像中的人脸检测及其快速算法概述
17
作者 邵平 《玉林师范学院学报》 2005年第5期23-28,共6页
人脸检测是当前计算机视觉和图像理解领域关注的重要研究课题.在灰度图像中检测人脸比在彩色图像中检测难度更大.该文从静态灰度图像的检测策略和加速算法两个方面概述了当前的研究状况,讨论了各自的优缺点,提出了应在保证适合具体应用... 人脸检测是当前计算机视觉和图像理解领域关注的重要研究课题.在灰度图像中检测人脸比在彩色图像中检测难度更大.该文从静态灰度图像的检测策略和加速算法两个方面概述了当前的研究状况,讨论了各自的优缺点,提出了应在保证适合具体应用场合的检测精度前提下,致力于提高人脸检测的速度. 展开更多
关键词 灰度图像 人脸检测 快速算法 检测策略 概述
在线阅读 下载PDF
多策略融合算术优化算法及其工程优化 被引量:20
18
作者 兰周新 何庆 《计算机应用研究》 CSCD 北大核心 2022年第3期758-763,共6页
针对算术优化算法(AOA)在搜索过程中容易陷入局部极值点、收敛速度慢以及求解精度低等缺陷,提出一种多策略集成的算术优化算法(MFAOA)。首先,采用Sobol序列初始化AOA种群,增加初始个体的多样性,为算法全局寻优奠定基础;然后,重构数学优... 针对算术优化算法(AOA)在搜索过程中容易陷入局部极值点、收敛速度慢以及求解精度低等缺陷,提出一种多策略集成的算术优化算法(MFAOA)。首先,采用Sobol序列初始化AOA种群,增加初始个体的多样性,为算法全局寻优奠定基础;然后,重构数学优化器加速函数(MOA),权衡全局搜索与局部开发过程的比重;最后,利用混沌精英突变策略,改善算法过于依赖当前最优解的问题,增强算法跳出局部极值的能力。选用12个基准函数和部分CEC2014测试函数进行实验仿真,结果表明MFAOA在求解精度和收敛速度上均有明显的提升;另外,通过对两个工程实例进行优化,验证了MFAOA在工程优化问题上的可行性。 展开更多
关键词 算术优化算法 Sobol序列 数学优化器加速函数 混沌精英突变 工程优化
在线阅读 下载PDF
基于小波分析的有源滤波器技术研究 被引量:1
19
作者 郭晓玲 程建 《核电子学与探测技术》 CAS CSCD 北大核心 2014年第3期285-289,共5页
现代先进的高能加速器对束流的稳定性提出了越来越高的要求,而磁铁电源输出电流的稳定性是直接影响束流品质的主要因素之一。基于小波分析的有源滤波器针对北京正负电子对撞机(BEPC II)中部分直流磁铁电源输出电流纹波过大的问题,利用... 现代先进的高能加速器对束流的稳定性提出了越来越高的要求,而磁铁电源输出电流的稳定性是直接影响束流品质的主要因素之一。基于小波分析的有源滤波器针对北京正负电子对撞机(BEPC II)中部分直流磁铁电源输出电流纹波过大的问题,利用小波分析对电源输出电流数据进行谐波分析,得出电源输出电流纹波中各个频段内谐波的信息,并根据该信息输出幅值相等、方向相反的纹波电流,用于抵消磁铁电源输出电流中的纹波,达到降低纹波含量、提高电源输出质量的目的。利用Matlab对该有源滤波器的工作进行仿真,并在小电源样机上对仿真结果进行实验验证。 展开更多
关键词 有源滤波器 小波分析 加速器磁铁电源 MALLAT算法
在线阅读 下载PDF
水平线遮挡在林业可视化中的应用 被引量:1
20
作者 梁韬 淮永建 《微计算机信息》 北大核心 2008年第4期224-225,231,共3页
水平线遮挡主要应用在不透明的遮挡物与地面相连,可以将遮挡物连同地面作为一个高度场看待的场景,例如城市中的建筑物场景。森林场景中的植株有些特点与城市景观中的建筑物场景类似。如植株均与地面相连,透明性差,主干和枝叶遮挡后面的... 水平线遮挡主要应用在不透明的遮挡物与地面相连,可以将遮挡物连同地面作为一个高度场看待的场景,例如城市中的建筑物场景。森林场景中的植株有些特点与城市景观中的建筑物场景类似。如植株均与地面相连,透明性差,主干和枝叶遮挡后面的植株等等。因此可以把森林场景中的植株视为一个高度场。本文简要介绍森林场景可视化的主要方法,将水平线遮挡应用到森林场景中,来加速森林场景的绘制,增强场景的实时性和交互性。 展开更多
关键词 加速绘制算法 水平线遮挡 虚拟水平线
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部