期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
嵌入式GPU的FPGA原型验证平台设计及实现 被引量:2
1
作者 赵强 郭亮 《航空计算技术》 2020年第1期76-79,共4页
GPU是一种设计复杂度非常高的专用功能芯片,传统的FPGA验证平台无法实施GPU芯片的原型验证。设计和实现了一种FPGA原型验证平台,具有逻辑容量大、复用率高、易移植、FPGA之间信号传输稳定可靠等特征。一方面,FPGA原型验证平台能够实现... GPU是一种设计复杂度非常高的专用功能芯片,传统的FPGA验证平台无法实施GPU芯片的原型验证。设计和实现了一种FPGA原型验证平台,具有逻辑容量大、复用率高、易移植、FPGA之间信号传输稳定可靠等特征。一方面,FPGA原型验证平台能够实现嵌入式GPU芯片快速、充分验证,从而加快项目进度,为流片成功提供有力支撑;另一方面,平台的设计及实现也为其他超大规模、高复杂度的数字集成电路的FPGA原型验证平台的开发提供了参考。 展开更多
关键词 图形处理器 现场可编程门阵列 LVDS引脚复用 原型验证平台
在线阅读 下载PDF
FPGA与GPU并行计算分析——以Kirchhoff叠前时间偏移为例 被引量:7
2
作者 张锦涛 赵惊涛 王真理 《地球物理学进展》 CSCD 北大核心 2013年第3期1464-1471,共8页
高性能计算(high performance computing)是地震数据处理领域一个重要研究课题.目前的高性能计算大多是利用图形处理器(GPU)强大并行处理能力,以GPU/CPU协同并行计算构架为基础实现有关算法.本文讨论了利用CUDA和Impulse C-to-FPGA工具... 高性能计算(high performance computing)是地震数据处理领域一个重要研究课题.目前的高性能计算大多是利用图形处理器(GPU)强大并行处理能力,以GPU/CPU协同并行计算构架为基础实现有关算法.本文讨论了利用CUDA和Impulse C-to-FPGA工具分别在GPU(图形处理器)和FPGA(可编程逻辑门阵列)平台上并行实现Kirchhoff叠前时间偏移算法.处理结果表明,利用GPU加速Kirchhoff叠前时间偏移处理得到了14倍的单核加速比,利用FPGA加速Kirchhoff叠前时间偏移处理得到了9.5倍的单核加速比. 展开更多
关键词 KIRCHHOFF叠前时间偏移 gpu CUDA fpga ImpulseC
在线阅读 下载PDF
基于PCIe的高性能FPGA-GPU-CPU异构编程架构 被引量:7
3
作者 孙兆鹏 周宽久 《计算机工程与科学》 CSCD 北大核心 2021年第4期641-651,共11页
异构计算作为一种特殊的并行计算方式,能根据计算任务的特点发挥不同计算资源的能力,在提高服务器计算性能、能效比和实时性方面有极大优势,但目前异构计算环境存在编程复杂、可信性无法保证的问题。针对以上问题,提出了一个基于状态变... 异构计算作为一种特殊的并行计算方式,能根据计算任务的特点发挥不同计算资源的能力,在提高服务器计算性能、能效比和实时性方面有极大优势,但目前异构计算环境存在编程复杂、可信性无法保证的问题。针对以上问题,提出了一个基于状态变迁矩阵(STM)的编程框架,可以集成GPU和FPGA的资源。通过状态迁移矩阵对CUDA和Vivado的应用程序接口(API)进行集成,自动生成异构计算所需要的标准C代码。通过PCIe总线连接GPU和FPGA设备,从而可以在这些异构计算单元之间进行数据传输,中间无需使用系统CPU内存。并且通过GPUDirect RDMA实现了FPGA作为主控器的PCIe通信,突破了GPU作为主控器的PCIe通信当中读取操作的短板。实验表明,相比共享内存的通信方式,FPGA作为主控器的PCIe通信方式的通信效率提高了1.4倍,实现的数据速率接近理论带宽的最大值。 展开更多
关键词 状态变迁矩阵 异构计算 fpga gpu PCIE
在线阅读 下载PDF
字符串匹配算法的实现:CPU vs.GPU vs.FPGA 被引量:1
4
作者 李璋 杜慧敏 王涌钢 《电子科技》 2014年第12期5-8,共4页
针对字符串匹配算法在各平台实现的性能问题,将算法在CPU、GPU及FPGA上做了测试对比。GPU具有计算单元多的特点,使得GPU对计算密集型应用有较大的效率提升;而FPGA具有级强的灵活性、可编程性及大量的逻辑运算单元,在处理字符串匹配时的... 针对字符串匹配算法在各平台实现的性能问题,将算法在CPU、GPU及FPGA上做了测试对比。GPU具有计算单元多的特点,使得GPU对计算密集型应用有较大的效率提升;而FPGA具有级强的灵活性、可编程性及大量的逻辑运算单元,在处理字符串匹配时的处理速度快。通过对3种实现方式在Snort规则库下做的分析,其结果表明,FPGA的处理速度最快,相比GPU的处理速度提升了10倍。而CPU的串行处理速度最慢,且FPGA的资源消耗最多,GPU次之,CPU的资源消耗最少,且实现最简单。 展开更多
关键词 字符串匹配 gpu fpga CUDA 并行处理
在线阅读 下载PDF
基于FPGA+GPU的图像采集处理系统设计 被引量:3
5
作者 蒋俊伦 丰大强 +3 位作者 徐新瑞 程坤 常中坤 王桢 《计算机测量与控制》 2023年第8期273-279,305,共8页
随着嵌入式图像处理系统的快速发展,对于前端图像采集模块的需求越来越高;图像采集的速度、分辨率、可靠性以及集成度对后续设计的准确度由极大的影响;通过对数字图像采集系统进行研究,设计出了基于FPGA和GPU架构的图像采集处理系统,重... 随着嵌入式图像处理系统的快速发展,对于前端图像采集模块的需求越来越高;图像采集的速度、分辨率、可靠性以及集成度对后续设计的准确度由极大的影响;通过对数字图像采集系统进行研究,设计出了基于FPGA和GPU架构的图像采集处理系统,重点研究了图像采集处理系统的硬件设计过程和软件设计过程;在基于FPGA+GPU的图像采集处理系统中,让具有强大运算处理能力的GPU专注于数据存储、用户交互以及后续的图像处理;系统中,FPGA则负责图像的采集、外设控制、任务调度;GPU与FPGA之间通过高速PCIE总线进行通信,分别设计编写基于Linux系统的驱动程序和FPGA端PCIE程序;实验结果表明,所设计基于FPGA+GPU的图像采集处理系统可实现437.5 Mbps的实时图像采集存储速度,传输过程实时稳定,数据传输完整。 展开更多
关键词 fpga gpu 图像采集 数据存储 任务调度
在线阅读 下载PDF
集成萤火虫2号GPU的片上系统设计和实现 被引量:3
6
作者 杜慧敏 王涌钢 李涛 《西安邮电大学学报》 2015年第3期39-43,共5页
设计一个用于图形处理的片上系统。该系统将LEON3处理器和萤火虫2号图形处理器相结合,通过AHB总线互联而成。主模块LEON3处理器通过访问分配给各个从模块地址空间,实现对从模块的控制和主从模块之间的数据通信。以OpenVX内核函数为测试... 设计一个用于图形处理的片上系统。该系统将LEON3处理器和萤火虫2号图形处理器相结合,通过AHB总线互联而成。主模块LEON3处理器通过访问分配给各个从模块地址空间,实现对从模块的控制和主从模块之间的数据通信。以OpenVX内核函数为测试用例,进行功能验证和现场可编程逻辑阵列的验证。结果表明,该系统能够正确读写数据,快速实现图像处理。 展开更多
关键词 图形图像处理器 处理器 片上系统 现场可编程逻辑阵列 OpenVX
在线阅读 下载PDF
基于GPU的车载全景视觉系统 被引量:2
7
作者 郑文玲 钱宏文 +1 位作者 卢思翰 倪文龙 《计算机系统应用》 2021年第4期99-103,共5页
针对大、中型车辆在行驶、泊车过程中存在的视觉盲区以及多路视频全景拼接难以实时等工程化问题,本文设计出一种基于FPGA和GPU平台的多路相机安全驾驶辅助系统.FPGA实现图像数据采集、参数传递等预处理,在GPU上实现拼接算法的并行加速.... 针对大、中型车辆在行驶、泊车过程中存在的视觉盲区以及多路视频全景拼接难以实时等工程化问题,本文设计出一种基于FPGA和GPU平台的多路相机安全驾驶辅助系统.FPGA实现图像数据采集、参数传递等预处理,在GPU上实现拼接算法的并行加速.在算法上优化实现多相机自动化标定,生成融合参数表以获取精确的融合配准关系.实验结果表明,该系统可适应多路鱼眼相机的实时拼接,在TX2上稳定的拼接速度可达到33 fps. 展开更多
关键词 鱼眼相机 fpga 嵌入式gpu 自动化标定 全景拼接
在线阅读 下载PDF
基于非一般类算子融合方法及硬件架构设计
8
作者 王莹 高岚 +3 位作者 张哲 刘昕 武毅雄 张伟功 《电子学报》 北大核心 2025年第9期3299-3309,共11页
针对传统算子融合算法在异构计算系统跨计算单元时的失效性问题,本文提出一种优化后的算子融合策略,并针对新型融合算法进行了硬件设计实现.论文基于传统算子融合算法的设计初衷,在端侧异构计算系统部署深度学习算法时,分析算子融合覆... 针对传统算子融合算法在异构计算系统跨计算单元时的失效性问题,本文提出一种优化后的算子融合策略,并针对新型融合算法进行了硬件设计实现.论文基于传统算子融合算法的设计初衷,在端侧异构计算系统部署深度学习算法时,分析算子融合覆盖率对推理任务计算性能的影响,挖掘跨计算单元算子融合的可能性,设计可以提升算子融合覆盖率的改进算法模型;同时,通过构建以CPU(Central Processing Unit)+GPU(Graphics Processing Unit)+DLA((Deep Learning Accelerator))组成的异构计算平台,为改进后的算子融合策略提供结构更加耦合的多层级存储共享结构.实验结果表明,与优化前的算子融合算法相比,改进后的算子融合策略可以有效提升算子融合覆盖率,部署在Xilinx公司FPGA(Field-Programmable Gate Array)开发板上进行目标检测网络推理实验.结果表明,本文提出的设计方案,针对YOLOX-Nano的推理过程可实现62.67%推理计算性能提升,计算加速比为2.68;针对YOLOv5s的推理过程可实现71.10%推理计算性能提升,计算加速比为3.46. 展开更多
关键词 深度学习 算子融合 卷积神经网络 异构计算 fpga gpu
在线阅读 下载PDF
人工智能器件宇航应用面临的挑战与应对措施 被引量:1
9
作者 李家强 祝名 +6 位作者 刘承溪 张大宇 张松 梁培哲 杨舒文 刘一帆 张磊 《集成电路与嵌入式系统》 2025年第1期18-22,共5页
人工智能器件是提供实现系统功能的微小型化器件,是实现空间环境感知、自主判断、自主任务规划等的硬件载体和基础。此类新型元器件在宇航应用前,仍然面临成熟度、可靠性、抗辐射能力、宇航适用性等诸多挑战。本文从分析人工智能器件国... 人工智能器件是提供实现系统功能的微小型化器件,是实现空间环境感知、自主判断、自主任务规划等的硬件载体和基础。此类新型元器件在宇航应用前,仍然面临成熟度、可靠性、抗辐射能力、宇航适用性等诸多挑战。本文从分析人工智能器件国内外发展现状出发,分析人工智能器件宇航应用面临的挑战与应对措施,给出典型人工智能器件质量保证案例,并归纳和总结后续人工智能器件宇航应用的相关建议。 展开更多
关键词 人工智能器件 宇航应用 gpu fpga+DSP
在线阅读 下载PDF
Application of FPGA in Process Tomography Systems
10
作者 Ling En Hong Yusri Bin Md. Yunos 《Engineering(科研)》 2020年第10期790-809,共20页
This paper will provide some insights on the application of Field Programmable Gate Array (FPGA) in process tomography. The focus of this paper will be to investigate the performance of the technology with respect to ... This paper will provide some insights on the application of Field Programmable Gate Array (FPGA) in process tomography. The focus of this paper will be to investigate the performance of the technology with respect to various tomography systems and comparison to other similar technologies including the Application Specific Integrated Circuit (ASIC), Graphics Processing Unit (GPU) and the microcontroller. Fundamentally, the FPGA is primarily used in the Data Acquisition System (DAQ) due to its better performance and better trade-off as compared to competitor technologies. However, the drawback of using FPGA is that it is relatively more expensive. 展开更多
关键词 Data Acquisition System (DAQ) Field Programmable Gate Array (fpga) Application Specific Integrated Circuit (ASIC) Graphics Processing Unit (gpu) MICROCONTROLLER
在线阅读 下载PDF
基于异构计算的大规模风电场精细化高效仿真技术
11
作者 李冰 赵浩然 +3 位作者 江艺宝 孟铃涵 魏小钊 Kai STRUNZ 《电力系统自动化》 北大核心 2025年第24期138-149,共12页
考虑“风能-机械能-电能”全过程耦合的风电场精细化高效仿真将面临仿真对象多、仿真规模大、仿真步长小的挑战。为此,基于中央处理器(CPU)、图形处理器(GPU)、现场可编程门阵列(FPGA)异构计算芯片设计仿真平台架构,以实现仿真对象与硬... 考虑“风能-机械能-电能”全过程耦合的风电场精细化高效仿真将面临仿真对象多、仿真规模大、仿真步长小的挑战。为此,基于中央处理器(CPU)、图形处理器(GPU)、现场可编程门阵列(FPGA)异构计算芯片设计仿真平台架构,以实现仿真对象与硬件特性的匹配;其次,在操作系统底层对基于CPU的仿真设备进行实时性改进,以兼顾大规模和小步长仿真需求;最后,针对高效离线仿真需求,基于并行计算技术,设计了高效仿真计算内核和引导式仿真建模软件。基于含40台机组的风电场仿真算例对所提出的仿真技术进行测试。结果表明,所提出的仿真技术在计算效率和实时性方面均能够满足风电场精细化高效仿真需求。 展开更多
关键词 风电场 实时仿真 精细化仿真 异构计算 可编程门阵列(fpga) 图形处理器(gpu)
在线阅读 下载PDF
应用于射电天文的高效实时管道数据流传输与处理技术 被引量:1
12
作者 张萌 张海龙 +6 位作者 王杰 李健 冶鑫晨 王万琼 李嘉 王博群 张亚州 《天文研究与技术》 CSCD 2021年第4期489-503,共15页
针对超宽带及多波束接收系统海量天文信号实时高效传输与处理问题,对基于现场可编程门阵列(Field Programmable Gate Array,FPGA)+图形处理器(Graphics Processing Unit,GPU)的主流终端设备软件系统进行了测试分析。超宽带接收设备要求... 针对超宽带及多波束接收系统海量天文信号实时高效传输与处理问题,对基于现场可编程门阵列(Field Programmable Gate Array,FPGA)+图形处理器(Graphics Processing Unit,GPU)的主流终端设备软件系统进行了测试分析。超宽带接收设备要求终端系统软件能够在更宽带宽、更高时间分辨率和频率分辨率的条件下,实现数据流实时传输与处理。结合大口径射电观测设备未来发展的方向,提出了利用高速并行环形缓冲区实现数据流缓存,基于图形处理器集群实现数据流实时处理,基于BeeGFS实现分布式并行数据存储,模块化构建射电天文信号传输管道软件的设计思路。 展开更多
关键词 数据传输与处理 射电天文 实时 fpga+gpu
在线阅读 下载PDF
基于异构系统的生物序列比对并行处理研究进展 被引量:1
13
作者 朱香元 李仁发 +1 位作者 李肯立 胡忠望 《计算机科学》 CSCD 北大核心 2015年第B11期390-395,399,共7页
序列比对工作属于生物信息学的基础性研究领域。由于它具有应用广泛、计算复杂以及海量数据等特点,加之现在高性能计算的兴起,使得近年来序列比对并行处理技术快速发展。首先介绍了序列比对领域高性能计算的新进展,接着从体系结构特征... 序列比对工作属于生物信息学的基础性研究领域。由于它具有应用广泛、计算复杂以及海量数据等特点,加之现在高性能计算的兴起,使得近年来序列比对并行处理技术快速发展。首先介绍了序列比对领域高性能计算的新进展,接着从体系结构特征入手对其研究进行分类,并对每类方法的实现细节和性能进行分析比较,从中不难看出访存控制、同步、数据交互以及算法可扩展性等问题均为目前基于异构系统的序列比对并行处理研究的关键点。最后,对该领域的未来研究方向进行了展望。 展开更多
关键词 序列比对 并行处理 异构 gpu fpga Cell BE MIC
在线阅读 下载PDF
矿山三维空间数据距离直方图算法优化及加速 被引量:2
14
作者 裴浩 游小荣 牛欣伟 《工矿自动化》 北大核心 2017年第2期55-60,共6页
分析了三维空间数据距离直方图算法的性质及数据结构,提出了基于图形处理器的通用计算方法和基于FPGA的高性能计算方法,基于图形处理器的计算方法可用于实现三维空间数据距离直方图算法的单指令多数据并行优化;基于FPGA的计算方法可实... 分析了三维空间数据距离直方图算法的性质及数据结构,提出了基于图形处理器的通用计算方法和基于FPGA的高性能计算方法,基于图形处理器的计算方法可用于实现三维空间数据距离直方图算法的单指令多数据并行优化;基于FPGA的计算方法可实现算法的硬件分块优化,使算法的硬件结构达到最优匹配。实验结果表明,利用基于图形处理器的计算方法可使算法达到平均18倍的性能加速,基于FPGA的计算方法可使算法达到平均30倍的性能加速,大大提升了算法的数据处理能力。 展开更多
关键词 数字矿山 三维空间数据 大数据 距离直方图算法 优化加速 gpu fpga
在线阅读 下载PDF
一种新型红外信号处理平台的构建及应用 被引量:2
15
作者 何锡君 陈华础 陈晓东 《光电技术应用》 2010年第5期15-19,共5页
随着红外探测技术的高速发展,红外信号的实时处理面临着较大的挑战.在采用多单元与高帧频探测器的红外系统中,当使用较复杂的处理算法时,基于传统架构的信号处理平台已较难满足系统的实时处理要求.通用计算图形处理器(GPGPU)的出现与日... 随着红外探测技术的高速发展,红外信号的实时处理面临着较大的挑战.在采用多单元与高帧频探测器的红外系统中,当使用较复杂的处理算法时,基于传统架构的信号处理平台已较难满足系统的实时处理要求.通用计算图形处理器(GPGPU)的出现与日益成熟为红外实时信号处理提供了良好的平台.根据红外系统中实时信号处理的特点,利用FPGA+CPU+GPU架构构建了一种新型红外信号处理平台,并进行了实际应用.结果表明,该平台能够胜任探测器单元数多、帧频高和算法较复杂的红外系统的实时信号处理任务. 展开更多
关键词 红外 实时 信号处理 gpu fpga
在线阅读 下载PDF
深度学习计算平台发展综述 被引量:5
16
作者 郭乔进 胡杰 +1 位作者 宫世杰 梁中岩 《信息化研究》 2019年第3期1-7,25,共8页
深度学习作为机器学习中延伸出来的一个领域,被应用在图像处理、计算机视觉、自然语言处理及语音识别等领域。由于深度神经网络结构复杂、计算规模大,利用传统CPU进行训练和推断效率低下,不论从速度还是从能耗比角度来考虑,CPU都不是合... 深度学习作为机器学习中延伸出来的一个领域,被应用在图像处理、计算机视觉、自然语言处理及语音识别等领域。由于深度神经网络结构复杂、计算规模大,利用传统CPU进行训练和推断效率低下,不论从速度还是从能耗比角度来考虑,CPU都不是合适的深度学习计算平台。因此,近年来越来越多的厂家推出了各自的深度学习计算平台,包括基于GPU.FPGA和SoC的相关产品,并基于相关平台推出了配套软件和相关应用。文章对目前市场上常见的深度学习计算平台进行了综述,并对相关平台的应用案例进行了简单介绍。 展开更多
关键词 深度学习 gpu fpga 训练 推断
在线阅读 下载PDF
图形处理器片段处理单元的设计与实现 被引量:5
17
作者 田泽 张淑 +3 位作者 张骏 许宏杰 黎小玉 郭蒙 《计算机应用》 CSCD 北大核心 2014年第A02期357-360,共4页
针对图形处理器三维引擎中对图形的后期处理需求,实现片段写入帧缓冲区前的测试、混合、逻辑操作、累积、清除和屏蔽等关键功能。分析并提取了Open GL核心库中的片段处理相关函数,确定了片段处理单元要实现的功能;合理安排多个片段处理... 针对图形处理器三维引擎中对图形的后期处理需求,实现片段写入帧缓冲区前的测试、混合、逻辑操作、累积、清除和屏蔽等关键功能。分析并提取了Open GL核心库中的片段处理相关函数,确定了片段处理单元要实现的功能;合理安排多个片段处理功能的执行顺序,设计了基于流水线的片段处理单元结构;采用Verilog HDL对电路进行描述,采用Cadence NC-Verilog仿真工具进行虚拟验证,采用Xilinx的ISE工具进行综合,并在Xilinx Virtex6XC6VLX760 FPGA上进行原型验证,电路工作频率可以达到180 MHz,测试功能正确。在SMIC 65 nm CMOS工艺下,采用Synopsys Design-Compiler对设计进行综合,电路工作频率达到300 MHz,满足设计需求。 展开更多
关键词 片段处理 图形处理器 现场可编程门阵列 开放图形语言
在线阅读 下载PDF
高性能计算的发展现状及趋势 被引量:50
18
作者 张军华 臧胜涛 +1 位作者 单联瑜 石林光 《石油地球物理勘探》 EI CSCD 北大核心 2010年第6期918-925,共8页
地震勘探是高性能计算最重要的应用领域之一。本文通过跟踪国内外高性能计算机的发展动态,分析地球物理勘探领域对高性能计算的需求和应用现状,展望高性能计算的发展趋势,得出了以下结论和认识:高性能计算机今后发展趋势是向多核方向发... 地震勘探是高性能计算最重要的应用领域之一。本文通过跟踪国内外高性能计算机的发展动态,分析地球物理勘探领域对高性能计算的需求和应用现状,展望高性能计算的发展趋势,得出了以下结论和认识:高性能计算机今后发展趋势是向多核方向发展;②目前地震勘探对高性能计算的直接需求是叠前深度偏移、叠前反演和全波形反演,以及单点高密度勘探技术;③GPU技术具有广阔的应用前景,尤其是新建的CUDA架构完善了软件开发环境;④基于FPGAs(Field Programmable Gate Arrays,现场可编程门阵列)的可重构技术,既有硬件的计算性能,又有软件的灵活性,采用此项技术可以大大提高计算速度;⑤受功耗、传统集成电路技术等制约,单CPU性能提高有很大的局限性,开发新材料、完善计算机封装结构成为提高计算性能的新途径,光电二极管(APD)硅光子器件、内存+CPU的MCP封装结构,发展前景看好;⑥云计算(Cloud Computing)是在分布计算、并行计算、网格计算等基础上发展起来的一种全新的数据密集型超级计算模式,该技术将在海量数据的高性能计算方面有很好的应用前景;⑦计算性能的提高依赖于软硬件一体化整体发展,目前硬件技术发展日新月异,但软件开发及应用相对滞后,大力发展软件产业是解决以上问题的必由之路。 展开更多
关键词 高性能计算 gpu fpgaS 云计算 高密度勘探 叠前深度偏移 全波形反演
在线阅读 下载PDF
面向异构体系结构的任务流模型
19
作者 张丹 赵荣彩 +1 位作者 韩林 瞿进 《信息工程大学学报》 2012年第3期358-364,375,共8页
异构体系结构是当前高性能计算研究中的一个重要发展方向,体系结构的异构不仅为高性能计算系统性能的提升带来了发展契机,也为研究人员们提出了一系列诸如编程屏障、易用性差、使用门槛较高等难题。提出了一种面向异构体系结构的任务流... 异构体系结构是当前高性能计算研究中的一个重要发展方向,体系结构的异构不仅为高性能计算系统性能的提升带来了发展契机,也为研究人员们提出了一系列诸如编程屏障、易用性差、使用门槛较高等难题。提出了一种面向异构体系结构的任务流模型和基于任务流模型的任务流化工具,能够将异构系统中计算部件计算特性和应用程序执行特征实现较为合理的映射关系,充分发挥异构计算部件的计算能力,从而达到提升应用程序整体执行性能的目标。 展开更多
关键词 异构:fpga:gpu:任务 任务流
在线阅读 下载PDF
面向新型处理器的数据密集型计算 被引量:4
20
作者 王鹤澎 王宏志 +3 位作者 李佳宁 孔欣欣 李建中 高宏 《软件学报》 EI CSCD 北大核心 2016年第8期2048-2067,共20页
近年来,随着数据量的不断增大,数据密集型计算任务变得日益繁重.如何能够快速、高效地实现在大规模数据集上的计算,已成为数据密集型计算的主要研究方向.最近几年,研究人员利用新型的硬件处理器对数据密集型计算进行加速处理,并针对不... 近年来,随着数据量的不断增大,数据密集型计算任务变得日益繁重.如何能够快速、高效地实现在大规模数据集上的计算,已成为数据密集型计算的主要研究方向.最近几年,研究人员利用新型的硬件处理器对数据密集型计算进行加速处理,并针对不同新型处理器的特点,设计了不同形式的加速处理算法.主要对新型硬件处理器基于数据密集型计算的研究进行了综述.首先概述了新型硬件处理器的特点;然后,分别对新型处理器FPGA和GPU等硬件进行性能分析,并分析了每种处理器对数据密集型计算的效果;最后提出了进一步的研究方向. 展开更多
关键词 fpga gpu CPU 数据密集型计算
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部