期刊文献+
共找到196篇文章
< 1 2 10 >
每页显示 20 50 100
GPU-CPU协同航空影像快速正射纠正方法 被引量:8
1
作者 李朋龙 邓非 +2 位作者 何江 陈朝霞 杨丽颖 《测绘地理信息》 2016年第2期44-47,共4页
为满足应急测绘中大序列航空影像快速正射纠正的要求,提出了一种GPU-CPU协同快速正射纠正方法。实验结果表明,通过对GPU程序进行配置选择优化和存储层次性优化,该方法较传统的基于CPU正射纠正方法,其平均加速比达到52倍。
关键词 gpu-cpu协同 CUDA 航空影像 正射纠正
原文传递
基于有效区域约束的GPU-CPU协同影像快拼方法 被引量:4
2
作者 李朋龙 邓非 +3 位作者 李海亮 李勇 何江 王岚 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2018年第2期304-310,共7页
提出了一种以有效区域约束的Voronoi图为拼接线网络,利用GPU-CPU协同处理航空影像快速拼接方法。首先,基于成像有效区域生成有效区域约束的Voronoi图拼接线网络,解决了传统Voronoi图拼接线网络在低重叠度条件下拼接后影像局部区域不被... 提出了一种以有效区域约束的Voronoi图为拼接线网络,利用GPU-CPU协同处理航空影像快速拼接方法。首先,基于成像有效区域生成有效区域约束的Voronoi图拼接线网络,解决了传统Voronoi图拼接线网络在低重叠度条件下拼接后影像局部区域不被覆盖的问题,然后利用GPU-CPU协同处理将正射纠正嵌入到影像拼接的过程中,并且只对每张影像的有效区域进行纠正,再通过选择配置优化和存储层次性优化进一步提高拼接效率。实验表明,对237张高分辨率航空影像进行快速正射纠正和拼接,本文算法较传统先纠正再拼接的方法效率提高近20倍,同时保证很高的拼接精度,可以满足应急测绘要求。 展开更多
关键词 航空影像 正射纠正 影像拼接 有效区域约束的Voronoi图 gpu-cpu协同处理
原文传递
论GPU-CPU协作计算模式的应用研究 被引量:2
3
作者 李超 《电子商务》 2010年第11期54-54,共1页
根据GPU计算特点和任务划分的特点,提出一种类似主从模型的GPU-CPU协作计算的处理模式,本文对GPU-CPU协作计算模式的特点进行介绍,再对GPU-CPU协作计算模式的应用进行研究,最后对GPU-CPU协作计算模式的发展展望。
关键词 gpu-cpu协作 计算模式 特点 应用研究
在线阅读 下载PDF
基于GPU-CPU协同的遥感影像坐标转换研究与实现
4
作者 侯飞 《测绘与空间地理信息》 2020年第11期29-31,共3页
2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的... 2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的影像坐标转换方法效率较低,且大数据量影像难以转换,鉴于此,本文将GPU-CPU协同处理技术引入到影像坐标转换过程,建立GPU-CPU协同的影像并行转换流程,通过分块处理策略和GPU处理优化加速整个处理过程。经过系统数据实验,本文方法较普通坐标转换方法有极大的效率提升,在国土资源数据2000国家大地坐标系转换工作中得到了良好的推广应用。 展开更多
关键词 gpu-cpu协同 遥感影像 坐标转换 并行计算
在线阅读 下载PDF
一种GPU-CPU异构运算框架加速的实时N-1交流潮流计算方法 被引量:18
5
作者 唐坤杰 董树锋 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2018年第15期4329-4338,共10页
随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中... 随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中设计一种N-1潮流问题的拼接求解方法,将原本多个独立的潮流问题组合为一个。雅可比矩阵的拼接生成采用并行化处理,线性方程组的求解根据规模大小选择直接法或迭代法处理,其中迭代法采用并行化处理。算法整体分为CPU处理部分和GPU处理部分,CPU处理迭代初值的设定、节点导纳矩阵的形成、校验集合的形成、迭代值的修正、收敛性判断等步骤,GPU处理雅可比矩阵的拼接生成等步骤,修正方程组的求解根据其规模选择CPU求解或GPU求解,以达到快速求解的目的。算例表明,所提算法效率和精度高、空间占用小,与传统N-1潮流算法相比具有明显优势,能够满足电网实时N-1潮流计算的需求,具有工程应用价值。 展开更多
关键词 N-1潮流计算 gpu-cpu异构运算架构 并行化 拼接求解 迭代法
原文传递
基于CPU-GPU的超音速流场N-S方程数值模拟
6
作者 卢志伟 张皓茹 +3 位作者 刘锡尧 王亚东 张卓凯 张君安 《中国机械工程》 北大核心 2025年第9期1942-1950,共9页
为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并... 为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并行计算速度明显高于CPU串行计算速度,其加速比随流场网格规模的增大而明显提高。GPU并行计算可以有效提高超音速流场的计算速度,为超音速飞行器的设计、优化、性能评估及其研发提供一种强有力的并行计算方法。 展开更多
关键词 超音速流场 中央处理器-图形处理器 异构计算 有限差分
在线阅读 下载PDF
SERGHEI-SWMM:并行计算与可移植性城市洪涝模型及其应用
7
作者 郑哪 王俊博 +3 位作者 李小宁 李博 李质 刘曙光 《水利学报》 北大核心 2025年第10期1372-1382,共11页
随着气候变化的不确定性日益加剧,极端天气引发的洪涝灾害已成为制约城市韧性提升的重要因素。城市洪涝模拟模型作为评估洪涝灾害风险、支撑城市防灾减灾系统、提升城市应急管理能力的关键工具,其计算方法已趋于成熟。然而,当前广泛应... 随着气候变化的不确定性日益加剧,极端天气引发的洪涝灾害已成为制约城市韧性提升的重要因素。城市洪涝模拟模型作为评估洪涝灾害风险、支撑城市防灾减灾系统、提升城市应急管理能力的关键工具,其计算方法已趋于成熟。然而,当前广泛应用于城市洪涝模拟的管道排水与地表径流耦合模型在多样化的高性能计算硬件架构上缺乏良好的可移植性。本研究基于Kokkos异构并行计算框架,构建了一维管道排水与二维地表径流耦合的水动力模型SERGHEI-SWMM。首先,通过基准算例验证,SERGHEI-SWMM模拟结果与InfoWorks ICM等模型的相对差值均低于9%。随后,以同济大学校园为研究区域,建立了其一维管道与二维地表耦合的洪涝模型,并结合洪涝实测数据对模型进行率定及验证。结果表明,该模型能够准确模拟洪涝过程中地表径流与地下管流之间的交换以及积水的时空演变特征,在不同CPU与GPU硬件架构上均表现出良好的并行性能与可移植性。本研究成果可为城市洪涝灾害风险评估提供高效、可靠的技术支撑,也为后续城市洪涝的实时预报预警奠定了基础。 展开更多
关键词 城市洪涝 耦合模型 可移植性 并行计算 CPU/GPU异构计算
在线阅读 下载PDF
利用CPU和GPU混合并行方法快速构建海洋扰动重力梯度基准图
8
作者 黄炎 李姗姗 +3 位作者 吕明昊 范雕 谭勖立 冯进凯 《武汉大学学报(信息科学版)》 北大核心 2025年第3期515-527,共13页
高精度、高分辨率的海洋扰动重力梯度基准图是将水下扰动重力梯度辅助惯性导航付诸于实践的关键技术之一,可依据边值问题理论,基于移去-恢复技术计算求得。基于传统串行算法存在计算效率低、耗时长等问题,为满足大范围乃至全球海洋扰动... 高精度、高分辨率的海洋扰动重力梯度基准图是将水下扰动重力梯度辅助惯性导航付诸于实践的关键技术之一,可依据边值问题理论,基于移去-恢复技术计算求得。基于传统串行算法存在计算效率低、耗时长等问题,为满足大范围乃至全球海洋扰动重力梯度基准图的快速构建需求,利用中央处理器(central processing unit,CPU)与图形处理器(graph processing unit,GPU)混合并行(CPU+GPU)编程平台,设计了一种高效的混合并行计算方案。首先,利用数组收缩膨胀方法,有效解决了CPU进行勒让德函数递推计算过程中内存读写冲突问题;然后,引入Hilbert空间填充曲线,将二维格网重力异常数据降维成为具有高度聚簇性的一维数组,通过其在GPU显存中的快速索引,实现了Stokes积分的高效计算。在CPU型号为Intel Xeon(R)Gold 6130、GPU型号为Tesla V100的计算机上进行实验,利用该混合并行方案计算6°×6°范围、1′分辨率的全张量海洋扰动重力梯度基准图仅需15.84 s,而传统串行方法需要35 min以上;计算2°×2°范围、30″分辨率基准图仅需22.7 s,串行方法则需要52 min;计算2°×2°范围、10″分辨率基准图需要26.7 min,串行方法则需要两天以上。在保证并行计算绝对误差小于等于1×10^(-6) E、T_(xx)+T_(yy)+T_(zz)绝对值的最大值小于0.1 E、均方根误差小于0.01 E的前提下,实现了全球全张量海洋扰动重力梯度基准图模型的快速构建。 展开更多
关键词 扰动重力梯度 边值问题 CPU GPU 混合并行
原文传递
基于CPU-GPU协同的迭代物理光学并行算法研究
9
作者 曹倩 周远国 +1 位作者 任强 王焱 《电波科学学报》 北大核心 2025年第3期427-438,共12页
随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常... 随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常大。为解决该问题,本文引入参数空间技术优化IPO算法,提高了电大尺寸RCS的计算效率,并引入计算统一设备架构(compute unified device architecture,CUDA)技术,在中央处理器(central processing unit,CPU)与图形处理器(graphics processing unit,GPU)协同平台上实现了电大尺寸目标RCS的并行计算。与商业软件FEKO比对,在NVIDIA GeForce RTX 3050显卡上获得了224.35的加速比。实例结果展示了基于CPU-GPU协同的IPO算法并行计算的可行性与高效性,可以用来解决目前只能在高性能计算机或计算机集群上解决的电大尺寸目标散射问题。 展开更多
关键词 迭代物理光学法(IPO) 参数空间技术 CPU-GPU协同 并行加速 雷达散射截面(RCS)
在线阅读 下载PDF
基于云平台CPU与GPU协同处理的光学卫星遥感影像正射融合方法
10
作者 于潇 张一 +2 位作者 吕丽红 张强 王得成 《空间科学学报》 北大核心 2025年第5期1416-1424,共9页
系统探讨了基于国产云平台调度下自主可控CPU和GPU协同处理的光学卫星遥感影像正射融合方法执行效率问题,通过数据流配置、中间数据存储访问优化等手段进一步提高了该方法执行效率.在云平台调度下,使用飞腾S2500和英伟达A100对高分二号... 系统探讨了基于国产云平台调度下自主可控CPU和GPU协同处理的光学卫星遥感影像正射融合方法执行效率问题,通过数据流配置、中间数据存储访问优化等手段进一步提高了该方法执行效率.在云平台调度下,使用飞腾S2500和英伟达A100对高分二号卫星多光谱影像进行正射融合的试验,结果表明,该方法可很大程度提高光学卫星遥感影像正射融合效率,与传统X86架构CPU与GPU协同的正射融合算法相比,加速比为14.3倍以上,数据处理时间压缩至8.4 s内,其中GPU运算耗时仅1 s,可满足并优化大数据量的光学卫星遥感影像快速正射融合的要求. 展开更多
关键词 正射融合 国产云平台 CPU和GPU协同处理 数据流配置 存储访问优化
在线阅读 下载PDF
车-车通信系统中安全控制执行结果设计 被引量:1
11
作者 陈景柱 张文辉 周公建 《铁路通信信号工程技术》 2025年第6期91-97,共7页
为提高列车自动监控系统中安全相关控制命令执行结果的可靠性和安全性,满足基于车-车通信的列车自主运行系统项目安全需求,设计一种基于中央处理单元(CPU)和图形处理单元(GPU)双链计算和显示的安全控制执行结果显示方法。操作终端的C P ... 为提高列车自动监控系统中安全相关控制命令执行结果的可靠性和安全性,满足基于车-车通信的列车自主运行系统项目安全需求,设计一种基于中央处理单元(CPU)和图形处理单元(GPU)双链计算和显示的安全控制执行结果显示方法。操作终端的C P U计算的执行结果以字符串格式输出到指定位置显示,操作终端的GPU计算的执行结果以图元格式输出到标题栏位置显示。同时采用不同编码方法、相异的算法等方式,避免同一硬件设备在编码语言、算法和硬件平台的共模失效。 展开更多
关键词 车-车通信系统 安全显示 执行结果 共模失效 中央处理单元 图形处理单元
在线阅读 下载PDF
航空面阵数字影像多基线立体匹配及协同处理
12
作者 张丽 汤晓涛 李纲 《测绘科学与工程》 2015年第3期31-37,共7页
多基线立体匹配技术是获取可靠DSM产品的有效手段之一。本文针对面阵航空数字影像设计了多基线立体匹配的技术流程,根据算法特点提出了基于GPU—CPU的协同处理方案;利用构建的专业级GPU并行计算平台,对协同处理方案进行了实验验证。... 多基线立体匹配技术是获取可靠DSM产品的有效手段之一。本文针对面阵航空数字影像设计了多基线立体匹配的技术流程,根据算法特点提出了基于GPU—CPU的协同处理方案;利用构建的专业级GPU并行计算平台,对协同处理方案进行了实验验证。结果表明,提出的方案在保证DSM产品高精度的同时,大幅提高了多基线立体匹配的计算效率和整体处理能力。 展开更多
关键词 多基线立体匹配 gpu-cpu 协同处理 计算效率
在线阅读 下载PDF
盐下构造速度建模与逆时偏移成像研究及应用 被引量:30
13
作者 刘文卿 王西文 +4 位作者 刘洪 王宇超 王孝 曾华会 邵喜春 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2013年第2期616-625,共10页
盐丘速度建模及成像是盐下油气藏勘探有关技术瓶颈问题.盐下构造由于盐丘速度与围岩地层差异大,且厚度横向变化大,造成地震波场复杂及时间域构造畸变.针对H区复杂盐丘的地质特征,通过技术创新重新认识盐下油气藏.针对盐丘速度建模的难点... 盐丘速度建模及成像是盐下油气藏勘探有关技术瓶颈问题.盐下构造由于盐丘速度与围岩地层差异大,且厚度横向变化大,造成地震波场复杂及时间域构造畸变.针对H区复杂盐丘的地质特征,通过技术创新重新认识盐下油气藏.针对盐丘速度建模的难点,提出了"多信息约束层控实体建模技术",采用序贯高斯模拟及克里金趋势约束速度反演方法,较好解决了盐下速度异常问题,大大提高了速度建模的精度;针对盐下复杂构造成像,基于有限差分方法研究了精确且高效的差分格式逆时波场外推算法.基于GPU/CPU协同平台,将波场延拓通过GPU实现.采用逆时偏移深度域成像技术,使高角度反射界面、甚至超过90°盐丘侧翼界面的反射波精确成像.通过盐丘理论模型试算验证算法及方法的正确性.上述方法解决了盐丘速度建模精度问题、盐丘侧翼的回转构造成像问题,实现了对盐丘边界及盐丘侧翼的准确归位.消除了速度异常造成的时间域构造畸变,使盐下地层在深度域能够准确成像. 展开更多
关键词 盐丘 层控建模 多信息约束 逆时偏移 波动方程 GPU CPU协同计算
在线阅读 下载PDF
基于GPU/CPU叠前逆时偏移研究及应用 被引量:15
14
作者 刘文卿 王宇超 +4 位作者 雍学善 王孝 邵喜春 高厚强 刘秋良 《石油地球物理勘探》 EI CSCD 北大核心 2012年第5期712-716,844+676,共5页
本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协... 本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协同系统的计算效率非常高,在实际应用中取得良好的成像效果和时效比。理论模型试算和实际盐丘数据的处理验证了算法的正确性。 展开更多
关键词 逆时偏移 波动方程 成像条件 GPU/CPU协同计算 随机速度边界
在线阅读 下载PDF
基于Hadoop的高性能海量数据处理平台研究 被引量:32
15
作者 翟岩龙 罗壮 +1 位作者 杨凯 徐晟晨 《计算机科学》 CSCD 北大核心 2013年第3期100-103,共4页
海量数据高性能计算蕴藏着巨大的应用价值,但是目前云计算体系只具有海量数据处理能力,而不具有足够的高性能计算能力。将具有超强并行计算能力的GPU与云计算相融合,提出了基于CPU/GPU协同的异构高性能云计算体系结构。以开源Hadoop为基... 海量数据高性能计算蕴藏着巨大的应用价值,但是目前云计算体系只具有海量数据处理能力,而不具有足够的高性能计算能力。将具有超强并行计算能力的GPU与云计算相融合,提出了基于CPU/GPU协同的异构高性能云计算体系结构。以开源Hadoop为基础,采用注释码的形式对MapReduce函数中需要并行的部分进行标记。通过定制GPU类加载器,将被标记代码转换为CUDA代码并动态编译运行。该平台将GPU的计算能力融合到MapRe-duce框架中,可高效处理海量数据。 展开更多
关键词 CPU GPU协同计算 HADOOP 海量数据处理 高性能计算
在线阅读 下载PDF
基于GPU/CPU和震源随机编码技术的混合域全波形反演 被引量:5
16
作者 冯海新 刘洪 +2 位作者 孙军 胡婷 刘志伟 《石油物探》 EI CSCD 北大核心 2017年第1期107-115,共9页
传统的全波形反演利用普通炮集进行反演,反演计算量过大;且利用传统的相位编码技术进行全波形反演,会产生炮间串扰问题,因此,提出了基于GPU/CPU和震源随机编码技术的混合域全波形反演。该方法将参与反演的多个炮集随机组合并分成炮集数... 传统的全波形反演利用普通炮集进行反演,反演计算量过大;且利用传统的相位编码技术进行全波形反演,会产生炮间串扰问题,因此,提出了基于GPU/CPU和震源随机编码技术的混合域全波形反演。该方法将参与反演的多个炮集随机组合并分成炮集数相同的组,各组炮集叠加形成多个组合炮集,然后将组合炮集代替普通炮集进行反演。与传统的相位编码反演方法相比,震源随机编码技术在反演效率和收敛速度方面均有优势,且减少了炮间串扰噪声;并且在GPU的加速下,计算效率会再次提升。Marmousi模型数据测试结果表明:组合炮集方法得到了与普通炮集方法相同的反演效果,但计算效率却比普通炮集方法明显提高,且相较于传统的相位编码技术,组合炮集方法有效抑制了串扰噪声。 展开更多
关键词 混合域 全波形反演 GPU/CPU 组合炮集 震源随机编码
在线阅读 下载PDF
基于GPU的矩阵求逆性能测试和分析 被引量:11
17
作者 刘丽 沈杰 李洪林 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第6期812-817,共6页
在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并... 在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并行运算,从而获得了较大的加速比。同时,根据程序的执行结果,分析了GPU的单精度与双精度的浮点运算能力及其优、劣势。最后,通过分析数据传输时间对GPU性能的影响,总结出适合GPU的算法特征。 展开更多
关键词 图形处理器(GPU) 计算统一设备架构(CUDA) CPU 并行运算 矩阵求逆
在线阅读 下载PDF
CPU和GPU协同处理的光学卫星遥感影像正射校正方法 被引量:36
18
作者 方留杨 王密 李德仁 《测绘学报》 EI CSCD 北大核心 2013年第5期668-675,共8页
系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GP... 系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GPU上对资源三号卫星下视全色影像进行正射校正的试验结果表明,本文方法可大幅提高光学卫星遥感影像正射校正效率,与传统串行正射校正算法相比,加速比最高达到110倍以上,相应的处理时间压缩至5 s以内,可满足对海量数据光学卫星遥感影像进行快速正射校正的要求。 展开更多
关键词 正射校正 CPU和GPU协同处理 层次性分块 配置选择优化 存储层次性访问
在线阅读 下载PDF
CPU-GPU系统中基于剖分的全局性能优化方法 被引量:10
19
作者 张保 董小社 +3 位作者 白秀秀 曹海军 刘超 梅一多 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第2期17-23,共7页
针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优... 针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右. 展开更多
关键词 CPU-GPU异构并行系统 全局优化 3级优化 3级剖分
在线阅读 下载PDF
基于CPU/GPU异构平台的全波形反演及其实用化分析 被引量:12
20
作者 张猛 王华忠 +3 位作者 任浩然 冯波 隋志强 王延光 《石油物探》 EI CSCD 北大核心 2014年第4期461-467,共7页
全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实... 全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实现流程。理论模型测试结果表明,该算法不仅对速度模型具有高精度刻画能力,而且计算效率比基于CPU集群的FWI算法大幅提升。对胜利探区某陆上区块实际地震资料进行全波形速度反演试处理,取得了初步的应用效果。在此基础上,讨论了FWI对实际地震资料质量的要求,就FWI在陆上地震资料的生产性应用提出了相应的策略。 展开更多
关键词 地震反问题 全波形反演 速度估计 CPU GPU异构平台 陆上地震资料
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部