期刊文献+
共找到195篇文章
< 1 2 10 >
每页显示 20 50 100
GPU-CPU协同航空影像快速正射纠正方法 被引量:8
1
作者 李朋龙 邓非 +2 位作者 何江 陈朝霞 杨丽颖 《测绘地理信息》 2016年第2期44-47,共4页
为满足应急测绘中大序列航空影像快速正射纠正的要求,提出了一种GPU-CPU协同快速正射纠正方法。实验结果表明,通过对GPU程序进行配置选择优化和存储层次性优化,该方法较传统的基于CPU正射纠正方法,其平均加速比达到52倍。
关键词 gpu-cpu协同 CUDA 航空影像 正射纠正
原文传递
基于有效区域约束的GPU-CPU协同影像快拼方法 被引量:4
2
作者 李朋龙 邓非 +3 位作者 李海亮 李勇 何江 王岚 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2018年第2期304-310,共7页
提出了一种以有效区域约束的Voronoi图为拼接线网络,利用GPU-CPU协同处理航空影像快速拼接方法。首先,基于成像有效区域生成有效区域约束的Voronoi图拼接线网络,解决了传统Voronoi图拼接线网络在低重叠度条件下拼接后影像局部区域不被... 提出了一种以有效区域约束的Voronoi图为拼接线网络,利用GPU-CPU协同处理航空影像快速拼接方法。首先,基于成像有效区域生成有效区域约束的Voronoi图拼接线网络,解决了传统Voronoi图拼接线网络在低重叠度条件下拼接后影像局部区域不被覆盖的问题,然后利用GPU-CPU协同处理将正射纠正嵌入到影像拼接的过程中,并且只对每张影像的有效区域进行纠正,再通过选择配置优化和存储层次性优化进一步提高拼接效率。实验表明,对237张高分辨率航空影像进行快速正射纠正和拼接,本文算法较传统先纠正再拼接的方法效率提高近20倍,同时保证很高的拼接精度,可以满足应急测绘要求。 展开更多
关键词 航空影像 正射纠正 影像拼接 有效区域约束的Voronoi图 gpu-cpu协同处理
原文传递
论GPU-CPU协作计算模式的应用研究 被引量:2
3
作者 李超 《电子商务》 2010年第11期54-54,共1页
根据GPU计算特点和任务划分的特点,提出一种类似主从模型的GPU-CPU协作计算的处理模式,本文对GPU-CPU协作计算模式的特点进行介绍,再对GPU-CPU协作计算模式的应用进行研究,最后对GPU-CPU协作计算模式的发展展望。
关键词 gpu-cpu协作 计算模式 特点 应用研究
在线阅读 下载PDF
基于GPU-CPU协同的遥感影像坐标转换研究与实现
4
作者 侯飞 《测绘与空间地理信息》 2020年第11期29-31,共3页
2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的... 2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的影像坐标转换方法效率较低,且大数据量影像难以转换,鉴于此,本文将GPU-CPU协同处理技术引入到影像坐标转换过程,建立GPU-CPU协同的影像并行转换流程,通过分块处理策略和GPU处理优化加速整个处理过程。经过系统数据实验,本文方法较普通坐标转换方法有极大的效率提升,在国土资源数据2000国家大地坐标系转换工作中得到了良好的推广应用。 展开更多
关键词 gpu-cpu协同 遥感影像 坐标转换 并行计算
在线阅读 下载PDF
一种GPU-CPU异构运算框架加速的实时N-1交流潮流计算方法 被引量:18
5
作者 唐坤杰 董树锋 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2018年第15期4329-4338,共10页
随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中... 随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中设计一种N-1潮流问题的拼接求解方法,将原本多个独立的潮流问题组合为一个。雅可比矩阵的拼接生成采用并行化处理,线性方程组的求解根据规模大小选择直接法或迭代法处理,其中迭代法采用并行化处理。算法整体分为CPU处理部分和GPU处理部分,CPU处理迭代初值的设定、节点导纳矩阵的形成、校验集合的形成、迭代值的修正、收敛性判断等步骤,GPU处理雅可比矩阵的拼接生成等步骤,修正方程组的求解根据其规模选择CPU求解或GPU求解,以达到快速求解的目的。算例表明,所提算法效率和精度高、空间占用小,与传统N-1潮流算法相比具有明显优势,能够满足电网实时N-1潮流计算的需求,具有工程应用价值。 展开更多
关键词 N-1潮流计算 gpu-cpu异构运算架构 并行化 拼接求解 迭代法
原文传递
基于CPU-GPU的超音速流场N-S方程数值模拟
6
作者 卢志伟 张皓茹 +3 位作者 刘锡尧 王亚东 张卓凯 张君安 《中国机械工程》 北大核心 2025年第9期1942-1950,共9页
为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并... 为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并行计算速度明显高于CPU串行计算速度,其加速比随流场网格规模的增大而明显提高。GPU并行计算可以有效提高超音速流场的计算速度,为超音速飞行器的设计、优化、性能评估及其研发提供一种强有力的并行计算方法。 展开更多
关键词 超音速流场 中央处理器-图形处理器 异构计算 有限差分
在线阅读 下载PDF
SERGHEI-SWMM:并行计算与可移植性城市洪涝模型及其应用
7
作者 郑哪 王俊博 +3 位作者 李小宁 李博 李质 刘曙光 《水利学报》 北大核心 2025年第10期1372-1382,共11页
随着气候变化的不确定性日益加剧,极端天气引发的洪涝灾害已成为制约城市韧性提升的重要因素。城市洪涝模拟模型作为评估洪涝灾害风险、支撑城市防灾减灾系统、提升城市应急管理能力的关键工具,其计算方法已趋于成熟。然而,当前广泛应... 随着气候变化的不确定性日益加剧,极端天气引发的洪涝灾害已成为制约城市韧性提升的重要因素。城市洪涝模拟模型作为评估洪涝灾害风险、支撑城市防灾减灾系统、提升城市应急管理能力的关键工具,其计算方法已趋于成熟。然而,当前广泛应用于城市洪涝模拟的管道排水与地表径流耦合模型在多样化的高性能计算硬件架构上缺乏良好的可移植性。本研究基于Kokkos异构并行计算框架,构建了一维管道排水与二维地表径流耦合的水动力模型SERGHEI-SWMM。首先,通过基准算例验证,SERGHEI-SWMM模拟结果与InfoWorks ICM等模型的相对差值均低于9%。随后,以同济大学校园为研究区域,建立了其一维管道与二维地表耦合的洪涝模型,并结合洪涝实测数据对模型进行率定及验证。结果表明,该模型能够准确模拟洪涝过程中地表径流与地下管流之间的交换以及积水的时空演变特征,在不同CPU与GPU硬件架构上均表现出良好的并行性能与可移植性。本研究成果可为城市洪涝灾害风险评估提供高效、可靠的技术支撑,也为后续城市洪涝的实时预报预警奠定了基础。 展开更多
关键词 城市洪涝 耦合模型 可移植性 并行计算 CPU/GPU异构计算
在线阅读 下载PDF
利用CPU和GPU混合并行方法快速构建海洋扰动重力梯度基准图
8
作者 黄炎 李姗姗 +3 位作者 吕明昊 范雕 谭勖立 冯进凯 《武汉大学学报(信息科学版)》 北大核心 2025年第3期515-527,共13页
高精度、高分辨率的海洋扰动重力梯度基准图是将水下扰动重力梯度辅助惯性导航付诸于实践的关键技术之一,可依据边值问题理论,基于移去-恢复技术计算求得。基于传统串行算法存在计算效率低、耗时长等问题,为满足大范围乃至全球海洋扰动... 高精度、高分辨率的海洋扰动重力梯度基准图是将水下扰动重力梯度辅助惯性导航付诸于实践的关键技术之一,可依据边值问题理论,基于移去-恢复技术计算求得。基于传统串行算法存在计算效率低、耗时长等问题,为满足大范围乃至全球海洋扰动重力梯度基准图的快速构建需求,利用中央处理器(central processing unit,CPU)与图形处理器(graph processing unit,GPU)混合并行(CPU+GPU)编程平台,设计了一种高效的混合并行计算方案。首先,利用数组收缩膨胀方法,有效解决了CPU进行勒让德函数递推计算过程中内存读写冲突问题;然后,引入Hilbert空间填充曲线,将二维格网重力异常数据降维成为具有高度聚簇性的一维数组,通过其在GPU显存中的快速索引,实现了Stokes积分的高效计算。在CPU型号为Intel Xeon(R)Gold 6130、GPU型号为Tesla V100的计算机上进行实验,利用该混合并行方案计算6°×6°范围、1′分辨率的全张量海洋扰动重力梯度基准图仅需15.84 s,而传统串行方法需要35 min以上;计算2°×2°范围、30″分辨率基准图仅需22.7 s,串行方法则需要52 min;计算2°×2°范围、10″分辨率基准图需要26.7 min,串行方法则需要两天以上。在保证并行计算绝对误差小于等于1×10^(-6) E、T_(xx)+T_(yy)+T_(zz)绝对值的最大值小于0.1 E、均方根误差小于0.01 E的前提下,实现了全球全张量海洋扰动重力梯度基准图模型的快速构建。 展开更多
关键词 扰动重力梯度 边值问题 CPU GPU 混合并行
原文传递
基于CPU-GPU协同的迭代物理光学并行算法研究
9
作者 曹倩 周远国 +1 位作者 任强 王焱 《电波科学学报》 北大核心 2025年第3期427-438,共12页
随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常... 随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常大。为解决该问题,本文引入参数空间技术优化IPO算法,提高了电大尺寸RCS的计算效率,并引入计算统一设备架构(compute unified device architecture,CUDA)技术,在中央处理器(central processing unit,CPU)与图形处理器(graphics processing unit,GPU)协同平台上实现了电大尺寸目标RCS的并行计算。与商业软件FEKO比对,在NVIDIA GeForce RTX 3050显卡上获得了224.35的加速比。实例结果展示了基于CPU-GPU协同的IPO算法并行计算的可行性与高效性,可以用来解决目前只能在高性能计算机或计算机集群上解决的电大尺寸目标散射问题。 展开更多
关键词 迭代物理光学法(IPO) 参数空间技术 CPU-GPU协同 并行加速 雷达散射截面(RCS)
在线阅读 下载PDF
基于云平台CPU与GPU协同处理的光学卫星遥感影像正射融合方法
10
作者 于潇 张一 +2 位作者 吕丽红 张强 王得成 《空间科学学报》 北大核心 2025年第5期1416-1424,共9页
系统探讨了基于国产云平台调度下自主可控CPU和GPU协同处理的光学卫星遥感影像正射融合方法执行效率问题,通过数据流配置、中间数据存储访问优化等手段进一步提高了该方法执行效率.在云平台调度下,使用飞腾S2500和英伟达A100对高分二号... 系统探讨了基于国产云平台调度下自主可控CPU和GPU协同处理的光学卫星遥感影像正射融合方法执行效率问题,通过数据流配置、中间数据存储访问优化等手段进一步提高了该方法执行效率.在云平台调度下,使用飞腾S2500和英伟达A100对高分二号卫星多光谱影像进行正射融合的试验,结果表明,该方法可很大程度提高光学卫星遥感影像正射融合效率,与传统X86架构CPU与GPU协同的正射融合算法相比,加速比为14.3倍以上,数据处理时间压缩至8.4 s内,其中GPU运算耗时仅1 s,可满足并优化大数据量的光学卫星遥感影像快速正射融合的要求. 展开更多
关键词 正射融合 国产云平台 CPU和GPU协同处理 数据流配置 存储访问优化
在线阅读 下载PDF
车-车通信系统中安全控制执行结果设计 被引量:1
11
作者 陈景柱 张文辉 周公建 《铁路通信信号工程技术》 2025年第6期91-97,共7页
为提高列车自动监控系统中安全相关控制命令执行结果的可靠性和安全性,满足基于车-车通信的列车自主运行系统项目安全需求,设计一种基于中央处理单元(CPU)和图形处理单元(GPU)双链计算和显示的安全控制执行结果显示方法。操作终端的C P ... 为提高列车自动监控系统中安全相关控制命令执行结果的可靠性和安全性,满足基于车-车通信的列车自主运行系统项目安全需求,设计一种基于中央处理单元(CPU)和图形处理单元(GPU)双链计算和显示的安全控制执行结果显示方法。操作终端的C P U计算的执行结果以字符串格式输出到指定位置显示,操作终端的GPU计算的执行结果以图元格式输出到标题栏位置显示。同时采用不同编码方法、相异的算法等方式,避免同一硬件设备在编码语言、算法和硬件平台的共模失效。 展开更多
关键词 车-车通信系统 安全显示 执行结果 共模失效 中央处理单元 图形处理单元
在线阅读 下载PDF
电力系统全纯嵌入潮流的并行计算 被引量:2
12
作者 李雪 高翔 +2 位作者 姜涛 王长江 李国庆 《电工技术学报》 EI CSCD 北大核心 2024年第18期5839-5854,共16页
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的... 潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。 展开更多
关键词 全纯嵌入法 潮流计算 Aitken差分法 CPU-GPU异构运算平台 预处理器
在线阅读 下载PDF
任意起伏地形下重力异常三维正演及并行计算 被引量:1
13
作者 戴世坤 朱德祥 +4 位作者 张莹 李昆 陈轻蕊 凌嘉宣 田红军 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第2期768-780,共13页
为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转... 为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转化为两个一维傅里叶变换,一维傅里叶变换积分离散为多个单元积分累加和,离散单元中原函数采用二次插值形函数拟合,求出单元积分的解析表达式.相比现有的傅里叶变换算法,新方法具有采样灵活、积分精度高、计算速度快和傅里叶变换的截断效应小等优势.利用空间-波数域算法的高度并行性,采用CPU并行求解常微分方程,GPU并行计算任意傅里叶变换,实现了CPU-GPU并行加速方案,进一步提升了本文算法效率.利用常密度模型,对比数值解和解析解,结果表明本文算法正确;利用变密度模型对比了任意傅里叶变换算法与高斯快速傅里叶变换算法的计算效率与精度,在相近的数值精度下,本文算法波数选取少,效率高;测试CPU-GPU并行效果,结果表明相比CPU串行算法,CPU-GPU并行算法的计算效率大大提升,千万数量级节点数模型正演仅耗时数秒.最后利用实际地形数据进行三维重力异常场数值模拟,证明了新方法的高效性与实用性,对实现大规模复杂条件下重力异常精细化反演成像与综合解释有重要意义. 展开更多
关键词 空间-波数域 任意傅里叶变换 三维重力异常正演 CPU-GPU并行
在线阅读 下载PDF
基于异构系统的多级并行稀疏张量向量乘算法 被引量:4
14
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 CPU-GPU 异构并行计算 多级并行 稀疏张量 张量运算
在线阅读 下载PDF
面向多核CPU与GPU平台的图处理系统关键技术综述 被引量:4
15
作者 张园 曹华伟 +5 位作者 张婕 申玥 孙一鸣 敦明 安学军 叶笑春 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1401-1428,共28页
图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处... 图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处理加速的常用平台.但由于图处理具有处理数据规模大、数据依赖复杂、访存计算比高等特性,加之现实应用场景下的图数据分布不规则且图中的顶点与边呈现动态变化,给图处理的性能提升和高可扩展性带来严峻挑战.为应对上述挑战,大量基于多核CPU与GPU平台的图处理系统被提出,并在该领域取得显著成果.为了让读者了解多核CPU与GPU平台上图处理优化相关技术的演化,首先剖析了图数据、图算法、图应用特性,并阐明图处理所面临的挑战.然后分类梳理了当前已有的基于多核CPU与GPU平台的图处理系统,并从加速图处理设计的角度,详细、系统地总结了关键优化技术,包括图数据预处理、访存优化、计算加速和数据通信优化等.最后对已有先进图处理系统的性能、可扩展性等进行分析,并从不同角度对图处理未来发展趋势进行展望,希望对从事图处理系统研究的学者有一定的启发. 展开更多
关键词 多核CPU与GPU平台 图处理系统 图数据表示 负载均衡 不规则访存 动态图处理
在线阅读 下载PDF
面向深度学习应用的组件式开发框架的设计实现 被引量:1
16
作者 刘祥 华蓓 +1 位作者 林飞 魏宏原 《计算机应用》 CSCD 北大核心 2024年第2期526-535,共10页
针对目前深度学习应用缺少有效的开发与部署工具的问题,提出一个面向深度学习应用的组件式开发框架。所提框架根据应用的资源消耗类型进行功能拆分,使用评测引导的资源分配方案进行瓶颈消除,使用分步装箱方案兼顾高CPU利用率和低显存开... 针对目前深度学习应用缺少有效的开发与部署工具的问题,提出一个面向深度学习应用的组件式开发框架。所提框架根据应用的资源消耗类型进行功能拆分,使用评测引导的资源分配方案进行瓶颈消除,使用分步装箱方案兼顾高CPU利用率和低显存开销的功能放置。基于此框架开发的实时车牌号检测应用,在吞吐优先模式下GPU利用率达到82%,在延迟优先模式下平均应用延迟达到0.73 s,在三种模式下(吞吐优先模式、延迟优先模式以及吞吐/延迟的均衡模式)下,CPU平均利用率达到68.8%。实验结果表明,基于此框架能够进行硬件吞吐与应用延迟的平衡型配置,在吞吐优先模式下高效利用平台的计算资源,在延迟优先模式下满足应用的低延迟需求。相较于MediaPipe,使用本框架能够进行超实时的多人姿态估计应用开发,应用的检测帧率最高提升了1077%。实验结果表明,所提框架能够作为CPU-GPU异构服务器上面向深度学习应用开发部署的有效解决方案。 展开更多
关键词 深度学习应用 开发框架 基于组件的开发 流水线部署 CPU-GPU异构
在线阅读 下载PDF
基于CPU+GPU混合架构的雷达信号处理方法 被引量:2
17
作者 常艳 何涛 朱占宇 《火力与指挥控制》 CSCD 北大核心 2024年第7期80-85,90,共7页
针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积... 针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积累、目标检测、目标检测后处理及解模糊过程,将对应处理映射到CPU+GPU核心以提高加速比。实验结果表明,相比多核DSP信号处理方法,该方法具有更好的性能。 展开更多
关键词 CPU+GPU 混合架构 信号处理 多核DSP
在线阅读 下载PDF
雷达回波模拟器的设计与实现
18
作者 李梦圆 开根深 杨刚 《火控雷达技术》 2024年第3期145-152,共8页
性能测试和算法验证是雷达信号处理分系统评估过程中必不可少的环节,为了获得精确的评估结果,通常需要回波模拟来验证雷达信号处理算法的有效性和稳定性。传统雷达回波模拟器大都基于DSP+FPGA的架构,其成本较高且升级维护比较困难。本... 性能测试和算法验证是雷达信号处理分系统评估过程中必不可少的环节,为了获得精确的评估结果,通常需要回波模拟来验证雷达信号处理算法的有效性和稳定性。传统雷达回波模拟器大都基于DSP+FPGA的架构,其成本较高且升级维护比较困难。本文通过对数字相控阵雷达建模,基于CPU+GPU平台设计了一种雷达回波模拟器,解决了传统模拟器难以升级维护的问题。在实验室内与雷达波控、信号处理、预处理、数据处理以及终端搭建起一套完整的仿真验证系统,经系统联调验证,该模拟器可以模拟雷达多种工作模式。 展开更多
关键词 回波模拟器 干扰 杂波 CPU+GPU
在线阅读 下载PDF
一种面向生物基因多序列比对算法的任务调度方法
19
作者 杨波 王宏杰 +3 位作者 徐胜超 毛明扬 蒋金陵 蒋大锐 《计算机与现代化》 2024年第7期7-12,共6页
针对现阶段生物基因多序列比对算法在面对大规模数据时存在比对效率慢的问题,提出一种面向生物基因多序列比对算法的任务调度方法,以提高生物基因多序列比对的效率。通过Trie树方法对生物基因多序列数据展开分割处理,从而提高后续基因... 针对现阶段生物基因多序列比对算法在面对大规模数据时存在比对效率慢的问题,提出一种面向生物基因多序列比对算法的任务调度方法,以提高生物基因多序列比对的效率。通过Trie树方法对生物基因多序列数据展开分割处理,从而提高后续基因多序列比对过程中数据查找和匹配的效率;构建基因多序列BWT索引,利用BWT索引方法完成生物基因多序列比对;以多序列比对方法为基础,采用CPU与GPU异构并行系统完成多序列比对的任务调度。实验结果表明,所提的面向生物基因多序列比对算法的任务调度方法效率更高、性能更好,且更适合于实际应用。 展开更多
关键词 生物基因 任务调度 多序列比对 CPU与GPU BWT索引方法
在线阅读 下载PDF
航空面阵数字影像多基线立体匹配及协同处理
20
作者 张丽 汤晓涛 李纲 《测绘科学与工程》 2015年第3期31-37,共7页
多基线立体匹配技术是获取可靠DSM产品的有效手段之一。本文针对面阵航空数字影像设计了多基线立体匹配的技术流程,根据算法特点提出了基于GPU—CPU的协同处理方案;利用构建的专业级GPU并行计算平台,对协同处理方案进行了实验验证。... 多基线立体匹配技术是获取可靠DSM产品的有效手段之一。本文针对面阵航空数字影像设计了多基线立体匹配的技术流程,根据算法特点提出了基于GPU—CPU的协同处理方案;利用构建的专业级GPU并行计算平台,对协同处理方案进行了实验验证。结果表明,提出的方案在保证DSM产品高精度的同时,大幅提高了多基线立体匹配的计算效率和整体处理能力。 展开更多
关键词 多基线立体匹配 gpu-cpu 协同处理 计算效率
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部