期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
CUDA架构下的快速Wallis影像增强算法
1
作者 肖汉 吴庆双 冯娜 《沈阳工业大学学报》 EI CAS 2011年第3期293-298,共6页
针对图像增强通常需要较大的计算量、用传统方法难于进行实时处理的问题,提出了一种基于图形处理器加速的Wallis变换影像增强方法.借助于图形处理器较强的运算能力,利用CUDA并行计算架构在PC机上实现了快速Wallis图像滤波算法,包括图形... 针对图像增强通常需要较大的计算量、用传统方法难于进行实时处理的问题,提出了一种基于图形处理器加速的Wallis变换影像增强方法.借助于图形处理器较强的运算能力,利用CUDA并行计算架构在PC机上实现了快速Wallis图像滤波算法,包括图形处理器(GPU)上任务分解、大规模计算核心的分解方法,结合使用共享存储器、全局存储器对算法进行加速,使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题.对比了CPU和GPU计算Wallis影像变换的时间,结果表明,随着图像分辨率的增大,Wallis并行算法可以把计算速度提高40倍.该方法具有较好的实时性,可大大提高图像增强过程的处理速度,显著地减少了计算时间. 展开更多
关键词 图形处理器 统一计算设备架构 单指令多线程 Wallis变换 影像增强 cuda 并行 滤波
在线阅读 下载PDF
CUDA到异构众核架构的线程映射模型
2
作者 余勇 庞建民 +1 位作者 单征 刘晓楠 《计算机工程》 CAS CSCD 2012年第9期282-284,287,共4页
统一计算设备架构(CUDA)程序移植到其他异构众核架构时的线程数不匹配。为此,提出一种层次化的线程映射模型。在第1个映射层次上,将CUDA主机端线程和设备端线程分别映射到目标平台的主核和从核阵列上,在第2个映射层次上,采用线程循环的... 统一计算设备架构(CUDA)程序移植到其他异构众核架构时的线程数不匹配。为此,提出一种层次化的线程映射模型。在第1个映射层次上,将CUDA主机端线程和设备端线程分别映射到目标平台的主核和从核阵列上,在第2个映射层次上,采用线程循环的方法消除协作线程阵列(CTA)中线程间同步操作,将整个CTA映射到从核阵列的一个从核上。实验结果表明,该模型能使CUDA程序在其他异构众核系统上得到有效运行。 展开更多
关键词 代码移植 图形处理器 统一计算设备架构 异构众核架构 流式多处理器 线程循环
在线阅读 下载PDF
基于CUDA并行化的K-Means聚类算法优化 被引量:1
3
作者 丁芙蓉 张功萱 《计算机与数字工程》 2019年第7期1662-1666,共5页
论文分析了基于CUDA并行化的K-means聚类算法在CPU和GPU上的执行特征,提出了一种基于CPU/GPU异步计算模式的并行优化方法。该方法将聚类的各步骤映射到CPU和GPU上,通过异步执行方式使CPU和GPU的计算重叠,对聚类过程进一步并行化,提高了... 论文分析了基于CUDA并行化的K-means聚类算法在CPU和GPU上的执行特征,提出了一种基于CPU/GPU异步计算模式的并行优化方法。该方法将聚类的各步骤映射到CPU和GPU上,通过异步执行方式使CPU和GPU的计算重叠,对聚类过程进一步并行化,提高了程序运行效率。最后,在多核CPU和GPU异构平台上对UCI数据集和人工合成的数据集进行实验,结果表明,论文提出的优化方法比经典的基于CUDA并行化的K-Means聚类算法性能有所提升。 展开更多
关键词 cuda 多核 聚类算法 异构计算
在线阅读 下载PDF
基于任务分解模型的离散数据格网化并行优化 被引量:5
4
作者 王家润 谢海峰 《计算机工程与设计》 北大核心 2018年第6期1774-1781,共8页
针对国产应用的性能提升,基于CPU\GPU多核技术,提出软硬件结合的并行优化策略及反距离权重(IDW)插值的并行优化算法(PIDW),优化离散数据网格化处理。针对并行处理中的线程任务分解共性难点,设计基于开放多核处理(OpenMP)与统一计算设备... 针对国产应用的性能提升,基于CPU\GPU多核技术,提出软硬件结合的并行优化策略及反距离权重(IDW)插值的并行优化算法(PIDW),优化离散数据网格化处理。针对并行处理中的线程任务分解共性难点,设计基于开放多核处理(OpenMP)与统一计算设备架构(CUDA)的线程任务分解模型(TTDM),具有线程访问安全(不越界)、计算无冗余(无重复)、计算完整(无遗漏)等特点,具有较好的计算均衡性(负载均衡)。通过国产及商用多环境实验,加速比分别是3.6和5.9,验证了PIDW算法的性能提升能力。 展开更多
关键词 多核技术 离散数据 格网化 线程任务分解模型 反距离权重 开放多核处理 统一计算设备架构
在线阅读 下载PDF
基于众核处理器的多计算模式构造技术研究 被引量:1
5
作者 李叶繁 张凯龙 周兴社 《计算机测量与控制》 CSCD 北大核心 2012年第11期3098-3100,共3页
复杂嵌入式应用领域的具体计算任务不仅需要计算平台具有嵌入式高效能计算能力,而且应具有与应用特点匹配的计算资源结构;面向复杂嵌入式应用领域研究了众核处理机体系架构,在GPU基本计算形态的基础上,依据NVIDIA Kepler架构的特性,进... 复杂嵌入式应用领域的具体计算任务不仅需要计算平台具有嵌入式高效能计算能力,而且应具有与应用特点匹配的计算资源结构;面向复杂嵌入式应用领域研究了众核处理机体系架构,在GPU基本计算形态的基础上,依据NVIDIA Kepler架构的特性,进一步研究、构建了相应的众核组织与处理模式,将其形成3种基本计算模式:单任务并行计算、多任务并行计算、多任务流处理计算,有效地提高了嵌入式高性能计算的效能和灵活性。 展开更多
关键词 嵌入式系统 众核处理器 GPU cuda KEPLER 计算模式
在线阅读 下载PDF
众核多计算模式系统的构建
6
作者 王可锋 吴晓 罗眉 《现代电子技术》 2013年第22期1-4,共4页
复杂应用领域中的一些具体计算任务不仅需要计算平台具备高效的计算能力,而且也应具有与计算任务特点相匹配的计算模式。依据NVIDIA Kepler GK110架构中Hyper.Q特性与CUDA流的关系,提出单任务并行、多任务并行与多任务流式计算三种计算... 复杂应用领域中的一些具体计算任务不仅需要计算平台具备高效的计算能力,而且也应具有与计算任务特点相匹配的计算模式。依据NVIDIA Kepler GK110架构中Hyper.Q特性与CUDA流的关系,提出单任务并行、多任务并行与多任务流式计算三种计算模式。采用空位标记的方法对计算模式进行构建与切换,结合数据缓冲机制和计算任务加载方式,设计了众核多计算模式处理系统,实现了众核处理机多模式计算的功能。 展开更多
关键词 众核处理机 KeplerGK110 计算模式 cuda
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部