-
题名CUDA架构下的快速Wallis影像增强算法
- 1
-
-
作者
肖汉
吴庆双
冯娜
-
机构
武汉大学遥感信息工程学院
郑州师范学院信息技术系
安徽师范大学国土资源与旅游学院
郑州市档案馆
-
出处
《沈阳工业大学学报》
EI
CAS
2011年第3期293-298,共6页
-
基金
国家自然科学基金资助项目(40771177)
国家高技术研究与发展计划(863)资助项目(2006AA12Z136)
河南省高等学校青年骨干教师计划资助项目(2009GGJS-167)
-
文摘
针对图像增强通常需要较大的计算量、用传统方法难于进行实时处理的问题,提出了一种基于图形处理器加速的Wallis变换影像增强方法.借助于图形处理器较强的运算能力,利用CUDA并行计算架构在PC机上实现了快速Wallis图像滤波算法,包括图形处理器(GPU)上任务分解、大规模计算核心的分解方法,结合使用共享存储器、全局存储器对算法进行加速,使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题.对比了CPU和GPU计算Wallis影像变换的时间,结果表明,随着图像分辨率的增大,Wallis并行算法可以把计算速度提高40倍.该方法具有较好的实时性,可大大提高图像增强过程的处理速度,显著地减少了计算时间.
-
关键词
图形处理器
统一计算设备架构
单指令多线程
Wallis变换
影像增强
cuda核
并行
滤波
-
Keywords
graphic processing unit (GPU)
compute unified device architecture (cuda)
single instructionmultiple thread (SIMT)
Wallis transform
image enhancement
cuda core
parallel
filter
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
P237
[天文地球—摄影测量与遥感]
-
-
题名CUDA到异构众核架构的线程映射模型
- 2
-
-
作者
余勇
庞建民
单征
刘晓楠
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
2012年第9期282-284,287,共4页
-
基金
国家"863"计划基金资助重点项目(2009AA012201)
"核高基"重大专项(2009ZX01036-001-001)
河南省重大科技攻关计划基金资助项目(092101210501)
-
文摘
统一计算设备架构(CUDA)程序移植到其他异构众核架构时的线程数不匹配。为此,提出一种层次化的线程映射模型。在第1个映射层次上,将CUDA主机端线程和设备端线程分别映射到目标平台的主核和从核阵列上,在第2个映射层次上,采用线程循环的方法消除协作线程阵列(CTA)中线程间同步操作,将整个CTA映射到从核阵列的一个从核上。实验结果表明,该模型能使CUDA程序在其他异构众核系统上得到有效运行。
-
关键词
代码移植
图形处理器
统一计算设备架构
异构众核架构
流式多处理器
线程循环
-
Keywords
code transplantation
Graphics Processing Unit(GPU)
Compute Unified Device Architecture(cuda)
heterogeneous many-core architecture
Streaming Multiprocessor(SM)
thread cycle
-
分类号
TP945.12
[自动化与计算机技术]
-
-
题名基于CUDA并行化的K-Means聚类算法优化
被引量:1
- 3
-
-
作者
丁芙蓉
张功萱
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机与数字工程》
2019年第7期1662-1666,共5页
-
文摘
论文分析了基于CUDA并行化的K-means聚类算法在CPU和GPU上的执行特征,提出了一种基于CPU/GPU异步计算模式的并行优化方法。该方法将聚类的各步骤映射到CPU和GPU上,通过异步执行方式使CPU和GPU的计算重叠,对聚类过程进一步并行化,提高了程序运行效率。最后,在多核CPU和GPU异构平台上对UCI数据集和人工合成的数据集进行实验,结果表明,论文提出的优化方法比经典的基于CUDA并行化的K-Means聚类算法性能有所提升。
-
关键词
cuda
多核
聚类算法
异构计算
-
Keywords
cuda
multi-cores
clustering algorithm
asynchronous computing pattern
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于任务分解模型的离散数据格网化并行优化
被引量:5
- 4
-
-
作者
王家润
谢海峰
-
机构
华北计算技术研究所基础三部
-
出处
《计算机工程与设计》
北大核心
2018年第6期1774-1781,共8页
-
基金
十三五预研基金项目(31511070401)
-
文摘
针对国产应用的性能提升,基于CPU\GPU多核技术,提出软硬件结合的并行优化策略及反距离权重(IDW)插值的并行优化算法(PIDW),优化离散数据网格化处理。针对并行处理中的线程任务分解共性难点,设计基于开放多核处理(OpenMP)与统一计算设备架构(CUDA)的线程任务分解模型(TTDM),具有线程访问安全(不越界)、计算无冗余(无重复)、计算完整(无遗漏)等特点,具有较好的计算均衡性(负载均衡)。通过国产及商用多环境实验,加速比分别是3.6和5.9,验证了PIDW算法的性能提升能力。
-
关键词
多核技术
离散数据
格网化
线程任务分解模型
反距离权重
开放多核处理
统一计算设备架构
-
Keywords
multi core technology
discrete data
grid processing
TTDM
IDW
OpenMP
cuda
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于众核处理器的多计算模式构造技术研究
被引量:1
- 5
-
-
作者
李叶繁
张凯龙
周兴社
-
机构
西北工业大学计算机学院
陕西省嵌入式系统技术重点实验室
-
出处
《计算机测量与控制》
CSCD
北大核心
2012年第11期3098-3100,共3页
-
基金
国家自然科学基金
-
文摘
复杂嵌入式应用领域的具体计算任务不仅需要计算平台具有嵌入式高效能计算能力,而且应具有与应用特点匹配的计算资源结构;面向复杂嵌入式应用领域研究了众核处理机体系架构,在GPU基本计算形态的基础上,依据NVIDIA Kepler架构的特性,进一步研究、构建了相应的众核组织与处理模式,将其形成3种基本计算模式:单任务并行计算、多任务并行计算、多任务流处理计算,有效地提高了嵌入式高性能计算的效能和灵活性。
-
关键词
嵌入式系统
众核处理器
GPU
cuda
KEPLER
计算模式
-
Keywords
embedded system
many--core processor
GPU
cuda
Kepler
compute modes
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名众核多计算模式系统的构建
- 6
-
-
作者
王可锋
吴晓
罗眉
-
机构
西北工业大学计算机学院
陕西省嵌入式系统技术重点实验室
第二炮兵工程大学
-
出处
《现代电子技术》
2013年第22期1-4,共4页
-
基金
国家自然科学基金(61103004)
-
文摘
复杂应用领域中的一些具体计算任务不仅需要计算平台具备高效的计算能力,而且也应具有与计算任务特点相匹配的计算模式。依据NVIDIA Kepler GK110架构中Hyper.Q特性与CUDA流的关系,提出单任务并行、多任务并行与多任务流式计算三种计算模式。采用空位标记的方法对计算模式进行构建与切换,结合数据缓冲机制和计算任务加载方式,设计了众核多计算模式处理系统,实现了众核处理机多模式计算的功能。
-
关键词
众核处理机
KeplerGK110
计算模式
cuda流
-
Keywords
many-core processor
Kepler GK110
compute mode
cuda stream
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP302
[自动化与计算机技术—计算机系统结构]
-