期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于CUDA并行的线性复杂度快速检测方法
1
作者 付一方 范丽敏 +1 位作者 陈华 陈东昱 《密码学报(中英文)》 北大核心 2025年第4期752-765,共14页
线性复杂度检测是一种重要的二元序列随机性检测方法,亦为判断随机数发生器输出质量的有效指标之一.该检测方法使用的Berlekamp-Massey算法计算复杂度较高,导致该检测相较于其他检测方法效率较低,特别是随着样本长度的增加,检测效率逐... 线性复杂度检测是一种重要的二元序列随机性检测方法,亦为判断随机数发生器输出质量的有效指标之一.该检测方法使用的Berlekamp-Massey算法计算复杂度较高,导致该检测相较于其他检测方法效率较低,特别是随着样本长度的增加,检测效率逐渐成为其适用性的瓶颈问题.本文着眼于解决二元序列线性复杂度测试的低效率问题,提出了一种基于GPU/NVIDIA CUDA技术的并行优化方法,实现了线性复杂度的快速检测.本文在改进的Berlekamp-Massey算法基础上,增加了快速移位方法,结合NVIDIA CUDA模型提出了针对二元序列线性复杂度的并行检测策略,通过对Berlekamp-Massey算法进行的并行化处理,在实现线程块间并行的同时也实现了多线程同步合作的深层并行Berlekamp-Massey算法.除此之外,通过调整线程配置参数以及引入CUDA协作组与warp shuffle机制对检测流程进行进一步优化.实验结果表明,本文提出的优化算法速度提升明显,相对于NIST-STS版本的线性复杂度检测,最高实现了约20000倍的加速;对比目前最快的线性复杂度并行检测方法,最高实现了约3–3.5倍的稳定加速. 展开更多
关键词 随机性检测 线性复杂度检测 BERLEKAMP-MASSEY算法 nvidia cuda GPU并行
在线阅读 下载PDF
基于NVIDIA Kepler的PIC方法并行 被引量:1
2
作者 文敏华 林新华 Simon Chong Wee See 《计算机工程与科学》 CSCD 北大核心 2013年第11期100-104,共5页
PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法... PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法,并使用CUDA在GPU上实现了该算法。在PIC方法中最耗时间的两个函数collision和mover被移植到GPU上。在实验中使用了NVIDIA新发布的Kepler K20GPU进行这两个函数的性能测试,相比于Intel Sandy Bridge E5-2650,最高获得了30倍的加速。 展开更多
关键词 PIC方法 cuda nvidia KEPLER
在线阅读 下载PDF
基于嵌入式GPU的汗孔识别算法并行设计 被引量:3
3
作者 刘义鹏 曾宏翔 +2 位作者 王海霞 杨熙丞 陈朋 《传感器与微系统》 CSCD 2018年第5期76-79,共4页
基于NVIDIA Jetson Tx2平台,结合Open CV计算机视觉库与计算统一设备架构(CUDA)程序设计,对汗孔特征提取与匹配算法实现了并行设计。实验结果表明:并行设计算法能够实现最多180倍的加速,推动指纹匹配算法在嵌入式系统领域的应用。
关键词 汗孔 指纹识别 nvidia Jetson TX2 计算统一设备架构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部