期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于CUDA并行的线性复杂度快速检测方法
1
作者
付一方
范丽敏
+1 位作者
陈华
陈东昱
《密码学报(中英文)》
北大核心
2025年第4期752-765,共14页
线性复杂度检测是一种重要的二元序列随机性检测方法,亦为判断随机数发生器输出质量的有效指标之一.该检测方法使用的Berlekamp-Massey算法计算复杂度较高,导致该检测相较于其他检测方法效率较低,特别是随着样本长度的增加,检测效率逐...
线性复杂度检测是一种重要的二元序列随机性检测方法,亦为判断随机数发生器输出质量的有效指标之一.该检测方法使用的Berlekamp-Massey算法计算复杂度较高,导致该检测相较于其他检测方法效率较低,特别是随着样本长度的增加,检测效率逐渐成为其适用性的瓶颈问题.本文着眼于解决二元序列线性复杂度测试的低效率问题,提出了一种基于GPU/NVIDIA CUDA技术的并行优化方法,实现了线性复杂度的快速检测.本文在改进的Berlekamp-Massey算法基础上,增加了快速移位方法,结合NVIDIA CUDA模型提出了针对二元序列线性复杂度的并行检测策略,通过对Berlekamp-Massey算法进行的并行化处理,在实现线程块间并行的同时也实现了多线程同步合作的深层并行Berlekamp-Massey算法.除此之外,通过调整线程配置参数以及引入CUDA协作组与warp shuffle机制对检测流程进行进一步优化.实验结果表明,本文提出的优化算法速度提升明显,相对于NIST-STS版本的线性复杂度检测,最高实现了约20000倍的加速;对比目前最快的线性复杂度并行检测方法,最高实现了约3–3.5倍的稳定加速.
展开更多
关键词
随机性检测
线性复杂度检测
BERLEKAMP-MASSEY算法
nvidia
cuda
GPU并行
在线阅读
下载PDF
职称材料
基于NVIDIA Kepler的PIC方法并行
被引量:
1
2
作者
文敏华
林新华
Simon Chong Wee See
《计算机工程与科学》
CSCD
北大核心
2013年第11期100-104,共5页
PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法...
PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法,并使用CUDA在GPU上实现了该算法。在PIC方法中最耗时间的两个函数collision和mover被移植到GPU上。在实验中使用了NVIDIA新发布的Kepler K20GPU进行这两个函数的性能测试,相比于Intel Sandy Bridge E5-2650,最高获得了30倍的加速。
展开更多
关键词
PIC方法
cuda
nvidia
KEPLER
在线阅读
下载PDF
职称材料
基于嵌入式GPU的汗孔识别算法并行设计
被引量:
3
3
作者
刘义鹏
曾宏翔
+2 位作者
王海霞
杨熙丞
陈朋
《传感器与微系统》
CSCD
2018年第5期76-79,共4页
基于NVIDIA Jetson Tx2平台,结合Open CV计算机视觉库与计算统一设备架构(CUDA)程序设计,对汗孔特征提取与匹配算法实现了并行设计。实验结果表明:并行设计算法能够实现最多180倍的加速,推动指纹匹配算法在嵌入式系统领域的应用。
关键词
汗孔
指纹识别
nvidia
Jetson
TX2
计算统一设备架构
在线阅读
下载PDF
职称材料
题名
基于CUDA并行的线性复杂度快速检测方法
1
作者
付一方
范丽敏
陈华
陈东昱
机构
中国科学院软件研究所可信计算与信息保障实验室
中国科学院大学
出处
《密码学报(中英文)》
北大核心
2025年第4期752-765,共14页
基金
国家重点研发计划(2020YFA0309704)
国家密码科学基金(2025NCSF02057)。
文摘
线性复杂度检测是一种重要的二元序列随机性检测方法,亦为判断随机数发生器输出质量的有效指标之一.该检测方法使用的Berlekamp-Massey算法计算复杂度较高,导致该检测相较于其他检测方法效率较低,特别是随着样本长度的增加,检测效率逐渐成为其适用性的瓶颈问题.本文着眼于解决二元序列线性复杂度测试的低效率问题,提出了一种基于GPU/NVIDIA CUDA技术的并行优化方法,实现了线性复杂度的快速检测.本文在改进的Berlekamp-Massey算法基础上,增加了快速移位方法,结合NVIDIA CUDA模型提出了针对二元序列线性复杂度的并行检测策略,通过对Berlekamp-Massey算法进行的并行化处理,在实现线程块间并行的同时也实现了多线程同步合作的深层并行Berlekamp-Massey算法.除此之外,通过调整线程配置参数以及引入CUDA协作组与warp shuffle机制对检测流程进行进一步优化.实验结果表明,本文提出的优化算法速度提升明显,相对于NIST-STS版本的线性复杂度检测,最高实现了约20000倍的加速;对比目前最快的线性复杂度并行检测方法,最高实现了约3–3.5倍的稳定加速.
关键词
随机性检测
线性复杂度检测
BERLEKAMP-MASSEY算法
nvidia
cuda
GPU并行
Keywords
randomness
linear complexity test
Berlekamp-Massey algorithm
nvidia cuda
GPU parallelization
分类号
TP309.7 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于NVIDIA Kepler的PIC方法并行
被引量:
1
2
作者
文敏华
林新华
Simon Chong Wee See
机构
上海交通大学高性能计算中心
东京工业大学
NVIDIA Corporation
出处
《计算机工程与科学》
CSCD
北大核心
2013年第11期100-104,共5页
基金
Supported by SJTU CUDA Center of Excellence and JSPS RONPAKU Fellowship
文摘
PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法,并使用CUDA在GPU上实现了该算法。在PIC方法中最耗时间的两个函数collision和mover被移植到GPU上。在实验中使用了NVIDIA新发布的Kepler K20GPU进行这两个函数的性能测试,相比于Intel Sandy Bridge E5-2650,最高获得了30倍的加速。
关键词
PIC方法
cuda
nvidia
KEPLER
Keywords
PIC method
cuda
nvidia
Kepler
分类号
O53 [理学—等离子体物理]
TP38 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于嵌入式GPU的汗孔识别算法并行设计
被引量:
3
3
作者
刘义鹏
曾宏翔
王海霞
杨熙丞
陈朋
机构
浙江工业大学信息工程学院
出处
《传感器与微系统》
CSCD
2018年第5期76-79,共4页
基金
国家自然科学基金资助项目(61502426
61527808)
浙江省自然科学基金资助项目(LQ15F020009)
文摘
基于NVIDIA Jetson Tx2平台,结合Open CV计算机视觉库与计算统一设备架构(CUDA)程序设计,对汗孔特征提取与匹配算法实现了并行设计。实验结果表明:并行设计算法能够实现最多180倍的加速,推动指纹匹配算法在嵌入式系统领域的应用。
关键词
汗孔
指纹识别
nvidia
Jetson
TX2
计算统一设备架构
Keywords
sweat pore
fingerprint recognition
nvidia
Jetson TX2
compute unified device architecture(
cuda
)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于CUDA并行的线性复杂度快速检测方法
付一方
范丽敏
陈华
陈东昱
《密码学报(中英文)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于NVIDIA Kepler的PIC方法并行
文敏华
林新华
Simon Chong Wee See
《计算机工程与科学》
CSCD
北大核心
2013
1
在线阅读
下载PDF
职称材料
3
基于嵌入式GPU的汗孔识别算法并行设计
刘义鹏
曾宏翔
王海霞
杨熙丞
陈朋
《传感器与微系统》
CSCD
2018
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部