期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
GPS信号FFT捕获的GPU实现 被引量:4
1
作者 王可东 李鸿田 +1 位作者 侯绍东 高悦 《全球定位系统》 2011年第6期12-16,共5页
缩短GPS接收机冷启动时间一直是GPS领域的热点问题,而决定冷启动时间的关键是捕获速度。针对快速付里叶变换(FFT)捕获算法的并行运算特点和图形处理单元(GPU)适合于进行并行的优势,简单介绍了FFT捕获算法原理和对比了GPU与FPGA的特点,... 缩短GPS接收机冷启动时间一直是GPS领域的热点问题,而决定冷启动时间的关键是捕获速度。针对快速付里叶变换(FFT)捕获算法的并行运算特点和图形处理单元(GPU)适合于进行并行的优势,简单介绍了FFT捕获算法原理和对比了GPU与FPGA的特点,重点设计了各通道和各频点均进行并行计算的FFT捕获算法的GPU实现方案。利用实测的GPS中频数据初步验证了本文捕获方案的正确性和运行时间。试验结果表明:与基于CPU的捕获方案相比,本文的捕获方案对卫星PRN和CA码相位的捕获结果完全正确,而捕获时间大幅度缩短了。 展开更多
关键词 并行捕获 GPU GPS CUDA
在线阅读 下载PDF
基于CUDA的GPS信号快速捕获 被引量:8
2
作者 程俊仁 刘光斌 张博 《宇航学报》 EI CAS CSCD 北大核心 2010年第10期2407-2410,共4页
为实现基于PC平台的GPS软件接收机C/A码信号快速搜索,提出了一种由GPU完成信号搜索计算的快速实现方法。该方法以基于FFT的码相位并行搜索算法为基础,通过CUDA编程,由GPU完成主要的计算任务,实现了信号搜索在GPU上的并行计算。最后,将... 为实现基于PC平台的GPS软件接收机C/A码信号快速搜索,提出了一种由GPU完成信号搜索计算的快速实现方法。该方法以基于FFT的码相位并行搜索算法为基础,通过CUDA编程,由GPU完成主要的计算任务,实现了信号搜索在GPU上的并行计算。最后,将该方法与在CPU上实现的捕获方法进行了比较测试,结果表明:新方法的捕获速度显著提高,冷启动条件下,搜索全部32颗卫星只需1.653秒,为GPS软件接收机的实时化提供了重要保证。 展开更多
关键词 GPS软件接收机 快速捕获 快速傅里叶变换 图形处理单元
在线阅读 下载PDF
基于GPU的GPS信号并行捕获 被引量:7
3
作者 杨静 刘一霏 《中国惯性技术学报》 EI CSCD 北大核心 2012年第4期430-434,共5页
针对计算机中央处理器上串行实现GPS捕获算法耗时长的缺点,利用具有强并行处理能力的图形处理器设计实现了两种分别适用于不同载噪比信号的并行捕获算法以提高捕获速度。所提算法基于计算机统一设备架构的设计思想,采用了并行码相位搜... 针对计算机中央处理器上串行实现GPS捕获算法耗时长的缺点,利用具有强并行处理能力的图形处理器设计实现了两种分别适用于不同载噪比信号的并行捕获算法以提高捕获速度。所提算法基于计算机统一设备架构的设计思想,采用了并行码相位搜索捕获策略,通过对GPS星座32颗卫星多通道、多频点的并行搜索实现了强信号捕获,而对弱信号则采用非相关积分法,通过对单颗卫星多时段、多频点的并行搜索再进行通道的串行处理来实现并行捕获。仿真结果表明:两种并行捕获算法比串行实现的捕获算法速度提高了10倍;采用非相干积分提高了弱信号捕获能力,对于载噪比为40 dB的10 ms中频数据,在保证捕获速度的同时,仍能够有效实现正确捕获。 展开更多
关键词 GPS软件接收机 并行捕获 图形处理器 弱信号 非相关积分法
在线阅读 下载PDF
Improving Global Performance on GPU for Algorithms with Main Loop Containing a Reduction Operation: Case of Dijkstra’s Algorithm
4
作者 Amadou Chaibou Oumarou Sie 《Journal of Computer and Communications》 2015年第8期41-54,共14页
In this paper, we study the impact of copying data in GPU computing. GPU computing allows implementing parallel computations at low cost: a GPU can be purchased at under USD 500. Many studies have shown that GPU can b... In this paper, we study the impact of copying data in GPU computing. GPU computing allows implementing parallel computations at low cost: a GPU can be purchased at under USD 500. Many studies have shown that GPU can be used to speed up the calculations. But for algorithms requiring doing a part of the calculations on GPU and another part on CPU, alternately, latency due to the copy of the data is a performance degradation factor. To illustrate this, we consider the Dijkstra’s algorithm on the shortest path used in solving optimization problems. This algorithm is very heavy to run on sequential machine. So, we are considering a parallel approach on GPU. Note that Dijkstra’s algorithm has been subject of many implementations on GPU. In the present work, we use two platforms with external GPU. Graphs are represented in adjacency matrix. During the computation of this algorithm, intermediates results are copied from GPU to CPU or from CPU to GPU. The purpose of this work is to measure the impact of these copies in the overall performance of the algorithm. For that we calculate time due to the copying data’s implementation;then we compare results with implementation computing only on CPU memory (zero-copy). The real impact shown by experiments demonstrates the interest of this study. GP-GPU programmers have to think that they will use either memory zero-copy or GPU memory. The challenge for GPU’s manufacturers is how to reduce this impact. 展开更多
关键词 gp-gpu Parallel COMPUTING CUDA C DIJKSTRA BGL GRID
暂未订购
Comparative Study of the Parallelization of the Smith-Waterman Algorithm on OpenMP and Cuda C
5
作者 Amadou Chaibou Oumarou Sie 《Journal of Computer and Communications》 2015年第6期107-117,共11页
In this paper, we present parallel programming approaches to calculate the values of the cells in matrix’s scoring used in the Smith-Waterman’s algorithm for sequence alignment. This algorithm, well known in bioinfo... In this paper, we present parallel programming approaches to calculate the values of the cells in matrix’s scoring used in the Smith-Waterman’s algorithm for sequence alignment. This algorithm, well known in bioinformatics for its applications, is unfortunately time-consuming on a serial computer. We use formulation based on anti-diagonals structure of data. This representation focuses on parallelizable parts of the algorithm without changing the initial formulation of the algorithm. Approaching data in that way give us a formulation more flexible. To examine this approach, we encode it in OpenMP and Cuda C. The performance obtained shows the interest of our paper. 展开更多
关键词 CUDA gp-gpu OPENMP PARALLEL COMPUTING Smith-Waterman
在线阅读 下载PDF
GPU的并行支持向量机算法(英文) 被引量:6
6
作者 DO Thanh-Nghi NGUYEN Van-Hoa POULET Franqois 《计算机科学与探索》 CSCD 2009年第4期368-377,共10页
提出了一种新的并行增量式支持向量机算法来解决图形处理单元(GPU)中大规模数据集的分类问题。SVM以及核相关方法可以用来创建精确分类模型,但学习过程需要大量内存和很长时间。扩展了Suykens和Vandewalle提出的最少次方SVM(LS-SVM)方... 提出了一种新的并行增量式支持向量机算法来解决图形处理单元(GPU)中大规模数据集的分类问题。SVM以及核相关方法可以用来创建精确分类模型,但学习过程需要大量内存和很长时间。扩展了Suykens和Vandewalle提出的最少次方SVM(LS-SVM)方法来建立增量和并行算法。新算法使用图形处理器以低代价获得高系统性能。实现表明,在UCI和Delve数据集上,基于GPU并行增量算法较CPU实现方法快130倍,而且比现行算法,如LibSVM、SVM-perf和CB-SVM等快的多(超过2500倍)。 展开更多
关键词 支持向量机 图形处理器 最少次方SVM
在线阅读 下载PDF
一种GPU的GPS/BDS双模信号单硬件通道复合模拟方法
7
作者 黄文涛 宋茂忠 《舰船电子工程》 2021年第1期63-66,116,共5页
为了优化卫星导航模拟器的硬件资源,设计了一种基于GPU的单硬件通道同时产生GPS/BDS双模信号的模拟方法。通过分析GPS卫星导航信号和BDS卫星导航信号的信号模型,利用时间压扩的方法模拟多普勒,在CPU+GPU架构下实现中频信号的模拟,可实现... 为了优化卫星导航模拟器的硬件资源,设计了一种基于GPU的单硬件通道同时产生GPS/BDS双模信号的模拟方法。通过分析GPS卫星导航信号和BDS卫星导航信号的信号模型,利用时间压扩的方法模拟多普勒,在CPU+GPU架构下实现中频信号的模拟,可实现GPS/BDS的单模产生和双模同时产生。该方法硬件上采用单通道的上变频放大输出,双模信号统一进行上变频和滤波,通过GPS上边带信号和BDS下边带信号结合的方式,在保证信号性能的前提下,缩小了中频信号的带宽,降低了对采样率的要求,有效地减少了软件模拟的时间开销。经过微波矢量信号发生器的播放与接收机的接收,证明了方法的有效性。 展开更多
关键词 信号模拟 GPU GPS/BDS 单通道
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部