期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于CUDA加速动态规划优化全景拼接的刮板输送机直线状态监测 被引量:2
1
作者 李博 侍守伊 +4 位作者 张建军 夏蕊 王学文 崔卫秀 倪强 《工矿自动化》 北大核心 2025年第1期45-51,60,共8页
为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法。首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视... 为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法。首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视频流进行暗通道清晰化处理,以消除井下煤尘、水雾等的干扰。其次,使用ORB算法检测和计算2路视频帧的特征点和描述子,通过K最近邻(KNN)匹配计算特征点间的匹配对,利用设置阈值比例的方法过滤错误的匹配点,使用随机抽样一致(RANSAC)算法计算出用于图像透视变换的单应性矩阵。然后,基于CUDA将读取Sobel算子、计算梯度、计算总能量差异、循环初始化权重与路径、寻找最佳接缝线分配到不同的线程中,并定义计算能量图和寻找最佳接缝线的核函数,完成2路图像沿接缝线融合的全景拼接。最后,使用霍夫变换方法对全景拼接的刮板输送机图像中部槽挡煤板进行直线拟合,并将拟合的直线绘制在全景拼接图像上,以反映刮板输送机的直线状态。实验及测试结果表明,CUDA加速动态规划优化全景拼接痕迹不明显,且处理速度快;通过霍夫变换对中部槽挡煤板拟合的直线与刮板输送机直线具有较好的一致性,可用于刮板输送机直线状态监测。 展开更多
关键词 刮板输送机直线状态监测 cuda加速 动态规划 全景拼接 霍夫变换 统一计算设备架构
在线阅读 下载PDF
基于CUDA加速的三维医学图像配准 被引量:6
2
作者 王蓓蕾 朱志良 孟琭 《小型微型计算机系统》 CSCD 北大核心 2013年第11期2621-2625,共5页
三维医学图像配准技术是医学图像处理,特别是外科手术导航的关键技术,但现有的三维医学图像配准算法大多存在计算量大、耗时过长的问题,不能满足临床应用中实时处理的要求.针对这一问题,提出一种基于统一计算设备架构(Compute Unified D... 三维医学图像配准技术是医学图像处理,特别是外科手术导航的关键技术,但现有的三维医学图像配准算法大多存在计算量大、耗时过长的问题,不能满足临床应用中实时处理的要求.针对这一问题,提出一种基于统一计算设备架构(Compute Unified Device Architecture,CUDA)的高性能计算方法,充分利用CUDA架构下GPU(Graphic Processing Unit)并行计算的优势,并结合图像多尺度、最大互信息等方法,实现了三维医学图像的快速配准.实验结果表明,该方法在保证配准精度的前提下,大幅度地提高了三维医学图像配准算法的运算速度,可以满足临床上对配准算法的实时性要求. 展开更多
关键词 三维图像配准 cuda加速 互信息 多尺度
在线阅读 下载PDF
基于CUDA加速的SIFT特征提取 被引量:5
3
作者 王蓓蕾 朱志良 孟琭 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第2期200-204,共5页
提出一种基于统一计算设备架构(CUDA)加速的尺度不变特征变换(SIFT)快速计算方法,用以解决SIFT特征提取计算过程耗时过长的问题.该方法充分利用图像处理单元(GPU)在并行计算、浮点计算、内存管理等方面的优势,合理分配主机端和设备端的... 提出一种基于统一计算设备架构(CUDA)加速的尺度不变特征变换(SIFT)快速计算方法,用以解决SIFT特征提取计算过程耗时过长的问题.该方法充分利用图像处理单元(GPU)在并行计算、浮点计算、内存管理等方面的优势,合理分配主机端和设备端的资源及其在SIFT特征计算中所承担的角色.实验表明,与CPU架构下的SIFT特征提取算法相比,本文算法可以大幅度加快SIFT特征提取的计算速度,其加速比随着SIFT特征点数目的增加而增加,在本文实验中最大加速比可达19.54. 展开更多
关键词 cuda加速 尺度不变特征变换 图像特征 特征描述符 图像处理单元
在线阅读 下载PDF
基于CUDA加速的多模态膝关节图像配准 被引量:4
4
作者 蒲云洁 王学渊 《制造业自动化》 CSCD 北大核心 2022年第3期11-14,26,共5页
不同模态的医学图像包含了不同的信息,这些信息对医生和患者来说通常是互补的。针对单一模态医学图像信息缺失的问题,提出了一种基于CUDA加速的多模态医学图像快速配准算法。算法首先通过数字影像重建(Digitally Reconstructed Radiogra... 不同模态的医学图像包含了不同的信息,这些信息对医生和患者来说通常是互补的。针对单一模态医学图像信息缺失的问题,提出了一种基于CUDA加速的多模态医学图像快速配准算法。算法首先通过数字影像重建(Digitally Reconstructed Radiograph,DRR)技术将采集到的患者膝关节CT三维体数据转化成二维平面图像数据,将该图像数据作为配准浮动图像,同一患者采集的X光图像作为配准参考图像;然后通过进行刚体变换粗配准,再采用梯度方向测度计算相似性测度;最终利用CMA-ES优化算法对参数进行优化,直到完成配准整个过程。实验结果表明,算法配准成功率高,精度好,具有较强的鲁棒性,在患者膝关节X光有噪声或者病态的情况下仍然具有较高的配准成功率。 展开更多
关键词 多模态配准 数字影像重建 梯度方向 cuda加速 参数优化
在线阅读 下载PDF
基于卷积神经网络与CUDA加速计算的手势识别算法应用研究 被引量:4
5
作者 姜洋洋 《系统仿真技术》 2020年第1期22-26,共5页
针对服务性智能终端对识别鲁棒性和用户体验的高要求,基于PC的传统计算机视觉算法已不能保证抗干扰力与实时响应的问题,提出了一种基于卷积神经网络与CUDA加速计算的手势识别算法。首先,建立数据训练机制,收集各种手势图像,分为训练集... 针对服务性智能终端对识别鲁棒性和用户体验的高要求,基于PC的传统计算机视觉算法已不能保证抗干扰力与实时响应的问题,提出了一种基于卷积神经网络与CUDA加速计算的手势识别算法。首先,建立数据训练机制,收集各种手势图像,分为训练集和测试集,为深度学习训练做好数据标注准备。然后,基于卷积神经网络原理,根据核心方程模型,进行代码实现,构成识别模型,并对手势样本训练集进行自动特征学习,完成模型迭代。最后,引入CUDA加速计算技术,将识别机制代码移植到独立显卡GPU平台,提高训练与识别过程的加速。实验测试结果显示:所提方法较好地兼顾了较高的识别精度与效率,耗时仅为1. 5 ms。 展开更多
关键词 卷积神经网络 cuda加速计算 GPU 手势识别 识别模型
在线阅读 下载PDF
CT体数据中心环绕特征检测算法及其CUDA加速 被引量:1
6
作者 崔明明 曹鸿涛 +3 位作者 闫镔 陈健 曾磊 蔡爱龙 《计算机应用研究》 CSCD 北大核心 2015年第6期1912-1916,共5页
针对CT体数据的多尺度特征点检测计算量大、耗时长的问题,提出一种三维中心环绕特征快速检测算法。设计三维中心环绕特征检测子,结合三维积分图像快速生成图像的尺度空间,同时利用三维Harris边缘判定准则去除边缘点,增强特征点的稳定性... 针对CT体数据的多尺度特征点检测计算量大、耗时长的问题,提出一种三维中心环绕特征快速检测算法。设计三维中心环绕特征检测子,结合三维积分图像快速生成图像的尺度空间,同时利用三维Harris边缘判定准则去除边缘点,增强特征点的稳定性。实验结果表明,相比于经典的三维Do G和SURF检测子,算法计算时间显著降低(检测时间约为三维Do G检测子的1/8,三维SURF检测子的1/2),同时相比于三维SURF检测子,特征点检测重复率也有一定程度的提高。最后,对三维中心环绕特征检测算法进行并行性分析,并分别从尺度空间生成和特征点搜索及边缘抑制两部分进行CUDA并行加速。实验结果表明,经CUDA加速后,算法能得到10倍左右的加速比,特征点检测过程耗时基本达到实际应用需求。 展开更多
关键词 三维特征点检测 三维中心环绕特征检测子 CT体数据 cuda并行加速
在线阅读 下载PDF
特征融合的双目半全局匹配算法及其并行加速实现 被引量:12
7
作者 吕倪祺 宋广华 杨波威 《中国图象图形学报》 CSCD 北大核心 2018年第6期874-886,共13页
目的在微小飞行器系统中,如何实时获取场景信息是实现自主避障及导航的关键问题。本文提出了一种融合中心平均Census特征与绝对误差(AD)特征、基于纹理优化的半全局立体匹配算法(ADCC-TSGM),并利用统一计算设备架构(CUDA)进行并行加速... 目的在微小飞行器系统中,如何实时获取场景信息是实现自主避障及导航的关键问题。本文提出了一种融合中心平均Census特征与绝对误差(AD)特征、基于纹理优化的半全局立体匹配算法(ADCC-TSGM),并利用统一计算设备架构(CUDA)进行并行加速。方法使用沿极线方向的一维差分计算纹理信息,使用中心平均Census特征及AD特征进行代价计算,通过纹理优化的SGM算法聚合代价并获得初始视差图;然后,通过左右一致性检验检查剔除粗略视差图中的不稳定点和遮挡点,使用线性插值和中值滤波对视差图中的空洞进行填充;最后,利用GPU特性,对立体匹配中的代价计算、半全局匹配(SGM)计算、视差计算等步骤使用共享内存、单指令多数据流(SIMD)及混合流水线进行优化以提高运行速度。结果在Quarter Video Graphics Array(QVGA)分辨率的middlebury双目图像测试集中,本文提出的ADCC-TSGM算法总坏点率较Semi-Global Block Matching(SGBM)算法降低36.1%,较SGM算法降低28.3%;平均错误率较SGBM算法降低44.5%,较SGM算法降低49.9%。GPU加速实验基于NVIDIA Jetson TK1嵌入式计算平台,在双目匹配性能不变的情况下,通过使用CUDA并行加速,可获得117倍以上加速比,即使相较于已进行SIMD及多核并行优化的SGBM,运行时间也减少了85%。在QVGA分辨率下,GPU加速后的运行帧率可达31.8帧/s。结论本文算法及其CUDA加速可为嵌入式平台提供一种实时获取高质量深度信息的有效途径,可作为微小飞行器、小型机器人等设备进行环境感知、视觉定位、地图构建的基础步骤。 展开更多
关键词 双目视觉 census特征 半全局匹配 cuda加速 并行计算
原文传递
虚拟手术流血模拟的GPU加速实现 被引量:1
8
作者 赖颢升 向辉 《中国图象图形学报》 CSCD 北大核心 2014年第10期1532-1538,共7页
目的流血效果是虚拟手术模拟器视觉效果的重要组成部分,血流与固体交互的庞大计算量使取得实时的流血模拟效果具有很大的挑战性。提出一种基于图形处理单元(GPU)加速的虚拟手术流血效果模拟方法。方法该方法以Maller等人提出的光滑粒子... 目的流血效果是虚拟手术模拟器视觉效果的重要组成部分,血流与固体交互的庞大计算量使取得实时的流血模拟效果具有很大的挑战性。提出一种基于图形处理单元(GPU)加速的虚拟手术流血效果模拟方法。方法该方法以Maller等人提出的光滑粒子动力学(SPH)作为基础,采用温度项使粒子具有不同速度模拟血流形成的血槽,同时基于构建均匀空间网格的思想,利用通用并行计算架构(CUDA)多线程并行加速技术完成粒子控制方程的求解和血流与固体交互的计算,从而取得实时的效果。结果实验结果表明,本文方法能够满足虚拟手术中切割表面流血和血液在器官中流动的模拟需求,在粒子个数为9000时仅需20 ms,对比于纯CPU的实现取得20.15倍的加速比,实现了大量粒子下的实时流血模拟。结论本文方法具有较好的灵活性和实时性的特点,可以应用于虚拟手术仿真系统之中。 展开更多
关键词 虚拟手术 流血模拟 光滑粒子动力学(SPH) cuda加速 温度项
原文传递
基于GPU加速的地震图像重建技术
9
作者 许盼兮 张东 孙尽尧 《半导体光电》 CAS CSCD 北大核心 2013年第5期852-857,共6页
针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行... 针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行运算架构。而FDTD正演算法本身在算法特性上满足并行的要求,二者的结合将极大地加速程序的计算速度。在基于标准Marmousi速度模型的正演模拟中,程序速度提升30倍,而GPU正演图像与CPU正演结果误差小于千分之一。算例表明CUDA可以大大加速目前的FDTD正演算法,并且随着GPU硬件自身的发展和计算架构的不断改进,加速效果还将进一步提升,这将有利于后续波形反演工作的进展。 展开更多
关键词 cuda加速 波形正演 声波方程 MARMOUSI模型
原文传递
光照不均匀的结构光图像的条纹快速提取方法 被引量:7
10
作者 郑红波 石豪 +2 位作者 杜轶诚 张美玉 秦绪佳 《计算机科学》 CSCD 北大核心 2019年第5期272-278,共7页
结构光图像的条纹提取易受不均匀光照的影响,而提取的条纹精度是后续三维重建精确与否的重要前提,因此,如何消除不均匀光照的影响,准确提取结构光图像的条纹是本文研究的目标。文中提出了一种结合高斯滤波和均值滤波的处理算法,适用于... 结构光图像的条纹提取易受不均匀光照的影响,而提取的条纹精度是后续三维重建精确与否的重要前提,因此,如何消除不均匀光照的影响,准确提取结构光图像的条纹是本文研究的目标。文中提出了一种结合高斯滤波和均值滤波的处理算法,适用于光照不均匀的结构光图像的条纹提取。该算法既可以有效地消除不均匀光照对图像的影响,又保留了原始图像的特征信息,取得了良好的实验效果。为了加速滤波处理过程,文中使用可分离滤波器对算法进行改进,降低了计算复杂度,又使用基于GPU并行计算的CUDA技术对算法进行加速,使处理速度得到较大的提高。 展开更多
关键词 条纹提取 不均匀光照 可分离滤波器 cuda加速
在线阅读 下载PDF
层次结构树木物理运动的实时仿真
11
作者 杨猛 吴恩华 《中国图象图形学报》 CSCD 北大核心 2011年第6期1112-1120,共9页
提出一种在GPU上实现基于力学运动原理的层次结构树木运动的并行仿真技术。该技术通过分析物理运动原理与多层次的矩阵结构(HMSM)算法的并行性,来达到将树木动画在图形硬件CUDA平台上进行加速的目的。首先介绍层次结构树木在外力诸如风... 提出一种在GPU上实现基于力学运动原理的层次结构树木运动的并行仿真技术。该技术通过分析物理运动原理与多层次的矩阵结构(HMSM)算法的并行性,来达到将树木动画在图形硬件CUDA平台上进行加速的目的。首先介绍层次结构树木在外力诸如风力等作用下的物理运动原理;然后,针对树木的物理运动以及层次结构叠加算法详细地进行并行性分析;之后着重阐述CUDA框架下树木运动的并行结构设计过程与并行算法的详细设计方法;最后在GPU上执行树木物理运动仿真。实验结果表明,该技术不但能够生成真实感较强的树木动画序列,还能够实时模拟基于物理的树木运动。同时,该技术给计算机动画的加速算法提供了很好的思想。 展开更多
关键词 树木动画 基于物理 层级结构 cuda加速 实时
原文传递
基于奇异值分解的橡胶密封圈表面缺陷检测方法 被引量:9
12
作者 黄连 刘晓军 +3 位作者 雷自力 顾浩 刘云峰 狄超雄 《润滑与密封》 CAS CSCD 北大核心 2021年第11期84-88,共5页
为解决橡胶密封圈表面缺陷人工检测效率低,缺陷提取困难等问题,提高橡胶密封圈缺陷在线检测速度及准确率,提出一种基于机器视觉的橡胶密封圈表面缺陷检测方法。该方法采用多相机多线程图像采集模式,采集橡胶密封圈的上下表面不同位置的... 为解决橡胶密封圈表面缺陷人工检测效率低,缺陷提取困难等问题,提高橡胶密封圈缺陷在线检测速度及准确率,提出一种基于机器视觉的橡胶密封圈表面缺陷检测方法。该方法采用多相机多线程图像采集模式,采集橡胶密封圈的上下表面不同位置的局部图像;对图像自适应中值滤波后进行边缘增强,并使用高斯差分算子提取轮廓粗边缘,利用Zernike矩获取亚像素边缘位置;针对边缘存在不连续点问题,使用Ceres库多项式拟合,估计断点位置,并更新所有边缘位置;根据边缘位置寻找出整张图像中橡胶密封圈表面图像区域,并将该环形兴趣区域映射到矩形区域中;将获得的图像进行奇异值分解(SVD),并通过连通域分析,提取出图像中的奇异区域,即存在缺陷的位置。经实验验证,基于奇异值分解的橡胶圈表面缺陷检测方法鲁棒性好、效率高,可以快速准确地寻找出橡胶密封圈表面缺陷信息。 展开更多
关键词 橡胶密封圈 高斯差分 ZERNIKE矩 Ceres拟合 cuda加速 奇异值分解
在线阅读 下载PDF
基于Sobel算子改进卷积神经网络的人脸识别 被引量:1
13
作者 黄剑 贺兴时 《渭南师范学院学报》 2018年第20期39-46,共8页
人脸识别是一项实用新技术,在使用过程中有很高的要求,目前对于人脸识别的研究多种多样,但在识别速率和准确度上很难达到人类视觉的效果。文章研究了在输入网络之前首先通过Sobel算子对人脸图片进行预处理,然后在卷积神经网络的基础上... 人脸识别是一项实用新技术,在使用过程中有很高的要求,目前对于人脸识别的研究多种多样,但在识别速率和准确度上很难达到人类视觉的效果。文章研究了在输入网络之前首先通过Sobel算子对人脸图片进行预处理,然后在卷积神经网络的基础上对网络结构和参数进行了改进,并采用SVM作为分类器,利用CUDA(Computer Unified Device Architecture)进行加速,使得网络的速度和识别率有了很大提高。最后将改进的网络与PCA、BP神经网络和传统CNN的人脸识别方法进行比较,结果表明改进的网络效果更优。 展开更多
关键词 人脸识别 SOBEL算子 卷积神经网络 Caffe环境 cuda加速
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部