期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
Parallel Image Processing: Taking Grayscale Conversion Using OpenMP as an Example 被引量:1
1
作者 Bayan AlHumaidan Shahad Alghofaily +2 位作者 Maitha Al Qhahtani Sara Oudah Naya Nagy 《Journal of Computer and Communications》 2024年第2期1-10,共10页
In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularl... In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularly noteworthy in the field of image processing, which witnessed significant advancements. This parallel computing project explored the field of parallel image processing, with a focus on the grayscale conversion of colorful images. Our approach involved integrating OpenMP into our framework for parallelization to execute a critical image processing task: grayscale conversion. By using OpenMP, we strategically enhanced the overall performance of the conversion process by distributing the workload across multiple threads. The primary objectives of our project revolved around optimizing computation time and improving overall efficiency, particularly in the task of grayscale conversion of colorful images. Utilizing OpenMP for concurrent processing across multiple cores significantly reduced execution times through the effective distribution of tasks among these cores. The speedup values for various image sizes highlighted the efficacy of parallel processing, especially for large images. However, a detailed examination revealed a potential decline in parallelization efficiency with an increasing number of cores. This underscored the importance of a carefully optimized parallelization strategy, considering factors like load balancing and minimizing communication overhead. Despite challenges, the overall scalability and efficiency achieved with parallel image processing underscored OpenMP’s effectiveness in accelerating image manipulation tasks. 展开更多
关键词 Parallel Computing Image processing openmp Parallel Programming High Performance Computing GPU (Graphic processing Unit)
在线阅读 下载PDF
Parallel Technologies with Image Processing Using Inverse Filter
2
作者 Rahaf Alsharhan Areej Muheef +2 位作者 Yasmin Al Ibrahim Afnan Rayyani Yasir Alguwaifli 《Journal of Computer and Communications》 2024年第1期110-119,共10页
Real-time capabilities and computational efficiency are provided by parallel image processing utilizing OpenMP. However, race conditions can affect the accuracy and reliability of the outcomes. This paper highlights t... Real-time capabilities and computational efficiency are provided by parallel image processing utilizing OpenMP. However, race conditions can affect the accuracy and reliability of the outcomes. This paper highlights the importance of addressing race conditions in parallel image processing, specifically focusing on color inverse filtering using OpenMP. We considered three solutions to solve race conditions, each with distinct characteristics: #pragma omp atomic: Protects individual memory operations for fine-grained control. #pragma omp critical: Protects entire code blocks for exclusive access. #pragma omp parallel sections reduction: Employs a reduction clause for safe aggregation of values across threads. Our findings show that the produced images were unaffected by race condition. However, it becomes evident that solving the race conditions in the code makes it significantly faster, especially when it is executed on multiple cores. 展开更多
关键词 PARALLEL PARALLELIZATION Image processing Inverse Filtering openmp Race Conditions
在线阅读 下载PDF
基于OpenMP的分子动力学并行算法的性能分析与优化 被引量:10
3
作者 白明泽 程丽 +1 位作者 豆育升 孙世新 《计算机应用》 CSCD 北大核心 2012年第1期163-166,共4页
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三... 为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。 展开更多
关键词 分子动力学 并行计算 多核中央处理器 openmp 临界区
在线阅读 下载PDF
基于OpenMP的遥感影像并行ISODATA聚类研究 被引量:11
4
作者 刘扬 王鹏 +4 位作者 杨瑞 左宪禹 张周威 吴晓洋 渠涧涛 《计算机工程》 CAS CSCD 北大核心 2016年第7期238-243,250,共7页
针对传统影像分类算法执行效率较低,无法满足海量高分辨率遥感数据实时处理需求的问题,对资源三号卫星专题产品中遥感影像的迭代自组织数据分析算法进行分析与研究,设计一种基于OpenMP的并行ISODATA聚类算法(PIsodata Omp)。采用OpenMP... 针对传统影像分类算法执行效率较低,无法满足海量高分辨率遥感数据实时处理需求的问题,对资源三号卫星专题产品中遥感影像的迭代自组织数据分析算法进行分析与研究,设计一种基于OpenMP的并行ISODATA聚类算法(PIsodata Omp)。采用OpenMP技术优化ISODATA算法中的样本点聚类、聚类样本中心标准差计算,实现基于共享内存的单机多核并行化处理。实验结果表明,PIsodata Omp算法能在保证分类精度不变的情况下,明显提高资源三号卫星影像数据的处理速度。 展开更多
关键词 并行聚类 迭代自组织数据分析算法 openmp技术 遥感影像分类 多核处理
在线阅读 下载PDF
基于MPI+OpenMP混合模型的并行地震数据处理支撑库的研究 被引量:3
5
作者 李肯立 杨进 +1 位作者 彭成斌 秦云川 《计算机工程与科学》 CSCD 2007年第12期136-139,142,共5页
计算机集群技术已经引起了石油地球物理界的广泛关注,如何将现有地震数据处理模块快速、高效地移植到集群上已成为地震数据处理需要解决的重大课题。本文将现有的基于消息传递(MPI)的并行地震处理模型与共享存储(OpenMP)模型相结合,实... 计算机集群技术已经引起了石油地球物理界的广泛关注,如何将现有地震数据处理模块快速、高效地移植到集群上已成为地震数据处理需要解决的重大课题。本文将现有的基于消息传递(MPI)的并行地震处理模型与共享存储(OpenMP)模型相结合,实现了一个适合于SMP集群的并行地震数据支撑库,将涉及到消息传递的并行地震数据操作以直观的API的形式提供给开发人员。本文利用支撑库提供的API开发了一些测试模块。实验证明,支撑库可支持现有地震数据处理和显示模块的多种并行计算模型,并且能够获得较高的并行加速比和计算效率。 展开更多
关键词 集群 并行地震数据处理 支撑库 openmp MPI
在线阅读 下载PDF
OpenMP在信息系统中的应用 被引量:4
6
作者 钱葵东 蹇成刚 《指挥信息系统与技术》 2011年第5期81-84,88,共5页
传统的信息系统是基于单核处理器而研发的,如何充分利用多核处理器资源,如何将并行处理技术引入信息系统,已经成为一个重要课题。介绍了面向共享内存的多处理器、多线程并行编程语言——OpenMP,并探讨了OpenMP程序在信息系统中的应用。
关键词 openmp 信息系统 并行处理技术 多核处理器 多线程
在线阅读 下载PDF
基于MPI+OpenMP混合编程模型的并行声纳信号处理技术研究 被引量:4
7
作者 胡银丰 孔强 《舰船电子工程》 2017年第12期130-133,共4页
针对多核分布式共享存储集群的特点,提出了一种基于MPI+OpenMP混合编程模型的声纳信号处理并行计算技术,该模型结合了消息传递和共享存储两者的优点,为现代声纳信号处理中海量数据的实时处理及复杂算法的实时实现提供了解决方案。
关键词 声纳信号处理 并行计算 MPI openmp
在线阅读 下载PDF
面向嵌入式多核的OpenMP扩展方法(英文)
8
作者 王庆 季振洲 刘涛 《计算机科学与探索》 CSCD 2011年第1期81-86,共6页
为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标。在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行。针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌... 为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标。在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行。针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌入式多核平台上的运行效率。扩展后的OpenMP并行程序支持循环分片,从而能够充分利用层次内存结构。实验结果证明,该方法在嵌入式多核平台上的运行性能能够提高10%。 展开更多
关键词 嵌入式多核 openmp 循环分片
在线阅读 下载PDF
Highly integrated all-optical nonlinear deep neural network for multi-thread processing 被引量:2
9
作者 Jialong Zhang Bo Wu +5 位作者 Shiji Zhang Junwei Cheng Yilun Wang Hailong Zhou Jianji Dong Xinliang Zhang 《Advanced Photonics》 2025年第4期91-100,共10页
Optical neural networks have emerged as feasible alternatives to their electronic counterparts,offering significant benefits such as low power consumption,low latency,and high parallelism.However,the realization of ul... Optical neural networks have emerged as feasible alternatives to their electronic counterparts,offering significant benefits such as low power consumption,low latency,and high parallelism.However,the realization of ultra-compact nonlinear deep neural networks and multi-thread processing remain crucial challenges for optical computing.We present a monolithically integrated all-optical nonlinear diffractive deep neural network(AON-D^(2) NN)chip for the first time.The all-optical nonlinear activation function is implemented using germanium microstructures,which provide low loss and are compatible with the standard silicon photonics fabrication process.Assisted by the germanium activation function,the classification accuracy is improved by 9.1%for four-classification tasks.In addition,the chip's reconfigurability enables multi-task learning in situ via an innovative cross-training algorithm,yielding two task-specific inference results with accuracies of 95%and 96%,respectively.Furthermore,leveraging the wavelength-dependent response of the chip,the multi-thread nonlinear optical neural network is implemented for the first time,capable of handling two different tasks in parallel.The proposed AON-D^(2)NN contains three hidden layers with a footprint of only 0.73 mm^(2).It can achieve ultra-low latency(172 ps),paving the path for realizing high-performance optical neural networks. 展开更多
关键词 NONLINEARITY diffractive neural network multi-thread processing
原文传递
MPI+OpenMP算法在三维可压缩流场计算中的应用 被引量:1
10
作者 许啸 王学德 谭俊杰 《航空计算技术》 2011年第6期32-36,共5页
在多核CPU集群并行体系结构下,采用MPI+OpenMP的混合并行算法,对可压缩流场进行数值模拟,并在计算时间上与MPI算法进行比较。流场计算的控制方程为Euler方程,空间离散采用Jameson中心差分格式,时间离散采用R-K法,并行模式采用Master/Sl... 在多核CPU集群并行体系结构下,采用MPI+OpenMP的混合并行算法,对可压缩流场进行数值模拟,并在计算时间上与MPI算法进行比较。流场计算的控制方程为Euler方程,空间离散采用Jameson中心差分格式,时间离散采用R-K法,并行模式采用Master/Slave模式。通过对M6机翼和某弹丸采用多种并行方法进行流场的数值模拟,得出MPI+OpenMP混合算法在一定条件下具有高效性的结论。 展开更多
关键词 有限体积法 并行计算 进程 线程 MPI+openmp混合算法
在线阅读 下载PDF
基于OPENMP的高性能GNSS法方程解算方法研究 被引量:3
11
作者 杨凯 《大地测量与地球动力学》 CSCD 北大核心 2013年第1期141-144,共4页
在大规模GNSS基准站网数据处理中,全网整体数据处理可以避免由于分子网解算而带来的子网划分、公共站选取等技术难点,在一定程度上维持了数学模型的严密性。针对大规模GNSS基准站网数据处理中存在的技术难点,给出了同时处理测站数量受限... 在大规模GNSS基准站网数据处理中,全网整体数据处理可以避免由于分子网解算而带来的子网划分、公共站选取等技术难点,在一定程度上维持了数学模型的严密性。针对大规模GNSS基准站网数据处理中存在的技术难点,给出了同时处理测站数量受限制(不能超过100个)的解决方法,比较了滤波算法与最小二乘估计算法的优劣,对比分析了现有法方程解算方法的效率,实现了基于OPENMP的并行乔里斯基分解法方程求逆方法,通过实际算例验证了其解算的高效率。 展开更多
关键词 GNSS基准站网 openmp 法方程解算 数据处理 测站数量
在线阅读 下载PDF
利用OpenMP技术实现线性方程组并行求解 被引量:2
12
作者 徐胜利 《信息网络安全》 2013年第5期70-72,共3页
文章介绍了OpenMP的并行执行原理和语言规范,讨论了OpenMP的循环并行化、迭代相关、数据共享、任务调度等问题。接着研究了高斯-约当消元法固有的并行性,提出并行高斯-约当消元法,并基于多处理器平台HPZ620进行了测试。实验结果表明,理... 文章介绍了OpenMP的并行执行原理和语言规范,讨论了OpenMP的循环并行化、迭代相关、数据共享、任务调度等问题。接着研究了高斯-约当消元法固有的并行性,提出并行高斯-约当消元法,并基于多处理器平台HPZ620进行了测试。实验结果表明,理论分析与实验结果是一致的。 展开更多
关键词 openmp 多处理器 高斯-约当消元法 并行处理
在线阅读 下载PDF
基于MPI与OpenMP混合编程的一种过程神经网络算法
13
作者 于文韬 孙丽媛 《长江大学学报(自科版)(上旬)》 CAS 2010年第3期417-419,共3页
针对过程神经网络训练时间长的问题,提出了一种基于MPI与OpenMP混合编程的过程神经网络算法,该算法基于标准梯度下降过程神经网络的批处理模式,应用MPI与OpenMP编程技术,在局域网内实现多台计算机组成机群,并进行了不同数量级下的样本... 针对过程神经网络训练时间长的问题,提出了一种基于MPI与OpenMP混合编程的过程神经网络算法,该算法基于标准梯度下降过程神经网络的批处理模式,应用MPI与OpenMP编程技术,在局域网内实现多台计算机组成机群,并进行了不同数量级下的样本集的训练。试验证明,在适当选取并行粒度的情况下,基于MPI与OpenMP编程技术的数据并行算法可以加快训练速度。 展开更多
关键词 MPI openmp 梯度下降法 过程神经网络
在线阅读 下载PDF
一种基于OpenMP多核并行机制的基带数据处理方法 被引量:4
14
作者 党妮 范志芳 《空间电子技术》 2022年第2期78-82,共5页
针对遥感卫星地面基带处理速率低、效率不高、稳定性差等问题,提出一种基于OpenMP多核并行机制的基带数据处理方法。通过在系统平台上建立多个线程,将数据处理分解到多线程中进行并行处理。以真实的卫星数据作为测试源,在压缩比为4∶1... 针对遥感卫星地面基带处理速率低、效率不高、稳定性差等问题,提出一种基于OpenMP多核并行机制的基带数据处理方法。通过在系统平台上建立多个线程,将数据处理分解到多线程中进行并行处理。以真实的卫星数据作为测试源,在压缩比为4∶1和无损模式下,从时间、解码速度、CPU占用、内存、设备资源利用率等指标对基带处理方法性能进行评估。评估结果表明,基于OpenMP并行化处理方法的解压缩软件,在充分利用硬件平台性能的基础上,实现了4倍解压缩速率的提升,显著提升了实时性。 展开更多
关键词 数据处理 openmp 多线程 设备资源利用率
在线阅读 下载PDF
基于OpenMP的并行空间电磁分布计算 被引量:3
15
作者 邴丕浩 钟立俊 +1 位作者 严少虎 邹钊 《电子信息对抗技术》 2015年第2期75-78,共4页
获得空间电磁场场强分布是电磁频谱管理的重要任务之一,研究如何提高其计算性能以适应快速变化的空间电磁环境具有重要的意义。OpenMP(Open Multi Processing)是一种简单快速提高计算效率的方式,它有助于CPU多核资源被充分利用。提出了... 获得空间电磁场场强分布是电磁频谱管理的重要任务之一,研究如何提高其计算性能以适应快速变化的空间电磁环境具有重要的意义。OpenMP(Open Multi Processing)是一种简单快速提高计算效率的方式,它有助于CPU多核资源被充分利用。提出了一种基于Open MP的并行获得空间电磁场场强分布方法,通过合理分析计算过程,设计相应并行方案,使得设计的并行算法适合CPU多核处理方式,并行度高。大量实验结果表明,该并行算法明显提高了计算效率,且具有高可扩展性。 展开更多
关键词 多核 openmp 电磁分布 并行计算 高效 可扩展性
在线阅读 下载PDF
Time-dependent Density Functional-based Tight-bind Method Efficiently Implemented with OpenMP Parallel and GPU Acceleration
16
作者 Guo-hong Fan Ke-li Han Guo-zhong He 《Chinese Journal of Chemical Physics》 SCIE CAS CSCD 2013年第6期635-645,I0003,共12页
The time-dependent density functional-based tight-bind (TD-DFTB) method is implemented on the multi-core and the graphical processing unit (GPU) system for excited state calcu-lations of large system with hundreds... The time-dependent density functional-based tight-bind (TD-DFTB) method is implemented on the multi-core and the graphical processing unit (GPU) system for excited state calcu-lations of large system with hundreds or thousands of atoms. Sparse matrix and OpenMP multithreaded are used for building the Hamiltonian matrix. The diagonal of the eigenvalue problem in the ground state is implemented on the GPUs with double precision. The GPU- based acceleration fully preserves all the properties, and a considerable total speedup of 8.73 can be achieved. A Krylov-space-based algorithm with the OpenMP parallel and CPU acceleration is used for finding the lowest eigenvalue and eigenvector of the large TDDFT matrix, which greatly reduces the iterations taken and the time spent on the excited states eigenvalue problem. The Krylov solver with the GPU acceleration of matrix-vector product can converge quickly to obtain the final result and a notable speed-up of 206 times can be observed for system size of 812 atoms. The calculations on serials of small and large systems show that the fast TD-DFTB code can obtain reasonable result with a much cheaper computational requirement compared with the first-principle results of CIS and full TDDFT calculation. 展开更多
关键词 Density-functional theory Tight-binding method Time-dependent densityfunctional theory Excited state Graphical processing unit Krylov iterative algorithm Sparse matrix openmp
在线阅读 下载PDF
基于MPI+OpenMP的雷达信号脉内分析并行加速方法
17
作者 姚群 童真 柴恒 《舰船电子对抗》 2023年第4期66-69,79,共5页
雷达脉内分析一般采用中频数据,数据量大,处理算法复杂,运算量大,实时性差。基于多节点高性能多核CPU信号处理平台,提出了一种基于消息传递接口(MPI)+开放式多处理(OpenMP)的雷达信号脉内分析技术,综合利用了MPI跨节点并行以及OpenMP节... 雷达脉内分析一般采用中频数据,数据量大,处理算法复杂,运算量大,实时性差。基于多节点高性能多核CPU信号处理平台,提出了一种基于消息传递接口(MPI)+开放式多处理(OpenMP)的雷达信号脉内分析技术,综合利用了MPI跨节点并行以及OpenMP节点内并行的特点,实现了雷达信号脉内分析的高性能脉冲级并行处理。在基于IntelXeon2640构建的多节点集群系统上的测试结果表明,该方法显著的提高了脉内分析的处理速度。 展开更多
关键词 信号处理 消息传递接口 openmp 脉内分析
在线阅读 下载PDF
Multi-threaded code generation from Signal program to OpenMP 被引量:2
18
作者 Kai HU Teng ZHANG Zhibin YANG 《Frontiers of Computer Science》 SCIE EI CSCD 2013年第5期617-626,共10页
The use of multi-core processors will become a trend in safety critical systems. For safe execution of multi- threaded code, automatic code generation from formal spec- ification is a desirable method. Signal, a synch... The use of multi-core processors will become a trend in safety critical systems. For safe execution of multi- threaded code, automatic code generation from formal spec- ification is a desirable method. Signal, a synchronous lan- guage dedicated for the functional description of safety crit- ical systems, provides soundness semantics for determinis- tic concurrency. Although sequential code generation of Sig- nal has been implemented in Polychrony compiler, deter- ministic multi-threaded code generation strategy is still far from mature. Moreover, existing code generation methods use certain multi-thread library, which limits the cross plat- form executions. OpenMP is an application program inter- face (API) standard for parallel programming, supported by several mainstream compilers from different platforms. This paper presents a methodology translating Signal program to OpenMP-based multi-threaded C code. First, the intermedi- ate representation of the core syntax of Signal using syn- chronous guarded actions is defined. Then, according to the compositional semantics of Signal equations, the Signal pro- gram is synthesized to dependency graph (DG). After par- allel tasks are extracted from dependency graph, the Signal program can be finally translated into OpenMP-based C code which can be executed on multiple platforms. 展开更多
关键词 multi-thread synchronous language Signal code generation openmp
原文传递
基于国产高性能CPU的信号处理平台设计
19
作者 刘豪 李超 《现代导航》 2025年第5期380-385,共6页
针对雷达信号处理带宽不足问题,基于国产高性能CPU设计信号处理平台。首先,基于国产高性能920模组设计硬件板卡并构建硬件测试平台;其次,根据固件、操作系统、中间件和编译软件搭建软件开发环境;接着,利用矢量、信号和图像处理函数库(VS... 针对雷达信号处理带宽不足问题,基于国产高性能CPU设计信号处理平台。首先,基于国产高性能920模组设计硬件板卡并构建硬件测试平台;其次,根据固件、操作系统、中间件和编译软件搭建软件开发环境;接着,利用矢量、信号和图像处理函数库(VSIPL)软件编写规范设计信号处理应用软件;最后,基于雷达波形数据测试信号处理平台处理时效性。结果表明,在处理点数较大时,采用改进VSIPL中间件进行OpenMP多线程信号处理效果较好,可大幅缩减信号处理时间,具有一定的工程应用价值。 展开更多
关键词 920模组 矢量、信号和图像处理函数库中间件 openmp多线程处理 信号处理
在线阅读 下载PDF
多核系统的小波包并行算法及其在电力系统数据压缩中的应用 被引量:5
20
作者 鲁晓帆 刘志刚 吴峰 《电力自动化设备》 EI CSCD 北大核心 2013年第5期130-135,共6页
利用多核并行技术,使用Pthreads与OpenMP并行编程环境在单机双核平台上开发小波包并行算法。通过分析串行算法潜在并行性,基于Pthreads将小波包分解数据分组并分配给不同的线程,由线程并行处理;根据小波包重构对象不同,重构过程实现并... 利用多核并行技术,使用Pthreads与OpenMP并行编程环境在单机双核平台上开发小波包并行算法。通过分析串行算法潜在并行性,基于Pthreads将小波包分解数据分组并分配给不同的线程,由线程并行处理;根据小波包重构对象不同,重构过程实现并行处理近似重构与细节重构。基于OpenMP适当分解循环体,得出小波包嵌套与非嵌套并行算法,并将这些算法应用于电力系统海量数据压缩。与串行小波包算法的耗时比较表明,并行算法的速度可以达到接近串行算法的2倍,显著提高了小波包在电力系统应用中的计算速度及电力系统数据压缩效率。 展开更多
关键词 并行 openmp Pthreads 小波包 数据压缩 电力系统 数据处理
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部