期刊文献+
共找到1,169篇文章
< 1 2 59 >
每页显示 20 50 100
一种集成于超算作业调度系统应用的并行参数优化方法
1
作者 张文帅 李会民 +1 位作者 李京 潘必才 《计算机工程》 北大核心 2025年第7期59-67,共9页
随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率... 随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率影响很大。随着计算规模与复杂度的提升,多个并行参数的可配置空间越来越大,用户越来越难以确定最佳的并行参数值。这类运行时优化问题在科学计算应用中较为普遍,但相关的研究与解决方法比较少见。以VASP(Vienna Ab initio Simulation Package)应用为例,首先分析了该应用的多层并行结构,展示了不同并行参数配置引发的巨大运行速度差异。然后提出了一个基于约化并行效率指标的全自动运行优化方法,其不仅可以帮助用户简单快捷地确定最佳应用并行参数,而且可以帮助用户确定最佳的计算资源使用量,使应用可以高效率地扩展到大规模的并行计算中。最后将该优化方法与计算集群作业调度系统相融合应用于用户提交的真实VASP计算作业。统计结果表明,该方法显著提升了作业运行速度与超算资源的使用效率,具有很好的工程应用前景。 展开更多
关键词 并行计算 作业调度 运行时优化 超级计算 VASP应用
在线阅读 下载PDF
基于Slurm的气象高性能计算资源调度管理及应用
2
作者 沈瑜 孙婧 李娟 《计算机技术与发展》 2025年第11期180-187,共8页
针对气象数值预报应用的特点及气象高性能计算资源调度管理的需求,基于Slurm(Simple Linux Utility for Resource Management)作业调度系统,在中国气象局派-曙光高性能计算机系统上提出了一套精细化的资源调度管理方法。该方法通过优化... 针对气象数值预报应用的特点及气象高性能计算资源调度管理的需求,基于Slurm(Simple Linux Utility for Resource Management)作业调度系统,在中国气象局派-曙光高性能计算机系统上提出了一套精细化的资源调度管理方法。该方法通过优化调度策略与灵活的资源分区配置,从系统层面实现了气象实时业务运行保障与作业吞吐量、调度效率之间的平衡,实现了资源的高效利用;同时,引入服务质量(QoS)机制,动态调整作业优先级与资源配额,从用户层面进一步确保了资源分配的公平性与调度灵活性。系统资源使用及作业运行数据表明,该方法在保障气象实时业务稳定运行的同时,有效提高了研发作业的完成效率,确保系统整体资源的高效利用,在派-曙光高性能计算机系统上取得了良好的应用效果,对高性能计算资源在复杂应用场景下的合理调度和利用具有很好的实用性和参考意义。 展开更多
关键词 气象高性能计算 资源调度 Slurm 分区管理 服务质量
在线阅读 下载PDF
基于服务器无感知计算架构的并行计算通信框架
3
作者 袁雨馨 李庆文 +1 位作者 史骁 赵晓芳 《高技术通讯》 北大核心 2025年第6期590-603,共14页
随着云计算技术的发展与成熟,并行计算在云环境中得到了越来越多的实践。服务器无感知计算作为云计算中的一种新型的应用部署与计算方式,允许用户弹性分配资源并实现负载均衡,并提供了更强的可扩展性和更大的灵活性。然而,无状态的特性... 随着云计算技术的发展与成熟,并行计算在云环境中得到了越来越多的实践。服务器无感知计算作为云计算中的一种新型的应用部署与计算方式,允许用户弹性分配资源并实现负载均衡,并提供了更强的可扩展性和更大的灵活性。然而,无状态的特性导致服务器无感知计算框架并不完全适用于传统并行计算,其中通信是一个关键问题。本文提出了一个具有服务质量(quality of service,QoS)保障的通信框架FreeParallel,旨在基于服务器无感知计算中的函数即服务(function as a service,FaaS)平台构建面向并行计算的通信能力。FreeParallel结合了消息传递接口(message passing interface,MPI)并行计算编程模型,有效地保证了通信服务的质量;并采用代理模型来支持并行函数的识别和转换,并以服务形式灵活部署在多个FaaS或虚拟化平台上。此外,本研究还提出了函数间通信流量的QoS管理策略fm Clock,在保证传输公平性的前提下,实现基于请求和限制的通信原语级网络资源分配。实验结果表明,点对点通信场景下FreeParallel与虚拟化平台的覆盖网络相比传输性能略有不足,但比当前服务器无感知计算状态共享方案的传输效率有至少89.5%的提升。并且FreeParallel在集合通信场景下表现极佳,比基线方法提升了59.9%~83.1%。同时,带有fm Clock策略的FreeParallel能够实现原语级按比例分配策略,避免了不同原语间请求的交叉干扰,案例表明,策略的加入降低了应用25.0%的完成时间。 展开更多
关键词 服务器无感知计算 消息传递接口并行计算 服务质量保障 弹性资源分配
在线阅读 下载PDF
基于国产加速器的三维卷积前向算子优化
4
作者 姬晨晨 陈永青 韩孟之 《计算机工程》 北大核心 2025年第2期250-258,共9页
目前三维卷积神经网络(3D CNN)的应用场景越来越广泛,其能够从原始数据中提取更丰富、更具判别性的特征信息,在处理3D数据、特征提取和实际应用等方面具有重要意义。然而,从二维(2D)数据到3D数据的转变导致了卷积运算的数据量和计算量... 目前三维卷积神经网络(3D CNN)的应用场景越来越广泛,其能够从原始数据中提取更丰富、更具判别性的特征信息,在处理3D数据、特征提取和实际应用等方面具有重要意义。然而,从二维(2D)数据到3D数据的转变导致了卷积运算的数据量和计算量均呈指数级增长,对计算资源和时间的需求也相应增加,这会导致训练和推理过程更加耗时,特别是在处理大规模3D数据时尤为明显。针对以上问题,提出一种基于国产加速器的隐式卷积算法,对3D卷积的前向计算过程进行优化。首先,该算法结合了硬件特点和并行化思路,利用索引直接访问所需计算的数据地址,无须开辟新的内存空间,大幅节省内存开销;其次,考虑到国产加速器具有高度并行的计算结构和丰富的计算资源,适合处理大规模数据和复杂的计算任务,结合国产加速器的计算能力和架构特点,采用一系列特定的异构并行优化算法,加速3D卷积前向算子的计算过程,提高计算效率和性能。实验结果表明,自研算子性能远超国产计算平台现有算子的最优性能,在多数情况下与NVIDIA V100之间的能效比可以达到70%甚至更高。 展开更多
关键词 三维卷积 国产加速器 隐式卷积算法 索引机制 前向算子优化 并行优化算法
在线阅读 下载PDF
FDTD算法的网络并行运算实现 被引量:29
5
作者 薛正辉 杨仕明 +1 位作者 高本庆 张泽杰 《电子学报》 EI CAS CSCD 北大核心 2003年第12期1839-1843,共5页
本文提出了FDTD方法在微机互连构成的机群 (COW)并行计算系统上以消息传递方式执行的一种实现方案 .组成了验证性的机群并行计算系统 ,以一维和三维典型算例验证了算法的可行性、正确性和高效性 ,为运用FDTD方法进行电大尺寸复杂电磁问... 本文提出了FDTD方法在微机互连构成的机群 (COW)并行计算系统上以消息传递方式执行的一种实现方案 .组成了验证性的机群并行计算系统 ,以一维和三维典型算例验证了算法的可行性、正确性和高效性 ,为运用FDTD方法进行电大尺寸复杂电磁问题数值模拟计算提供了一条有效的途径 。 展开更多
关键词 时域有限差分法 机群系统 并行虚拟机 并行计算 FDTD
在线阅读 下载PDF
二分K均值聚类算法优化及并行化研究 被引量:23
6
作者 张军伟 王念滨 +1 位作者 黄少滨 蔄世明 《计算机工程》 CAS CSCD 北大核心 2011年第17期23-25,共3页
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均... 二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。 展开更多
关键词 数据挖掘 聚类算法 二分K均值 并行化 群集系统
在线阅读 下载PDF
高性能并行集群计算环境的构建与性能测试 被引量:20
7
作者 王小伟 郭力 +1 位作者 葛蔚 杨章远 《小型微型计算机系统》 CSCD 北大核心 2004年第3期325-328,共4页
高性能并行集群系统在大规模科学计算中发挥着越来越重要的作用 .本文介绍了一个集群系统的硬件和软件环境的设置 。
关键词 并行计算 并行集群系统 性能测试 硬件环境 软件环境
在线阅读 下载PDF
基于Linux的Beowulf集群的实现 被引量:17
8
作者 李贵明 俞国扬 罗家融 《计算机工程》 CAS CSCD 北大核心 2003年第11期49-51,共3页
中国科学院等离子体物理研究所是国内从事核聚变研究和托卡马克(Tokamak)实 验的主要基地,由于实验研究的需要,有必要建立自己的大型并行计算机系统,进行托卡马 克实验的数值模拟等研究课题?文章介绍了在普通PC机上利用Linux操作系统实... 中国科学院等离子体物理研究所是国内从事核聚变研究和托卡马克(Tokamak)实 验的主要基地,由于实验研究的需要,有必要建立自己的大型并行计算机系统,进行托卡马 克实验的数值模拟等研究课题?文章介绍了在普通PC机上利用Linux操作系统实现基于分布 存储结构的Beowulf集群系统的方法,同时也介绍了基于消息传递模型 (Message Passing I nterface,MPI)的并行程序设计方法? 展开更多
关键词 并行计算 TOKAMAK BEOWULF Linux 分布存储 消息传递接口
在线阅读 下载PDF
SIMD技术与向量数学库研究 被引量:10
9
作者 解庆春 张云泉 +2 位作者 王可 李焱 许亚武 《计算机科学》 CSCD 北大核心 2011年第7期298-301,共4页
首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell ... 首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell SDK函数,因其独特的体系结构,多个向量处理单元带来的平均加速比为10。最后,通过测试结果的对比,发现不同数学库中的向量函数之间在性能方面也存在着差异,并对差异原因进行了分析,得出性能差异主要是处理器架构和向量计算单元个数和访存等因素造成的。 展开更多
关键词 向量化 SSE MMX 3DNow! SIMD
在线阅读 下载PDF
基于极大安全通路向量的超立方体容错路由 被引量:11
10
作者 王雷 林亚平 +1 位作者 陈治平 文学 《通信学报》 EI CSCD 北大核心 2004年第4期130-137,共8页
针对超立方体结构的多处理机系统中存在链路故障的情况,提出了用于最优通路记录的极大安全通路向量的概念,给出了一个建立MSPV及其容错路由算法。证明了MSPV通过n-1轮邻节点之间的信息交换,能以向量的形式记录最多的最优通路;与基于安... 针对超立方体结构的多处理机系统中存在链路故障的情况,提出了用于最优通路记录的极大安全通路向量的概念,给出了一个建立MSPV及其容错路由算法。证明了MSPV通过n-1轮邻节点之间的信息交换,能以向量的形式记录最多的最优通路;与基于安全向量及扩展安全向量的容错路由算法相比,MSPV是SV以及ESV的最大扩展,解决了如何用向量的形式来记录最多最优通路的问题. 展开更多
关键词 计算机应用技术 容错路由 极大安全通路向量 超立方体
在线阅读 下载PDF
基于Hadoop平台的改进关联规则挖掘算法 被引量:15
11
作者 王英博 马菁 +1 位作者 柴佳佳 赵彬 《计算机工程》 CAS CSCD 北大核心 2016年第10期69-74,79,共7页
数据采集方式的增多导致单处理器下的关联规则挖掘受到I/O和内存的限制。针对该问题,对传统挖掘算法进行改进。借助Hadoop平台的优势,通过累加迭代的方法降低算法的时间复杂度,并利用MapReduce编程特点,通过一次遍历和MapReduce任务调... 数据采集方式的增多导致单处理器下的关联规则挖掘受到I/O和内存的限制。针对该问题,对传统挖掘算法进行改进。借助Hadoop平台的优势,通过累加迭代的方法降低算法的时间复杂度,并利用MapReduce编程特点,通过一次遍历和MapReduce任务调度完成频繁项集挖掘,在强关联挖掘中通过Sqoop组件将外部表Hive中的数据迁移到Redis,实现数据的高速读取。实验结果表明,该方法可有效提高挖掘效率,提高幅度随数据集规模同步增大,并且具有较好的加速比和扩展性。 展开更多
关键词 HADOOP平台 MapReduce编程 关联规则 大数据 数据挖掘
在线阅读 下载PDF
一种基于预测的动态负载均衡模型及算法研究 被引量:9
12
作者 陈志刚 许伟 曾志文 《计算机工程》 CAS CSCD 北大核心 2004年第23期87-89,共3页
提出了一种基于负载预测的动态负载均衡方法,它改变了一般动态负载均衡方法中负载信息采集过时的情况,有效解决了负载迁移的抖动问题,提高了平衡系统的性能。给出了该方法的实现模型、算法,并进行了性能分析,最后给出了实验结果。
关键词 动态负载均衡 负载迁移 负载信息 负载预测 实现模型 算法研究 平衡系统 抖动 性能分析 有效解
在线阅读 下载PDF
基于Fluent的绕流问题的数值模拟与并行计算 被引量:15
13
作者 辛晓华 张武 周华 《计算机工程与设计》 CSCD 北大核心 2005年第8期2153-2154,2200,共3页
使用商用软件Fluent对二维不可压流问题进行了两次实验,两次实验的网格数相差很多,发现当网格数少的时候,并行计算反而不如单机的效果好;而当网格数足够大的时候,并行计算就显示出其优越性来,目的在于考察Fluent软件的并行计算能力,为... 使用商用软件Fluent对二维不可压流问题进行了两次实验,两次实验的网格数相差很多,发现当网格数少的时候,并行计算反而不如单机的效果好;而当网格数足够大的时候,并行计算就显示出其优越性来,目的在于考察Fluent软件的并行计算能力,为进行大规模工程应用计算提供技术参照。 展开更多
关键词 FLUENT PARALLEL FLUENT 绕流 数值模拟 并行计算
在线阅读 下载PDF
用PC机群组构并行超级计算机 被引量:17
14
作者 黎康保 陶文正 +1 位作者 许丽华 黎文楼 《计算机工程》 CAS CSCD 北大核心 2000年第9期1-3,共3页
美国由高等院校、大型实验室和研究部门共同研究推出PC群机Beowulf超级计算机.这一创举,说明超级计算机可以用大众化的PC机集群来完成,这对我国是一个挑战和机遇.这里对Beowulf作了一些研究的基础上,论述了PC... 美国由高等院校、大型实验室和研究部门共同研究推出PC群机Beowulf超级计算机.这一创举,说明超级计算机可以用大众化的PC机集群来完成,这对我国是一个挑战和机遇.这里对Beowulf作了一些研究的基础上,论述了PC群机的结构组成原理,操作系统平台和并行计算秩序设计、并行通信程序设计等问题. 展开更多
关键词 并行计算机群机 PC集群技术 LINUX应用 MPI应用
在线阅读 下载PDF
HPMR:多核集群上的高性能计算支撑平台 被引量:11
15
作者 郑启龙 王昊 +1 位作者 吴晓伟 房明 《微电子学与计算机》 CSCD 北大核心 2008年第9期21-23,27,共4页
HPMR是建立在多核集群上的高性能计算支撑平台,它继承并改进了MapRedcue并行编程模式,使其适合高性能计算需求.HPMR让并行程序的编写和运行变得非常简单,同时又保持很高的性能.HPMR的实用功能不但使并行程序变得易于扩展和移植,而且增... HPMR是建立在多核集群上的高性能计算支撑平台,它继承并改进了MapRedcue并行编程模式,使其适合高性能计算需求.HPMR让并行程序的编写和运行变得非常简单,同时又保持很高的性能.HPMR的实用功能不但使并行程序变得易于扩展和移植,而且增强了并行程序的健壮性. 展开更多
关键词 高性能计算 多核 平台 MAPREDUCE
在线阅读 下载PDF
基于空间聚类的矢量空间数据并行计算划分方法 被引量:7
16
作者 邱强 方雷 +1 位作者 姚晓 方金云 《高技术通讯》 CAS CSCD 北大核心 2015年第4期327-333,共7页
为了解决并行矢量空间分析在数据划分阶段的负载均衡问题,研究了矢量空间数据的划分,提出了一种基于空间聚类思想的矢量空间数据划分方法。该方法充分考虑矢量空间数据规模以及空间邻近性特征对并行空间分析算法效率的影响,首先采用空... 为了解决并行矢量空间分析在数据划分阶段的负载均衡问题,研究了矢量空间数据的划分,提出了一种基于空间聚类思想的矢量空间数据划分方法。该方法充分考虑矢量空间数据规模以及空间邻近性特征对并行空间分析算法效率的影响,首先采用空间填充曲线对二维空间数据进行编码,保证空间要素邻近性特征;然后用空间要素集合对空间要素流进行填充,从而确保各个子任务集中的要素数据规模相对均衡。以并行叠加分析中点面、线面、面面叠加操作为例,设计了对比实验。实验结果表明,该方法能够有效提高以线、面要素为操作对象的并行算法负载均衡度和提高并行算法整体运行效率。 展开更多
关键词 并行计算 HILBERT曲线 矢量数据 负载均衡 要素集合
在线阅读 下载PDF
基于复杂曲线表示的切比雪夫多项式拟合并行算法 被引量:5
17
作者 邓倩妮 陈笠 +1 位作者 陆鑫达 何赢潮 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第6期906-909,共4页
骨科临床造型系统中进行假体再造时 ,要对 CT片上的原始点采用数学逼近法进行优化处理 .常用的数学逼近法中切比雪夫多项式拟和法误差较小 ,对此 ,提出一种基于复杂曲线表示的切比雪夫多项式拟合并行算法 ,并采用两种 Java方案实现并行... 骨科临床造型系统中进行假体再造时 ,要对 CT片上的原始点采用数学逼近法进行优化处理 .常用的数学逼近法中切比雪夫多项式拟和法误差较小 ,对此 ,提出一种基于复杂曲线表示的切比雪夫多项式拟合并行算法 ,并采用两种 Java方案实现并行程序 .实验结果表明 ,与一般的切比雪夫多项式拟合串行算法相比 ,基于复杂曲线表示的切比雪夫多项式拟合并行算法保持了较高的计算精度 。 展开更多
关键词 并行计算 数据拟合 切比雪夫多项式 多线程 Java远程方法调用
在线阅读 下载PDF
基于MPI+CUDA的异构并行可压缩流求解器 被引量:7
18
作者 刘枫 李桦 +1 位作者 田正雨 潘沙 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第1期6-10,共5页
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数... 在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 展开更多
关键词 消息传递接口 统一计算设备架构 异构计算 可压缩流
在线阅读 下载PDF
用于并行计算的PC集群系统构建 被引量:8
19
作者 李敏 张宜生 李德群 《计算机应用研究》 CSCD 北大核心 2009年第3期1042-1043,1062,共3页
在注射成形模拟研究过程中,涉及材料的牛顿和非牛顿黏性流动模拟和注射成形后期的冷却过程模拟,以及随时间变化各处的压力变化等科学和工程领域经常应用大规模科学计算。随着基于网格的计算和数据处理日益复杂,很多计算一般PC系统无法... 在注射成形模拟研究过程中,涉及材料的牛顿和非牛顿黏性流动模拟和注射成形后期的冷却过程模拟,以及随时间变化各处的压力变化等科学和工程领域经常应用大规模科学计算。随着基于网格的计算和数据处理日益复杂,很多计算一般PC系统无法满足要求,需要超级计算环境。因为不断追求更高的计算精度和日益复杂的对象而扩大计算规模,传统的串行处理方式难以满足这些要求。因此,现代高性能计算的低成本、高效率成为选择并行计算的解决方式。重点阐述如何构建一个用于并行计算的PC集群系统,结合实例阐明MPI的实现方法,以及对PC集群系统进行了性能评测。 展开更多
关键词 集群系统 并行计算 LINUX 消息传递接口 PVFS
在线阅读 下载PDF
RS纠删码在云存储中的应用 被引量:7
20
作者 余林琛 章巍 +2 位作者 林强 许杰星 钟贝 《微电子学与计算机》 CSCD 北大核心 2011年第8期234-236,共3页
云存储作为一种旨在为用户提供高效、廉价、安全、可扩展、可定制的存储服务的存储模式,已然成为存储服务的发展趋势.但是因为其云端存储节点的不可控性,云存储在如何保障数据安全性的问题上面临着挑战.通过将RS纠删码引入云存储中,采... 云存储作为一种旨在为用户提供高效、廉价、安全、可扩展、可定制的存储服务的存储模式,已然成为存储服务的发展趋势.但是因为其云端存储节点的不可控性,云存储在如何保障数据安全性的问题上面临着挑战.通过将RS纠删码引入云存储中,采用分片聚合机制,为云存储的数据安全性保障提供了一种新的解决方案. 展开更多
关键词 RS纠删码 云存储 数据安全 缓冲区
在线阅读 下载PDF
上一页 1 2 59 下一页 到第
使用帮助 返回顶部