期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
Improving scalability of sequential task flow models with cache-friendly parallel dependency tracking
1
作者 Xiran Gao Li Chen Xiaobing Feng 《CCF Transactions on High Performance Computing》 2026年第1期1-14,共14页
The Sequential Task Flow(STF)model guides task parallelism by dynamically analyzing data dependencies at runtime,making it well-suited to handle dynamic and irregular parallelism.However,it introduces additional depen... The Sequential Task Flow(STF)model guides task parallelism by dynamically analyzing data dependencies at runtime,making it well-suited to handle dynamic and irregular parallelism.However,it introduces additional dependency tracking overhead.As task granularity becomes increasingly fine-grained or hardware parallelism increases,the traditional Centralized TDG Building(CB)algorithm progressively becomes a performance bottleneck.The Parallel TDG Building algorithm with Helpers(PBH),which leverages hardware message-passing mechanisms,has achieved significant speedups on the SW26010 platform,but its intensive sub-microsecond irregular synchronizations make it difficult to scale on cache-coherent multicore platforms.This paper proposes Cache-friendly PBH(CPBH),a parallel dependency tracking algorithm optimized for cache-coherent architectures.CPBH introduces a locality-aware lock-free batch synchronization mechanism that reduces the overhead of atomic operation contention and improves data access locality.Additionally,it employs an asynchronous execution strategy to overlap dependency tracking and task graph execution using dynamic reference counting.Experiments on three cache-coherent multicore platforms using 10 HPC benchmarks demonstrate that CPBH achieves an average speedup exceeding 1.4×compared to CB and over 1.2×speedup compared to DDAST under fine-grained scenarios. 展开更多
关键词 high performance computing Cache-coherent platform Sequential task flow model Cache-friendly parallel dependency tracking algorithm
在线阅读 下载PDF
海气耦合模式的优化方法研究 被引量:4
2
作者 魏敏 罗勇 +3 位作者 王兰宁 董敏 李清泉 徐影 《应用气象学报》 CSCD 北大核心 2005年第3期408-412,共5页
气候模式不断发展的同时,对高性能计算机提出了更高的要求,如何提高模式在现有计算机资源上的运行效率问题已越来越重要。文章介绍了利用编译器优化和手工优化技术对海气耦合模式进行优化试验,优化后模式运行效率提高60%,表明将这些优... 气候模式不断发展的同时,对高性能计算机提出了更高的要求,如何提高模式在现有计算机资源上的运行效率问题已越来越重要。文章介绍了利用编译器优化和手工优化技术对海气耦合模式进行优化试验,优化后模式运行效率提高60%,表明将这些优化方法应用到气候模式的改进工作中,可以达到较好的效果。 展开更多
关键词 海气耦合模式 优化方法 高性能计算机 气候模式 计算机资源 效率问题 优化试验 优化技术 运行效率 改进工作 方法应用 编译器
在线阅读 下载PDF
求解Boltzmann模型方程高性能并行算法在航天跨流域空气动力学应用研究 被引量:9
3
作者 李志辉 蒋新宇 +2 位作者 吴俊林 徐金秀 白智勇 《计算机学报》 EI CSCD 北大核心 2016年第9期1801-1811,共11页
对Boltzmann方程碰撞积分物理分析与可计算建模,得到适于描述航天再入从外层空间到近地面各流域统一Boltzmann模型方程,提出求解Boltzmann模型方程统一算法高性能并行计算数学模型.发展离散速度空间区域分解大规模并行计算技术,分析统... 对Boltzmann方程碰撞积分物理分析与可计算建模,得到适于描述航天再入从外层空间到近地面各流域统一Boltzmann模型方程,提出求解Boltzmann模型方程统一算法高性能并行计算数学模型.发展离散速度空间区域分解大规模并行计算技术,分析统一算法变量依赖关系,建立可扩展并行计算方案;研究数据并行分布与并行执行特征,开展大规模并行化程序设计,并在小、中、大规模256-512、4096-20 625CPU及异构计算机500-45 000、3125-112 500进程并行算法测试,建立稳定运行于国产千万亿次超级计算机高性能可扩展大规模并行算法与航天器再入跨流域复杂气动力/热绕流问题并行化软件应用平台.通过对稀薄流到连续流再入飞行不同高度可回收返回式卫星飞行器、近空间大尺度机动飞行器跨流域绕流环境不同粒度高性能计算与验证,揭示大尺度复杂结构飞行器跨流区飞行稀薄过渡流区热流系数比连续、近连续流区热流系数随物面变化剧烈得多、大得多,发现该类飞行器后端面热流最大值发生在水平舵外侧拐角处,达驻点热流六分之一量级,提供了一个可靠求解航天器再入各流域高超声速绕流问题统一算法高性能并行计算应用研究方向. 展开更多
关键词 航天器 跨流域空气动力学 BOLTZMANN模型方程 统一算法 区域分解 高性能并行计算
在线阅读 下载PDF
并行I/O技术在气候数值模式中的应用研究 被引量:5
4
作者 魏敏 徐金秀 王在志 《计算机技术与发展》 2014年第12期11-15,19,共6页
在气候变化数值模拟工作中,气候数值模式运行效率主要受到计算效率和I/O效率的共同影响。目前,模式计算部分已经基本实现并行,计算效率显著提升。随着气候数值模式时空分辨率的提高,对I/O效率的需求也不断增加,数据并行I/O技术已经成为... 在气候变化数值模拟工作中,气候数值模式运行效率主要受到计算效率和I/O效率的共同影响。目前,模式计算部分已经基本实现并行,计算效率显著提升。随着气候数值模式时空分辨率的提高,对I/O效率的需求也不断增加,数据并行I/O技术已经成为提高模式整体运行效率的有效方法之一。文中深入分析了BCC_AGCM模式串行I/O算法及NetCDF数据结构特点,采用基于MPI-IO的高层I/O库对模式I/O算法进行并行优化,优化后可支持多类气象要素并行输出,输出效率明显提升。为我国应对气候变化数值模式的运行效率优化工作,进行了有益的技术探索和积累。 展开更多
关键词 高性能计算 气候数值模式 并行I/O NETCDF
在线阅读 下载PDF
高性能计算过程中基于网络带宽代价的节点决策算法研究 被引量:2
5
作者 汤小春 罗晓宇 +1 位作者 阎磊 胡杰 《西北工业大学学报》 EI CAS CSCD 北大核心 2007年第4期599-602,共4页
针对高性能计算中由于网络延迟造成的地理位置分散的节点资源使用率不均匀现象,提出了一种自适应的节点决策算法。该算法通过估计待选节点的作业执行代价,选择一个代价最小的节点作为作业的执行节点,提高了作业的响应速度,高效地利用了... 针对高性能计算中由于网络延迟造成的地理位置分散的节点资源使用率不均匀现象,提出了一种自适应的节点决策算法。该算法通过估计待选节点的作业执行代价,选择一个代价最小的节点作为作业的执行节点,提高了作业的响应速度,高效地利用了计算资源。文中首先给出了远程作业执行的模型,其次给出了网络通信特征以及自适应代价模型,最后提出了基于网络带宽代价的节点决策算法并对该算法进行了系统的评价,取得良好的效果。 展开更多
关键词 远程计算模型 网络带宽代价 节点决策
在线阅读 下载PDF
量子计算的研究现状和发展动向 被引量:3
6
作者 陈平形 吴伟 +2 位作者 吴春旺 吴俊杰 唐玉华 《国防科技》 2014年第6期3-6,共4页
作为未来高性能计算研究的重要方向,量子计算受到了全世界的高度重视。文章简单介绍了量子计算的基本原理和研究现状,并对量子计算的未来发展作了分析与思考。
关键词 高性能计算 量子计算 物理实现 计算模型 量子算法
在线阅读 下载PDF
HPMR系统KV路由算法设计
7
作者 郑启龙 王向前 王昊 《计算机工程》 CAS CSCD 北大核心 2010年第20期102-105,共4页
提出一种针对HPMR系统的KV路由算法。HPMR系统是MapReduce模型的一个实现,改进了MapReduce模型以适应高性能计算的需求。HPMR的KV路由算法生成KV路由表,所有数据的收发动作将依据该路由表进行。KV路由算法产生的KV路由表直接决定HPMR系... 提出一种针对HPMR系统的KV路由算法。HPMR系统是MapReduce模型的一个实现,改进了MapReduce模型以适应高性能计算的需求。HPMR的KV路由算法生成KV路由表,所有数据的收发动作将依据该路由表进行。KV路由算法产生的KV路由表直接决定HPMR系统在通信阶段的时间开销。实验结果表明,该KV路由算法产生的KV路由表可以提高HPMR系统的通信性能。 展开更多
关键词 MAPREDUCE模型 高性能计算 DSS-KV路由算法
在线阅读 下载PDF
“气候系统模式的高性能算法与应用”2011年度报告
8
作者 刘骥平 王斌 +1 位作者 李若 王何宇 《科技创新导报》 2016年第9期165-165,共1页
"气候系统模式的高性能算法与应用"重点研究气候环境与稀薄大气中复杂流动问题的高性能算法与应用,完成千亿自由度的气候模拟。课题主要任务是发展高性能和高分辨率海冰/海洋模式和气候系统模式,使模式能处理近1亿网格、1 000亿自由... "气候系统模式的高性能算法与应用"重点研究气候环境与稀薄大气中复杂流动问题的高性能算法与应用,完成千亿自由度的气候模拟。课题主要任务是发展高性能和高分辨率海冰/海洋模式和气候系统模式,使模式能处理近1亿网格、1 000亿自由度、在1 000-10 000个计算核上运行利用模式开展短期和长期气候预测研究,参加国际模式比较计划;利用模式重点开展东亚气候(特别是极端天气、气候事件)和海冰变化及预测的研究基于R13方程组所采用的修正方法,对任意高阶正则化矩方程组给出数值模拟方案,在该方案的基础上研究自适应方法,开展大气高层流体力学模拟。 展开更多
关键词 海冰模式 海洋模式 气候系统模式 高性能计算 东亚气候 正则化矩方程
在线阅读 下载PDF
Ising模型的并行计算
9
作者 刘军 沈扬 罗向前 《中山大学研究生学刊(自然科学与医学版)》 2003年第3期28-35,共8页
本文以Ising模型为例,介绍有关格点系统的Monte carlo数值模拟并行算法的设计和编程,并给出在本组建造的PC集群式高性能并行计算系统上的测量结果。本文的结果对格点量子色动力学的大规模数值模拟研究有一定的参考价值。
关键词 ISING模型 并行计算 蒙特卡罗模拟 格点规范理论 高性能并行计算系统 格点量子色动力学 统计物理
在线阅读 下载PDF
高性能并行分布式水文模型研究进展 被引量:11
10
作者 叶翔宇 李强 +2 位作者 郭禹含 梁廖逢 王中根 《地理科学进展》 CSSCI CSCD 北大核心 2022年第4期731-740,共10页
传统分布式水文模型采用串行计算模式,其计算能力无法满足大规模水文精细化、多要素、多过程耦合模拟的需求,亟需并行计算的支持。进入21世纪后,计算机技术的飞速发展和并行环境的逐步完善,为分布式水文模型并行计算提供了软硬件支撑。... 传统分布式水文模型采用串行计算模式,其计算能力无法满足大规模水文精细化、多要素、多过程耦合模拟的需求,亟需并行计算的支持。进入21世纪后,计算机技术的飞速发展和并行环境的逐步完善,为分布式水文模型并行计算提供了软硬件支撑。论文从并行环境、并行算法2个方面对已有研究进行总结概括,分析了不同并行环境和并行算法的优势与不足,并提出提高模型并行效率的手段,即合理分配进程/线程数缩减通信开销,采用混合并行环境增强模型可扩展性,空间或时空离散化提高模型的可并行性及动态分配计算任务、平衡工作负载等。最后,论文对高性能并行分布式模型的未来研究方向进行展望。 展开更多
关键词 分布式水文模型 并行计算 高性能水文模型 并行环境 并行算法
原文传递
基于国产众核架构CESM中有限差分计算优化 被引量:3
11
作者 陈宏博 钱雪忠 +2 位作者 甘霖 徐敬蘅 刘徐 《计算机应用研究》 CSCD 北大核心 2021年第2期501-505,共5页
针对CESM中的有限差分算法并行过程中存在内存读取冗余过大、通信开销过高的问题,设计出根据数据结构进行数据重构、计算核心捆绑、流水线通信等多种并行优化方案。弥补了申威26010处理器在数据读取过程中缺少共享缓存区、带宽利用率不... 针对CESM中的有限差分算法并行过程中存在内存读取冗余过大、通信开销过高的问题,设计出根据数据结构进行数据重构、计算核心捆绑、流水线通信等多种并行优化方案。弥补了申威26010处理器在数据读取过程中缺少共享缓存区、带宽利用率不高等不足,缓解了申威26010处理器在有限差分法求解过程的通信瓶颈。对CESM中以有限差分法为核心计算的两个函数,在申威26010众核处理器上的测试结果表明,提出算法及优化策略拥有21.2倍的性能提升。 展开更多
关键词 通用地球系统模型 并行计算 异构众核处理器 有限差分算法 高性能计算
在线阅读 下载PDF
国土空间规划实施监测网络(CSPON)算法模型体系构建及应用 被引量:10
12
作者 张鸿辉 钟镇涛 +3 位作者 杨丽娅 崔学森 徐华键 李文静 《自然资源学报》 CSSCI CSCD 北大核心 2024年第12期2853-2868,共16页
国土空间规划实施监测网络(CSPON)是打造“可感知、能学习、善治理、自适应”的智慧规划,推进国土空间治理“数智化”转型的重要手段。针对当前CSPON建设亟需科学系统技术方法支撑的需要,系统回顾国内外CSPON算法模型相关研究的发展历... 国土空间规划实施监测网络(CSPON)是打造“可感知、能学习、善治理、自适应”的智慧规划,推进国土空间治理“数智化”转型的重要手段。针对当前CSPON建设亟需科学系统技术方法支撑的需要,系统回顾国内外CSPON算法模型相关研究的发展历程与现状问题,在此基础上,提出以“大算力”“大数据”“大模型”技术为支撑,以“大场景”应用为导向的CSPON算法模型技术框架,重点分析“算力、数据、模型、场景”四大核心要素在CSPON算法模型建设中的定位与作用及其相互耦合机理。结合实践案例阐述CSPON算法模型在安全底线管控、规划传导管控、规划实施评估、空间格局优化等国土空间规划实施监测典型场景中的应用。研究结果可为加快推进CSPON技术方法完善与实践应用落地提供科学依据。 展开更多
关键词 CSPON 算法模型 “大算力” “大数据” “大模型” 智慧规划
原文传递
基于GPU的B-S模型下改进的Crank Nicolson算法
13
作者 王文浩 邬春学 《上海理工大学学报》 CAS 北大核心 2013年第2期147-151,156,共6页
针对Black-Scholes模型及其公式特点进行了理论分析与数学处理,给出了优化的Crank-Nicolson算法,提高了实际期权交易效率.通过使用GPU作为计算平台,结合CUDA架构技术,验证改进后算法的有效性和适用性.在CPU平台下进行横向测试,验证GPU... 针对Black-Scholes模型及其公式特点进行了理论分析与数学处理,给出了优化的Crank-Nicolson算法,提高了实际期权交易效率.通过使用GPU作为计算平台,结合CUDA架构技术,验证改进后算法的有效性和适用性.在CPU平台下进行横向测试,验证GPU平台运行环境优势.实验表明,改进后的算法在GPU平台下运行所提升的效果显著,运算精度和效率得到提高. 展开更多
关键词 金融期权计算 B—S模型 改进的C—N算法 GPU CUDA构架 HPC
在线阅读 下载PDF
基于矩阵值因子算法的企业年金投资组合建模与并行求解 被引量:1
14
作者 杜首燕 陆忠华 《数据与计算发展前沿》 2020年第4期142-154,共13页
【目的】为了满足我国企业年金的资产配置和实际交易的需求,确定整体的风险和收益目标,得到最佳的资产配置比例和更优的投资决策。【方法】本文在遵循企业年金安全性和收益性前提下,基于矩阵值因子算法构建了带投资约束条件的均值-方差... 【目的】为了满足我国企业年金的资产配置和实际交易的需求,确定整体的风险和收益目标,得到最佳的资产配置比例和更优的投资决策。【方法】本文在遵循企业年金安全性和收益性前提下,基于矩阵值因子算法构建了带投资约束条件的均值-方差优化模型,并基于CVXOPT求解器、遗传算法和粒子群算法进行最优值求解,综合最好方差、均值方差和均值收益率三个指标,选择最优模型实现并行计算。【结果】研究和实验结果表明,模型实现了对高维协方差矩阵的降维建模和预测,缓解了在资产数量多的情况下,模型的待估参数过多且不易求解的问题,从而更快的收敛到全局最优解;并行计算可使最优模型的计算效率显著提升,有效缩短模型的运行时间。【局限】作为面向我国企业年金的投资组合优化模型,改进均值-方差模型解的不可靠性和考虑职工的风险承受能力的差别是下一步需要解决的重要问题。【结论】投资组合优化模型结合矩阵值因子算法和并行计算有利于解决投资组合选择的计算瓶颈问题,促进企业年金的保值增值,从而缓解社会养老金制度在人口老龄化环境下所面临的平衡难以持续、负担不断加重的问题。 展开更多
关键词 企业年金 矩阵值因子算法 遗传算法 高性能计算 均值-方差优化模型
在线阅读 下载PDF
面向申威众核处理器的并行SaNSDE算法 被引量:1
15
作者 康上 钱雪忠 甘霖 《计算机科学与探索》 CSCD 北大核心 2021年第10期2015-2024,共10页
演化算法作为解决大规模优化问题的重要方法,被广泛应用于机器学习、过程控制、工程优化、管理科学和社会科学等领域。然而在求解高维度、高计算密度问题时,程序性能很难得到保证。在高性能计算机上实现并行化是问题的一个热门解决方案... 演化算法作为解决大规模优化问题的重要方法,被广泛应用于机器学习、过程控制、工程优化、管理科学和社会科学等领域。然而在求解高维度、高计算密度问题时,程序性能很难得到保证。在高性能计算机上实现并行化是问题的一个热门解决方案。针对申威众核处理器的硬件特征,提出了采用二级并行策略的自适应邻域搜索的差分进化算法(SaNSDE)。第一级为进程并行,实现了合作协同进化模型和池模型,将大规模问题划分为多个低维子问题并分布在不同进程上;第二级为线程并行,使用从核加速了适应度的计算过程。实验结果表明,采用合作协同进化模型和池模型的算法与传统的并行算法相比,经过多核扩展之后收敛效果提升更加明显。相较于串行版本算法,二级并行的SaNSDE算法在四个测试函数上分别获得了134.29、186.05、239.01和189.80的最大加速比。 展开更多
关键词 高性能计算 申威异构众核处理器 演化算法 合作协同进化模型(CC) 池模型
在线阅读 下载PDF
L2TP/IPsec加密机制脆弱性分析 被引量:1
16
作者 罗杰 刘成 臧今宇 《通信技术》 2019年第7期1727-1732,共6页
VPN是在公用网络上建立专用网络进行加密通讯的技术。L2TP/IPsec是被普遍认为是'强加密'的VPN协议,在互联网和军用骨干网中有广泛应用。L2TP/IPsec采用了DES、AES、DiffieHellman、SHA等加密算法,通过MS-CHAP、IKE、AH和ESP等... VPN是在公用网络上建立专用网络进行加密通讯的技术。L2TP/IPsec是被普遍认为是'强加密'的VPN协议,在互联网和军用骨干网中有广泛应用。L2TP/IPsec采用了DES、AES、DiffieHellman、SHA等加密算法,通过MS-CHAP、IKE、AH和ESP等机制实现用户身份认证、密钥协商管理和数据加密传输。通过从加密算法和加密协议的层面对L2TP/IPsec加密机制的脆弱性进行分析,并基于高性能计算提出L2TP/IPsec登录口令及预共享密钥的获取方法。通过树形结构的方法建立攻击分析模型,将L2TP/IPsec加密机制的脆弱性及密钥获取方法映射到攻击树的结构中。L2TP/IPsec加密机制脆弱性分析为数据取证、网络攻防、情报侦察、反恐维稳等领域提供了技术手段。 展开更多
关键词 L2TP/IPsec 加密算法 加密协议 攻击树模型 高性能计算
在线阅读 下载PDF
浅谈科学计算 被引量:8
17
作者 朱少平 《物理》 CAS 北大核心 2009年第8期545-551,共7页
科学计算是指利用计算机再现、预测和发现客观世界运动规律和演化特性的全过程.在实际应用牵引下,依托高性能计算机的发展,近年来科学计算得到了快速的发展.与传统的理论研究和实验研究一起,科学计算已经成为推动科技创新的重要研究手段... 科学计算是指利用计算机再现、预测和发现客观世界运动规律和演化特性的全过程.在实际应用牵引下,依托高性能计算机的发展,近年来科学计算得到了快速的发展.与传统的理论研究和实验研究一起,科学计算已经成为推动科技创新的重要研究手段.文章首先介绍了作者对科学计算的认识:科学计算的本质是求真,置信度是科学计算的核心;做好科学计算,需要以应用为牵引,需要物理、数学与计算机等方面人才的合作,需要多学科交叉融合.文章还讨论了影响科学计算置信度的几个环节.最后就如何做好科学计算发表了看法. 展开更多
关键词 科学计算 置信度 物理建模 计算方法与算法 应用程序 高性能计算机
原文传递
Ising模型的并行计算 被引量:1
18
作者 刘军 沈扬 罗向前 《高能物理与核物理》 CSCD 北大核心 2004年第2期122-128,共7页
以Ising模型为例 ,介绍有关格点系统的MonteCarlo数值模拟并行算法的设计和编程 ,并给出在本组建造的PC集群式高性能并行计算系统上的测量结果 .
关键词 蒙特卡罗模拟 ISING模型 并行计算 格点规范理论 量子色动力学 高能物理学 统计物理学
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部