期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于Multi-GPU平台的大规模图数据处理 被引量:8
1
作者 张珩 张立波 武延军 《计算机研究与发展》 EI CSCD 北大核心 2018年第2期273-288,共16页
在GPU高性能节点上构建高效的大规模图数据的算法和系统已经日益成为研究热点,以GPU协处理器为计算核心不仅能够提供大规模线程的并行环境,也能提供高吞吐的内存和缓存访问机制.随着图的规模增大,相对大小局限的GPU的设备访存空间逐渐... 在GPU高性能节点上构建高效的大规模图数据的算法和系统已经日益成为研究热点,以GPU协处理器为计算核心不仅能够提供大规模线程的并行环境,也能提供高吞吐的内存和缓存访问机制.随着图的规模增大,相对大小局限的GPU的设备访存空间逐渐不能满足缓存整个图数据的应用需求,也催生了大量以单节点上外存I/O优化(out-of-core graph)为主要研究方向的大规模图数据处理系统.为了应对这一瓶颈,现有的算法和系统研究采用对图切分的压缩数据形式(即shards)用以数据传输和迭代计算.然而,这类研究扩展到Multi-GPU平台上往往性能的局限性表现在对PCI-E带宽的高依赖性,同时也由于Multi-GPU上任务负载不均衡而缺乏一定的可扩展性.为了应对上述挑战,提出并设计了基于Multi-GPU平台的支持高效、可扩展的大规模图数据处理系统GFlow.GFlow提出了全新的适用于Multi-GPU下的图数据Grid切分策略和双层滑动窗口算法,在将图的属性数据(点的状态集合、点/边权重值)缓存于各GPU设备之后,顺序加载图的拓扑结构数据(点/边集合)值各GPU中.通过双层滑动窗口,GFlow动态地加载数据分块从SSD存储至GPU设备内存,并顺序化聚合并应用处理过程中各GPU所生成的Updates.通过在9个现实图数据集上的实验结果可以看出,GFlow在Multi-GPU平台下相比其他支持外存图(out-of-core graph)处理的相关系统性能表现更为优异,对比CPU下的GraphChi和X-Stream分别提升25.6X和20.3X,对比GPU下支持外存图数据处理的GraphReduce系统单GPU提升1.3~2.5X.同时GFlow可扩展性在Multi-GPU上也表现良好. 展开更多
关键词 大规模图数据 multi-gpu 图分块 双层滑动窗口 数据传输
在线阅读 下载PDF
Multi-GPU加速的二元合金定向凝固三维相场模型 被引量:1
2
作者 朱昶胜 徐升 +1 位作者 冯力 李浩 《兰州理工大学学报》 CAS 北大核心 2018年第6期24-29,共6页
基于三维相场模型,使用MPI+CUDA异构协同并行技术,在GPU集群上建立三维合金定向凝固的MultiGPU计算模型,实现了Al-Cu二元合金三维定向凝固的模拟.再现了Al-Cu二元合金三维定向凝固的过程,以及不同取向晶粒间的竞争生长现象.通过与传统CP... 基于三维相场模型,使用MPI+CUDA异构协同并行技术,在GPU集群上建立三维合金定向凝固的MultiGPU计算模型,实现了Al-Cu二元合金三维定向凝固的模拟.再现了Al-Cu二元合金三维定向凝固的过程,以及不同取向晶粒间的竞争生长现象.通过与传统CPU串行计算模型相比较,验证了Multi-GPU计算模型的计算效率和加速效果.实现了二元合金定向凝固的加速模拟计算,其加速比最大可达57.7. 展开更多
关键词 multi-gpu MPI+CUDA 定向凝固 相场法
在线阅读 下载PDF
An effi cient scheme for multi-GPU TTI reverse time migration 被引量:1
3
作者 Liu Guo-Feng Meng Xiao-Hong +1 位作者 Yu Zhen-Jiang Liu Ding-Jin 《Applied Geophysics》 SCIE CSCD 2019年第1期56-63,共8页
Reverse time migration (RTM) is an indispensable but computationally intensive seismic exploration technique. Graphics processing units (GPUs) by NVIDIA■offer the option for parallel computations and speed improvemen... Reverse time migration (RTM) is an indispensable but computationally intensive seismic exploration technique. Graphics processing units (GPUs) by NVIDIA■offer the option for parallel computations and speed improvements in such high-density processes. With increasing seismic imaging space, the problems associated with multi-GPU techniques need to be addressed. We propose an efficient scheme for multi-GPU programming based on the features of the compute-unified device Architecture (CUDA) using GPU hardware, including concurrent kernel execution, CUDA streams, and peer-to-peer (P2P) communication between the different GPUs. In addition, by adjusting the computing time for imaging during RTM, the data communication times between GPUs become negligible. This means that the overall computation effi ciency improves linearly, as the number of GPUs increases. We introduce the multi-GPU scheme by using the acoustic wave propagation and then describe the implementation of RTM in tilted transversely isotropic (TTI) media. Next, we compare the multi-GPU and the unifi ed memory schemes. The results suggest that the proposed multi- GPU scheme is superior and, with increasing number of GPUs, the computational effi ciency improves linearly. 展开更多
关键词 multi-gpu KERNEL PEER-TO-PEER FORWARD MODELING TTI RTM
在线阅读 下载PDF
并行显卡:nVIDIA SLI Multi-GPU技术再现 被引量:1
4
作者 张岩 《个人电脑》 2004年第8期192-197,共6页
将SLI推向普及化,将会对整个显卡市场产生深远的影响。
关键词 并行显卡 NVIDIA SLI multi-gpu 显存频率
在线阅读 下载PDF
Large-Eddy Simulation of Airflow over a Steep, Three-Dimensional Isolated Hill with Multi-GPUs Computing
5
作者 Takanori Uchida 《Open Journal of Fluid Dynamics》 2018年第4期416-434,共19页
The present research attempted a Large-Eddy Simulation (LES) of airflow over a steep, three-dimensional isolated hill by using the latest multi-cores multi-CPUs systems. As a result, it was found that 1) turbulence si... The present research attempted a Large-Eddy Simulation (LES) of airflow over a steep, three-dimensional isolated hill by using the latest multi-cores multi-CPUs systems. As a result, it was found that 1) turbulence simulations using approximately 50 million grid points are feasible and 2) the use of this system resulted in the achievement of a high computation speed, which exceeded the speed of parallel computation attained by a single CPU on one of the latest supercomputers. Furthermore, LES was conducted by using the multi-GPUs systems. The results of these simulations revealed the following findings: 1) the multi-GPUs environment which used the NVDIA? Tesla M2090 or the M2075 could simulate turbulence in a model with as many as approximately 50 million grid points. 2) The computation speed achieved by the multi-GPUs environments exceeded that by parallel computation which used four to six CPUs of one of the latest supercomputers. 展开更多
关键词 LES ISOLATED HILL Multi-Cores Multi-CPUs COMPUTING multi-gpus COMPUTING
暂未订购
多GPU系统非一致存储访问优化:研究进展与展望 被引量:1
6
作者 李晨 刘畅 +1 位作者 葛一漩 郭阳 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1783-1800,共18页
随着晶体管缩小速度的减缓,单GPU(Graphics Processing Units)的性能提升已经变得越来越具有挑战性,因此,多GPU系统成为了提高GPU系统性能的主要手段.然而,由于片外物理设计的制约,多GPU系统中处理器间的带宽不均衡导致了非一致存储访问... 随着晶体管缩小速度的减缓,单GPU(Graphics Processing Units)的性能提升已经变得越来越具有挑战性,因此,多GPU系统成为了提高GPU系统性能的主要手段.然而,由于片外物理设计的制约,多GPU系统中处理器间的带宽不均衡导致了非一致存储访问(Non-Uniform Memory Access,NUMA)问题,严重影响多GPU系统的性能.为了减少非一致存储访问所导致的性能损失,本文首先分析了非一致存储访问出现的原因,并对现有的非一致存储访问解决方案进行了对比.针对不同维度的非一致存储访问,本文从减少远程访问流量和提升远程访问性能两个方向出发,对非一致存储访问的优化方案进行了总结.最后,结合这些方案的优缺点,提出了未来多GPU系统非一致存储访问优化的发展方向. 展开更多
关键词 多GPU系统 非一致存储访问 GPU访存
在线阅读 下载PDF
SLI回归?——NVIDIA SLI multi-GPU简介
7
作者 本苯 《大众硬件》 2004年第8期91-91,共1页
6月底NVIDIA宣布推出最新的SLI multi-GPU技术。SLI的全称是Scalable Link Interface,强调其可升级性,这是自Voodoo2 SLI被淘汰后,我们首次在桌面系统上看到双显卡同时工作以提升性能的SLI技术。
关键词 NVIDIA SLI multi-gpu 显卡 显存频率 MIO接口 超频性能 前端总线
在线阅读 下载PDF
多GPU系统的高速互联技术与拓扑发展现状研究 被引量:2
8
作者 崔晨 吴迪 +1 位作者 陶业荣 赵艳丽 《航空兵器》 CSCD 北大核心 2024年第1期23-31,共9页
多GPU系统通过横向扩展实现性能提升,以满足人工智能日趋复杂的算法和持续激增的数据所带来的不断增长的计算需求。对于多GPU系统而言,处理器间的互联带宽以及系统的拓扑是决定系统性能的关键因素。在传统的基于PCIe的多GPU系统中,PCIe... 多GPU系统通过横向扩展实现性能提升,以满足人工智能日趋复杂的算法和持续激增的数据所带来的不断增长的计算需求。对于多GPU系统而言,处理器间的互联带宽以及系统的拓扑是决定系统性能的关键因素。在传统的基于PCIe的多GPU系统中,PCIe带宽是限制系统性能的瓶颈。当前,面向GPU的高速互联技术成为解决多GPU系统带宽限制问题的有效方法。本文首先介绍了传统多GPU系统所采用的PCIe互联技术及其典型拓扑,然后以Nvidia NVLink、AMD Infinity Fabric Link、Intel X^(e) Link、壁仞科技BLink为例,对国内外代表性GPU厂商的面向GPU的高速互联技术及其拓扑进行了梳理分析,最后讨论了关于互联技术的研究启示。 展开更多
关键词 多GPU系统 高速互联技术 拓扑 互联带宽 数据中心
在线阅读 下载PDF
面向多核CPU与GPU平台的图处理系统关键技术综述 被引量:4
9
作者 张园 曹华伟 +5 位作者 张婕 申玥 孙一鸣 敦明 安学军 叶笑春 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1401-1428,共28页
图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处... 图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处理加速的常用平台.但由于图处理具有处理数据规模大、数据依赖复杂、访存计算比高等特性,加之现实应用场景下的图数据分布不规则且图中的顶点与边呈现动态变化,给图处理的性能提升和高可扩展性带来严峻挑战.为应对上述挑战,大量基于多核CPU与GPU平台的图处理系统被提出,并在该领域取得显著成果.为了让读者了解多核CPU与GPU平台上图处理优化相关技术的演化,首先剖析了图数据、图算法、图应用特性,并阐明图处理所面临的挑战.然后分类梳理了当前已有的基于多核CPU与GPU平台的图处理系统,并从加速图处理设计的角度,详细、系统地总结了关键优化技术,包括图数据预处理、访存优化、计算加速和数据通信优化等.最后对已有先进图处理系统的性能、可扩展性等进行分析,并从不同角度对图处理未来发展趋势进行展望,希望对从事图处理系统研究的学者有一定的启发. 展开更多
关键词 多核CPU与GPU平台 图处理系统 图数据表示 负载均衡 不规则访存 动态图处理
在线阅读 下载PDF
基于GPU加速的等几何拓扑优化高效多重网格求解方法 被引量:1
10
作者 杨峰 罗世杰 +1 位作者 杨江鸿 王英俊 《中国机械工程》 EI CAS CSCD 北大核心 2024年第4期602-613,共12页
针对大规模等几何拓扑优化(ITO)计算量巨大、传统求解方法效率低的问题,提出了一种基于样条h细化的高效多重网格方程求解方法。该方法利用h细化插值得到粗细网格之间的权重信息,然后构造多重网格方法的插值矩阵,获得更准确的粗细网格映... 针对大规模等几何拓扑优化(ITO)计算量巨大、传统求解方法效率低的问题,提出了一种基于样条h细化的高效多重网格方程求解方法。该方法利用h细化插值得到粗细网格之间的权重信息,然后构造多重网格方法的插值矩阵,获得更准确的粗细网格映射信息,从而提高求解速度。此外,对多重网格求解过程进行分析,构建其高效GPU并行算法。数值算例表明,所提出的求解方法与线性插值的多重网格共轭梯度法、代数多重网格共轭梯度法和预处理共轭梯度法相比分别取得了最高1.47、11.12和17.02的加速比。GPU并行求解相对于CPU串行求解的加速比高达33.86,显著提高了大规模线性方程组的求解效率。 展开更多
关键词 等几何拓扑优化 方程组求解 h细化 多重网格法 GPU并行计算
在线阅读 下载PDF
基于GPU并行技术的超大型海面舰船电磁散射仿真 被引量:6
11
作者 郑文军 杨伟 周礼来 《电子科技大学学报》 EI CAS CSCD 北大核心 2023年第4期549-554,共6页
为了解决超电大尺寸海面舰船场景中电磁散射计算的瓶颈问题,研究基于多图像处理单元(Multi-GPU)并行加速技术的弹跳射线法(SBR)。借助统一设备计算架构(CUDA)提供的多线程服务(MPS),构建Multi-GPU并行加速框架,研究基于区域射线束划分GP... 为了解决超电大尺寸海面舰船场景中电磁散射计算的瓶颈问题,研究基于多图像处理单元(Multi-GPU)并行加速技术的弹跳射线法(SBR)。借助统一设备计算架构(CUDA)提供的多线程服务(MPS),构建Multi-GPU并行加速框架,研究基于区域射线束划分GPU计算任务和实现方式;研究基于矩阵网格的任务分割技术,最大限度提高GPU全局内存利用率;针对不同运算单元间的差异所带来的计算不同步问题,设计基于动态负载均衡算法的调度系统,进而提高计算资源利用率。仿真结果表明,在双GPU硬件平台上,该方案与现有并行技术算法相比,在确保结果准确性的情况下加速比接近甚至超过200%。因此,该技术方案能够有效解决超电大海面舰船电磁散射问题。 展开更多
关键词 超电大 multi-gpu 雷达散射截面 海面舰船 射线追踪法
在线阅读 下载PDF
基于GPU的大规模爆炸效果模拟 被引量:4
12
作者 马东洋 赵羲 徐青 《测绘科学技术学报》 北大核心 2009年第5期351-354,359,共5页
提出一种基于图形处理单元(GPU)的方法来模拟深空探测器撞击天体产生的大规模爆炸效果。利用基于GPU的多粒子系统方法模拟爆炸产生的3种喷射物,基于欧拉网格与漩涡粒子相结合的方法及GPU的通用计算能力解算流体动力学方程模拟了浓烟的... 提出一种基于图形处理单元(GPU)的方法来模拟深空探测器撞击天体产生的大规模爆炸效果。利用基于GPU的多粒子系统方法模拟爆炸产生的3种喷射物,基于欧拉网格与漩涡粒子相结合的方法及GPU的通用计算能力解算流体动力学方程模拟了浓烟的翻腾与扩散。实验结果表明,用该方法能够产生具有较高逼真度的大规模爆炸效果。 展开更多
关键词 图形处理单元 多粒子系统 欧拉网格 漩涡粒子 流体动力学方程
在线阅读 下载PDF
基于GPU的一类地理多智能体系统并行仿真研究 被引量:1
13
作者 赵元 程家昌 +1 位作者 王璐 胡月明 《系统仿真学报》 CAS CSCD 北大核心 2015年第2期396-403,共8页
针对当前地理多智能体建模存在着计算成本高、配置复杂、运算加速性能不高的问题,以杜能模型为例,提出基于GPU并行技术的一类地理多智能体仿真与优化方法。通过构建空间索引网格的方法,动态维持智能体与空间索引网格的关联关系,提高地... 针对当前地理多智能体建模存在着计算成本高、配置复杂、运算加速性能不高的问题,以杜能模型为例,提出基于GPU并行技术的一类地理多智能体仿真与优化方法。通过构建空间索引网格的方法,动态维持智能体与空间索引网格的关联关系,提高地理多智能体系统的仿真运行效率。研究结果表明:采用GPU并行技术,能够使多智能体系统的运行性能得到明显提升,对开展大规模数据下的空间系统多智能体仿真建模具有重要意义。 展开更多
关键词 空间索引网格 多智能体系统 并行计算 GPU
原文传递
全景视频与个性化分发在数字博物馆中的应用 被引量:3
14
作者 王广生 高新 孙树文 《北京联合大学学报》 CAS 2015年第3期5-9,共5页
全景视频是更先进的虚拟现实技术,用数个摄像机联合拍摄周围的景物,通过全景缝合将多个摄像机所拍摄的视频合为一体,生成全景视频,真实再现周边的实况全景。提出了用于生成全景视频的高性能计算架构,采用图形处理器完成大部分全景视频... 全景视频是更先进的虚拟现实技术,用数个摄像机联合拍摄周围的景物,通过全景缝合将多个摄像机所拍摄的视频合为一体,生成全景视频,真实再现周边的实况全景。提出了用于生成全景视频的高性能计算架构,采用图形处理器完成大部分全景视频生成算法,降低了中央处理器的使用个数。应用上,将全景视频与IPTV技术结合,生成的全景视频通过剪裁、压缩编码、传输,发送给远程观众,使远端观众可以自由地观看其感兴趣的区域,产生一种新的全景直播方式,为数字博物馆参观提供了新途径。 展开更多
关键词 全景视频 通用GPU 多摄像机 直播系统
在线阅读 下载PDF
面向多核CPU多GPU的节点内并行混合绘制模型 被引量:3
15
作者 刘华海 王攀 +3 位作者 蔡勋 曾亮 王文珂 李思昆 《系统仿真学报》 CAS CSCD 北大核心 2012年第1期94-98,112,共6页
分布式并行绘制集群节点可以配置多核CPU和多个GPU构建节点内多CPU多GPU系统。现有的节点内并行绘制模型既没有充分发挥多核CPU的强大计算能力,还将绘制、读回和合成阶段串行耦合在一起导致了大量的GPU闲置停顿,严重影响了节点内并行... 分布式并行绘制集群节点可以配置多核CPU和多个GPU构建节点内多CPU多GPU系统。现有的节点内并行绘制模型既没有充分发挥多核CPU的强大计算能力,还将绘制、读回和合成阶段串行耦合在一起导致了大量的GPU闲置停顿,严重影响了节点内并行绘制性能。提出了一种节点内高效的并行绘制模型,通过软件绘制与硬件绘制相结合的方法将硬件绘制与图像合成分离,同时利用DMA异步传输机制,构建了节点内绘制、读回和合成三段并行绘制流水线。与现有节点内并行绘制模型相比,并行混合绘制模型不但降低GPU资源闲置率,而且提高了CPU资源使用率。理论分析与实验表明相同应用采用并行混合绘制模型的性能可以达到现有模型的3-4倍,并且具有更好的数据扩展性、性能扩展性。 展开更多
关键词 multi-gpu MULTI-CPU 分布式并行绘制 异步合成 DMA
原文传递
通用加速计算在环幕失真校正中的应用研究
16
作者 张立民 邓向阳 赵瑞行 《海军航空工程学院学报》 2008年第3期261-265,共5页
大规模场景的沉浸式投影系统大都以环幕作为显示设备,而由环幕造成的几何失真使系统真实感大大降低。从环幕产生失真的几何原理出发,通过建立投影平面和成像面之间的坐标映射关系,生成了一种几何失真校正的理论模型。同时,研究了一... 大规模场景的沉浸式投影系统大都以环幕作为显示设备,而由环幕造成的几何失真使系统真实感大大降低。从环幕产生失真的几何原理出发,通过建立投影平面和成像面之间的坐标映射关系,生成了一种几何失真校正的理论模型。同时,研究了一种适于通用加速计算的图形硬件架构CUDA,基于其多线程的硬件执行机制,通过将几何失真的校正矩阵组织成纹理进行多重纹理贴图映射,设计了预失真校正的硬件加速算法,该算法还利用基于权值的超采样技术对加速中的走样进行了设计。最后,对该方法的校正效率和效果进行了实验验证,证明该方法具有更高的场景交互速度和很好的校正效果。 展开更多
关键词 通用计算 多投影系统 失真校正 硬件加速
在线阅读 下载PDF
多GPU系统虚实地址转换架构研究
17
作者 魏金晖 李晨 鲁建壮 《计算机工程与科学》 CSCD 北大核心 2021年第2期228-234,共7页
近年来,随着大数据的发展,GPU应用的数据集规模急剧增加,这对GPU的处理能力提出了挑战。由于摩尔定律即将达到极限,提升单一GPU的性能变得越发困难,而多GPU系统通过提升GPU处理器级的并行性,成为应对该挑战的一种解决方案。GPU制造商对... 近年来,随着大数据的发展,GPU应用的数据集规模急剧增加,这对GPU的处理能力提出了挑战。由于摩尔定律即将达到极限,提升单一GPU的性能变得越发困难,而多GPU系统通过提升GPU处理器级的并行性,成为应对该挑战的一种解决方案。GPU制造商对内存虚拟化的支持进一步简化了多GPU系统的编程,提升了资源利用率。内存虚拟化需要地址转换的支持,而地址转换的开销对系统性能具有重要影响。研究了多GPU系统中2种常见的地址转换架构,即分布式地址转换架构和集中式地址转换架构,通过模拟实验对2种架构进行了深度分析和比较,在此基础上提出了优化地址转换设计的建议。 展开更多
关键词 多GPU系统 内存虚拟化 地址转换架构
在线阅读 下载PDF
基于多源信息感知和光学图像处理的电力装备数字化运维技术研究 被引量:1
18
作者 季巧宇 张施令 李玥 《电工技术》 2023年第9期160-164,共5页
将数字孪生技术引入新型电力系统高端电力设备,依据其孪生模型进行现场运维模拟试验和大电流、高电压、多谐波载荷下的功能性响应分析。从机械振动、气体成分、光学视觉、电气参量四个传感维度分析了新型电力系统装备智能感知技术提升,... 将数字孪生技术引入新型电力系统高端电力设备,依据其孪生模型进行现场运维模拟试验和大电流、高电压、多谐波载荷下的功能性响应分析。从机械振动、气体成分、光学视觉、电气参量四个传感维度分析了新型电力系统装备智能感知技术提升,并实现了现场运行参数与数字孪生模型数据之间的交互联动。另一方面,提出了支撑数字孪生多源感知技术的GPU算力拓展技术,可有效支撑10-5~103 s设备动态行为仿真监测,并提出了高端装备运行寿命评估策略。研究结果可为数字孪生技术应用于高端电力设备场景提供理论指导和技术参考,有效支撑“双高特征”为主的新型电力系统安全稳定运行。 展开更多
关键词 新型电力系统 特高压电力装备 数字孪生 多源感知 GPU算力拓展 寿命评估
在线阅读 下载PDF
Multiscale Hemodynamics Using GPU Clusters
19
作者 Mauro Bisson Massimo Bernaschi +2 位作者 Simone Melchionna Sauro Succi Efthimios Kaxiras 《Communications in Computational Physics》 SCIE 2012年第1期48-64,共17页
The parallel implementation of MUPHY,a concurrent multiscale code for large-scale hemodynamic simulations in anatomically realistic geometries,for multi-GPU platforms is presented.Performance tests show excellent resu... The parallel implementation of MUPHY,a concurrent multiscale code for large-scale hemodynamic simulations in anatomically realistic geometries,for multi-GPU platforms is presented.Performance tests show excellent results,with a nearly linear parallel speed-up on up to 32GPUs and a more than tenfold GPU/CPU acceleration,all across the range of GPUs.The basic MUPHY scheme combines a hydrokinetic(Lattice Boltzmann)representation of the blood plasma,with a Particle Dynamics treatment of suspended biological bodies,such as red blood cells.To the best of our knowledge,this represents the first effort in the direction of laying down general design principles for multiscale/physics parallel Particle Dynamics applications in non-ideal geometries.This configures the present multi-GPU version of MUPHY as one of the first examples of a high-performance parallel code for multiscale/physics biofluidic applications in realistically complex geometries. 展开更多
关键词 multi-gpu computing HEMODYNAMICS molecular dynamics irregular domain
原文传递
基于深度学习的操作系统多维度安全保护架构 被引量:1
20
作者 曹玉红 陈思羽 《工业技术创新》 2021年第1期90-95,共6页
操作系统漏洞长期威胁用户隐私安全,给用户带来的不仅是经济损失,更有个人隐私泄漏等威胁。基于操作系统的内存管理、进程管理、IO管理三大核心功能,分析针对各功能的攻击方案的表现形式,提出利用深度学习技术,搭建包含基础数据层、特... 操作系统漏洞长期威胁用户隐私安全,给用户带来的不仅是经济损失,更有个人隐私泄漏等威胁。基于操作系统的内存管理、进程管理、IO管理三大核心功能,分析针对各功能的攻击方案的表现形式,提出利用深度学习技术,搭建包含基础数据层、特征提取层、特征学习层、防御行为层的操作系统多维度安全保护架构。基础数据层收集操作系统运行数据,并将原始数据提供给特征提取层;特征提取层对原始数据进行变换,向特征学习层提供易于理解与学习的特征;特征学习层借助深度神经网络,理解特征提取层提供的数据,并将检测结果反馈给防御行为层;防御行为层产生防御行为,并优化特征学习层,降低误判概率,提升检测精度。该架构通用性强,可部署性良好,能检测到未曾发现的攻击。若辅以GPU硬件支持,神经网络的算力资源开销将降低80%。 展开更多
关键词 操作系统 多维度安全保护 深度学习 可部署性 GPU 神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部