期刊文献+
共找到110篇文章
< 1 2 6 >
每页显示 20 50 100
基于NUMA架构的多线程网络通信延迟检测
1
作者 王磊 陈莹 《电子设计工程》 2025年第13期171-174,179,共5页
针对多线程网络,由于多个线程分布在不同的处理器或内存节点上,这种分布增加了线程间协调的复杂性,进而影响延迟检测效果。因此,针对基于NUMA架构的多线程网络通信延迟检测方法进行研究。在NUMA架构体系中计算分层级数,并采用高效的线... 针对多线程网络,由于多个线程分布在不同的处理器或内存节点上,这种分布增加了线程间协调的复杂性,进而影响延迟检测效果。因此,针对基于NUMA架构的多线程网络通信延迟检测方法进行研究。在NUMA架构体系中计算分层级数,并采用高效的线程同步机制确保多线程之间的协调一致,完成对多线程网络的部署;在提取通信性能数据后,充分考虑NUMA架构的延迟特性,参照ROI延迟参数的取值范围,定义通信延迟检测表达式。实验结果表明,该方法可以有效检测出启动延迟、通道延迟、路由延迟三种不同的通信延迟。 展开更多
关键词 numa架构 多线程网络 通信延迟 分层级数 ROI参数
在线阅读 下载PDF
NUMA感知的云平台负载调度系统
2
作者 娄杰 段宏键 +1 位作者 曹华伟 叶笑春 《高技术通讯》 北大核心 2025年第1期20-36,共17页
随着互联网的高速发展,云计算逐渐走向了云原生时代。在云原生领域中,对容器进行调度与编排的标准系统是Kubernetes。Kubernetes有着开源、可扩展、部署难度低等诸多优点,然而,随着容器化应用的多样化和底层资源的多元化,Kubernetes在... 随着互联网的高速发展,云计算逐渐走向了云原生时代。在云原生领域中,对容器进行调度与编排的标准系统是Kubernetes。Kubernetes有着开源、可扩展、部署难度低等诸多优点,然而,随着容器化应用的多样化和底层资源的多元化,Kubernetes在以非统一存储访问(non-uniform memory access,NUMA)资源为代表的细粒度资源调度方面仍然存在不足,集群中计算资源利用率低、使用不均衡、系统关键资源争用等情况常常发生。本文以Kubernetes系统为基础,探究以NUMA为代表的细粒度资源的优化调度机制,具体研究点如下:(1)建立缓存管理器,对集群中基于容器的典型应用进行性能的建模与特征分析;(2)设计NUMA管理器,实现细粒度资源划分;(3)优化面向细粒度资源调度的算法,细粒度分配NUMA资源。通过NUMA感知的调度优化,本文所提方案提高了系统的关键资源利用率,提升了应用的运行速度,减少了集群中资源的争用以及资源使用上不均衡的现象。 展开更多
关键词 云计算 容器云平台 负载调度 非统一存储访问 资源划分
在线阅读 下载PDF
NUMA架构下不平衡多线程网络通信延迟检测
3
作者 何珏 黄怀霖 +2 位作者 陈崇明 李为明 丁伟锋 《电子设计工程》 2024年第23期131-135,共5页
针对不平衡动态多线程网络通信延迟检测不精准的问题,提出了NUMA架构下不平衡多线程网络通信延迟检测方法。引入通信进程性能降低比例,分析NUMA架构下的不平衡多线程网络通信延迟结构。计算不平衡多线程的网络通信延迟数据并行处理时间... 针对不平衡动态多线程网络通信延迟检测不精准的问题,提出了NUMA架构下不平衡多线程网络通信延迟检测方法。引入通信进程性能降低比例,分析NUMA架构下的不平衡多线程网络通信延迟结构。计算不平衡多线程的网络通信延迟数据并行处理时间,确定静态、动态延迟路径。分析NUMA架构延迟节点组织形式,计算从发生时间到发送时间产生的延迟,并根据静态、动态信息帧检测相应延迟。由实验结果可知,所研究方法静态通信情况下的延迟时间最长为1.45 min,最短为0.5 min,与实际延迟时间一致;动态通信情况下的延迟时间最长为9 min,最短为3.1 min,与实际延迟时间仅存在最大为0.3 min的误差。 展开更多
关键词 numa架构 不平衡多线程 网络通信 延迟检测
在线阅读 下载PDF
Bowtie 2-NUMA:具有NUMA体系结构适应性的基因序列比对应用
4
作者 王强 孙彦洁 +1 位作者 齐星云 徐佳庆 《计算机工程与科学》 CSCD 北大核心 2024年第12期2117-2127,共11页
Bowtie 2作为生物信息领域使用最广泛的二代测序软件之一,具有计算密集的特点。如何根据多核平台的体系结构进行适应性优化以提高并行效率,成为亟待解决的问题。首先分析了非一致性访存架构的多样性,以及Bowtie 2在多种非一致性访存架... Bowtie 2作为生物信息领域使用最广泛的二代测序软件之一,具有计算密集的特点。如何根据多核平台的体系结构进行适应性优化以提高并行效率,成为亟待解决的问题。首先分析了非一致性访存架构的多样性,以及Bowtie 2在多种非一致性访存架构下内存访问拥塞和最后一级缓存命中率低的结构性瓶颈。然后,基于Bowtie 2在不同非一致性访存平台的表现特点,在复制索引、内存分配以及数据划分3个方面进行优化,提出了Bowtie 2-NUMA。最后,通过实验表明,Bowtie 2-NUMA面向不同计算平台,能够基于体系结构进行适应性优化,实现并行效率的提升。 展开更多
关键词 非一致性访存 Bowtie 2 适应性优化 体系结构 内存带宽 最后一级缓存
在线阅读 下载PDF
信创CPU与Intel CPU在NUMA架构方面的调优实践
5
作者 徐光龙 金鹰 《计算机应用文摘》 2024年第3期35-37,共3页
通过选取具有代表性的基准测试工具,文章对比了信创CPU和IntelCPU在多核性能方面的表现。同时,针对NUMA架构的特点进行了调优实验,并通过分析性能数据得出了调优前后的性能差异。结果表明,通过NUMA调优可以有效提高处理器的性能。
关键词 numa调优 信创CPU IntelCPU 性能对比测试 基准测试工具 处理器性能
在线阅读 下载PDF
核有丝分裂器蛋白NuMA在人脑胶质瘤中的表达 被引量:1
6
作者 肖瑾 万经海 +3 位作者 李长元 冯春国 徐培坤 胡向阳 《安徽医科大学学报》 CAS 北大核心 2007年第1期42-44,共3页
目的检测核有丝分裂器蛋白(NuMA)在人脑胶质瘤中的表达及其与胶质瘤临床病理学特征之间的关系。方法采用免疫组化SP法检测65例人脑胶质瘤标本和15例正常脑组织标本中NuMA蛋白的表达情况。结果NuMA在Ⅱ级、Ⅲ级、Ⅳ级人脑胶质瘤中的表达... 目的检测核有丝分裂器蛋白(NuMA)在人脑胶质瘤中的表达及其与胶质瘤临床病理学特征之间的关系。方法采用免疫组化SP法检测65例人脑胶质瘤标本和15例正常脑组织标本中NuMA蛋白的表达情况。结果NuMA在Ⅱ级、Ⅲ级、Ⅳ级人脑胶质瘤中的表达分别为42.9%、66.7%、82.4%;在正常脑组织中NuMA的表达率为20%。结论NuMA的过高表达与胶质瘤的组织病理学分级显著相关,而与肿瘤的组织学类型无关。 展开更多
关键词 numa 胶质瘤 免疫组织化学
暂未订购
基于NUMA MPSoC的FFT并行化算法设计及实现 被引量:1
7
作者 张冰 杜高明 +1 位作者 李丽 杨盛光 《微电子学与计算机》 CSCD 北大核心 2007年第12期109-112,共4页
如何充分利用多个处理器任务级并行或线程级并行的特点提高性能已成为MPSoC设计的关键问题之一。在建立基于非均匀存储型(Non-Uniform Memory Access Architecture,NUMA)MPSoC平台的基础上,以快速傅里叶变换为例,遵循减少核间通讯及平... 如何充分利用多个处理器任务级并行或线程级并行的特点提高性能已成为MPSoC设计的关键问题之一。在建立基于非均匀存储型(Non-Uniform Memory Access Architecture,NUMA)MPSoC平台的基础上,以快速傅里叶变换为例,遵循减少核间通讯及平均分配工作负载的原则,提出其并行化方法,设计出相应的并行程序及底层驱动,在FPGA原型芯片的运行环境下分析系统性能。试验结果表明,在4核MPSoC的FPGA原型系统中最高加速比可达2.65,具有较好的并行执行效率。 展开更多
关键词 numa 多核片上系统 FFT 并行算法
在线阅读 下载PDF
NuMA蛋白的生物学作用及其研究进展 被引量:1
8
作者 杨立琳 孙露双 +1 位作者 曾晓 曹允考 《东北农业大学学报》 CAS CSCD 2008年第10期127-130,共4页
NuMA存在于动、植物细胞中,是细胞核基质的重要组成部分,参与纺锤体极的组装与分解、核重组等过程,调节细胞周期,对细胞的有丝分裂和减数分裂具有重要作用。此外,对细胞凋亡也发挥重要作用,NuMA的降解是早期细胞调亡的标志。
关键词 numa 细胞 功能
暂未订购
面向CC-NUMA体系结构的事务内存冲突规避方法 被引量:1
9
作者 王睿伯 卢锡城 +1 位作者 卢凯 王绍刚 《计算机学报》 EI CSCD 北大核心 2011年第4期676-683,共8页
现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过... 现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过详尽的实验数据,深入分析了CC-NUMA结构的本地、远程访存差异特性对事务内存性能的影响,提出了一种面向CC-NUMA体系结构的冲突规避方法PBC.PBC在事务启动之前,对冲突可能性进行预测,并根据预测结果对事务进行调度,以降低事务的失败率.实验表明,文中提出的PBC方法可以显著提高CC-NUMA机器上运行事务内存的整体性能. 展开更多
关键词 事务内存 CC-numa 冲突规避
在线阅读 下载PDF
植物细胞核基质(Nuclear Matrix)的形态结构及其NuMA蛋白成分的研究 被引量:1
10
作者 汪健 孙英丽 翟中和 《实验生物学报》 CSCD 1997年第4期417-429,共13页
应用细胞选择性抽提并结合DGD包埋去包埋剂电镜技术对植物细胞核基质的形态结构进行了观察。结果显示胡萝卜悬浮培养细胞、银杏花粉细胞和精子细胞的细胞核内存在一个非染色质性的纤维蛋白网络体系。免疫荧光染色结果说明植物细胞核基... 应用细胞选择性抽提并结合DGD包埋去包埋剂电镜技术对植物细胞核基质的形态结构进行了观察。结果显示胡萝卜悬浮培养细胞、银杏花粉细胞和精子细胞的细胞核内存在一个非染色质性的纤维蛋白网络体系。免疫荧光染色结果说明植物细胞核基质中含有与动物NuMA多抗交叉反应的多肽。免疫印迹反应显示胡萝卜悬浮培养细胞核基质蛋白与NuMA蛋白多抗的阳性反应条带为74KD和76 KD;银杏花粉细胞只有78 KD一条阳性带。以动物核基质NuMA蛋白保守杆状区的cDNA片段作为探针,与白菜子叶总DNA进行Southern杂交的结果表明植物细胞基因组中含有动物NuMA蛋白cDNA的同源序列。 展开更多
关键词 植物细胞 核基质 numa 蛋白
在线阅读 下载PDF
CC-NUMA系统中一种块传输通讯机制的设计与实现 被引量:1
11
作者 张峻 庞征斌 +3 位作者 郑义 谢旻 徐炜遐 周兴铭 《计算机工程与科学》 CSCD 2008年第1期138-141,共4页
本文描述了一种CC-NUMA结点控制器内实现的通信机制,通信请求通过描述符进行提交,利用CC-NUMA硬件实现的Cache一致性协议,实现高性能的一致性数据传输。基于这种通信机制,实现了高速通信软件接口,使用用户级通信技术,将硬件的通讯功能... 本文描述了一种CC-NUMA结点控制器内实现的通信机制,通信请求通过描述符进行提交,利用CC-NUMA硬件实现的Cache一致性协议,实现高性能的一致性数据传输。基于这种通信机制,实现了高速通信软件接口,使用用户级通信技术,将硬件的通讯功能抽象出来给应用层使用,在测试中获得了较好的性能。 展开更多
关键词 CC-numa 描述符 一致性块传输 通信接口
在线阅读 下载PDF
基于CC-NUMA系统模拟器的并行程序性能分析 被引量:1
12
作者 陈渝 庞立会 +1 位作者 杨学军 陈福接 《计算机工程与科学》 CSCD 2001年第1期86-89,96,共5页
针对 CC- NUMA并行系统的特点 ,本文描述了模拟器—AMY的设计与实现。该模拟器运行在 x86PC机上的 L inux操作系统环境下 ,采用多项优化技术 ,能够较精确地统计并行程序的时间开销和 CC- NUMA并行系统的各项参数 ,具有执行速度快、精度... 针对 CC- NUMA并行系统的特点 ,本文描述了模拟器—AMY的设计与实现。该模拟器运行在 x86PC机上的 L inux操作系统环境下 ,采用多项优化技术 ,能够较精确地统计并行程序的时间开销和 CC- NUMA并行系统的各项参数 ,具有执行速度快、精度高和内存开销小等特点。在 AMY模拟器环境下 ,通过对几个典型的并行测试程序的模拟执行 ,文章给出了统计的模拟结果 ,分析了并行测试程序的执行行为和开销 ,最后得出了在 CC- NUMA并行系统中对并行程序进行性能优化的有益的指导原则。 展开更多
关键词 CC-numa 并行系统模拟器 性能分析 并行程序
在线阅读 下载PDF
CC-NUMA架构下4路龙芯3B服务器设计与实现 被引量:3
13
作者 张鹏 《计算机工程与科学》 CSCD 北大核心 2018年第12期2141-2145,共5页
针对特定领域中服务器的高性能计算、高带宽通信以及自主可控需求,在分析龙芯3B3000处理器架构特点的基础上,设计了基于CC-NUMA并行处理架构的4路龙芯3B3000高性能服务器核心模块,通过使用TOE芯片提高了网络响应效率,同时大幅降低了10G... 针对特定领域中服务器的高性能计算、高带宽通信以及自主可控需求,在分析龙芯3B3000处理器架构特点的基础上,设计了基于CC-NUMA并行处理架构的4路龙芯3B3000高性能服务器核心模块,通过使用TOE芯片提高了网络响应效率,同时大幅降低了10G以太网接口对处理器资源的占用消耗,有效提高了服务器的综合性能。通过测试验证,该服务器能够实现高效的并行计算能力和10G以太网通信能力,且国产元器件种类占比和数量占比均可达95%以上。 展开更多
关键词 服务器 CC-numa 龙芯3B3000 TOE 自主可控
在线阅读 下载PDF
四膜虫大核基质中含有NuMA类似蛋白
14
作者 孙英丽 陈丹英 高崇明 《动物学报》 SCIE CAS CSCD 2000年第1期104-107,共4页
SUN Ying Li CHEN Dan Ying GAO Chong Ming) (College of Life Sciences, Peking University, Beijing 100871, China)
关键词 四膜虫 numa 核基质
在线阅读 下载PDF
一种CC-NUMA系统模拟环境的研究与实现
15
作者 庞立会 陈渝 《计算机工程》 EI CAS CSCD 北大核心 2005年第3期82-85,共4页
描述了CC-NUMA模拟环境——AMY的研究与实现。它采用多项优化技术,能在X86 PC机上的Linux操作系统环境下运行,能够较精确地统计并行程序的时间开销和CC-NUMA并行系统的各项参数,它特别适合于分析并行程序在CC-NUMA系统下的执行行为和开... 描述了CC-NUMA模拟环境——AMY的研究与实现。它采用多项优化技术,能在X86 PC机上的Linux操作系统环境下运行,能够较精确地统计并行程序的时间开销和CC-NUMA并行系统的各项参数,它特别适合于分析并行程序在CC-NUMA系统下的执行行为和开销,能够有效指导并行程序的优化和对CC-NUMA并行系统进行深入研究。最后将AMY模拟环境与CC-NUMA系统以及其它的模拟环境进行比较分析,对它的精确性、灵活性和有效性进行了检验。 展开更多
关键词 并行程序 CC-numa 并行系统 LINUX操作系统 开销 PC机 模拟环境 有效指导 灵活性 有效性
在线阅读 下载PDF
CC-NUMA并行系统通信优化的变换技术
16
作者 陈渝 nudt.edu.cn +2 位作者 李春江 杨学军 陈福接 《软件学报》 EI CSCD 北大核心 2000年第4期507-514,共8页
减少通信开销是并行编译优化的主要目标之一 .该文针对具有 cache一致性的非一致存储访问并行系统 ( CC- NUMA)的特点 ,提出通过结合计算变换和数据变换 ,在统一的代数框架下对并行程序进行通信优化的策略和方法 .通过实验测试 。
关键词 并行编译 通信优化 数据变换 CC-numa
在线阅读 下载PDF
Linux NUMA关键技术研究
17
作者 吴庆波 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第z1期556-562,共7页
NUMA(Non-Uniform Memory Access Architecture)系统在市场上的应用越来越广泛,许多厂商都成功推出了基于NUMA架构的服务器,重点讨论当前Linux内核中的NUMA技术,主要包括:存储管理和NUMA调度,并在SGI Altix 350 NUMA系统上对Linux进行... NUMA(Non-Uniform Memory Access Architecture)系统在市场上的应用越来越广泛,许多厂商都成功推出了基于NUMA架构的服务器,重点讨论当前Linux内核中的NUMA技术,主要包括:存储管理和NUMA调度,并在SGI Altix 350 NUMA系统上对Linux进行了基本测试,为操作系统进行NUMA技术的研究提供了有力的借鉴. 展开更多
关键词 存储管理 numa 操作系统
在线阅读 下载PDF
CC-NUMA结构计算机含错技术研究
18
作者 金丽娜 《长春大学学报》 2008年第12期28-30,共3页
主要研究CC-NUMA结构计算机的主存共享状态下含错技术问题。本文对主存共享、含错区域划分进行了说明,并深入分析了在主存共享状态下的含错区域划分、乱写防护等含错技术支持和保障。
关键词 CC—numa 主存共享 含错技术
在线阅读 下载PDF
CC-NUMA时代到来——谈新一代可扩展共享存储并行处理机的发展
19
作者 孟念青 袁国兴 《中国经济和信息化》 1999年第19期25-26,共2页
在实际应用对高计算性能永无休止的追求过程中,随着众多新技术、新材料和新工艺的出现,并行处理技术已取得长足进步。自进入以存储系统为中心的体系结构时代,并行处理技术已经成为现代计算机设计的关键技术。
关键词 并行处理机 CC-numa 分布共享存储 体系结构 可扩展性 numa 存储带宽 存储系统 节点内 系统利用率
在线阅读 下载PDF
NUMA架构内多个节点间访存延时平衡的内存分配策略 被引量:4
20
作者 李慧娟 栾钟治 +2 位作者 王辉 杨海龙 钱德沛 《计算机学报》 EI CSCD 北大核心 2017年第9期2111-2126,共16页
随着多核架构的发展和普及,NUMA多核架构凭借其本地访存低延时的优势,被各大商业数据中心以及科学计算集群广泛采用.NUMA架构通过增加多个内存控制器,缓解了多核架构下对同一个内存控制器的争用问题,但同时也增加了内存管理的负担.Linu... 随着多核架构的发展和普及,NUMA多核架构凭借其本地访存低延时的优势,被各大商业数据中心以及科学计算集群广泛采用.NUMA架构通过增加多个内存控制器,缓解了多核架构下对同一个内存控制器的争用问题,但同时也增加了内存管理的负担.Linux的系统开发者为了实现充分利用NUMA本地访存低延时的特点,在为进程分配内存时,选择进程当前正在运行的NUMA节点作为分配内存的目标节点.这种分配会导致进/线程之间共享内存的不公平.例如,一个在当前本地节点被分配很多内存的进程,可能被调度到远端节点运行,这样会导致进程的性能波动.针对这一问题,该文设计了一种保证NUMA架构内各内存节点间访存延时平衡的内存分配策略,并在Linux系统中实现和验证.延时的获取方法依赖平台,但是系统内核的策略是通用的.实验结果表明,与Linux默认的内存分配策略相比,进/线程间的不公平性平均降低了16%(最多34%),并且各进/线程的性能没有较大抖动. 展开更多
关键词 numa架构 内存分配策略 访存延时 访存延时感知 访存延时平衡
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部