期刊文献+
共找到16,130篇文章
< 1 2 250 >
每页显示 20 50 100
基于监督学习的稀疏矩阵乘算法优选
1
作者 彭林 张鹏 +2 位作者 陈俊峰 唐滔 黄春 《计算机工程与科学》 北大核心 2025年第3期381-391,共11页
稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了... 稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了一种基于机器学习的最优稀疏矩阵乘算法选择模型,以给定矩阵集作为数据源,抽取稀疏矩阵的特征,并使用SPA、HASH、ESC计算获得的性能数据进行训练和验证,获得的模型能够仅使用稀疏矩阵的特征即可完成对新数据集的算法优选。实验结果表明,该模型可以获得91%以上的预测准确率,平均性能达到最优选择的98%,是单一算法性能的1.55倍以上,并且可在实际库函数中使用,具有良好的泛化能力和实用价值。 展开更多
关键词 稀疏矩阵乘 SpGEMM SPA算法 HASH算法 ESC算法 机器学习
在线阅读 下载PDF
面向特定应用的可配置CPU性能分析方法
2
作者 邓全 林荣臻 +2 位作者 罗莉 鲁建壮 王永文 《计算机工程与科学》 北大核心 2025年第11期1901-1911,共11页
随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系... 随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系结构工程师,缺乏一套科学方法进行指导,因此,提出了一种面向特定应用的可配置CPU性能分析方法。在软件层面,利用Perf工具快速定位应用程序在硬件执行时的热点代码块;在硬件层面,通过分析框架的2种计数模式(时钟周期计数与slots计数),锁定各个执行部件的热点执行情况,以便设计人员快速定位硬件执行的热点行为。对支持RISCV指令集的可配置DMR架构在流体力学典型程序NPB上进行了敏捷设计。实验结果表明,迭代后可配置CPU单核性能提升了13.2%,面积开销增加了12.2%。 展开更多
关键词 性能分析 可配置CPU PMU NPB 测试
在线阅读 下载PDF
芯粒互联技术综述
3
作者 王浩 王勇 +3 位作者 冯长磊 盖伟新 吴鹏 钱江 《计算机研究与发展》 北大核心 2025年第11期2651-2662,共12页
作为摩尔定律的“破局者”,芯粒(Chiplet)技术被业界寄予了厚望.芯粒技术能够将多个具有特定功能的“小芯粒”通过高速互联技术组合成一个“小芯粒”集成芯片,其技术核心是能够实现芯粒组合扩展的芯粒互联技术.从芯粒互联协议、互联架... 作为摩尔定律的“破局者”,芯粒(Chiplet)技术被业界寄予了厚望.芯粒技术能够将多个具有特定功能的“小芯粒”通过高速互联技术组合成一个“小芯粒”集成芯片,其技术核心是能够实现芯粒组合扩展的芯粒互联技术.从芯粒互联协议、互联架构、容错机制、典型互联芯粒、基于互联芯粒的可测性设计5个方面进行了分析与讨论.首先详细对比分析了国内外芯粒互联协议,给出了各协议的分层及功能.然后介绍了3种典型的芯粒互联架构,分析了各种架构的特点及优势.之后介绍了芯粒容错机制,介绍了互联接口容错编码、容错拓扑和容错路由等容错途径.接着给出了可编程互联芯粒、路径可编程互联芯粒以及专用互联芯粒3种设计方案.最后介绍了基于互联芯粒的可测试性设计与测试方案.以芯粒互联为主题,旨在帮助读者对芯粒互联技术进行系统性了解. 展开更多
关键词 芯粒 互联 互联芯粒 架构 容错机制 可测性设计
在线阅读 下载PDF
一种基于产品复用模型的高效遥感共性产品生产算法
4
作者 左宪禹 周小虎 +2 位作者 周黎明 谢毅 刘成 《计算机科学》 北大核心 2025年第6期316-323,共8页
随着各行业对遥感共性产品需求的不断增加,高性能遥感产品生产系统的应用范围不断扩大。优秀的任务调度算法作为该系统的关键部件,能显著提高生产效率。然而,在遥感共性产品的生产过程中面临特有的挑战,如果大量的工作流在短时间内被提... 随着各行业对遥感共性产品需求的不断增加,高性能遥感产品生产系统的应用范围不断扩大。优秀的任务调度算法作为该系统的关键部件,能显著提高生产效率。然而,在遥感共性产品的生产过程中面临特有的挑战,如果大量的工作流在短时间内被提交生产,这些工作流在处理中存在重复计算和数据处理的问题,且生成共性产品所需的数据量往往较大,流程处理时间长,很容易导致资源浪费和生产效率下降。为了解决这一问题,提出一种基于产品复用模型的任务划分策略。该策略着眼于优化工作流处理,首先将用户提交的工作流按照任务重复度打包成流程包,把带有重复任务的流程分配到同一个计算节点,旨在减少节点间的数据传输时间;然后引入一种产品复用模型,允许不同的处理流程复用已获得的产品结果,减少重复性计算和数据处理,从而提高生产效率,满足共性产品生产的高效化需求。为了验证所提算法的有效性,将所提算法和传统算法FCFS,SJF分别在CloudSim仿真模拟器中进行模拟实验。结果表明,所提调度算法任务的总完成时间和任务的平均响应时间均显著低于对比算法,展现出了更为优秀的性能。 展开更多
关键词 高性能计算 共性遥感产品 产品复用 任务划分策略 CloudSim
在线阅读 下载PDF
基于天河互连的并行文件系统网络驱动
5
作者 董勇 邬会军 +3 位作者 杨梨花 张伟 王睿伯 周恩强 《计算机工程与科学》 北大核心 2025年第3期392-399,共8页
并行文件系统是高性能计算机系统软件栈的重要组成部分。面向高速网络的驱动是并行文件系统提供高效数据访问的关键环节。设计实现了基于天河高速互连网络TH-Express的并行文件网络驱动GLND,在并行化、通信协议以及容错3方面进行了有针... 并行文件系统是高性能计算机系统软件栈的重要组成部分。面向高速网络的驱动是并行文件系统提供高效数据访问的关键环节。设计实现了基于天河高速互连网络TH-Express的并行文件网络驱动GLND,在并行化、通信协议以及容错3方面进行了有针对性的优化,采用VP粒度并行,配合适度均衡的流水线划分,实现了高吞吐率;根据消息大小差异等因素自适应地选择底层通信协议,实现NUMA感知的内存管理机制;通过自适应调节的超时机制来避免软件异常超时对通信操作的影响。实验结果表明,在相同硬件条件下,GLND相比于TCP的写带宽平均提升了23.69%,读带宽平均提升了79.25%。 展开更多
关键词 并行文件系统 互连网络 网络编程接口
在线阅读 下载PDF
面向国产芯片的可复现矩阵分解
6
作者 唐滔 姜浩 +2 位作者 彭林 漆海俊 鲁轻风 《计算机工程与科学》 北大核心 2025年第5期761-774,共14页
浮点程序的可复现性是指相同的浮点程序在多次不同的运行中得到按位完全相同的数值结果,这对程序调试或数值结果的正确性检验具有重要意义,在数值仿真模拟领域应用广泛。然而,浮点计算的结果往往受到计算顺序的影响,因而指令的动态调度... 浮点程序的可复现性是指相同的浮点程序在多次不同的运行中得到按位完全相同的数值结果,这对程序调试或数值结果的正确性检验具有重要意义,在数值仿真模拟领域应用广泛。然而,浮点计算的结果往往受到计算顺序的影响,因而指令的动态调度和乱序执行使得浮点计算的精确可复现成为一个挑战。矩阵分解算法在数值仿真应用中有着非常广泛的应用背景,基于可复现的矩阵分解算法可有效提升精度敏感的数值仿真应用的调试和结果分析的效率。基于无误差变换技术,在可复现BLAS库的基础上实现了分块LU分解、Cholesky分解和QR分解3个可复现矩阵分解算法,并在国产处理器上进行了验证。实验结果表明,可复现矩阵分解算法具备良好的数值精确性和可复现性。 展开更多
关键词 可复现 LU分解 CHOLESKY分解 QR分解
在线阅读 下载PDF
面向隐私计算的模运算加速设计
7
作者 刘宏伟 支梁 +3 位作者 秦梦远 陈铭志 董文阔 郝沁汾 《计算机工程与科学》 北大核心 2025年第8期1331-1342,共12页
隐私计算技术是数据中心保证数据安全的重要手段,随着量子计算的发展,基于格的后量子算法和全同态加密算法逐步发展流行。在这些算法中,模运算都是广泛使用的非线性算子之一,主要用于避免计算过程中出现溢出。面向隐私计算及密码学应用... 隐私计算技术是数据中心保证数据安全的重要手段,随着量子计算的发展,基于格的后量子算法和全同态加密算法逐步发展流行。在这些算法中,模运算都是广泛使用的非线性算子之一,主要用于避免计算过程中出现溢出。面向隐私计算及密码学应用中广泛使用的模运算问题,在FPGA平台上基于PCIe接口设计实现了一个软硬件协同加速设计,能够有效掩盖通信延迟,并支持高达2048位的模运算,包括模乘和模幂运算,以服务于有隐私计算需求的数据中心场景。已有研究工作都仅关注模运算本身,而此软硬件协同框架则给出了一个完整的加速框架,不仅包含运算核心,还给出了数据和软硬件接口,并减少了通信延迟的影响。最后结合一个具体的运营商场景,实现了针对性的加速应用,通过实验验证了设计的性能优势。 展开更多
关键词 隐私计算 模乘 模幂 软硬件协同 RSA
在线阅读 下载PDF
基于梯度引导的社团隐匿扰动子结构优化方法
8
作者 俞山青 宋亦聃 +4 位作者 周金涛 周梦 李家祥 汪泽钰 宣琦 《计算机科学》 北大核心 2025年第9期376-387,共12页
社团检测是一种用于揭示网络聚集行为的技术,能够精准识别网络中的社团结构,帮助更好地理解复杂网络的内部组织和功能。然而,随着社团检测算法的快速发展,其中信息泄露和过度挖掘等诸多隐私问题也备受关注。因此,社团隐匿算法被广泛研究... 社团检测是一种用于揭示网络聚集行为的技术,能够精准识别网络中的社团结构,帮助更好地理解复杂网络的内部组织和功能。然而,随着社团检测算法的快速发展,其中信息泄露和过度挖掘等诸多隐私问题也备受关注。因此,社团隐匿算法被广泛研究,它通过构建扰动子结构来模糊网络中的社团结构,从而有效地降低社团检测算法的识别能力,实现隐私保护。在现有的扰动子结构优化方法中,基于遗传算法的方法表现较为突出,但这些方法在搜索解过程中缺少方向性指导,因此在构建扰动子结构的效果和效率上仍有提升空间。通过将梯度引导信息引入遗传算法搜索,可以优化扰动子结构的构建过程,从而提高社团隐匿的效果和效率。实验结果表明,在社团隐匿问题中加入梯度引导信息的遗传算法,在搜索扰动子结构方面显著优于其他基线方法,证明了其有效性。 展开更多
关键词 社团检测 社团隐匿 梯度优化 进化计算 扰动子结构
在线阅读 下载PDF
面向同构非对称多核的OpenOCD调试功能优化研究
9
作者 唐竹 陈宝海 +1 位作者 王敬宇 朱琪 《计算机工程与科学》 北大核心 2025年第1期45-55,共11页
多核架构是提升处理器性能的重要手段,其在网络处理领域的应用也日渐广泛,因此,需要配套高效的多核调试工具才能提升多核网络处理器的开发效率。由于处理网络任务的多核之间并不存在很强的关联性,业务核更多使用运行到结束(RTC)而非流水... 多核架构是提升处理器性能的重要手段,其在网络处理领域的应用也日渐广泛,因此,需要配套高效的多核调试工具才能提升多核网络处理器的开发效率。由于处理网络任务的多核之间并不存在很强的关联性,业务核更多使用运行到结束(RTC)而非流水线(Pipeline)的处理模式,多个业务核之间并不需要复杂的缓存一致性逻辑,因此采用同构的非对称多处理AMP架构,可有效降低芯片复杂度和研发成本。目前,非对称多核调试需要同时启动多个GDB,不仅调试不便,同时还会导致较大的资源开销。针对同构非对称多核场景下OpenOCD多端口调试方案进行优化,以单个GDB端口实现针对多个非对称核的调试功能,同时支持对称多处理核簇与非对称多核的混合场景。最后,基于RISC-V软硬件平台搭建了非对称多核调试环境,对线程操作、单步执行、单步跳过、继续运行、查看堆栈和断点设置等GDB调试命令进行测试,验证了单端口OpenOCD进行非对称多核调试的可行性和有效性。 展开更多
关键词 非对称多处理 多核调试 OpenOCD 单端口
在线阅读 下载PDF
基于改进遗传算法的可信边缘计算任务卸载方法
10
作者 王亚丽 娄世豪 《郑州大学学报(理学版)》 北大核心 2025年第3期72-80,共9页
针对边缘服务器可信性无法保证的问题,提出一种基于改进遗传算法的可信边缘计算任务卸载方法。首先,为激励边缘服务器参与任务卸载竞争,采用一种声誉机制激励边缘服务器,并以已有声誉作为评估边缘服务器可信度的依据。其次,使用基于声... 针对边缘服务器可信性无法保证的问题,提出一种基于改进遗传算法的可信边缘计算任务卸载方法。首先,为激励边缘服务器参与任务卸载竞争,采用一种声誉机制激励边缘服务器,并以已有声誉作为评估边缘服务器可信度的依据。其次,使用基于声誉和分布式一致性协议的拜占庭共识机制来选举边缘服务器领导者。最后,边缘服务器领导者采用一种改进的遗传算法来决策边缘服务器的任务卸载行为,以选出满足用户时延和能耗需求约束的可信边缘服务器来执行终端设备的卸载任务。仿真实验结果表明,与基准测试方案相比,所提方法的成本降低5.46%~59.26%。 展开更多
关键词 边缘计算 共识机制 可信度 遗传算法 任务卸载
在线阅读 下载PDF
三维片上网络自适应路由算法研究综述
11
作者 邵晶波 宁家鸿 苏鑫苓 《计算机工程与科学》 北大核心 2025年第10期1745-1755,共11页
近年来,随着半导体制造工艺不断发展,芯片的集成度不断提高。作为大规模片上互连问题的一种解决方案,三维片上网络(3D NoC)已经成为集成电路发展的一个主要趋势。然而,系统之间大规模的通信可能会造成网络拥塞、链路故障以及局部温度过... 近年来,随着半导体制造工艺不断发展,芯片的集成度不断提高。作为大规模片上互连问题的一种解决方案,三维片上网络(3D NoC)已经成为集成电路发展的一个主要趋势。然而,系统之间大规模的通信可能会造成网络拥塞、链路故障以及局部温度过高等问题,从而降低系统性能。故拥塞控制、拓扑感知以及热点避免是路由算法所研究的重点。而3D NoC自适应路由算法根据3D NoC的网络状态,动态地对数据包进行路由决策,已成为3D NoC路由算法研究的热点之一。首先介绍了自适应路由算法的研究历史,阐述了3D NoC自适应路由算法的工作原理和实现方式,并从算法设计原则的角度对算法进行分类。其次在基于路由规则、路由策略以及调整策略方面的分析框架下,对近年来提出的自适应路由算法进行了分析,并归纳了它们的特点。最后,讨论了自适应路由算法面临的挑战和未来发展趋势。 展开更多
关键词 三维片上网络 自适应路由算法 热点 拥塞控制 拓扑感知
在线阅读 下载PDF
改善网络伸缩性的Docker容器迁移算法研究
12
作者 王佳 班瑞 +2 位作者 王新 华润多 林昕 《电脑与电信》 2025年第5期10-15,共6页
云计算、虚拟化等技术在计算机领域中发展迅速,虚拟化技术中的Docker容器技术是当前主要的研究热点。由于云数据中心的流量负载随时变化,网络可能频繁发生拥塞,造成网络设备资源紧张,导致应用的吞吐量下降、丢包增多和时延增大,影响通... 云计算、虚拟化等技术在计算机领域中发展迅速,虚拟化技术中的Docker容器技术是当前主要的研究热点。由于云数据中心的流量负载随时变化,网络可能频繁发生拥塞,造成网络设备资源紧张,导致应用的吞吐量下降、丢包增多和时延增大,影响通信性能和整个云平台服务器的质量。对此,研究在保持物理机不变的情况下通过迁移物理机上挂载的Docker容器来改善网络拥塞,提出一种网络感知的Docker容器重调度算法,通过迁移挂载在物理机上的Docker,来提高物理机通信的能力以达到提高全局的通信效率。算法通过迁移较少的虚拟机来提高物理机之间的通信能力,以提升整个数据中心的整体通信性能。 展开更多
关键词 DOCKER 虚拟机 网络伸缩性
在线阅读 下载PDF
多策略SMA优化的研究生英语成绩聚类仿真分析
13
作者 王磊 《计算机仿真》 2025年第8期255-261,共7页
在研究生英语水平考试成绩数据聚类统计分析过程中,针对传统KMC方法存在初始聚类中心选取随机性较大且算法容易陷入局部最优,聚类精度低等问题,提出了一种改进的多策略聚类算法LSMA-KMC。首先,设计了Interative混沌映射初始化种群,并引... 在研究生英语水平考试成绩数据聚类统计分析过程中,针对传统KMC方法存在初始聚类中心选取随机性较大且算法容易陷入局部最优,聚类精度低等问题,提出了一种改进的多策略聚类算法LSMA-KMC。首先,设计了Interative混沌映射初始化种群,并引入莱维飞行优化策略,提高寻找聚类中心的准确率;其次,利用最大最小距离方法优化聚类中心的初始化,使中心点分布更均匀;最后,通过LSMA和KMC互补迭代提高数据聚类精度。测试结果表明:提出的LSMA-KMC方法相对于KMC,KMC++以及同类群体智能优化SMA-KMC、MFO-KMC,搜索精度和收敛速度更高,聚类代价更低。应用于研究生英语成绩聚类中,能更直观地了解研究生的学习现状,有助于制定科学有效的智慧教学管理方案。 展开更多
关键词 K均值聚类 多策略黏菌算法 最大最小距离法 群体智能 成绩数据
在线阅读 下载PDF
基于区块链的高校课程资源共享平台设计
14
作者 金一宁 《哈尔滨商业大学学报(自然科学版)》 2025年第1期25-30,共6页
当前的课程资源共享因缺乏信任机制,存在依赖特定平台、难以碎片化共享、共享数据使用不便等问题.基于区块链的理论与技术搭建课程资源共享平台,通过“共享账本”实现方便、快捷、灵活、低成本的共享多种数据格式的课程资源,打造“轻共... 当前的课程资源共享因缺乏信任机制,存在依赖特定平台、难以碎片化共享、共享数据使用不便等问题.基于区块链的理论与技术搭建课程资源共享平台,通过“共享账本”实现方便、快捷、灵活、低成本的共享多种数据格式的课程资源,打造“轻共享”、“多边交流”的新模式,利于个性化的课程资源建设,同时区块链技术的“可溯源”、“时间戳”可以为课程资源知识产权的有效保护提供可靠的依据,通过合理的激励机制进行合约自动执行,可以保证低成本、高效率的运行. 展开更多
关键词 区块链 高校课程 课程资源 共享设计 智能合约
在线阅读 下载PDF
基于气象大数据云平台的文件存储优化设计
15
作者 贾晨刚 王玮 《陕西气象》 2025年第5期82-86,共5页
在气象大数据云平台运行阶段,其分布式文件存储系统出现异常现象:服务器端存储空间使用量与设备管理界面显示数据存在显著偏差,实际可用容量低于预设设计阈值。经开展系统性排查与机理分析,明确该问题的核心诱因在于存储系统数据管理颗... 在气象大数据云平台运行阶段,其分布式文件存储系统出现异常现象:服务器端存储空间使用量与设备管理界面显示数据存在显著偏差,实际可用容量低于预设设计阈值。经开展系统性排查与机理分析,明确该问题的核心诱因在于存储系统数据管理颗粒度粗放,以及资源动态分配机制存在设计缺陷。为解决上述问题,研究团队实施了存储管理系统升级方案,同步完成设备参数的优化配置。具体措施包括:(1)对数据存储单元进行精细化管控,建立存储块的动态映射机制;(2)构建负载均衡模型,实现数据在存储节点间的最优分布;(3)设计多重容错架构,通过数据同步机制降低单点故障风险。实践验证表明,此次技术优化使平台文件存储服务的可用性、可靠性显著提升,为气象监测预报业务的多源数据整合、实时分析及历史归档提供了规范化的存储支撑,有效保障了业务流程的连续性与稳定性,为后续数据存储方案的优化设计与实践应用提供了可借鉴的技术参考与理论依据。 展开更多
关键词 气象大数据云平台 分布式存储 存储引擎 优化设计
在线阅读 下载PDF
计算机网络系统集成技术的应用研究
16
作者 徐涛 《移动信息》 2025年第9期289-291,共3页
随着计算机技术的不断发展,其在各行各业均得到了广泛应用,为人们日常的生活与工作带来了巨大的便利。目前,计算机技术在各行业中的应用均通过数据集成的方式来达到想要实现的功能。但随着计算机技术的不断发展,传统的数据集成模式已经... 随着计算机技术的不断发展,其在各行各业均得到了广泛应用,为人们日常的生活与工作带来了巨大的便利。目前,计算机技术在各行业中的应用均通过数据集成的方式来达到想要实现的功能。但随着计算机技术的不断发展,传统的数据集成模式已经无法满足日益增加的功能需求,对计算机网络集成技术的发展提出了重要挑战。基于此,文中对计算机网络集成技术的应用展开了研究。 展开更多
关键词 计算机 网络系统 集成技术
在线阅读 下载PDF
IIoT环境下基于聚类的工作流多雾协同调度算法 被引量:2
17
作者 吴宏伟 江凌云 陈海峰 《计算机工程与设计》 北大核心 2025年第1期52-59,共8页
为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中... 为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中的任务进行聚类,基于聚类结果,在多个雾服务器之间使用改进的免疫粒子群优化算法进行任务调度。实验结果表明,该算法相比其它一些传统的调度算法在完工时间、成本、负载均衡方面都有一定提升。 展开更多
关键词 工业物联网 聚类 工作流 二分K均值算法 多雾 免疫粒子群优化算法 调度算法
在线阅读 下载PDF
改进粒子群模糊PID算法对污水处理曝气控制的优化 被引量:2
18
作者 阳鑫 张劲 刘志 《科学技术与工程》 北大核心 2025年第7期3064-3070,共7页
针对污水处理曝气控制系统存在滞后大、非线性的问题,分析了污水处理曝气控制系统的原理,建立了污水处理曝气控制系统的数学模型;并通过对传统比例-积分-微分(proportion, integration, differential, PID)控制算法、粒子群算法和模糊... 针对污水处理曝气控制系统存在滞后大、非线性的问题,分析了污水处理曝气控制系统的原理,建立了污水处理曝气控制系统的数学模型;并通过对传统比例-积分-微分(proportion, integration, differential, PID)控制算法、粒子群算法和模糊控制算法的研究,提出了一种改进的粒子群优化模糊PID算法,有效解决了模糊PID控制过度依赖专家经验、缺少动态性能的缺点。采用MATLAB对该系统进行仿真,从阶跃响应、抗干扰性和模型失配情况下的鲁棒性三个方面,对三种不同控制方法的快速性、准确性和稳定性进行比较。结果表明,基于改进的粒子群模糊PID算法在阶跃响应、抗干扰能力和鲁棒性方面均优于传统PID和模糊PID控制算法,能够更快速、更稳定地实现对溶解氧的高效调节,改善了控制系统性能,有助于降低污水处理厂的运营成本。 展开更多
关键词 粒子群 模糊PID控制 PID 溶解氧
在线阅读 下载PDF
基于Matrix Core的高性能多维FFT设计与优化 被引量:1
19
作者 陆璐 祝松祥 +2 位作者 田卿燕 林海山 郭逸劼 《华南理工大学学报(自然科学版)》 北大核心 2025年第3期20-30,共11页
快速傅里叶变换(FFT)算法广泛应用于科学计算等领域。为了充分挖掘图形处理器(GPU)的计算能力并进一步提高FFT的计算效率,该文针对矩阵形式的Stockham FFT,提出了一种基于Matrix Core的高性能多维FFT计算方案。在计算优化方面,该方案利... 快速傅里叶变换(FFT)算法广泛应用于科学计算等领域。为了充分挖掘图形处理器(GPU)的计算能力并进一步提高FFT的计算效率,该文针对矩阵形式的Stockham FFT,提出了一种基于Matrix Core的高性能多维FFT计算方案。在计算优化方面,该方案利用Matrix Core加速FFT计算中的矩阵乘运算,同时通过编译器内部指令完成小粒度的矩阵乘加,使得Matrix Core支持更多尺寸的FFT计算。在内存优化方面,该方案使用2层迭代策略,以充分利用共享内存,减少与全局内存的数据交换;根据Matrix Core的矩阵数据在各个线程寄存器中的分布规律,直接在寄存器上完成FFT计算中大量存在的矩阵逐元素乘操作;通过对共享内存中的数据进行重排来缓解存储体冲突,并采用双缓冲策略缓解访存瓶颈。该文还提出了高效的矩阵转置策略,以加速多维FFT计算。在AMD MI250 GPU平台上将该方案与GPU上主流的高性能FFT计算库rocFFT和VkFFT进行了比较实验,结果表明:该方案在AMD MI250上的1维、2维和3维FFT平均计算效率均优于rocFFT和VkFFT,3维FFT的平均计算效率为rocFFT的1.5倍,为VkFFT的2.0倍,具有较好的性能提升;mcFFT的计算精度与rocFFT和VkFFT保持在相同水平。 展开更多
关键词 图形处理器 Matrix Core 快速傅里叶变换 矩阵乘法
在线阅读 下载PDF
分布式存储系统中支持近数据处理的纠删码技术 被引量:1
20
作者 李浩然 黄志杰 +3 位作者 史宇龙 赵承佳 赵楠楠 张晓 《电子学报》 北大核心 2025年第2期344-353,共10页
纠删码技术和近数据处理技术是构建高效的云边端协同数据管理系统的两大基石,前者通过对数据添加编码冗余方式来保障系统的可用性,而后者则通过在存储端处理数据的方式避免大量的网络传输开销.云边端协同的数据管理系统通常采用成熟的... 纠删码技术和近数据处理技术是构建高效的云边端协同数据管理系统的两大基石,前者通过对数据添加编码冗余方式来保障系统的可用性,而后者则通过在存储端处理数据的方式避免大量的网络传输开销.云边端协同的数据管理系统通常采用成熟的分布式存储系统作为底层存储引擎,然而主流的分布式存储系统中的纠删码实现方式并不能高效地支持近数据处理.本文提出了一种支持近数据处理的纠删码技术架构,其基本原理是通过对待编码的一组数据进行重新布局,保证语义相关数据被存储在同一个存储设备上,避免执行近数据处理时的跨节点数据传输.该方案在分布式存储系统Ceph上获得实现,并测试典型场景的读写性能.实验结果表明,在近数据处理场景下和常规数据读取场景下,读取对象的性能分别提升59.4%和10%,对象写入性能则与原版保持一致. 展开更多
关键词 纠删码 分布式存储 Ceph 近数据处理 云边端协同数据管理
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部