期刊文献+
共找到16,241篇文章
< 1 2 250 >
每页显示 20 50 100
OBCC:后摩尔时代E级计算编程墙的一种估计方法
1
作者 张晓哲 陈涛 +3 位作者 肖调杰 张翔 包为民 龚春叶 《计算机工程与科学》 北大核心 2026年第1期20-27,共8页
后摩尔时代的E级计算面临的编程墙缺乏衡量标准。代码复杂度作为软件代码的内在属性,是代码理解、优化和计价的基础。针对现有的代码复杂度衡量方法在HPC应用中存在局限性的问题,提出了基于操作符数目和代码行数的代码绝对复杂度和相对... 后摩尔时代的E级计算面临的编程墙缺乏衡量标准。代码复杂度作为软件代码的内在属性,是代码理解、优化和计价的基础。针对现有的代码复杂度衡量方法在HPC应用中存在局限性的问题,提出了基于操作符数目和代码行数的代码绝对复杂度和相对复杂度,其中绝对复杂度为代码操作符总数,相对复杂度为绝对复杂度与代码行数的比值。通过43个软件代码的实验验证,该方法能够合理评估不同类型代码的复杂度,特别是在科学计算领域。其中llvm和linux内核分别以3300万和2300万的绝对复杂度位列前两位;jellyfin-media-player,spheral和llvm则以4.54,3.9和3.12的相对复杂度排名前3位。该方法为不同代码的分析、比较和计价提供了新视角,也为E级计算编程墙的衡量提供了一种客观、可量化的标准。 展开更多
关键词 高性能计算 代码复杂度 绝对复杂度 相对复杂度 操作符计量
在线阅读 下载PDF
基于事件的蒙特卡罗粒子输运算法设计实现
2
作者 黎铁军 张建民 +1 位作者 李雨函 杨博 《计算机工程与科学》 北大核心 2026年第3期381-388,共8页
蒙特卡罗MC粒子输运程序是典型的高性能计算应用。MC粒子输运程序存在基于粒子历史与基于事件2种并行实现方法。代理程序是面向特定体系结构开展大型实际程序性能优化的重要基础,实现基于事件的MC代理程序对研究面向众核体系结构的性能... 蒙特卡罗MC粒子输运程序是典型的高性能计算应用。MC粒子输运程序存在基于粒子历史与基于事件2种并行实现方法。代理程序是面向特定体系结构开展大型实际程序性能优化的重要基础,实现基于事件的MC代理程序对研究面向众核体系结构的性能优化非常重要。然而目前没有公开的基于事件方法的代理程序。基于开源项目OpenMC,对基于事件的蒙特卡罗粒子输运算法进行设计,实现了一个新的基于事件的MC粒子输运代理程序。实验结果表明,该代理程序能够有效模拟OpenMC的分支、访存及计算特征,且其代码量不到OpenMC代码量的5%,运行时间仅为OpenMC的7.5%,为基于事件算法的优化研究提供了高效易用的平台。 展开更多
关键词 粒子输运模拟 蒙特卡罗算法 基于事件的方法 程序特征提取
在线阅读 下载PDF
一种基于模拟退火的并行任务调度方案的设计
3
作者 张宏海 方浏洋 +1 位作者 田丰 刘硕 《计算机技术与发展》 2026年第4期169-175,共7页
随着计算机技术的发展,并行处理的方式成为系统性能优化的重要手段。传统并行系统中,因无法有效均衡子任务处理时间,导致系统响应速度受限。为了解决这一问题,实现高效的并行系统,该文设计了一种基于模拟退火的并行任务调度方案。该方... 随着计算机技术的发展,并行处理的方式成为系统性能优化的重要手段。传统并行系统中,因无法有效均衡子任务处理时间,导致系统响应速度受限。为了解决这一问题,实现高效的并行系统,该文设计了一种基于模拟退火的并行任务调度方案。该方案利用历史数据多次重复模拟退火算法,得出不同特征数据的最佳初始温度,设计了采用动态初始温度的模拟退火算法。该算法能够适配变化的系统环境和性能,让时间开销处在较低水平,最终高效地将条件项平均地分配到子任务中,从而实现并行系统的性能优化。该文结合民航运价搜索系统进行了实验,实验环境模拟真实系统运行环境。对比传统模拟退火算法和采用动态初始温度的模拟退火算法,后者执行时间相比前者降低约33%。采用模拟退火的并行任务调度方案的任务执行时间,相对于未采用模拟退火的并行任务调度方案缩短了53%。实验验证了基于模拟退火的并行任务调度方案的可行性和高效性,为高并行任务调度提供了一种高效可行的优化范式。 展开更多
关键词 模拟退火算法 动态初始温度 并行架构 子任务调度 性能优化
在线阅读 下载PDF
基于PLC和组态软件的人防工程环境在线监测方法研究
4
作者 马强 田林锋 陈仲浩 《科技资讯》 2026年第6期186-189,共4页
针对现有人防工程环境监测方法存在画面清晰度低、数据反馈时延高的问题,开展基于可编程逻辑控制器(Programmable Logic Controller,PLC)和组态软件的人防工程环境在线监测方法研究。通过构建分布式视频采集网络与多传感器融合架构,结合... 针对现有人防工程环境监测方法存在画面清晰度低、数据反馈时延高的问题,开展基于可编程逻辑控制器(Programmable Logic Controller,PLC)和组态软件的人防工程环境在线监测方法研究。通过构建分布式视频采集网络与多传感器融合架构,结合PLC的工业级抗干扰能力和组态软件的可视化调度,该方法实现对环境参数实时采集、智能分析与联动控制;利用运动目标检测算法和矩阵主机协同策略,提升异常事件预警效率。实验证明,该方法具备更高清晰度,并且数据反馈时延显著降低,能够满足复杂环境下的高可靠性监测需求。 展开更多
关键词 可编程逻辑控制器 组态软件 在线监测 人防工程
在线阅读 下载PDF
基于结构光视觉的航空叶片叶尖中间线提取方法
5
作者 刘霞 肖傲 +3 位作者 龚烨飞 刘继承 曹可歆 何榕程 《化工自动化及仪表》 2026年第1期70-77,共8页
针对不同尺寸、位置和姿态下的航空叶尖的中间线提取需求,提出了一种基于主成分分析(PCA)的自适应叶片叶尖中间线提取方法。该方法采用3D面结构光相机获取叶尖点云数据,通过将基于PCA的自适应坐标变换与端点约束的多项式拟合方法相结合... 针对不同尺寸、位置和姿态下的航空叶尖的中间线提取需求,提出了一种基于主成分分析(PCA)的自适应叶片叶尖中间线提取方法。该方法采用3D面结构光相机获取叶尖点云数据,通过将基于PCA的自适应坐标变换与端点约束的多项式拟合方法相结合,实现了中间线的稳定提取。采用ICP配准技术进行了多次重复性实验,结果显示93.3%的数据最终均方根误差小于0.1,且在采样数据缺失情况下,其最终均方根误差均值仍保持在0.1以下,证明了算法具有良好的鲁棒性。 展开更多
关键词 航空叶尖 点云处理 中间线提取 主成分分析
在线阅读 下载PDF
面向服务器应用的远距离函数调用指令预取优化
6
作者 陈立 高军 +1 位作者 赵天磊 刘峤 《计算机研究与发展》 北大核心 2026年第4期1079-1093,共15页
一级指令缓存缺失导致的大取指延迟是制约现代处理器性能进一步提升的重要瓶颈之一,尤其在大指令踪迹的服务器应用上更是如此。指令预取技术是解决这一问题的关键性技术,它通过提前将要用到的指令块放入上级缓存中,从而达到掩盖高昂访... 一级指令缓存缺失导致的大取指延迟是制约现代处理器性能进一步提升的重要瓶颈之一,尤其在大指令踪迹的服务器应用上更是如此。指令预取技术是解决这一问题的关键性技术,它通过提前将要用到的指令块放入上级缓存中,从而达到掩盖高昂访问延迟时间的目的。近年来,研究者们提出了许多指令预取架构来缓解该问题,但由于指令局部性较差,长距离函数调用仍然带来了大量的指令缺失。设计了一种新的指令预取机制,能以较低的硬件开销实现对函数调用目标指令的高覆盖率和高准确率预取。实验表明,优化后的函数调用目标指令缺失率较目前最先进的指令预取器降低约45%,IPC(instruction per cycle)性能比基准线高约11.9%,比目前相似开销的最先进的指令预取器高出约2.9%。 展开更多
关键词 指令预取 服务器端 函数调用 每周期指令数 存储优化
在线阅读 下载PDF
RISC-V SBI固件安全启动过程的形式化验证
7
作者 杨叶倩 戴鸿君 《计算机研究与发展》 北大核心 2026年第3期768-781,共14页
RISC-V SBI(supervisor binary interface)标准定义了RISC-V架构硬件与操作系统的接口规范。相比x86和ARM固件,SBI固件更合规、可靠;但现有版本仍存在启动正确性未验证、PMP(physical memory protection)物理地址访问等安全漏洞。为此,... RISC-V SBI(supervisor binary interface)标准定义了RISC-V架构硬件与操作系统的接口规范。相比x86和ARM固件,SBI固件更合规、可靠;但现有版本仍存在启动正确性未验证、PMP(physical memory protection)物理地址访问等安全漏洞。为此,提出了定理证明驱动的闭环形式化验证框架,开发经形式验证的SBI固件——SeSBI,并结合Dafny与Isabelle/HOL,以分层策略实现对启动过程的形式验证。为提高验证效率,提出RISC-V硬件模拟策略,统一建模固件与硬件的交互,从而显著降低验证开销。最终成功验证了SeSBI固件启动过程的功能正确性。结果表明,SeSBI以更简洁的代码实现SBI标准启动过程接口,并具备高度可靠性,为RISC-V生态系统提供了经形式验证的可信SBI固件实现。未来工作将扩展验证范围至更多高级属性,并优化验证工具以提升效率。 展开更多
关键词 RISC-V SBI固件 形式化验证 定理证明 功能正确性
在线阅读 下载PDF
多芯粒大模型加速器推理协同优化方法
8
作者 方娟 潘晨阳 +3 位作者 古明辉 李硕朋 陈慧杰 翟冉 《通信学报》 北大核心 2026年第2期190-208,共19页
在采用2.5D封装集成多计算芯粒与存储芯粒的大模型推理加速系统中,模型推理解码阶段跨芯粒通信具有突发性与强非均衡性,流量在拓扑中聚集到少数链路并形成热点排队,封装内网络通信常成为性能瓶颈。为缓解上述瓶颈,提出T^(2)-CHIP协同优... 在采用2.5D封装集成多计算芯粒与存储芯粒的大模型推理加速系统中,模型推理解码阶段跨芯粒通信具有突发性与强非均衡性,流量在拓扑中聚集到少数链路并形成热点排队,封装内网络通信常成为性能瓶颈。为缓解上述瓶颈,提出T^(2)-CHIP协同优化方法,通过刻画解码阶段跨芯粒通信在互连中的分布特征,识别热点链路,对带宽资源重分配,同时调整任务映射以减少热点跨芯粒交互,从而有效缓解解码阶段通信拥塞。周期精确网络仿真结果表明,该方法在提升解码阶段尾部性能与整体吞吐量的同时,降低了动态功耗,且维持了较低的实现开销。 展开更多
关键词 大语言模型 2.5D芯粒架构 芯粒间互连 异构协同优化
在线阅读 下载PDF
面向安全可编程阀门阵列生物芯片的基于深度强化学习的组件布局算法
9
作者 陈子阳 陈钧 +2 位作者 朱予涵 刘耿耿 黄兴 《计算机工程与科学》 北大核心 2026年第1期40-50,共11页
作为一种新型的连续流体式微流控生物芯片,完全可编程阀门阵列FPVA生物芯片具备高灵活性和可编程性的优点,将其用作实验平台可以提供更加灵活的操纵,同时可以实现个性化的实验流程配置。然而,随着芯片制造工艺不断提高,FPVA生物芯片的... 作为一种新型的连续流体式微流控生物芯片,完全可编程阀门阵列FPVA生物芯片具备高灵活性和可编程性的优点,将其用作实验平台可以提供更加灵活的操纵,同时可以实现个性化的实验流程配置。然而,随着芯片制造工艺不断提高,FPVA生物芯片的集成度已经达到很高的水平,结合其高自由度的特性,对FPVA生物芯片进行编程和设计的难度也在不断提高。组件布局是生物芯片设计中的一个重要步骤,在以往的研究中通常采用启发式算法进行布局,但是对于离散问题的求解效果比较有限,而且参数设置难度较大,因此设计一种高效易用、更加适合离散化的组件布局算法,能够提高整体芯片设计过程的效率。深度强化学习DRL具备高效率、强自适应性和灵活性等优点,智能体通过不断地与环境交互,进行自我训练和调节,能够迅速适应各种复杂的变化和需求并找到最优或近似最优的策略。相比启发式算法,DRL能够更加贴合环境,找到全局最优的布局方案。因此,设计了一种面向FPVA生物芯片的基于DRL的组件布局算法,为DRL智能体构建了FPVA芯片交互环境并采用双重深度Q网络构建组件布局决策模型,利用智能体能够快速迭代的优点迅速完成大规模集成FPVA生物芯片的组件布局工作。同时,通过设计并发关系约束和布局区域约束来判断各个组件之间的并发关系并且对芯片上的可布局区域进行限制,使得布局方案能够更加符合实际情况,从而保证布局方案的正确性与可行性。利用多个测试样例,将所提算法与最新相关算法进行了对比,实验结果表明所提算法能够生成具有更短预布线线长与更少单元复用次数的组件布局方案,从而为后续的布线阶段提供高质量的布局方案。 展开更多
关键词 微流控生物芯片 完全可编程阀门阵列 组件布局 深度强化学习 双重深度Q网络
在线阅读 下载PDF
面向多线程应用的智能缓存分配方法
10
作者 何铭健 王桦 《计算机研究与发展》 北大核心 2026年第1期15-27,共13页
多线程编程模型被广泛用于促进多核上的应用程序执行。然而,并发执行的线程对最后一级缓存(last level cache,LLC)的竞争造成的干扰可能会导致性能下降。英特尔缓存分配技术(cache allocation technology,CAT)提供了一种机制为不同线程... 多线程编程模型被广泛用于促进多核上的应用程序执行。然而,并发执行的线程对最后一级缓存(last level cache,LLC)的竞争造成的干扰可能会导致性能下降。英特尔缓存分配技术(cache allocation technology,CAT)提供了一种机制为不同线程实时分配缓存。然而,有2个原因导致现有分配方法并不适用于多线程应用。首先,它们是为多应用场景量身定制的,而不是为涉及多个相关线程的单个多线程应用场景设计的。其次,它们旨在提高每周期指令数(instruction per cycle,IPC),这不是一个在多线程场景中合适的性能指标。为了解决这个问题,提出了LPart,这是一种用于多线程应用程序的智能缓存分配技术,通过分配缓存显著提高了系统的吞吐量。LPart利用深度强化学习为应用程序中的不同线程分配适当数量的缓存空间。在微基准测试、Redis、商用分布式存储系统和多种应用场景上评估LPart的实验结果表明,与默认配置相比,LPart分别实现了26.9%,8.1%,9.8%,24.1%的性能提升。 展开更多
关键词 缓存分配 多核架构 多线程应用 深度强化学习 资源分配
在线阅读 下载PDF
深度学习模型训练过程检查点访问性能优化方法
11
作者 滕云 张广艳 +2 位作者 孙大为 田海东 常锐 《大数据》 2026年第2期75-84,共10页
随着大模型应用越来越广泛、规模逐渐增大,目前大模型训练面临出错概率高、检查点访问性能差等问题。总结了已有检查点访问性能优化方法的优缺点,提出了一种新的检查点访问性能优化方法。观察检查点数据模式可知,相近检查点的模型权重... 随着大模型应用越来越广泛、规模逐渐增大,目前大模型训练面临出错概率高、检查点访问性能差等问题。总结了已有检查点访问性能优化方法的优缺点,提出了一种新的检查点访问性能优化方法。观察检查点数据模式可知,相近检查点的模型权重数据变化较小,适合增量压缩。基于多台互联训练节点实现了增量压缩,并基于真实的深度学习模型训练时产生的检查点数据进行了实验测试。结果表明,在训练周期内,增量压缩对大多数检查点具有较好的压缩效果。此外,提出在增量压缩中使用动态间隔来平衡压缩率与存储开销,并对动量数据特征进行分析。文章对已有方法的分析及对检查点访问性能的优化为大模型训练加速提供了指导。 展开更多
关键词 大模型 检查点 数据压缩 性能提升
在线阅读 下载PDF
IoT-EDF:基于Unikernel的物联网任务调度方法
12
作者 董博南 杨秋松 李明树 《信息安全学报》 2026年第1期155-170,共16页
Unikernel作为虚拟化领域的前沿技术,在物联网环境中因其启动快速和低资源消耗以及高安全性的特点而被广泛应用。然而目前Unikernel缺乏根据不同任务特点所设计的动态调度机制,用以保障物联网大规模任务调度场景下的工作效率。为解决这... Unikernel作为虚拟化领域的前沿技术,在物联网环境中因其启动快速和低资源消耗以及高安全性的特点而被广泛应用。然而目前Unikernel缺乏根据不同任务特点所设计的动态调度机制,用以保障物联网大规模任务调度场景下的工作效率。为解决这一问题,首先总结了物联网环境下Unikernel的任务特点,在此基础上,提出一种新的基于Unikernel的物联网环境下的调度机制IoT-EDF及其数学模型,该机制通过划分任务的重要性和截止时间,不仅有效的提高了Unikernel在物联网环境中的任务调度效率,避免了重要数据丢失的问题,还能通过数学模型预测任务执行的总体情况,降低任务执行失败的风险。同时,基于网络时间协议,提出一种适用于Unikernel物联网场景下的时钟同步方法,通过调整从不同地点发送的数据包中的时间戳来生成时差表,以解决全局时钟同步的问题,从而确保Io T-EDF调度机制中对截止时间计算的准确。最后,对IoT-EDF调度机制在OSv Unikernel上进行了实现和验证,实验结果表明,IoT-EDF在降低内存开销的情况下,可以有效提升OSv Unikernel任务的执行成功率,相比于未经改动的OSv Unikernel,对重要任务的完成率提升达21%。此外,还模拟实际应用场景,对系统的吞吐量进行测试,与原始的OSv Unikernel相比,吞吐量提升了30%,进一步证明了IoT-EDF调度机制的有效性。 展开更多
关键词 物联网 Unikernel 调度机制 时钟同步 任务完成率
在线阅读 下载PDF
面向稀疏矩阵向量乘法的GPU性能建模和算法优化
13
作者 马澄宇 李锁兰 +3 位作者 刘一诺 赵文哲 任鹏举 夏天 《集成电路与嵌入式系统》 2026年第1期5-11,共7页
针对GPU平台上稀疏矩阵向量乘(SpMV)操作的性能瓶颈问题,提出了一种基于行重分割的优化算法及其配套性能评估模型。该方法首先基于矩阵行长度与计算资源分配之间的量化映射关系,通过设定动态阈值将原始矩阵划分为长行和短行子矩阵,分别... 针对GPU平台上稀疏矩阵向量乘(SpMV)操作的性能瓶颈问题,提出了一种基于行重分割的优化算法及其配套性能评估模型。该方法首先基于矩阵行长度与计算资源分配之间的量化映射关系,通过设定动态阈值将原始矩阵划分为长行和短行子矩阵,分别采用线程级和线程块级并行策略进行计算,从而有效缓解GPU SIMT执行特性与稀疏矩阵非规则数据分布之间的矛盾。为量化预处理过程中引入的额外开销,分别建立了针对Atomic Conflict和Padding的性能损失模型,将额外的访存和计算转换为可计算的开销函数。基于上述模型,构建了参数空间搜索算法,通过预先获取硬件性能指标和矩阵非零元分布信息,快速在参数集合中搜索得到最优预处理参数。实验结果表明,该优化算法在多种典型稀疏矩阵数据集上均优于传统的GPU稀疏计算库cuSPARSE,在部分场景下性能提升达1.26倍及1.17倍。此外,参数搜索开销较低,且该方法具备良好的通用性,可适配不同的输入矩阵与GPU硬件架构。 展开更多
关键词 GPU性能建模 并行算法优化 稀疏矩阵 SpMV
在线阅读 下载PDF
工业炉烟气排放智能监测系统设计
14
作者 商娟叶 《工业加热》 2026年第2期61-64,共4页
伴随工业生产不断发展,工业炉作为极为重要的热能转换设备,在各类工业生产环节当中有着举足轻重的地位。但是,工业炉在运行期间所产生的烟气排放这一问题愈发显著,对环境以及人类健康都造成了极为严重的危害。所以,设计一套既高效又智... 伴随工业生产不断发展,工业炉作为极为重要的热能转换设备,在各类工业生产环节当中有着举足轻重的地位。但是,工业炉在运行期间所产生的烟气排放这一问题愈发显著,对环境以及人类健康都造成了极为严重的危害。所以,设计一套既高效又智能的工业炉烟气排放监测系统,以此达成对烟气排放实时监测以及控制的目的,该系统旨在实时监测工业炉烟气中的污染物浓度,并将数据传输至相关部门,以便及时采取治理措施。对于确保环境安全、促使工业生产效率得以提升而言,有着相当重要的意义。着手对工业炉烟气排放智能监测系统的架构展开设计工作,对该系统所具备的优势加以分析。研究表明,该系统具有较高的监测准确性与实效性,为工业炉的进一步发展以及运用给予一定的参考。 展开更多
关键词 工业炉 烟气排放 监测系统
在线阅读 下载PDF
基于PSO和网格优化结合的SVM算法癌症分类研究
15
作者 汪颖 王琳 《兰州文理学院学报(自然科学版)》 2026年第1期56-61,共6页
针对乳腺癌良性与恶性的鉴别,提出一种融合粒子群优化与网格搜索的支持向量机模型(GPSO-SVM).该方法先通过网格搜索初步确定粒子群优化的超参数范围,并在粒子群优化迭代过程中阶段性引入网格搜索.联合完成对支持向量机超参数的优化,有... 针对乳腺癌良性与恶性的鉴别,提出一种融合粒子群优化与网格搜索的支持向量机模型(GPSO-SVM).该方法先通过网格搜索初步确定粒子群优化的超参数范围,并在粒子群优化迭代过程中阶段性引入网格搜索.联合完成对支持向量机超参数的优化,有效结合了网格搜索的全局搜索能力与粒子群算法的局部精细寻优优势,提高了参数寻优的效率与准确性.实验结果显示,GPSO-SVM模型在4种不同乳腺癌数据集上的五折交叉验证准确率分别达到98.60%、97.00%、90.52%和88.89%,优于其他寻优方法. 展开更多
关键词 癌症分类 网格搜索 GPSO-SVM
在线阅读 下载PDF
垃圾焚烧电站母管制机组FCB孤岛运行技术
16
作者 茆顺涵 《能源工程》 2026年第1期70-76,共7页
本文研究了垃圾焚烧电站FCB孤岛功能的设计优化和试验工艺,通过对DEH并网信号和锅炉蒸汽排放通道等优化改造,垃圾焚烧电站发生外部线路跳闸后,开展了FCB孤岛运行试验,实现了汽轮机发电机组带厂用电孤岛运行功能。对垃圾焚烧电站母管制... 本文研究了垃圾焚烧电站FCB孤岛功能的设计优化和试验工艺,通过对DEH并网信号和锅炉蒸汽排放通道等优化改造,垃圾焚烧电站发生外部线路跳闸后,开展了FCB孤岛运行试验,实现了汽轮机发电机组带厂用电孤岛运行功能。对垃圾焚烧电站母管制机组实现FCB孤岛运行功能提供了重要的参考。 展开更多
关键词 FCB设计优化 垃圾焚烧电站 孤岛运行 母管制机组
在线阅读 下载PDF
针对高维数据的动态集成堆叠宽度学习系统
17
作者 云帆 余志文 杨楷翔 《计算机科学》 北大核心 2026年第4期48-56,共9页
在高维小样本分类任务中,宽度学习系统(Broad Learning System,BLS)因其高效的特性而备受关注。然而,原始的单层BLS的特征提取能力有限,难以处理复杂的高维数据。随机节点生成机制导致直接堆叠BLS隐层时出现节点冗余,模型性能难以提升... 在高维小样本分类任务中,宽度学习系统(Broad Learning System,BLS)因其高效的特性而备受关注。然而,原始的单层BLS的特征提取能力有限,难以处理复杂的高维数据。随机节点生成机制导致直接堆叠BLS隐层时出现节点冗余,模型性能难以提升。为解决上述问题,提出了一种集成堆叠BLS算法。所提算法利用前一层BLS的输出作为增强特征,将其与按分类置信度加权的原始特征进行拼接后输入下一层BLS,不断提高深层特征表达能力。通过元学习器池集成多个BLS层的输出,增强了原始单层BLS的高维特征提取能力,从而提升了模型的泛化性能。此外,考虑到高维数据复杂多变的特性,设计了动态集成框架,根据数据难度动态调整模型的复杂度。所提方法在保持模型性能的同时,进一步提升了集成效率。消融实验证明了所提算法的各个模块的有效性,对比实验证明了所提算法在高维疾病数据上的优越分类性能。 展开更多
关键词 宽度学习系统 集成学习 动态结构 高维数据 堆叠
在线阅读 下载PDF
面向大规模系统的并行进化策略框架
18
作者 张涵 王小平 《计算机工程与科学》 北大核心 2026年第1期11-19,共9页
进化策略算法是一种高效的优化算法,适用于解决无梯度信息或难以获取梯度信息的问题,广泛应用于强化学习和黑盒优化等任务。随着问题规模和复杂度的增加,进化策略算法的采样规模也越来越大,相应地,计算并行度也随之增加。面向大规模系统... 进化策略算法是一种高效的优化算法,适用于解决无梯度信息或难以获取梯度信息的问题,广泛应用于强化学习和黑盒优化等任务。随着问题规模和复杂度的增加,进化策略算法的采样规模也越来越大,相应地,计算并行度也随之增加。面向大规模系统,提出了新的并行进化策略算法框架,主要优化进化策略算法在超大规模并行执行中的容错计算和通信开销问题。针对这些问题,提出了高并发的规约机制,并针对算法特点提出了低开销的容错方法。实验显示,新的并行进化策略算法框架在大规模系统中的并行效率在54.7%以上,且在并行规模上升至上万节点时,并行效率比OpenAI-NES高出23%。 展开更多
关键词 进化策略 黑盒优化 容错计算 并行计算
在线阅读 下载PDF
应用场景驱动的动态自重构A^(*)算法加速阵列设计与实现
19
作者 白瑜龙 山蕊 《计算机工程与科学》 北大核心 2026年第2期238-244,共7页
在A^(*)算法的应用场景中,当父节点周围障碍物稀少或不存在时,理论上路径搜索应变得相对直接。然而,A*算法仍会遵循既定的规则进行节点扩展,这往往导致不必要的子节点扩展冗余。针对这一问题,提出了一种基于应用场景驱动的A*算法ASD-A*... 在A^(*)算法的应用场景中,当父节点周围障碍物稀少或不存在时,理论上路径搜索应变得相对直接。然而,A*算法仍会遵循既定的规则进行节点扩展,这往往导致不必要的子节点扩展冗余。针对这一问题,提出了一种基于应用场景驱动的A*算法ASD-A*,通过检测当前节点附近的障碍物数量来动态选择不同的节点拓展步长,从而提高节点拓展效率。同时,应对文中提出的灵活变化的节点拓展策略,提出了一种在动态自重构阵列上并行实现ASD-A*算法的方法,进一步加速路径规划过程。仿真结果表明,ASD-A*算法在不同障碍物数量的场景下规划出路径的时间比原算法规划出路径的时间平均减少17.7%。 展开更多
关键词 动态自重构 阵列处理器 A^(*)算法 并行化
在线阅读 下载PDF
基于DT-CWPT和QGA-LSSVM的振动信号故障模式分析
20
作者 赵凯 王志雄 +2 位作者 史永运 孙涛 张赟 《机械制造与自动化》 2026年第1期172-176,共5页
为了提高航空发动机振动信号故障模式的识别精度和计算效率,提出了基于双树复小波包变换(DT-CWPT)和基于量子遗传算法(QGA)优化的最小二乘支持向量机(LSSVM)的转子振动信号故障模式分类识别算法。利用DT-CWPT对采集的振动信号进行降噪... 为了提高航空发动机振动信号故障模式的识别精度和计算效率,提出了基于双树复小波包变换(DT-CWPT)和基于量子遗传算法(QGA)优化的最小二乘支持向量机(LSSVM)的转子振动信号故障模式分类识别算法。利用DT-CWPT对采集的振动信号进行降噪预处理,计算各频带的能量谱作为训练样本,利用QGA对LSSVM核心参数进行寻优,达到对振动信号模式识别与分类的目的。实验结果表明:该算法具有较好的计算速度和分类精度。 展开更多
关键词 双树复小波包变换 量子遗传算法 最小二乘支持向量机 航空发动机 振动信号 模式分类
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部