期刊文献+
共找到100篇文章
< 1 2 5 >
每页显示 20 50 100
基于国产NPU的智能计算系统课程实验平台构建及案例设计
1
作者 姚远 张羽 +4 位作者 张盈 黄兴 郭斌 於志文 周兴社 《计算机教育》 2025年第6期33-39,共7页
针对现有智能计算系统课程实验平台智能算力弱、案例覆盖窄、国产芯片少等问题,聚焦本科生系统能力培养,提出以典型智能计算系统应用场景为对象,以智能计算系统优化思想为核心,以国产嵌入式NPU芯片为载体,构建实验教学平台,并提供从场... 针对现有智能计算系统课程实验平台智能算力弱、案例覆盖窄、国产芯片少等问题,聚焦本科生系统能力培养,提出以典型智能计算系统应用场景为对象,以智能计算系统优化思想为核心,以国产嵌入式NPU芯片为载体,构建实验教学平台,并提供从场景分析、算法设计、系统部署到硬件优化的完整全栈式实验案例。 展开更多
关键词 智能计算系统 国产npu芯片 实验教学 场景驱动
在线阅读 下载PDF
一种面向NPU内存侧信道攻击的安全防护方案
2
作者 胡文澳 严飞 张立强 《信息网络安全》 北大核心 2025年第6期977-987,共11页
随着人工智能技术的快速发展,NPU在智能手机、自动驾驶、边缘计算等领域的应用日益广泛。然而,现有的NPU架构在抵御内存侧信道攻击方面存在不足,攻击者可以通过分析内存访问模式逆向推导出DNN模型的结构和参数。为应对这一挑战,文章提... 随着人工智能技术的快速发展,NPU在智能手机、自动驾驶、边缘计算等领域的应用日益广泛。然而,现有的NPU架构在抵御内存侧信道攻击方面存在不足,攻击者可以通过分析内存访问模式逆向推导出DNN模型的结构和参数。为应对这一挑战,文章提出一种面向NPU内存侧信道攻击的安全防护方案——NPUGuard,该方案通过特征图划分和加密压缩引擎两个关键模块,从增加层边界、混淆数据地址和加密保护数据3个方面提供安全保障。实验结果表明,NPUGuard能够有效增加层边界,使攻击者通过内存侧信道攻击逆向推导的可能网络数量从24种增加到7.86×105种;基于混沌映射的数据加密压缩算法在加密数据的同时,可降低60%的存储空间。此外,NPUGuard仅带来5%的性能损失,处于可接受范围,有效平衡了安全与性能之间的关系。 展开更多
关键词 侧信道防护 npu安全 特征图划分 数据加密压缩
在线阅读 下载PDF
基于国产NPU的超万卡智算集群大模型训练调优实践
3
作者 娄涛 牛红韦华 +8 位作者 张鹏飞 董江帆 李攀攀 李道通 许伟栋 姚成辉 薛连浩 唐婷 向洁 《电信科学》 北大核心 2025年第7期120-132,共13页
为解决超万卡智算集群模型训练算效利用率低、稳定性差、调优难度高、国产技术生态差等问题,提出一种基于全国产化超万卡智算集群的大模型训练调优方案。通过自动分布式策略推荐、流水线并行优化、overlap优化和全链路profiling等技术,... 为解决超万卡智算集群模型训练算效利用率低、稳定性差、调优难度高、国产技术生态差等问题,提出一种基于全国产化超万卡智算集群的大模型训练调优方案。通过自动分布式策略推荐、流水线并行优化、overlap优化和全链路profiling等技术,在16 384个国产NPU加速卡上实现了405B参数大模型的预训练,模型算力利用率(model FLOPS utilization,MFU)达到了45.13%,较基准性能提升了10%以上。同时,在模型训练全流程中构建稳定性保障机制,实现训前和训中关键指标的实时监控和训练任务秒级故障诊断。实验结果表明,提出的国产超万卡智算集群大模型训练方案能有效提升算力利用率,对未来国产智算集群建设与大模型训练有重要指导意义。 展开更多
关键词 超万卡智算集群 国产npu加速卡 模型训练调优
在线阅读 下载PDF
基于国产NPU的边缘端嵌入式智能计算系统设计与实现
4
作者 赵江涛 夏杰 秦翔 《集成电路与嵌入式系统》 2025年第7期9-14,共6页
基于翔腾微HKN201(NPU)构建了强实时、高并发、高性能的边缘端嵌入式智能计算系统。结合高速电路的设计理念及实际工程应用给出了电源完整性(PI)、信号完整性(SI)的基本设计方法及有效的控制措施,并进行了仿真分析,给出了仿真结果。最... 基于翔腾微HKN201(NPU)构建了强实时、高并发、高性能的边缘端嵌入式智能计算系统。结合高速电路的设计理念及实际工程应用给出了电源完整性(PI)、信号完整性(SI)的基本设计方法及有效的控制措施,并进行了仿真分析,给出了仿真结果。最后对该系统进行了应用测试给出了性能指标,实验结果表明,该方案具有通用性、扩展性强、可靠性高等特点,为开展智能产品的研究提供了参考。 展开更多
关键词 电源完整性 信号完整性 高速电路 npu DDR4 PCIE
在线阅读 下载PDF
异构计算环境下NPU架构与深度学习加速方法
5
作者 王颖 徐天骅 孙德龙 《电脑知识与技术》 2025年第18期95-97,共3页
当前,随着异构计算技术的快速发展,如何高效部署深度神经网络成为业界关注的焦点。文章重点研究了面向边缘场景的神经网络加速技术,通过剖析现有NPU架构的优缺点,提出了一套低功耗加速方案。该方案有效结合了流水线并行与循环展开技术,... 当前,随着异构计算技术的快速发展,如何高效部署深度神经网络成为业界关注的焦点。文章重点研究了面向边缘场景的神经网络加速技术,通过剖析现有NPU架构的优缺点,提出了一套低功耗加速方案。该方案有效结合了流水线并行与循环展开技术,显著提升了计算资源利用率,同时在数据调度与存储管理方面实现了有效优化。在采用混合精度模式时,DSP与BRAM资源利用率分别达到98.15%与72.44%,相较于CPU基准实现获得了37.3倍的性能提升。此外,该方案的平均功耗仅为5.85 W,功耗波动控制在7.2%以内,为神经网络在边缘设备上的实际应用提供了可靠的技术路径。 展开更多
关键词 神经网络处理器(npu) 异构计算 深度学习加速 边缘计算 流水线优化
在线阅读 下载PDF
基于信息技术背景下的NPU集群调度方法及服务器的应用研究
6
作者 韦裕霖 凌赞 莫志艺 《数码设计(电子版)》 2024年第11期0307-0309,共3页
在信息技术飞速发展的背景下,神经网络处理器(NPU)集群已成为支撑人工智能应用的关键基础设施。本文聚焦信息技术背景下的NPU集群调度方法及服务器应用,提出一种创新的NPU集群调度机制。该机制通过对任务负载的精准分析,实现资源的合理... 在信息技术飞速发展的背景下,神经网络处理器(NPU)集群已成为支撑人工智能应用的关键基础设施。本文聚焦信息技术背景下的NPU集群调度方法及服务器应用,提出一种创新的NPU集群调度机制。该机制通过对任务负载的精准分析,实现资源的合理分配,有效提升了NPU集群的资源利用率与任务处理效率。本文还深入探讨了服务器在NPU集群中的协同应用,优化了数据传输与存储流程。实验结果表明,所提方法显著增强了NPU集群的整体性能,为人工智能应用的高效运行提供了有力支撑。 展开更多
关键词 信息技术 npu 集群 调度方法 服务器应用
在线阅读 下载PDF
基于NPU架构的VPN防火墙硬件结构模型 被引量:1
7
作者 周轶男 李曦 冯朝阳 《计算机工程与设计》 CSCD 北大核心 2006年第5期831-835,共5页
随着光纤网络的快速发展,网络速度的瓶颈并不在于传输系统,而依赖于数据报的处理速度是否能匹配不断增长的线路速度,尤其是在不断出现新服务和新协议的情况下,基于软件的网络处理已经不能完全胜任了,软硬件协同处理的方法开始不断涌现... 随着光纤网络的快速发展,网络速度的瓶颈并不在于传输系统,而依赖于数据报的处理速度是否能匹配不断增长的线路速度,尤其是在不断出现新服务和新协议的情况下,基于软件的网络处理已经不能完全胜任了,软硬件协同处理的方法开始不断涌现。防火墙同传统的网络设备一样,硬件体系结构经历了从Intelx86架构到ASIC架构再到NPU架构的发展过程。通过对防火墙硬s件体系结构进行研究,以NPU架构为基础提出一种VPN防火墙的硬件平台模型,建议以“龙芯”或其它国产CPU core为基础,以网络安全设备的应用为目标,以SOC宽带NPU为切入点,研制具有自主知识产权的NPU及其网络安全产品。 展开更多
关键词 防火墙 Intelx86架构 ASIC架构 npu架构 SOC宽带npu
在线阅读 下载PDF
NPU-WA系列风力机翼型设计与风洞实验 被引量:24
8
作者 乔志德 宋文萍 高永卫 《空气动力学学报》 EI CSCD 北大核心 2012年第2期260-265,共6页
针对兆瓦级大型风力机,研究发展了以具有更优良高雷诺数和高升力气动性能为特点的NPU-WA翼型族,风洞实验表明,该翼型族达到了在高雷诺数、高升力条件下实现高升阻比和外侧翼型对粗糙度不敏感的主要设计要求,为我国自主研发大型风力机提... 针对兆瓦级大型风力机,研究发展了以具有更优良高雷诺数和高升力气动性能为特点的NPU-WA翼型族,风洞实验表明,该翼型族达到了在高雷诺数、高升力条件下实现高升阻比和外侧翼型对粗糙度不敏感的主要设计要求,为我国自主研发大型风力机提供了可以实际使用的翼型几何数据和雷诺数范围内1.0×106~5.0×106的风洞实验数据。 展开更多
关键词 npu—WA翼型族 翼型设计 风洞实验
在线阅读 下载PDF
基于NPU的实时深度学习跟踪算法实现 被引量:5
9
作者 何曦 李良福 +5 位作者 王娇颖 王洁 卢晓燕 钱钧 杨一洲 刘培桢 《应用光学》 CAS CSCD 北大核心 2022年第4期682-692,共11页
深度学习在检测领域高速发展,但受限于训练数据和计算效率,在基于嵌入式平台的边缘计算领域,尤其是实时跟踪应用中深度学习的智能化算法应用并不广泛。针对这一现象,同时为满足现阶段国产化、智能化的技术需求,提出了一种改进的孪生网... 深度学习在检测领域高速发展,但受限于训练数据和计算效率,在基于嵌入式平台的边缘计算领域,尤其是实时跟踪应用中深度学习的智能化算法应用并不广泛。针对这一现象,同时为满足现阶段国产化、智能化的技术需求,提出了一种改进的孪生网络深度学习跟踪算法。在特征网络加入微调网络,解决了网络模型无法在线更新的问题,提升了跟踪的准确性;在IoUNet损失函数中加入中心距离惩罚项,解决了IoUNet当IoU相同时位置跳跃,存在收敛盲区和收敛速度慢的问题;将训练后的网络通过通道剪枝,缩减网络模型尺寸,提升了模型加载和运行的速度。在华为Atlas200NPU平台上实现了实时运行,算法准确率高达0.90(IoU>0.7),帧率达到66 Hz。 展开更多
关键词 实时跟踪 孪生网络 npu 深度学习
在线阅读 下载PDF
NPU翼型的气动力分析和改进设计 被引量:7
10
作者 华俊 张仲寅 +1 位作者 G.Redeker G.Wichmann 《航空学报》 EI CAS CSCD 北大核心 1989年第4期B180-B183,共4页
在飞行器设计中用计算方法设计超临面翼型已完全取代了选用现成翼型的设计方法。为考察已设计出的NPU翼型是否满足飞行器设计要求我们对其进行了全面气动分析,发现这些翼型尚有不足之处,有必要进行改进设计。本文以其中一个翼型为例。
关键词 翼型 气动力 设计 npu
在线阅读 下载PDF
NPU-WA翼型族厚翼型粗糙敏感度研究 被引量:1
11
作者 邓磊 乔志德 高永卫 《太阳能学报》 EI CAS CSCD 北大核心 2013年第6期938-945,共8页
研究NPU-WA风力机专用翼型族4个厚翼型(相对厚度25%、30%、35%和40%)的粗糙敏感度,并与相同厚度的经典风力机翼型进行比较。结果表明NPU-WA厚翼型满足气动设计要求,前缘粗糙度对NPU-WA翼型的影响和DU系列相同厚度翼型的影响非常类似,但... 研究NPU-WA风力机专用翼型族4个厚翼型(相对厚度25%、30%、35%和40%)的粗糙敏感度,并与相同厚度的经典风力机翼型进行比较。结果表明NPU-WA厚翼型满足气动设计要求,前缘粗糙度对NPU-WA翼型的影响和DU系列相同厚度翼型的影响非常类似,但翼型总体性能要优于后者。 展开更多
关键词 风力机 翼型 npu—WA翼型族 粗糙敏感度
原文传递
Npu DnaE内含肽构建及其对293T细胞高效反式剪接活性分析
12
作者 张矫 崔文静 +2 位作者 马祥敏 王雯雯 王欣 《山东医药》 CAS 2013年第44期10-13,I0002,共5页
目的构建Npu DnaE内含肽,探讨Npu DnaE内含肽是否在293T细胞中具备高效反式剪接活性。方法制备融合基因Vn-NDn-myc和NDc-Vc,插入pCDH-CMV-MCS-EF1-Puro载体,构建质粒。转染293T细胞,荧光显微镜下观察目的蛋白Venus是否形成。48 h后收集... 目的构建Npu DnaE内含肽,探讨Npu DnaE内含肽是否在293T细胞中具备高效反式剪接活性。方法制备融合基因Vn-NDn-myc和NDc-Vc,插入pCDH-CMV-MCS-EF1-Puro载体,构建质粒。转染293T细胞,荧光显微镜下观察目的蛋白Venus是否形成。48 h后收集细胞蛋白,应用Western blot技术进一步印证。结果构建的质粒经限制性内切酶鉴定及测序比对正确,转染293T后可见共转染细胞组出现明亮荧光,弥漫分布于细胞质中,Western blot证明高量目的蛋白Venus形成。结论成功构建Npu DnaE内含肽,其能在293T细胞中发挥反式剪接的生物学功能,并具有高效的剪接效率及功能目的蛋白形成率。 展开更多
关键词 npu DnaE 内含肽 蛋白质反式剪接
暂未订购
基于多核NPU的TCP数据接收卸载
13
作者 李杰 陈曙晖 《计算机工程与科学》 CSCD 北大核心 2016年第7期1344-1349,共6页
目前以太网的发展速度远高于存储器和CPU的发展速度,存储器访问和CPU处理网络协议已经成为TCP的性能瓶颈。网络带宽的不断增大对CPU造成了沉重的负担,大约需要1GHz的CPU处理资源对1Gbps的网络流量进行协议处理。为此,使用多核NPU作为NIC... 目前以太网的发展速度远高于存储器和CPU的发展速度,存储器访问和CPU处理网络协议已经成为TCP的性能瓶颈。网络带宽的不断增大对CPU造成了沉重的负担,大约需要1GHz的CPU处理资源对1Gbps的网络流量进行协议处理。为此,使用多核NPU作为NIC,实现TCP接收数据路径中的校验和计算、报文乱序重组功能,并将合并之后的大报文经Linux网卡驱动程序交由协议栈处理,从而减少协议栈处理报文和网卡产生中断的数量,提升端系统的TCP性能。在10Gbps以太网络中,实验取得4.9Gbps的TCP接收数据吞吐量。 展开更多
关键词 TCP乱序重组 TCP数据接收卸载 LRO TOE 多核npu
在线阅读 下载PDF
NPU⁃LL叶片系列构型气动性能研究
14
作者 赵清周 廖明夫 刘前智 《机械科学与技术》 CSCD 北大核心 2022年第8期1278-1288,共11页
为提高轴流压气机气动负荷和稳定性,本文将若干个叶片的前缘和后缘在不同轴向位置上沿圆周方向彼此交错排列,构成压气机的一个非均匀叶片排。提出了4种压气机叶片新型排布构型———NPU⁃刘⁃廖叶片系列构型,简称LL叶片系列构型,分析了NPU... 为提高轴流压气机气动负荷和稳定性,本文将若干个叶片的前缘和后缘在不同轴向位置上沿圆周方向彼此交错排列,构成压气机的一个非均匀叶片排。提出了4种压气机叶片新型排布构型———NPU⁃刘⁃廖叶片系列构型,简称LL叶片系列构型,分析了NPU⁃LL叶片系列构型的结构特征和参数,探索了其流动特性,初步揭示了NPU⁃LL叶片系列构型在流动控制方面的突出优势,计算了4种NPU⁃LL叶片叶栅布局的气动特性,并与常规叶栅进行了对比。研究结果表明,NPU⁃LL叶片系列构型打破了传统叶片均匀布局局限,可有效地提升压气机的气动性能,为压气机性能的优化设计提供了一种新思路。 展开更多
关键词 npu⁃LL叶片系列构型 压气机 气动性能 流动控制 特性计算
在线阅读 下载PDF
NPU系统中优化PLA的实现
15
作者 全士玉 高德远 《计算机辅助设计与图形学学报》 EI CSCD 1992年第4期68-73,共6页
本文首先介绍了西北工业大学ASIC研究室开发的NPU超大规模集成电路计算机辅助设计系统中PLA设计工具包的基本功能。然后介绍了优化PLA的实现和版图实现的基本原理。该系统中采用了二次优化技术,对PLA进行优化处理,最后产生出版图文件。... 本文首先介绍了西北工业大学ASIC研究室开发的NPU超大规模集成电路计算机辅助设计系统中PLA设计工具包的基本功能。然后介绍了优化PLA的实现和版图实现的基本原理。该系统中采用了二次优化技术,对PLA进行优化处理,最后产生出版图文件。为PLA设计提供了实用化的工具。 展开更多
关键词 最佳化 特征矩阵 版图输出 CAD npu
在线阅读 下载PDF
基于昇腾NPU的癌细胞检测算法设计及实现 被引量:1
16
作者 吴振宁 肖仲喆 +1 位作者 江均均 黄敏 《电子器件》 CAS 北大核心 2020年第6期1210-1214,共5页
为了解决临床针图像中循环肿瘤细胞(CTC)人工检测效率低的问题,提出了利用经典图像处理方法进行预处理并利用卷积神经网络(CNN)进行判断识别的解决方法。通过预处理初步检测出图像中所有的疑似癌细胞,将得到的细胞图像输入到训练好的网... 为了解决临床针图像中循环肿瘤细胞(CTC)人工检测效率低的问题,提出了利用经典图像处理方法进行预处理并利用卷积神经网络(CNN)进行判断识别的解决方法。通过预处理初步检测出图像中所有的疑似癌细胞,将得到的细胞图像输入到训练好的网络进行判断并得到检测结果。实验中采用临床采集的图像进行测试,测试过程中网络判别准确率为90%,且没有出现漏判。结果表明:利用卷积神经网络的癌细胞识别方法具有可靠的效果,相较于人工判断具有精度上的优势,能够作为癌细胞识别的重要手段。同时,算法在集成了NPU加速芯片的华为Atlas200 DK硬件平台上运行,实现了运算加速,并为实现应用的离线部署创造了条件。 展开更多
关键词 癌细胞检测 预处理 npu 卷积神经网络
暂未订购
基于NPU的光纤振动信号数据预处理算法 被引量:1
17
作者 郭家旭 董雷 《电子设计工程》 2021年第20期156-160,共5页
在分布式光纤振动传感系统判断入侵事件的过程中,需要处理规模巨大的传感器阵列信号,使用中央处理器(CPU)端的异常事件识别所需的计算量大,而且运算时间长,特别消耗CPU的计算资源。基于此,利用华为公司的网络处理器(NPU)设备并结合Tenso... 在分布式光纤振动传感系统判断入侵事件的过程中,需要处理规模巨大的传感器阵列信号,使用中央处理器(CPU)端的异常事件识别所需的计算量大,而且运算时间长,特别消耗CPU的计算资源。基于此,利用华为公司的网络处理器(NPU)设备并结合TensorFlow计算框架进行运算实现,对分布式光纤振动传感系统采集到的部分本地原始解调数据进行读取以及预处理,以此分担CPU端的运算压力。经过测试表明,在NPU设备上对本地部分原始数据进行预处理后符合原系统准确度需求,所用的时间约为CPU端的1/3。 展开更多
关键词 光纤周界 TensorFlow npu计算 信号处理
在线阅读 下载PDF
中科院寒武纪NPU拟流片商用 被引量:2
18
《今日电子》 2017年第6期61-61,共1页
寒武纪是地球生命大爆发的年代,从那时起,地球进入了生命的新纪元。中国科学院计算技术研究所陈云霁、陈天石课题组把他们研制的深度学习处理器命名为“寒武纪”,是希望这世界上第一款模仿人类神经元和突触进行深度学习的处理器,能... 寒武纪是地球生命大爆发的年代,从那时起,地球进入了生命的新纪元。中国科学院计算技术研究所陈云霁、陈天石课题组把他们研制的深度学习处理器命名为“寒武纪”,是希望这世界上第一款模仿人类神经元和突触进行深度学习的处理器,能开启人工智能的新纪元。 展开更多
关键词 寒武纪 中国科学院计算技术研究所 npu 中科院 商用 地球生命 人工智能 处理器
在线阅读 下载PDF
断裂型内含肽Npu DnaE的C端序列赖氨酸突变对其剪接活性的影响
19
作者 张敬仪 朱建伟 张宝红 《中国医药工业杂志》 CAS CSCD 北大核心 2022年第12期1719-1725,共7页
断裂型内含肽Nostoc punctiforme(Npu)DnaE作为一种为构建抗体-药物偶联物(ADC)过程中实现定点偶联的工具,其C端序列中的赖氨酸对其剪接活性有较大影响。该研究对断裂型内含肽Npu DnaE C端序列中的赖氨酸进行定点突变,得到了5种氨基酸(... 断裂型内含肽Nostoc punctiforme(Npu)DnaE作为一种为构建抗体-药物偶联物(ADC)过程中实现定点偶联的工具,其C端序列中的赖氨酸对其剪接活性有较大影响。该研究对断裂型内含肽Npu DnaE C端序列中的赖氨酸进行定点突变,得到了5种氨基酸(精氨酸、谷氨酰胺、甘氨酸、谷氨酸和甲硫氨酸)取代的多肽序列,以探究不同氨基酸取代对其剪接活性的影响。结果显示分别由精氨酸、谷氨酰胺和甲硫氨酸3种氨基酸取代赖氨酸的内含肽C端序列保持了剪接活性,其中精氨酸取代的内含肽C端序列剪接效率较高。采用精氨酸取代的内含肽C端序列制备了ADC HER2-Lc-SMCCDM1,经检测其保有抗原亲和力和抗肿瘤活性。该研究结果为ADC的定点偶联和基于内含肽设计、改造蛋白质或多肽连接合成相关研究提供了技术支撑。 展开更多
关键词 npu DnaE 断裂型内含肽 赖氨酸突变 剪接活性 抗体-药物偶联物
原文传递
基于NPU和NSE系统的控制平面分析 被引量:1
20
作者 Karthik Ranganathan Jagadeesan Rajamanickam 《今日电子》 2004年第3期36-37,共2页
关键词 npu系统 NSE系统 网络搜索引擎 吞吐量 控制平面
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部