期刊文献+
共找到5,789篇文章
< 1 2 250 >
每页显示 20 50 100
swDaCe:一种申威众核处理器上以数据为中心的并行编程模型设计与实现
1
作者 沈沛祺 陈俊仕 安虹 《小型微型计算机系统》 北大核心 2026年第3期751-759,共9页
高性能科学计算是超级计算机的核心应用领域,包括粒子模拟、气候分析等关键任务.然而,随着摩尔定律逐渐失效,超级计算机体系结构日益趋向异构和复杂,导致科学计算应用的开发和优化变得更加困难.为解决这一问题,本文基于新一代申威超级... 高性能科学计算是超级计算机的核心应用领域,包括粒子模拟、气候分析等关键任务.然而,随着摩尔定律逐渐失效,超级计算机体系结构日益趋向异构和复杂,导致科学计算应用的开发和优化变得更加困难.为解决这一问题,本文基于新一代申威超级计算平台,提出并实现了一种以数据为中心的并行编程模型——swDaCe.该模型通过解耦数据流图优化与原始程序,使得编程人员可以使用Python描述计算逻辑,并最终生成适配申威众核架构的高性能C++代码.此外,本文提出了一系列针对申威架构的数据流优化方法,包括从核任务映射、向量化并行以及DMA访存优化,以充分利用申威众核处理器的计算能力.实验结果表明,swDaCe生成的代码在稀疏矩阵计算等典型应用中实现了显著的性能提升,单核组加速比达到25倍以上,验证了该框架在申威架构上的有效性. 展开更多
关键词 新一代神威平台 异构众核处理器 数据流编程 并行计算 稀疏矩阵乘
在线阅读 下载PDF
考虑多资源交错的深度学习训练作业调度策略
2
作者 林洁楠 郑裕恒 陈星 《小型微型计算机系统》 北大核心 2026年第1期80-88,共9页
随着深度学习(Deep Learning,DL)的迅速发展,各类DL模型在CPU、GPU、存储IO和网络IO等资源的使用上表现出明显差异化特征.然而,在带有资源约束的集群环境中,面对资源瓶颈各异的DL训练作业,如何进行作业调度以最小化完工时间是一个挑战.... 随着深度学习(Deep Learning,DL)的迅速发展,各类DL模型在CPU、GPU、存储IO和网络IO等资源的使用上表现出明显差异化特征.然而,在带有资源约束的集群环境中,面对资源瓶颈各异的DL训练作业,如何进行作业调度以最小化完工时间是一个挑战.大多数现有工作主要关注GPU分配,难以有效应对不同类型模型对多种资源的综合需求.为了解决这一挑战,本文引入了一种考虑多资源交错的DL训练作业调度策略,该策略充分利用DL作业分阶段迭代的特点,通过不同资源的交替使用实现作业的并行运行,并提出一种结合了DDPSO-GA(Dynamic Discrete Particle Swarm Optimization algorithm with Genetic Algorithm operators)和多轮Blossom算法的调度方法DPGB,以搜索最优作业调度方案.实验结果表明,该方法能够有效缩短集群环境下DL训练作业的完工时间. 展开更多
关键词 资源共享 深度学习 作业调度 粒子群优化算法
在线阅读 下载PDF
数据空间中基于纠删码的数据布局策略
3
作者 林兵 姜海鸥 +2 位作者 檀啸 陈星 郑裕恒 《计算机科学》 北大核心 2026年第2期196-206,共11页
针对云边环境下面向多目标优化的科学工作流数据布局问题,考虑数据可靠性、工作流执行时延和数据中心负载均衡等因素,提出了数据空间中基于纠删码的数据布局策略。首先,提出在科学工作流执行时使用低存储开销的纠删码冗余技术以提供容... 针对云边环境下面向多目标优化的科学工作流数据布局问题,考虑数据可靠性、工作流执行时延和数据中心负载均衡等因素,提出了数据空间中基于纠删码的数据布局策略。首先,提出在科学工作流执行时使用低存储开销的纠删码冗余技术以提供容错能力,并通过构建数据空间来管理工作流产生的多样化数据;其次,设计了一种响应式多目标进化算法(Interactive Multi-Objective Evolution Algorithm,IMOEA),同时优化执行时延和数据中心负载均衡,通过与决策者交互,使算法生成的解决方案更符合决策者的期望,提高了优化结果的个性化和可接受性。实验结果表明,针对不同规模和类型的工作流,相比于DIST,MOGA和RAND算法,IMOEA在空间指标(Space,SP)上分别降低了2.3%~36.34%,15.71%~44.01%和22.50%~47.64%,在超体积指标(Hypervolume,HV)上分别优化了7.84%~38.23%,14.65%~48.4%和45.01%~109.45%。此外,IMOEA算法可以很好地对决策者的偏好做出反应,找到令决策者满意的数据布局方案。 展开更多
关键词 数据空间 云边环境 科学工作流 数据布局 纠删码 多目标优化
在线阅读 下载PDF
一种基于图同构时空网络的交通流预测模型
4
作者 张伟阳 陈宏敏 林兵 《福建师范大学学报(自然科学版)》 北大核心 2026年第1期1-9,共9页
准确的交通流预测对于智能交通系统的有效运作至关重要,为此提出了图同构时空网络(graph isomorphism spatio-temporal network,GISTN)模型,旨在提高交通流预测的准确性。GISTN将图同构网络应用于交通流预测任务,并创新性地与双尺度时... 准确的交通流预测对于智能交通系统的有效运作至关重要,为此提出了图同构时空网络(graph isomorphism spatio-temporal network,GISTN)模型,旨在提高交通流预测的准确性。GISTN将图同构网络应用于交通流预测任务,并创新性地与双尺度时间卷积网络和门控循环单元相结合,有效捕捉了交通数据中的复杂非线性空间依赖关系和不同尺度时间特征。基于3个公开数据集上的实验结果表明,GISTN在不同预测时间尺度下的性能均优于经典基线模型。GISTN为交通流预测提供了一个新颖且高效的解决方案,对于提高智能交通系统的性能和效率具有重要意义。 展开更多
关键词 交通流预测 图神经网络 图同构网络 时空建模 智能交通系统
在线阅读 下载PDF
一起单片机内存软错误问题研究及解决措施
5
作者 周强 孙浩 +2 位作者 赵天恩 梁剑 何嵘 《自动化应用》 2026年第6期249-252,256,共5页
随着半导体技术的不断发展,新型单片机(MCU)因单粒子效应(SEE)引发内存软错误的概率上升,这会对设备的可靠运行产生影响。结合一起工程现场嵌入式设备运行异常,开展故障信息提取及原因机理分析,提出MCU内存软错误问题解决措施,最后通过... 随着半导体技术的不断发展,新型单片机(MCU)因单粒子效应(SEE)引发内存软错误的概率上升,这会对设备的可靠运行产生影响。结合一起工程现场嵌入式设备运行异常,开展故障信息提取及原因机理分析,提出MCU内存软错误问题解决措施,最后通过中子试验验证措施的有效性。研究表明,在工业自动化系统这类高可靠性产品的设计阶段,应充分评估MCU内存软错误风险,主动采取预防性设计和监视恢复措施,以保障系统的安全稳定运行。 展开更多
关键词 单片机 内存 软错误 缓存 监视 恢复
在线阅读 下载PDF
面向分布式计算的类脑智能处理器指令集架构设计
6
作者 冯烁 路冬冬 +6 位作者 尹飞 杨剑新 班冬松 何军 颜世云 李媛 雎浩宇 《计算机研究与发展》 北大核心 2026年第1期1-14,共14页
作为分布式计算的典型体现之一,端边云协同计算系统能够有效推动物联网、大模型、数字孪生等人工智能技术的垂直落地应用。类脑计算是一种受大脑工作方式启发而提出的智能计算技术,具有能效高、速度快、容错度高、可扩展性强等优点。通... 作为分布式计算的典型体现之一,端边云协同计算系统能够有效推动物联网、大模型、数字孪生等人工智能技术的垂直落地应用。类脑计算是一种受大脑工作方式启发而提出的智能计算技术,具有能效高、速度快、容错度高、可扩展性强等优点。通过利用脉冲神经网络的事件驱动机制和脉冲稀疏发放等特性,类脑计算能够极大地提升分布式端边云系统的实时处理能力和能量效率。针对分布式终端设备的高实时、低功耗、强异构等特点,聚焦于指令集架构这一软硬件的交互界面,给出了一种立足现有系统、易于部署升级、安全自主可控、异构融合兼容的硬件设计方案,一共提出了12条类脑计算指令,完成了基于某国产指令系统的类脑指令集和对应微结构的定制化设计,为类脑计算赋能分布式计算系统奠定了技术基础。 展开更多
关键词 分布式计算 类脑智能 脉冲神经网络 指令集架构 处理器微结构 神经拟态芯片
在线阅读 下载PDF
计算机科学与技术中并行计算优化策略研究
7
作者 曹亦菲 龙艳彬 《信息产业报道》 2026年第1期0203-0205,共3页
文章系统探究了并行计算中的性能优化策略,以解决高性能计算应用中突出的性能瓶颈难题。从硬件架构、软件算法、系统等不同层次,深入分析性能瓶颈产生的原因。针对节点内共享内存与跨节点分布式内存这两类具有代表性的环境,分别提出了... 文章系统探究了并行计算中的性能优化策略,以解决高性能计算应用中突出的性能瓶颈难题。从硬件架构、软件算法、系统等不同层次,深入分析性能瓶颈产生的原因。针对节点内共享内存与跨节点分布式内存这两类具有代表性的环境,分别提出了一些关键的优化策略。实验表明,提出的优化策略可提升程序的并行效率和可扩展性效果,加速比有明显提升,为并行程序的性能调优提供了一套完整的方法指导和实践范例,有助于提高计算资源的利用效率。 展开更多
关键词 并行计算 性能优化 OPENMP MPI 混合编程
在线阅读 下载PDF
A Real-Time Task Scheduling Algorithm Based on Bilateral Matching Games in a Distributed Computing Environment
8
作者 LI Shuo FANG Zuying +1 位作者 ZHOU Guoqiang DAI Guilan 《Wuhan University Journal of Natural Sciences》 2026年第1期69-78,共10页
In the era of the Internet of Things,distributed computing alleviates the problem of insufficient terminal computing power by integrating idle resources of heterogeneous devices.However,the imbalance between task exec... In the era of the Internet of Things,distributed computing alleviates the problem of insufficient terminal computing power by integrating idle resources of heterogeneous devices.However,the imbalance between task execution delay and node energy consumption,and the scheduling and adaptation challenges brought about by device heterogeneity,urgently need to be addressed.To tackle this problem,this paper constructs a multi-objective real-time task scheduling model that considers task real-time performance,execution delay,system energy consumption,and node interests.The model aims to minimize the delay upper bound and total energy consumption while maximizing system satisfaction.A real-time task scheduling algorithm based on bilateral matching game is proposed.By designing a bidirectional preference mechanism between tasks and computing nodes,combined with a multi-round stable matching strategy,accurate matching between tasks and nodes is achieved.Simulation results show that compared with the baseline scheme,the proposed algorithm significantly reduces the total execution cost,effectively balances the task execution delay and the energy consumption of compute nodes,and takes into account the interests of each network compute node. 展开更多
关键词 dispersed computing real-time task task scheduling bilateral matching game
原文传递
迄今最逼真虚拟大脑问世
9
作者 吴玉(编译) 《自然杂志》 2026年第1期8-8,50,共2页
借助全球运算速度最快的超级计算机,科学家打造出迄今最全面且在生物学上最真实的动物大脑模型。相关研究成果在近日举行的2025年全球超级计算大会(SC25)上发布。这一小鼠全皮层数字重建模型为研究人员探索大脑功能提供了新途径,可在虚... 借助全球运算速度最快的超级计算机,科学家打造出迄今最全面且在生物学上最真实的动物大脑模型。相关研究成果在近日举行的2025年全球超级计算大会(SC25)上发布。这一小鼠全皮层数字重建模型为研究人员探索大脑功能提供了新途径,可在虚拟环境中复现阿尔茨海默病或癫痫等疾病状态,追踪神经回路中的损伤传播路径,并深入研究认知与意识等相关过程。 展开更多
关键词 虚拟大脑 小鼠全皮层 超级计算机
在线阅读 下载PDF
美桑迪亚国家实验室新型超级计算机或重塑核武器模拟能力
10
作者 伍浩松 张焰 《国外核新闻》 2026年第1期17-17,共1页
【美国桑迪亚国家实验室网站2025年12月8日报道】美国桑迪亚国家实验室(SNL)近发布新型超级计算系统Spectra,展了美在核武器模拟与高性能计算领域探索新一代计算架构应用的最新进展。该系统通过引入实时任务优先级调度机制,有望在不依... 【美国桑迪亚国家实验室网站2025年12月8日报道】美国桑迪亚国家实验室(SNL)近发布新型超级计算系统Spectra,展了美在核武器模拟与高性能计算领域探索新一代计算架构应用的最新进展。该系统通过引入实时任务优先级调度机制,有望在不依赖物理核试验的前提下,进一步提升核武器相关模拟的效率与可靠性。 展开更多
关键词 超级计算机 核武器模拟
在线阅读 下载PDF
国家超算互联网科学计算智能体亮相
11
《信息系统工程》 2026年第1期F0002-F0002,共1页
国家超算互联网科学计算智能体日前在天津正式发布。该智能体通过自然语言交互,可自动完成科研任务问题拆解、算力资源调度、计算软件调用、结果分析与报告生成,将传统模式下需1天完成的工作缩短至约1小时完成。当前,人工智能正深刻重... 国家超算互联网科学计算智能体日前在天津正式发布。该智能体通过自然语言交互,可自动完成科研任务问题拆解、算力资源调度、计算软件调用、结果分析与报告生成,将传统模式下需1天完成的工作缩短至约1小时完成。当前,人工智能正深刻重塑科学研究和工程创新模式。随着AI for Science (人工智能驱动的科学研究)的深入发展,科研活动对算力的需求持续增长,也对算力的组织、调度与应用方式提出了更高要求。 展开更多
关键词 国家超算互联网 科学计算智能体
在线阅读 下载PDF
面向迈创3000异构处理器的多头注意力机制多重并行优化 被引量:1
12
作者 路瑶 栾钟治 +4 位作者 李根 齐家兴 韩斌 杨海龙 钱德沛 《计算机学报》 北大核心 2025年第9期2049-2063,共15页
针对迈创3000(MT-3000)异构多核处理器在带宽不足场景下多头注意力(Multi-Head Attention,MHA)计算效率低的问题,本文提出了一套涵盖算子优化、访存优化与调度优化的综合方案,以加速PyTorch框架中的MHA推理。通过融合MT-3000的VLIW指令... 针对迈创3000(MT-3000)异构多核处理器在带宽不足场景下多头注意力(Multi-Head Attention,MHA)计算效率低的问题,本文提出了一套涵盖算子优化、访存优化与调度优化的综合方案,以加速PyTorch框架中的MHA推理。通过融合MT-3000的VLIW指令集、片上存储层次和DMA传输特性,设计了三方面的优化策略:在算子方面,对Linear和Softmax等算子进行内核级优化与算子融合,减少计算与访存开销;在访存方面,利用广播机制与全局共享内存(GSM)优化数据流,降低主存带宽依赖;在调度方面,以行为粒度分块并行,隐藏数据传输延迟。实验表明,优化后的Linear算子单簇峰值性能达1.53 TFLOPS,占理论峰值的37.7%,较NVIDIA V100 GPU加速比最高达5.34倍;在典型大语言模型配置下(嵌入维度4096/8192,头数32/64),MHA机制相较NVIDIA V100 GPU实现最高23.53倍加速,且在单节点多簇环境中扩展性良好。本研究为MT-3000在长序列推理任务中的高效部署提供了解决方案,并为天河超算支持大语言模型等复杂AI任务奠定了技术基础。 展开更多
关键词 MT-3000 多头注意力 性能优化 PyTorch 加速比
在线阅读 下载PDF
基于超级计算机的高性能计算应用发展现状及趋势研究 被引量:2
13
作者 刘扬 许建飞 +9 位作者 许黄超 吴璨 胡泰源 原惠峰 高凌云 梁文昊 董盛 马英晋 李瑞琳 赵永华 《数据与计算发展前沿(中英文)》 2025年第2期68-85,共18页
【目的】随着信息技术的快速发展和全球数据量的激增,超级计算机(超算)已经成为科学研究和创新发展的重要驱动力。本文旨在探讨超算在多个领域中的应用现状与发展趋势。【方法】通过广泛调研全球范围内的超算和领域应用情况,系统性地对... 【目的】随着信息技术的快速发展和全球数据量的激增,超级计算机(超算)已经成为科学研究和创新发展的重要驱动力。本文旨在探讨超算在多个领域中的应用现状与发展趋势。【方法】通过广泛调研全球范围内的超算和领域应用情况,系统性地对相关高性能计算应用进行分类和总结,重点关注化学与材料、物理学等多个领域,探讨相关计算需求与超算的适配和部署情况。此外,本文还积极讨论了网格计算与超算互联。【结果】超算在多个领域应用已经展现出了显著的效果。随着应用领域的需要和高性能计算技术的不断发展,对超级计算机的软硬件发展也提出更高要求。【局限】虽然超算正处在蓬勃发展的阶段,可应用范围广泛,但本文仅选取了代表性应用领域进行分析总结。【结论】超算在加速科学发现和技术创新方面的效率显著提升,为未来的研究和应用提供了强有力的支持。同时,提升超算的性能和适应性将是未来科研进展的重要保障。 展开更多
关键词 超级计算机 大规模并行应用 高性能计算
在线阅读 下载PDF
基于图强化学习的多边缘协同负载均衡方法
14
作者 郑龙海 肖博怀 +2 位作者 姚泽玮 陈星 莫毓昌 《计算机科学》 北大核心 2025年第3期338-348,共11页
在移动边缘计算中,设备通过将计算密集型任务卸载到附近边缘服务器,可以有效减少应用程序的延迟和能耗。为了提高服务质量,边缘服务器之间需要协作而非单独工作。针对多边缘协作的负载均衡问题,现有的策略往往依赖于精确的数学模型或缺... 在移动边缘计算中,设备通过将计算密集型任务卸载到附近边缘服务器,可以有效减少应用程序的延迟和能耗。为了提高服务质量,边缘服务器之间需要协作而非单独工作。针对多边缘协作的负载均衡问题,现有的策略往往依赖于精确的数学模型或缺乏对边缘拓扑关系的利用。为了解决此问题,文中提出了一种基于图强化学习的卸载决策方法。首先将多边缘协作的负载均衡场景抽象为图数据;然后采用基于图卷积神经网络的图嵌入过程来提取图的信息特征,以辅助深度Q网络进行卸载决策;最后通过集中反馈控制机制找到目标负载均衡方案。在多个场景下进行仿真实验,实验结果验证了所提方法在缩短任务平均响应时延方面的有效性,并且可以在短时间内获得优于对比算法且接近理想方案的负载均衡效果。 展开更多
关键词 多边缘协作 负载均衡 任务卸载 图神经网络 深度强化学习
在线阅读 下载PDF
基于Slurm的气象高性能计算资源调度管理及应用
15
作者 沈瑜 孙婧 李娟 《计算机技术与发展》 2025年第11期180-187,共8页
针对气象数值预报应用的特点及气象高性能计算资源调度管理的需求,基于Slurm(Simple Linux Utility for Resource Management)作业调度系统,在中国气象局派-曙光高性能计算机系统上提出了一套精细化的资源调度管理方法。该方法通过优化... 针对气象数值预报应用的特点及气象高性能计算资源调度管理的需求,基于Slurm(Simple Linux Utility for Resource Management)作业调度系统,在中国气象局派-曙光高性能计算机系统上提出了一套精细化的资源调度管理方法。该方法通过优化调度策略与灵活的资源分区配置,从系统层面实现了气象实时业务运行保障与作业吞吐量、调度效率之间的平衡,实现了资源的高效利用;同时,引入服务质量(QoS)机制,动态调整作业优先级与资源配额,从用户层面进一步确保了资源分配的公平性与调度灵活性。系统资源使用及作业运行数据表明,该方法在保障气象实时业务稳定运行的同时,有效提高了研发作业的完成效率,确保系统整体资源的高效利用,在派-曙光高性能计算机系统上取得了良好的应用效果,对高性能计算资源在复杂应用场景下的合理调度和利用具有很好的实用性和参考意义。 展开更多
关键词 气象高性能计算 资源调度 Slurm 分区管理 服务质量
在线阅读 下载PDF
一种带缓冲区的分布式流式图划分算法
16
作者 史惠康 王泽胜 +2 位作者 胡克坤 董刚 赵有健 《计算机研究与发展》 北大核心 2025年第7期1805-1815,共11页
图划分是大图并行处理关键技术之一.现有图划分算法存在划分质量和效率难以平衡的问题,主要体现在离线划分算法划分质量高但耗时长;在线(也称流式)划分算法相对高效但划分质量不理想.为此,提出一种带缓冲区的分布式流式划分算法.该算法... 图划分是大图并行处理关键技术之一.现有图划分算法存在划分质量和效率难以平衡的问题,主要体现在离线划分算法划分质量高但耗时长;在线(也称流式)划分算法相对高效但划分质量不理想.为此,提出一种带缓冲区的分布式流式划分算法.该算法采用多加载器-多划分器架构,多个加载器并行读取图数据,提高图数据加载效率;每个划分器维护一个缓冲区,缓存相应加载器发来的图顶点,并按顶点度数高低排序,为划分器提供更多决策依据.划分器预置有4条流式启发式规则,围绕不同目标,对缓冲区中的顶点实施并行划分,并借助重流机制微调划分结果,改进划分质量.分布式系统环境下的划分质量与性能实验表明:提出算法的划分质量(割边比)比当前最好的在线划分算法改善超过18.8个百分点,并将图数据加载时间在划分总时间的占比,从单划分器-单加载器架构流式划分算法的平均30.8%缩减至平均20.1%. 展开更多
关键词 大图 流式划分 分布式 缓冲 重流
在线阅读 下载PDF
中国科学院超级计算中心创新发展
17
作者 钱芳 柴芳姣 +3 位作者 赵芸卿 田原 白一頔 姜金荣 《数据与计算发展前沿(中英文)》 2025年第3期15-29,共15页
【目的】超级计算关乎国家发展,是世界各国竞相抢占的战略制高点。【方法】中国科学院超级计算中心在中国科学院的支持下,充分发挥中国科学院建制化优势,以科学计算应用需求为牵引,在超级计算环境、基础软件、应用软件方面积极布局、持... 【目的】超级计算关乎国家发展,是世界各国竞相抢占的战略制高点。【方法】中国科学院超级计算中心在中国科学院的支持下,充分发挥中国科学院建制化优势,以科学计算应用需求为牵引,在超级计算环境、基础软件、应用软件方面积极布局、持续深耕。【结果】在计算与科研交叉领域取得了丰硕的成果,推动了中国高性能计算技术的自主创新与国际竞争力提升。 展开更多
关键词 超级计算中心 超级计算环境 基础软件 应用软件
在线阅读 下载PDF
一种基于CPU+FPGA架构的大容量数据高效索引方法
18
作者 张雷 赵杨 《现代信息科技》 2025年第12期45-49,共5页
在某些嵌入式装备中,尤其是“星”状网络结构的中心节点设备,需要对大量互联终端用户类数据进行管理,特别是对指定终端用户数据的高效索引,随着终端用户数量的增大,对指定数据的索引将影响嵌入式设备的整体性能。文章基于CPU+FPGA硬件架... 在某些嵌入式装备中,尤其是“星”状网络结构的中心节点设备,需要对大量互联终端用户类数据进行管理,特别是对指定终端用户数据的高效索引,随着终端用户数量的增大,对指定数据的索引将影响嵌入式设备的整体性能。文章基于CPU+FPGA硬件架构,提出一种对大容量数据进行高效索引的方法,不依赖大型数据库管理软件,通过在CPU和FPGA间建立一张数据与地址的索引表,可在大量用户数据中快速查找到指定用户数据进行处理,减小时延,提升设备性能。 展开更多
关键词 数据查询 高速索引 嵌入式系统
在线阅读 下载PDF
三角函数协处理器的设计与实现
19
作者 胡玉婷 袁甲 张加宏 《中国电子科学研究院学报》 2025年第3期321-330,共10页
在实时处理和边缘计算应用中,三角函数作为基础计算广泛使用,仅依靠性能有限的微处理器会面临实时性和功耗的问题。为应对这些挑战,设计了一种基于CORDIC算法的协处理器,用以提升运算速度和效率。该协处理器采用直接内存访问技术快速获... 在实时处理和边缘计算应用中,三角函数作为基础计算广泛使用,仅依靠性能有限的微处理器会面临实时性和功耗的问题。为应对这些挑战,设计了一种基于CORDIC算法的协处理器,用以提升运算速度和效率。该协处理器采用直接内存访问技术快速获取数据,并具备灵活的配置能力。核心模块以CORDIC算法为基础,通过查找表替代法、固定高位动态处理低位法以及改进的混合迭代法优化运算过程。整体架构采用流水线结构,显著减少迭代周期和硬件资源占用。仿真结果显示,协处理器平均相对误差为1×10^(-5),综合结果的总资源消耗LUT数1103、FF数571,其中改进的算法模块相较传统算法节省约46.72%资源,最大频率达315.36 MHz。该设计具有高运行频率和低资源占用,适用于实时处理芯片等高计算需求场景,具有广泛的应用前景。 展开更多
关键词 协处理器 CORDIC算法 三角函数 混合迭代法
在线阅读 下载PDF
百万亿次超级高性能计算机曙光5000诞生 被引量:1
20
作者 张志军 《科技创新与品牌》 2008年第8期24-25,共2页
2008年6月24日,中国高性能计算机的研发迈上了一个新台阶。中国科学院计算技术研究所、中国服务器领先品牌“曙光”和上海超级计算中心在北京联合举行曙光5000落户上海签约仪式。这标志着中国用户即将拥有国产品牌的百万亿次超级计算... 2008年6月24日,中国高性能计算机的研发迈上了一个新台阶。中国科学院计算技术研究所、中国服务器领先品牌“曙光”和上海超级计算中心在北京联合举行曙光5000落户上海签约仪式。这标志着中国用户即将拥有国产品牌的百万亿次超级计算机,也标志着上海超级计算中心也将成为世界最大的通用计算平台。 展开更多
关键词 高性能计算机 上海超级计算中心 中国科学院 计算技术研究所 国产品牌 超级计算机 签约仪式 中国用户
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部