期刊文献+
共找到5,713篇文章
< 1 2 250 >
每页显示 20 50 100
面向迈创3000异构处理器的多头注意力机制多重并行优化
1
作者 路瑶 栾钟治 +4 位作者 李根 齐家兴 韩斌 杨海龙 钱德沛 《计算机学报》 北大核心 2025年第9期2049-2063,共15页
针对迈创3000(MT-3000)异构多核处理器在带宽不足场景下多头注意力(Multi-Head Attention,MHA)计算效率低的问题,本文提出了一套涵盖算子优化、访存优化与调度优化的综合方案,以加速PyTorch框架中的MHA推理。通过融合MT-3000的VLIW指令... 针对迈创3000(MT-3000)异构多核处理器在带宽不足场景下多头注意力(Multi-Head Attention,MHA)计算效率低的问题,本文提出了一套涵盖算子优化、访存优化与调度优化的综合方案,以加速PyTorch框架中的MHA推理。通过融合MT-3000的VLIW指令集、片上存储层次和DMA传输特性,设计了三方面的优化策略:在算子方面,对Linear和Softmax等算子进行内核级优化与算子融合,减少计算与访存开销;在访存方面,利用广播机制与全局共享内存(GSM)优化数据流,降低主存带宽依赖;在调度方面,以行为粒度分块并行,隐藏数据传输延迟。实验表明,优化后的Linear算子单簇峰值性能达1.53 TFLOPS,占理论峰值的37.7%,较NVIDIA V100 GPU加速比最高达5.34倍;在典型大语言模型配置下(嵌入维度4096/8192,头数32/64),MHA机制相较NVIDIA V100 GPU实现最高23.53倍加速,且在单节点多簇环境中扩展性良好。本研究为MT-3000在长序列推理任务中的高效部署提供了解决方案,并为天河超算支持大语言模型等复杂AI任务奠定了技术基础。 展开更多
关键词 MT-3000 多头注意力 性能优化 PyTorch 加速比
在线阅读 下载PDF
基于图强化学习的多边缘协同负载均衡方法
2
作者 郑龙海 肖博怀 +2 位作者 姚泽玮 陈星 莫毓昌 《计算机科学》 北大核心 2025年第3期338-348,共11页
在移动边缘计算中,设备通过将计算密集型任务卸载到附近边缘服务器,可以有效减少应用程序的延迟和能耗。为了提高服务质量,边缘服务器之间需要协作而非单独工作。针对多边缘协作的负载均衡问题,现有的策略往往依赖于精确的数学模型或缺... 在移动边缘计算中,设备通过将计算密集型任务卸载到附近边缘服务器,可以有效减少应用程序的延迟和能耗。为了提高服务质量,边缘服务器之间需要协作而非单独工作。针对多边缘协作的负载均衡问题,现有的策略往往依赖于精确的数学模型或缺乏对边缘拓扑关系的利用。为了解决此问题,文中提出了一种基于图强化学习的卸载决策方法。首先将多边缘协作的负载均衡场景抽象为图数据;然后采用基于图卷积神经网络的图嵌入过程来提取图的信息特征,以辅助深度Q网络进行卸载决策;最后通过集中反馈控制机制找到目标负载均衡方案。在多个场景下进行仿真实验,实验结果验证了所提方法在缩短任务平均响应时延方面的有效性,并且可以在短时间内获得优于对比算法且接近理想方案的负载均衡效果。 展开更多
关键词 多边缘协作 负载均衡 任务卸载 图神经网络 深度强化学习
在线阅读 下载PDF
一种带缓冲区的分布式流式图划分算法
3
作者 史惠康 王泽胜 +2 位作者 胡克坤 董刚 赵有健 《计算机研究与发展》 北大核心 2025年第7期1805-1815,共11页
图划分是大图并行处理关键技术之一.现有图划分算法存在划分质量和效率难以平衡的问题,主要体现在离线划分算法划分质量高但耗时长;在线(也称流式)划分算法相对高效但划分质量不理想.为此,提出一种带缓冲区的分布式流式划分算法.该算法... 图划分是大图并行处理关键技术之一.现有图划分算法存在划分质量和效率难以平衡的问题,主要体现在离线划分算法划分质量高但耗时长;在线(也称流式)划分算法相对高效但划分质量不理想.为此,提出一种带缓冲区的分布式流式划分算法.该算法采用多加载器-多划分器架构,多个加载器并行读取图数据,提高图数据加载效率;每个划分器维护一个缓冲区,缓存相应加载器发来的图顶点,并按顶点度数高低排序,为划分器提供更多决策依据.划分器预置有4条流式启发式规则,围绕不同目标,对缓冲区中的顶点实施并行划分,并借助重流机制微调划分结果,改进划分质量.分布式系统环境下的划分质量与性能实验表明:提出算法的划分质量(割边比)比当前最好的在线划分算法改善超过18.8个百分点,并将图数据加载时间在划分总时间的占比,从单划分器-单加载器架构流式划分算法的平均30.8%缩减至平均20.1%. 展开更多
关键词 大图 流式划分 分布式 缓冲 重流
在线阅读 下载PDF
中国科学院超级计算中心创新发展
4
作者 钱芳 柴芳姣 +3 位作者 赵芸卿 田原 白一頔 姜金荣 《数据与计算发展前沿(中英文)》 2025年第3期15-29,共15页
【目的】超级计算关乎国家发展,是世界各国竞相抢占的战略制高点。【方法】中国科学院超级计算中心在中国科学院的支持下,充分发挥中国科学院建制化优势,以科学计算应用需求为牵引,在超级计算环境、基础软件、应用软件方面积极布局、持... 【目的】超级计算关乎国家发展,是世界各国竞相抢占的战略制高点。【方法】中国科学院超级计算中心在中国科学院的支持下,充分发挥中国科学院建制化优势,以科学计算应用需求为牵引,在超级计算环境、基础软件、应用软件方面积极布局、持续深耕。【结果】在计算与科研交叉领域取得了丰硕的成果,推动了中国高性能计算技术的自主创新与国际竞争力提升。 展开更多
关键词 超级计算中心 超级计算环境 基础软件 应用软件
在线阅读 下载PDF
基于超级计算机的高性能计算应用发展现状及趋势研究
5
作者 刘扬 许建飞 +9 位作者 许黄超 吴璨 胡泰源 原惠峰 高凌云 梁文昊 董盛 马英晋 李瑞琳 赵永华 《数据与计算发展前沿(中英文)》 2025年第2期68-85,共18页
【目的】随着信息技术的快速发展和全球数据量的激增,超级计算机(超算)已经成为科学研究和创新发展的重要驱动力。本文旨在探讨超算在多个领域中的应用现状与发展趋势。【方法】通过广泛调研全球范围内的超算和领域应用情况,系统性地对... 【目的】随着信息技术的快速发展和全球数据量的激增,超级计算机(超算)已经成为科学研究和创新发展的重要驱动力。本文旨在探讨超算在多个领域中的应用现状与发展趋势。【方法】通过广泛调研全球范围内的超算和领域应用情况,系统性地对相关高性能计算应用进行分类和总结,重点关注化学与材料、物理学等多个领域,探讨相关计算需求与超算的适配和部署情况。此外,本文还积极讨论了网格计算与超算互联。【结果】超算在多个领域应用已经展现出了显著的效果。随着应用领域的需要和高性能计算技术的不断发展,对超级计算机的软硬件发展也提出更高要求。【局限】虽然超算正处在蓬勃发展的阶段,可应用范围广泛,但本文仅选取了代表性应用领域进行分析总结。【结论】超算在加速科学发现和技术创新方面的效率显著提升,为未来的研究和应用提供了强有力的支持。同时,提升超算的性能和适应性将是未来科研进展的重要保障。 展开更多
关键词 超级计算机 大规模并行应用 高性能计算
在线阅读 下载PDF
一种基于CPU+FPGA架构的大容量数据高效索引方法
6
作者 张雷 赵杨 《现代信息科技》 2025年第12期45-49,共5页
在某些嵌入式装备中,尤其是“星”状网络结构的中心节点设备,需要对大量互联终端用户类数据进行管理,特别是对指定终端用户数据的高效索引,随着终端用户数量的增大,对指定数据的索引将影响嵌入式设备的整体性能。文章基于CPU+FPGA硬件架... 在某些嵌入式装备中,尤其是“星”状网络结构的中心节点设备,需要对大量互联终端用户类数据进行管理,特别是对指定终端用户数据的高效索引,随着终端用户数量的增大,对指定数据的索引将影响嵌入式设备的整体性能。文章基于CPU+FPGA硬件架构,提出一种对大容量数据进行高效索引的方法,不依赖大型数据库管理软件,通过在CPU和FPGA间建立一张数据与地址的索引表,可在大量用户数据中快速查找到指定用户数据进行处理,减小时延,提升设备性能。 展开更多
关键词 数据查询 高速索引 嵌入式系统
在线阅读 下载PDF
三角函数协处理器的设计与实现
7
作者 胡玉婷 袁甲 张加宏 《中国电子科学研究院学报》 2025年第3期321-330,共10页
在实时处理和边缘计算应用中,三角函数作为基础计算广泛使用,仅依靠性能有限的微处理器会面临实时性和功耗的问题。为应对这些挑战,设计了一种基于CORDIC算法的协处理器,用以提升运算速度和效率。该协处理器采用直接内存访问技术快速获... 在实时处理和边缘计算应用中,三角函数作为基础计算广泛使用,仅依靠性能有限的微处理器会面临实时性和功耗的问题。为应对这些挑战,设计了一种基于CORDIC算法的协处理器,用以提升运算速度和效率。该协处理器采用直接内存访问技术快速获取数据,并具备灵活的配置能力。核心模块以CORDIC算法为基础,通过查找表替代法、固定高位动态处理低位法以及改进的混合迭代法优化运算过程。整体架构采用流水线结构,显著减少迭代周期和硬件资源占用。仿真结果显示,协处理器平均相对误差为1×10^(-5),综合结果的总资源消耗LUT数1103、FF数571,其中改进的算法模块相较传统算法节省约46.72%资源,最大频率达315.36 MHz。该设计具有高运行频率和低资源占用,适用于实时处理芯片等高计算需求场景,具有广泛的应用前景。 展开更多
关键词 协处理器 CORDIC算法 三角函数 混合迭代法
在线阅读 下载PDF
一种集成于超算作业调度系统应用的并行参数优化方法
8
作者 张文帅 李会民 +1 位作者 李京 潘必才 《计算机工程》 北大核心 2025年第7期59-67,共9页
随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率... 随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率影响很大。随着计算规模与复杂度的提升,多个并行参数的可配置空间越来越大,用户越来越难以确定最佳的并行参数值。这类运行时优化问题在科学计算应用中较为普遍,但相关的研究与解决方法比较少见。以VASP(Vienna Ab initio Simulation Package)应用为例,首先分析了该应用的多层并行结构,展示了不同并行参数配置引发的巨大运行速度差异。然后提出了一个基于约化并行效率指标的全自动运行优化方法,其不仅可以帮助用户简单快捷地确定最佳应用并行参数,而且可以帮助用户确定最佳的计算资源使用量,使应用可以高效率地扩展到大规模的并行计算中。最后将该优化方法与计算集群作业调度系统相融合应用于用户提交的真实VASP计算作业。统计结果表明,该方法显著提升了作业运行速度与超算资源的使用效率,具有很好的工程应用前景。 展开更多
关键词 并行计算 作业调度 运行时优化 超级计算 VASP应用
在线阅读 下载PDF
DSP处理器二级缓存的结构优化研究 被引量:1
9
作者 安昕辰 《计算机工程与科学》 北大核心 2025年第1期10-17,共8页
近年来自动驾驶、医用仪器、智能家居等领域涌现出的新应用对DSP处理器的实时性和数据吞吐能力提出了更高的要求。多级缓存结构在DSP中的使用引入了因缓存缺失和一致性维护等过程带来的延迟不确定性。针对长延时访问导致的性能下降问题... 近年来自动驾驶、医用仪器、智能家居等领域涌现出的新应用对DSP处理器的实时性和数据吞吐能力提出了更高的要求。多级缓存结构在DSP中的使用引入了因缓存缺失和一致性维护等过程带来的延迟不确定性。针对长延时访问导致的性能下降问题,提出将缺失缓冲区和逐出缓冲区合并,在运行时灵活分配缓冲条目的功能,以提高缓冲区利用率。针对L1 Cache、L2 Cache间一致性维护信息同步效率低的问题,提出利用无效化地址的连续性,将无效化信息非阻塞地同步到监听过滤器。测试结果表明,生产者-消费者场景下包含大量脏数据更新的程序性能提高了19.91%,32行无效化信息的同步时间从61个时钟周期降低到16个时钟周期。 展开更多
关键词 DSP 二级缓存 流水线 一致性
在线阅读 下载PDF
基于最长时延加权带宽的Wasm与容器混合函数部署优化方法
10
作者 谌燃照 李哲雄 +2 位作者 顾琳 钟梁 曾德泽 《计算机科学》 北大核心 2025年第9期170-177,共8页
容器技术因具备轻量化、易于部署和高可用等优势,在边缘服务器无感知计算平台中得到了广泛使用。然而,随着应用对低延迟需求的增长,容器的冷启动所引发的高时延问题逐渐成为系统性能的瓶颈。WebAssembly(Wasm)凭借其轻量级沙箱特性和毫... 容器技术因具备轻量化、易于部署和高可用等优势,在边缘服务器无感知计算平台中得到了广泛使用。然而,随着应用对低延迟需求的增长,容器的冷启动所引发的高时延问题逐渐成为系统性能的瓶颈。WebAssembly(Wasm)凭借其轻量级沙箱特性和毫秒级启动能力,成为容器技术在某些场景下的重要补充方案。然而,Wasm的计算性能相较容器存在劣势,尤其在需要处理函数间的复杂依赖关系时,Wasm和容器的固有优缺点使得函数部署方式和部署位置的决策变得十分困难。为解决该问题,构建了基于函数依赖关系的服务器无感知计算模型,将Wasm与容器混合部署问题转换为非线性整数规划问题。该问题随后被证明是一个NP-hard问题。为此,设计了长时延敏感的加权带宽贪心调度算法(Long-Latency-Sensitive Weighted Bandwidth Greedy Scheduling Algorithm,LLS-WBG),根据函数依赖以及前驱函数最长完成时间,加权计算服务器带宽,以优化资源利用并降低任务尾时延。基于真实世界数据的实验结果表明,在边缘计算场景下,与先进算法相比,所提出的算法能够使应用完成时间减少44.45%。 展开更多
关键词 服务器无感知计算 容器 边缘计算 WebAssembly
在线阅读 下载PDF
基于服务器无感知计算架构的并行计算通信框架
11
作者 袁雨馨 李庆文 +1 位作者 史骁 赵晓芳 《高技术通讯》 北大核心 2025年第6期590-603,共14页
随着云计算技术的发展与成熟,并行计算在云环境中得到了越来越多的实践。服务器无感知计算作为云计算中的一种新型的应用部署与计算方式,允许用户弹性分配资源并实现负载均衡,并提供了更强的可扩展性和更大的灵活性。然而,无状态的特性... 随着云计算技术的发展与成熟,并行计算在云环境中得到了越来越多的实践。服务器无感知计算作为云计算中的一种新型的应用部署与计算方式,允许用户弹性分配资源并实现负载均衡,并提供了更强的可扩展性和更大的灵活性。然而,无状态的特性导致服务器无感知计算框架并不完全适用于传统并行计算,其中通信是一个关键问题。本文提出了一个具有服务质量(quality of service,QoS)保障的通信框架FreeParallel,旨在基于服务器无感知计算中的函数即服务(function as a service,FaaS)平台构建面向并行计算的通信能力。FreeParallel结合了消息传递接口(message passing interface,MPI)并行计算编程模型,有效地保证了通信服务的质量;并采用代理模型来支持并行函数的识别和转换,并以服务形式灵活部署在多个FaaS或虚拟化平台上。此外,本研究还提出了函数间通信流量的QoS管理策略fm Clock,在保证传输公平性的前提下,实现基于请求和限制的通信原语级网络资源分配。实验结果表明,点对点通信场景下FreeParallel与虚拟化平台的覆盖网络相比传输性能略有不足,但比当前服务器无感知计算状态共享方案的传输效率有至少89.5%的提升。并且FreeParallel在集合通信场景下表现极佳,比基线方法提升了59.9%~83.1%。同时,带有fm Clock策略的FreeParallel能够实现原语级按比例分配策略,避免了不同原语间请求的交叉干扰,案例表明,策略的加入降低了应用25.0%的完成时间。 展开更多
关键词 服务器无感知计算 消息传递接口并行计算 服务质量保障 弹性资源分配
在线阅读 下载PDF
基于国产加速器的三维卷积前向算子优化
12
作者 姬晨晨 陈永青 韩孟之 《计算机工程》 北大核心 2025年第2期250-258,共9页
目前三维卷积神经网络(3D CNN)的应用场景越来越广泛,其能够从原始数据中提取更丰富、更具判别性的特征信息,在处理3D数据、特征提取和实际应用等方面具有重要意义。然而,从二维(2D)数据到3D数据的转变导致了卷积运算的数据量和计算量... 目前三维卷积神经网络(3D CNN)的应用场景越来越广泛,其能够从原始数据中提取更丰富、更具判别性的特征信息,在处理3D数据、特征提取和实际应用等方面具有重要意义。然而,从二维(2D)数据到3D数据的转变导致了卷积运算的数据量和计算量均呈指数级增长,对计算资源和时间的需求也相应增加,这会导致训练和推理过程更加耗时,特别是在处理大规模3D数据时尤为明显。针对以上问题,提出一种基于国产加速器的隐式卷积算法,对3D卷积的前向计算过程进行优化。首先,该算法结合了硬件特点和并行化思路,利用索引直接访问所需计算的数据地址,无须开辟新的内存空间,大幅节省内存开销;其次,考虑到国产加速器具有高度并行的计算结构和丰富的计算资源,适合处理大规模数据和复杂的计算任务,结合国产加速器的计算能力和架构特点,采用一系列特定的异构并行优化算法,加速3D卷积前向算子的计算过程,提高计算效率和性能。实验结果表明,自研算子性能远超国产计算平台现有算子的最优性能,在多数情况下与NVIDIA V100之间的能效比可以达到70%甚至更高。 展开更多
关键词 三维卷积 国产加速器 隐式卷积算法 索引机制 前向算子优化 并行优化算法
在线阅读 下载PDF
基于改进特征点匹配算法的徽州廊桥空间三维构建
13
作者 崔金敏 陈广 《兰州文理学院学报(自然科学版)》 2025年第2期59-63,共5页
针对徽州廊桥建筑文化如何精准、可靠传承的问题,提出基于改进特征点匹配算法的徽州廊桥空间三维重建方法,实现传统建筑风格的传承与保护.首先,基于三维激光扫描仪采集廊桥空间的点云数据并实施预处理,基于无人机搭载图像传感器采集倾... 针对徽州廊桥建筑文化如何精准、可靠传承的问题,提出基于改进特征点匹配算法的徽州廊桥空间三维重建方法,实现传统建筑风格的传承与保护.首先,基于三维激光扫描仪采集廊桥空间的点云数据并实施预处理,基于无人机搭载图像传感器采集倾斜摄影数据.其次,利用k-means算法估算倾斜摄影的特征点目标数量,以改进特征点匹配算法将廊桥的三维激光扫描数据与倾斜摄影数据融合,实现廊桥空间三维重建.实验结果显示,该方法构建的廊桥三维模型精度较高,融合后的三维数据较好诠释了徽州廊桥的真实面貌. 展开更多
关键词 徽州廊桥 激光点云 数据融合 K-MEANS算法 特征点匹配 倾斜摄影
在线阅读 下载PDF
面向物联网的分布式计算机系统架构研究
14
作者 彭建杰 《信息产业报道》 2025年第6期0002-0004,共3页
物联网作为新一代信息技术的重要组成部分,通过将大量物理设备连接到互联网,实现物与物、物与人之间的信息交互和智能化管理。文章围绕面向物联网的分布式计算机系统架构展开深入研究,分析物联网环境下分布式系统面临的挑战与需求,探讨... 物联网作为新一代信息技术的重要组成部分,通过将大量物理设备连接到互联网,实现物与物、物与人之间的信息交互和智能化管理。文章围绕面向物联网的分布式计算机系统架构展开深入研究,分析物联网环境下分布式系统面临的挑战与需求,探讨新型架构设计思路、关键技术及应用实践,旨在为构建高效、可靠、安全的物联网分布式计算机系统提供理论支撑与技术指导,推动物联网产业的蓬勃发展。 展开更多
关键词 物联网 分布式计算机系统 系统架构 边缘计算
在线阅读 下载PDF
FAST角点检测算法IP的软硬件协同测试系统
15
作者 牛致远 邓杰 +1 位作者 冯冲 施展 《佳木斯大学学报(自然科学版)》 2025年第9期5-8,20,共5页
随着SoC设计中IP核数量迅速增加,传统测试方法在成本和验证周期方面面临挑战。为提高图像算法IP核测试的效率与准确性,构建了一种基于FPGA异构计算的软硬件协同物理测试系统。系统以ZYNQ7100芯片为核心,构建软硬协同验证框架:在ARM端部... 随着SoC设计中IP核数量迅速增加,传统测试方法在成本和验证周期方面面临挑战。为提高图像算法IP核测试的效率与准确性,构建了一种基于FPGA异构计算的软硬件协同物理测试系统。系统以ZYNQ7100芯片为核心,构建软硬协同验证框架:在ARM端部署Linux系统并集成OpenCV库生成标准测试数据,借助AXI总线实现IP物理测试数据采集。所设计系统以FAST角点检测IP电路为目标进行验证,结果显示,在ZYNQ平台上实现3.22倍加速,准确率与召回率均超过95%。该系统在提高测试效率的同时,具备良好的工程实用性与优化策略参考价值。 展开更多
关键词 软硬件协同 IP核测试 FAST角点检测 异构计算
在线阅读 下载PDF
Coded Distributed Computing for System with Stragglers
16
作者 Xu Jiasheng Kang Huquan +5 位作者 Zhang Haonan Fu Luoyi Long Fei Cao Xinde Wang Xinbing Zhou Chenghu 《China Communications》 2025年第8期298-313,共16页
Distributed computing is an important topic in the field of wireless communications and networking,and its high efficiency in handling large amounts of data is particularly noteworthy.Although distributed computing be... Distributed computing is an important topic in the field of wireless communications and networking,and its high efficiency in handling large amounts of data is particularly noteworthy.Although distributed computing benefits from its ability of processing data in parallel,the communication burden between different servers is incurred,thereby the computation process is detained.Recent researches have applied coding in distributed computing to reduce the communication burden,where repetitive computation is utilized to enable multicast opportunities so that the same coded information can be reused across different servers.To handle the computation tasks in practical heterogeneous systems,we propose a novel coding scheme to effectively mitigate the "straggling effect" in distributed computing.We assume that there are two types of servers in the system and the only difference between them is their computational capabilities,the servers with lower computational capabilities are called stragglers.Given any ratio of fast servers to slow servers and any gap of computational capabilities between them,we achieve approximately the same computation time for both fast and slow servers by assigning different amounts of computation tasks to them,thus reducing the overall computation time.Furthermore,we investigate the informationtheoretic lower bound of the inter-communication load and show that the lower bound is within a constant multiplicative gap to the upper bound achieved by our scheme.Various simulations also validate the effectiveness of the proposed scheme. 展开更多
关键词 coded computation communication load distributed computing straggling effect
在线阅读 下载PDF
基于分布式计算的工业智能制造平台架构优化与应用研究
17
作者 綦孝文 《移动信息》 2025年第6期318-320,共3页
为探讨分布式计算在工业智能制造平台系统中的架构设计与优化路径,文中从分布式计算及其架构出发,基于工业智能制造平台的架构特点,梳理了基于分布式计算的工业智能制造平台构建与性能优化路径,进而探讨了基于分布式计算的工业智能制造... 为探讨分布式计算在工业智能制造平台系统中的架构设计与优化路径,文中从分布式计算及其架构出发,基于工业智能制造平台的架构特点,梳理了基于分布式计算的工业智能制造平台构建与性能优化路径,进而探讨了基于分布式计算的工业智能制造平台的架构优化策略,以供参考. 展开更多
关键词 分布式计算 工业智能制造平台 架构优化
在线阅读 下载PDF
基于联合损失和3D-3D对比学习的分子活性预测模型
18
作者 张强 张贝祎 +2 位作者 张连伟 牛东江 李臻 《青岛大学学报(自然科学版)》 2025年第1期30-36,共7页
目前的分子活性预测方法对小数据集的泛化能力不足,缺少对分子空间几何结构信息的充分利用,且现有的基于对比学习的分子活性预测方法在微调过程中缺少高维空间的相互联系。为此提出了一种基于图对比学习的自监督学习模型,同时使用了基... 目前的分子活性预测方法对小数据集的泛化能力不足,缺少对分子空间几何结构信息的充分利用,且现有的基于对比学习的分子活性预测方法在微调过程中缺少高维空间的相互联系。为此提出了一种基于图对比学习的自监督学习模型,同时使用了基于3D分子图的3DGCN和SchNet模型,在下游任务中,引入由对比学习损失和标签预测损失组成的联合损失函数,优化模型的特征空间,加强模型高维空间的联系。实验结果表明,模型在ESOL、FreeSolv和QM7数据集上都取得了较好的性能,与第二优模型相比,性能分别提高了10.95%、4.60%和29.26%,且具有可解释性,可以合理地编码分子特征。 展开更多
关键词 空间几何结构 对比学习 联合损失
在线阅读 下载PDF
高性能并行计算的发展历程 被引量:2
19
作者 陈国良 《计算机科学》 CSCD 北大核心 2024年第1期1-3,共3页
并行计算是相对于串行计算而言的,它是将一个计算任务分解成若干相对独立的子任务,然后用若干个处理器对其并行求解。使用并行计算最直接的目的就是提高问题的求解速度以快速完成原问题的解。非数值计算是相对数值计算而言的,它研究的... 并行计算是相对于串行计算而言的,它是将一个计算任务分解成若干相对独立的子任务,然后用若干个处理器对其并行求解。使用并行计算最直接的目的就是提高问题的求解速度以快速完成原问题的解。非数值计算是相对数值计算而言的,它研究的是如何将计算科学中一些不能直接使用数学函数解决的问题并行求解。90年代开始,我带领团队系统地开展了此方面的研究,首先是奠定了所需的理论基础,并逐渐形成了完善的学科体系和应用示范。在此过程中,我们还积极倡导交叉学科研究,及时关注学科前沿技术,并且坚持学术研究要服务于国民经济主战场。在整个研究过程中,我们一方面积极开展国际学术交流,创办国际学术会议和专业期刊;另一方面坚持自力更生,研制自主可控的国产高性能计算机,创建科教平台为普及中国高性能计算机教育服务。 展开更多
关键词 并行计算 高性能计算 国产计算机 学科体系
在线阅读 下载PDF
混合云环境面向安全科学工作流数据布局策略 被引量:2
20
作者 苏明辉 林兵 +1 位作者 卢宇 王素云 《计算机工程与设计》 北大核心 2024年第7期2004-2012,共9页
为解决混合云环境下科学工作流数据布局问题,在考虑数据的安全需求的前提下,以优化跨数据中心传输时延为目标,提出了一种混合云环境下面向安全的科学工作流布局策略。分析数据集的安全需求以及数据中心所能提供的安全服务,提出安全等级... 为解决混合云环境下科学工作流数据布局问题,在考虑数据的安全需求的前提下,以优化跨数据中心传输时延为目标,提出了一种混合云环境下面向安全的科学工作流布局策略。分析数据集的安全需求以及数据中心所能提供的安全服务,提出安全等级分级规则;设计并提出基于遗传算法和模拟退火算法的自适应粒子群优化算法(adaptive particle swarm optimization algorithm based on SA and GA,SAGA-PSO),避免算法陷入局部极值,有效提高种群多样性;与其它经典布局算法对比,基于SAGA-PSO的数据布局策略在满足数据安全需求的同时能够大大降低传输时延。 展开更多
关键词 混合云 科学工作流 数据布局 安全分级 时延优化 遗传粒子群优化算法 模拟退火
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部