期刊文献+
共找到4,303篇文章
< 1 2 216 >
每页显示 20 50 100
基于Matrix Core的高性能多维FFT设计与优化 被引量:1
1
作者 陆璐 祝松祥 +2 位作者 田卿燕 林海山 郭逸劼 《华南理工大学学报(自然科学版)》 北大核心 2025年第3期20-30,共11页
快速傅里叶变换(FFT)算法广泛应用于科学计算等领域。为了充分挖掘图形处理器(GPU)的计算能力并进一步提高FFT的计算效率,该文针对矩阵形式的Stockham FFT,提出了一种基于Matrix Core的高性能多维FFT计算方案。在计算优化方面,该方案利... 快速傅里叶变换(FFT)算法广泛应用于科学计算等领域。为了充分挖掘图形处理器(GPU)的计算能力并进一步提高FFT的计算效率,该文针对矩阵形式的Stockham FFT,提出了一种基于Matrix Core的高性能多维FFT计算方案。在计算优化方面,该方案利用Matrix Core加速FFT计算中的矩阵乘运算,同时通过编译器内部指令完成小粒度的矩阵乘加,使得Matrix Core支持更多尺寸的FFT计算。在内存优化方面,该方案使用2层迭代策略,以充分利用共享内存,减少与全局内存的数据交换;根据Matrix Core的矩阵数据在各个线程寄存器中的分布规律,直接在寄存器上完成FFT计算中大量存在的矩阵逐元素乘操作;通过对共享内存中的数据进行重排来缓解存储体冲突,并采用双缓冲策略缓解访存瓶颈。该文还提出了高效的矩阵转置策略,以加速多维FFT计算。在AMD MI250 GPU平台上将该方案与GPU上主流的高性能FFT计算库rocFFT和VkFFT进行了比较实验,结果表明:该方案在AMD MI250上的1维、2维和3维FFT平均计算效率均优于rocFFT和VkFFT,3维FFT的平均计算效率为rocFFT的1.5倍,为VkFFT的2.0倍,具有较好的性能提升;mcFFT的计算精度与rocFFT和VkFFT保持在相同水平。 展开更多
关键词 图形处理器 Matrix Core 快速傅里叶变换 矩阵乘法
在线阅读 下载PDF
基于LoRa通信与传感技术的储粮温度变频通风测控系统
2
作者 甄彤 李雄飞 +1 位作者 吕宗旺 孙福艳 《中国农机化学报》 北大核心 2025年第11期60-67,共8页
针对现有储粮温度测控系统传输距离短、灵活性不足,以及传统机械通风效率低、功耗高等问题,提出一种结合LoRa(Long Range)扩频通信与传感网络的储粮通风系统。系统采用分布式架构设计,由从站监测部分与主站核心控制部分构成。从站集成DS... 针对现有储粮温度测控系统传输距离短、灵活性不足,以及传统机械通风效率低、功耗高等问题,提出一种结合LoRa(Long Range)扩频通信与传感网络的储粮通风系统。系统采用分布式架构设计,由从站监测部分与主站核心控制部分构成。从站集成DS18B20数字温度传感器网络,基于单总线拓扑(1—Wire)、二叉树遍历算法与CRC—8—MAXIM校验实现储粮过程中多节点温度数据采集;系统在传统通风控制中引入风机变频控制技术,主站通过Modbus RTU协议调控变频器(Variable-frequency Drive,VFD)频率,驱动三相离心风机动态调速;结合RS232通信接口调控控制面板,主站基于FreeRTOS实时操作系统,实现多任务协同处理,满足系统控制的实时性与稳定性。主从站通过LoRa扩频技术(470 MHz频段、22 dBm发射功率、扩频因子SF=12)保障远距离无线通信可靠性,实现复杂粮仓环境的有效覆盖。试验表明,采集温度数据平均偏差率为0.13%,最大偏差≤±0.5℃,符合国家粮油储藏行业标准;LoRa通信在空旷与模拟粮仓环境下1 km内通信成功率分别达94.2%、86%以上,显著优于传统无线通信技术;系统变频通风控制策略能够根据不同的粮情动态调控风机功率(通风响应时间≤5 s),相比于恒定电源频率控制风机方法通风效果提高,节能降耗。 展开更多
关键词 LoRa扩频技术 储粮系统 变频通风控制 传感网络 远距离无线通信
在线阅读 下载PDF
基于北斗时空基准服务的工业互联网赋能平台研究
3
作者 王伟 董国栋 +2 位作者 冀宏斌 张亚宁 周中华 《计算机应用与软件》 北大核心 2025年第3期386-391,共6页
以“北斗赋能智能制造更精准”为赋能应用为出发点,通过北斗卫星导航、授时、短报文通信等天基资源及物联网、云计算等技术的应用,创新性构建基于北斗时空基准服务的工业互联网赋能平台,解决工业互联网各系统因缺少高精度时空信息而产... 以“北斗赋能智能制造更精准”为赋能应用为出发点,通过北斗卫星导航、授时、短报文通信等天基资源及物联网、云计算等技术的应用,创新性构建基于北斗时空基准服务的工业互联网赋能平台,解决工业互联网各系统因缺少高精度时空信息而产生的协同不精密、分级时频不同步等隐匿性问题,以远洋船运和化工园区场景开展赋能平台应用验证。验证结果表明,北斗时空基准服务赋能工业互联网生产应用效果显著,实现船舶的精准能效管理并使化工园区内实现人、物、区域功能系统之间无缝连接与协同联动。 展开更多
关键词 北斗全球服务 北斗高精度时空信息 工业互联网 赋能平台
在线阅读 下载PDF
基于大语言模型的大数据技术教学知识库系统 被引量:1
4
作者 林峰 《武汉工程职业技术学院学报》 2025年第2期37-42,共6页
随着人工智能技术的快速发展,大语言模型在教育领域展现出巨大潜力。设计并实现了一种基于大语言模型的高职大数据技术教学知识库系统,通过本地部署开源大语言模型,整合海量教学资源,提供智能化的知识检索和个性化学习辅助功能。系统采... 随着人工智能技术的快速发展,大语言模型在教育领域展现出巨大潜力。设计并实现了一种基于大语言模型的高职大数据技术教学知识库系统,通过本地部署开源大语言模型,整合海量教学资源,提供智能化的知识检索和个性化学习辅助功能。系统采用多源数据清洗、标准化处理,构建结构化的知识库,并借助大语言模型的强大自然语言处理能力,提升教学效率与教学质量。实验结果表明,该系统在提升高职教育大数据技术专业的教学模式创新及教学质量方面具有较大优势,知识库构建有效率达95%以上,系统平均响应速度在1s内。 展开更多
关键词 大语言模型 高职教育 大数据技术 教学知识库 智能化检索 人工智能
在线阅读 下载PDF
基于Matrix Core的小尺寸批量矩阵乘法设计与优化
5
作者 陆璐 赵容 +1 位作者 梁志宏 索思亮 《华南理工大学学报(自然科学版)》 北大核心 2025年第9期48-58,共11页
通用矩阵乘法(GEMM)是线性代数中最重要的运算,来自不同科学领域的许多应用程序都将其关键部分转换为使用GEMM的形式。GEMM广泛应用于大模型、机器学习、科学计算和信号处理等领域。特别是半精度的批处理GEMM(即FP16)一直是许多深度学... 通用矩阵乘法(GEMM)是线性代数中最重要的运算,来自不同科学领域的许多应用程序都将其关键部分转换为使用GEMM的形式。GEMM广泛应用于大模型、机器学习、科学计算和信号处理等领域。特别是半精度的批处理GEMM(即FP16)一直是许多深度学习框架的核心操作。目前AMD GPU上半精度批处理GEMM的访存和计算利用率不足,急需优化。为此,该文提出了一种半精度批处理GEMM(HGEMM)的图形处理器(GPU)优化方案。分块策略方面,根据输入矩阵块大小为线程分配相同的访存量和计算量,同时线程计算多个矩阵乘法,以提高计算单元的利用率。访存优化方面,以多读数据为代价,为每个线程分配相同访存量以便于编译器优化,保证访存和计算时间相互掩盖。对于矩阵尺寸小于16的极小尺寸批处理HGEMM,该文利用4×4×4的Matrix Core及其对应的分块方案,在提升访存性能的同时减少Matrix Core计算资源的浪费,并提供是否使用共享内存的选项来达到最高性能。在AMD GPU MI210平台上,将该方案与rocBLAS的2个算子进行性能对比,结果表明:该方案在AMD GPU MI210上的平均性能为rocBLASHGEMMBatched的4.14倍,rocBLASGEMMExBatched的4.96倍;对于极小尺寸批处理HGEMM,平均性能为rocBLASHGEMMBatched的18.60倍,rocBLASGEMMExBatched的14.02倍。 展开更多
关键词 图形处理器 Matrix Core 矩阵乘法 访存优化
在线阅读 下载PDF
一种计算存储设备中的字符串并行匹配算法
6
作者 张东阳 刘东石 +2 位作者 苏攀 马玉梅 王其乐 《计算机技术与发展》 2025年第8期25-35,共11页
传统的字符串匹配算法在遭遇最不利情况时时间消耗显著攀升,成为性能瓶颈,此外还往往伴随大量数据的频繁迁移与操作,当面临数据密集型应用和输入输出(IO)性能限制时,其局限性愈发凸显。针对传统字符串匹配解决方案中的数据移动量大、最... 传统的字符串匹配算法在遭遇最不利情况时时间消耗显著攀升,成为性能瓶颈,此外还往往伴随大量数据的频繁迁移与操作,当面临数据密集型应用和输入输出(IO)性能限制时,其局限性愈发凸显。针对传统字符串匹配解决方案中的数据移动量大、最差情况下的性能瓶颈等问题,提出了基于计算存储设备(Computational Storage Device,CSD)的解决方法。该方法通过在存储器内部部署嵌入式处理引擎,将计算移动到存储端,大幅减少了数据在处理单元和存储单元之间的传输,从而显著提升了整体计算效率。将现场可编程门阵列(Field Programmable Gate Array,FPGA)作为CSD嵌入式处理引擎,利用其并行处理能力,设计了一种高效的精确字符串并行匹配算法。在FPGA读取数据的同时,完成字符串匹配工作,消除了字符串匹配过程中的额外时间开销。实验结果表明,基于CSD的解决方法展现出了显著的性能优势,为大数据环境下的字符串匹配问题提供了一种新的解决方案。 展开更多
关键词 字符串匹配 计算存储设备 现场可编程门阵列 并行 算法
在线阅读 下载PDF
基于Lora智能手环健康监控实验设计与探索
7
作者 崔凯 林驰 《实验室科学》 2025年第2期16-19,23,共5页
针对以往的实验实践教学过程中面临的实验内容单一、学生动手能力弱等问题,将物联网的相关技术引入到实验教学中。利用物联网中的Lora技术的干扰能力强,覆盖范围大,能耗低等突出特点,实现一个面向在校生的Lora智能手环,基于B/S模式校园... 针对以往的实验实践教学过程中面临的实验内容单一、学生动手能力弱等问题,将物联网的相关技术引入到实验教学中。利用物联网中的Lora技术的干扰能力强,覆盖范围大,能耗低等突出特点,实现一个面向在校生的Lora智能手环,基于B/S模式校园健康监控的实验教学设计。这种实验教学设计模式不仅加强学生对物联网相关技术的应用,增加学生的学习热情,加强问题的解决能力,而且有助于丰富实验教学的内容,进而实现更好的实验教学目标和效果。 展开更多
关键词 物联网 Lora B/S 智能手环 健康监控系统
在线阅读 下载PDF
组态式智能家居人机交互系统的设计与实现
8
作者 杨萍 房可佳 《智能计算机与应用》 2025年第2期153-161,共9页
智能家居的人机交互系统影响用户体验,而传统的菜单式的交互页面存在着画面固定、操作不直观等问题,并且系统通用性较差,实时性也不高。针对上述问题,本文开发了一种基于云平台的组态式智能家居人机交互系统,设计了包括页面、数据和交... 智能家居的人机交互系统影响用户体验,而传统的菜单式的交互页面存在着画面固定、操作不直观等问题,并且系统通用性较差,实时性也不高。针对上述问题,本文开发了一种基于云平台的组态式智能家居人机交互系统,设计了包括页面、数据和交互控制组件在内的组件,以此为基础实现了图形化的界面构建。针对智能家居设备数据多源异构的特点,采用MongoDB和Redis相结合的存储方案进行分类存储,并以Redis+WebSocket的方式实现数据的实时推送。实验表明,系统功能正确,可实现智能场景搭建、设备交互,实时更新设备数据及统计能耗。 展开更多
关键词 智能家居 人机交互系统 云平台 组态式 实时推送
在线阅读 下载PDF
面向数据密集型应用的近数据处理架构设计 被引量:1
9
作者 谢洋 李晨 陈小文 《计算机工程与科学》 北大核心 2025年第5期797-810,共14页
大数据时代,多核处理器在处理数据密集型应用时,面临着数据局部性低、访存延迟高和内核计算效率低等挑战。近数据处理对于降低访存延迟、提高内核计算效率具有重要潜力。设计了一种计算访存松耦合的近数据处理架构(LcNDP),部署在多核处... 大数据时代,多核处理器在处理数据密集型应用时,面临着数据局部性低、访存延迟高和内核计算效率低等挑战。近数据处理对于降低访存延迟、提高内核计算效率具有重要潜力。设计了一种计算访存松耦合的近数据处理架构(LcNDP),部署在多核处理器的共享缓存端和内存端。一方面通过迁移内核的访存任务,实现内核计算与访存的并行,隐藏访存开销;另一方面通过近数据计算单元,处理流数据计算,降低内核计算量和访存开销。实验结果表明LcNDP相较于传统多核架构,平均延迟降低了43%,与传统近数据处理的多核架构相比平均延迟降低了23%。 展开更多
关键词 近数据 数据密集型应用 计算机体系结构 多核处理器
在线阅读 下载PDF
一机多芯模块化服务器系统 被引量:1
10
作者 高显扬 吴安 +2 位作者 慈潭龙 李金锋 赵伟康 《计算机工程与应用》 北大核心 2025年第5期344-354,共11页
面向多样化应用场景需求和多元算力融合挑战,创新“一机多芯模块化服务器”软硬件体系结构。以服务器系统互连交换为中心,将多元计算单元和系统硬件资源进行解耦池化。通过标准化接口定义和统一控制与管理实现底层硬件差异化集成,实现... 面向多样化应用场景需求和多元算力融合挑战,创新“一机多芯模块化服务器”软硬件体系结构。以服务器系统互连交换为中心,将多元计算单元和系统硬件资源进行解耦池化。通过标准化接口定义和统一控制与管理实现底层硬件差异化集成,实现多元算力协同、资源按需调配、系统统一调度与管理。关键技术包括高性能无阻塞总线互连交换、池化单元长距离低延时互连、内存和存储资源解耦池化、整机系统监控管理和系统资源拓扑管理等。一机多芯模块化服务器系统,可实现全部硬件解耦和弹性组合,实现在服务器系统内兼容多元算力模组以及多元算力和共享资源按需在线调配。实验结果显示一机多芯系统实现了均衡的16卡GPU低延时通信和系统性能线性提升,可面向AI场景实现异构算力按需分配;实现了亚微秒级远端内存访问,扩展了内存带宽和容量,有效提升系统性能;实现了细粒度存储池化资源共享,满足多主机高并发存储应用需求。 展开更多
关键词 一机多芯 模块化服务器 融合架构 硬件解耦 资源池化 异构算力
在线阅读 下载PDF
移动设备日志结构文件系统综述
11
作者 杨梨花 董勇 +3 位作者 邬会军 谭支鹏 王芳 卢凯 《计算机研究与发展》 北大核心 2025年第1期58-74,共17页
NAND闪存(NAND flash)因为其大容量、轻便、抗震等优异特性,被广泛使用于移动设备.面向闪存特性设计的闪存友好型文件系统(flash friendly file system,F2FS)是典型的日志结构文件系统(log-structured file system,LFS),它采用日志结构... NAND闪存(NAND flash)因为其大容量、轻便、抗震等优异特性,被广泛使用于移动设备.面向闪存特性设计的闪存友好型文件系统(flash friendly file system,F2FS)是典型的日志结构文件系统(log-structured file system,LFS),它采用日志结构写机制提升了随机写性能,使用前滚恢复技术实现快速的一致性保护,经常被用作移动设备的文件系统.文件系统因碎片化和段清理问题导致性能下降,而日志结构文件系统的异地更新机制和移动应用的高并发随机同步小写模式进一步加剧了碎片化,导致I/O请求响应变慢、设备运行卡顿.首先介绍了移动设备日志结构文件系统的相关概念和内容,随后总结了日志结构文件系统碎片化和段清理问题的研究现状.一方面分析了碎片产生的原因与影响,从预防碎片产生和重整碎片2个角度总结了减少碎片的研究工作.另一方面分析了冷热数据混合对段清理的影响,从静态分类和动态分类2方面总结了冷热数据区分技术的研究现状,从管理数据分布和调整段清理时机、频率、对象2个角度总结了段清理的研究现状.最后展望了移动设备日志结构文件系统研究的主要挑战和未来研究工作. 展开更多
关键词 日志结构文件系统 移动存储 文件碎片 空闲空间碎片 段清理 冷热数据区分
在线阅读 下载PDF
计算平台运维数据融合与查询引擎设计与实现
12
作者 程延福 胡庆宝 +1 位作者 欧歌 石京燕 《计算机工程与设计》 北大核心 2025年第9期2644-2650,共7页
针对大规模计算平台运维数据多、访问慢的问题,研发高效查询引擎,融合多源数据,通过缓存机制、加速算法为应用系统提供近实时的查询服务。引擎屏蔽不同底层存储数据格式差异,支持多数据源接入;采用长、短期结合缓存策略,提升命中率;通... 针对大规模计算平台运维数据多、访问慢的问题,研发高效查询引擎,融合多源数据,通过缓存机制、加速算法为应用系统提供近实时的查询服务。引擎屏蔽不同底层存储数据格式差异,支持多数据源接入;采用长、短期结合缓存策略,提升命中率;通过定制数据格式和聚合算法,提高查询速度。基于查询引擎,研发了面向大规模计算平台实时资源查询系统。目前系统已在国家高能物理数据中心部署,提供便捷高效的资源查询服务。 展开更多
关键词 运维数据 缓存 聚合查询 数据分析 格式化 实时性 查询优化
在线阅读 下载PDF
面向多值逻辑计算的基于CNFET的三元逻辑单元库设计
13
作者 王蕾 王洪 +3 位作者 王耀 朱晓章 杨智杰 唐玉华 《计算机工程与科学》 北大核心 2025年第7期1152-1161,共10页
相比二值逻辑,三元逻辑具有更多的逻辑状态,因而基于三元逻辑的电路具有面积小、利用率高、传输效率高和安全性强等优点。利用常见的碳纳米管场效应晶体管(CNFET)搭建了基本三元逻辑门电路,设计了一个逻辑完备的三元逻辑库,提出了减小CN... 相比二值逻辑,三元逻辑具有更多的逻辑状态,因而基于三元逻辑的电路具有面积小、利用率高、传输效率高和安全性强等优点。利用常见的碳纳米管场效应晶体管(CNFET)搭建了基本三元逻辑门电路,设计了一个逻辑完备的三元逻辑库,提出了减小CNFET的物理信道长度L ch和源/漏极长度L s/L d的方法来降低转换延迟时间,还以构建的三元逻辑库为基础,设计搭建了一个一位乘法器电路,通过HSPICE仿真,验证了各电路的性能以及降低转换延迟时间的方法的有效性。与之前的三元1-bit乘法器相比,所设计的电路平均转换延迟时间降低了47 ps。在实际电路应用中,所构建的三元逻辑单元库可以用于更高阶电路的电路综合和物理设计,提出的降低三元电路转换延迟时间的方法为未来以高性能微处理器和人工智能芯片为代表的超大规模集成电路提供了思路。 展开更多
关键词 碳纳米管场效应管 三元逻辑 多值逻辑
在线阅读 下载PDF
基于点聚合的多类别城市时空大数据交互式可视化方法
14
作者 黎世骄 韩博洋 +3 位作者 孟垂实 张晓龙 李天瑞 郑宇 《计算机应用》 北大核心 2025年第11期3601-3608,共8页
针对大规模多类别城市时空数据可视化管理难、定位效率低的问题,提出基于点聚合的多类别城市时空大数据交互式可视化方法。首先,分别提出基于地理位置与基于地理层级的高效聚合方法,满足政务人员在不同场景下的高效可视化管理需求;其次... 针对大规模多类别城市时空数据可视化管理难、定位效率低的问题,提出基于点聚合的多类别城市时空大数据交互式可视化方法。首先,分别提出基于地理位置与基于地理层级的高效聚合方法,满足政务人员在不同场景下的高效可视化管理需求;其次,在高效点聚合功能基础上,提出条件解析算法实现对时空条件和类目显隐的实时解析转换,提高数据定位效率;最后,采用北京市27万条城市实体数据进行地理层级解析算法与聚合交互实验。实验结果表明,在不同场景下,所提出的2个聚合方法的平均耗时比K-means方法分别缩短了约69.66%和63.15%,充分说明了系统存储数据时数据处理与聚合服务的高效性与稳定性;而且该聚合应用服务目前已成功在某城市治理项目示范应用,支撑了百万级城市数据聚合服务,具有较高的可用性。 展开更多
关键词 点聚合 地理层级解析 人机交互 可视化管理系统 时空数据
在线阅读 下载PDF
分布式无证书网络身份系统的关键技术研究构想和成果展望
15
作者 张小松 曹晟 +4 位作者 陆天波 杨坤 桂勋 谢国涛 牛伟纳 《工程科学与技术》 北大核心 2025年第3期1-10,共10页
随着万物互联的持续演进与深化,工业互联网、能源互联网、车联网等数字业务规模不断扩大。同时,各类软硬件设备与系统逐渐呈现智能化和复杂化,中心化身份认证方法面临的性能问题和安全威胁日益突出,适用于分布式无证书网络身份认证的技... 随着万物互联的持续演进与深化,工业互联网、能源互联网、车联网等数字业务规模不断扩大。同时,各类软硬件设备与系统逐渐呈现智能化和复杂化,中心化身份认证方法面临的性能问题和安全威胁日益突出,适用于分布式无证书网络身份认证的技术和平台缺失。为有效应对分布式网络身份认证的严峻挑战,研究分布式无证书身份认证基础理论体系和应用模式,包括认证架构、密钥管理、硬件增强、并行执行、集成应用等。本研究针对分布式无证书网络身份认证的3个科学问题:密钥系统安全高效管理、海量接入硬件加速认证、智能合约并行优化运行;围绕5大课题研究方向:高性能无证书的网络身份认证技术与架构、无证书的分布式密钥管理、高并行分布式终端接入硬件增强、多层级并行化智能合约虚拟机、分布式大规模物联网身份认证应用与验证;重点突破10类关键技术:高性能分布式身份标识与共识技术,无证书身份认证协议族与网络架构技术,基于智能合约的无证书密钥自动化管理技术,可持续抗攻击的分布式密钥生成、分发及回收技术,内生安全的高性能硬件层级构建技术,异构终端跨域安全接入一体化硬件加速技术,智能合约并行化协处理架构技术,智能合约虚拟机优化调度技术,轻量无证书公钥标识框架技术,基于国密的物联网标识身份管理技术;研发5种主要系统/工具:设备数字身份全流程管理系统、密钥全生命周期管理系统、硬件增强的高性能终端并发接入系统、基于国产芯片的智能合约协处理器系统、大规模分布式数字身份系统应用检测评估工具。面向能源物联网、车联网等典型工业互联网业务的分布式无证书环境下网络身份认证场景,构建具备基于国密和物联网标识认证的终端设备可信身份、安全接入、安全管控等功能的分布式大规模物联网身份认证应用平台。建立分布式无证书环境下网络身份标识、共识、集成、应用全过程的关键技术体系。研究成果从数字身份安全层面保障国家数字经济高质量安全发展,支撑中国网络空间安全与治理重大战略实施,有效鉴别对中国关键信息基础设施的访问与入侵,对于提升国家网络安全和信息化有重要意义。 展开更多
关键词 网络空间安全 区块链 无证书 密钥管理 硬件增强 并行处理 身份认证
在线阅读 下载PDF
基于gem5的CXL内存池系统设计与实现
16
作者 孟凡丰 王子聪 +4 位作者 张金涛 王彦景 欧洋 吴利舟 肖侬 《计算机工程》 北大核心 2025年第3期180-188,共9页
大数据时代的各类数据中心应用程序对大规模数据的存储与计算需求越来越大,海量数据的访问开销成为限制应用程序性能的主要瓶颈,计算快速链路(CXL)互联协议的出现为这一问题提供了新的解决思路。提出一种基于CXL的内存池系统软硬件设计... 大数据时代的各类数据中心应用程序对大规模数据的存储与计算需求越来越大,海量数据的访问开销成为限制应用程序性能的主要瓶颈,计算快速链路(CXL)互联协议的出现为这一问题提供了新的解决思路。提出一种基于CXL的内存池系统软硬件设计。在硬件层面,基于CXL扩展内存协议,在系统结构模拟器gem5上构建CXL扩展内存设备。通过将设备内存暴露在中央处理器(CPU)地址空间内,使得CPU可以直接使用load/store指令访问设备内存。在操作系统层面,编写CXL设备的驱动程序,为管理和访问设备提供了完整的软件栈。通过在用户态使用memkind库整合主机与设备内存,从而向应用程序提供统一的内存视图。通过gem5的全系统模式搭建完整的CXL扩展内存池原型系统,对系统进行全面的性能评估。使用基准测试membench和STREAM对主机本地动态随机存取内存(DRAM)与主机管理设备内存(HDM)进行了延迟和带宽的对比分析,实验结果显示:HDM延迟约为DRAM的1.5倍,HDM的带宽约为DRAM的50%~63%。此外,在DRAM和HDM上运行了真实的键值存储引擎Viper,发现在DRAM容量受限的场景下,使用扩展的HDM有2~7倍的性能提升。 展开更多
关键词 gem5模拟器 LINUX驱动 快速计算链路 内存池 数据中心
在线阅读 下载PDF
面向SCSI子系统的用户空间存储架构设计
17
作者 郝栋栋 高聪明 舒继武 《计算机研究与发展》 北大核心 2025年第3期633-647,共15页
近年来存储行业经历了巨大的变革,以固态硬盘(solid state drive, SSD)为代表的半导体存储设备迅猛发展,在性能上显著超越了通过磁头移动寻址的机械硬盘(hard disk drive, HDD).目前支持SSD的2种协议主要包括非易失性内存主机控制器接... 近年来存储行业经历了巨大的变革,以固态硬盘(solid state drive, SSD)为代表的半导体存储设备迅猛发展,在性能上显著超越了通过磁头移动寻址的机械硬盘(hard disk drive, HDD).目前支持SSD的2种协议主要包括非易失性内存主机控制器接口规范(nonvolatile memory express, NVMe)协议与串行SCSI(serial attached small computer system interface, SAS)协议,即SAS. NVMe是专为SSD设计的高性能存储协议,能够很大限度地发挥SSD的性能;而SAS协议则充分考虑数据中心的需求,在提供高可靠性与高可扩展性的同时,兼顾了系统性能与成本的平衡.相对于日益增速的存储介质,针对慢速存储设备所设计的软件栈在一次I/O过程中所耗费的时间开销愈发显著.针对该问题学界及工业界都相继提出了众多解决方案,例如Intel提出的高性能存储开发包(storage performance development kit, SPDK)通过将设备驱动实现在用户空间,并采用轮询感知I/O完成等方式大幅度缩短了NVMe SSD对应用程序的响应时间,极大地提升了整个系统的整体性能.然而之前的研究工作针对SAS SSD存储软件栈的优化非常有限,为此在用户空间实现了针对SAS SSD的软件栈优化.实验结果表明,该优化能够有效缩短存储设备对应用程序的响应时间,提高应用对存储设备的访存效率.此外,为了准确评估I/O栈中存储设备的时间开销,硬件性能测试工具HwPerfIO被提出,能够消除大部分软件开销的影响以测得更加准确的存储设备性能. 展开更多
关键词 固态硬盘 HwPerfIO SAS协议 I/O栈 用户空间驱动
在线阅读 下载PDF
支持上下文感知的图结构混合访问控制模型
18
作者 陈函 袁凌云 +2 位作者 张黔会 戴晖 保昊辰 《计算机应用研究》 北大核心 2025年第5期1490-1499,共10页
针对现有访问控制模型在高负载情况下性能不足、缺乏对上下文信息的综合考虑等问题,提出一种支持上下文感知的图结构访问控制模型G-RABAC(graph-based role and attribute-based access control)。首先,G-RABAC结合RBAC(role-based acce... 针对现有访问控制模型在高负载情况下性能不足、缺乏对上下文信息的综合考虑等问题,提出一种支持上下文感知的图结构访问控制模型G-RABAC(graph-based role and attribute-based access control)。首先,G-RABAC结合RBAC(role-based access control)与ABAC(attribute-based access control)模型,将基于ABAC的访问控制策略可视化为授权图,定义角色间的关系为特殊的主体属性,实现了属性和上下文信息的高效管理。其次,构建了基于G-RABAC的访问控制框架,并设计了基于上下文的访问控制决策算法和风险感知算法,实现了支持多维上下文感知的访问控制。在此基础上,集成区块链和G-RABAC模型,设计了用户身份合法性验证合约,结合Web3.0技术有效监控和处理用户访问行为,提升了访问控制的安全性和透明性。实验结果表明,G-RABAC模型的访问控制效率显著提升,与所选基线方案相比,访问控制时间开销基本维持在230 ms以内,且能够在多用户并发场景中支持安全且细粒度的访问控制,具备更高的灵活性和扩展性。 展开更多
关键词 混合访问控制 图模型 上下文感知 区块链
在线阅读 下载PDF
基于微控制器的便携式原位拉曼光谱仪系统设计
19
作者 张庆 薛萌 郭汉明 《电子科技》 2025年第5期38-45,共8页
为了满足原位拉曼光谱分析系统小型化、便携化以及高性能和稳定性的需求,解决在化工检测、环境测量等现场使用单一且固定式的上位机时携带不便的问题,文中结合项目需求设计了一种基于ARM(Advanced RISC Machine)架构的STM32光谱仪主控... 为了满足原位拉曼光谱分析系统小型化、便携化以及高性能和稳定性的需求,解决在化工检测、环境测量等现场使用单一且固定式的上位机时携带不便的问题,文中结合项目需求设计了一种基于ARM(Advanced RISC Machine)架构的STM32光谱仪主控系统。将STM32F4微控制器作为整个系统的核心控制单元,基于STM32的标准库函数编写控制程序,从而对整个供电系统以及各个子系统进行管理与控制。基于控制系统的硬件及软件完成电源智能管理、激光器驱动控制、双上位机控制以及光谱数据采集等功能。测试结果表明,在该控制系统协调下的光谱仪积分时间0~65536 ms可调,能够满足项目需求,具有较好的拉曼光谱测量效果。在实际应用中,该系统主板可接入多种类型的CCD(Charge-Coupled Device)并被应用于不同的光谱仪内,具有通用性强、主板成本低、体积小、工作稳定、电路集成度高以及可拓展性强等优点,在拉曼光谱仪的应用中具有较高的应用价值。 展开更多
关键词 拉曼光谱仪 STM32 控制系统 光谱测量 多上位机 电源管理 子模块控制 便携式
在线阅读 下载PDF
物联网驱动下的高校教学空间交互与管理系统构建与优化策略
20
作者 杨雁英 郑传梁 +1 位作者 刘传尧 曹文辉 《物联网技术》 2025年第20期157-162,共6页
在高等教育持续发展的背景下,教学空间的精细化管理与高效利用成为影响教学质量的关键要素。本研究聚焦于高校教学空间的管理现状,深入剖析现存问题,并结合物联网、大数据及人工智能等前沿技术,系统阐述教学空间交互与管理系统的构建原... 在高等教育持续发展的背景下,教学空间的精细化管理与高效利用成为影响教学质量的关键要素。本研究聚焦于高校教学空间的管理现状,深入剖析现存问题,并结合物联网、大数据及人工智能等前沿技术,系统阐述教学空间交互与管理系统的构建原则和功能分析。通过精准的需求分析与性能优化,该系统实现了高校教学空间资源的智能化调配与互动管理,有效提升了资源利用率与管理效能,为高校教学空间的信息化管理提供了实践指导,同时为智慧校园建设提供了创新性的理论框架与应用案例,推动了教育信息化的深度发展。 展开更多
关键词 物联网 智慧校园 教学空间 空间管理 空间预约 智能交互 NFC交互
在线阅读 下载PDF
上一页 1 2 216 下一页 到第
使用帮助 返回顶部