期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Cache功能模拟的GPU内存系统建模
1
作者
袁福焱
郝晓宇
+3 位作者
曹振伟
张森
陈俊仕
安虹
《小型微型计算机系统》
北大核心
2026年第2期477-486,共10页
重用距离分析是一种常用的基于Trace的Cache性能分析方法.然而,随着现代GPU微架构的持续演进,现有基于重用距离理论的GPU内存分析模型由于简化了过多硬件特性,导致了显著的失真.为此,本文提出一种基于Trace和Cache功能模拟的GPU内存系...
重用距离分析是一种常用的基于Trace的Cache性能分析方法.然而,随着现代GPU微架构的持续演进,现有基于重用距离理论的GPU内存分析模型由于简化了过多硬件特性,导致了显著的失真.为此,本文提出一种基于Trace和Cache功能模拟的GPU内存系统建模框架,针对现代GPU的关键内存特性进行了精确建模,包括Sector Cache、自适应L1缓存分配机制以及写直达与写回策略等.通过在Volta架构及多个基准测试套件上的实验验证,论文模型相较现有最先进模型PPT-GPU-Mem在多个关键指标上显著提升了预测精度:L2命中率误差从43.39%降至15.86%,显存读写事务次数误差从42%降至16.85%.
展开更多
关键词
GPU
内存模型
重用距离
功能模拟
NVIDIA
nvbit
在线阅读
下载PDF
职称材料
题名
基于Cache功能模拟的GPU内存系统建模
1
作者
袁福焱
郝晓宇
曹振伟
张森
陈俊仕
安虹
机构
中国科学技术大学计算机科学与技术学院
出处
《小型微型计算机系统》
北大核心
2026年第2期477-486,共10页
基金
中国科学院战略性先导科技专项项目(XDB0500102)资助.
文摘
重用距离分析是一种常用的基于Trace的Cache性能分析方法.然而,随着现代GPU微架构的持续演进,现有基于重用距离理论的GPU内存分析模型由于简化了过多硬件特性,导致了显著的失真.为此,本文提出一种基于Trace和Cache功能模拟的GPU内存系统建模框架,针对现代GPU的关键内存特性进行了精确建模,包括Sector Cache、自适应L1缓存分配机制以及写直达与写回策略等.通过在Volta架构及多个基准测试套件上的实验验证,论文模型相较现有最先进模型PPT-GPU-Mem在多个关键指标上显著提升了预测精度:L2命中率误差从43.39%降至15.86%,显存读写事务次数误差从42%降至16.85%.
关键词
GPU
内存模型
重用距离
功能模拟
NVIDIA
nvbit
Keywords
GPU
memory model
reuse distance
functional simulation
NVIDIA
nvbit
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Cache功能模拟的GPU内存系统建模
袁福焱
郝晓宇
曹振伟
张森
陈俊仕
安虹
《小型微型计算机系统》
北大核心
2026
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部