检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于MLIR的数据流模型: 1; 作者李金熹尹首一 +1 位作者魏少军胡杨《计算机工程与科学》 CSCD 北大核心 2024年第7期1151-1157,共7页; 在冯诺依曼架构下,指令集的使用让软硬件得以解耦并各自飞速发展。然而,近年来并行多核架构加速器的热潮为冯诺依曼架构下的顺序编程模型带来了挑战。在顺序编程模型下设计而成的指令集缺乏对并行硬件的抽象,因此仅仅使用指令集已不能... 展开更多; 关键词数据流模型端到端编译 mlir; 在线阅读下载PDF 职称材料

基于MLIR的FP8量化模拟与推理内存优化: 2; 作者徐金龙桂中华 +2 位作者李嘉楠李颖颖韩林《计算机科学》 CSCD 北大核心 2024年第9期112-120,共9页; 随着目标检测模型和语言大模型的迅速发展,网络模型正变得越来越庞大。为了更好地在端侧硬件上进行模型部署,通常采用模型量化技术对模型进行压缩。现有的模型量化策略主要基于FP16,BF16和INT8等类型实现。其中,8bit数据类型在降低推理... 展开更多; 关键词模型压缩深度学习编译器 FP8量化 mlir Yolov5s模型; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部