期刊文献+
共找到6,035篇文章
< 1 2 250 >
每页显示 20 50 100
BER performance analysis of non-Hermitian symmetry OFDM-VLC systems with ADC quantization noise
1
作者 WANG Zhongpeng AI Caihua ZHANG Lijuan 《Optoelectronics Letters》 2025年第11期677-683,共7页
Quantization noise caused by analog-to-digital converter(ADC)gives rise to the reliability performance degradation of communication systems.In this paper,a quantized non-Hermitian symmetry(NHS)orthogonal frequency-div... Quantization noise caused by analog-to-digital converter(ADC)gives rise to the reliability performance degradation of communication systems.In this paper,a quantized non-Hermitian symmetry(NHS)orthogonal frequency-division multiplexing-based visible light communication(OFDM-VLC)system is presented.In order to analyze the effect of the resolution of ADC on NHS OFDM-VLC,a quantized mathematical model of NHS OFDM-VLC is established.Based on the proposed quantized model,a closed-form bit error rate(BER)expression is derived.The theoretical analysis and simulation results both confirm the effectiveness of the obtained BER formula in high-resolution ADC.In addition,channel coding is helpful in compensating for the BER performance loss due to the utilization of lower resolution ADC. 展开更多
关键词 quantized modela communication systemsin Bit Error Rate quantized mathematical model reliability performance degradation non hermitian symmetry ADC quantization OFDM VLC
原文传递
Optimizing BERT for Bengali Emotion Classification: Evaluating Knowledge Distillation, Pruning, and Quantization
2
作者 Md Hasibur Rahman Mohammed Arif Uddin +1 位作者 Zinnat Fowzia Ria Rashedur M.Rahman 《Computer Modeling in Engineering & Sciences》 2025年第2期1637-1666,共30页
The rapid growth of digital data necessitates advanced natural language processing(NLP)models like BERT(Bidi-rectional Encoder Representations from Transformers),known for its superior performance in text classificati... The rapid growth of digital data necessitates advanced natural language processing(NLP)models like BERT(Bidi-rectional Encoder Representations from Transformers),known for its superior performance in text classification.However,BERT’s size and computational demands limit its practicality,especially in resource-constrained settings.This research compresses the BERT base model for Bengali emotion classification through knowledge distillation(KD),pruning,and quantization techniques.Despite Bengali being the sixth most spoken language globally,NLP research in this area is limited.Our approach addresses this gap by creating an efficient BERT-based model for Bengali text.We have explored 20 combinations for KD,quantization,and pruning,resulting in improved speedup,fewer parameters,and reduced memory size.Our best results demonstrate significant improvements in both speed and efficiency.For instance,in the case of mBERT,we achieved a 3.87×speedup and 4×compression ratio with a combination of Distil+Prune+Quant that reduced parameters from 178 to 46 M,while the memory size decreased from 711 to 178 MB.These results offer scalable solutions for NLP tasks in various languages and advance the field of model compression,making these models suitable for real-world applications in resource-limited environments. 展开更多
关键词 Bengali NLP black-box distillation emotion classification model compression post-training quantization unstructured pruning
在线阅读 下载PDF
Automatic diagnosis of keratitis from low-quality slit-lamp images using feature vector quantization and self-attention mechanisms
3
作者 JIANG Jiewei XIN Yu +3 位作者 DING Ke ZHU Mingmin CHEN Yi LI Zhongwen 《Optoelectronics Letters》 2025年第10期612-618,共7页
This paper proposes a novel method for the automatic diagnosis of keratitis using feature vector quantization and self-attention mechanisms(ADK_FVQSAM).First,high-level features are extracted using the DenseNet121 bac... This paper proposes a novel method for the automatic diagnosis of keratitis using feature vector quantization and self-attention mechanisms(ADK_FVQSAM).First,high-level features are extracted using the DenseNet121 backbone network,followed by adaptive average pooling to scale the features to a fixed length.Subsequently,product quantization with residuals(PQR)is applied to convert continuous feature vectors into discrete features representations,preserving essential information insensitive to image quality variations.The quantized and original features are concatenated and fed into a self-attention mechanism to capture keratitis-related features.Finally,these enhanced features are classified through a fully connected layer.Experiments on clinical low-quality(LQ)images show that ADK_FVQSAM achieves accuracies of 87.7%,81.9%,and 89.3% for keratitis,other corneal abnormalities,and normal corneas,respectively.Compared to DenseNet121,Swin transformer,and InceptionResNet,ADK_FVQSAM improves average accuracy by 3.1%,11.3%,and 15.3%,respectively.These results demonstrate that ADK_FVQSAM significantly enhances the recognition performance of keratitis based on LQ slit-lamp images,offering a practical approach for clinical application. 展开更多
关键词 KERATITIS low quality images adaptive average pooling densenet backbone networkfollowed self attention mechanism feature vector quantization diagnosis keratitis automatic diagnosis
原文传递
Networked control with guaranteed performance for IoT rehabilitation robot under nonvanishing uncertainties and input quantization
4
作者 Shilei Tan Xuesong Wang +1 位作者 Haoquan Zhou Wei Gong 《Digital Communications and Networks》 2025年第6期1774-1782,共9页
The Internet of Things(IoT)technology provides data acquisition,transmission,and analysis to control rehabilitation robots,encompassing sensor data from the robots as well as lidar signals for trajectory planning(desi... The Internet of Things(IoT)technology provides data acquisition,transmission,and analysis to control rehabilitation robots,encompassing sensor data from the robots as well as lidar signals for trajectory planning(desired trajectory).In IoT rehabilitation robot systems,managing nonvanishing uncertainties and input quantization is crucial for precise and reliable control performance.These challenges can cause instability and reduced effectiveness,particularly in adaptive networked control.This paper investigates networked control with guaranteed performance for IoT rehabilitation robots under nonvanishing uncertainties and input quantization.First,input quantization is managed via a quantization-aware control design,ensur stability and minimizing tracking errors,even with discrete control inputs,to avoid chattering.Second,the method handles nonvanishing uncertainties by adjusting control parameters via real-time neural network adaptation,maintaining consistent performance despite persistent disturbances.Third,the control scheme guarantees the desired tracking performance within a specified time,with all signals in the closed-loop system remaining uniformly bounded,offering a robust,reliable solution for IoT rehabilitation robot control.The simulation verifies the benefits and efficacy of the proposed control strategy. 展开更多
关键词 Networked control IoT rehabilitation robot Guaranteed performance Nonvanishing uncertainties Input quantization
在线阅读 下载PDF
基于FPGA的灵活量化卷积器
5
作者 金华 蔡新颖 +2 位作者 刘玖金 宋雪桦 王昌达 《微电子学与计算机》 2026年第2期57-71,共15页
针对在资源受限的边缘设备上部署CNN时面临的精度损失、计算吞吐量及卷积运算效率问题,提出了一种灵活的量化卷积器。该方法通过HA-MPLF量化策略,将BN(Batch Normalization)层折叠至卷积层,并为每层过滤器分配最优精度,以在精度和计算... 针对在资源受限的边缘设备上部署CNN时面临的精度损失、计算吞吐量及卷积运算效率问题,提出了一种灵活的量化卷积器。该方法通过HA-MPLF量化策略,将BN(Batch Normalization)层折叠至卷积层,并为每层过滤器分配最优精度,以在精度和计算性能间取得平衡。同时,提出一种基于卷积分解的计算方法,有效支持不同大小过滤器的处理。在FPGA(Field-Programmable Gate Array)平台上,该量化卷积器采用通道优先的运算策略,结合DSP(Digital Signal Processor)打包和级联技术,显著提升资源利用效率。在ZCU102 FPGA上进行实验验证,结果表明:该方法在MobileNet-V2、ResNet18和ResNet50上的精度分别达到90.13%、89.51%和93.33%,并实现了吞吐量的显著提升,为边缘设备上的CNN部署提供了一种高效解决方案。 展开更多
关键词 卷积神经网络 边缘设备 模型量化 卷积运算
在线阅读 下载PDF
后训练量化方法综述(特邀)
6
作者 张俊娜 王泓尊 丁春涛 《计算机工程》 北大核心 2026年第1期33-60,共28页
后训练量化(PTQ)是一种高效的模型压缩方法,它无需重新训练模型,只需少量(或无需)无标签校准数据即可将高精度浮点模型的参数转换为低比特整数表示。该方法在显著降低存储与计算开销的同时能够最大限度地保留原始模型的推理精度,因而受... 后训练量化(PTQ)是一种高效的模型压缩方法,它无需重新训练模型,只需少量(或无需)无标签校准数据即可将高精度浮点模型的参数转换为低比特整数表示。该方法在显著降低存储与计算开销的同时能够最大限度地保留原始模型的推理精度,因而受到学术界与工业界的广泛关注。从PTQ的量化步骤、方法分类、工具生态、应用进展4个维度,系统总结PTQ的研究进展。首先,构建了量化流程框架,涵盖动态范围统计、量化参数计算、权重与激活量化、误差优化和模型生成等步骤;其次,提出一个完整的量化方法分类体系,从量化粒度、位宽、校准方法到结构导向量化;再次,分析了支持PTQ规模化应用的工具生态,探讨了其在硬件适配和工程部署中的应用价值;最后,总结了PTQ方法的融合与应用进展,并指出PTQ方法在实践中面临的挑战,尤其是跨模态一致性、极低比特语义崩塌与硬件适配等难题。这些实践挑战的总结不仅揭示了当前技术的局限性,也为未来研究提供了重要方向。本综述为学术界与工业界提供了PTQ方法的参考框架,助力推动人工智能在资源受限场景中的广泛应用。 展开更多
关键词 后训练量化 后训练量化步骤 后训练量化方法分类 工具生态 应用进展
在线阅读 下载PDF
基于双重注意力机制的传统服饰图像检索
7
作者 王明远 张优贤 《毛纺科技》 北大核心 2026年第2期110-116,共7页
针对传统服饰图像检索过程中特征描述符构建粗糙、特征编码冗余度高、图像特征提取不充分的问题,提出一种基于双重注意力机制的传统服饰图像检索方法。该方法利用差分成像方法重构传统服饰图像,将重构后图像输入多尺度通道注意力机制中... 针对传统服饰图像检索过程中特征描述符构建粗糙、特征编码冗余度高、图像特征提取不充分的问题,提出一种基于双重注意力机制的传统服饰图像检索方法。该方法利用差分成像方法重构传统服饰图像,将重构后图像输入多尺度通道注意力机制中,获取传统服饰图像多尺度特征;将该特征输入自注意力机制自主学习,获取包含空间和位置信息的特征图;经由2个全连接层组成的哈希网络对特征图编码,计算特征图编码之间的汉明距离;设定三元组量化约束,降低该距离的计算误差,获取前N个结果作为传统服饰图像检索结果。测试结果显示:该方法重构后图像的色彩饱满且不失真,并且信息系数均在0.929以上,弗雷谢特感知距离均低于0.016,能够依据设定的损失函数进行训练并输出检索结果。 展开更多
关键词 注意力机制 传统服饰 图像检索 特征图编码 汉明距离 三元组量化约束
在线阅读 下载PDF
Establishing formal state space models via quantization forquantum control systems 被引量:2
8
作者 DongDaoyi ChenZonghai 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第2期398-402,共5页
Formal state space models of quantum control systems are deduced and a scheme to establish formal state space models via quantization could been obtained for quantum control systems is proposed. State evolution of qua... Formal state space models of quantum control systems are deduced and a scheme to establish formal state space models via quantization could been obtained for quantum control systems is proposed. State evolution of quantum control systems must accord with Schrdinger equations, so it is foremost to obtain Hamiltonian operators of systems. There are corresponding relations between operators of quantum systems and corresponding physical quantities of classical systems, such as momentum, energy and Hamiltonian, so Schrdinger equation models of corresponding quantum control systems via quantization could been obtained from classical control systems, and then establish formal state space models through the suitable transformation from Schrdinger equations for these quantum control systems. This method provides a new kind of path for modeling in quantum control. 展开更多
关键词 quantum control systems formal state space models quantization.
在线阅读 下载PDF
Fast encoding algorithm for vector quantization based on subvector L_2-norm 被引量:1
9
作者 Chen Shanxue Li Fangwei Zhu Weile 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第3期611-617,共7页
A fast encoding algorithm based on the mean square error (MSE) distortion for vector quantization is introduced. The vector, which is effectively constructed with wavelet transform (WT) coefficients of images, can... A fast encoding algorithm based on the mean square error (MSE) distortion for vector quantization is introduced. The vector, which is effectively constructed with wavelet transform (WT) coefficients of images, can simplify the realization of the non-linear interpolated vector quantization (NLIVQ) technique and make the partial distance search (PDS) algorithm more efficient. Utilizing the relationship of vector L2-norm and its Euclidean distance, some conditions of eliminating unnecessary codewords are obtained. Further, using inequality constructed by the subvector L2-norm, more unnecessary codewords are eliminated. During the search process for code, mostly unlikely codewords can be rejected by the proposed algorithm combined with the non-linear interpolated vector quantization technique and the partial distance search technique. The experimental results show that the reduction of computation is outstanding in the encoding time and complexity against the full search method. 展开更多
关键词 image compression fast encoding subvector wavelet transform vector quantization.
在线阅读 下载PDF
An Efficient Information Hiding Scheme Based on Closest Paired Tree Structure Vector Quantization 被引量:1
10
作者 Zhi-Hui Wang Chin-Chen Chang Ting-Yu Lin 《Journal of Electronic Science and Technology》 CAS 2013年第1期15-19,共5页
Information hiding schemes based on vector quantization (VQ) usually require lengthy VQ encoding and decoding processes. In this paper, we propose an efficient information hiding method based on closest paired tree ... Information hiding schemes based on vector quantization (VQ) usually require lengthy VQ encoding and decoding processes. In this paper, we propose an efficient information hiding method based on closest paired tree structure vector quantization (CPTSVQ). The simulation result shows that the execution time of the proposed scheme is much shorter than that attained by previous approaches. 展开更多
关键词 Digital image information hiding tree structure vector quantization vector quantization.
在线阅读 下载PDF
自适应动态选择尺度的ViT后训练量化模型研究
11
作者 裴颂文 彭宇昂 +2 位作者 刘方鑫 陈铭松 张波 《小型微型计算机系统》 北大核心 2026年第1期142-149,共8页
后训练量化方法无需重新训练神经网络,且对数据集的依赖性小,是一种轻量且实用的模型压缩技术.然而,现有的量化范式未能有效地拟合post-Softmax激活的分布特性,并且在重新参数化post-LayerNorm激活后,精度不可避免地出现下降.因此,本文... 后训练量化方法无需重新训练神经网络,且对数据集的依赖性小,是一种轻量且实用的模型压缩技术.然而,现有的量化范式未能有效地拟合post-Softmax激活的分布特性,并且在重新参数化post-LayerNorm激活后,精度不可避免地出现下降.因此,本文提出了一种自适应动态选择量化尺度的变换器后训练量化框架DAQ-ViT.DAQ-ViT首先提出了一种基于偏度度量的缩放因子分布选择器,解决了post-LayerNorm激活存在显著的通道间变化所导致的精度下降问题.其次,针对post-Softmax和post-GELU激活分布特性,提出了满足分布特性的Sigmoid量化器.此外,提出了感知分布检测器,自适应感知激活值分布情况,从而动态选择Sigmoid量化和log2量化.实验结果表明,在没有输出重建的情况下与PTQ4ViT相比,DAQ-ViT进行4比特量化时,在DeiT-Tiny和DeiT-Small上的精度分别提高了20%和35%. 展开更多
关键词 模型压缩 模型量化 后训练量化 图像分类 视觉变换器
在线阅读 下载PDF
大语言模型低比特量化的历史、现状和未来:以复域量化为例
12
作者 丛培壮 王飞宇 +3 位作者 王国安 王砚舒 郑策 杨仝 《计算机研究与发展》 北大核心 2026年第2期276-293,共18页
随着大语言模型(large language model,LLM)参数规模的指数级增长,模型部署和推理面临着严峻的内存和计算资源挑战。量化技术作为模型压缩的核心方法,通过降低权重和激活值的数值精度,显著减少了模型的存储需求和计算开销。首先回顾了... 随着大语言模型(large language model,LLM)参数规模的指数级增长,模型部署和推理面临着严峻的内存和计算资源挑战。量化技术作为模型压缩的核心方法,通过降低权重和激活值的数值精度,显著减少了模型的存储需求和计算开销。首先回顾了量化技术的发展历程,从经典的Int8/4量化方法到前沿的超低比特量化算法,总结了典型方法的技术特征与性能演进规律,指出传统实数域量化在极低比特条件下存在受限于离散化误差的挑战,难以突破性能上限。为此,进而系统性地梳理了复域量化系列工作。该系列工作提出了基于复数域的量化范式,通过在参数表示中引入幅度与相位2个自由度,显著扩展了模型的表达空间;此外,类比信号处理中通过将时域信号进行傅里叶变换与低通滤波实现稳定表示的经典范式,进一步提出了由实数模型经复域变换与复域量化,达成了无乘法稳定推理的技术路线。实验结果表明,该方案在多个基准数据集上优于现有超低比特量化方法,有效突破了实数域模型的性能天花板,展现出复域量化在高效建模与性能保持方面的潜在价值。总体而言,通过对量化技术演进及复域量化系列研究的系统分析,旨在揭示超低比特量化的发展规律与未来趋势,为高效大模型的理论研究与工程实现提供参考。 展开更多
关键词 大语言模型 模型量化 低比特量化 模型压缩 复数模型
在线阅读 下载PDF
基于采样量化降维观测器的切换非线性系统非周期触发预定性能控制
13
作者 薛璐倩 王春艳 《燕山大学学报》 北大核心 2026年第1期55-67,共13页
针对具有未知控制方向和任意切换信号的切换非线性系统,研究了非周期事件触发输出反馈预定性能控制问题。首先基于采样量化输出,给出一种新的模型依赖的降维神经网络量化观测器来估计不可测状态,降低了系统观测成本。其次,提出一种新的... 针对具有未知控制方向和任意切换信号的切换非线性系统,研究了非周期事件触发输出反馈预定性能控制问题。首先基于采样量化输出,给出一种新的模型依赖的降维神经网络量化观测器来估计不可测状态,降低了系统观测成本。其次,提出一种新的依赖切换信号的非周期事件触发策略,该策略克服了现有文献中控制器与对应子系统同步切换的假设,也成功避免了常规触发机制中因子系统与匹配控制器异步运行对系统稳定性造成的不利影响。通过递归设计得到的输出反馈控制器保证了闭环系统的所有变量在任意切换下的一致有界性,并且系统的跟踪误差信号轨迹收敛到原点附近尽可能小的预定范围,实现了对具有未知控制方向的切换非线性系统的任意切换输出反馈控制。最后,仿真分析的结果验证了本文所提方法的正确性和有效性。 展开更多
关键词 切换非线性系统 量化降维观测器 非周期事件触发 预定性能 采样量化
在线阅读 下载PDF
面向可重构结构的CNN模型混合压缩方法
14
作者 刘朋飞 蒋林 +1 位作者 李远成 吴海 《现代电子技术》 北大核心 2026年第1期167-173,共7页
随着卷积神经网络规模的不断扩大,其参数量和计算量显著增加,导致硬件面临严重的访存瓶颈,限制了计算效率。为解决这一问题,文中提出一种面向可重构结构的CNN混合压缩新方法,该方法采用先剪枝后量化的策略,通过基于一阶泰勒展开的滤波... 随着卷积神经网络规模的不断扩大,其参数量和计算量显著增加,导致硬件面临严重的访存瓶颈,限制了计算效率。为解决这一问题,文中提出一种面向可重构结构的CNN混合压缩新方法,该方法采用先剪枝后量化的策略,通过基于一阶泰勒展开的滤波器剪枝、基于阈值的全连接层权值剪枝和混合精度自适应量化策略,来减少模型参数量和计算复杂度,并部署在自研的可重构处理器上。实验结果表明,所提方法在VGG16和ResNet18模型上分别实现了31.4倍和7.9倍的压缩比,精度仅下降1.20%和0.74%。在基于VirtexUltraScale VU440 FPGA开发板搭建的可重构阵列处理器上,压缩后的VGG16模型执行周期最大降低了62.7%。证明所提方法适合资源有限的边缘计算设备。 展开更多
关键词 卷积神经网络 模型压缩 结构化剪枝 自适应量化 并行计算 可重构结构
在线阅读 下载PDF
基于贝叶斯网的故障根因分析
15
作者 刘华帅 陶厚国 +1 位作者 岳昆 段亮 《计算机科学》 北大核心 2026年第3期143-150,共8页
故障根因分析旨在找到导致特定问题、故障或事件发生的原因,是多个领域中追踪溯源的重要支撑技术,但现有方法在效率、准确性和稳定性等方面仍不能满足故障根因分析任务的实际需求。对此,将贝叶斯网作为相关属性之间依赖关系表示和推理... 故障根因分析旨在找到导致特定问题、故障或事件发生的原因,是多个领域中追踪溯源的重要支撑技术,但现有方法在效率、准确性和稳定性等方面仍不能满足故障根因分析任务的实际需求。对此,将贝叶斯网作为相关属性之间依赖关系表示和推理的知识框架,提出基于贝叶斯网的故障根因分析方法。首先,针对高维数据和稀疏样本带来的挑战,提出基于向量量化自编码器的高维属性约简算法,并给出α-BIC评分准则,高效地学习根因贝叶斯网(Root Cause Bayesian Network,RCBN)。随后,基于贝叶斯网嵌入技术实现RCBN的高效推理,高效计算各原因条件下故障产生的可能性,进而使用因果模型中的Blame机制度量各原因对给定故障的贡献度,从而实现故障根因分析。在3个公共数据集和3个合成数据集上的实验结果表明,所提方法的平均检测准确性和效率明显优于对比方法,在CHILD数据集上精度提升了7%,运行时间快了60%。 展开更多
关键词 故障根因分析 贝叶斯网 向量量化自编码器 贝叶斯信息准则 根因贡献度
在线阅读 下载PDF
From Steady 4D Quantization of Valence Electrons to Material Space Paradigm
16
作者 Igor E. Bulyzhenkov 《Journal of Chemistry and Chemical Engineering》 2013年第4期370-373,共4页
Potential electric and gravitational fields do not change steady quantized states of electrons in chemical bonds, microscopic clusters of charges and macroscopic superconducting rings. There are no theoretical grounds... Potential electric and gravitational fields do not change steady quantized states of electrons in chemical bonds, microscopic clusters of charges and macroscopic superconducting rings. There are no theoretical grounds to create Squid-type instruments to measure electric and gravitational fields with quantum accuracy basing on the Bohr-Sommerfeld quantization of charged particles. Squid-verified spatial flatness for superfluid electrons corresponds to the material space paradigm for reality. 展开更多
关键词 Continuous electron relativistic quantization.
在线阅读 下载PDF
基于分型图谱量化法的德化窑犀角杯造型流变研究
17
作者 徐骁琪 程永胜 景银 《包装工程》 北大核心 2026年第2期179-186,共8页
目的研究德化窑犀角杯造型流变过程,结合德化窑所处区域的人文、地理、文化特征,以此窥探出德化窑的造物文化。方法采用分型图谱量化法,首先择取各种杯型样本,基于考古类型学对不同形制的杯子进行分型分式;其次,提取样本器皿的轮廓线,... 目的研究德化窑犀角杯造型流变过程,结合德化窑所处区域的人文、地理、文化特征,以此窥探出德化窑的造物文化。方法采用分型图谱量化法,首先择取各种杯型样本,基于考古类型学对不同形制的杯子进行分型分式;其次,提取样本器皿的轮廓线,以此建立图谱量化表,整理量化参考值对器皿造型中的关键性因素进行量化;最后,通过数据分析结果探究德化窑白釉犀角杯及其衍生杯型形制的演变规律。结论白釉犀角杯是德化窑特有的杯型,造型极具特色并以此为基础演变出了不同形制的杯子,其造型演变规律反映了德化窑继承性、实用性和应时嬗变等文化特征。 展开更多
关键词 德化窑 白釉犀角杯 造型流变 分型图谱量化法
在线阅读 下载PDF
一种自注意力模块的低精度损失量化方法
18
作者 林德铝 何琨 《计算机研究与发展》 北大核心 2026年第1期162-175,共14页
随着深度学习技术的飞速进步和对海量数据集的持续发掘,自注意力模块在自然语言处理、计算机视觉以及大语言模型等多个领域得到了广泛应用。尽管自注意力模块显著提升了深度学习模型的检测精度,其巨大的计算需求却使得其在算力受限的计... 随着深度学习技术的飞速进步和对海量数据集的持续发掘,自注意力模块在自然语言处理、计算机视觉以及大语言模型等多个领域得到了广泛应用。尽管自注意力模块显著提升了深度学习模型的检测精度,其巨大的计算需求却使得其在算力受限的计算设备上部署显得尤为困难。整数量化作为在低算力计算芯片中部署模型的关键技术之一,面临着由自注意力模块结构特点引起的较高精度损失问题。针对这个问题,对自注意力模块的整数量化误差进行了深入分析,提出了伪softmax向量量化方法和分块伪softmax向量量化方法。所提出方法通过对自注意力模块中的softmax向量进行特殊的整数量化,旨在显著提升推理速度的同时,有效降低整数量化带来的误差。实验结果表明,相比于传统的直接量化方法,伪softmax向量量化方法能够将量化精度损失降低50%,而分块伪softmax向量量化方法更是能将精度损失减少约90%。该结果充分证明了这2种量化方法在减少精度损失方面的有效性,为自注意力模块在算力受限设备上的高效部署提供了有力支持。 展开更多
关键词 模型量化 自注意力模块 低精度损失 推理加速 分治
在线阅读 下载PDF
基于知识蒸馏的量化卷积神经网络模型压缩研究
19
作者 何龙超 武唯康 +1 位作者 李斌 常迎辉 《计算机测量与控制》 2026年第2期227-234,共8页
针对边缘设备部署深度卷积神经网络存在的高资源消耗问题,对知识蒸馏与低比特量化协同优化方法进行了研究;采用了量化感知训练与蒸馏损失联合指导的关键技术,通过教师模型软标签监督和投影梯度下降优化,有效缓解了低比特量化的精度损失;... 针对边缘设备部署深度卷积神经网络存在的高资源消耗问题,对知识蒸馏与低比特量化协同优化方法进行了研究;采用了量化感知训练与蒸馏损失联合指导的关键技术,通过教师模型软标签监督和投影梯度下降优化,有效缓解了低比特量化的精度损失;在CIFAR-10和CIFAR-100数据集上的实验分析与验证,该方法实现了ResNet系列网络的4位量化,在CIFAR-10上达到92.1%的准确率,模型大小压缩至0.41 MB;经FPGA端侧部署验证,ResNet-20推理时延从82.3 ms降至5.67 ms,满足了边缘计算对低延迟与高效率的工程需求;证实该方法能在保持精度的同时显著降低资源开销,为资源受限环境下的神经网络部署提供了有效解决方案。 展开更多
关键词 卷积神经网络 模型压缩 知识蒸馏 量化 FPGA 边缘计算
在线阅读 下载PDF
大语言模型混合量化压缩与加速推理技术
20
作者 尹经纬 李志强 刘裕彤 《计算机工程与设计》 北大核心 2026年第1期187-194,共8页
大语言模型已广泛应用于日常学习、工作和生活中,但由于其参数规模庞大、资源消耗高,且推理高度依赖GPU,这严重制约其推广。针对上述问题,论文在CPU环境下提出基于离群特征优化的混合INT8量化方法,充分发挥其在模型压缩中的优势;同时,... 大语言模型已广泛应用于日常学习、工作和生活中,但由于其参数规模庞大、资源消耗高,且推理高度依赖GPU,这严重制约其推广。针对上述问题,论文在CPU环境下提出基于离群特征优化的混合INT8量化方法,充分发挥其在模型压缩中的优势;同时,基于注意力机制在文本首尾集中分布的规律,设计高效的参数快速读取机制。两种方法的有机结合显著减少模型内存消耗和提升推理效率,为解决大语言模型在边缘计算环境中的应用瓶颈提供新的技术方案。在I7-13700 CPU环境下,基于LLaMA2、GPT-J和FSEQ大模型,使用C4、Wikitext和PG19数据集进行全面验证,结果充分验证了所提方法的优越性与实用价值。 展开更多
关键词 大语言模型 离群参数 混合量化 注意力机制 参数快速读取 模型推理 边缘计算
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部