期刊文献+
共找到6,059篇文章
< 1 2 250 >
每页显示 20 50 100
TP-ViT:truncated uniform-log2 quantizer and progressive bit-decline reconstruction for vision Transformer quantization
1
作者 Xichuan ZHOU Sihuan ZHAO +4 位作者 Rui DING Jiayu SHI Jing NIE Lihui CHEN Haijun LIU 《ENGINEERING Information Technology & Electronic Engineering》 2026年第1期47-58,共12页
Vision Transformers(ViTs)have achieved remarkable success across various artificial intelligence-based computer vision applications.However,their demanding computational and memory requirements pose significant challe... Vision Transformers(ViTs)have achieved remarkable success across various artificial intelligence-based computer vision applications.However,their demanding computational and memory requirements pose significant challenges for de-ployment on resource-constrained edge devices.Although post-training quantization(PTQ)provides a promising solution by reducing model precision with minimal calibration data,aggressive low-bit quantization typically leads to substantial perfor-mance degradation.To address this challenge,we present the truncated uniform-log2 quantizer and progressive bit-decline reconstruction method for vision Transformer quantization(TP-ViT).It is an innovative PTQ framework specifically designed for ViTs,featuring two key technical contributions:(1)truncated uniform-log2 quantizer,a novel quantization approach which effectively handles outlier values in post-Softmax activations,significantly reducing quantization errors;(2)bit-decline optimiza-tion strategy,which employs transition weights to gradually reduce bit precision while maintaining model performance under extreme quantization conditions.Comprehensive experiments on image classification,object detection,and instance segmenta-tion tasks demonstrate TP-ViT’s superior performance compared to state-of-the-art PTQ methods,particularly in challenging 3-bit quantization scenarios.Our framework achieves a notable 6.18 percentage points improvement in top-1 accuracy for ViT-small under 3-bit quantization.These results validate TP-ViT’s robustness and general applicability,paving the way for more efficient deployment of ViT models in computer vision applications on edge hardware. 展开更多
关键词 Vision Transformers Post-training quantization Block reconstruction Image classification Object detection Instance segmentation
在线阅读 下载PDF
BER performance analysis of non-Hermitian symmetry OFDM-VLC systems with ADC quantization noise
2
作者 WANG Zhongpeng AI Caihua ZHANG Lijuan 《Optoelectronics Letters》 2025年第11期677-683,共7页
Quantization noise caused by analog-to-digital converter(ADC)gives rise to the reliability performance degradation of communication systems.In this paper,a quantized non-Hermitian symmetry(NHS)orthogonal frequency-div... Quantization noise caused by analog-to-digital converter(ADC)gives rise to the reliability performance degradation of communication systems.In this paper,a quantized non-Hermitian symmetry(NHS)orthogonal frequency-division multiplexing-based visible light communication(OFDM-VLC)system is presented.In order to analyze the effect of the resolution of ADC on NHS OFDM-VLC,a quantized mathematical model of NHS OFDM-VLC is established.Based on the proposed quantized model,a closed-form bit error rate(BER)expression is derived.The theoretical analysis and simulation results both confirm the effectiveness of the obtained BER formula in high-resolution ADC.In addition,channel coding is helpful in compensating for the BER performance loss due to the utilization of lower resolution ADC. 展开更多
关键词 quantized modela communication systemsin Bit Error Rate quantized mathematical model reliability performance degradation non hermitian symmetry ADC quantization OFDM VLC
原文传递
Optimizing BERT for Bengali Emotion Classification: Evaluating Knowledge Distillation, Pruning, and Quantization
3
作者 Md Hasibur Rahman Mohammed Arif Uddin +1 位作者 Zinnat Fowzia Ria Rashedur M.Rahman 《Computer Modeling in Engineering & Sciences》 2025年第2期1637-1666,共30页
The rapid growth of digital data necessitates advanced natural language processing(NLP)models like BERT(Bidi-rectional Encoder Representations from Transformers),known for its superior performance in text classificati... The rapid growth of digital data necessitates advanced natural language processing(NLP)models like BERT(Bidi-rectional Encoder Representations from Transformers),known for its superior performance in text classification.However,BERT’s size and computational demands limit its practicality,especially in resource-constrained settings.This research compresses the BERT base model for Bengali emotion classification through knowledge distillation(KD),pruning,and quantization techniques.Despite Bengali being the sixth most spoken language globally,NLP research in this area is limited.Our approach addresses this gap by creating an efficient BERT-based model for Bengali text.We have explored 20 combinations for KD,quantization,and pruning,resulting in improved speedup,fewer parameters,and reduced memory size.Our best results demonstrate significant improvements in both speed and efficiency.For instance,in the case of mBERT,we achieved a 3.87×speedup and 4×compression ratio with a combination of Distil+Prune+Quant that reduced parameters from 178 to 46 M,while the memory size decreased from 711 to 178 MB.These results offer scalable solutions for NLP tasks in various languages and advance the field of model compression,making these models suitable for real-world applications in resource-limited environments. 展开更多
关键词 Bengali NLP black-box distillation emotion classification model compression post-training quantization unstructured pruning
在线阅读 下载PDF
Automatic diagnosis of keratitis from low-quality slit-lamp images using feature vector quantization and self-attention mechanisms
4
作者 JIANG Jiewei XIN Yu +3 位作者 DING Ke ZHU Mingmin CHEN Yi LI Zhongwen 《Optoelectronics Letters》 2025年第10期612-618,共7页
This paper proposes a novel method for the automatic diagnosis of keratitis using feature vector quantization and self-attention mechanisms(ADK_FVQSAM).First,high-level features are extracted using the DenseNet121 bac... This paper proposes a novel method for the automatic diagnosis of keratitis using feature vector quantization and self-attention mechanisms(ADK_FVQSAM).First,high-level features are extracted using the DenseNet121 backbone network,followed by adaptive average pooling to scale the features to a fixed length.Subsequently,product quantization with residuals(PQR)is applied to convert continuous feature vectors into discrete features representations,preserving essential information insensitive to image quality variations.The quantized and original features are concatenated and fed into a self-attention mechanism to capture keratitis-related features.Finally,these enhanced features are classified through a fully connected layer.Experiments on clinical low-quality(LQ)images show that ADK_FVQSAM achieves accuracies of 87.7%,81.9%,and 89.3% for keratitis,other corneal abnormalities,and normal corneas,respectively.Compared to DenseNet121,Swin transformer,and InceptionResNet,ADK_FVQSAM improves average accuracy by 3.1%,11.3%,and 15.3%,respectively.These results demonstrate that ADK_FVQSAM significantly enhances the recognition performance of keratitis based on LQ slit-lamp images,offering a practical approach for clinical application. 展开更多
关键词 KERATITIS low quality images adaptive average pooling densenet backbone networkfollowed self attention mechanism feature vector quantization diagnosis keratitis automatic diagnosis
原文传递
Networked control with guaranteed performance for IoT rehabilitation robot under nonvanishing uncertainties and input quantization
5
作者 Shilei Tan Xuesong Wang +1 位作者 Haoquan Zhou Wei Gong 《Digital Communications and Networks》 2025年第6期1774-1782,共9页
The Internet of Things(IoT)technology provides data acquisition,transmission,and analysis to control rehabilitation robots,encompassing sensor data from the robots as well as lidar signals for trajectory planning(desi... The Internet of Things(IoT)technology provides data acquisition,transmission,and analysis to control rehabilitation robots,encompassing sensor data from the robots as well as lidar signals for trajectory planning(desired trajectory).In IoT rehabilitation robot systems,managing nonvanishing uncertainties and input quantization is crucial for precise and reliable control performance.These challenges can cause instability and reduced effectiveness,particularly in adaptive networked control.This paper investigates networked control with guaranteed performance for IoT rehabilitation robots under nonvanishing uncertainties and input quantization.First,input quantization is managed via a quantization-aware control design,ensur stability and minimizing tracking errors,even with discrete control inputs,to avoid chattering.Second,the method handles nonvanishing uncertainties by adjusting control parameters via real-time neural network adaptation,maintaining consistent performance despite persistent disturbances.Third,the control scheme guarantees the desired tracking performance within a specified time,with all signals in the closed-loop system remaining uniformly bounded,offering a robust,reliable solution for IoT rehabilitation robot control.The simulation verifies the benefits and efficacy of the proposed control strategy. 展开更多
关键词 Networked control IoT rehabilitation robot Guaranteed performance Nonvanishing uncertainties Input quantization
在线阅读 下载PDF
基于动态事件触发的异质复杂网络量化同步控制
6
作者 黄玲 郭婧 王云飞 《控制理论与应用》 北大核心 2026年第3期634-642,共9页
本文研究基于节点平均值轨道跟踪的异质复杂网络同步控制.首先,建立异质复杂网络的模型及节点平均值轨道模型.之后,设计动态事件触发条件,减少系统不必要的数据传输,引入对数量化器,构建复杂网络的同步误差模型.接着,利用Lyapunov稳定... 本文研究基于节点平均值轨道跟踪的异质复杂网络同步控制.首先,建立异质复杂网络的模型及节点平均值轨道模型.之后,设计动态事件触发条件,减少系统不必要的数据传输,引入对数量化器,构建复杂网络的同步误差模型.接着,利用Lyapunov稳定性理论及相关引理,得到异质复杂网络最终指数有界同步的充分条件.然后,利用成熟线性矩阵不等式工具箱联合求解控制器和事件触发参数.最后,通过数值例子验证所提方法的有效性. 展开更多
关键词 复杂网络 异质网络 同步控制 事件触发机制 量化
在线阅读 下载PDF
基于FPGA的灵活量化卷积器
7
作者 金华 蔡新颖 +2 位作者 刘玖金 宋雪桦 王昌达 《微电子学与计算机》 2026年第2期57-71,共15页
针对在资源受限的边缘设备上部署CNN时面临的精度损失、计算吞吐量及卷积运算效率问题,提出了一种灵活的量化卷积器。该方法通过HA-MPLF量化策略,将BN(Batch Normalization)层折叠至卷积层,并为每层过滤器分配最优精度,以在精度和计算... 针对在资源受限的边缘设备上部署CNN时面临的精度损失、计算吞吐量及卷积运算效率问题,提出了一种灵活的量化卷积器。该方法通过HA-MPLF量化策略,将BN(Batch Normalization)层折叠至卷积层,并为每层过滤器分配最优精度,以在精度和计算性能间取得平衡。同时,提出一种基于卷积分解的计算方法,有效支持不同大小过滤器的处理。在FPGA(Field-Programmable Gate Array)平台上,该量化卷积器采用通道优先的运算策略,结合DSP(Digital Signal Processor)打包和级联技术,显著提升资源利用效率。在ZCU102 FPGA上进行实验验证,结果表明:该方法在MobileNet-V2、ResNet18和ResNet50上的精度分别达到90.13%、89.51%和93.33%,并实现了吞吐量的显著提升,为边缘设备上的CNN部署提供了一种高效解决方案。 展开更多
关键词 卷积神经网络 边缘设备 模型量化 卷积运算
在线阅读 下载PDF
后训练量化方法综述(特邀)
8
作者 张俊娜 王泓尊 丁春涛 《计算机工程》 北大核心 2026年第1期33-60,共28页
后训练量化(PTQ)是一种高效的模型压缩方法,它无需重新训练模型,只需少量(或无需)无标签校准数据即可将高精度浮点模型的参数转换为低比特整数表示。该方法在显著降低存储与计算开销的同时能够最大限度地保留原始模型的推理精度,因而受... 后训练量化(PTQ)是一种高效的模型压缩方法,它无需重新训练模型,只需少量(或无需)无标签校准数据即可将高精度浮点模型的参数转换为低比特整数表示。该方法在显著降低存储与计算开销的同时能够最大限度地保留原始模型的推理精度,因而受到学术界与工业界的广泛关注。从PTQ的量化步骤、方法分类、工具生态、应用进展4个维度,系统总结PTQ的研究进展。首先,构建了量化流程框架,涵盖动态范围统计、量化参数计算、权重与激活量化、误差优化和模型生成等步骤;其次,提出一个完整的量化方法分类体系,从量化粒度、位宽、校准方法到结构导向量化;再次,分析了支持PTQ规模化应用的工具生态,探讨了其在硬件适配和工程部署中的应用价值;最后,总结了PTQ方法的融合与应用进展,并指出PTQ方法在实践中面临的挑战,尤其是跨模态一致性、极低比特语义崩塌与硬件适配等难题。这些实践挑战的总结不仅揭示了当前技术的局限性,也为未来研究提供了重要方向。本综述为学术界与工业界提供了PTQ方法的参考框架,助力推动人工智能在资源受限场景中的广泛应用。 展开更多
关键词 后训练量化 后训练量化步骤 后训练量化方法分类 工具生态 应用进展
在线阅读 下载PDF
基于双重注意力机制的传统服饰图像检索
9
作者 王明远 张优贤 《毛纺科技》 北大核心 2026年第2期110-116,共7页
针对传统服饰图像检索过程中特征描述符构建粗糙、特征编码冗余度高、图像特征提取不充分的问题,提出一种基于双重注意力机制的传统服饰图像检索方法。该方法利用差分成像方法重构传统服饰图像,将重构后图像输入多尺度通道注意力机制中... 针对传统服饰图像检索过程中特征描述符构建粗糙、特征编码冗余度高、图像特征提取不充分的问题,提出一种基于双重注意力机制的传统服饰图像检索方法。该方法利用差分成像方法重构传统服饰图像,将重构后图像输入多尺度通道注意力机制中,获取传统服饰图像多尺度特征;将该特征输入自注意力机制自主学习,获取包含空间和位置信息的特征图;经由2个全连接层组成的哈希网络对特征图编码,计算特征图编码之间的汉明距离;设定三元组量化约束,降低该距离的计算误差,获取前N个结果作为传统服饰图像检索结果。测试结果显示:该方法重构后图像的色彩饱满且不失真,并且信息系数均在0.929以上,弗雷谢特感知距离均低于0.016,能够依据设定的损失函数进行训练并输出检索结果。 展开更多
关键词 注意力机制 传统服饰 图像检索 特征图编码 汉明距离 三元组量化约束
在线阅读 下载PDF
带有事件触发和输入量化的无人船轨迹跟踪控制
10
作者 宁君 王二月 +1 位作者 李铁山 陈俊龙 《控制理论与应用》 北大核心 2026年第3期530-540,共11页
针对航海实践中通信带宽受限问题,本文提出了带有事件触发机制和输入量化的欠驱动无人船(USV)轨迹跟踪控制策略.首先,为了实现对期望轨迹的有效跟踪,补偿因海流造成的运动学偏移,在USV运动学子系统中,利用扩张状态观测器观测偏移量,设... 针对航海实践中通信带宽受限问题,本文提出了带有事件触发机制和输入量化的欠驱动无人船(USV)轨迹跟踪控制策略.首先,为了实现对期望轨迹的有效跟踪,补偿因海流造成的运动学偏移,在USV运动学子系统中,利用扩张状态观测器观测偏移量,设计了基于观测结果的制导律.其次,在USV动力学子系统中,引入径向基神经网络以近似模型不确定性,设计了带有事件触发机制的自适应神经网络量化控制器.针对输入量化为非均匀量化的挑战,本文引入了描述输入量化过程的线性解析模型,在设计系统控制律时无需输入量化参数的先验信息,能够有效增强所设计系统的自适应性与通用性.本文所设计的带有事件触发和输入量化的USV轨迹跟踪控制方法能够降低执行器的控制频率和幅度,从而减轻通信负担.此外,基于输入到状态稳定性理论证明了闭环系统的稳定性,同时证明了闭环系统中无芝诺现象.最后,通过仿真实验验证了所提方法的有效性. 展开更多
关键词 欠驱动无人船舶 扩张状态观测器 输入量化 自适应神经网络控制 事件触发机制
在线阅读 下载PDF
Establishing formal state space models via quantization forquantum control systems 被引量:2
11
作者 DongDaoyi ChenZonghai 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第2期398-402,共5页
Formal state space models of quantum control systems are deduced and a scheme to establish formal state space models via quantization could been obtained for quantum control systems is proposed. State evolution of qua... Formal state space models of quantum control systems are deduced and a scheme to establish formal state space models via quantization could been obtained for quantum control systems is proposed. State evolution of quantum control systems must accord with Schrdinger equations, so it is foremost to obtain Hamiltonian operators of systems. There are corresponding relations between operators of quantum systems and corresponding physical quantities of classical systems, such as momentum, energy and Hamiltonian, so Schrdinger equation models of corresponding quantum control systems via quantization could been obtained from classical control systems, and then establish formal state space models through the suitable transformation from Schrdinger equations for these quantum control systems. This method provides a new kind of path for modeling in quantum control. 展开更多
关键词 quantum control systems formal state space models quantization.
在线阅读 下载PDF
Fast encoding algorithm for vector quantization based on subvector L_2-norm 被引量:1
12
作者 Chen Shanxue Li Fangwei Zhu Weile 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第3期611-617,共7页
A fast encoding algorithm based on the mean square error (MSE) distortion for vector quantization is introduced. The vector, which is effectively constructed with wavelet transform (WT) coefficients of images, can... A fast encoding algorithm based on the mean square error (MSE) distortion for vector quantization is introduced. The vector, which is effectively constructed with wavelet transform (WT) coefficients of images, can simplify the realization of the non-linear interpolated vector quantization (NLIVQ) technique and make the partial distance search (PDS) algorithm more efficient. Utilizing the relationship of vector L2-norm and its Euclidean distance, some conditions of eliminating unnecessary codewords are obtained. Further, using inequality constructed by the subvector L2-norm, more unnecessary codewords are eliminated. During the search process for code, mostly unlikely codewords can be rejected by the proposed algorithm combined with the non-linear interpolated vector quantization technique and the partial distance search technique. The experimental results show that the reduction of computation is outstanding in the encoding time and complexity against the full search method. 展开更多
关键词 image compression fast encoding subvector wavelet transform vector quantization.
在线阅读 下载PDF
An Efficient Information Hiding Scheme Based on Closest Paired Tree Structure Vector Quantization 被引量:1
13
作者 Zhi-Hui Wang Chin-Chen Chang Ting-Yu Lin 《Journal of Electronic Science and Technology》 CAS 2013年第1期15-19,共5页
Information hiding schemes based on vector quantization (VQ) usually require lengthy VQ encoding and decoding processes. In this paper, we propose an efficient information hiding method based on closest paired tree ... Information hiding schemes based on vector quantization (VQ) usually require lengthy VQ encoding and decoding processes. In this paper, we propose an efficient information hiding method based on closest paired tree structure vector quantization (CPTSVQ). The simulation result shows that the execution time of the proposed scheme is much shorter than that attained by previous approaches. 展开更多
关键词 Digital image information hiding tree structure vector quantization vector quantization.
在线阅读 下载PDF
自适应动态选择尺度的ViT后训练量化模型研究
14
作者 裴颂文 彭宇昂 +2 位作者 刘方鑫 陈铭松 张波 《小型微型计算机系统》 北大核心 2026年第1期142-149,共8页
后训练量化方法无需重新训练神经网络,且对数据集的依赖性小,是一种轻量且实用的模型压缩技术.然而,现有的量化范式未能有效地拟合post-Softmax激活的分布特性,并且在重新参数化post-LayerNorm激活后,精度不可避免地出现下降.因此,本文... 后训练量化方法无需重新训练神经网络,且对数据集的依赖性小,是一种轻量且实用的模型压缩技术.然而,现有的量化范式未能有效地拟合post-Softmax激活的分布特性,并且在重新参数化post-LayerNorm激活后,精度不可避免地出现下降.因此,本文提出了一种自适应动态选择量化尺度的变换器后训练量化框架DAQ-ViT.DAQ-ViT首先提出了一种基于偏度度量的缩放因子分布选择器,解决了post-LayerNorm激活存在显著的通道间变化所导致的精度下降问题.其次,针对post-Softmax和post-GELU激活分布特性,提出了满足分布特性的Sigmoid量化器.此外,提出了感知分布检测器,自适应感知激活值分布情况,从而动态选择Sigmoid量化和log2量化.实验结果表明,在没有输出重建的情况下与PTQ4ViT相比,DAQ-ViT进行4比特量化时,在DeiT-Tiny和DeiT-Small上的精度分别提高了20%和35%. 展开更多
关键词 模型压缩 模型量化 后训练量化 图像分类 视觉变换器
在线阅读 下载PDF
分布范围动态感知的扩散模型量化
15
作者 占瑞乙 樊轶 +5 位作者 周丽娜 谢宇宝 陈佳鑫 杨鸿宇 黄迪 王蕴红 《中国图象图形学报》 北大核心 2026年第3期745-754,共10页
目的扩散模型在图像生成、艺术创作等领域具有广泛的应用前景。然而,现有扩散模型存在存储开销大、推理时延长等问题。已有工作通过模型量化减少存储及推理时间消耗,但在量化过程中面临诸多挑战。一方面,噪声估计网络结构复杂,不同模块... 目的扩散模型在图像生成、艺术创作等领域具有广泛的应用前景。然而,现有扩散模型存在存储开销大、推理时延长等问题。已有工作通过模型量化减少存储及推理时间消耗,但在量化过程中面临诸多挑战。一方面,噪声估计网络结构复杂,不同模块对量化误差的敏感性存在显著差异;另一方面,其多采样时间步特性使量化模型在推理时存在误差累积问题。现有量化方法未能考虑模块间量化差异和多时间步推理特性,因而量化模型性能较全精度模型仍有较大差距。为此,设计了一种分布范围动态感知的训练后量化方法。方法在校准过程中,首先基于模块的量化误差对量化参数进行选择;再基于输入激活值的分布范围对不同网络模块中的量化参数进行微调;最后,依次计算全精度扩散模型与量化模型在每个采样时间步下估计噪声之间的均方误差,抑制多采样时间步推理过程中的累积量化误差。结果在CIFAR-10(Canadian Institute for Advanced Research)、LSUN-Bedroom(large-scale scene understanding)与LSUN-Church这3个公开数据集上采用DDIM(denoising diffusion implicit model)与LDM(latent diffusion model)两种扩散模型,使用不同量化位宽(W8A8,W4A8,W6A6),并与主流扩散模型量化方法进行对比。实验结果表明,所提方法将DDIM量化至W6A6时,在CIFAR-10数据集上取得了(IS:9.40,FID:4.61)的性能表现,与全精度DDIM性能(IS:9.12,FID:4.12)相近;相较于对比量化方法,所提方法将IS(inception score)值提高了0.34,FID(Frechet inception distance score)值降低了1.96。在LSUN-Church数据集上,相较于已有工作,所提方法量化LDM至W8A8时,将FID值降低了0.34。此外,所提方法与现有量化方法结合均能进一步取得一致性提升。结论本文所提出的分布范围动态感知的训练后量化方法同时考虑了扩散模型的多时间步推理特性与模块间量化差异,显著提升了量化扩散模型在低激活比特位宽上的性能,且该方法可作为即插即用模块与已有量化方法结合取得更优的性能。 展开更多
关键词 图像生成 扩散模型(DM) 模型压缩 推理加速 模型量化 训练后量化
原文传递
一种基于内存对齐的大模型混合精度量化方法
16
作者 李章明 关伟凡 +2 位作者 常政威 张凌浩 胡庆浩 《图学学报》 北大核心 2026年第1期39-46,共8页
随着大模型规模的不断增长,模型推理的内存占用和计算开销成为重要挑战。模型量化是降低模型资源消耗的有效方法,但现有方法在权重量化过程中存在离群点处理不足、量化精度损失显著以及内存访问效率低下等问题。为此,提出一种内存对齐... 随着大模型规模的不断增长,模型推理的内存占用和计算开销成为重要挑战。模型量化是降低模型资源消耗的有效方法,但现有方法在权重量化过程中存在离群点处理不足、量化精度损失显著以及内存访问效率低下等问题。为此,提出一种内存对齐的大模型混合精度量化方法,通过将模型参数表示成不同位宽的量化参数实现混合精度量化方法,在降低模型存储的同时缓解量化带来的精度损失问题。具体来说,基于小组显著性分析划分权重离群点,将模型参数按单指令多数据流(SIMD)单元对齐分组,并依据显著性对不同小组采用8 bit或2 bit量化;针对2 bit量化可能导致的精度损失,引入分块量化补偿策略。此外,设计了一种高效的混合精度权重打包与存储方案,通过位图(Bitmap)记录数据块位宽类型,支持随机访问。实验结果表明,该方法在保证模型精度的同时,显著降低了内存占用并提升了计算效率。通过在Llama2-7 B,13 B和70 B上进行验证,相比最先进的方法,在WikiText2和C4数据集上的困惑度(PPL)分别下降8.13,2.84,1.37及5.80,并且量化后的70 B模型相对BF16权重存储约减87%。此外在7个QA数据集上平均准确率提升6.24%。其结果表明,基于内存对齐的大模型混合精度量化方法能够同时提升压缩率、访存效率与模型性能。 展开更多
关键词 大模型压缩 训练后量化 低比特量化 混合精度量化 离群点划分
在线阅读 下载PDF
边缘联邦学习中的量化感知训练及安全挑战
17
作者 雷程宇 吴黎兵 +3 位作者 张壮壮 王恩澍 霍丽娟 冯佳琪 《小型微型计算机系统》 北大核心 2026年第4期927-936,共10页
传统量化模型虽能降低模型复杂度、降低推理开销,但其量化扰动也会带来一定的性能损失.量化感知训练旨在提高神经网络对量化扰动的鲁棒性.为了使联邦学习中的边缘设备在计算资源受限的情况下进行实时推理,本文将量化感知训练引入边缘联... 传统量化模型虽能降低模型复杂度、降低推理开销,但其量化扰动也会带来一定的性能损失.量化感知训练旨在提高神经网络对量化扰动的鲁棒性.为了使联邦学习中的边缘设备在计算资源受限的情况下进行实时推理,本文将量化感知训练引入边缘联邦学习场景,并提出了量化感知边缘联邦学习框架.在该框架中,量化后的全局模型部署在终端,并且不会产生过大性能损失,从而解决了边缘设备对用户推理需求实时快速响应与自身算力不足的矛盾.此外,本文发现在联邦学习中引入量化感知训练会带来一定的安全风险,攻击者可以利用量化感知训练恶意模型.进一步地,本文也提出了两种联邦量化攻击.实验结果表明本文所提方法在CIFAR10数据集上,使用ResNet18训练的全局模型在被量化至4-bit时仍保持62%的准确率,相较于传统的边缘联邦学习方法提升30%.另外,联邦量化攻击在8-bit量化下的攻击成功率相比现有工作提升10%. 展开更多
关键词 联邦学习 量化扰动 边缘联邦学习 量化感知训练
在线阅读 下载PDF
基于差分的多级量化共享密钥提取方案
18
作者 李琼 陈纯毅 +3 位作者 张振忠 于波 于海洋 胡小娟 《计算机应用》 北大核心 2026年第3期839-846,共8页
合法通信双方可以利用无线信道状态的随机特性提取符合信息论安全的共享密钥序列。为了提高无线信道提取密钥的效率,提出一种基于差分的多级量化共享密钥提取方案。该方案采用随机调制对无线信道进行高频采样,并引入融合随机抽样差分的... 合法通信双方可以利用无线信道状态的随机特性提取符合信息论安全的共享密钥序列。为了提高无线信道提取密钥的效率,提出一种基于差分的多级量化共享密钥提取方案。该方案采用随机调制对无线信道进行高频采样,并引入融合随机抽样差分的自适应符号量化(ASQ)和均衡化多比特修正量化(BMMQ)这2个算法处理一阶差分序列,以获得原始密钥序列。在此基础上,应用信息协商算法纠正原始密钥中不一致的比特,并使用原始密钥及一阶差分序列重构信号,再对该信号进行二次量化,最终实现合法通信双方的密钥同步。实验结果表明,随机抽样差分能够将相邻样本点之间的相关系数降低至e^(-1)以下,有效降低密钥序列中的统计依赖性;在信噪比(SNR)为25 dB的条件下,ASQ算法可在保持原始密钥提取率(OKER)为0.86的同时,将密钥不一致率(KDR)降低至3.8×10^(-5);在无损量化的条件下,BMMQ算法可以把KDR降低至7×10^(-3)。最终生成的共享密钥序列通过了NIST(National Institute of Standards and Technology)随机性测试,验证了密钥的安全性和有效性。 展开更多
关键词 无线信道 密钥提取 多级量化 随机抽样 信号重构
在线阅读 下载PDF
大语言模型低比特量化的历史、现状和未来:以复域量化为例
19
作者 丛培壮 王飞宇 +3 位作者 王国安 王砚舒 郑策 杨仝 《计算机研究与发展》 北大核心 2026年第2期276-293,共18页
随着大语言模型(large language model,LLM)参数规模的指数级增长,模型部署和推理面临着严峻的内存和计算资源挑战。量化技术作为模型压缩的核心方法,通过降低权重和激活值的数值精度,显著减少了模型的存储需求和计算开销。首先回顾了... 随着大语言模型(large language model,LLM)参数规模的指数级增长,模型部署和推理面临着严峻的内存和计算资源挑战。量化技术作为模型压缩的核心方法,通过降低权重和激活值的数值精度,显著减少了模型的存储需求和计算开销。首先回顾了量化技术的发展历程,从经典的Int8/4量化方法到前沿的超低比特量化算法,总结了典型方法的技术特征与性能演进规律,指出传统实数域量化在极低比特条件下存在受限于离散化误差的挑战,难以突破性能上限。为此,进而系统性地梳理了复域量化系列工作。该系列工作提出了基于复数域的量化范式,通过在参数表示中引入幅度与相位2个自由度,显著扩展了模型的表达空间;此外,类比信号处理中通过将时域信号进行傅里叶变换与低通滤波实现稳定表示的经典范式,进一步提出了由实数模型经复域变换与复域量化,达成了无乘法稳定推理的技术路线。实验结果表明,该方案在多个基准数据集上优于现有超低比特量化方法,有效突破了实数域模型的性能天花板,展现出复域量化在高效建模与性能保持方面的潜在价值。总体而言,通过对量化技术演进及复域量化系列研究的系统分析,旨在揭示超低比特量化的发展规律与未来趋势,为高效大模型的理论研究与工程实现提供参考。 展开更多
关键词 大语言模型 模型量化 低比特量化 模型压缩 复数模型
在线阅读 下载PDF
基于采样量化降维观测器的切换非线性系统非周期触发预定性能控制
20
作者 薛璐倩 王春艳 《燕山大学学报》 北大核心 2026年第1期55-67,共13页
针对具有未知控制方向和任意切换信号的切换非线性系统,研究了非周期事件触发输出反馈预定性能控制问题。首先基于采样量化输出,给出一种新的模型依赖的降维神经网络量化观测器来估计不可测状态,降低了系统观测成本。其次,提出一种新的... 针对具有未知控制方向和任意切换信号的切换非线性系统,研究了非周期事件触发输出反馈预定性能控制问题。首先基于采样量化输出,给出一种新的模型依赖的降维神经网络量化观测器来估计不可测状态,降低了系统观测成本。其次,提出一种新的依赖切换信号的非周期事件触发策略,该策略克服了现有文献中控制器与对应子系统同步切换的假设,也成功避免了常规触发机制中因子系统与匹配控制器异步运行对系统稳定性造成的不利影响。通过递归设计得到的输出反馈控制器保证了闭环系统的所有变量在任意切换下的一致有界性,并且系统的跟踪误差信号轨迹收敛到原点附近尽可能小的预定范围,实现了对具有未知控制方向的切换非线性系统的任意切换输出反馈控制。最后,仿真分析的结果验证了本文所提方法的正确性和有效性。 展开更多
关键词 切换非线性系统 量化降维观测器 非周期事件触发 预定性能 采样量化
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部