自适应聚类中心个数选择:一种联邦学习的隐私效用平衡方法被引量：1

Adaptive Clustering Center Selection:A Privacy Utility Balancing Method for Federated Learning

下载PDF

导出

摘要联邦学习是一种分布式机器学习方法,它使多个设备或节点能够协作训练模型,同时保持数据的本地性。但由于联邦学习是由不同方拥有的数据集进行模型训练,敏感数据可能会被泄露。为了改善上述问题,已有相关工作在联邦学习中应用差分隐私对梯度数据添加噪声。然而在采用了相应的隐私技术来降低敏感数据泄露风险的同时,模型精度和效果因为噪声大小的不同也受到了部分影响。为解决此问题,该文提出一种自适应聚类中心个数选择机制(DP-Fed-Adap),根据训练轮次和梯度的变化动态地改变聚类中心个数,使模型可以在保持相同性能水平的同时确保对敏感数据的保护。实验表明,在使用相同的隐私预算前提下DP-Fed-Adap与添加了差分隐私的联邦相似算法(FedSim)和联邦平均算法(FedAvg)相比,具有更好的模型性能和隐私保护效果。 Objective Differential privacy,based on strict statistical models,is widely applied in federated learning.The common approach integrates privacy protection by perturbing parameters during local model training and global model aggregation to safeguard user privacy while maintaining model performance.A key challenge is minimizing performance degradation while ensuring strong privacy protection.Currently,an issue arises in early-stage training,where data gradient directions are highly dispersed.Directly applying initial data calculations and processing at this stage can reduce the accuracy of the global model.Methods To address this issue,this study introduces a differential privacy mechanism in federated learning to protect individual privacy while clustering gradient information from multiple data owners.During gradient clustering,the number of clustering centers is dynamically adjusted based on training epochs,with the rate of change in clusters aligned with the model training process.In the early stages,higher noise levels are introduced to enhance privacy protection.As the model converges,noise is gradually reduced to improve learning of the true data distribution.Result and discussions The first set of experimental results(Fig.3)shows that different fixed numbers of cluster centers lead to varying rates of change in training accuracy during the early and late stages of the training cycle.This suggests that reducing the number of cluster centers as training progresses benefits model performance,and the segmentation function is selected based on these findings.The second set of experiments(Fig.4)indicates that among four sets of model performance comparisons,our method achieves the highest accuracy in the later stages of training as the number of rounds increases.This demonstrates that adjusting the number of cluster centers during training has a measurable effect.As model training concludes,gradient directions tend to converge,and reducing the number of cluster centers improves accuracy.The performance comparison of the three models(Table 2)further shows that our proposed method outperforms others in most cases.Conclusions Comparative experiments on four publicly available datasets demonstrate that the proposed algorithm outperforms baseline methods in model performance after incorporating adaptive clustering center selection.Additionally,it ensures privacy protection for sensitive data while maintaining a more stable training process.The improved clustering strategy better aligns with the actual training dynamics,validating the effectiveness of this approach.

作者宁博宁一鸣杨超周新李冠宇马茜 NING Bo;NING Yi ming;YANG Chao;ZHOU Xin;LI Guan yu;MA Qian(School of Information Science and Technology,Dalian Maritime University,Dalian 116026,China;Information and Communication Branch of State Grid Liaoning Electric Power Co.,Ltd.,Shenyang 110000,China)

机构地区大连海事大学信息科学技术学院国网辽宁省电力有限公司信息通信分公司

出处《电子与信息学报》北大核心 2025年第2期519-529,共11页 Journal of Electronics & Information Technology

基金国家自然科学基金(61976032,62002039)。

关键词联邦学习差分隐私保护梯度聚类自适应选择 Federated Learning(FL) Differential privacy protection Gradient clustering Adaptive selection

分类号 TN919 [电子电信—通信与信息系统] TP309.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1李三希,曹志刚,崔志伟,高红伟,乔雪,翁翕,俞宁,张博宇,杨晓光.数字经济的博弈论基础性科学问题[J].中国科学基金,2021,35(5):782-800. 被引量：15
2刘艺璇,陈红,刘宇涵,李翠平.联邦学习中的隐私保护技术[J].软件学报,2022,33(3):1057-1092. 被引量：76
3张跃,朱友文,周玉倩,袁家斌.(ε,δ)-本地差分隐私模型下的均值估计机制[J].电子与信息学报,2023,45(3):765-774. 被引量：1
4郭鹏,钟尚平,陈开志,程航.差分隐私GAN梯度裁剪阈值的自适应选取方法[J].网络与信息安全学报,2018,4(5):10-20. 被引量：8

二级参考文献9

1周黎安,张维迎,顾全林,沈懿.信誉的价值:以网上拍卖交易为例[J].经济研究,2006,41(12):81-91. 被引量：158
2聂海峰.高考录取机制的博弈分析[J].经济学（季刊）,2007,6(3):899-916. 被引量：50
3魏立佳.中国高考录取与博士生录取的机制设计[J].经济学（季刊）,2009,8(4):349-362. 被引量：22
4叶青青,孟小峰,朱敏杰,霍峥.本地化差分隐私研究综述[J].软件学报,2018,29(7):1981-2005. 被引量：86
5冯登国,张敏,叶宇桐.基于差分隐私模型的位置轨迹发布技术研究[J].电子与信息学报,2020,42(1):74-88. 被引量：21
6刘睿瑄,陈红,郭若杨,赵丹,梁文娟,李翠平.机器学习中的隐私攻击与防御[J].软件学报,2020,31(3):866-892. 被引量：28
7王健宗,孔令炜,黄章成,陈霖捷,刘懿,卢春曦,肖京.联邦学习隐私保护研究进展[J].大数据,2021,7(3):130-149. 被引量：20
8Qiao XUE,Youwen ZHU,Jian WANG,Xingxin LI,Ji ZHANG.Locally differentially private distributed algorithms for set intersection and union[J].Science China(Information Sciences),2021,64(11):230-232. 被引量：2
9钱文君,沈晴霓,吴鹏飞,董春涛,吴中海.大数据计算环境下的隐私保护技术研究进展[J].计算机学报,2022,45(4):669-701. 被引量：76

共引文献96

1宋蕾,马春光,段广晗.机器学习安全及隐私保护研究进展.[J].网络与信息安全学报,2018,4(8):1-11. 被引量：27
2帅爱华,陈烨.大规模网络自适应安全阈值数据自动分割算法[J].自动化与仪器仪表,2019,0(11):33-36.
3方晨,郭渊博,王娜,甄帅辉,唐国栋.基于生成对抗网络的差分隐私数据发布方法[J].电子学报,2020,48(10):1983-1992. 被引量：12
4王正龙,张保稳.生成对抗网络研究综述[J].网络与信息安全学报,2021,7(4):68-85. 被引量：21
5欧阳日辉,龚伟.基于价值和市场评价贡献的数据要素定价机制[J].改革,2022(3):39-54. 被引量：116
6杨洁,董标,付雪,王禹,桂冠.基于轻量化分布式学习的自动调制分类方法[J].通信学报,2022,43(7):134-142. 被引量：4
7顾凌云.联邦学习技术在金融行业的应用研究[J].IT经理世界,2022,25(6):139-142.
8贾国伟,崔纪鹏,王顺兵,杨帆.科技助力反电信网络诈骗对策研究[J].山东警察学院学报,2022,34(2):126-131. 被引量：4
9安鹏,张卓晖,喻波.基于微服务与隐私计算技术的数据安全共享服务平台[J].信息安全研究,2022,8(10):1000-1007. 被引量：3
10周炜,王超,徐剑,胡克勇,王金龙.基于区块链的隐私保护去中心化联邦学习模型[J].计算机研究与发展,2022,59(11):2423-2436. 被引量：30

同被引文献13

1孟向前,刘腾飞,谢绒娜.面向联邦学习的学习率裁剪梯度优化隐私保护方案[J].北京电子科技学院学报,2023,31(1):45-53. 被引量：2
2赵月,何锦雯,朱申辰,李聪仪,张英杰,陈恺.大语言模型安全现状与挑战[J].计算机科学,2024,51(1):68-71. 被引量：67
3牟奕洋,陈涵霄,李洪伟.大语言模型的安全与隐私保护技术研究进展[J].网络空间安全科学学报,2024,2(1):40-49. 被引量：1
4朱友文,唐聪,吴启晖,张焱.个性化本地差分隐私机制的研究现状与展望[J].南京航空航天大学学报,2024,56(5):784-800. 被引量：2
5王乔晨,吴振刚,刘虎.大语言模型应用的安全与隐私问题综述[J].工业信息安全,2024(5):40-45. 被引量：8
6康海燕,吴思远.时空数据隐私保护共享的群体学习方法研究[J].南京师大学报（自然科学版）,2024,47(4):1-10. 被引量：3
7马文玉,陈谦,胡宇翔,闫皓楠,胡涛,伊鹏.面向联邦算力物联网的隐私预算自适应优化方案[J].物联网学报,2024,8(4):54-69. 被引量：2
8陈海田,陈学斌,马锐奎,张帅华.面向遥感数据的基于本地差分隐私的联邦学习隐私保护方案[J].计算机应用,2025,45(2):506-517. 被引量：2
9苏家兴,赵乙,李奥,谭崎,刘自轩,松永健宏,徐恪.兼顾高效与安全的松耦合跨域协作学习平台[J].网络空间安全科学学报,2024,2(6):74-85. 被引量：3
10黄河燕,李思霖,兰天伟,邱昱力,柳泽明,姚嘉树,曾理,单赢宇,施晓明,郭宇航.大语言模型安全性:分类、评估、归因、缓解、展望[J].智能系统学报,2025,20(1):2-32. 被引量：11

引证文献1

1党铮铮,王超,赵宁.大语言模型中的差分隐私保护研究[J].国外电子测量技术,2025,44(6):122-128.

1李勇.汽车发动机热效率提升路径探析[J].汽车测试报告,2024(19):5-7.
2柳玉莹.基于生态环保理念的节约型园林绿化构建途径分析[J].居业,2024(11):214-216. 被引量：2
3俞浩,范菁,孙伊航.异构联邦学习在无人系统中的研究综述[J].计算机应用研究,2025,42(3):641-649. 被引量：1
4李青.基于PID算法的市政照明集中控制系统设计[J].河南科技,2025,52(3):10-13.
5金兰兰,沈辉树,顾力天.浅谈上海北蔡楔形绿地结构性景观规划设计的四个维度[J].中国园林,2024,40(S02):15-19. 被引量：2
6刘璐,高浩城,陈伟,吴国全,魏峻.FineFlow:FaaS工作流部署优化与执行系统[J].软件学报,2025,36(2):488-510.
7孔凌浩,严鹏,刘晓,周朝,张翔宇,卢文波.爆破地震波中P波及S波初至自动识别方法[J].振动与冲击,2025,44(5):253-262.
8王晓晓,朱晓娟.基于自适应分层梯度压缩的分布式训练通信优化方法[J].湖北民族大学学报(自然科学版),2025,43(1):34-40.
9邹洁丽,张子华,高铁杠.考虑外部敌手的去中心化联邦学习梯度聚合协议[J].计算机系统应用,2025,34(3):14-26.
10邵宽,张镇勇,杨科迪,朱俊彦,王鑫,田有亮,马建峰.基于国密SM2的数字藏品网络拍卖隐私保护方法[J].软件学报,2025,36(3):1289-1303. 被引量：2

电子与信息学报

2025年第2期

浏览历史

内容加载中请稍等...

自适应聚类中心个数选择:一种联邦学习的隐私效用平衡方法被引量：1

参考文献4

二级参考文献9

共引文献96

同被引文献13

引证文献1

相关作者

相关机构

相关主题

浏览历史

自适应聚类中心个数选择:一种联邦学习的隐私效用平衡方法 被引量：1

参考文献4

二级参考文献9

共引文献96

同被引文献13

引证文献1

相关作者

相关机构

相关主题

浏览历史

自适应聚类中心个数选择:一种联邦学习的隐私效用平衡方法被引量：1