基于聚类的分级匿名方法被引量：5

Clustering-based approach for multi-level anonymization

下载PDF

导出

摘要为了防止链接攻击导致隐私的泄露,同时尽可能降低匿名保护时的信息损失,提出(λα,k)-分级匿名模型。该模型根据隐私保护的需求程度,将各敏感属性值划分为高、中、低三个等级类,通过隐私保护度参数λ灵活控制泄露风险。在此基础上,给出一种基于聚类的分级匿名方法。该方法采用一种新层次聚类算法,并针对准标识符中数值型属性与分类型属性采用灵活的概化策略。实验结果显示,该方法能够满足敏感属性的分级匿名保护需求,同时有效地减少信息损失。 To prevent the privacy disclosure caused by linking attack and reduce information loss resulting from anonymous protection, a （λα, k） multi-level anonymity model was proposed. According to the requirement of privacy preservation, sensitive attribute values could be divided into three levels： high, medium, and low. The risk of privacy disclosure was flexibly controlled by privacy protection degree parameter λ. On the basis of this, clustering-based approach for multi-level anonymization was proposed. The approach used a new hierarchical clustering algorithm and adopted more flexible strategies of data generalization for numerical attributes and classified attributes in a quasi-identifier. The experimental results show that the approach can meet the requirement of multi-level anonymous protection of sensitive attribute, and effectively reduce information loss.

作者桂琼程小辉

机构地区桂林理工大学信息科学与工程学院

出处《计算机应用》 CSCD 北大核心 2013年第2期412-416,共5页 journal of Computer Applications

基金国家自然科学基金资助项目(61262075) 广西高等学校重大科研项目(201201ZD012) 广西教育厅科研项目(200911LX119)

关键词隐私保护数据发布数据匿名分级聚类信息损失 privacy preservation data publishing data anonymization multi-level clustering information loss

分类号 TP309.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献15

1SWEENEY L. k-anonymity:a model for protecting privacy[J].International Journal on Uncertainty Fuzziness and Knowledgebased Systems,2002,(05):557-570.
2MEYERSON A,WILLIAMS R. On the complexity of optimal k-anonymity[A].New York:ACM,2004.223-228.
3AGGARWAL G,FEDER T,KENTHAPADI K. Anonymizing tables[A].Beilin:Springer-Verlag,2005.246-258.
4MACHANAVAJJHALA A,GEHRKE J,KIFER D. l-diversity:privacy beyond k-anonymity[A].Washington,DC:IEEE Computer Society,2006.24-35.
5LI N H,LI T C,VENKATASUBRAMANIAN S. t-closeness:privacy beyond k-anonymity and l-diversity[A].Washington,DC:IEEE Computer Society,2007.106-115.
6WONGRC-C,LIJY,FU AW-C. (α,k)-anonymity:an enhanced k-anonymity model for privacy-preserving data publishing[A].New York:ACM,2006.754-759.
7WONG R,LI J Y,FU A. (α,k)-anonymous data publishing[J].Journal of Intelligent Information Systems,2009,(02):209-234.doi:10.1007/s10844-008-0075-2.
8杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
9童云海,陶有东,唐世渭,杨冬青.隐私保护数据发布中身份保持的匿名方法[J].软件学报,2010,21(4):771-781. 被引量：45
10王智慧,许俭,汪卫,施伯乐.一种基于聚类的数据匿名方法[J].软件学报,2010,21(4):680-693. 被引量：50

二级参考文献64

1葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
2杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
3张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
4Sweeney L.Achieving k-anonymity privacy protection using generalization and suppression[J].International Journal on Uncertainty,Fuzziness and Knowldege-Based Systems,2002,10(5):571-588.
5Agrawal R,Srikant R.Privacy-preserving data mining[C]// Proc of SIGMOD 2000.New York:ACM.2000:439-450.
6Wong R,Li J,Fu A,et al.(alpha,k)-anonymity,An enhanced k-anonymity model for privacy-preserving data publishing[C] aProc of KDD2006.New York:ACM,2006:754-759.
7Aggrawal G,Feder T,Kenthapadi K,et al.Anomyrnizing tables[C] //Proc of ICDT 2005.Berlin:Springer,2005:236-258.
8Machanavajjhala A,Gehrke J.Kifer D.1-diversity:Privacy beyond k-anonymity[C] //Proc of ICDE 2006.Los Alamitoa,CA:IEEE Computer Society,2006:24-35.
9Lefevre K,Dewht D J.Ramakrishnan R.Incognhn: Efficient full domain k anonymity[C] //Proc of SIGMOD 2005.New York:ACM.2005:49-60.
10Fung BC M,Wang K,Yu P S.Top-down specialization for information and privacy preservation[C] //Proc of ICDE 2005.Los Alamitos.CA:IEEE Computer Society.2005:205-216.

共引文献202

1程林,丰江帆.多维敏感属性流数据发布的隐私保护方法[J].中国科技论文在线精品论文,2021(2):212-219. 被引量：1
2武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
3岑婷婷,韩建民,王基一,李细雨.隐私保护中K-匿名模型的综述[J].计算机工程与应用,2008,44(4):130-134. 被引量：18
4杨晓春,王雅哲,王斌,于戈.数据发布中面向多敏感属性的隐私保护方法[J].计算机学报,2008,31(4):574-587. 被引量：60
5黄立明,宋金玲,刘国华,张奇.视图的k-匿名化方法[J].计算机工程与应用,2008,44(17):115-118.
6宋金玲,黄立明,周国红,李玉香.视图发布的安全问题(综述)[J].河北科技师范学院学报,2008,22(2):76-80.
7宋金玲,黄立明,刘国华.k-匿名方法中准标识符的求解算法[J].小型微型计算机系统,2008,29(9):1688-1693. 被引量：7
8韩建民,岑婷婷,虞慧群.数据表k-匿名化的微聚集算法研究[J].电子学报,2008,36(10):2021-2029. 被引量：40
9宋金玲,刘国华,黄立明,朱彩云.k-匿名方法中相关视图集和准标识符的求解算法[J].计算机研究与发展,2009,46(1):77-88. 被引量：7
10李太勇,唐常杰,吴江,周敏.基于两次聚类的k-匿名隐私保护[J].吉林大学学报（信息科学版）,2009,27(2):173-178. 被引量：1

同被引文献43

1张岐山,郑丽君.基于灰关联分析的V-MDAV算法研究[J].计算机应用研究,2020,37(1):107-111. 被引量：3
2杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
3XU Yang,MA Tinghuai,TANG Meili,et al.A survey of privacy preserving data publishing using generalization and suppression[J].Applied Mathematics & Information Sciences,2014,8(3):1103-1116.
4Sweeney L.k-anonymity:A model for protecting privacy[J].International Journal of Uncertainty,Fuzziness and Knowledge based Systems,2002,10(5):557-570.
5WONG Chiwing,LI Jiuyongi FU Waichee,et al.(α,k)-anonymity:An enhanced k-anonymity model for privacy preserving data publishing[C]//Proceeding of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM,2006:754-759.
6Tassa T,Mazza A,Gionis A.k-Concealment:An alternative model of k-type anonymity[J].Transactions on Data Privacy,2012,5(1):189-222.
7Sarowar Sattar A H M,LI Jiuyong,DING Xiaofeng,et al.A general framework for privacy preserving data publishing[J].Knowledge-Based Systems,2013,54(4):276-287.
8Machanavajjhala A,Kifer D,Gehrke J.l-diversity:Privacy beyond k-anonymity[J].ACM Transactions on Knowledge Discovery from Data,2007,1(1):1-52.
9SUN Xiaoxun,LI Min,WANG Hua.A family of enhanced(L,α)-diversity models for privacy preserving data publishing[J].Future Generation Computer Systems,2011,27(3):348-356.
10Abdalaal A,Nergiz M E,Saygin Y.Privacy-preserving publishing of opinion polls[J].Computers & Security,2013,37(3):143-154.

引证文献5

1谢静,张健沛,杨静,张冰.相异敏感度下最小信息损失增量优先的隐私保护方法[J].中南大学学报（自然科学版）,2015,46(12):4548-4555. 被引量：1
2张付霞,蒋朝惠.面向分类型敏感属性的分级匿名算法[J].计算机应用研究,2016,33(7):2181-2185. 被引量：3
3李丹,凌捷.一种基于变长聚类的个性化匿名保护方法[J].计算机工程与应用,2018,54(8):85-90. 被引量：3
4石昆正,张攀峰,董明刚.基于敏感分级信息熵的匿名方法[J].计算机应用与软件,2024,41(5):319-326.
5敬超,肖链,谭华,张攀峰.面向缺损敏感属性的加权信息熵匿名算法[J].计算机应用与软件,2025,42(2):330-335.

二级引证文献7

1李丹,凌捷.一种基于变长聚类的个性化匿名保护方法[J].计算机工程与应用,2018,54(8):85-90. 被引量：3
2钱榕,周娟,金鑫.基于自组织聚类的多敏感属性数据发布算法[J].济南大学学报（自然科学版）,2018,32(6):463-468.
3王静宇,魏立香.基于属性敏感度度量的ATN模型[J].内蒙古科技大学学报,2018,37(3):270-277. 被引量：2
4蒲东,方睿.个性化(p,α,k)-匿名隐私保护算法[J].计算机应用与软件,2020,37(2):301-307. 被引量：9
5从传锋,杨桢.基于大数据模式分解的隐私信息保护方法仿真[J].计算机仿真,2021,38(6):251-254. 被引量：7
6张婷.基于无限深度神经网络的非平衡大数据集群匿名化调度算法[J].计算技术与自动化,2022,41(3):71-76. 被引量：4
7张付霞.基于多维桶分组技术改进算法对电子病历隐私信息研究[J].计算机应用与软件,2024,41(2):86-92. 被引量：1

1何贤芒,陈银冬,李东,郝艳妮.基于环概化的半同构泛化算法研究[J].计算机研究与发展,2015,52(10):2382-2394.
2龚奇源,杨明,罗军舟.面向缺失数据的数据匿名方法[J].软件学报,2013,24(12):2883-2896. 被引量：6
3王智慧,许俭,汪卫,施伯乐.一种基于聚类的数据匿名方法[J].软件学报,2010,21(4):680-693. 被引量：50
4龚奇源,杨明,罗军舟.面向关系-事务数据的数据匿名方法[J].软件学报,2016,27(11):2828-2842. 被引量：4
5熊平,朱天清.基于杂度增益与层次聚类的数据匿名方法[J].计算机研究与发展,2012,49(7):1545-1552. 被引量：6
6郭昆,张岐山.基于聚类的快速数据流匿名方法[J].软件学报,2013,24(8):1852-1867. 被引量：5
7熊平,朱天清,顾霄.基于信息增益比例约束的数据匿名方法及其评估机制[J].计算机应用研究,2014,31(3):819-824. 被引量：2
8焉凯,何贤芒.基于局部聚类的数据匿名化算法[J].计算机应用研究,2012,29(1):148-151. 被引量：5
9秦晓薇,门爱华,邹妍.基于K-匿名的隐私保护算法研究[J].赤峰学院学报（自然科学版）,2010,26(5):14-16. 被引量：2
10王玉健.基于增量更新视域的数据库隐私保护方法探讨[J].计算机光盘软件与应用,2014,17(19):212-212.

计算机应用

2013年第2期

浏览历史

内容加载中请稍等...

基于聚类的分级匿名方法被引量：5

参考文献15

二级参考文献64

共引文献202

同被引文献43

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于聚类的分级匿名方法 被引量：5

参考文献15

二级参考文献64

共引文献202

同被引文献43

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于聚类的分级匿名方法被引量：5