-
题名基于差分隐私保护的DP-DBScan聚类算法研究
被引量:28
- 1
-
-
作者
吴伟民
黄焕坤
-
机构
广东工业大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2015年第4期830-834,共5页
-
基金
广州市科技计划资助项目(2012Y2-00046)
-
文摘
差分隐私保护是一种基于数据失真的隐私保护方法,通过添加随机噪声使敏感数据失真的同时也保证数据的统计特性。针对DBScan聚类算法在聚类分析过程中会泄露隐私的问题,提出一种新的基于差分隐私保护的DP-DBScan聚类算法。在满足ε-差分隐私保护的前提下,DP-DBScan聚类算法在基于密度的DBScan聚类算法上引入并实现了差分隐私保护。算法能够有效地保护个人隐私,适用于不同规模和不同维度的数据集。实验结果表明,与DBScan聚类算法相比,DP-DBScan聚类算法在添加少量随机噪声的情况下能保持聚类的有效性并获得差分隐私保护。
-
关键词
差分隐私
DBSCAN
DP—DBScan
隐私保护
数据挖掘
-
Keywords
differential privacy
DBScan
dp-dbscan
privacy preserving
data mining
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名时空属性关系标签的频繁轨迹模式挖掘
被引量:4
- 2
-
-
作者
潘晓英
赵倩
赵普
-
机构
西安邮电大学计算机学院
西安邮电大学陕西省网络数据智能处理重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2019年第10期83-89,共7页
-
基金
陕西省教育厅专项科研项目(No.14JK1665)
西安邮电大学研究生创新基金项目(No.114-602080125)
-
文摘
校园卡技术的广泛应用是高校信息化程度的重要标志,其中学生消费数据隐含了强大的潜在价值,对其进行挖掘具备重大的实用意义。由此,提出一种将校园消费流水数据转换为带有时空属性的消费轨迹树DP-DBSCAN算法和带有关系标签的频繁轨迹挖掘模式FP-TRtree。DP-DBSCAN算法采用时间分块、顺序查询和距离度量,能高效地将数据转换为FP-TRtree带有顺序的频繁一项集,同时无需考虑参数问题,也避免了查询每个数据点最近邻对象的巨大耗时。FP-TRtree模式按顺序添加关系值,支持度降序排序,并对相同轨迹节点间的关系标签不断迭代优化。可视化分析结果表明,该数据转换算法和挖掘模式不但可以发现频繁消费的学生关系轨迹网及孤立人群,而且能定量描述节点间学生的消费亲密程度,同时也减少了数据库扫描次数以及树分支的建立。实验结果不仅符合学生实际消费情况,还能从复杂的消费网络中发现隐含的信息,为院校管理、领导决策提供可参照的依据。
-
关键词
dp-dbscan算法
一卡通数据
关系标签
FP-TRtree模式
可视化
-
Keywords
dp-dbscan algorithm
cartoon data
relationship label
FP-TRtree mode
visualization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-