期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
南华北盆地科学实验场隐伏断裂系统Mini Batch K-means聚类研究
1
作者 许军 李丛 +6 位作者 张栋 张垚垚 袁青松 董果果 张馨元 瓮纪昌 刘炎昊 《地球物理学进展》 北大核心 2025年第5期2014-2027,共14页
南华北盆地西北缘主力层段山西组—太原组发育多期次断裂.该区非均质性较强、裂隙形成机制复杂、小尺度隐伏断裂比较发育,利用常规预测手段获得的小尺度裂缝边界特征模糊,精度较低,严重制约了深部煤系气的开发进程.因此,亟需寻找一种适... 南华北盆地西北缘主力层段山西组—太原组发育多期次断裂.该区非均质性较强、裂隙形成机制复杂、小尺度隐伏断裂比较发育,利用常规预测手段获得的小尺度裂缝边界特征模糊,精度较低,严重制约了深部煤系气的开发进程.因此,亟需寻找一种适合于研究区的隐伏构造预测方法.本文以JF1井区为例,提出融合灰度共生矩阵的纹理分析和Mini Batch K-means深度聚类的隐伏断裂识别方法.首先,本文采用时变分频反褶积技术进行了拓频处理,获取了宽频带的叠后地震数据.然后,通过优化三维滑动窗口尺度和灰度级数,在滑动窗口按照指定的真倾角和方位角生成灰度共生矩阵,分别提取熵、差异性、均一性及能量的纹理特征.将基于真倾角、方位角约束的纹理属性作为样本数据,设定Mini Batch K-means初始聚类中心,优化小批量数据子集,建立适合JF1井区的Mini Batch Kmeans深度学习模型.最后,基于智能蚁群算法优选裂缝优势路径,结合连续裂缝网格的粗化网格,构建小尺度连续缝网模型,可以获得局部隐伏断裂系统的连通性规律.结果表明,小批量、分批次的Mini Batch Kmeans算法对隐伏断裂系统分析具有重要作用.Mini Batch K-means深度学习模型和小尺度连通性预测方法对南华北盆地JF1井区隐伏断裂发育区的预测具有较好的应用效果. 展开更多
关键词 mini batch K-means 时变分频反褶积 灰度共生矩阵 连通性 隐伏断裂系统
原文传递
基于TFIDF+LDA和Mini Batch K⁃means算法的在线课程推荐方法研究 被引量:2
2
作者 严武军 王丽蓉 《现代计算机》 2023年第23期15-20,共6页
在线教育资源急剧增长让学习者难以抉择,研究在线课程分类推荐,能帮助学习者快速获取所需资源。首先将潜在狄利克雷分配算法融入词频-逆向文件频率算法对数据进行预处理,生成词向量矩阵;之后采用Mini Batch K-means算法训练聚类模型,并... 在线教育资源急剧增长让学习者难以抉择,研究在线课程分类推荐,能帮助学习者快速获取所需资源。首先将潜在狄利克雷分配算法融入词频-逆向文件频率算法对数据进行预处理,生成词向量矩阵;之后采用Mini Batch K-means算法训练聚类模型,并采用T分布随机邻域嵌入降维算法对训练结果进行可视化分析。实验采用从Pluralsight在线课程API获取8016条数据进行实验,实验结果表明融入潜在狄利克雷分配算法的词频-逆向文件频率算法效果更好。 展开更多
关键词 词频逆向文件频率 潜在狄利克雷分配 mini batch K-means 在线课程推荐
在线阅读 下载PDF
改进Mini Batch K-Means时间权重推荐算法 被引量:7
3
作者 徐慧君 王忠 +2 位作者 马丽萍 饶华 何承恩 《计算机工程》 CAS CSCD 北大核心 2020年第3期73-78,86,共7页
传统的协同过滤算法存在数据稀疏、可扩展性弱和用户兴趣度偏移等问题,算法运行效率和预测精度偏低。针对上述问题,提出一种改进的Mini Batch K-Means时间权重推荐算法。采用Pearson相关系数改进Mini Batch K-Means聚类,利用改进的聚类... 传统的协同过滤算法存在数据稀疏、可扩展性弱和用户兴趣度偏移等问题,算法运行效率和预测精度偏低。针对上述问题,提出一种改进的Mini Batch K-Means时间权重推荐算法。采用Pearson相关系数改进Mini Batch K-Means聚类,利用改进的聚类算法对稀疏评分矩阵进行聚类,计算用户兴趣评分并完成对稀疏矩阵的填充。考虑用户兴趣随时间变化的影响,引入牛顿冷却时间权重计算相似度,并基于已填充评分矩阵进行相似度加权计算,得到项目最终评分。实验结果表明,与传统协同过滤算法相比,该算法的平均绝对误差下降了31.08%,准确率、召回率、F1值均有较大提升,具有较高的评分预测精确度和准确度。 展开更多
关键词 协同过滤 预测填充 Pearson相关系数 mini batch K-Means聚类 牛顿冷却定律
在线阅读 下载PDF
基于在线梯度下降的Mini Batch K-Prototypes算法
4
作者 贾子琪 万世昌 +2 位作者 张腾飞 吉康毅 常雪瑞 《南阳理工学院学报》 2023年第4期45-49,共5页
K-Prototypes算法每次迭代都需要花费大量时间来计算所有样本与每个簇中心的相异度以将其划分到各个聚类簇中,这导致K-Prototypes算法在处理大型数据集时运行时间急剧增加。根据在线梯度下降算法对K-Prototypes算法的迭代过程进行优化,... K-Prototypes算法每次迭代都需要花费大量时间来计算所有样本与每个簇中心的相异度以将其划分到各个聚类簇中,这导致K-Prototypes算法在处理大型数据集时运行时间急剧增加。根据在线梯度下降算法对K-Prototypes算法的迭代过程进行优化,减少算法每次迭代所需的计算量从而降低算法的时间复杂度,提升算法运行效率。实验结果表明,提出的基于在线梯度下降的K-Prototypes聚类算法,可以在不影响算法收敛性和有效性的前提下降低算法的时间复杂度,提升算法运行效率。 展开更多
关键词 K-Prototypes mini batch K-Prototypes 在线梯度下降
在线阅读 下载PDF
An Optimisation Strategy for Electric Vehicle Charging Station Layout Incorporating Mini Batch K-Means and Simulated Annealing Algorithms
5
作者 Haojie Yang Xiang Wen Peng Geng 《Journal on Artificial Intelligence》 2024年第1期283-300,共18页
To enhance the rationality of the layout of electric vehicle charging stations,meet the actual needs of users,and optimise the service range and coverage efficiency of charging stations,this paper proposes an optimisa... To enhance the rationality of the layout of electric vehicle charging stations,meet the actual needs of users,and optimise the service range and coverage efficiency of charging stations,this paper proposes an optimisation strategy for the layout of electric vehicle charging stations that integrates Mini Batch K-Means and simulated annealing algorithms.By constructing a circle-like service area model with the charging station as the centre and a certain distance as the radius,the maximum coverage of electric vehicle charging stations in the region and the influence of different regional environments on charging demand are considered.Based on the real data of electric vehicle charging stations in Nanjing,Jiangsu Province,this paper uses the model proposed in this paper to optimise the layout of charging stations in the study area.The results show that the optimisation strategy incorporating Mini Batch K-Means and simulated annealing algorithms outperforms the existing charging station layouts in terms of coverage and the number of stations served,and compared to the original charging station layouts,the optimised charging station layouts have flatter Lorentzian curves and are closer to the average distribution.The proposed optimisation strategy not only improves the service efficiency and user satisfaction of EV(Electric Vehicle)charging stations but also provides a reference for the layout optimisation of EV charging stations in other cities,which has important practical value and promotion potential. 展开更多
关键词 mini batch K-Means simulated annealing algorithm electric vehicle charging stations layout optimisation
在线阅读 下载PDF
WSN中基于Mini Batch K-Means与SVM的入侵检测方案 被引量:2
6
作者 欧阳潇琴 王秋华 《软件导刊》 2020年第3期204-209,共6页
无线传感器网络通常部署在复杂的户外环境,易遭受各种攻击。多数入侵检测系统均采用数据挖掘算法对网络数据包进行分析,但在处理大样本集时,其效率明显降低。针对这一缺点,提出一种基于Mini Batch K-Means和SVM的入侵检测方案。该方案... 无线传感器网络通常部署在复杂的户外环境,易遭受各种攻击。多数入侵检测系统均采用数据挖掘算法对网络数据包进行分析,但在处理大样本集时,其效率明显降低。针对这一缺点,提出一种基于Mini Batch K-Means和SVM的入侵检测方案。该方案首先分别对正常行为特征库和异常行为特征库进行Mini Batch K-Means聚类,取得类中心作为各类的代表样本并赋予权值,将其传入SVM分类器作为训练数据,得到分类超平面,通过该超平面对待测样本作出判断。解决了如K-Means、KNN、SVM等传统数据挖掘算法在大数据样本集数据分析中面临的低效问题。仿真结果表明,该方案能快速准确地判断样本类别,其检测率达到98.7%。与K-Means、KNN和SVM相比,不仅达到了同样高的检测率,而且明显提高了入侵检测的时间效率。 展开更多
关键词 无线传感器网络 入侵检测 mini batch K-MEANS聚类算法 SVM算法
在线阅读 下载PDF
Mini Batch K-means算法在遥感影像分类中的应用 被引量:5
7
作者 修瑛昌 杨文静 《鲁东大学学报(自然科学版)》 2017年第4期359-363,共5页
作为K-means算法的优化算法,Mini Batch K-means算法在遥感影像分类中的应用较少.分别利用Mini Batch K-means算法与K-means算法对10个不同幅度的EVI遥感影像数据进行分类.对比两种分类算法的精度和时间复杂度发现,相比于K-means算法,Mi... 作为K-means算法的优化算法,Mini Batch K-means算法在遥感影像分类中的应用较少.分别利用Mini Batch K-means算法与K-means算法对10个不同幅度的EVI遥感影像数据进行分类.对比两种分类算法的精度和时间复杂度发现,相比于K-means算法,Mini Batch K-means虽然损失了小部分的精度,但却极大提高了分类效率,更适用于大数据量的遥感影像分类. 展开更多
关键词 mini batch K-MEANS K-MEANS 分类 遥感影像
在线阅读 下载PDF
基于Mini-batch神经网络的船舶柴油机风险等级预测 被引量:1
8
作者 尚前明 王潇 +2 位作者 曹召 刘治江 邓晓光 《中国修船》 2018年第4期35-40,共6页
文章针对现有的船舶柴油机健康管理智能化程度不高、管理技术落后等问题,引入神经网络风险预测方法。提出Mini-batch梯度下降方法,通过在网络训练不同阶段使用不同权重的训练样本,提升原有全量梯度下降算法预测模型不准确和较难更新等... 文章针对现有的船舶柴油机健康管理智能化程度不高、管理技术落后等问题,引入神经网络风险预测方法。提出Mini-batch梯度下降方法,通过在网络训练不同阶段使用不同权重的训练样本,提升原有全量梯度下降算法预测模型不准确和较难更新等问题。并从船舶柴油机在一次机务风险所承担的风险着手,建立设备健康风险状态的综合评价指标体系,通过Minibatch梯度下降优化了风险等级分类器。结果表明,该方法能够对柴油机风险等级进行有效预测。 展开更多
关键词 船舶柴油机 mini-batch梯度下降 风险等级预测 神经网络
在线阅读 下载PDF
复杂背景下基于YCbCr颜色空间和Mini-Batch聚类的肤色检测 被引量:3
9
作者 陈涛 云利军 +1 位作者 程飞燕 王坤 《云南师范大学学报(自然科学版)》 2017年第5期27-33,共7页
针对复杂背景下的人体彩色图像,提出了一种基于YCbCr颜色空间和Mini-Batch聚类的肤色检测算法.算法首先将目标图像转换到YCbCr颜色空间,并在Cb和Cr分量上进行统计建模,得出肤色阈值的高斯分布模型;然后采用Mini-Batch聚类算法在Cb和Cr... 针对复杂背景下的人体彩色图像,提出了一种基于YCbCr颜色空间和Mini-Batch聚类的肤色检测算法.算法首先将目标图像转换到YCbCr颜色空间,并在Cb和Cr分量上进行统计建模,得出肤色阈值的高斯分布模型;然后采用Mini-Batch聚类算法在Cb和Cr分量上对肤色进行聚类分割,并对分割出的肤色区域进行面积过滤和区域归并,最终获得完整的肤色区域.仿真结果表明,相比传统算法,该算法对光照变化具有很好的鲁棒性,在背景复杂的人体图像中,能够得到较为完整、准确的肤色区域;同时该算法对大尺寸的图像具有较高处理效率. 展开更多
关键词 mini-batch聚类 YCBCR颜色空间 肤色检测 聚类分割 区域归并
在线阅读 下载PDF
高清彩色图像分割的Mini-batch FCM算法研究
10
作者 倪翠 李千 玄甲辉 《现代信息科技》 2019年第19期15-17,共3页
模糊C-均值(Fuzzy C-Means,FCM)聚类算法是一种基于划分的无监督聚类算法,也是较为常见的图像分割算法之一,该算法通过寻找0~1之间的模糊隶属度等级来进行图像分割,并通过在特征空间中寻找聚类中心来达到最小化目标函数的目的。它的局... 模糊C-均值(Fuzzy C-Means,FCM)聚类算法是一种基于划分的无监督聚类算法,也是较为常见的图像分割算法之一,该算法通过寻找0~1之间的模糊隶属度等级来进行图像分割,并通过在特征空间中寻找聚类中心来达到最小化目标函数的目的。它的局限性主要有实时性较差、初始聚类中心的设置对最终结果影响较大、未考虑空间因素导致抗噪性弱。本文将mini-batch方法应用到FCM算法中,加快了FCM算法的收敛速度,提高了算法的效率及时效性,一定程度上解决了当数据特征复杂、集合较大时,FCM算法的实时性不是很理想的问题,继而节省算法运行的时间。 展开更多
关键词 FCM聚类 mini-batch 图像分割
在线阅读 下载PDF
联邦学习的社群化制造韧性能力预测建模 被引量:1
11
作者 张富强 王浩杰 +1 位作者 惠记庄 丁凯 《西安交通大学学报》 北大核心 2025年第8期11-19,共9页
针对社群化制造资源分散化布局的特点,以及传统集中式建模面临的数据隐私与信息孤岛等问题,提出了一种基于联邦学习的韧性能力预测框架,从多角度分析不同因素对产品生产加工工时的影响。首先,考虑不同工序中断情况,以订单交付周期为目... 针对社群化制造资源分散化布局的特点,以及传统集中式建模面临的数据隐私与信息孤岛等问题,提出了一种基于联邦学习的韧性能力预测框架,从多角度分析不同因素对产品生产加工工时的影响。首先,考虑不同工序中断情况,以订单交付周期为目标函数,搭建了工时扰动模型计算损失时间,进而基于分布式学习范式,搭建了联邦学习网络模型;其次,设计了联邦小批量梯度下降(FedMBGD)算法,明确算法流程并进行本地训练;最后,结合工时扰动模型和算法,对社群化制造的韧性能力进行预测,通过与其他算法的对比,验证了所提算法的可行性与有效性。研究结果表明:所提出的算法能够显著提升收敛性与寻优能力,可将预测精确度提高至90%以上,并且在不共享原始数据的前提下,实现了社群化制造韧性的动态精准预测,解决了数据隐私与协同建模之间的矛盾。该研究为社群化制造模式下韧性能力预测提供了理论参考,为隐私数据的算法训练、参数上传及信息共享提供了一定的指导意义。 展开更多
关键词 社群化制造 工时扰动 联邦小批量梯度下降算法 韧性能力预测
在线阅读 下载PDF
求解多核学习的自适应随机递归梯度下降法 被引量:1
12
作者 王梅 任怡果 +1 位作者 刘勇 王志宝 《计算机技术与发展》 2025年第7期93-99,共7页
针对随机递归梯度法(SARAH)求解多核学习(MKL)的不足之处,如收敛速度缓慢以及计算成本高等问题,该文提出一种改进算法——基于随机Polyak步长(SPS)的小批量随机递归梯度下降算法(SPS-MSARAH)来求解多核学习优化问题。首先将小批量方法... 针对随机递归梯度法(SARAH)求解多核学习(MKL)的不足之处,如收敛速度缓慢以及计算成本高等问题,该文提出一种改进算法——基于随机Polyak步长(SPS)的小批量随机递归梯度下降算法(SPS-MSARAH)来求解多核学习优化问题。首先将小批量方法引入随机方差缩减类算法中,选取一个固定大小的样本集代替单个训练样本计算SARAH的梯度,降低传统随机梯度下降算法使用单个样本计算梯度导致较大的波动和不稳定性所带来的方差。在此基础上,使用随机Polyak步长自适应地更新小批量SARAH的步长,使得优化过程更加灵活和鲁棒,从而解决随机优化算法中步长选取的难题。为了验证该算法的有效性,在标准数据集上进行了详细的数值实验。实验结果显示,在求解大规模多核学习优化问题时,SPS-MSARAH算法不仅显著提高了收敛速度,还有效降低了计算复杂度。此外,对初始参数的敏感性问题也得到了很好的克服,展现出良好的鲁棒性。 展开更多
关键词 多核学习 随机递归梯度下降法 随机Polyak步长 小批量 凸优化
在线阅读 下载PDF
基于动力学参数辨识的两轮机器人平衡控制 被引量:1
13
作者 董慧芬 姚勤燃 王俊峰 《控制工程》 北大核心 2025年第2期345-353,共9页
针对非同轴两轮机器人平衡控制算法设计过程中,机器人动力学建模不精准导致控制器设计困难的问题,提出一种基于小批量梯度下降法的极大似然估计参数辨识方法。首先,用欧拉-拉格朗日方法建立两轮机器人动力学模型;然后,根据激励轨迹用极... 针对非同轴两轮机器人平衡控制算法设计过程中,机器人动力学建模不精准导致控制器设计困难的问题,提出一种基于小批量梯度下降法的极大似然估计参数辨识方法。首先,用欧拉-拉格朗日方法建立两轮机器人动力学模型;然后,根据激励轨迹用极大似然估计方法进行动力学模型参数辨识;最后,用辨识参数和三维软件计算参数分别设计线性二次型调节器平衡控制算法,提升机器人倾角的控制精度。实验结果表明,该方法得到的动力学模型与真实模型的拟合度达到92.5%,基于此方法设计的控制器平衡控制效果显著,在静态和动态下均具有良好的平衡性能。 展开更多
关键词 参数辨识 两轮机器人 小批量梯度下降 极大似然估计 线性二次型调节器
原文传递
基于信任关系的非线性表征潜在因子模型
14
作者 潘天艺 宋燕 《电子科技》 2025年第2期53-61,共9页
针对高维稀疏无向网络挖掘实体间潜在关联信息的表征能力较弱和计算效率较低的问题,文中在社交推荐模型框架下提出了一种基于信任关系的非负非线性表征潜在因子模型。该模型通过非线性映射塑造潜在矩阵的特征空间,既保证了目标矩阵的非... 针对高维稀疏无向网络挖掘实体间潜在关联信息的表征能力较弱和计算效率较低的问题,文中在社交推荐模型框架下提出了一种基于信任关系的非负非线性表征潜在因子模型。该模型通过非线性映射塑造潜在矩阵的特征空间,既保证了目标矩阵的非负性,又提高了模型的表征能力。通过在模型训练的目标函数中引入图拉普拉斯正则化项保证了信任关系映射前后的结构一致性。基于6个公开数据集的对比实验结果表明,所提模型较其他模型具有明显的优越性。 展开更多
关键词 高维稀疏无向网络 社交推荐模型 信任关系 非负非线性 特征空间 图拉普拉斯正则化 潜在因子模型 小批量梯度下降法
在线阅读 下载PDF
基于CCSS十年追踪调查的学生留言文本分析
15
作者 刘哲 单剑锋 杨立军 《软件导刊》 2025年第9期34-40,共7页
通过调查问卷定期收集大学生的意见是高校提高办学质量的重要举措,问卷中的留言在很大程度上可以体现出学生的诉求、期待与评价。然而,学生留言往往是只言片语,存在词汇稀疏、语义特征匮乏等问题。为此,提出一种改进的Mini-Batch K-Mean... 通过调查问卷定期收集大学生的意见是高校提高办学质量的重要举措,问卷中的留言在很大程度上可以体现出学生的诉求、期待与评价。然而,学生留言往往是只言片语,存在词汇稀疏、语义特征匮乏等问题。为此,提出一种改进的Mini-Batch K-Means聚类算法,通过使用聚类方法将短文本按照相似度大小变换成长文本作为LDA模型的输入。改进算法每次迭代只使用部分数据,通过随机抽样来处理大规模数据集,在抽样样本批次内找出新的聚类中心,然后将该聚类中心更新到全局聚类中心中,有助于稳定聚类中心的更新,并提供更准确的聚类结果。实验结果表明,改进聚类方法所需运行时间可维持在10 s以内,模型平均PMI值最高提升了15.1%。文本分析结果显示,10年来,大学生在就业机会、专业、社会实践、课程、教育资源等方面表现出较为稳定的关注程度,个别年份突出关注宿舍等个性化问题。 展开更多
关键词 学生留言 mini-batch K-Means聚类算法 主题模型 LDA TF-IDF
在线阅读 下载PDF
基于机器学习的K-Means聚类优化算法研究 被引量:4
16
作者 李贞 刘海燕 +2 位作者 刘策 李庆钰 刘刚 《数据挖掘》 2022年第1期20-26,共7页
K均值聚类(K-Means)算法是基于划分的聚类算法中的一个典型算法,是机器学习研究算法的基础。通过将相似的样本自动归到一个类别,合理地确定K值和K个初始类簇中心点,使聚类效果更好。经过适当的预处理,可以对数据做初步分析,甚至挖掘出... K均值聚类(K-Means)算法是基于划分的聚类算法中的一个典型算法,是机器学习研究算法的基础。通过将相似的样本自动归到一个类别,合理地确定K值和K个初始类簇中心点,使聚类效果更好。经过适当的预处理,可以对数据做初步分析,甚至挖掘出隐含的价值信息。相比于SVM、GBDT等机器学习算法,具有操作简单、采用误差平方和准则函数、对大数据集处理上有较高的伸缩性和可压缩性的优点。但是,这种聚类算法仍然存在随机初始聚类中心导致算法不稳定、K值的选取不好把握、非凸性数据集非常难收敛等问题。为提升数据挖掘中聚类分析的效果,本文在分析数据挖掘、聚类分析、传统K-Means算法的基础上,提出一种改进的K-Means算法,经过实验证明,K-Means的改进算法可以有效地提高簇的质量,以及算法的效率和稳定性,使其提供更加精准有效的服务,并且减少了算法开销。 展开更多
关键词 改进K-MEANS算法 mini batch K-Means算法 数据挖掘
在线阅读 下载PDF
基于Fibonacci采样的数据预处理方法研究 被引量:11
17
作者 邓泓 刘志超 +2 位作者 彭莹琼 舒晴 何火娇 《江西师范大学学报(自然科学版)》 CAS 北大核心 2021年第1期60-66,共7页
提高神经网络(NN)的收敛速率和预测精度一直是人工智能领域的一个挑战性问题,尽管许多研究人员已在研究中使用小批量数据训练神经网络获得了较好的效果,但是这些方法并不够灵活.针对这个问题,该文提出了一种新的数据预处理算法即Fibona... 提高神经网络(NN)的收敛速率和预测精度一直是人工智能领域的一个挑战性问题,尽管许多研究人员已在研究中使用小批量数据训练神经网络获得了较好的效果,但是这些方法并不够灵活.针对这个问题,该文提出了一种新的数据预处理算法即Fibonacci采样算法.根据Fibonacci数列规则绘制一个新的训练数据序列,这不仅可以恢复小批量数据的划分,而且还可以提供更灵活的批量规模的选择.实验结果表明:在梯度下降之前,Fibonacci数据划分序列能得到较好的实验结果.在应用于相同的单个CNN(5层卷积神经网络)和AlexNet中,Fibonacci采样算法比传统的小批量梯度下降算法能获得更高的准确度和更低的损失值,并且在几种通用网络(LeNet、AlexNet、VGG-16、GoogLeNet)上的性能也取得显著提升. 展开更多
关键词 小批量 Fibonacci采样 神经网络
在线阅读 下载PDF
满足本地差分隐私的分类变换扰动机制 被引量:6
18
作者 朱素霞 王蕾 孙广路 《计算机研究与发展》 EI CSCD 北大核心 2022年第2期430-439,共10页
本地差分隐私作为一种隐私保护技术,被广泛用于连续数值型数据的均值估计,使用的扰动机制将直接影响均值的准确度.为进一步提高均值估计的准确性,提出了一种满足差分隐私的分类变换扰动机制.该机制对连续数值型数据划分变换范围并进行分... 本地差分隐私作为一种隐私保护技术,被广泛用于连续数值型数据的均值估计,使用的扰动机制将直接影响均值的准确度.为进一步提高均值估计的准确性,提出了一种满足差分隐私的分类变换扰动机制.该机制对连续数值型数据划分变换范围并进行分段,根据分段将其变换为1维二元分类数据.转换后使用随机响应机制进行扰动,再根据扰动后的数据标识的数值段从中随机均匀抽取数值作为扰动值.在真实数据和合成数据中的均值估计实验结果表明该机制极大地提高了准确性.除此之外,将分类变换扰动机制用于构建满足本地差分隐私的小批量梯度下降算法,并完成线性回归学习任务,实验结果证明该方法同样优于其他已有机制,可得到更小的均方误差. 展开更多
关键词 本地差分隐私 数据转换 均值估计 小批量梯度下降 随机响应
在线阅读 下载PDF
基于去噪自编码器网络特征降维与改进小批优化K均值算法的海量用户用电行为聚类及分析 被引量:14
19
作者 汪颖 杨维 +1 位作者 肖先勇 张姝 《电力自动化设备》 EI CSCD 北大核心 2022年第6期146-153,共8页
海量用户用电特性的挖掘与分析对实现电网与用户间的双向互动具有十分重要的意义。提出一种适用于海量用户用电行为聚类及分析的算法,以降低算法时间复杂度,提升海量用户负荷数据分析效率。提取用户用电行为特征,构建多层去噪自编码网络... 海量用户用电特性的挖掘与分析对实现电网与用户间的双向互动具有十分重要的意义。提出一种适用于海量用户用电行为聚类及分析的算法,以降低算法时间复杂度,提升海量用户负荷数据分析效率。提取用户用电行为特征,构建多层去噪自编码网络,实现多维特征的降维;利用小批优化K均值算法进行聚类分析,并对算法进行初始聚类质心优化与超参数优化的改进以提升算法收敛速度与效果,其中超参数优化利用基于高斯过程的贝叶斯优化算法进行;利用类间分离度和类内内聚度的相关指标对聚类效果进行评价;通过互信息筛选有效聚类特征,实现用户画像。算例结果表明,所提方法在特征优化、聚类效果与收敛速度上均有较好的表现。 展开更多
关键词 用电行为 特征降维 聚类分析 互信息 小批优化K均值算法 超参数优化 贝叶斯优化
在线阅读 下载PDF
面向大规模服务性能预测的在线学习方法 被引量:7
20
作者 孙勇 谭文安 +1 位作者 谢娜 蒋文明 《计算机科学与探索》 CSCD 北大核心 2017年第12期1922-1930,共9页
为提高服务运行质量,需要主动预防服务失效和服务性能波动,而不是在服务发生错误时触发处理程序。高效地预测与分析大规模服务的性能是有效可行的主动预防工具。然而传统的服务性能预测模型多采用完全批量训练模式,难以满足大规模服务... 为提高服务运行质量,需要主动预防服务失效和服务性能波动,而不是在服务发生错误时触发处理程序。高效地预测与分析大规模服务的性能是有效可行的主动预防工具。然而传统的服务性能预测模型多采用完全批量训练模式,难以满足大规模服务计算的实时性要求。在综合权衡完全批量学习法和随机梯度下降法的基础上,建立了基于在线学习的大规模服务性能预测模型,提出了一种基于小批量在线学习的服务性能预测方法,通过合理地设置预测模型的批量参数,一次迭代仅需训练批量规模较小的样本数据,从而改善大规模服务性能预测的时间效率;详细分析了在线服务预测模型的收敛性。实验表明,提出的在线学习算法有效地解决了大规模服务预测算法的时效性问题。 展开更多
关键词 大规模服务计算 在线学习 小批量在线学习 随机梯度下降法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部