期刊文献+
共找到751篇文章
< 1 2 38 >
每页显示 20 50 100
Big Data Clustering Optimization Based on Intuitionistic Fuzzy Set Distance and Particle Swarm Optimization forWireless Sensor Networks
1
作者 Ye Li Tianbao Shang Shengxiao Gao 《IJLAI Transactions on Science and Engineering》 2024年第3期26-35,共10页
Big data clustering plays an important role in the field of data processing in wireless sensor networks.However,there are some problems such as poor clustering effect and low Jaccard coefficient.This paper proposes a ... Big data clustering plays an important role in the field of data processing in wireless sensor networks.However,there are some problems such as poor clustering effect and low Jaccard coefficient.This paper proposes a novel big data clustering optimization method based on intuitionistic fuzzy set distance and particle swarm optimization for wireless sensor networks.This method combines principal component analysis method and information entropy dimensionality reduction to process big data and reduce the time required for data clustering.A new distance measurement method of intuitionistic fuzzy sets is defined,which not only considers membership and non-membership information,but also considers the allocation of hesitancy to membership and non-membership,thereby indirectly introducing hesitancy into intuitionistic fuzzy set distance.The intuitionistic fuzzy kernel clustering algorithm is used to cluster big data,and particle swarm optimization is introduced to optimize the intuitionistic fuzzy kernel clustering method.The optimized algorithm is used to obtain the optimization results of wireless sensor network big data clustering,and the big data clustering is realized.Simulation results show that the proposed method has good clustering effect by comparing with other state-of-the-art clustering methods. 展开更多
关键词 big data clustering Intuitionistic fuzzy set distance Particle swarm optimization Wireless sensor networks
在线阅读 下载PDF
The Interdisciplinary Research of Big Data and Wireless Channel: A Cluster-Nuclei Based Channel Model 被引量:24
2
作者 Jianhua Zhang 《China Communications》 SCIE CSCD 2016年第S2期14-26,共13页
Recently,internet stimulates the explosive progress of knowledge discovery in big volume data resource,to dig the valuable and hidden rules by computing.Simultaneously,the wireless channel measurement data reveals big... Recently,internet stimulates the explosive progress of knowledge discovery in big volume data resource,to dig the valuable and hidden rules by computing.Simultaneously,the wireless channel measurement data reveals big volume feature,considering the massive antennas,huge bandwidth and versatile application scenarios.This article firstly presents a comprehensive survey of channel measurement and modeling research for mobile communication,especially for 5th Generation(5G) and beyond.Considering the big data research progress,then a cluster-nuclei based model is proposed,which takes advantages of both the stochastical model and deterministic model.The novel model has low complexity with the limited number of cluster-nuclei while the cluster-nuclei has the physical mapping to real propagation objects.Combining the channel properties variation principles with antenna size,frequency,mobility and scenario dug from the channel data,the proposed model can be expanded in versatile application to support future mobile research. 展开更多
关键词 channel model big data 5G massive MIMO machine learning cluster
在线阅读 下载PDF
Performance and Availability Evaluation of Big Data Environments in the Private Cloud
3
作者 Tarcísio Rolim Erica Sousa 《Journal of Computer and Communications》 2024年第12期266-288,共23页
Cloud computing allows scalability at a lower cost for data analytics in a big data environment. This paradigm considers the dimensioning of resources to process different volumes of data, minimizing the response time... Cloud computing allows scalability at a lower cost for data analytics in a big data environment. This paradigm considers the dimensioning of resources to process different volumes of data, minimizing the response time of big data. This work proposes a performance and availability evaluation of big data environments in the private cloud through a methodology and stochastic and combinatorial models considering performance metrics such as execution times, processor utilization, memory utilization, and availability. The proposed methodology considers objective activities, performance, and availability modeling to evaluate the private cloud environment. A performance model based on stochastic Petrinets is adopted to evaluate the big data environment on the private cloud. Reliability block diagram models are adopted to evaluate the availability of big environment data in the private cloud. Two case studies based on the CloudStack platform and Hadoop cluster are adopted to demonstrate the viability of the proposed methodologies and models. Case Study 1 evaluated the performance metrics of the Hadoop cluster in the private cloud, considering different service offerings, workloads, and the number of data sets. The sentiment analysis technique is used in tweets from users with symptoms of depression to generate the analyzed datasets. Case Study 2 evaluated the availability of big data environments in the private cloud. 展开更多
关键词 Cloud Computing big data Hadoop cluster Performance Evaluation Availability Evaluation Reliability Block Diagram Stochastic Petri Nets
在线阅读 下载PDF
A brief procedure for big data analysis of gene expression 被引量:1
4
作者 Kewei Wang Wenji Wang Mang Li 《Animal Models and Experimental Medicine》 2018年第3期189-193,共5页
There are a lot of biological and experimental data from genomics, proteomics, drug screening, medicinal chemistry, etc. A large amount of data must be analyzed by special methods of statistics, bioinformatics, and co... There are a lot of biological and experimental data from genomics, proteomics, drug screening, medicinal chemistry, etc. A large amount of data must be analyzed by special methods of statistics, bioinformatics, and computer science. Big data analysis is an effective way to build scientific hypothesis and explore internal mechanism.Here, gene expression is taken as an example to illustrate the basic procedure of the big data analysis. 展开更多
关键词 big data ANALYSIS cluster ANALYSIS MICROARRAY PCA ANALYSIS regression model
暂未订购
Integration of Deep-time Digital Data for Mapping Clusters of Porphyry Copper Mineral Deposits 被引量:4
5
作者 CHENG Qiuming 《Acta Geologica Sinica(English Edition)》 SCIE CAS CSCD 2019年第S01期8-10,共3页
1 Introduction PCDs are generated in continental arcs in response to plate converging processes(subduction and collision)(Hou et al.,2009;Richards,2013).It is generally accepted that the formation of PCDs is associate... 1 Introduction PCDs are generated in continental arcs in response to plate converging processes(subduction and collision)(Hou et al.,2009;Richards,2013).It is generally accepted that the formation of PCDs is associated with igneous activities either originating from lower crust or upper mantle,with contributions of crusts during the evolution of continental lithosphere. 展开更多
关键词 PORPHYRY MINERAL DEPOSITS MINERAL DEPOSITS clustering simulation and prediction plate TECTONICS big data
在线阅读 下载PDF
Data field for mining big data 被引量:1
6
作者 Shuliang Wang Ying Li Dakui Wang 《Geo-Spatial Information Science》 CSCD 2016年第2期中插2-中插2,106-118,共14页
Big data is a highlighted challenge for many fields with the rapid expansion of large-volume, complex, and fast-growing sources of data. Mining from big data is required for exploring the essence of data and providing... Big data is a highlighted challenge for many fields with the rapid expansion of large-volume, complex, and fast-growing sources of data. Mining from big data is required for exploring the essence of data and providing meaningful information. To this end, we have previously introduced the theory of physical field to explore relations between objects in data space and proposed a framework of data field to discover the underlying distribution of big data. This paper concerns an overview of big data mining by the use of data field. It mainly discusses the theory of data field and different aspects of applications including feature selection for high-dimensional data, clustering, and the recognition of facial expression in human-computer interaction. In these applications, data field is employed to capture the intrinsic distribution of data objects for selecting meaningful features, fast clustering, and describing variation of facial expression. It is expected that our contributions would help overcome the problems in accordance with big data. 展开更多
关键词 Physical FIELD data FIELD big data MINING FEATURE selection hierarchical clustering recognition of FACE expression
全文增补中
基于大数据聚类分析的移动机器人偏摆力矩控制系统设计
7
作者 袁辉 赵瑞林 《计算机测量与控制》 2025年第6期145-152,共8页
移动机器人在不同类型的运动状态具有不同的运动特性,由于姿态的不断变化,系统更容易受到偏摆力矩的影响,出现姿态失衡的问题;为此,设计基于大数据聚类分析的移动机器人偏摆力矩控制系统;在硬件设计方面,对移动机器人进行了改装,增加了... 移动机器人在不同类型的运动状态具有不同的运动特性,由于姿态的不断变化,系统更容易受到偏摆力矩的影响,出现姿态失衡的问题;为此,设计基于大数据聚类分析的移动机器人偏摆力矩控制系统;在硬件设计方面,对移动机器人进行了改装,增加了姿态传感器和力矩传感器,并引入了大数据聚类分析处理器;同时,对力矩控制器的内部组成结构进行了调整,从电气设计和机械结构两个维度添加了抗干扰元件,从而实现了硬件系统的优化;在软件设计方面,利用大数据聚类分析技术,通过运动数据采集、特征提取和距离度量等步骤,准确识别移动机器人的不同运动状态;根据各状态下的标准运动参数,确定了偏摆力矩的控制目标;通过与实际测量的偏摆力矩进行比对,计算出所需的力矩控制量,进而实现了系统的偏摆力矩控制功能,显著提升了控制的稳定性;通过系统测试得出结论:与传统控制系统相比,优化设计系统的偏摆力矩控制误差减小约0.3 N·m,在系统控制作用下移动机器人的稳定系数明显提升。 展开更多
关键词 大数据聚类分析 移动机器人 偏摆力矩 力矩控制系数 传感器
在线阅读 下载PDF
基于ABWO的并行DCNN优化算法 被引量:1
8
作者 毛伊敏 刘映兴 《计算机工程与设计》 北大核心 2025年第2期353-359,共7页
针对并行DCNN算法在大数据环境下存在特征差异性较小、模型性能不足、参数更新慢和集群并行效率低等问题,提出一种基于ABWO的并行DCNN优化算法PDCNN-ABWO。提出一种基于自适应密度峰值聚类的特征选择策略FS-ADPC划分原始特征,筛选差异... 针对并行DCNN算法在大数据环境下存在特征差异性较小、模型性能不足、参数更新慢和集群并行效率低等问题,提出一种基于ABWO的并行DCNN优化算法PDCNN-ABWO。提出一种基于自适应密度峰值聚类的特征选择策略FS-ADPC划分原始特征,筛选差异性较大的特征;设计一种ResNet-CBAMDW模型,提升模型性能;提出一种基于自适应黑寡妇优化算法的并行训练策略PT-ABWO优化初始参数,加快参数更新速度;提出一种基于大数据基准测试的动态负载均衡策略DLB-BDB,合理分配任务负载,提升集群并行效率。实验结果表明,该算法能够有效提升DCNN在大数据环境下的训练效率。 展开更多
关键词 大数据 并行深度卷积神经网络算法 密度峰值聚类 自适应黑寡妇优化算法 并行训练 基准测试 负载均衡
在线阅读 下载PDF
基于大数据深度挖掘技术的电力负荷智能感知系统
9
作者 马国真 王云佳 +2 位作者 夏静 彭寒 邵华 《电子设计工程》 2025年第14期171-175,共5页
为提升电力系统对电力负荷需求的满足能力,设计了基于大数据深度挖掘技术的电力负荷智能感知系统。该系统通过数据连接模块将电力负荷数据汇总、暂存。利用数据挖掘模块对暂存数据进行分析,获取最优聚类。依据预测时间段的属性数据实现... 为提升电力系统对电力负荷需求的满足能力,设计了基于大数据深度挖掘技术的电力负荷智能感知系统。该系统通过数据连接模块将电力负荷数据汇总、暂存。利用数据挖掘模块对暂存数据进行分析,获取最优聚类。依据预测时间段的属性数据实现电力负荷预测。同时,结合特征权重算法去除电力负荷风险特征中的冗余项,构建最优风险特征子集,并采用支持向量机建立风险预警模型。将预测结果与最优风险特征子集输入预警模型,实现负荷预警。实验结果表明,该系统能准确预测电力负荷情况,且电力负荷风险预警结果的Ka值高达0.9以上,显著提升电力系统对电力负荷需求的满足能力。 展开更多
关键词 大数据 深度挖掘 聚类算法 负荷预测 特征选择 风险预警
在线阅读 下载PDF
基于大数据的图书馆用户行为分析方法研究
10
作者 施平 《科技资讯》 2025年第11期239-241,共3页
图书馆用户行为分析有助于提升图书馆的用户体验,该过程通常需要构建用户画像,并应用各种算法来深度挖掘用户的行为特征。首先,系统总体框架描述了图书馆用户行为分析的基本流程和原理;其次,在该系统中,用户画像用来刻画用户特征,并为... 图书馆用户行为分析有助于提升图书馆的用户体验,该过程通常需要构建用户画像,并应用各种算法来深度挖掘用户的行为特征。首先,系统总体框架描述了图书馆用户行为分析的基本流程和原理;其次,在该系统中,用户画像用来刻画用户特征,并为后续行为分析打下基础;最后,将K-means算法作为聚类方法的代表性方法来对用户行为数据进行分析,以挖掘各类用户的特征与需求。这一研究不仅有助于优化图书馆的资源配置,还可以提升个性化服务的效率。 展开更多
关键词 大数据 行为分析 特征工程 聚类分析
在线阅读 下载PDF
基于K-means算法的学前教育学生成绩聚类分析
11
作者 方琼 《工业技术与职业教育》 2025年第3期72-76,共5页
现有的学生成绩分析方法多依赖于单一维度的成绩数据,难以反映学生多元学习表现。从课程类型的宏观视角出发,运用K-means算法对学生的三类课程平均分进行聚类分析,聚类结果表明,学生在三类课程中的表现存在显著差异。针对聚类结果各个... 现有的学生成绩分析方法多依赖于单一维度的成绩数据,难以反映学生多元学习表现。从课程类型的宏观视角出发,运用K-means算法对学生的三类课程平均分进行聚类分析,聚类结果表明,学生在三类课程中的表现存在显著差异。针对聚类结果各个群体的特点,提出了有针对性的教学改进建议。同时,从学生、教师与教学管理者角度提出具体建议:学生应主动参与实践与操作任务,提升综合能力;教师应以学习者为中心,设计差异化教学任务;教学管理者需依据学生群体的学习特点,优化课程设置并提供精准资源支持,修订人才培养方案,确保课程设置与学生的学习需求相匹配。 展开更多
关键词 聚类分析 课程 大数据技术
在线阅读 下载PDF
基于孤立森林算法的供电营销大数据异常挖掘方法
12
作者 于亮 钟宏伟 +2 位作者 冯祎辰 肖莞 张硕 《微型电脑应用》 2025年第2期51-54,共4页
当前供电营销大数据异常挖掘方法中异常数据检测环节较为薄弱,导致数据异常挖掘率相对较低且误检率较高,为此,提出基于孤立森林算法的供电营销大数据异常挖掘方法。构建孤立森林模型检测原始数据,借鉴二叉搜索树(BST)方法确定模型之间... 当前供电营销大数据异常挖掘方法中异常数据检测环节较为薄弱,导致数据异常挖掘率相对较低且误检率较高,为此,提出基于孤立森林算法的供电营销大数据异常挖掘方法。构建孤立森林模型检测原始数据,借鉴二叉搜索树(BST)方法确定模型之间数据距离,获取异常数据。使用离散小波变换方法,提取异常数据特征。对传统k-means算法进行优化,结合异常数据特征构建数据簇,实现对异常数据的挖掘分析。构建应用测试环节,测试结果表明,所提方法可有效提升供电营销大数据异常挖掘率,进一步降低数据异常挖掘误检率,为供电营销大数据分析环节提供新的发展方向。 展开更多
关键词 孤立森林算法 供电营销 大数据平台 异常数据挖掘 聚类数目
在线阅读 下载PDF
基于节点抽样的分布式二阶段聚类方法
13
作者 张曼静 何玉林 +1 位作者 李旭 黄哲学 《计算机科学》 北大核心 2025年第2期134-144,共11页
针对大数据聚类中存在的计算资源消耗大、聚类效率低的问题,提出了一种新的基于节点抽样的分布式二阶段聚类方法。该方法首先在各个本地节点对节点上的数据执行局部聚类操作,并基于局部聚类结果,从每个节点中抽取代表性的数据样本,然后... 针对大数据聚类中存在的计算资源消耗大、聚类效率低的问题,提出了一种新的基于节点抽样的分布式二阶段聚类方法。该方法首先在各个本地节点对节点上的数据执行局部聚类操作,并基于局部聚类结果,从每个节点中抽取代表性的数据样本,然后将各节点选定的样本数据传输至中央节点。之后,在中央节点上,对合并的样本数据进行进一步的聚类分析,并将样本聚类的结果传回各个本地节点。最后,各本地节点结合自身的局部聚类结果和中央节点的样本聚类结果,完成最终的聚类标签统一。通过以上流程,所提方法实现了对集中式聚类算法的分布式改造,能够快速一致地完成对全局数据的聚类分析。理论分析和数值实验均表明,与传统的全量数据集中式聚类方法相比,二阶段聚类方法有效地结合了并行处理的高效性和集成分析的准确性,在保证聚类质量的前提下能够显著降低计算资源的消耗,是一种可行的大数据聚类分布式解决方案。 展开更多
关键词 大数据聚类 分布式计算 节点抽样 并行计算 二阶段聚类
在线阅读 下载PDF
基于大数据的船舶会遇热点区域挖掘技术开发
14
作者 陈麒龙 黄鹏飞 《舰船科学技术》 北大核心 2025年第4期168-172,共5页
船舶交通密度的增大会直接影响船舶航行的安全性,本文提出一种基于大数据挖掘技术的船舶会遇热点区域分析方法,首先将AIS数据、雷达数据以及图像数据作为船舶会遇热点区域分析的数据来源,并提出一种多源数据的预处理和融合方法。定义了... 船舶交通密度的增大会直接影响船舶航行的安全性,本文提出一种基于大数据挖掘技术的船舶会遇热点区域分析方法,首先将AIS数据、雷达数据以及图像数据作为船舶会遇热点区域分析的数据来源,并提出一种多源数据的预处理和融合方法。定义了3种船舶会遇基本特征,探讨了船舶属性、环境属性和船舶会遇之间的关联规则,在此基础上使用K-means聚类算法对船舶会遇热点区域进行分析,结果表明本文提出的方法可以有效对船舶会遇热点区域进行分析和标定,有效降低会遇热点区域的船舶碰撞概率。 展开更多
关键词 会遇 大数据挖掘 K-MEANS 聚类分析
在线阅读 下载PDF
基于大数据的电力系统故障诊断技术研究 被引量:1
15
作者 于荣荣 《灯与照明》 2025年第2期154-156,共3页
大数据技术通过对海量历史数据和实时数据的深度分析,能够更准确地识别故障特征并快速定位故障点,从而大幅提升故障诊断的准确性和效率。本研究结合数据聚类算法以及支持向量机算法,开展大数据在电力系统故障诊断中的应用研究,为推动电... 大数据技术通过对海量历史数据和实时数据的深度分析,能够更准确地识别故障特征并快速定位故障点,从而大幅提升故障诊断的准确性和效率。本研究结合数据聚类算法以及支持向量机算法,开展大数据在电力系统故障诊断中的应用研究,为推动电力系统故障诊断领域的发展奠定基础。研究表明:通过构建科学、合理的大数据架构,电力系统可以实现故障的实时监测、快速诊断和精准预警,从而提升电网的运行效率和安全水平。研究为保障电力系统的安全与稳定运行提供了参考。 展开更多
关键词 电力系统 大数据 聚类算法 支持向量机
在线阅读 下载PDF
智慧旅游背景下高职大数据技术专业群建设探索
16
作者 肖伟 马卫 李微微 《职业技术》 2025年第10期41-48,共8页
针对智慧旅游数据服务产业链对高职数字化人才的需求,分析大数据技术专业在智慧旅游数据服务产业中的应用,以大数据技术专业为核心组建专业群的逻辑,确立大数据专业群的培养定位,阐述人才培养体系的建设、模块化专业群课程体系的构建、... 针对智慧旅游数据服务产业链对高职数字化人才的需求,分析大数据技术专业在智慧旅游数据服务产业中的应用,以大数据技术专业为核心组建专业群的逻辑,确立大数据专业群的培养定位,阐述人才培养体系的建设、模块化专业群课程体系的构建、课程教学资源的打造、教学质量改革的开展,以及产教融合机制的创新等观点。推动智慧旅游与大数据技术的深度融合,助力江苏数字文旅产业的高质量发展,为高职院校智慧旅游方向的专业群建设提供参考。 展开更多
关键词 大数据技术 专业群 产业链 智慧旅游数据服务业 产教融合
在线阅读 下载PDF
基于产线大数据的电池内阻预测及快速分选方法
17
作者 包新宇 孔祥栋 +5 位作者 吕桃林 朱志成 韩雪冰 来鑫 郑岳久 孙涛 《储能科学与技术》 北大核心 2025年第9期3541-3551,共11页
基于产线大数据平台,利用容量对出厂电池进行快速分选,保证电池组的一致性,可以提高电池包的使用寿命,但无法保证电池组的动态一致性。本工作提出了一种通过产线大数据来预测分容阶段电池内阻,根据预测出的电池内阻,结合容量对电池进行... 基于产线大数据平台,利用容量对出厂电池进行快速分选,保证电池组的一致性,可以提高电池包的使用寿命,但无法保证电池组的动态一致性。本工作提出了一种通过产线大数据来预测分容阶段电池内阻,根据预测出的电池内阻,结合容量对电池进行快速分选的方法。通过收集产线数据,利用皮尔逊相关性分析(PCC)对特征进行筛选,然后利用多层感知机(MLP)构建内阻预测的神经网络模型。将预测出的内阻结合容量数据,利用模糊C均值聚类(FCM)将产线电池分为4个档次,然后利用充放电电压曲线特征作为评价标准,对分选效果进行验证,并与传统的容量分选方法效果进行对比。结果表明,内阻预测的平均绝对百分比误差(MAPE)为1.2%,分选效果的综合优化率达到14.9%,相较于传统容量分选效果有显著提升。本工作为产线电池的快速分选提供了一种新的方法。 展开更多
关键词 产线数据 锂离子电池 内阻预测 聚类分析 电池分选
在线阅读 下载PDF
时空行为视角下多层级城市生活圈空间结构测度与类型划分研究——以北京市为例
18
作者 梁弘 鞠秋雯 +4 位作者 柴彦威 金尚琪 孙道胜 张晓东 顾重泰 《上海城市规划》 北大核心 2025年第3期49-58,共10页
依据城市生活圈理论,基于时空大数据对北京市的多层级城市生活圈进行研究。利用社团识别、核密度估计和多算法聚类等技术手段,量化测度北京社区生活圈、通勤生活圈和扩展生活圈的空间结构,刻画居民活动产生的“社区—停留点—路径”网络... 依据城市生活圈理论,基于时空大数据对北京市的多层级城市生活圈进行研究。利用社团识别、核密度估计和多算法聚类等技术手段,量化测度北京社区生活圈、通勤生活圈和扩展生活圈的空间结构,刻画居民活动产生的“社区—停留点—路径”网络,揭示了不同生活圈居民日常活动的时空规律。根据通勤及生活性出行的距离—概率曲线,利用基于Hausdroff距离的K-Medoids聚类算法对北京全市社区生活圈进行类型划分和特征归纳,同时选取代表性案例进行深入分析。研究发现北京全市生活圈依照不同出行特征可划分为均衡型、通勤依赖型、生活依赖型、廊道型及其他类型5大模式,其差异主要体现在就业活动和其他生活性活动圈层与居住地和城市中心的空间相对关系上,空间上呈现显著的圈层分布特征。研究为理解城市生活圈的空间结构提供了实证基础,并为城市规划和管理实践提供数据支持和决策参考。 展开更多
关键词 生活圈 时空行为学 时空大数据 手机信令数据 K-Medoids聚类
在线阅读 下载PDF
高维空间聚类下多信道光纤网络大数据异常检测
19
作者 李晟 李嘉泽楷 任昊 《激光杂志》 北大核心 2025年第3期169-174,共6页
光纤网络的数据质量会影响用户通信质量,当其中包含异常数据时,将会使得通信效率和通信质量大幅下降。为此,提出高维空间聚类下多信道光纤网络大数据异常检测算法。根据历史数据特征密度指标,获得异常数据特征;利用高维高斯混合聚类算... 光纤网络的数据质量会影响用户通信质量,当其中包含异常数据时,将会使得通信效率和通信质量大幅下降。为此,提出高维空间聚类下多信道光纤网络大数据异常检测算法。根据历史数据特征密度指标,获得异常数据特征;利用高维高斯混合聚类算法将数据特征从低维空间映射到高维空间中,为了降低计算难度,利用核映射将高维内积计算转换为低维数据核计算;最后利用HGMM算法得到不同时刻下的检测时间序列,融合后输出最终检测结果。实验结果表明,所提方法可取得高达98%的反馈率,且检测到的异常数据类型与实际结果完全一致,可保证光纤网络免受异常数据影响。 展开更多
关键词 高维空间聚类 大数据异常检测 聚类权值 协方差矩阵 条件概率
原文传递
大数据与计算机技术结合的应用研究
20
作者 李亭 《移动信息》 2025年第7期233-235,共3页
在信息技术迅猛发展的背景下,大数据已成为推动科技创新和商业决策的重要力量。K-Means聚类算法和Apriori关联规则算法作为数据挖掘领域的两种基础且广泛应用的算法,因其在大规模数据处理中的高效性和简洁性而受到青睐。K-Means聚类算... 在信息技术迅猛发展的背景下,大数据已成为推动科技创新和商业决策的重要力量。K-Means聚类算法和Apriori关联规则算法作为数据挖掘领域的两种基础且广泛应用的算法,因其在大规模数据处理中的高效性和简洁性而受到青睐。K-Means聚类算法通过将数据点划分为K个簇,使得簇内的点尽可能相似,簇间的点尽可能不同。Apriori算法则通过挖掘频繁项集来发现数据中的关联规则。文中首先探讨了这两种算法的理论基础和实现机制;其次,以医疗平台应用为例,面向实际的应用需求,提出了组合模型,以网站的用户细分以及产品推荐;最后,提出了未来研究方向,为相关领域的研究者和实践者提供参考。 展开更多
关键词 大数据 聚类 关联规则 计算机技术
在线阅读 下载PDF
上一页 1 2 38 下一页 到第
使用帮助 返回顶部