期刊文献+
共找到1,429篇文章
< 1 2 72 >
每页显示 20 50 100
Distributed C-Means Algorithm for Big Data Image Segmentation on a Massively Parallel and Distributed Virtual Machine Based on Cooperative Mobile Agents
1
作者 Fatéma Zahra Benchara Mohamed Youssfi +2 位作者 Omar Bouattane Hassan Ouajji Mohammed Ouadi Bensalah 《Journal of Software Engineering and Applications》 2015年第3期103-113,共11页
The aim of this paper is to present a distributed algorithm for big data classification, and its application for Magnetic Resonance Images (MRI) segmentation. We choose the well-known classification method which is th... The aim of this paper is to present a distributed algorithm for big data classification, and its application for Magnetic Resonance Images (MRI) segmentation. We choose the well-known classification method which is the c-means method. The proposed method is introduced in order to perform a cognitive program which is assigned to be implemented on a parallel and distributed machine based on mobile agents. The main idea of the proposed algorithm is to execute the c-means classification procedure by the Mobile Classification Agents (Team Workers) on different nodes on their data at the same time and provide the results to their Mobile Host Agent (Team Leader) which computes the global results and orchestrates the classification until the convergence condition is achieved and the output segmented images will be provided from the Mobile Classification Agents. The data in our case are the big data MRI image of size (m × n) which is splitted into (m × n) elementary images one per mobile classification agent to perform the classification procedure. The experimental results show that the use of the distributed architecture improves significantly the big data segmentation efficiency. 展开更多
关键词 Multi-Agent System DISTRIBUTED algorithm big data IMAGE Segmentation MRI IMAGE C-MEANS algorithm Mobile Agent
在线阅读 下载PDF
Protection of Basic Human Rights in the Application of Big Data to Counter Terrorism
2
作者 夏雨 齐延平 PAN Yingzhao(译) 《The Journal of Human Rights》 2019年第5期590-602,共13页
In the era of big data,the ways people work,live and think have changed dramatically,and the social governance system is also being restructured.Achieving intelligent social governance has now become a national strate... In the era of big data,the ways people work,live and think have changed dramatically,and the social governance system is also being restructured.Achieving intelligent social governance has now become a national strategy.The application of big data technology to counterterrorism efforts has become a powerful weapon for all countries.However,due to the uncertainty,difficulty of interpretation and potential risk of discrimination in big data technology and algorithm models,basic human rights,freedom and even ethics are likely to be impacted and challenged.As a result,there is an urgent need to prioritize basic human rights and regulate the application of big data for counter terrorism purposes.The legislation and law enforcement regarding the use of big data to counter terrorism must be subject to constitutional and other legal reviews,so as to strike a balance between safeguarding national security and protecting basic human rights. 展开更多
关键词 the application of big data to COUNTER TERRORISM algorithm DISCRIMINATION national security basic human RIGHTS the principle of BALANCE
原文传递
算法嵌入政治安全治理:风险样态与规制路径
3
作者 陈东冬 《深圳大学学报(人文社会科学版)》 北大核心 2026年第1期99-110,共12页
随着“数字中国”战略的深入推进,大数据算法作为一种新型权力载体,已深度嵌入政治安全治理全过程。算法重塑政治安全的内涵与形态,政治安全疆域从物理空间拓展至数字主权空间,安全内容从政权安全深化至认知安全,安全主体从国家主导扩... 随着“数字中国”战略的深入推进,大数据算法作为一种新型权力载体,已深度嵌入政治安全治理全过程。算法重塑政治安全的内涵与形态,政治安全疆域从物理空间拓展至数字主权空间,安全内容从政权安全深化至认知安全,安全主体从国家主导扩展至多元协同,安全形态从静态防御转型为动态治理。算法通过数据驱动、智能决策与协同治理等运行机理,赋能政治安全治理的精准感知、科学施策与多元共治,推动其从传统经验驱动向现代技术赋能转型。然而,算法亦诱发多重政治安全风险:数字主权层面,算法霸权通过技术垄断与规则压制侵蚀国家数字主权;意识形态层面,算法操纵引发认知异化,动摇社会共识基础;社会政治稳定层面,算法歧视、权力滥用等问题会激化社会矛盾;技术自主性层面,算法黑箱与伦理失序现象会导致治理失灵甚至技术反噬。为此,亟须构建融制度规制、技术攻坚、伦理内嵌与多元协同于一体的综合性治理体系,精准防范化解算法时代的政治安全风险,为数字时代国家安全筑牢坚实屏障。 展开更多
关键词 大数据算法 政治安全 风险样态 数字主权 意识形态安全 规制路径
原文传递
基于Bigtable与MapReduce的Apriori算法改进 被引量:22
4
作者 魏玲 魏永江 高长元 《计算机科学》 CSCD 北大核心 2015年第10期208-210,243,共4页
为提高Apriori算法挖掘频繁项目集的效率,引进了Bigtable技术与MapReduce模型来对Apriori算法进行优化,设计出大数据环境下挖掘频繁项目集的新算法BM-Apriori算法。与单纯基于MapReduce模型的Apriori改进算法相比,新算法利用Bigtable的... 为提高Apriori算法挖掘频繁项目集的效率,引进了Bigtable技术与MapReduce模型来对Apriori算法进行优化,设计出大数据环境下挖掘频繁项目集的新算法BM-Apriori算法。与单纯基于MapReduce模型的Apriori改进算法相比,新算法利用Bigtable的时间戳属性代替了键/值对的产生,只需扫描数据库一次即可,节约了模式匹配的时间。同时,BM-Apriori算法在项集列表中新增事务标号列,自动获取事务标号以计算支持度。将BM-Apriori算法在Hadoop平台上进行了实验,结果表明Bigtable技术的融入使得BM-Apriori算法具有更高的效率与可拓展性。 展开更多
关键词 APRIORI算法 大数据
在线阅读 下载PDF
基于BigQuant大数据平台的股票投资策略开发 被引量:1
5
作者 李泳 《计算机科学》 CSCD 北大核心 2020年第S01期612-615,共4页
文中基于BigQuant平台股票投顾系统,利用StockRanker算法和回测机制,对中国股市在整个样本期2010年1月1日至2019年2月5日具有正常交易的全部A股中剔除沪深300指数成份股后的1848只股票特征数据进行分析,给出最有投资价值的股票排序,从... 文中基于BigQuant平台股票投顾系统,利用StockRanker算法和回测机制,对中国股市在整个样本期2010年1月1日至2019年2月5日具有正常交易的全部A股中剔除沪深300指数成份股后的1848只股票特征数据进行分析,给出最有投资价值的股票排序,从而为具有不同风险偏好的投资者提供智能化、个性化的资产配置建议。文中基于标准指数基金中证500指数,通过策略判断,用业绩优异的非成份股代替业绩较差的成份股,开发出一款D产品,它具有超越标准指数基金更好、更稳定的投资收益。 展开更多
关键词 bigQuant平台 大数据 StockRanker算法 投资策略
在线阅读 下载PDF
大数据证据法律地位问题研究
6
作者 包建华 《辽宁警察学院学报》 2026年第1期51-57,共7页
大数据证据是基于对信息量巨大的数据集进行收集、整理、对比、分析,通过一定算法得出的结论用以证明待证事实的证据种类。大数据证据包括识别类、分析类和预测类三种类型。目前我国学界和司法实践中对大数据证据的法律地位有争议,主要... 大数据证据是基于对信息量巨大的数据集进行收集、整理、对比、分析,通过一定算法得出的结论用以证明待证事实的证据种类。大数据证据包括识别类、分析类和预测类三种类型。目前我国学界和司法实践中对大数据证据的法律地位有争议,主要原因在于:大数据证据不具有“同步性”,不同于实物类证据;大数据证据是基于机器算法得出的证据,不同于言词类证据;我国立法采用“封闭式”的证据形式。由于大数据证据不适合归属于传统的证据种类,其审查判断规则和取证、质证方法都具有特殊性,应当赋予大数据证据独立的法律地位。 展开更多
关键词 大数据证据 法律地位 算法 司法适用
在线阅读 下载PDF
改进决策树算法的混合属性大数据分类优化方法
7
作者 剧树春 李来杰 《电子设计工程》 2026年第1期45-49,共5页
为了简化混合属性大数据的分类过程,并依据各类属性数据的内在特征,确保分类结果的准确性,文中提出了改进决策树算法的混合属性大数据分类优化方法。通过主成分分析法挖掘混合属性大数据之间的内在规律,提取混合属性大数据关键特征;构... 为了简化混合属性大数据的分类过程,并依据各类属性数据的内在特征,确保分类结果的准确性,文中提出了改进决策树算法的混合属性大数据分类优化方法。通过主成分分析法挖掘混合属性大数据之间的内在规律,提取混合属性大数据关键特征;构建基于C4.5算法的改进决策树算法分类模型,输入提取的关键特征,计算该特征的信息熵和信息增益率,采用动态调整的方式进行模式学习,实现动态修正信息熵,以此优化节点的分裂效果,从而进一步提升分类精准度,输出混合属性大数据分类结果。通过实验验证,该方法具有极高的精确度,能够清晰区分不同类别的数据,且性能稳定,分类效率更高、可靠性更强,能够有效抵御噪声对分类性能的不利影响,证明了所提方法实现混合属性大数据分类稳定性和可靠性。 展开更多
关键词 改进决策树算法 混合属性大数据 分类优化 C4.5算法 信息熵 信息增益率
在线阅读 下载PDF
大数据证据真实性审查的实践困境与机制构建
8
作者 徐梦翔 刘翔宇 段浩然 《山西警察学院学报》 2026年第1期118-127,共10页
随着信息时代的飞速发展,新型科学证据形态衍生出了大数据证据形式,在刑事犯罪追诉中的重要性日益凸显。基于大数据证据构成要素及真实性标准,审视大数据证据真实性审查实践可发现,其中存在处理程序合规性落实难、数据来源全量性缺失、... 随着信息时代的飞速发展,新型科学证据形态衍生出了大数据证据形式,在刑事犯罪追诉中的重要性日益凸显。基于大数据证据构成要素及真实性标准,审视大数据证据真实性审查实践可发现,其中存在处理程序合规性落实难、数据来源全量性缺失、基础数据内容不真实、算法技术不透明和分析结果缺乏可印证性等困境。对此,应当完善大数据证据处理程序,并构建数据来源全量性、数据内容真实性、算法模型科学性以及分析报告真实性的审查机制。 展开更多
关键词 大数据证据 真实性 全量性 算法技术 科学证据
在线阅读 下载PDF
大数据侦查的法律规制路径
9
作者 贺紫荆 杜航 《辽宁警察学院学报》 2026年第1期75-81,共7页
在大数据与人工智能技术快速发展的背景下,大数据侦查已成为现代犯罪治理的重要手段。大数据侦查通过海量数据挖掘、智能算法分析等技术手段,显著提升了侦查工作的精准性和预测预警的时效性。然而,这种技术驱动的侦查方式对传统法治体... 在大数据与人工智能技术快速发展的背景下,大数据侦查已成为现代犯罪治理的重要手段。大数据侦查通过海量数据挖掘、智能算法分析等技术手段,显著提升了侦查工作的精准性和预测预警的时效性。然而,这种技术驱动的侦查方式对传统法治体系提出了严峻挑战。数据算法与司法公正的冲突、侦查权对隐私权的侵蚀、数据对证据规则的冲击等问题也日益凸显。对此,可从规制数据质量以确保决策基础准确、规范算法设计以确保司法决策公正、依据比例原则以保障公民隐私权、创新证据的证明规则以辅助证明案件事实等方面提出法律规制路径。这既为平衡侦查效能与权利保护提供新思路,也为构建安全可靠的大数据侦查体系提供制度保障。最终实现技术理性与法律价值的有机统一,推动大数据侦查在法治轨道上规范发展。 展开更多
关键词 大数据侦查 法律规制 算法 隐私权 证明规则
在线阅读 下载PDF
面向电力营销的深度挖掘算法设计与应用
10
作者 孙爱兵 刘宇 《科技创新与应用》 2026年第3期32-35,共4页
随着当前经济与技术的迅速发展,电力用户的用电行为呈现出前所未有的多样化趋势,需求模式日益多元且变化迅速。为有效应对这一市场变革,电力企业亟需转型升级,采用创新的营销策略,以精准匹配用户需求、提升服务质量并增强市场竞争力。... 随着当前经济与技术的迅速发展,电力用户的用电行为呈现出前所未有的多样化趋势,需求模式日益多元且变化迅速。为有效应对这一市场变革,电力企业亟需转型升级,采用创新的营销策略,以精准匹配用户需求、提升服务质量并增强市场竞争力。针对传统电力营销方式存在的诸多问题,如策略僵化、用户需求匹配度低、电力资源分配不均与资源浪费严重等,该文基于大数据分析与人工智能(AI)技术,构建并提出一种面向电力营销的个性化推荐算法。该算法融合先进的机器学习(ML)模型,通过对海量用户用电数据的深度挖掘,实现对用户用电习惯、偏好及未来需求的精准预测。实验结果表明,该文所提出的个性化推荐算法在提升用户满意度与增强用户黏性方面表现良好,且显著降低电力企业的运营成本与资源浪费,为电力行业的可持续发展提供有力支撑。 展开更多
关键词 电力营销 个性化推荐算法 大数据 人工智能 设计与应用
在线阅读 下载PDF
基于区域供热方案的高级㶲分析模型
11
作者 柯一鸿 林艺龙 +2 位作者 林周勇 易秉恒 王炯铭 《电子设计工程》 2026年第2期192-196,共5页
为了评估热电联产系统在区域供热中的性能和效率,构建了基于区域供热方案的高级㶲分析模型。利用普通类间距离准则和加权类间距离准则,挖掘用于供暖潜能评估的频繁项集条件模式基,将条件fg-tree的构建与挖掘过程视为一种递归处理过程。以... 为了评估热电联产系统在区域供热中的性能和效率,构建了基于区域供热方案的高级㶲分析模型。利用普通类间距离准则和加权类间距离准则,挖掘用于供暖潜能评估的频繁项集条件模式基,将条件fg-tree的构建与挖掘过程视为一种递归处理过程。以㶲效率指标和能级平衡系数指标为度量依据,分析了基于热电联产系统的高级㶲分析模型的性能,从而实现热电联产系统中的热能评估。实验结果表明,正常生产工况下,文中模型计算得到的㶲效率为0.65,能级平衡系数为0.82,优于对比方法,并具有更高的评估效率。 展开更多
关键词 大数据频繁项集挖掘算法 热电联产 㶲效率 区域供热
在线阅读 下载PDF
基于自然语言处理的职务犯罪法律文书处理与分析研究
12
作者 姜志超 杨炳文 +1 位作者 高谷刚 李林怡 《通信与信息技术》 2026年第1期7-12,30,共7页
近年来,职务犯罪案件频发,现有研究多局限于法律文本和犯罪构成分析,缺乏跨学科视角,难以揭示其特征和发展趋势。目前,专门针对职务犯罪文书处理与分析的类似系统较少,法律领域通用的数据分析系统难以处理此类文书的专业性和特殊性。因... 近年来,职务犯罪案件频发,现有研究多局限于法律文本和犯罪构成分析,缺乏跨学科视角,难以揭示其特征和发展趋势。目前,专门针对职务犯罪文书处理与分析的类似系统较少,法律领域通用的数据分析系统难以处理此类文书的专业性和特殊性。因此,借助大数据、人工智能和自然语言处理技术,分析职务犯罪案例文本,揭示犯罪规律并实现高效预防具有重要意义。本研究提出基于智能数据处理与分析的职务犯罪研究模型与算法,并构建了系统原型。通过定制化爬虫技术高效采集多平台职务犯罪文书数据。在数据预处理阶段,采用jieba分词结合深度学习序列标注技术进行清洗、分词及关键信息提取。基于Word2Vec模型将文本信息转化为数字化表达,并结合K-Means聚类算法与Llama3大语言模型挖掘关键特征,显著提升类案检索精准性。最终通过箱线图、散点图等可视化手段展示犯罪规律。实验结果表明,相较于传统方法,该模型在精确度和召回率方面分别提升了21%和9%,充分验证了Llama3在语义理解和特征提取方面的强大能力。 展开更多
关键词 职务犯罪 法律文书 大数据 自然语言处理 词向量模型 聚类算法
在线阅读 下载PDF
基于Apriori算法的人才需求分析
13
作者 郑翊 《山西电子技术》 2026年第1期98-100,共3页
基于大数据技术以及人工智能技术飞速发展下,推动软件工程应用范围逐步扩大,为多个领域的发展起到了重要推动作用,并在相应的领域中取得了良好的成效。如何借助大数据时代下的技术提取分析软件工程专业的人才技能模型,是高校目前的研究... 基于大数据技术以及人工智能技术飞速发展下,推动软件工程应用范围逐步扩大,为多个领域的发展起到了重要推动作用,并在相应的领域中取得了良好的成效。如何借助大数据时代下的技术提取分析软件工程专业的人才技能模型,是高校目前的研究热点。基于此,使用以TF-IDF值采样方法抽取文本数据集中的岗位关键词,再选择简单关联分析中经典的Apriori算法来进行技能分析。并从多个角度和维度对软件工程专业就业技能的需求进行了分析。获得了软件工程人才市场需求信息的岗位技能需求,准确地了解企业所需人才的特定要求,从而为制定与企业需求相符的人才培养方案提供科学的决策支持。 展开更多
关键词 大数据 软件工程 文本挖掘技术 APRIORI算法
在线阅读 下载PDF
基于改进BigFIM算法的网络信息大数据高频数据项挖掘算法研究 被引量:3
14
作者 罗莉 《激光杂志》 北大核心 2016年第7期135-140,共6页
超大量的数据从诸如传感器、社交媒体、互联网应用等物联网产生,这些数据被统称为大数据。传统的工具和技术无法处理大数据。为了从大量数据中提取出对新技术有益的信息,大数据的挖掘尤为重要。非常受关注的关联规则挖掘和高频数据项挖... 超大量的数据从诸如传感器、社交媒体、互联网应用等物联网产生,这些数据被统称为大数据。传统的工具和技术无法处理大数据。为了从大量数据中提取出对新技术有益的信息,大数据的挖掘尤为重要。非常受关注的关联规则挖掘和高频数据项挖掘都需要在内存中调入全部数据,但是大量的数据并不适合内存存储。为解决这一难题,业界提出了MapReduce进行并行的大数据处理。本文提出的改进Big FIM算法(Improved Big FIM,IBFIM)运行于MapReduce架构下用于大数据的挖掘.IBFIM相对于Big FIM增加了对更大规模数据的支持并提高了数据挖掘的速度。该研究为更快速、更高效地并行挖掘大数据内容提供参考。 展开更多
关键词 大数据 优化控制 加速算法
原文传递
刑事诉讼中的预测性证据:属性、风险与适用规则
15
作者 叶翔宇 《北京科技大学学报(社会科学版)》 2026年第1期85-96,共12页
预测性证据是指基于数据分析、算法模型等技术手段,以算法预测结果形式证明刑事诉讼法相关事实的“算法型”相似性事实证据。从证明功能与证据特点来看,预测性证据与传统刑事诉讼中的相似性事实证据相契合。虽然,预测性证据不是法定的... 预测性证据是指基于数据分析、算法模型等技术手段,以算法预测结果形式证明刑事诉讼法相关事实的“算法型”相似性事实证据。从证明功能与证据特点来看,预测性证据与传统刑事诉讼中的相似性事实证据相契合。虽然,预测性证据不是法定的证据形式,但其在部分情况下仍能作为证据对案件事实发挥证明作用。与此同时,刑事诉讼中的预测性证据适用还存在着认知偏差传递、信息遮蔽与权利干预等风险。这些风险极易造成刑事诉讼中控辩对抗失衡与诉讼价值失衡,因此,应明确预测性证据适用的基本原则,结合传统相似性事实证据规则与预测性证据特征,构建具有可操作性的证据能力规则与证明力规则,以期推动预测性证据适用的规范化,实现数字正义。 展开更多
关键词 算法预测 相似性事实证据 证据属性 大数据证据
在线阅读 下载PDF
变电站运行状态智能化检修方法设计
16
作者 代显忠 董俊贤 +2 位作者 沈燚 张弄韬 李起荣 《自动化仪表》 2026年第2期70-75,共6页
以降低变电站设备故障概率、提升设备状态智能化检修效果为目的,提出了变电站运行状态智能化检修方法。首先,将变电站设备历史数据库、生产管理系统以及数据采集与监视控制(SCADA)系统中的变电站设备数据作为基础数据来源,通过适配器、... 以降低变电站设备故障概率、提升设备状态智能化检修效果为目的,提出了变电站运行状态智能化检修方法。首先,将变电站设备历史数据库、生产管理系统以及数据采集与监视控制(SCADA)系统中的变电站设备数据作为基础数据来源,通过适配器、数据加工组件、数据访问服务组件等硬件,将数据提供给变电站运行状态智能化检修部分。然后,建立最小综合风险、最大可用输电容量的变电站运行状态智能化检修目标函数。最后,通过粒子群优化算法求解构建的目标函数,以获取最小综合风险与最大可用输电容量;制定对应的变电站运行状态智能化检修策略,完成变电站运行状态智能化检修。试验结果证明,该方法可有效采集变电站设备运行相关数据、检修变电站运行状态、降低设备故障概率与综合风险、提升变电站设备可用输电容量。该方法的应用有助于进一步提高变电站运行的可靠性、保障设备稳定运行。 展开更多
关键词 变电站 大数据架构 设备状态 检修方法 网络爬虫 粒子群优化算法
在线阅读 下载PDF
智能算法安全:内涵、科学问题与展望 被引量:9
17
作者 程学旗 陈薇 +3 位作者 沈华伟 山世光 陈熙霖 李国杰 《中国科学院院刊》 北大核心 2025年第3期419-428,共10页
智能算法是指实现智能的计算过程所体现的方法,大多具备数据驱动、不确定性计算、模型推断难解释等特性,而这些特性同时也给智能算法应用带来了潜在的安全风险。文章首先探讨智能算法安全的内涵。具体地,智能算法安全的内涵依据人机融... 智能算法是指实现智能的计算过程所体现的方法,大多具备数据驱动、不确定性计算、模型推断难解释等特性,而这些特性同时也给智能算法应用带来了潜在的安全风险。文章首先探讨智能算法安全的内涵。具体地,智能算法安全的内涵依据人机融合的程度,由算法自身的一元内生性安全,延伸到算法服务于人时的人机二元应用性安全,最终拓展为人机共生的复杂社会系统中多元系统性安全,故据此提出智能算法安全层级范式(以下简称“TRC范式”),分别涵盖内生决策可信(trustworthiness)的一元安全目标、应用服务可管(regulatability)的二元安全目标和系统风险可控(controllability)的多元安全目标。进一步,基于当前实现TRC范式中的技术难点与智能算法可信、可管、可控的目标,文章提出实现智能算法安全需要重点突破的不确定性算法的可信域判定、黑箱模型的透明化监测与人机共生智能系统的风险临界点感知3个重大科学问题。最后,围绕TRC范式的“度量—评估—增强”技术体系,提出7项研究方向建议与4个方面智能算法安全相关的发展建议,并展望其助力实现人机共治的未来愿景。 展开更多
关键词 大数据 智能算法 智能算法安全 人工智能伦理与安全 智能算法安全层级范式
原文传递
面向大数据的多源化工医药数据融合存储技术优化研究
18
作者 贾晶晶 王晨博 《粘接》 2026年第1期201-204,共4页
针对传统Hadoop框架存储与计算策略处理复杂数据关联性不足的问题,研究首先通过多层次数据集成方法,实现跨系统平台的数据迁移与标准化,构建统一的数据字典。随后,引入基于哈希分桶算法的数据分布机制,优化HDFS存储策略,减少关联数据查... 针对传统Hadoop框架存储与计算策略处理复杂数据关联性不足的问题,研究首先通过多层次数据集成方法,实现跨系统平台的数据迁移与标准化,构建统一的数据字典。随后,引入基于哈希分桶算法的数据分布机制,优化HDFS存储策略,减少关联数据查询时的网络传输开销,并对MapReduce计算框架进行针对性优化,提升关联查询效率。为验证提出的优化策略的有效性,研究基于相同数据规模的多源化工医药数据,对比了MySQL数据库与优化前后的Hadoop框架的关联查询运行时间。结果表明,优化后的Hadoop框架储存多源化工医药时,关联查询所需运行时间大大减少,查询效率大幅提升。 展开更多
关键词 大数据存储优化 多源数据集成 Hadoop框架 哈希分桶算法 关联性分析
在线阅读 下载PDF
基于ISODATA的电力负荷曲线分类 被引量:9
19
作者 李仲恒 刘蓉晖 《上海电力学院学报》 CAS 2019年第4期327-332,共6页
迭代自组织数据分析算法(ISODATA)是一种基于统计模式识别的非监督学习动态聚类算法。针对当前各算法初始聚类数取值困难、容易陷入局部最优等问题,介绍了ISODATA的原理和实现步骤,并将此算法应用于负荷分类中。在MATLAB中结合具体日负... 迭代自组织数据分析算法(ISODATA)是一种基于统计模式识别的非监督学习动态聚类算法。针对当前各算法初始聚类数取值困难、容易陷入局部最优等问题,介绍了ISODATA的原理和实现步骤,并将此算法应用于负荷分类中。在MATLAB中结合具体日负荷曲线样本进行聚类分析,结果证明聚类效果较好。将ISODATA与各种传统聚类方法进行了对比实验,比较各种算法的聚类效果、预定聚类数目对算法结果的影响,以及初始聚类中心的选择对结果的影响。对比结果证明,此方法适用于负荷分类的研究。 展开更多
关键词 迭代自组织数据分析算法 聚类 日负荷曲线 曲线识别 大数据 数据挖掘
在线阅读 下载PDF
一种兼具精度与可解释性的Stacking-SHAP滑坡易发性预测集成方法 被引量:1
20
作者 黄鑫 叶健 +3 位作者 刘骋冰 曾秋雨 郭万新 郭志凯 《测绘学报》 北大核心 2025年第10期1826-1840,共15页
滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性... 滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性预测的准确性与诱因分析的可靠性。本文方法采用Stacking集成框架,融合XGBoost、CatBoost、LightGBM、逻辑回归(LR)、随机森林(RF)等多种机器学习分类器,在保证预测精度的基础上,引入SHAP(shapley additive explanations)算法,以增强模型的可解释性。试验结果表明,Stacking-SHAP模型的AUC值达到0.920,显著优于单一分类器模型,如XGBoost(0.893)、CatBoost(0.894)、LightGBM(0.879)、RF(0.859)和LR(0.794)。更重要的是,相较于SHAP集成单一机器学习模型,Stacking-SHAP可解释增强集成模型在滑坡诱因分析方面表现出更优的综合性能,提高了滑坡致灾因素分析的可信度。整体而言,本文方法兼具高精度预测与高可靠性解释,为滑坡易发性预测与诱因分析提供了一种创新性方法,在滑坡防治与减灾领域具有重要的理论与应用价值。 展开更多
关键词 滑坡易发性 地理大数据 Stacking算法 SHAP算法 滑坡诱因分析
在线阅读 下载PDF
上一页 1 2 72 下一页 到第
使用帮助 返回顶部