期刊文献+
共找到132篇文章
< 1 2 7 >
每页显示 20 50 100
GA-iForest: An Efficient Isolated Forest Framework Based on Genetic Algorithm for Numerical Data Outlier Detection 被引量:4
1
作者 LI Kexin LI Jing +3 位作者 LIU Shuji LI Zhao BO Jue LIU Biqi 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2019年第6期1026-1038,共13页
With the development of data age,data quality has become one of the problems that people pay much attention to.As a field of data mining,outlier detection is related to the quality of data.The isolated forest algorith... With the development of data age,data quality has become one of the problems that people pay much attention to.As a field of data mining,outlier detection is related to the quality of data.The isolated forest algorithm is one of the more prominent numerical data outlier detection algorithms in recent years.In the process of constructing the isolation tree by the isolated forest algorithm,as the isolation tree is continuously generated,the difference of isolation trees will gradually decrease or even no difference,which will result in the waste of memory and reduced efficiency of outlier detection.And in the constructed isolation trees,some isolation trees cannot detect outlier.In this paper,an improved iForest-based method GA-iForest is proposed.This method optimizes the isolated forest by selecting some better isolation trees according to the detection accuracy and the difference of isolation trees,thereby reducing some duplicate,similar and poor detection isolation trees and improving the accuracy and stability of outlier detection.In the experiment,Ubuntu system and Spark platform are used to build the experiment environment.The outlier datasets provided by ODDS are used as test.According to indicators such as the accuracy,recall rate,ROC curves,AUC and execution time,the performance of the proposed method is evaluated.Experimental results show that the proposed method can not only improve the accuracy and stability of outlier detection,but also reduce the number of isolation trees by 20%-40%compared with the original iForest method. 展开更多
关键词 outlier detection isolation tree isolated forest genetic algorithm feature selection
在线阅读 下载PDF
一种检测Docker容器异常的DiForest算法
2
作者 谢兆贤 孔德泓 +1 位作者 徐凤雅 杨晴晴 《信息安全研究》 北大核心 2025年第12期1156-1164,共9页
针对孤立森林(isolation forest,iForest)算法存在异常检测的准确性差、资源消耗量大、时间和空间复杂度高等问题,在既有的基础上采用特征加权选择,通过建立孤立树路径长度标准差的方式,提出一种新型的孤立森林(deviation-enhanced isol... 针对孤立森林(isolation forest,iForest)算法存在异常检测的准确性差、资源消耗量大、时间和空间复杂度高等问题,在既有的基础上采用特征加权选择,通过建立孤立树路径长度标准差的方式,提出一种新型的孤立森林(deviation-enhanced isolation forest,DiForest)算法,应用于Docker容器异常检测.实验通过模拟CPU、内存、磁盘IO和URL访问超限4类异常情况,对iForest和DiForest这2个异常检测算法进行比较和分析.实验结果表明,DiForest算法在进行异常检测时,容器内部的平均运行内存为30.6 MB,小于iForest算法检测指标值的6.67%.网络吞吐量为110 Mbps,大于iForest算法异常检测指标值的13.3%.与此同时,日志异常检测实验模拟URL访问超限的结果显示,DiForest算法访问请求的成功率为82.9%,比iForest算法访问请求的成功率高31.8%.因此DiForest算法不仅能够减少容器异常时的资源消耗,还能够提高异常日志检测的准确性. 展开更多
关键词 异常检测 孤立森林算法 Docker容器 特征加权选择 日志异常检测
在线阅读 下载PDF
基于iForest-Adaboost的核电厂一回路故障诊断技术研究 被引量:7
3
作者 艾鑫 刘永阔 +2 位作者 蒋利平 夏虹 周馨萩 《核动力工程》 EI CAS CSCD 北大核心 2020年第3期208-213,共6页
传统的故障诊断方法如主元分析方法与BP神经网络等在复杂非线性系统中存在泛化能力较差、故障识别准确度较低的问题。而孤立森林(iForest)算法使用孤立树划分思想识别异常数据,可适用于非线性系统的状态监测;Adaboost算法是一种基于组... 传统的故障诊断方法如主元分析方法与BP神经网络等在复杂非线性系统中存在泛化能力较差、故障识别准确度较低的问题。而孤立森林(iForest)算法使用孤立树划分思想识别异常数据,可适用于非线性系统的状态监测;Adaboost算法是一种基于组合分类思想的提升算法,可通过多个弱分类器的叠加,使整体算法具有较好的泛化能力。因此采用i Forest算法与Adaboost算法建立iForest-Adaboost核电厂一回路故障诊断系统,使用GSE实时仿真平台与福清核电站一号机组仿真数据测试。测试结果表明,iForest算法相比于主元分析与QTA阈值法可以更快识别出系统异常,Adaboost算法相比于BP神经网络与支持向量机方法具有更高的故障识别准确率。 展开更多
关键词 核电站 一回路 故障诊断 孤立森林(iforest)算法 ADABOOST算法
原文传递
基于iForest和LOF的流量异常检测 被引量:11
4
作者 杭菲璐 郭威 +2 位作者 陈何雄 张振红 易东阳 《计算机应用研究》 CSCD 北大核心 2022年第10期3119-3123,共5页
异常检测在现代大规模分布式系统的安全管理中起着重要作用,而网络流量异常检测则是组成异常检测系统的重要工具。网络流量异常检测的目的是找到和大多数流量数据不同的流量,并将这些离群点视为异常。由于现有的基于树分离的孤立森林(iF... 异常检测在现代大规模分布式系统的安全管理中起着重要作用,而网络流量异常检测则是组成异常检测系统的重要工具。网络流量异常检测的目的是找到和大多数流量数据不同的流量,并将这些离群点视为异常。由于现有的基于树分离的孤立森林(iForest)检测方法存在不能检测出局部异常的缺陷,为了克服这个缺陷,提出一种基于iForest和局部离群因子(LOF)近邻集成的无监督的流量异常检测方法。首先,改进原始的iForest与LOF算法,在提升检测精度的同时控制算法时间;然后分别使用两种改进算法进行检测,并将结果进行融合以得到最终的检测结果;最后在自制数据集上对所提方法进行有效性验证。实验结果表明,所提方法能够有效地隔离出异常,获得良好的流量异常检测效果。 展开更多
关键词 流量异常检测 大规模多维数据 孤立森林 特征离群系数 局部离群因子
在线阅读 下载PDF
Optimizing the Isolation Forest Algorithm for Identifying Abnormal Behaviors of Students in Education Management Big Data
5
作者 Bibo Feng Lingli Zhang 《Journal of Artificial Intelligence and Technology》 2024年第1期31-39,共9页
With the changes in educational models,applying computer algorithms and artificial intelligence technologies to data analysis in universities has become a research hotspot in the field of intelligent education.In resp... With the changes in educational models,applying computer algorithms and artificial intelligence technologies to data analysis in universities has become a research hotspot in the field of intelligent education.In response to the increasing amount of student data in universities,this study proposes to use an optimized isolated forest algorithm for recognizing features to detect abnormal student behavior concealed in big data for educational management.Firstly,it uses a logistic regression algorithm to update the calculation method of isolated forest weights and then uses residual statistics to eliminate redundant forests.Finally,it utilizes discrete particle swarm optimization to optimize the isolated forest algorithm.On this basis,improvements have also been made to the traditional gated loop unit network.It merges the two improved algorithm models and builds an anomaly detection model for collecting college student education data.The experiment shows that the optimized isolated forest algorithm has a recognition accuracy of 0.986 and a training time of 1s.The recognition accuracy of the improved gated loop unit network is 0.965,and the training time is 0.16s.In summary,the constructed model can effectively identify abnormal data of college students,thereby helping educators to detect students’problems in time and helping students to improve their learning status. 展开更多
关键词 isolated forest algorithm education abnormal behavior big data DISTINGUISH
在线阅读 下载PDF
基于Isolation Forest算法的10 kV配电网故障自动定位研究
6
作者 蔡林宏 陆曦 《电工技术》 2025年第S1期158-159,共2页
随着电网智能化程度的提高,对配电网络进行故障诊断是一个迫切需要解决的问题。针对10 kV配电网络,以孤立森林为研究对象,研究其在故障发生前和发生后的准确定位。研究表明,在高噪音、复杂电网数据背景下,孤立森林算法具有很好的异常检... 随着电网智能化程度的提高,对配电网络进行故障诊断是一个迫切需要解决的问题。针对10 kV配电网络,以孤立森林为研究对象,研究其在故障发生前和发生后的准确定位。研究表明,在高噪音、复杂电网数据背景下,孤立森林算法具有很好的异常检测性能。 展开更多
关键词 孤立森林算法 配电网 故障定位 特征提取 智能电网
在线阅读 下载PDF
基于孤立森林算法的直流系统调试全过程监控
7
作者 张坤 李志中 +2 位作者 陈兴望 杨若朴 吴小刚 《信息技术》 2026年第3期77-81,共5页
在实际直流系统调试监控中,可能会出现数据丢失、不完整或者受到噪声干扰的情况,这会影响监控结果的准确性。为此,文中提出基于孤立森林算法的直流系统调试全过程监控方法。概述直流系统调试的基本组成,并分析直流系统调试过程中的特点... 在实际直流系统调试监控中,可能会出现数据丢失、不完整或者受到噪声干扰的情况,这会影响监控结果的准确性。为此,文中提出基于孤立森林算法的直流系统调试全过程监控方法。概述直流系统调试的基本组成,并分析直流系统调试过程中的特点和挑战。在数据的预处理中,采用拉格朗日插值方法来插补直流系统调试数据缺失值。引入孤立森林算法,对每一个iTree进行遍历,计算直流系统调试数据的平均深度,完成直流系统调试的全过程监控。实验结果显示:研究方法的ROC曲线与横坐标的面积接近1,说明研究方法的特异度和灵敏度均较高,其应用性能更优。 展开更多
关键词 孤立森林算法 直流系统 调试全过程监控 iTree遍历
在线阅读 下载PDF
基于Isolation Forest改进的数据异常检测方法 被引量:28
8
作者 徐东 王岩俊 +1 位作者 孟宇龙 张子迎 《计算机科学》 CSCD 北大核心 2018年第10期155-159,共5页
针对现有的基于隔离森林(Isolation Forest)的数据异常检测算法检测精度低、执行效率差和泛化能力弱等问题,提出一种改进的数据异常检测方法 SA-iForest。该方法基于模拟退火算法选择精度高和有差异性的隔离树来优化森林,同时去除冗余... 针对现有的基于隔离森林(Isolation Forest)的数据异常检测算法检测精度低、执行效率差和泛化能力弱等问题,提出一种改进的数据异常检测方法 SA-iForest。该方法基于模拟退火算法选择精度高和有差异性的隔离树来优化森林,同时去除冗余的隔离树,改进了隔离森林的森林构建。采用标准仿真数据集对所提方法进行验证,结果表明该方法与传统Isolation Forest和LOF方法相比,在准确率、执行效率和稳定性方面均有显著提高。 展开更多
关键词 隔离森林 异常检测 SA-iforest 模拟退火
在线阅读 下载PDF
基于优化TimeGAN的航空发动机燃油调节系统故障数据增强方法
9
作者 张瑞鑫 马逸超 +1 位作者 李洋洋 李运华 《应用基础与工程科学学报》 北大核心 2026年第1期64-75,共12页
燃油调节系统作为航空发动机控制的核心系统是发动机故障高发区域.针对基于机器学习的故障诊断模型在训练中面临的数据规模有限和样本同质化问题,提出一种结合优化时间序列生成对抗网络(Time-series Generative Adversarial Networks,Ti... 燃油调节系统作为航空发动机控制的核心系统是发动机故障高发区域.针对基于机器学习的故障诊断模型在训练中面临的数据规模有限和样本同质化问题,提出一种结合优化时间序列生成对抗网络(Time-series Generative Adversarial Networks,TimeGAN)与孤立森林(Isolation Forest,iForest)的小样本数据增强方法.该方法首先通过TimeGAN学习由AMESim获得的故障数据的时间相关特性,生成多元故障时间序列;进而采用粒子群算法(Particle Swarm Optimization,PSO)优化TimeGAN网络参数,以加强对不同故障模式的特征注意与学习能力.在此基础上,利用训练后的优化TimeGAN生成故障数据,并借助iForest进行异常检测与去除,从而进一步提升生成故障数据的质量.通过对某型号航空发动机燃油调节系统的AMESim模型的有限故障数据开展验证分析表明,与传统方法相比,所提方法显著提高了故障数据的多样性、代表性和分布覆盖度,有效缓解了小样本条件下的特征学习不足问题,为航空发动机燃油调节系统的智能运维与故障识别提供了更充分的数据支持. 展开更多
关键词 航空发动机 燃油调节系统 时间序列生成对抗网络 孤立森林 优化算法 异常检测
原文传递
A novel integrated framework for enhanced water source identification
10
作者 CHAI Xin MA Xiaomin +4 位作者 LI Han WU Baobao LIU Junsheng GUAN Haipeng YANG Zhenwei 《Journal of Mountain Science》 2026年第3期1318-1333,共16页
Accurate identification of water sources is crucial for effective water management and safety in mining operations.However,imbalanced water sample datasets often lead to suboptimal classification accuracy.To address t... Accurate identification of water sources is crucial for effective water management and safety in mining operations.However,imbalanced water sample datasets often lead to suboptimal classification accuracy.To address this challenge,this study proposes a novel water source identification method integrating Synthetic Minority Over-Sampling Technique(SMOTE),Zebra Optimization Algorithm(ZOA),and Light Gradient Boosting Machine(LightGBM).Initially,SMOTE is utilized to synthesize samples for the minority class within the imbalanced dataset,thereby generating a balanced water sample dataset and mitigating class distribution disparities.Subsequently,an efficient water source identification model is constructed by combining ZOA with LightGBM,leveraging the strengths of both algorithms.The model’s performance is validated using a test set and compared with other common classification models.Results demonstrate that SMOTE significantly alleviates class imbalance and enhances the classification accuracy of LightGBM for minority class water samples.ZOA parameter tuning accelerates model convergence and further improves classification accuracy,optimizing the model’s overall performance.In experimental validation,the proposed SMOTE-ZOA-LightGBM model achieved an accuracy of 88.41%and a F1 score of 88.24%,outperforming six other classification models.The method proposed in this paper can accurately identify water source types,effectively addressing the issue of low classification accuracy caused by imbalanced water sample data.It provides reliable technical support and scientific basis for identifying and preventing water inrush sources in mines. 展开更多
关键词 Water source identification Machine learning Synthetic minority over-sampling technique Zebra Optimization algorithm Isolation forest
原文传递
炼油装置的在线监测维护方法研究
11
作者 张磊 《现代制造技术与装备》 2026年第2期138-140,共3页
为提高炼油装置运行的安全性与可靠性,提出一种基于多源数据融合与智能诊断的在线监测维护方法。该方法包括数据采集、特征提取、异常检测和维护决策4个环节,通过小波包分解提取多频段能量特征,结合孤立森林算法识别异常状态,基于风险... 为提高炼油装置运行的安全性与可靠性,提出一种基于多源数据融合与智能诊断的在线监测维护方法。该方法包括数据采集、特征提取、异常检测和维护决策4个环节,通过小波包分解提取多频段能量特征,结合孤立森林算法识别异常状态,基于风险评估矩阵生成分级维护策略。应用结果表明,该方法可显著提高异常检测准确性与响应速度,不仅将平均检测时延缩短为8 min、准确率提高至94.2%,而且能有效降低误报率与维护成本,减少非计划停机,提高设备可用率,为炼油装置的智能化运维提供参考。 展开更多
关键词 炼油装置 在线监测 智能维护 小波包分解 孤立森林算法
在线阅读 下载PDF
基于深度学习的高速公路数据质量管理研究
12
作者 孙楠 陈思行 +1 位作者 刘烨 黄毅嵩 《计算机技术与发展》 2026年第1期184-192,共9页
随着高速公路信息化的快速发展,运营数据的管理和利用成为提升路网服务水平和运营效率的关键。本研究构建了一个系统化的高速公路运营数据质量管理方法框架,该框架由数据质量评价、数据质量分析和数据质量修复三个核心模块构成。首先,采... 随着高速公路信息化的快速发展,运营数据的管理和利用成为提升路网服务水平和运营效率的关键。本研究构建了一个系统化的高速公路运营数据质量管理方法框架,该框架由数据质量评价、数据质量分析和数据质量修复三个核心模块构成。首先,采用AHP-CRITIC构建了多维度的运营数据质量评价模型,实现了评价指标的量化评估;其次,基于孤立森林算法构建了数据质量分析模型,有效识别并定位数据异常点;最后,基于自注意力机制优化的时间卷积网络构建数据质量修复模型,通过深度学习技术实现数据异常值的智能修复。为验证修复效果,本研究将修复前后的数据分别输入多种回归预测模型进行对比分析,结果表明各模型的预测性能均得到显著提升。该框架的实施不仅能够有效提升高速公路运营数据质量,为运营决策支持系统提供可靠的数据基础,同时对于推动高速公路行业的数字化转型具有重要的实践意义。 展开更多
关键词 交通数据 数据质量管理 孤立森林算法 时间卷积网络 自注意力机制
在线阅读 下载PDF
基于DEIM爆管侦测方法的青东供水调度管理优化策略研究
13
作者 冯偲慜 《工程建设与设计》 2026年第3期68-70,共3页
针对青东地区供水系统爆管侦测精度低、调度响应滞后的问题,论文以“青东供水系统的爆管精准侦测+调度管理优化”为核心研究对象,提出了一种DEIM爆管侦测方法(一种集成压力扰动提取与孤立森林算法的数据分析方法),并以该方法的侦测结果... 针对青东地区供水系统爆管侦测精度低、调度响应滞后的问题,论文以“青东供水系统的爆管精准侦测+调度管理优化”为核心研究对象,提出了一种DEIM爆管侦测方法(一种集成压力扰动提取与孤立森林算法的数据分析方法),并以该方法的侦测结果为依据,融合压力波动规律与用水需求预测,提出了多目标供水调度优化策略。 展开更多
关键词 供水调度管理 爆管侦测 孤立森林算法 数据驱动 供水系统管理
在线阅读 下载PDF
Detection of Multivariate Geochemical Anomalies Using the Bat-Optimized Isolation Forest and Bat-Optimized Elliptic Envelope Models 被引量:2
14
作者 Yongliang Chen Shicheng Wang +1 位作者 Qingying Zhao Guosheng Sun 《Journal of Earth Science》 SCIE CAS CSCD 2021年第2期415-426,共12页
Isolation forest and elliptic envelope are used to detect geochemical anomalies,and the bat algorithm was adopted to optimize the parameters of the two models.The two bat-optimized models and their default-parameter c... Isolation forest and elliptic envelope are used to detect geochemical anomalies,and the bat algorithm was adopted to optimize the parameters of the two models.The two bat-optimized models and their default-parameter counterparts were used to detect multivariate geochemical anomalies from the stream sediment survey data of 1:50000 scale collected from the Helong district,Jilin Province,China.Based on the data modeling results,the receiver operating characteristic(ROC)curve analysis was performed to evaluate the performance of the two bat-optimized models and their default-parameter counterparts.The results show that the bat algorithm can improve the performance of the two models by optimizing their parameters in geochemical anomaly detection.The optimal threshold determined by the Youden index was used to identify geochemical anomalies from the geochemical data points.Compared with the anomalies detected by the elliptic envelope models,the anomalies detected by the isolation forest models have higher spatial relationship with the mineral occurrences discovered in the study area.According to the results of this study and previous work,it can be inferred that the background population of the study area is complex,which is not suitable for the establishment of elliptic envelope model. 展开更多
关键词 bat algorithm isolation forest elliptic envelope receiver operating characteristic curve analysis geochemical anomaly detection
原文传递
基于Isolation Forest和Random Forest相结合的智能电网时间序列数据异常检测算法 被引量:11
15
作者 杨永娇 肖建毅 +1 位作者 赵创业 周开东 《计算机与现代化》 2020年第3期99-102,126,共5页
智能电网的信息系统是保障电力行业正常运行的基础,而智能电网中各种时间序列数据的分析结果是衡量信息系统稳定运行的重要依据。传统的时间序列数据异常检测算法很难同时兼顾准确性和实时性。本文引入基于Isolation Forest和Random For... 智能电网的信息系统是保障电力行业正常运行的基础,而智能电网中各种时间序列数据的分析结果是衡量信息系统稳定运行的重要依据。传统的时间序列数据异常检测算法很难同时兼顾准确性和实时性。本文引入基于Isolation Forest和Random Forest相结合的智能电网时间序列数据异常检测算法,结合无监督学习算法和有监督学习算法的优点,实现机器自动标注和自动学习阈值,人工标注少量特征值,从一定程度上提高了时间序列数据异常检查准确性和实时性,可以满足智能电网时间序列数据异常检测需求,从而达到提升智能电网信息安全的目的。 展开更多
关键词 Isolation forest算法 Random forest算法 异常检测算法 时间序列数据 智能电网
在线阅读 下载PDF
基于CoAtNet-LSTM模型的多传感器信息融合刀具磨损预测 被引量:1
16
作者 李亚 尚轩丞 +1 位作者 王海瑞 朱贵富 《计量学报》 北大核心 2025年第10期1433-1445,共13页
基于长短时记忆网络(LSTM)与CoAtNet网络,提出了一种刀具磨损预测CoAtNet-LSTM模型。在时域、频域、时频域中提取传感器信号特征,并通过孤立森林算法进行信号特征异常值处理,再将其输入预测模型中获得刀具磨损预测值并通过Hyperband算... 基于长短时记忆网络(LSTM)与CoAtNet网络,提出了一种刀具磨损预测CoAtNet-LSTM模型。在时域、频域、时频域中提取传感器信号特征,并通过孤立森林算法进行信号特征异常值处理,再将其输入预测模型中获得刀具磨损预测值并通过Hyperband算法优化模型超参数。应用PHM2010数控铣床刀具数据集验证训练模型的预测精度。实验结果表明,该模型的决定系数相较于原CoAtNet和LSTM网络模型平均提升了12.73%、16.44%。 展开更多
关键词 几何量计量 刀具磨损 CoAtNet-LSTM模型 长短期时间记忆网络 Hyperband算法 孤立森林算法
在线阅读 下载PDF
基于IForest和Sentinel-2的浒苔提取方法研究
17
作者 孙琬婷 朱秀芳 《自然资源遥感》 2026年第2期230-238,共9页
针对浒苔遥感提取中固定阈值法精度低、普适性不足,以及监督分类方法(如支持向量机、随机森林(random forest,RF))需依赖大量标注样本等问题,文章提出了一种融合无监督孤立森林(isolation forest,IForest)异常检测与RF监督分类的自动化... 针对浒苔遥感提取中固定阈值法精度低、普适性不足,以及监督分类方法(如支持向量机、随机森林(random forest,RF))需依赖大量标注样本等问题,文章提出了一种融合无监督孤立森林(isolation forest,IForest)异常检测与RF监督分类的自动化浒苔提取方法(IForest-RF)。该方法基于Sentinel-2 L2A卫星影像,在2024年6月26日黄海海域浒苔分布差异显著的2个区域对比了IForest-RF和5种其他方法(IForest结合大津法、IForest结合支持向量机法、传统大津法、支持向量机法和RF法)的浒苔提取精度,并进一步测试了该方法在大范围浒苔发生区域的识别效果。结果显示:IForest-RF法在2个测试区的总体精度均在90%以上,Kappa系数均大于95%,显著优于其他5种方法;大范围测试中总体精度为98%,Kappa系数为95%。总体来说,IForest-RF法兼具高精度、强适应性与自动化优势,可为浒苔灾害的实时监测与生态评估提供可靠技术支撑。 展开更多
关键词 孤立森林 异常检测 最大化类间方差 支持向量机 随机森林 浒苔
在线阅读 下载PDF
孤立森林算法下电力负荷异常数据辨识方法 被引量:1
18
作者 杨雪 陈巍 +1 位作者 刘静 李昌利 《计算机仿真》 2025年第3期140-144,共5页
为了提高电力企业管理水平,保证数据计量的准确性,提出了孤立森林算法下电力负荷异常数据辨识方法。利用拉格朗日插值方法插补电力负荷数据缺失值,标准化处理插补后的数据,获得标准化处理后的数据。根据随机解耦特征分解方法分解标准的... 为了提高电力企业管理水平,保证数据计量的准确性,提出了孤立森林算法下电力负荷异常数据辨识方法。利用拉格朗日插值方法插补电力负荷数据缺失值,标准化处理插补后的数据,获得标准化处理后的数据。根据随机解耦特征分解方法分解标准的电力负荷数据的谱特征,得到数据稀疏异质特征点集合。基于数据特征运用孤立森林算法划分电力负荷数据,构造iTree,运用异常分值完成异常数据辨识。通过实验证明所提方法能够精准辨识电力负荷异常数据,辅助相关人员及时作出修复决策,保证电力系统安全性。 展开更多
关键词 孤立森林算法 电力负荷 异常数据辨识 频谱特征 数据标准化处理
在线阅读 下载PDF
基于Sentence-BERT与孤立森林算法的专利新颖性评估 被引量:1
19
作者 邓娜 王雨佳 +1 位作者 杨洋 陈旭 《情报杂志》 北大核心 2025年第2期174-182,共9页
[研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提... [研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提出一种基于Sentence-BERT与孤立森林算法的专利新颖性评估方法。首先,使用专利标题与IPC分类号分别作为专利的应用方向与功能分类特征,再通过BiLSTM-CRF模型对专利摘要进行关键技术抽取作为实施方法特征;其次,采用Sentence-BERT对上述特征进行文本向量化表示后组合输入至孤立森林算法获得离群专利集;最后,通过技术量权值过滤法提高专利新颖性评估的精度。[研究结果/结论]以金融科技领域专利进行实证研究,结果表明,该评估方法准确率相较专业专利分析平台方法提升了9%~11%。证明了该方法在专利新颖性评估中的有效性,能为后续专利审核工作和高价值专利分析提供参考。 展开更多
关键词 专利评估 专利新颖性 BiLSTM-CRF Sentence-BERT 孤立森林算法 机器学习
在线阅读 下载PDF
基于孤立森林算法的供电营销大数据异常挖掘方法 被引量:1
20
作者 于亮 钟宏伟 +2 位作者 冯祎辰 肖莞 张硕 《微型电脑应用》 2025年第2期51-54,共4页
当前供电营销大数据异常挖掘方法中异常数据检测环节较为薄弱,导致数据异常挖掘率相对较低且误检率较高,为此,提出基于孤立森林算法的供电营销大数据异常挖掘方法。构建孤立森林模型检测原始数据,借鉴二叉搜索树(BST)方法确定模型之间... 当前供电营销大数据异常挖掘方法中异常数据检测环节较为薄弱,导致数据异常挖掘率相对较低且误检率较高,为此,提出基于孤立森林算法的供电营销大数据异常挖掘方法。构建孤立森林模型检测原始数据,借鉴二叉搜索树(BST)方法确定模型之间数据距离,获取异常数据。使用离散小波变换方法,提取异常数据特征。对传统k-means算法进行优化,结合异常数据特征构建数据簇,实现对异常数据的挖掘分析。构建应用测试环节,测试结果表明,所提方法可有效提升供电营销大数据异常挖掘率,进一步降低数据异常挖掘误检率,为供电营销大数据分析环节提供新的发展方向。 展开更多
关键词 孤立森林算法 供电营销 大数据平台 异常数据挖掘 聚类数目
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部