期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于不规则区域划分方法的k-Nearest Neighbor查询算法 被引量:1
1
作者 张清清 李长云 +3 位作者 李旭 周玲芳 胡淑新 邹豪杰 《计算机系统应用》 2015年第9期186-190,共5页
随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细... 随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细介绍了一种基于不规则区域划分方法的改进型k NN查询算法,并利用对大规模数据集进行分布式并行计算的模型Map Reduce对该算法加以实现.实验结果与分析表明,Map Reduce框架下基于不规则区域划分方法的k NN查询算法可以获得较高的数据处理效率,并可以较好的支持大数据环境下数据的高效查询. 展开更多
关键词 k-nearest neighbor(k nn)查询算法 不规则区域划分方法 MAP REDUCE 大数据
在线阅读 下载PDF
基于改进K-NN和SVM的多学科协作诊疗决策支持系统 被引量:1
2
作者 李晓峰 王妍玮 李东 《计算机系统应用》 2020年第6期80-88,共9页
由于当前的诊疗决策支持系统采用单一学科的决策方法,导致诊疗精度不高,获取的数据分类结果准确率较低,提出并设计一种基于改进K-NN(K-Nearest Neighbour)分类算法和SVM(Support Vector Mechine)的多学科协作诊疗决策支持系统.在构建系... 由于当前的诊疗决策支持系统采用单一学科的决策方法,导致诊疗精度不高,获取的数据分类结果准确率较低,提出并设计一种基于改进K-NN(K-Nearest Neighbour)分类算法和SVM(Support Vector Mechine)的多学科协作诊疗决策支持系统.在构建系统总体框架的基础上,对数据库系统模块、人机交互模块和诊疗推理模块进行设计,其中诊疗推理模块是系统的软件核心,通过改进K-NN分类算法和SVM建立推理引擎,在计算机的辅助下,搜索与患者病症信息相似的医疗案例,并进行相似度匹配,根据匹配结果与患者症状集构建一个新的临床案例,引入CDA(Clinical Document Architecture)概念,实现改进K-NN分类算法和SVM算法的有效融合,完成多学科协作诊疗决策.实验结果表明,与传统系统相比,该系统的诊疗决策精度高,评价指标测试平均值达到95.98%,分类结果准确率较高,在该系统辅助下能提高医生诊断正确性,降低误诊率,且运算复杂度较低. 展开更多
关键词 改进k-nn分类算法 SVM 多学科协作 诊疗决策支持系统
在线阅读 下载PDF
多颜色模型分割自学习k-NN设备状态识别方法 被引量:2
3
作者 郭雪梅 刘桂雄 《中国测试》 CAS 北大核心 2016年第4期107-110,共4页
在浪涌测试中,由于每次识别对象不同,直接采用特征匹配每次测试前需要根据受试设备重新训练样本。先根据图像中高亮度点、白光所占比例,决策用于图像分割的颜色模型(L*a*b*、HSL、HSV),实现自适应分割;其次,提出自学习k-NN算法,以像素数... 在浪涌测试中,由于每次识别对象不同,直接采用特征匹配每次测试前需要根据受试设备重新训练样本。先根据图像中高亮度点、白光所占比例,决策用于图像分割的颜色模型(L*a*b*、HSL、HSV),实现自适应分割;其次,提出自学习k-NN算法,以像素数n、偏心率e、密实度比r、欧拉数E为样本S特征向量X,构建数据集T0,以欧氏距离D实现样本分类;若样本置信度为k,加入预备数据集Tz′中,当Tz′满足条件,则扩充数据集Tz形成数据集Tz+1。结果证明:算法在9组各类样本(共21 600帧图像)识别中,准确度可达98.65%;并自学习扩充5组样本,距离矩阵变化较小,可见算法学习效率、学习准确度较高。 展开更多
关键词 多颜色模型 k近邻算法 自学习 浪涌测试
在线阅读 下载PDF
密度峰值聚类k匿名分布式网络数据隐私保护方法研究
4
作者 郭艳红 《数字通信世界》 2025年第3期41-42,120,共3页
由于分布式网络数据分散在多个节点上,导致数据隐私泄露的概率较大,为此,本文进行了密度峰值聚类k匿名的分布式网络数据隐私保护方法研究。其充分考虑了分布式网络环境自身的特点,引入了分布式k-NN查询算法,以找到其k个最近邻点,同时保... 由于分布式网络数据分散在多个节点上,导致数据隐私泄露的概率较大,为此,本文进行了密度峰值聚类k匿名的分布式网络数据隐私保护方法研究。其充分考虑了分布式网络环境自身的特点,引入了分布式k-NN查询算法,以找到其k个最近邻点,同时保证查询过程以不泄露数据隐私为目标,构建了针对分布式网络数据的k近邻匿名模型;利用密度峰值聚类算法识别具有高局部密度并且与更高密度点的距离较大的数据点作为聚类中心,对k近邻匿名模型中的节点进行聚类,实现数据保护。在测试结果中,设计方法在不同场景中的保护效果最好,对应的数据泄露概率始终稳定在0.2以下。 展开更多
关键词 密度峰值聚类 k匿名 分布式网络 数据隐私保护 分布式k-nn查询算法 k近邻匿名模型 局部密度
在线阅读 下载PDF
基于双层结构的加速K-NN分类方法 被引量:3
5
作者 王晓 赵丽 《计算机工程与设计》 北大核心 2018年第4期1071-1077,共7页
在传统K-NN分类中,对于每个待测样本均需计算并寻找k个决策近邻,分类效率较低。针对该问题,提出一种双层结构的加速K-NN分类(K-NN classification based on double-layer structure,KNN_DL)方法。将正类和负类样本分别划分为多个不同子... 在传统K-NN分类中,对于每个待测样本均需计算并寻找k个决策近邻,分类效率较低。针对该问题,提出一种双层结构的加速K-NN分类(K-NN classification based on double-layer structure,KNN_DL)方法。将正类和负类样本分别划分为多个不同子集,计算每个子集的中心和半径。当新样本进入时,选择k个决策近邻子集,若其具有相同的类别标签,将该样本标记为相应类别;反之,选择决策近邻子集中最近的k个决策近邻。这种双层结构的加速方式,压缩待测样本的决策近邻规模,提高效率。实验结果表明,KNN_DL方法能够获得较高的样本预测速度和较好的预测准确率。 展开更多
关键词 k-nn分类 决策近邻子集 决策近邻样本 中心 半径 knn_DL方法
在线阅读 下载PDF
基于K近邻算法和混合BiLSTM功率预测的微电网运行策略
6
作者 毛睿 马辉 +4 位作者 向昆 范李平 赵剑楠 王灿 席磊 《分布式能源》 2025年第2期12-24,共13页
可再生能源出力的不确定性为微电网的优化调度带来了重大挑战。同时,传统的优化方法和调度时间尺度过于单一,导致调度结果存在较大误差,从而难以确保系统运行的可靠性与经济性。针对上述问题,提出了一种基于K-近邻(K-nearest neighbor,K... 可再生能源出力的不确定性为微电网的优化调度带来了重大挑战。同时,传统的优化方法和调度时间尺度过于单一,导致调度结果存在较大误差,从而难以确保系统运行的可靠性与经济性。针对上述问题,提出了一种基于K-近邻(K-nearest neighbor,K-NN)算法、变模态分解(variational mode decomposition,VMD)、卷积神经网络(convolutional neural network,CNN)以及双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络的微电网两阶段优化运行策略。首先,构建了基于K-近邻算法和混合BiLSTM功率预测模型,为两阶段优化调度模型提供准确的风光发电预测数据。其次,建立了两阶段优化调度模型。在日前调度阶段,引入阶梯式碳交易机制和激励型需求响应,以最小化系统总运行成本为目标制定日前调度计划;在日内调度阶段,则采用基于模型预测控制的方法,实现日内滚动优化调度策略,以调整量最小为目标对日前调度计划进行动态修正,从而降低因预测误差引起的功率波动。最后,以某微电网为例进行了仿真分析,结果表明:该方法不仅有效提高了预测精确性,同时也提升了微电网的经济性、环保性及稳定性。 展开更多
关键词 k-近邻(k-nn)算法 微电网 功率预测 两阶段运行策略 激励型需求响应 模型预测控制
在线阅读 下载PDF
基于值差度量和聚类优化的K最近邻算法在银行客户行为预测中的应用 被引量:7
7
作者 李博 张晓 +4 位作者 颜靖艺 李可威 李恒 凌玉龙 张勇 《计算机应用》 CSCD 北大核心 2019年第9期2784-2788,共5页
为提升贷款金融客户行为预测的准确性,针对传统的K-最近邻(K NN)算法在数据分析中处理非数值因素的不完备问题,提出了一种采用值差度量(VDM)距离的对聚类结果迭代优化的改进K NN算法。首先对收集到的数据信息进行基于VDM距离的K NN算法... 为提升贷款金融客户行为预测的准确性,针对传统的K-最近邻(K NN)算法在数据分析中处理非数值因素的不完备问题,提出了一种采用值差度量(VDM)距离的对聚类结果迭代优化的改进K NN算法。首先对收集到的数据信息进行基于VDM距离的K NN算法的聚类,再对聚类结果进行迭代分析,最后通过联合训练提高了预测精度。基于葡萄牙零售银行2008—2013年收集的客户数据比较可知,改进的K NN算法与传统的K NN算法、基于属性值相关距离的K NN改进(FCD-K NN)算法、高斯贝叶斯算法、Gradient Boosting等现有算法相比具有更好的性能和稳定性,在银行数据预测客户行为中具有很大的应用价值。 展开更多
关键词 k-最近邻算法 值差异度量距离 金融危机 行为预测 数据挖掘
在线阅读 下载PDF
结合局部敏感哈希的k近邻数据填补算法 被引量:5
8
作者 郑奇斌 刁兴春 +2 位作者 曹建军 周星 许永平 《计算机应用》 CSCD 北大核心 2016年第2期397-401,共5页
k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的k NN数据填补算法LSH-k NN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之... k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的k NN数据填补算法LSH-k NN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的k条记录,并按照k NN算法对不完整记录进行填补。通过在4个真实数据集上的实验表明,结合局部敏感哈希的k NN填补算法LSH-k NN相对经典的k NN算法能够显著提高填补效率,并且保持准确性基本不变。 展开更多
关键词 数据质量 数据完整性 数据填补 k近邻算法 局部敏感哈希
在线阅读 下载PDF
面向K最近邻分类的遗传实例选择算法 被引量:7
9
作者 黄宇扬 董明刚 敬超 《计算机应用》 CSCD 北大核心 2018年第11期3112-3118,共7页
针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的遗传实例选择算法。该算法采用基于决策树和遗传算法的二阶段筛选机制,先使用决策树确定噪声样本存在的范围;再使用遗传算法在该范围... 针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的遗传实例选择算法。该算法采用基于决策树和遗传算法的二阶段筛选机制,先使用决策树确定噪声样本存在的范围;再使用遗传算法在该范围内精确删除噪声样本,可有效地降低误删率并提高效率,采用基于最近邻规则的验证集选择策略,进一步提高了遗传算法实例选择的准确度;最后引进基于均方误差(MSE)的分类精度惩罚函数来计算遗传算法中个体的适应度,提高有效性和稳定性。在20个数据集上,该方法相较于基于预分类的KNN(PRKNN)、基于协同进化的实例特征选择算法(IFS-CoCo)、K最近邻(KNN),在分类精度上的提升分别为0.07~26.9个百分点、0.03~11.8个百分点、0.2~12.64个百分点,在AUC和Kappa的上的提升分别为0.25~18.32个百分点、1.27~23.29个百分点、0.04~12.82个百分点。实验结果表明,该方法相较于当前实例选择算法在分类精度和分类效率上均具有优势。 展开更多
关键词 k最近邻 遗传算法 决策树 实例选择 噪声样本 机器学习
在线阅读 下载PDF
高光谱分辨不同细菌的可行性研究
10
作者 黄娴 《广东化工》 2025年第11期141-144,140,共5页
培养细菌菌落分散密度合适的平板,利用高光谱技术对LB固体培养基上的不同细菌(大肠埃希氏杆菌、枯草芽孢杆菌、铜绿假单胞菌)菌落进行分析判别。采集LB固体培养基上细菌菌落的高光谱反射图像,在目标平板上适宜菌落中心选取一个5PPI×... 培养细菌菌落分散密度合适的平板,利用高光谱技术对LB固体培养基上的不同细菌(大肠埃希氏杆菌、枯草芽孢杆菌、铜绿假单胞菌)菌落进行分析判别。采集LB固体培养基上细菌菌落的高光谱反射图像,在目标平板上适宜菌落中心选取一个5PPI×5PPI的感兴趣区域提取光谱,形成一条原始光谱数据,每3条原始光谱数据为一个样本,共获得188个样本。选用标准正态变量变换(Standard Normal Variate Transformation,SNV)对原始光谱进行预处理以减少噪声,采用Kennard Stone(KS)方法对细菌样本集进行划分,用简化的K最邻近算法(simplify-k-Nearest Neighbor,SKNN)和偏最小二乘判别(PLS-DA)模型两种方法对细菌菌落进行分类判别。结果表明,利用SNV降低了光谱的噪声,且建立的PLS-DA表现性能更好,校正集的判别准确率为100%,预测集的判别准确率为99.47%。研究表明,利用高光谱技术可以实现对不同细菌菌落的快速、无损识别。 展开更多
关键词 细菌 高光谱图像 偏最小二乘判别分析 k最邻近算法 无损识别
在线阅读 下载PDF
Multi-color space threshold segmentation and self-learning k-NN algorithm for surge test EUT status identification
11
作者 Jian HUANG Gui-xiong LIU 《Frontiers of Mechanical Engineering》 SCIE CSCD 2016年第3期311-315,共5页
The identification of targets varies in different surge tests. A multi-color space threshold segmentation and self-learning k-nearest neighbor algorithm (k-NN) for equipment under test status identification was prop... The identification of targets varies in different surge tests. A multi-color space threshold segmentation and self-learning k-nearest neighbor algorithm (k-NN) for equipment under test status identification was proposed after using feature matching to identify equipment status had to train new patterns every time before testing. First, color space (L*a*b*, hue saturation lightness (HSL), hue saturation value (HSV)) to segment was selected according to the high luminance points ratio and white luminance points ratio of the image. Second, the unknown class sample Sr was classified by the k-NN algorithm with training set T~ according to the feature vector, which was formed from number ofpixels, eccentricity ratio, compact- ness ratio, and Euler's numbers. Last, while the classification confidence coefficient equaled k, made Sr as one sample ofpre-training set Tz'. The training set Tz increased to Tz+1 by Tz' if Tz' was saturated. In nine series of illuminant, indicator light, screen, and disturbances samples (a total of 21600 frames), the algorithm had a 98.65% identification accuracy, also selected five groups of samples to enlarge the training set from To to T5 by itself. Keywords multi-color space, k-nearest neighbor algorithm (k-NN), self-learning, surge test 展开更多
关键词 multi-color space k-nearest neighbor algorithm (k-nn) SELF-LEARNING surge test
原文传递
基于颜色和深度信息融合的目标识别方法 被引量:17
12
作者 吴鑫 王桂英 丛杨 《农业工程学报》 EI CAS CSCD 北大核心 2013年第A01期96-100,共5页
传统的机器视觉采用二维RGB图像,难以满足三维视觉检测的要求,深度图像能直接反映物体表面的三维特征,正逐渐受到重视。该文提出的方案将RGB和深度信息相结合,分割出物体所在区域,并利用梯度方向直方图(HOG,histograms of oriented grad... 传统的机器视觉采用二维RGB图像,难以满足三维视觉检测的要求,深度图像能直接反映物体表面的三维特征,正逐渐受到重视。该文提出的方案将RGB和深度信息相结合,分割出物体所在区域,并利用梯度方向直方图(HOG,histograms of oriented gradients)分别提取RGB图像和深度图像特征信息。在分类算法上,该文采用k最邻近节点算法(k-NN)对特征进行筛选,识别出目标物体。试验结果表明,综合利用深度信息和RGB信息,识别准确率很高,此方案能够对物体和手势进行很好识别。 展开更多
关键词 物体识别 图像处理 图像分割 深度图像 RGB图像 k最邻近节点算法(k-nn)
在线阅读 下载PDF
多分类器联合虚警可控的海上小目标检测方法 被引量:5
13
作者 薛安克 毛克成 张乐 《电子与信息学报》 EI CSCD 北大核心 2023年第7期2528-2536,共9页
模式识别技术已经广泛应用于海上目标检测,其中二分类的模式识别算法在处理该问题时会面临类别非均衡的困境。传统方法一般通过添加人工仿真目标回波扩充目标数据集,检测结果容易受到仿真精度的影响,且增加算法的复杂度。该文提出一种... 模式识别技术已经广泛应用于海上目标检测,其中二分类的模式识别算法在处理该问题时会面临类别非均衡的困境。传统方法一般通过添加人工仿真目标回波扩充目标数据集,检测结果容易受到仿真精度的影响,且增加算法的复杂度。该文提出一种基于多分类思想的多特征海上小目标智能检测方法,先对海杂波数据与目标数据进行多维特征提取,构建高维特征空间;再基于多分类思想中的“1对1”方法,将海杂波特征空间划分成多个子空间,每个杂波子空间与目标数据特征空间等大,构造多个二分类器进行联合判决。该文选取的二分类器为改进的双参数K近邻(K-NN)算法,可有效调节虚警率。经冰多参数成像X波段雷达(IPIX)数据集验证,所提方法在观测时间为1.024 s时获得了82.40%的检测概率,与基于K-NN的检测器做比较,获得了2%的性能提升。 展开更多
关键词 海杂波 小目标检测 多分类 双参数寻优k近邻(k-nn)算法 可控虚警
在线阅读 下载PDF
高维不确定数据的子空间聚类算法 被引量:3
14
作者 万静 郑龙君 +1 位作者 何云斌 李松 《计算机应用》 CSCD 北大核心 2019年第11期3280-3287,共8页
如何降低不确定数据对高维数据聚类的影响是当前的研究难点。针对由不确定数据与维度灾难导致的聚类精度低的问题,采用先将不确定数据确定化,后对确定数据聚类的方法。在将不确定数据确定化的过程中,将不确定数据分为值不确定数据与维... 如何降低不确定数据对高维数据聚类的影响是当前的研究难点。针对由不确定数据与维度灾难导致的聚类精度低的问题,采用先将不确定数据确定化,后对确定数据聚类的方法。在将不确定数据确定化的过程中,将不确定数据分为值不确定数据与维度不确定数据,并分别处理以提高算法效率。采用结合期望距离的K近邻(K NN)查询得到对聚类结果影响最小的不确定数据近似值以提高聚类精度。在得到确定数据之后,采用子空间聚类的方式避免维度灾难的影响。实验结果证明,基于Clique的高维不确定数据聚类算法(UClique)在UCI数据集上有较好的表现,有良好的抗噪声能力和伸缩性,在高维数据上能得到较好的聚类结果,在不同的不确定数据集实验中能够得到较高精度的实验结果,体现出算法具有一定的健壮性,能够有效地对高维不确定数据集聚类。 展开更多
关键词 高维 不确定 CLIQUE算法 k近邻
在线阅读 下载PDF
SCATS线圈数据短时多步双重预测方法 被引量:2
15
作者 李琦 姜桂艳 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2013年第2期123-128,共6页
为了进一步改善悉尼自适应交通控制系统(Sydney coordinated adaptive traffic system,SCATS)线圈数据短时多步预测的效果,在对SCATS线圈数据进行预处理的基础上,将当前与之前若干时间间隔的交通数据及对应的时间点作为交通模式特征向... 为了进一步改善悉尼自适应交通控制系统(Sydney coordinated adaptive traffic system,SCATS)线圈数据短时多步预测的效果,在对SCATS线圈数据进行预处理的基础上,将当前与之前若干时间间隔的交通数据及对应的时间点作为交通模式特征向量的构成要素,用欧式距离作为当前交通模式特征向量和历史交通模式特征向量相似性的测度指标,以多步预测结果的误差最小为目标选取近邻数,通过对交通模式之间距离的倒数正规化处理,确定了所选相似交通模式的未来交通参数的权重,设计了一种基于k近邻(k nearest neighbor,k-NN)算法的短时多步双重预测方法,包括SCATS线圈数据的多步预测方法以及可预测步数在线估计方法,并采用某特大城市SCATS线圈实测数据进行了验证和对比分析.结果表明,所提出的新方法能够进一步降低SCATS线圈数据短时多步预测的误差. 展开更多
关键词 交通运输工程 悉尼自适应交通控制系统 感应线圈 短时交通预测 k近邻算法
在线阅读 下载PDF
基于可变核的自适应光辐射强度估算
16
作者 王海波 张文辉 +1 位作者 杨辉华 周欢 《计算机应用》 CSCD 北大核心 2011年第8期2240-2242,2245,共4页
针对传统的K最近邻(K-NN)光辐射强度估算只能通过发射大量的光子、增加光子密度来提高估算精度这一缺陷,提出用具有平滑性的可变核(VK)函数估算光辐射强度,通过计算光子到估算点的距离与该光子预先分配的半径之比,实现与传统估算算法不... 针对传统的K最近邻(K-NN)光辐射强度估算只能通过发射大量的光子、增加光子密度来提高估算精度这一缺陷,提出用具有平滑性的可变核(VK)函数估算光辐射强度,通过计算光子到估算点的距离与该光子预先分配的半径之比,实现与传统估算算法不同的自适应光辐射强度估算。实验结果表明,VK算法不需发射大量光子就能改善图像质量且渲染速度快。 展开更多
关键词 光辐射强度估算 k最邻近算法 可变核 自适应
在线阅读 下载PDF
改进SMOTE的不平衡数据集成分类算法 被引量:33
17
作者 王忠震 黄勃 +2 位作者 方志军 高永彬 张娟 《计算机应用》 CSCD 北大核心 2019年第9期2591-2596,共6页
针对不平衡数据集的低分类准确性,提出基于改进合成少数类过采样技术(SMOTE)和AdaBoost算法相结合的不平衡数据分类算法(KSMOTE-AdaBoost)。首先,根据K近邻(K NN)的思想,提出噪声样本识别算法,通过样本的K个近邻中所包含的异类样本数目... 针对不平衡数据集的低分类准确性,提出基于改进合成少数类过采样技术(SMOTE)和AdaBoost算法相结合的不平衡数据分类算法(KSMOTE-AdaBoost)。首先,根据K近邻(K NN)的思想,提出噪声样本识别算法,通过样本的K个近邻中所包含的异类样本数目,对样本集中的噪声样本进行精确识别并予以滤除;其次,在过采样过程中基于聚类的思想将样本集划分为不同的子簇,根据子簇的簇心及其所包含的样本数目,在簇内样本与簇心之间进行新样本的合成操作。在样本合成过程中充分考虑类间和类内数据不平衡性,对样本及时修正以保证合成样本质量,平衡样本信息;最后,利用AdaBoost算法的优势,采用决策树作为基分类器,对平衡后的样本集进行训练,迭代多次直到满足终止条件,得到最终分类模型。选择G-mean、AUC作为评价指标,通过在6组KEEL数据集进行对比实验。实验结果表明,所提的过采样算法与经典的过采样算法SMOTE、自适应综合过采样技术(ADASYN)相比,G-means和AUC在4组中有3组最高;所提分类模型与现有的不平衡分类模型SMOTE-Boost,CUS-Boost,RUS-Boost相比,6组数据中:G-means均高于CUS-Boost和RUS-Boost,有3组低于SMOTE-Boost;AUC均高于SMOTE-Boost和RUS-Boost,有1组低于CUS-Boost。验证了所提的KSMOTE-AdaBoost具有更好的分类效果,且模型泛化性能更高。 展开更多
关键词 不平衡数据分类 合成少数类过采样技术 k近邻 过采样 聚类 ADABOOST算法
在线阅读 下载PDF
基于多尺度信息熵的雷达辐射源信号识别 被引量:22
18
作者 黄颖坤 金炜东 +1 位作者 葛鹏 李冰 《电子与信息学报》 EI CSCD 北大核心 2019年第5期1084-1091,共8页
随着雷达信号的日益复杂,从实数序列中提取特征变得越来越困难,但当它们表示成符号序列时,通常能更容易地挖掘出有效的特征参数。因此,该文提出一种基于多尺度信息熵(MSIE)的雷达信号识别方法。首先通过符号聚合近似(SAX)算法在不同字... 随着雷达信号的日益复杂,从实数序列中提取特征变得越来越困难,但当它们表示成符号序列时,通常能更容易地挖掘出有效的特征参数。因此,该文提出一种基于多尺度信息熵(MSIE)的雷达信号识别方法。首先通过符号聚合近似(SAX)算法在不同字符集尺度下将雷达信号转换为符号化序列;然后联合各符号序列的信息熵值,组成MSIE特征向量;最后,使用k邻近算法(k-NN)作为分类器实现雷达信号的分类识别。通过仿真6种典型的雷达信号进行验证,结果表明该方法在信噪比(SNR)为5 dB时,不同雷达信号的识别正确率大于90%,并且优于传统的基于复杂度特征(盒维数和稀疏性)的识别方法。 展开更多
关键词 雷达信号识别 符号聚合近似算法 多尺度信息熵 k邻近算法
在线阅读 下载PDF
改进混合二进制蝗虫优化特征选择算法 被引量:6
19
作者 赵泽渊 代永强 《计算机科学与探索》 CSCD 北大核心 2021年第7期1339-1349,共11页
特征选择是从数据集的原始特征中选出最优或较优特征子集,从而在加快分类速度的同时提高分类准确率。提出了一种改进的混合二进制蝗虫优化特征选择算法:通过引入步长引导个体位置变化的二进制转化策略,降低了进制转换的盲目性,提高了算... 特征选择是从数据集的原始特征中选出最优或较优特征子集,从而在加快分类速度的同时提高分类准确率。提出了一种改进的混合二进制蝗虫优化特征选择算法:通过引入步长引导个体位置变化的二进制转化策略,降低了进制转换的盲目性,提高了算法在解空间中的搜索性能;通过引入混合复杂进化方法,将蝗虫群体划分子群并独立进化,提高了算法的多样性,降低了早熟收敛的概率。采用改进算法对UCI部分数据集进行特征选择,使用K-NN分类器对特征子集进行分类评价,实验结果表明:与基本二进制蝗虫优化算法、二进制粒子群优化算法和二进制灰狼优化算法相比,改进算法具有较优的搜索性能、收敛性能与较强的鲁棒性,能够获得更好的特征子集,取得更好的分类效果。 展开更多
关键词 二进制 蝗虫优化算法 混合复杂进化方法 特征选择 分类 k邻近(k-nn)算法
在线阅读 下载PDF
软件定义广域网中控制器部署与交换机动态迁移策略 被引量:5
20
作者 郭烜成 林晖 +1 位作者 叶秀彩 许传丰 《计算机应用》 CSCD 北大核心 2019年第2期453-457,共5页
在软件定义广域网(SD-WAN)部署中,由于广域网(WAN)覆盖范围极大这一特性,单控制器部署策略无论在容量、负载还是安全方面都无法满足其需求,多控制器的部署成为必然趋势。而多控制器部署后整体网络的静态配置很难适应动态的网络流变化,... 在软件定义广域网(SD-WAN)部署中,由于广域网(WAN)覆盖范围极大这一特性,单控制器部署策略无论在容量、负载还是安全方面都无法满足其需求,多控制器的部署成为必然趋势。而多控制器部署后整体网络的静态配置很难适应动态的网络流变化,从而造成控制器的负载不均衡,整体网络性能降低。针对上述问题,提出一种多控制器部署算法SC-cSNN,以有效减小控制器和交换机之间的传播时延;并提出一种基于时延、控制器容量以及控制器安全等特征的交换机动态迁移算法,以有效解决控制器超负载问题。仿真实验结果表明,SC-cSNN控制器部署算法的平均最大时延优于现有的基于k-means和基于谱聚类的控制器部署算法,交换机动态迁移算法从多特征的角度有效地解决了SD-WAN控制器负载不均衡的问题。 展开更多
关键词 软件定义广域网 谱聚类 控制器部署 k邻近算法 交换机动态迁移
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部