期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
Addressing Class Overlap in Sonic Hedgehog Medulloblastoma Molecular Subtypes Classification Using Under-Sampling and SVD-Enhanced Multinomial Regression
1
作者 Isra Mohammed Mohamed Elhafiz M.Musa +4 位作者 Murtada K.Elbashir Ayman Mohamed Mostafa Amin Ibrahim Adam Mahmood A.Mahmood Areeg S.Faggad 《Computers, Materials & Continua》 2025年第8期3749-3763,共15页
Sonic Hedgehog Medulloblastoma(SHH-MB)is one of the four primary molecular subgroups of Medulloblastoma.It is estimated to be responsible for nearly one-third of allMB cases.Using transcriptomic and DNA methylation pr... Sonic Hedgehog Medulloblastoma(SHH-MB)is one of the four primary molecular subgroups of Medulloblastoma.It is estimated to be responsible for nearly one-third of allMB cases.Using transcriptomic and DNA methylation profiling techniques,new developments in this field determined four molecular subtypes for SHH-MB.SHH-MB subtypes show distinct DNAmethylation patterns that allow their discrimination fromoverlapping subtypes and predict clinical outcomes.Class overlapping occurs when two or more classes share common features,making it difficult to distinguish them as separate.Using the DNA methylation dataset,a novel classification technique is presented to address the issue of overlapping SHH-MBsubtypes.Penalizedmultinomial regression(PMR),Tomek links(TL),and singular value decomposition(SVD)were all smoothly integrated into a single framework.SVD and group lasso improve computational efficiency,address the problem of high-dimensional datasets,and clarify class distinctions by removing redundant or irrelevant features that might lead to class overlap.As a method to eliminate the issues of decision boundary overlap and class imbalance in the classification task,TL enhances dataset balance and increases the clarity of decision boundaries through the elimination of overlapping samples.Using fivefold cross-validation,our proposed method(TL-SVDPMR)achieved a remarkable overall accuracy of almost 95%in the classification of SHH-MB molecular subtypes.The results demonstrate the strong performance of the proposed classification model among the various SHH-MB subtypes given a high average of the area under the curve(AUC)values.Additionally,the statistical significance test indicates that TL-SVDPMR is more accurate than both SVM and random forest algorithms in classifying the overlapping SHH-MB subtypes,highlighting its importance for precision medicine applications.Our findings emphasized the success of combining SVD,TL,and PMRtechniques to improve the classification performance for biomedical applications with many features and overlapping subtypes. 展开更多
关键词 class overlap SHH-MB molecular subtypes UNDER-SAMPLING singular value decomposition penalized multinomial regression DNA methylation profiles
暂未订购
An Imbalanced Dataset and Class Overlapping Classification Model for Big Data 被引量:1
2
作者 Mini Prince P.M.Joe Prathap 《Computer Systems Science & Engineering》 SCIE EI 2023年第2期1009-1024,共16页
Most modern technologies,such as social media,smart cities,and the internet of things(IoT),rely on big data.When big data is used in the real-world applications,two data challenges such as class overlap and class imba... Most modern technologies,such as social media,smart cities,and the internet of things(IoT),rely on big data.When big data is used in the real-world applications,two data challenges such as class overlap and class imbalance arises.When dealing with large datasets,most traditional classifiers are stuck in the local optimum problem.As a result,it’s necessary to look into new methods for dealing with large data collections.Several solutions have been proposed for overcoming this issue.The rapid growth of the available data threatens to limit the usefulness of many traditional methods.Methods such as oversampling and undersampling have shown great promises in addressing the issues of class imbalance.Among all of these techniques,Synthetic Minority Oversampling TechniquE(SMOTE)has produced the best results by generating synthetic samples for the minority class in creating a balanced dataset.The issue is that their practical applicability is restricted to problems involving tens of thousands or lower instances of each.In this paper,we have proposed a parallel mode method using SMOTE and MapReduce strategy,this distributes the operation of the algorithm among a group of computational nodes for addressing the aforementioned problem.Our proposed solution has been divided into three stages.Thefirst stage involves the process of splitting the data into different blocks using a mapping function,followed by a pre-processing step for each mapping block that employs a hybrid SMOTE algo-rithm for solving the class imbalanced problem.On each map block,a decision tree model would be constructed.Finally,the decision tree blocks would be com-bined for creating a classification model.We have used numerous datasets with up to 4 million instances in our experiments for testing the proposed scheme’s cap-abilities.As a result,the Hybrid SMOTE appears to have good scalability within the framework proposed,and it also cuts down the processing time. 展开更多
关键词 Imbalanced dataset class overlapping SMOTE MAPREDUCE parallel programming OVERSAMPLING
在线阅读 下载PDF
A Computationally Efficient Density-Aware Adversarial Resampling Framework Using Wasserstein GANs for Imbalance and Overlapping Data Classification
3
作者 Sidra Jubair Jie Yang +2 位作者 Bilal Ali Walid Emam Yusra Tashkandy 《Computer Modeling in Engineering & Sciences》 2025年第7期511-534,共24页
Effectively handling imbalanced datasets remains a fundamental challenge in computational modeling and machine learning,particularly when class overlap significantly deteriorates classification performance.Traditional... Effectively handling imbalanced datasets remains a fundamental challenge in computational modeling and machine learning,particularly when class overlap significantly deteriorates classification performance.Traditional oversampling methods often generate synthetic samples without considering density variations,leading to redundant or misleading instances that exacerbate class overlap in high-density regions.To address these limitations,we propose Wasserstein Generative Adversarial Network Variational Density Estimation WGAN-VDE,a computationally efficient density-aware adversarial resampling framework that enhances minority class representation while strategically reducing class overlap.The originality of WGAN-VDE lies in its density-aware sample refinement,ensuring that synthetic samples are positioned in underrepresented regions,thereby improving class distinctiveness.By applying structured feature representation,targeted sample generation,and density-based selection mechanisms strategies,the proposed framework ensures the generation of well-separated and diverse synthetic samples,improving class separability and reducing redundancy.The experimental evaluation on 20 benchmark datasets demonstrates that this approach outperforms 11 state-of-the-art rebalancing techniques,achieving superior results in F1-score,Accuracy,G-Mean,and AUC metrics.These results establish the proposed method as an effective and robust computational approach,suitable for diverse engineering and scientific applications involving imbalanced data classification and computational modeling. 展开更多
关键词 Machine learning imbalanced classification class overlap computational modelling adversarial resampling density estimation
在线阅读 下载PDF
面向类不平衡和重叠的工控数据异常检测的半监督欠采样方法 被引量:1
4
作者 顾兆军 扬雪影 +1 位作者 隋翯 张一诺 《计算机应用研究》 北大核心 2025年第1期156-164,共9页
工业控制系统异常检测面临着数据缺乏标签信息、类不平衡和类重叠的耦合问题,导致现有的分类器难以精准检测异常数据。现有的数据级采样方法在打伪标签、数据平衡或检测重叠区域时存在着打伪标签结果不准确、采样效果稳定性差以及重叠... 工业控制系统异常检测面临着数据缺乏标签信息、类不平衡和类重叠的耦合问题,导致现有的分类器难以精准检测异常数据。现有的数据级采样方法在打伪标签、数据平衡或检测重叠区域时存在着打伪标签结果不准确、采样效果稳定性差以及重叠识别率低等问题。为此,提出一种基于半监督学习的欠采样方法(SSLU-LP)。该方法通过异构集成将标签传播机制和单类分类器结合,补充数据伪标签;利用最小生成树策略构建重叠区域检测模型;采用欠采样策略,通过最近邻搜索有选择性地去除部分多数类样本。最后该方法与四种经典分类器结合,在九个工控数据集上与九种混合算法进行比较。实验结果表明,所提方法可以精准地为无标签数据打伪标签,高效且有效检测出不平衡数据集中的重叠数据,改善了分类器的训练效果,提高了分类器的异常检测性能。 展开更多
关键词 工业控制系统 类不平衡 类重叠 半监督学习 异常检测
在线阅读 下载PDF
基于局部合力改进的Borderline-SMOTE过采样方法
5
作者 吕峰 宋媚 +2 位作者 赵礼 祝义 李赫男 《南京师大学报(自然科学版)》 北大核心 2025年第5期93-103,共11页
数据分类是保障大数据分析有效进行的关键环节,解决数据分类中的类别不平衡成为当前研究的热点.过采样技术凭借其简洁性、有效性等特点,成为处理类不平衡问题的主要途径之一.现有的过采样技术在处理不平衡数据中类重叠时缺乏合理的采样... 数据分类是保障大数据分析有效进行的关键环节,解决数据分类中的类别不平衡成为当前研究的热点.过采样技术凭借其简洁性、有效性等特点,成为处理类不平衡问题的主要途径之一.现有的过采样技术在处理不平衡数据中类重叠时缺乏合理的采样策略,导致机器学习模型预测时出现过拟合.因此,本文提出一种基于局部合力改进的Borderline-SMOTE过采样方法(IBSLG).首先,根据少数类样本最近邻分布构建边界区域;其次,基于局部合力计算边界区域内样本的集中度,根据集中度将样本划分为低概率/高概率边界样本;然后,基于两类边界样本分布,计算缩放因子构建新边界区域;最后,基于类不平衡比,对新边界区域自适应生成新样本.通过IBSLG与6种采样方法在4种分类器、8个不平衡数据集上进行对比实验,结果表明,IBSLG在大部分数据集上取得了最优的F1、G-mean、AUC和Friedman排名,并在大部分分类器上取得了最高的平均次优率,说明所提方法的有效性. 展开更多
关键词 不平衡数据 过拟合 类重叠 过采样 Borderline-SMOTE 局部合力
在线阅读 下载PDF
可减轻腰椎间盘样本集类重叠的采样算法
6
作者 赵鑫鑫 吴晓锋 《软件工程》 2025年第1期40-45,共6页
医学数据的类重叠问题会严重影响疾病的智能诊断效果。为了减轻腰椎间盘样本的类重叠对分类器产生的不良影响,提出了一种可减轻类重叠的混合采样算法——CO_HS算法。该算法将训练样本划分为核心样本、边界样本和噪声样本,对重叠区域的... 医学数据的类重叠问题会严重影响疾病的智能诊断效果。为了减轻腰椎间盘样本的类重叠对分类器产生的不良影响,提出了一种可减轻类重叠的混合采样算法——CO_HS算法。该算法将训练样本划分为核心样本、边界样本和噪声样本,对重叠区域的样本进行采样,以减轻样本集的类重叠程度。采用CO_HS算法产生的新训练样本集训练RF等分类模型,并建立了6种新的腰椎间盘退变分类器。实验结果显示,建立的新分类器在多项性能指标上均实现了显著提升,其中准确度提升了7.8百分点~12.7百分点,kappa系数提升了11.6百分点~20.2百分点,敏感性提升了7.9百分点~16.8百分点,特异性提升了9.0百分点~18.2百分点,F指标提升了9.4百分点~18.4百分点。因此,CO_HS算法被证明是一种能有效解决样本类重叠问题、改善分类性能的高效方法。 展开更多
关键词 智能医学 类重叠 混合采样 腰椎间盘退变
在线阅读 下载PDF
结合模糊聚类和集成学习的不平衡数据过采样方法
7
作者 李金 王彪 《计算机技术与发展》 2025年第10期18-27,共10页
目前,不平衡数据的处理方法主要致力于解决类分布不平衡问题,通常采用重采样方法来构建更为平衡的数据集。然而,与类分布不平衡相比,类间重叠问题对不平衡数据分类性能产生的不利影响更大。因此,针对不平衡数据中存在的类内不平衡以及... 目前,不平衡数据的处理方法主要致力于解决类分布不平衡问题,通常采用重采样方法来构建更为平衡的数据集。然而,与类分布不平衡相比,类间重叠问题对不平衡数据分类性能产生的不利影响更大。因此,针对不平衡数据中存在的类内不平衡以及类间重叠问题,提出了一种基于模糊聚类和集成学习的不平衡数据过采样方法FCEL。在数据层面,首先运用SMOTE过采样合成新样本;其次利用软聚类和自适应阈值对数据空间进行区域划分;随后对划分的区域进行重采样,生成两个采样子集。在算法层面,首先根据不同的采样子集构建相应的集成模型;其次通过模型选择算法,根据每个样本的分布选择合适的模型。在9个不平衡数据集上进行对比实验,实验结果表明:与现有一些典型方法相比,FCEL方法的Recall、F 1、G-mean和AUC这四项指标的平均值至少提升17.67百分点、0.09百分点、7.25百分点和1.21百分点;最多提升30.29百分点、4.62百分点、17.25百分点和4.35百分点,说明该方法能有效地提高少数类样本的分类精度。 展开更多
关键词 不平衡数据分类 类别重叠 过采样 软聚类 集成学习
在线阅读 下载PDF
分类中的类重叠问题及其处理方法研究 被引量:9
8
作者 熊海涛 吴俊杰 +1 位作者 刘洪甫 刘鲁 《管理科学学报》 CSSCI 北大核心 2013年第4期8-21,共14页
类重叠问题是数据挖掘与机器学习领域的瓶颈问题之一.如果其中还存在类不均衡问题时,情况变得更加复杂.有鉴于此,本文在已有文献基础上归纳了三种类重叠学习算法及提出一种新的方法:分隔法,并首次将支持向量数据描述算法用于实际数据的... 类重叠问题是数据挖掘与机器学习领域的瓶颈问题之一.如果其中还存在类不均衡问题时,情况变得更加复杂.有鉴于此,本文在已有文献基础上归纳了三种类重叠学习算法及提出一种新的方法:分隔法,并首次将支持向量数据描述算法用于实际数据的重叠样本识别,对类重叠问题及其与类不均衡问题的相互影响进行了系统研究.在真实数据上采用五种分类器的实验结果表明:1)多数情况下"分隔法"是表现最佳的类重叠学习算法;2)分隔法通常对基于分界面而非规则的分类器更为有效;3)分隔法在类不均衡问题中表现很好,当基础分类器为支持向量机时尤为突出.最后针对支持向量机的实验结果给出了理论分析. 展开更多
关键词 数据挖掘 分类 类重叠 类不均衡 支持向量数据描述
在线阅读 下载PDF
基于条件生成对抗网络的不平衡学习研究 被引量:9
9
作者 赵海霞 石洪波 +1 位作者 武建 陈鑫 《控制与决策》 EI CSCD 北大核心 2021年第3期619-628,共10页
对于不平衡数据的分类,不平衡率并不是影响分类效果的唯一因素,类别间的重叠、正类样本的分离以及噪音样本的存在等均会对分类效果造成影响.针对具有类别重叠的不平衡数据集,提出基于CGAN模型的重抽样方法(RECGAN).该方法结合负类样本... 对于不平衡数据的分类,不平衡率并不是影响分类效果的唯一因素,类别间的重叠、正类样本的分离以及噪音样本的存在等均会对分类效果造成影响.针对具有类别重叠的不平衡数据集,提出基于CGAN模型的重抽样方法(RECGAN).该方法结合负类样本的欠抽样和正类样本的过抽样,既能够提高重叠区域正类样本的识别度,又可以克服以往均从样本点的局部邻域出发合成样本的缺陷.实验结果表明,无论是从AUC和F1的取值看,还是从数据集上的平均排序看, RECGAN方法均具有明显的优势. 展开更多
关键词 不平衡学习 类别重叠 重抽样方法 条件生成对抗网络
原文传递
基于油中气体分析与类重叠特征的变压器分层故障诊断模型 被引量:10
10
作者 陈铁 冷昊伟 +1 位作者 李咸善 陈一夫 《中国电力》 CSCD 北大核心 2022年第7期22-32,41,共12页
油中溶解气体分析可以有效识别变压器放电故障与过热故障,为提高变压器故障诊断准确度,提出一种基于类重叠特征的变压器分层故障诊断方法。首先使用支持向量数据描述(SVDD)划分出变压器故障样本数据空间的重叠区域,选择类重叠率与类重... 油中溶解气体分析可以有效识别变压器放电故障与过热故障,为提高变压器故障诊断准确度,提出一种基于类重叠特征的变压器分层故障诊断方法。首先使用支持向量数据描述(SVDD)划分出变压器故障样本数据空间的重叠区域,选择类重叠率与类重叠度作为重叠特征,分别对类重叠程度和样本点重要性进行描述,然后以类重叠率为分层标准建立分层故障诊断模型,采用分隔训练法将各诊断层的样本集分开训练,针对分类难度较大的重叠区,基于类重叠度构造二分类模糊支持向量机(FSVM)进行故障诊断。实验结果表明,相比于其他模型,所提方法具有更高的准确度。 展开更多
关键词 变压器故障诊断 类重叠 分层诊断 支持向量数据描述 模糊支持向量机
在线阅读 下载PDF
面向ICS不平衡数据的重叠区混合采样方法 被引量:4
11
作者 高冰 顾兆军 +1 位作者 周景贤 隋翯 《计算机工程与应用》 CSCD 北大核心 2023年第19期305-315,共11页
工业控制系统异常检测面临着数据不平衡问题,其中,不平衡数据存在的类重叠现象加剧了分类器的检测难度。基于数据类别平衡或数据重叠检测的应对策略较常被采用,但这些策略方法存在着模型稳定性差或重叠识别率低等问题。对此,提出了一种... 工业控制系统异常检测面临着数据不平衡问题,其中,不平衡数据存在的类重叠现象加剧了分类器的检测难度。基于数据类别平衡或数据重叠检测的应对策略较常被采用,但这些策略方法存在着模型稳定性差或重叠识别率低等问题。对此,提出了一种面向重叠区域的混合采样方法:OverlapRHS。该方法利用支持向量数据描述分别在多数类和少数类样本上构建重叠检测模型,并通过将合成少数类与邻域清洗进行组合,对重叠数据区域内的样本施以混合采样。最后该方法与4种经典分类器结合,在4个公开的不平衡数据集上进行了测试,并与其他4种处理不平衡问题的采样方法进行了比较。实验结果表明,所提方法能够有效检测出不平衡数据集中的重叠数据,并通过高效且针对性强的数据混合采样改善了分类器的训练效果,提高了分类器对不平衡数据的异常检测性能,展现了较之于其他采样方法在不平衡数据处理上的显著优势。 展开更多
关键词 工业控制系统 不平衡数据 类重叠 支持向量数据描述 混合采样 异常检测
在线阅读 下载PDF
类别混叠度对非均衡数据分类的有效性分析 被引量:2
12
作者 邢延 陈嘉锋 +1 位作者 贾小彦 汪新 《数据采集与处理》 CSCD 北大核心 2018年第5期936-944,共9页
类别混叠度是指不同类别数据之间互相交叠、混合的程度,其量化指标包含基于几何统计的和基于信息论的两类,用于衡量数据分类的难易。实际分类任务中存在大量的非均衡数据,大类与小类样本之间悬殊的数量差别给分类造成了极大的困难。本... 类别混叠度是指不同类别数据之间互相交叠、混合的程度,其量化指标包含基于几何统计的和基于信息论的两类,用于衡量数据分类的难易。实际分类任务中存在大量的非均衡数据,大类与小类样本之间悬殊的数量差别给分类造成了极大的困难。本文采用实验研究的方法,验证类别混叠度量化指标指导非均衡数据分类的有效性,以减少甚至避免盲目试错带来的庞大计算开销。首先,针对两类分类问题,设计验证实验,在不同类数据非均衡率,不同别边界形状、不同特征类型、不同概率分布的非均衡仿真数据上研究类别混叠度的有效性。其次,在实验研究的基础上,分析数据的非均衡性对类别混叠度的影响规律,找出类别混叠度指导非均衡分类的有效方法。最后,在真实的非均衡数据上验证类别混叠度指导非均衡分类的实际效果。实验结果表明,对数据的非均衡率具有较强鲁棒性的类别混叠度量化指标可以有效地指导非均衡数据的分类器选择。 展开更多
关键词 类别混叠度 分类复杂度 非均衡数据 分类 非均衡率
在线阅读 下载PDF
基于改进Switching集成算法的具有类间重叠不平衡数据分类 被引量:2
13
作者 张建同 李君昌 +1 位作者 王来 樊重俊 《系统工程》 CSSCI CSCD 北大核心 2024年第3期136-148,共13页
准确识别具有类间重叠的不平衡数据类别有着重要的理论意义与应用价值。首先,基于Switching集成学习框架,结合样本类间重叠度和邻域分布信息,定义了样本类别待转换的概率,进而提出了一种针对具有类间重叠的不平衡数据分类的集成学习算法... 准确识别具有类间重叠的不平衡数据类别有着重要的理论意义与应用价值。首先,基于Switching集成学习框架,结合样本类间重叠度和邻域分布信息,定义了样本类别待转换的概率,进而提出了一种针对具有类间重叠的不平衡数据分类的集成学习算法SwitchingHD。该方法在提升少数类样本可见性的同时,完全保留了少数类样本的真实信息,能有效克服已有Switching集成学习算法在具有类间重叠的不平衡数据分类中的局限性。其次,在3种评价指标下,对比了SwitchingHD与3类Switching集成算法及2类传统集成学习算法在33个具有类间重叠的不平衡数据集上的分类表现。再次,分析了6类集成学习算法分类效果对待转换样本比例和基分类器数目的敏感性,给出了最优待转换样本比例的范围及这两个因素的作用效果,分析表明SwitchingHD在AUC下的分类效果显著优于其他集成学习算法,针对具有类间重叠的不平衡数据分类问题具有有效性与优越性。最后,以某地区电信客户数据为例,进一步对比SwitchingHD与11种新颖集成学习算法识别潜在流失客户的效果。 展开更多
关键词 不平衡数据分类 类间重叠 邻域分布 Switching算法
原文传递
多分类SVDD混叠域识别新方法与故障诊断应用 被引量:6
14
作者 蔡金燕 杜敏杰 《航天控制》 CSCD 北大核心 2012年第6期83-88,共6页
针对支持向量数据描述(SVDD)多分类方法中混叠域样本识别精度差的问题,提出了一种提高精度的K近邻隶属度估计算法。首先提取训练样本中的两类混叠样本并在混叠域分别搜寻测试样本的K个近邻,然后通过估计待测样本到K近邻样本中心欧式距... 针对支持向量数据描述(SVDD)多分类方法中混叠域样本识别精度差的问题,提出了一种提高精度的K近邻隶属度估计算法。首先提取训练样本中的两类混叠样本并在混叠域分别搜寻测试样本的K个近邻,然后通过估计待测样本到K近邻样本中心欧式距离的方法计算样本隶属度,最后通过比较隶属度大小实现样本识别。仿真和UCI数据及模拟电路故障诊断应用验证了算法较传统方法更为有效,尤其适用于不平衡数据的识别。 展开更多
关键词 支持向量数据描述 多分类 混叠 K近邻 隶属度 故障诊断
原文传递
面向类重叠日志的一致性异常检测模型 被引量:1
15
作者 吕宗平 梁孟孟 +2 位作者 顾兆军 刘春波 王志 《计算机应用与软件》 北大核心 2024年第8期367-375,共9页
在系统日志异常检测中,决策边界出现的类重叠问题将导致传统分类器很难实现正确分类。为避免耗时的预处理技术或依赖特定算法,提出一致性异常检测模型。该模型计算样本与不同类别的隶属度,根据传统分类器的准确率差值选择最佳模糊度分... 在系统日志异常检测中,决策边界出现的类重叠问题将导致传统分类器很难实现正确分类。为避免耗时的预处理技术或依赖特定算法,提出一致性异常检测模型。该模型计算样本与不同类别的隶属度,根据传统分类器的准确率差值选择最佳模糊度分离出类重叠日志;通过集成分类器的不一致性度量函数得到p值,根据预设置信度得到类重叠日志标签。实验结果表明,相比传统分类器,该模型的召回率和F值等平均提高10百分点左右,验证了该模型在处理类重叠问题的有效性。 展开更多
关键词 异常检测 类重叠 一致性检测 模糊度 置信度
在线阅读 下载PDF
基于GIS的图层叠加法在地震次生火灾区划单元中的应用 被引量:3
16
作者 陈艳华 张琳 《河北联合大学学报(自然科学版)》 CAS 2014年第2期124-128,共5页
通过比较现有区划单元的确定方法,分析了现有区划单元确定方法的优缺点,论证了利用地理信息系统(GIS)图层叠加法进行基本区划单元确定的可行性。并以此将收集到的曹妃甸地区相关影响因子按照点、线、面进行分类、提取,并结合实地情况的... 通过比较现有区划单元的确定方法,分析了现有区划单元确定方法的优缺点,论证了利用地理信息系统(GIS)图层叠加法进行基本区划单元确定的可行性。并以此将收集到的曹妃甸地区相关影响因子按照点、线、面进行分类、提取,并结合实地情况的权重,将曹妃甸工业区划分为1391个地震次生火灾基本区划单元,为今后进行地震次生火灾综合评价提供基础,为今后有针对性地进行抗震防灾工作提供借鉴。 展开更多
关键词 地理信息系统 地震次生火灾 区划单元 图层叠加
在线阅读 下载PDF
公母畜间有不同的年龄组数目条件下控制近交最大化选择反应 被引量:2
17
作者 唐国庆 李学伟 《畜牧兽医学报》 CAS CSCD 北大核心 2006年第3期209-215,共7页
一种扩展的动态选择规则能够在公母畜间有不同的年龄组数目的世代重叠群体内约束年近交速率为一个预定义值,逐年最大化遗传反应。该规则考虑在世代重叠群体中按性别-年龄分组,通过限制父母亲群体性别-年龄组的平均加性遗传相关的增加,... 一种扩展的动态选择规则能够在公母畜间有不同的年龄组数目的世代重叠群体内约束年近交速率为一个预定义值,逐年最大化遗传反应。该规则考虑在世代重叠群体中按性别-年龄分组,通过限制父母亲群体性别-年龄组的平均加性遗传相关的增加,从而限制新生后代平均近交系数的增加。动态选择程序通过输入候选个体的BLUP估计育种值、所有个体的加性遗传相关矩阵和所有性别-年龄组的长期遗传贡献,给出最适宜的选留个体数及其每个选留个体最适宜的后代数。猪核心群随机模拟结果显示该动态选择规则能够获得预定义的近交速率。在相同的近交速率条件下,动态选择比截断选择获得高达10%的更多年遗传进展。 展开更多
关键词 动态选择 近交 世代重叠 性别一年龄组
在线阅读 下载PDF
关于课程间交叉渗透问题的分析 被引量:1
18
作者 唐杰 云建军 王兆明 《长春大学学报》 2006年第6期98-100,共3页
对高等职业教育课程改革中的部分问题进行了浅析。着重阐述了课程间交叉渗透的研究在课程改革中的影响与作用,并以机电类专业为例探讨了在教学中如何处理课程间交叉渗透的问题。
关键词 职业教育 课程改革 交叉渗透 机电类
在线阅读 下载PDF
A Hybrid Evolutionary Under-sampling Method for Handling the Class Imbalance Problem with Overlap in Credit Classification
19
作者 Ping Gong Junguang Gao Li Wang 《Journal of Systems Science and Systems Engineering》 SCIE EI CSCD 2022年第6期728-752,共25页
Credit risk assessment is an important task of risk management for financial institutions.Machine learning-based approaches have made promising progress in credit risk assessment by treating it as imbalanced binary cl... Credit risk assessment is an important task of risk management for financial institutions.Machine learning-based approaches have made promising progress in credit risk assessment by treating it as imbalanced binary classification tasks.However,few efforts have been made to deal with the class overlap problem that accompanies imbalances simultaneously.To this end,this study proposes a Tomek link and genetic algorithm(GA)-based under-sampling framework(TEUS)to address the class imbalance and overlap issues in binary credit classification by eliminating majority class instances with considering multi-perspective factors.TEUS first determines boundary majority instances with Tomek link,then take the distance from each majority instance to its nearest boundary as the radius and assigns the density of opposite class samples within the radius as the overlap potential of that majority instance.Second,TEUS weighs each non-borderline majority instance based on its information contribution in estimating class labels.After partitioning non-borderline majority instances into subgroups according to overlap potential and information contribution,TEUS applies GA to select samples from subgroups and merge them with the minority samples into a new training set.Innovatively,the design of the fitness function in GA and the grouping of the non-borderline majority not only trade off the multi-perspective characteristics of instances but also help reduce the computational complexity of the sampling optimization search.Numerical experiments on real-world credit data sets demonstrate the effectiveness of the proposed TEUS. 展开更多
关键词 Imbalance classification credit classification class overlap evolutionary under-sampling genetic algorithm
原文传递
多子超球支持向量机算法研究
20
作者 陈鹏 刘爽 李灵华 《微电子学与计算机》 CSCD 北大核心 2014年第12期28-33,共6页
提出了一种多子超球支持向量机算法.首先计算所有类别的分类超球,然后统计所有超球的位置关系,记入相应的数据集合.对相交集合中的超球,通过键值索引映射计算其交叉系数,根据该系数选择相交类别数据差异度最大的超球划分子超球,子超球... 提出了一种多子超球支持向量机算法.首先计算所有类别的分类超球,然后统计所有超球的位置关系,记入相应的数据集合.对相交集合中的超球,通过键值索引映射计算其交叉系数,根据该系数选择相交类别数据差异度最大的超球划分子超球,子超球个数由交叉系数确定.实验结果表明提出的算法在提高分类精度的同时,降低了决策规则求解的复杂度. 展开更多
关键词 超球支持向量机 多分类 相交 交叉系数 差异度
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部