期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于谱聚类欠取样的不平衡漂移大数据流分类算法
1
作者 康耀龙 冯丽露 张景安 《吉林大学学报(工学版)》 北大核心 2026年第2期509-515,共7页
在不平衡数据分类中,多数类样本在数量上占优,其分布会对聚类结果产生较大的“拉扯”作用,而少数类样本由于数量少,其特征在整个数据集中相对不明显,导致数据流出现漂移问题,影响数据流分类效果。为解决此问题,本文研究基于谱聚类欠取... 在不平衡数据分类中,多数类样本在数量上占优,其分布会对聚类结果产生较大的“拉扯”作用,而少数类样本由于数量少,其特征在整个数据集中相对不明显,导致数据流出现漂移问题,影响数据流分类效果。为解决此问题,本文研究基于谱聚类欠取样的不平衡漂移大数据流分类算法。通过欠取样技术减少不平衡漂移大数据流中多数类数据的冗余数据量,均衡多数类数据与少数类数据的数据量,缓解数据因聚类“拉扯”导致的漂移问题;选取均衡后大数据流的核心点构成核心点集,通过谱聚类算法对此核心点集实施聚类,基于谱聚类所得到的聚类结构以及选定的核心点,实现不平衡漂移大数据流分类。实验结果显示:该算法可实现不平衡漂移大数据流的均衡处理,处理后平均不均衡度可降至1.024,几乎接近于平衡状态;可实现不同属性大数据流核心点的选定与有效分组,为此类大数据流的后续有效应用提供保障。 展开更多
关键词 谱聚类 欠取样 不平衡 漂移大数据流 核心点集 组别划分
原文传递
LSNCCP——一种基于最大不相含核心点集的聚类算法 被引量:2
2
作者 薛永生 翁伟 +2 位作者 文娟 王劲波 张宇 《计算机研究与发展》 EI CSCD 北大核心 2004年第11期1930-1935,共6页
聚类在数据挖掘、模式识别等许多领域有着重要的应用 提出了一种新颖的聚类算法 :一种基于最大不相含核心点集的聚类算法LSNCCP(aclusteringalgorithmbasedonthelargestsetofnot coveredcorepoints) 在密度定义的基础上 ,考察核心点之... 聚类在数据挖掘、模式识别等许多领域有着重要的应用 提出了一种新颖的聚类算法 :一种基于最大不相含核心点集的聚类算法LSNCCP(aclusteringalgorithmbasedonthelargestsetofnot coveredcorepoints) 在密度定义的基础上 ,考察核心点之间的距离关系 ,定义相含、相交、相离这 3种核心点之间的关系 ,最后找出一个最大不相含核心点集 ,在此基础上进行聚类 ,并且找到解决丢失点问题的快速方法 该最大不相含核心点集只是全部核心点集合的一个很小的子集 ,因此有效地缩减了同类算法中搜寻核心点的时间 展开更多
关键词 数据挖掘 聚类 密度 核心点 最大不相含核心点集
在线阅读 下载PDF
基于核心主导人物构建团队的拓扑形态分析 被引量:2
3
作者 朱玉龙 谭林 《安徽农业科学》 CAS 北大核心 2009年第23期11313-11313,11315,共2页
以核心主导人物构建团队的方式,运用点集拓扑学中凝聚点的概念,将核心主导人物看作团队的凝聚点,得到核心主导人物集合是团队拓扑空间的闭集,并由此对由3个成员的团队进行分析,得出了同胚意义下的所有拓扑形态。
关键词 核心主导人物 凝聚点 闭集 拓扑空间
在线阅读 下载PDF
一种协调信息系统的快速求核算法
4
作者 黄丽萍 《漳州师范学院学报(自然科学版)》 2008年第3期32-35,共4页
属性核的确定对于求属性约简具有重要的意义,利用协调信息系统中条件属性的划分相对于决策属性划分的概率分布为单点分布的性质,提出一种新的求核算法.采用多个UCI数据集进行实验,结果表明该算法的效率高于基于辨识矩阵和基于信息熵的... 属性核的确定对于求属性约简具有重要的意义,利用协调信息系统中条件属性的划分相对于决策属性划分的概率分布为单点分布的性质,提出一种新的求核算法.采用多个UCI数据集进行实验,结果表明该算法的效率高于基于辨识矩阵和基于信息熵的求核算法. 展开更多
关键词 粗糙集 属性核 协调信息系统 单点分布
在线阅读 下载PDF
二阶自然最近邻和多簇合并的密度峰值聚类算法 被引量:4
5
作者 张紫丹 徐华 杨重阳 《计算机应用研究》 CSCD 北大核心 2023年第12期3559-3565,共7页
密度峰值聚类(density peaks clustering, DPC)算法基于局部密度和相对距离识别簇中心,忽视了样本所处环境对样本点密度的影响,因此不容易发现低密度区域的簇中心;DPC算法采用的单步分配策略的容错性差,一旦一个样本点分配错误,将导致... 密度峰值聚类(density peaks clustering, DPC)算法基于局部密度和相对距离识别簇中心,忽视了样本所处环境对样本点密度的影响,因此不容易发现低密度区域的簇中心;DPC算法采用的单步分配策略的容错性差,一旦一个样本点分配错误,将导致后续一系列样本点分配错误。针对上述问题,提出二阶自然最近邻和多簇合并的密度峰值聚类算法(TNMM-DPC)。首先,引入二阶自然邻居的概念,同时考虑样本点的密度与样本点所处的环境,重新定义了样本点的局部密度,以降低类簇的疏密对类簇中心选择的影响;其次,定义了核心点集来选取初始微簇,依据样本点与微簇间的关联度对样本点进行分配;最后引入了邻居边界点集的概念对相邻的子簇进行合并,得到最终的聚类结果,避免了分配错误连带效应。在人工数据集和UCI数据集上,将TNMM-DPC算法与DPC及其改进算法进行了对比,实验结果表明,TNMM-DPC算法能够解决DPC算法所存在的问题,可以有效聚类人工数据集和UCI数据集。 展开更多
关键词 密度峰值 自然邻居 局部密度 核心点集 子簇合并
在线阅读 下载PDF
中医药核心指标集研究利益相关群体选择实施要点 被引量:3
6
作者 张明妍 牛柏寒 +2 位作者 蔡慧姿 生晓迪 张俊华 《世界科学技术-中医药现代化》 CSCD 北大核心 2021年第8期2563-2568,共6页
核心指标集是通过一系列规范的研制过程,形成某种疾病所有相关临床研究必须报告的、统一的、标准化的最小指标集合。确定哪些指标为核心结局指标,需要经过不同利益相关群体层层筛选并最终达成共识决定。相关利益群体的代表性,决定了核... 核心指标集是通过一系列规范的研制过程,形成某种疾病所有相关临床研究必须报告的、统一的、标准化的最小指标集合。确定哪些指标为核心结局指标,需要经过不同利益相关群体层层筛选并最终达成共识决定。相关利益群体的代表性,决定了核心指标集的系统性和合理性。因此,在核心指标集研制过程中利益相关群体的选择至关重要。本文对中医药核心指标集研制中利益相关群体的种类选择、样本量、参与环节、权重分配以及患者代表群的特殊性等相关要点进行归纳总结,以期为中医药核心指标集研究的开展提供方法学借鉴。 展开更多
关键词 核心指标集 中医药 利益相关群体 结局指标 实施要点
暂未订购
中医药核心指标集研究中共识方法实施要点 被引量:3
7
作者 牛柏寒 张明妍 +3 位作者 蔡慧姿 李凯 庞博 张俊华 《世界科学技术-中医药现代化》 CSCD 北大核心 2021年第8期2576-2579,共4页
核心指标集是通过一系列规范的研制过程,形成某种疾病所有相关临床试验必须报告的、统一的、标准化的最小指标集合。确定哪些指标为核心结局指标,需要经过不同利益群体的高级代表一致性认定、达成共识。共识方法设计的科学性和实施的透... 核心指标集是通过一系列规范的研制过程,形成某种疾病所有相关临床试验必须报告的、统一的、标准化的最小指标集合。确定哪些指标为核心结局指标,需要经过不同利益群体的高级代表一致性认定、达成共识。共识方法设计的科学性和实施的透明化,决定了最终形成的核心指标集的质量。因此,在中医药核心指标集(Core Outcome Set for Traditional Chinese Medicine,COS-TCM)研制过程中共识过程的设计和实施至关重要。本文对COS-TCM研制中共识方法的实施要点进行归纳总结,以期为中医药核心指标集研究的开展提供方法学借鉴。 展开更多
关键词 核心指标集 中医药 共识方法 结局指标 实施要点
暂未订购
射频阻抗技术在油罐剖面监测中的应用 被引量:2
8
作者 郭有胜 张欲立 孟凡军 《新技术新工艺》 2010年第11期97-98,共2页
在油田生产中,原油沉降罐中油水界面及液位的准确测量对于油田的正常生产有着重要的作用。目前的油罐液位及油水界面测量装置误差较大,本文提出通过逐点阻抗测量技术这一全新的测量方法来提高液位及油水界面的测量精度,为生产工艺的调... 在油田生产中,原油沉降罐中油水界面及液位的准确测量对于油田的正常生产有着重要的作用。目前的油罐液位及油水界面测量装置误差较大,本文提出通过逐点阻抗测量技术这一全新的测量方法来提高液位及油水界面的测量精度,为生产工艺的调整及相关部门的决策提供可靠依据。 展开更多
关键词 逐点阻抗测量技术 原油沉降罐 油水界面 油层厚度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部