期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
Scaling up Kernel Grower Clustering Method for Large Data Sets via Core-sets 被引量:2
1
作者 CHANG Liang DENG Xiao-Ming +1 位作者 ZHENG Sui-Wu WANG Yong-Qing 《自动化学报》 EI CSCD 北大核心 2008年第3期376-382,共7页
核栽培者是聚类最近 Camastra 和 Verri 建议的方法的一个新奇的核。它证明为各种各样的数据的好性能关于流行聚类的算法有利地设定并且比较。然而,方法的主要缺点是在处理大数据集合的弱可伸缩能力,它极大地限制它的应用程序。在这... 核栽培者是聚类最近 Camastra 和 Verri 建议的方法的一个新奇的核。它证明为各种各样的数据的好性能关于流行聚类的算法有利地设定并且比较。然而,方法的主要缺点是在处理大数据集合的弱可伸缩能力,它极大地限制它的应用程序。在这份报纸,我们用核心集合建议一个可伸缩起来的核栽培者方法,它是比为聚类的大数据的原来的方法显著地快的。同时,它能处理很大的数据集合。象合成数据集合一样的基准数据集合的数字实验显示出建议方法的效率。方法也被用于真实图象分割说明它的性能。 展开更多
关键词 大型数据集 图象分割 模式识别 磁心配置 核聚类
在线阅读 下载PDF
基于Rough Set的属性及属性值简约的一种算法 被引量:7
2
作者 朱红 《湘潭大学自然科学学报》 CAS CSCD 2002年第3期36-39,共4页
属性及属性值的约简是RoughSet理论的核心内容之一 ,基于此 ,我们通过最少的信息量也能做出正确的判断 .利用RoughSet理论中关于相对正域的概念 ,给出了一种求最少属性及最少属性值 (即核值表 )的算法 。
关键词 ROUGH set 粗糙集 数据挖掘 核值表 最小条件属性集 属性核算 粗集理论 简化算法
在线阅读 下载PDF
冠心病中西医结合核心数据集构建 被引量:1
3
作者 贾君迪 鞠建庆 +3 位作者 高铸烨 李金根 史大卓 徐浩 《中国中西医结合杂志》 北大核心 2025年第7期808-818,共11页
目的构建冠心病中西医结合核心数据集。方法采用文献研究与半结构化访谈构建初始核心数据指标清单,应用德尔菲专家咨询以及专家共识会议对核心数据指标进行筛选,形成冠心病中西医结合核心数据集。结果在文献研究、半结构化访谈的基础上... 目的构建冠心病中西医结合核心数据集。方法采用文献研究与半结构化访谈构建初始核心数据指标清单,应用德尔菲专家咨询以及专家共识会议对核心数据指标进行筛选,形成冠心病中西医结合核心数据集。结果在文献研究、半结构化访谈的基础上,初步确定了人口学特征、主诉与现病史、合并症与危险因素、中医四诊与刻下症、检验检查、疾病与个体特点、治疗及临床结局8个维度的210个数据指标,形成初始核心数据指标清单。根据数据指标的特点,181个数据指标进入德尔菲调查。通过德尔菲调查与专家共识会议筛选与讨论,确定了核心数据指标121个,拓展数据指标54个,对数据指标的定义与测量范围达成一致。最终形成了具有8个维度175个数据指标的冠心病中西医结合核心数据集。结论本研究制定了中医、中西医结合领域专病核心数据集,为今后中西医结合临床研究的数据采集及中医药核心数据集的构建方法提供了参考。 展开更多
关键词 冠心病 中西医结合 核心数据集 德尔菲法
原文传递
中成药上市后临床安全性评价核心数据集的构建方法探索 被引量:12
4
作者 邱瑞瑾 李敏 +8 位作者 胡嘉元 黄涯 何天麦 韩松洁 郑蕊 张晓雨 关曼柯 陈静 商洪才 《世界科学技术-中医药现代化》 CSCD 北大核心 2018年第10期1723-1728,共6页
中成药不良反应漏报情况明显,加上中成药说明书中普遍存在安全性信息缺项,以致中成药的临床安全性应用缺乏证据,开展中成药上市后安全性再评价刻不容缓。构建中成药临床安全性评价数据集可能会减少中成药安全性项目漏报,减少同类研究中... 中成药不良反应漏报情况明显,加上中成药说明书中普遍存在安全性信息缺项,以致中成药的临床安全性应用缺乏证据,开展中成药上市后安全性再评价刻不容缓。构建中成药临床安全性评价数据集可能会减少中成药安全性项目漏报,减少同类研究中报告的指标不一致的情况,使更多研究能纳入系统评价,为中成药安全应用提供更高级别证据。本文提出中成药临床安全性评价核心数据集的构建方法:首先根据目标疾病、目标人群、研究目的、给药途径、评价方法等特点,确定临床安全性评价核心数据集的适用范围;通过系统评价和半结构化访谈,形成和完善临床安全性评价原始项目清单;根据清单制作调查问卷,对相关利益群体专家进行德尔菲调查,并通过共识会议形成的核心数据集。 展开更多
关键词 中成药 安全性 临床评价 核心数据集 方法学
暂未订购
一种神经网络分类器样本数据选择方法 被引量:20
5
作者 周玉 朱安福 +1 位作者 周林 钱旭 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第6期39-43,共5页
为了提高神经网络分类器的性能,提出一种基于阴影集的训练样本数据选择方法.在阴影集的基础上提出核数据和边界数据的概念.首先通过模糊C均值聚类(FCM)获取样本数据的最优模糊矩阵;然后诱导出相应的阴影集;样本数据结合阴影集构造核数... 为了提高神经网络分类器的性能,提出一种基于阴影集的训练样本数据选择方法.在阴影集的基础上提出核数据和边界数据的概念.首先通过模糊C均值聚类(FCM)获取样本数据的最优模糊矩阵;然后诱导出相应的阴影集;样本数据结合阴影集构造核数据和边界数据;最后在核数据和边界数据中进行数据选择.利用该方法,结合Iris数据集分别对BP网络、LVQ网络和可拓神经网络(ENN)等分类器进行实验研究.结果表明:该方法能够保留典型的样本,减少训练样本数据的数量;利用该方法所选择的数据对神经网络分类器进行训练,保证了分类器的泛化能力,节约了训练时间,有效提高分类器的性能. 展开更多
关键词 神经网络 分类器 数据选择 阴影集 核数据 边界数据
原文传递
基于最小包含球的大数据集域自适应快速算法 被引量:3
6
作者 许敏 王士同 +1 位作者 顾鑫 俞林 《模式识别与人工智能》 EI CSCD 北大核心 2013年第2期159-168,共10页
相同应用领域,不同时间、地点或设备检测到的数据域不一定完整.文中针对如何进行数据域间知识传递问题,提出相同领域的概率分布差异可用两域最小包含球中心点表示且其上限与半径无关的定理.基于上述定理,在原有支持向量域描述算法基础上... 相同应用领域,不同时间、地点或设备检测到的数据域不一定完整.文中针对如何进行数据域间知识传递问题,提出相同领域的概率分布差异可用两域最小包含球中心点表示且其上限与半径无关的定理.基于上述定理,在原有支持向量域描述算法基础上,提出一种数据域中心校正的领域自适应算法,并利用人造数据集和KDD CUP 99入侵检测数据集验证该算法.实验表明,这种领域自适应算法具有较好的性能. 展开更多
关键词 领域自适应 支持向量域描述(SVDD) 最小包含球(MEB) 核心集 大数据集
在线阅读 下载PDF
海量不完整数据的核心数据选择问题的研究 被引量:6
7
作者 刘永楠 李建中 高宏 《计算机学报》 EI CSCD 北大核心 2018年第4期915-930,共16页
在大数据时代,越来越多的带有缺失值的数据需要处理,因而数据不完整成为一种常见的数据质量问题.不完整的数据给大数据的查询、挖掘和分析带来了困难.在某些情况下,数据中的很多缺失值是无法被确定的.只能根据用户的需求,在不完整的数... 在大数据时代,越来越多的带有缺失值的数据需要处理,因而数据不完整成为一种常见的数据质量问题.不完整的数据给大数据的查询、挖掘和分析带来了困难.在某些情况下,数据中的很多缺失值是无法被确定的.只能根据用户的需求,在不完整的数据上选择一部分用户感兴趣的核心数据集合,来提高不完整数据的可用性.完整度较高,规模较小,在用户感兴趣的属性上给出更多完整信息的核心数据集合,能够支持高效的查询处理,提高查询结果的准确性和完整性.该文形式化了核心数据选择问题,证明了这至少是一个NP-难问题.由于需要同时优化核心数据集合的完整度、集合的规模以及对于感兴趣属性的覆盖性,现有的基于集合覆盖问题的方法无法解决文中提出的问题.该文提出了一个采用贪心策略,具有理论保证的近似核心数据选择算法ACS.ACS首先判断当前的数据集合是否存在一个满足覆盖性要求的子集合.当这样的子集合存在时,ACS尽量选择完整的元组来组成核心数据集合,当使用完整元组无法满足覆盖性的要求时,ACS选择较少的不完整元组.ACS通过限制选择的次数来获得一个集合大小的上界是运行次数常数倍的子集合,并且保证了对于感兴趣的属性的覆盖比例.通过理论分析可知,ACS能够在近似线性的时间内,找到一个大小至多在给定的大小对数因子内的近似核心数据集合,其中被覆盖的感兴趣的属性的比例至少为(1-1/e),包含的不完整元组的个数至多为给定的核心数据集合的大小,其中e是自然对数的底数.通过在DBLP和NBA球员信息这两个真实数据集合上的实验,表明了所提出的算法ACS的有效性和高效性;通过在规模更大的合成数据上的实验,表明了ACS的良好的扩展性. 展开更多
关键词 数据质量 数据完整性 不完整数据 核心数据选择 近似算法
在线阅读 下载PDF
粗集理论集成ORDBMS的原型系统 被引量:7
8
作者 孙惠琴 熊璋 《计算机学报》 EI CSCD 北大核心 2005年第11期1875-1881,共7页
对等价矩阵代数进行了扩充,使它能够实现决策表的上下近似集、规则提取、相对约简、相对核等操作.给出了一个原型系统RSORDMS.在原型系统中,采用了数据库SQL语言与粗集结合的技巧,使得数据清洗、求核等操作非常迅速.整个原型系统运行效... 对等价矩阵代数进行了扩充,使它能够实现决策表的上下近似集、规则提取、相对约简、相对核等操作.给出了一个原型系统RSORDMS.在原型系统中,采用了数据库SQL语言与粗集结合的技巧,使得数据清洗、求核等操作非常迅速.整个原型系统运行效率很高. 展开更多
关键词 粗集 ORDBMS 数据挖掘 等价矩阵代数
在线阅读 下载PDF
基于模糊概念层的核属性集确定方法及其应用 被引量:1
9
作者 李茹 张丽芳 褚诚缘 《计算机工程与应用》 CSCD 北大核心 2005年第30期162-165,共4页
核属性集的确定是从海量数据中发现决策规则的重要步骤。该文在结合粗糙集理论和层次聚类方法的基础上,改进了已有的模糊概念层核属性集确定方法,不仅能运用模糊概念层方法对原始数据进行模糊化处理,排除边缘数据的干扰作用,还可减少噪... 核属性集的确定是从海量数据中发现决策规则的重要步骤。该文在结合粗糙集理论和层次聚类方法的基础上,改进了已有的模糊概念层核属性集确定方法,不仅能运用模糊概念层方法对原始数据进行模糊化处理,排除边缘数据的干扰作用,还可减少噪声数据的干扰作用以进一步简化可区分矩阵,得出核属性集且使得生成的判定规则可信度更高。最后以汽车生产厂商汽车样本各项指标实测数据为例论证了算法的有效性和实用性。 展开更多
关键词 模糊概念层 核属性集 数据挖掘 知识发现
在线阅读 下载PDF
元数据DC与MARC的互换 被引量:3
10
作者 刘延 张凌 《中华医学图书情报杂志》 CAS 2003年第4期52-54,共3页
介绍了元数据及MARC 。
关键词 元数据 DC MARC 机读目录 编目格式 “都柏林核心集” 数据互换 “映射关系”
在线阅读 下载PDF
LSNCCP——一种基于最大不相含核心点集的聚类算法 被引量:2
11
作者 薛永生 翁伟 +2 位作者 文娟 王劲波 张宇 《计算机研究与发展》 EI CSCD 北大核心 2004年第11期1930-1935,共6页
聚类在数据挖掘、模式识别等许多领域有着重要的应用 提出了一种新颖的聚类算法 :一种基于最大不相含核心点集的聚类算法LSNCCP(aclusteringalgorithmbasedonthelargestsetofnot coveredcorepoints) 在密度定义的基础上 ,考察核心点之... 聚类在数据挖掘、模式识别等许多领域有着重要的应用 提出了一种新颖的聚类算法 :一种基于最大不相含核心点集的聚类算法LSNCCP(aclusteringalgorithmbasedonthelargestsetofnot coveredcorepoints) 在密度定义的基础上 ,考察核心点之间的距离关系 ,定义相含、相交、相离这 3种核心点之间的关系 ,最后找出一个最大不相含核心点集 ,在此基础上进行聚类 ,并且找到解决丢失点问题的快速方法 该最大不相含核心点集只是全部核心点集合的一个很小的子集 ,因此有效地缩减了同类算法中搜寻核心点的时间 展开更多
关键词 数据挖掘 聚类 密度 核心点 最大不相含核心点集
在线阅读 下载PDF
基于粗糙集理论的冗余规则处理方法 被引量:9
12
作者 陈超 陈性元 +1 位作者 汪永伟 代向东 《计算机工程与设计》 CSCD 北大核心 2014年第1期21-25,81,共6页
针对基于粗糙集理论的数据处理中存在冗余信息的问题,提出了冗余规则处理架构。利用粗糙集理论中属性约简的概念,把规则库中的单个规则作为条件属性建立新的决策表,通过规则约简剔除冗余规则。基于粗糙集理论中属性核的作用,把规则在多... 针对基于粗糙集理论的数据处理中存在冗余信息的问题,提出了冗余规则处理架构。利用粗糙集理论中属性约简的概念,把规则库中的单个规则作为条件属性建立新的决策表,通过规则约简剔除冗余规则。基于粗糙集理论中属性核的作用,把规则在多个约简中的出现频度作为规则重要性度量标准。实验结果表明,规则处理方法能够在有效剔除冗余规则的基础上,正确地对剩余规则进行重要性排序,对决策制定提供可靠的依据。 展开更多
关键词 粗糙集 属性约简 属性核 冗余规则 数据处理
在线阅读 下载PDF
基于粗集理论的数据过滤方法的研究 被引量:1
13
作者 王波 高克宁 张斌 《计算机工程与应用》 CSCD 北大核心 2005年第12期175-176,179,共3页
为了从大型数据库中获取有用的知识,采用了roughset理论。Roughset理论是一种研究不精确和不确定性知识的数学工具。利用粗糙集理论中属性核与不可分辨关系,提出了一种基于粗集的属性约简算法和消除冗余属性的数据过滤方法,并通过一个... 为了从大型数据库中获取有用的知识,采用了roughset理论。Roughset理论是一种研究不精确和不确定性知识的数学工具。利用粗糙集理论中属性核与不可分辨关系,提出了一种基于粗集的属性约简算法和消除冗余属性的数据过滤方法,并通过一个完整的实例验证了算法的有效性。 展开更多
关键词 粗糙集 数据挖掘 过滤 约简
在线阅读 下载PDF
一种基于Rough集的数据归约算法的实现 被引量:3
14
作者 杨宝华 胡学钢 《佳木斯大学学报(自然科学版)》 CAS 2003年第3期277-279,共3页
粗集是一种处理模糊和不确定性数据的工具 ,数据归约是粗集理论中重要的内容 .现已证明寻找信息系统的最小归约是 NP问题 .通过分辨矩阵和属性的依赖程度 ,消去冗余数据 ,得到一种最小归约集 ,并通过实例验证该算法的可行性 .
关键词 粗集 数据归约 信息系统 NP问题 分辨矩阵 属性 算法 上近似 不确定性 数据挖掘
在线阅读 下载PDF
基于模糊概念层核属性集确定算法及仿真研究
15
作者 李茹 张丽芳 +1 位作者 褚诚缘 邓嵩 《计算机仿真》 CSCD 2006年第4期99-102,共4页
大型数据库中核属性集的确定是生成分类规则算法的重要步骤。该文在结合粗糙集理论和层次聚类方法的基础上,提出运用模糊概念层方法对原始数据进行模糊化处理,排除边缘数据的干扰作用并简化可区分矩阵的构造,从而得出核属性集。并以我... 大型数据库中核属性集的确定是生成分类规则算法的重要步骤。该文在结合粗糙集理论和层次聚类方法的基础上,提出运用模糊概念层方法对原始数据进行模糊化处理,排除边缘数据的干扰作用并简化可区分矩阵的构造,从而得出核属性集。并以我国湖库在藻类繁殖高峰期实测浓度数据为例,快速、准确地得出湖库富营养化的主要指标。仿真试验结果表明,该算法简单,易于实现,在正确得出核属性集的基础上可以减少计算量,从而较为快速有效地得出推理规则。 展开更多
关键词 模糊概念层 核属性集 数据挖掘 知识发现
在线阅读 下载PDF
基于数据立方体的属性核计算方法 被引量:1
16
作者 刘亚波 刘大有 +1 位作者 高滢 齐红 《计算机工程》 CAS CSCD 北大核心 2008年第20期46-48,共3页
商业智能系统应用联机分析处理技术将数据组织为多维数据立方体。该文建立了数据立方体中非空单元与决策表中等价类的一一映射关系。通过复用数据立方体中的聚合结果,提出一种基于数据立方体计算相容决策表属性核的方法,并证明了该方法... 商业智能系统应用联机分析处理技术将数据组织为多维数据立方体。该文建立了数据立方体中非空单元与决策表中等价类的一一映射关系。通过复用数据立方体中的聚合结果,提出一种基于数据立方体计算相容决策表属性核的方法,并证明了该方法的正确性。利用UCI数据集进行实验,结果表明在大数据量下该方法具有较好的时间效率。 展开更多
关键词 数据立方体 联机分析处理 粗集 属性核
在线阅读 下载PDF
基于同构性档案本质的档案元数据核心集元问题研究 被引量:1
17
作者 崔杰 《兰台世界》 2019年第7期48-50,共3页
本文在“元数据”定义的基础上,应用同构性档案本质观点详细地阐述了档案元数据核心集构建中的元问题,将“档案元数据核心集”定义为“档案历史联系数据的数据集合”,揭示出了档案元数据核心集“整理档案历史联系”的根本功能以及“必... 本文在“元数据”定义的基础上,应用同构性档案本质观点详细地阐述了档案元数据核心集构建中的元问题,将“档案元数据核心集”定义为“档案历史联系数据的数据集合”,揭示出了档案元数据核心集“整理档案历史联系”的根本功能以及“必须最大限度保持档案历史联系与历史同构性”的构建原则,以此印证了同构性档案本质观点的理论导向功能及其科学性和实用性。 展开更多
关键词 同构性档案本质 档案元数据核心集 档案历史联系
在线阅读 下载PDF
领域自适应大数据集浓缩方法
18
作者 许敏 《温州职业技术学院学报》 2014年第4期38-42,59,共6页
传统机器学习均假定测试域和训练域处于同一概率分布,但现实中往往因各种原因引起所采集到的样本数据可能存在扰动或噪音情况,导致概率密度估计不一定准确。为有效解决这一问题,提出一种新的领域自适应数据集概率密度估计(A-RSDE)算法... 传统机器学习均假定测试域和训练域处于同一概率分布,但现实中往往因各种原因引起所采集到的样本数据可能存在扰动或噪音情况,导致概率密度估计不一定准确。为有效解决这一问题,提出一种新的领域自适应数据集概率密度估计(A-RSDE)算法。该算法可充分学习源域(训练域)概率密度分布知识,使目标域(测试域)概率密度估计更接近真实概率密度分布。实验证明,该算法具有有效性,且实现了数据浓缩的目的。 展开更多
关键词 领域自适应 RSDE 最小包含球 核心集 数据浓缩
在线阅读 下载PDF
半P-集合(X~■,X)与噪声数据剔除-应用 被引量:5
19
作者 李豫颖 《计算机科学》 CSCD 北大核心 2011年第8期221-225,共5页
半P-集合(half packet sets)是由内P-集合X■(internal packet set X■)与有限普通集合X构成的集合对,或者(X■,X)是半P-集合,它具有内-动态特性。为了剔除噪声数据,获得目标数据,利用半P-集合提出了基于属性补充的递推-剔除噪声数据的... 半P-集合(half packet sets)是由内P-集合X■(internal packet set X■)与有限普通集合X构成的集合对,或者(X■,X)是半P-集合,它具有内-动态特性。为了剔除噪声数据,获得目标数据,利用半P-集合提出了基于属性补充的递推-剔除噪声数据的方法。提出了噪声数据、噪声数据集成与■-数据核概念;给出了噪声数据与■-数据生成的递推方法与递推结构、噪声数据集成与■-数据核关系定理、■-数据依赖与辨识定理、噪声数据递推-剔除定理、噪声数据辨识准则与噪声数据递推-剔除准则,以及噪声数据递推-剔除应用。半P-集合是P-集合理论与应用的一个新的研究分支,是研究具有内-动态信息系统的一个新的数学方法。 展开更多
关键词 半P-集合 噪声数据 噪声数据集成 F-数据核 递推-剔除准则 应用
在线阅读 下载PDF
冠心病中医核心数据集构建思路 被引量:2
20
作者 贾君迪 鞠建庆 +4 位作者 高铸烨 李金根 赖润民 石榴 徐浩 《中国中西医结合杂志》 CAS CSCD 北大核心 2024年第7期864-867,共4页
核心数据集是临床采集的标准化数据集合,有助于数据标准统一,提高数据质量,为中医药高级别循证医学证据的形成提供支撑。笔者概述核心数据集的概念、研究现状与意义,探索冠心病中医核心数据集实施的思路方法,并提出难点与解决策略,以期... 核心数据集是临床采集的标准化数据集合,有助于数据标准统一,提高数据质量,为中医药高级别循证医学证据的形成提供支撑。笔者概述核心数据集的概念、研究现状与意义,探索冠心病中医核心数据集实施的思路方法,并提出难点与解决策略,以期为构建具有中医特色的核心数据集、提升中医药研究质量提供基础。 展开更多
关键词 核心数据集 中医 中西医结合 冠心病
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部