期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
基于几何匹配和四叉树编码的多源地理空间矢量数据融合方法
1
作者 张京坡 刘庆林 梁斌 《微型电脑应用》 2026年第2期209-213,共5页
为了保证多源地理空间矢量数据的可靠性,提出基于几何匹配和四叉树编码的多源地理空间矢量数据融合方法。所提出的方法基于自适应四叉树实现多源地理空间矢量数据点实体编码,依据点实体编码所属的网格构建网格索引。在此基础上生成粗候... 为了保证多源地理空间矢量数据的可靠性,提出基于几何匹配和四叉树编码的多源地理空间矢量数据融合方法。所提出的方法基于自适应四叉树实现多源地理空间矢量数据点实体编码,依据点实体编码所属的网格构建网格索引。在此基础上生成粗候选匹配集,并引入欧氏距离作为判断标准,获取精候选匹配集。利用几何匹配算法实现点实体匹配,利用点实体的图形相似度和属性相似度获取数据综合相似度,融合多源地理空间矢量数据。测试结果显示:所提出的方法能够完成多源地理空间矢量数据空间编码,极大程度降低匹配范围;能够精准完成实体待匹配点的匹配;空间相似性结果均在0.936以上,依据融合后数据能够更全面地获取建筑空间变化情况。 展开更多
关键词 几何匹配 四叉树编码 多源地理空间 矢量数据 融合方法 网格索引
在线阅读 下载PDF
基于欧式变换的矩形破片拦截靶点云拼接方法 被引量:1
2
作者 任杰 蒋海燕 姬建荣 《兵工学报》 北大核心 2025年第2期347-356,共10页
三维激光扫描技术可直接获取破片拦截靶板的高精度点云数据,从而识别提取破片对拦截靶形成的孔洞、凹坑等损伤特征,然而对于大规模靶板阵列,激光扫描仪在多个位置、角度所采集的靶板局部点云位置相互独立,难以反映靶板阵列整体结构,为... 三维激光扫描技术可直接获取破片拦截靶板的高精度点云数据,从而识别提取破片对拦截靶形成的孔洞、凹坑等损伤特征,然而对于大规模靶板阵列,激光扫描仪在多个位置、角度所采集的靶板局部点云位置相互独立,难以反映靶板阵列整体结构,为此提出一种基于欧式空间变换的矩形靶板阵列点云拼接方法。根据局部点云角点坐标及位置关系构建旋转矩阵与平移向量,通过多次旋转变换与平移变换实现多个局部点云的角度姿态调整,拼接为一个矩形破片拦截靶整体点云。与现场靶板阵列的尺寸相对比,拼接所得靶板整体点云的高度与长度的平均相对误差分别为2.035%、1.192%。所提方法填补了破片飞散分布测试技术领域靶板阵列激光点云拼接方法的研究空白,在此基础上未来可结合破片特征识别技术,进一步开展基于激光点云的战斗部破片场飞散分布三维重构方面的研究。 展开更多
关键词 破片分布测试 点云数据处理 欧式空间变换 旋转矩阵 平移向量
在线阅读 下载PDF
锌基合金电镀层斑点缺陷多光谱成像检测方法
3
作者 靳双燕 李浩亮 《电镀与精饰》 北大核心 2025年第12期139-145,共7页
由于电镀层表面复杂的光学特性,斑点缺陷的光谱向量与背景噪声存在多维耦合,导致传统方法难以有效分离光谱序列中的噪声数据。在噪声干扰下,斑点缺陷的尺度变化规律缺乏系统性表征,导致特征集构建不完整,无法覆盖多尺度缺陷形态,影响检... 由于电镀层表面复杂的光学特性,斑点缺陷的光谱向量与背景噪声存在多维耦合,导致传统方法难以有效分离光谱序列中的噪声数据。在噪声干扰下,斑点缺陷的尺度变化规律缺乏系统性表征,导致特征集构建不完整,无法覆盖多尺度缺陷形态,影响检测与定位的可靠性。为了解决这些问题,提出了一种基于多光谱成像的检测方法。通过分析多光谱成像数据的内在低秩特性,建立频谱间的噪声数据模型,输出正常与含噪信号的常量值,根据常量值减去光谱序列中每一行的对应数,完成去噪;在获得去噪数据后,针对锌基合金电镀层斑点的光谱向量与权重特征,采用多尺度融合求得斑点缺陷的尺度变化规律,整合形成全面特征集;基于这一规律构建全面特征集后,采用空间映射算法处理特征数据,生成反映缺陷特性的波频变化矩阵,通过分析矩阵参数锁定电镀层斑点缺陷在光谱维度的具体位置,实现缺陷的精准定位。实验数据表明,所提方法在信噪比、缺陷特征可视化及光谱匹配度3个关键指标上均显著优于对比方法,能够精准识别锌基合金电镀层中露铁斑、麻点斑等缺陷的轮廓、分布及光谱特征,且检测结果与实际值高度吻合。 展开更多
关键词 锌基合金电镀层斑点缺陷 多光谱成像检测 噪声数据 光谱向量 空间映射
在线阅读 下载PDF
模糊支持向量机下激光光栅大数据挖掘优化研究 被引量:2
4
作者 范少帅 姚远耀 占美星 《激光杂志》 北大核心 2025年第6期159-164,共6页
激光光栅数据中包含多种类型的信息,如波长、高维度、时间序列等,这些多样性增加了数据处理的难度。为了从大量激光光栅数据中提取到有价值的信息和模式,提出了模糊支持向量机下激光光栅大数据挖掘优化方法。基于共空间模式获取激光光... 激光光栅数据中包含多种类型的信息,如波长、高维度、时间序列等,这些多样性增加了数据处理的难度。为了从大量激光光栅数据中提取到有价值的信息和模式,提出了模糊支持向量机下激光光栅大数据挖掘优化方法。基于共空间模式获取激光光栅大数据的波长,利用机器学习技术中的模糊支持向量机将激光光栅数据波长映射到高维空间,并根据各数据波长展开数据智能挖掘,通过连续域蚁群算法确定模糊支持向量机的最优参数,以此提高机器学习技术的数据挖掘性能。实验结果表明,该方法对激光光栅数据的波长提取效果较好,在同类数据中的挖掘性能较高。 展开更多
关键词 机器学习技术 激光光栅大数据 数据挖掘 共空间模式 模糊支持向量机
原文传递
一种基于加权LDA模型的文本聚类方法 被引量:10
5
作者 李国 张春杰 张志远 《中国民航大学学报》 CAS 2016年第2期46-51,共6页
针对传统聚类算法在处理大规模和高维文本聚类时存在的不足和局限性,提出了新的以LDA(latent dirichlet allocation)模型为基础的聚类方法。通过LDA主题模型挖掘得到文本之中的潜在主题分布以及不同主题内的词语分布,分别计算文本在&qu... 针对传统聚类算法在处理大规模和高维文本聚类时存在的不足和局限性,提出了新的以LDA(latent dirichlet allocation)模型为基础的聚类方法。通过LDA主题模型挖掘得到文本之中的潜在主题分布以及不同主题内的词语分布,分别计算文本在"文本-主题"特征空间和"主题-词语"特征空间的相似度,然后对两者线性加权,获得最终的文本相似度。利用经典的K-Means算法,在中英文语料库上进行的实验表明,与单纯地利用VSM结合K-Means相比,具有较好的聚类效果。 展开更多
关键词 LDA 向量空间模型 数据挖掘 文本聚类 K-MEANS
在线阅读 下载PDF
基于查询接口文本VSM的Deep Web数据源分类 被引量:2
6
作者 石龙 强保华 +1 位作者 谌超 吴春明 《计算机应用与软件》 CSCD 北大核心 2013年第8期54-58,共5页
随着Internet技术的快速发展,Web数据库数目庞大而且仍在快速增长。为有效组织利用深藏于Web数据库上的信息,需对其按领域进行分类和集成。Web页面上的查询接口是网络用户访问Web数据库的唯一途径,对Deep Web数据源分类可通过对查询接... 随着Internet技术的快速发展,Web数据库数目庞大而且仍在快速增长。为有效组织利用深藏于Web数据库上的信息,需对其按领域进行分类和集成。Web页面上的查询接口是网络用户访问Web数据库的唯一途径,对Deep Web数据源分类可通过对查询接口分类实现。为此,提出一种基于查询接口文本VSM(Vector Space Model)的分类方法。首先,使用查询接口文本信息构建向量空间模型,然后通过典型的数据挖掘分类算法训练分类器,从而实现对查询接口所属领域进行分类。实验结果表明给出的方法具有良好的分类性能。 展开更多
关键词 DEEP WEB 数据源分类 向量空间模型 数据挖掘 查询接口
在线阅读 下载PDF
协同推荐中基于用户-文档矩阵的用户聚类研究 被引量:2
7
作者 颜端武 罗胜阳 成晓 《现代图书情报技术》 CSSCI 北大核心 2007年第3期25-28,共4页
针对个性化推荐服务的需要以及用户聚类处理时用户-文档访问数据的高维稀疏性问题,采用“比对降维”的思想和K层次聚类算法,分析基于用户资源评价数据的用户聚类处理流程。在此基础上,采用Java开源技术设计并实现一个用户聚类的试验系统。
关键词 协同推荐 用户聚类 向量空间模型 数据降维
在线阅读 下载PDF
基于Laplacian图谱的短文本聚类算法 被引量:2
8
作者 孟海宁 冯锴 +3 位作者 朱磊 张贝贝 童新宇 黑新宏 《电子学报》 EI CAS CSCD 北大核心 2021年第9期1716-1723,共8页
提出基于词频处理的Laplacian图谱聚类算法,以解决短文本数据维数高、特征稀疏等问题.首先采用词频-逆文本频率指数TF-IDF(Term Frequency-Inverse Document Frequency)方法,将短文本数据集映射到文本向量空间得到词频权值矩阵;其次利用... 提出基于词频处理的Laplacian图谱聚类算法,以解决短文本数据维数高、特征稀疏等问题.首先采用词频-逆文本频率指数TF-IDF(Term Frequency-Inverse Document Frequency)方法,将短文本数据集映射到文本向量空间得到词频权值矩阵;其次利用Laplacian矩阵的图谱聚类特性,对词频权值矩阵进行数据降维处理;然后依据Laplacian矩阵的特征值表示文本相似度的特点,选择前K个特征值对应的特征向量作为初始聚类中心,以减少聚类过程的迭代次数.在SSC、20 News Group及Microblog PCU数据集上进行相关实验,结果表明Laplacian图谱聚类算法比传统聚类算法,不仅具有更优的聚类结果与更快的收敛速度,而且受噪声点影响较小,有很好的鲁棒性. 展开更多
关键词 Laplacian图谱 词频-逆文本频率指数 短文本聚类 向量空间模型 数据降维 特征权值
在线阅读 下载PDF
集群环境下矢量空间数据长期存储方法仿真 被引量:3
9
作者 侯晓凌 《计算机仿真》 北大核心 2019年第5期484-487,共4页
针对当前数据存储方法存在存储空间占用严重和实时性差的问题,提出基于粒子群算法和K均值的集群环境下矢量空间数据长期存储方法。依据矢量空间数据比例尺和格网层次之间的关系梳理,利用Hilbert填充曲线划分矢量空间数据。在得出划分结... 针对当前数据存储方法存在存储空间占用严重和实时性差的问题,提出基于粒子群算法和K均值的集群环境下矢量空间数据长期存储方法。依据矢量空间数据比例尺和格网层次之间的关系梳理,利用Hilbert填充曲线划分矢量空间数据。在得出划分结果的基础上,将数据要素Hilbert排列码、矢量空间数据要素多级格网编码、数据要素顺序码、数据要素标识码,完成矢量空间数据唯一标识操作。确定K均值聚类算法初始均值或中心位置之后,初始化粒子群算法运行参数,计算粒子群适应度值,并更新粒子移动速度与位置,以此得到最佳粒子位置,将其当作K均值聚类的最佳聚类中心。将具有唯一标识的矢量空间数据集代入聚类算法中,并将具有相似性的数据缓存至同一数据簇,实现矢量空间数据长期存储。实验结果表明,所提方法数据存储空间占用率较低,存储效率高,具有可行性。 展开更多
关键词 集群环境 矢量空间 数据 存储
在线阅读 下载PDF
基于社会标注质量的文本分类模型框架 被引量:5
10
作者 李劲 张华 +2 位作者 吴浩雄 向军 辜希武 《计算机应用》 CSCD 北大核心 2012年第5期1335-1339,共5页
社会标注是一种用户对网络资源的大众分类,蕴含了丰富的语义信息,因此将社会标注应用到信息检索技术中有助于提高信息检索的质量。研究了一种基于社会标注的文本分类改进算法以提高网页分类的效果。由于社会标注属于大众分类,标注的产... 社会标注是一种用户对网络资源的大众分类,蕴含了丰富的语义信息,因此将社会标注应用到信息检索技术中有助于提高信息检索的质量。研究了一种基于社会标注的文本分类改进算法以提高网页分类的效果。由于社会标注属于大众分类,标注的产生具有很大的随意性,标注的质量差别很大,因此首先利用文档间的语义相似度以及标注间的语义相似度来对标注的质量进行量化评估。在此基础上对标注进行质量过滤,利用质量相对较好的标注对文档向量空间模型进行扩展,将文档表示成由文档单词以及文档标注信息组成的扩展向量。同时采用支持向量机分类算法进行分类实验。实验结果表明,通过对标注进行质量评估并过滤质量差的标注,同时结合文档内容以及标注来对文档能提高分类的效果,同传统的基于文档内容的分类算法相比,分类结果的F1度量值提高了6.2%。 展开更多
关键词 社会标注 向量空间模型 文本分类 信息检索 数据挖掘
在线阅读 下载PDF
人体运动捕获数据的向量空间建模与检索 被引量:7
11
作者 蓝荣祎 孙怀江 +2 位作者 连荷清 祝铭阳 李斌 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2011年第8期1357-1364,共8页
为了精确、高效地检索人体运动数据库,将三维人体运动捕获数据表示成类似于文本的形式,提出一种基于内容的运动检索方法.首先对人体上/下半身两部分数据分别提取关键帧,并进行相似传播聚类分析,获得数据中最具代表性的一组人体姿势,称... 为了精确、高效地检索人体运动数据库,将三维人体运动捕获数据表示成类似于文本的形式,提出一种基于内容的运动检索方法.首先对人体上/下半身两部分数据分别提取关键帧,并进行相似传播聚类分析,获得数据中最具代表性的一组人体姿势,称之为运动词汇;然后将运动片段的每一帧都替换成运动词汇中与其最相近的姿势来构建运动文档,利用Bigram向量空间模型对人体运动进行检索.整个算法流程不需要人为干预,能够自动完成对已分割运动数据片段的索引.实验结果表明,与现有方法相比,文中方法具有更高的检索精度和召回率. 展开更多
关键词 运动捕获数据 运动检索 向量空间模型 关键姿势提取 相似传播
在线阅读 下载PDF
基于n维仿射空间的产品结构模型的研究与应用 被引量:2
12
作者 刘晓冰 孟永胜 +1 位作者 阎长罡 邢英杰 《计算机集成制造系统》 EI CSCD 北大核心 2005年第3期314-319,346,共7页
考虑到传统物料清单模型在企业应用系统中的局限性及运行效率等问题,提出一种基于 n维仿射空间的产品结构模型。零件、部件和产品的全体构成一个仿射空间,并与伴随向量空间中的向径相对应。从零件到部件,产品的组装过程转化为对应向径... 考虑到传统物料清单模型在企业应用系统中的局限性及运行效率等问题,提出一种基于 n维仿射空间的产品结构模型。零件、部件和产品的全体构成一个仿射空间,并与伴随向量空间中的向径相对应。从零件到部件,产品的组装过程转化为对应向径间的线性组合,对物料清单的正逆向搜索、变形产品定义等操作通过相应向径间的内积运算来实现。最后,通过应用实例说明,基于该模型的产品结构数据在搜索性能、动态可变性以及数据重用性等方面得到了相应的改善。 展开更多
关键词 物料清单 数据模型 仿射空间 向量
在线阅读 下载PDF
航空液压泵磨损状况预测 被引量:19
13
作者 葛薇 王少萍 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2011年第11期1410-1414,共5页
磨损是航空液压泵典型的渐进性故障之一,因磨损量难以测量,对磨损状况进行准确的预测比较困难.针对上述问题,提出了基于多尺度数据的支持向量机预测方法,该方法将支持向量机用于时间序列预测的基本理论和数据多尺度分解、相空间重构方... 磨损是航空液压泵典型的渐进性故障之一,因磨损量难以测量,对磨损状况进行准确的预测比较困难.针对上述问题,提出了基于多尺度数据的支持向量机预测方法,该方法将支持向量机用于时间序列预测的基本理论和数据多尺度分解、相空间重构方法结合,能更有效地挖掘时间序列的内在联系及变化规律.采用回油流量作为反映航空液压泵磨损状况的敏感信号,将其分解为趋势项和随机项,采用多尺度支持向量机作等维信息一步预测和多步预测,利用网格方法对预测模型参数寻优.对比传统支持向量机算法分析其预测精度,结果表明:多尺度支持向量机模型预测精度更高,适于中长期预测. 展开更多
关键词 航空液压泵 磨损预测 多尺度支持向量机 数据分解 相空间重构
原文传递
一种新的支持矢量数据描述模糊识别方法 被引量:2
14
作者 郭雷 肖怀铁 付强 《系统仿真学报》 CAS CSCD 北大核心 2009年第7期1882-1886,共5页
支持矢量机(SVM)是一种两类分类器,而支持矢量数据描述(SVDD)是一种单类数据分类方法,通过在特征空间寻找包含某类样本的最小超球体来对样本分类,该方法只需已知某类数据即可构造分类器。但是在SVDD方法中,直接根据超球体构造的分类器... 支持矢量机(SVM)是一种两类分类器,而支持矢量数据描述(SVDD)是一种单类数据分类方法,通过在特征空间寻找包含某类样本的最小超球体来对样本分类,该方法只需已知某类数据即可构造分类器。但是在SVDD方法中,直接根据超球体构造的分类器对样本数据正确识别能力不高。针对这个问题,根据样本在特征空间中到各个超球体球心的距离构造了样本属于各个类别的模糊隶属度函数,提出了FSVDD多目标识别方法。在FSVDD的训练过程中采用了乘性迭代规则的快速优化算法,该快速算法降低了优化的复杂度和缩短了优化时间。在针对不同类型数据集的识别实验中,证明了提出的FSVDD多目标识别算法具有训练速度快、识别率高的优点,有很强的实用性。 展开更多
关键词 目标识别 支持矢量机 支持矢量数据描述 特征空间 超球体 模糊隶属度
原文传递
一种基于核SMOTE的非平衡数据集分类方法 被引量:50
15
作者 曾志强 吴群 +1 位作者 廖备水 高济 《电子学报》 EI CAS CSCD 北大核心 2009年第11期2489-2495,共7页
本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空... 本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果. 展开更多
关键词 非平衡数据集 支持向量机 输入空间 特征空间 原像
在线阅读 下载PDF
仅根据Proximity数据构建向量空间模型的方法 被引量:1
16
作者 徐硕 乔晓东 +1 位作者 朱礼军 郭怀恩 《情报学报》 CSSCI 北大核心 2011年第11期1163-1170,共8页
在实际应用中,许多研究对象都是抽象的,难以用某种特征向量的形式表示,这使得许多成熟的数据挖掘和机器学习方法难以被采用。不过,通常可将其转化成一个Proximity数据矩阵,使得矩阵中的元素表示两个对象间某种“比较”关系。针对... 在实际应用中,许多研究对象都是抽象的,难以用某种特征向量的形式表示,这使得许多成熟的数据挖掘和机器学习方法难以被采用。不过,通常可将其转化成一个Proximity数据矩阵,使得矩阵中的元素表示两个对象间某种“比较”关系。针对该问题,本文提出仅根据Proximity数据矩阵利用多维尺度分析法(MDS)将研究对象进行向量化表示,即构建了一种向量空间模型。最后,对汉语科技词系统中的词语进行了聚类分析,结果表明,向量空间模型构建后再聚类的结果明显优于直接针对Proximity数据进行聚类分析的结果,从而验证了该方法的可行性和有效性。 展开更多
关键词 多维尺度法 Proximity数据 向量空间模型 汉语科技词系统 聚类分析
在线阅读 下载PDF
基于主题标签的在线社区话题发现 被引量:2
17
作者 周新民 陈晓红 +1 位作者 钟敏娟 赵文军 《系统工程》 CSSCI 北大核心 2017年第7期40-46,共7页
面对海量的互联网信息,如何快速有效地提取到用户关心的话题成为网络信息处理的一项基本任务。话题发现实质是无指导的聚类研究,本文引入主题标签概念,针对在线社区数据,提出了主题标签的话题发现算法。该算法以词项为粒度,基于词项的... 面对海量的互联网信息,如何快速有效地提取到用户关心的话题成为网络信息处理的一项基本任务。话题发现实质是无指导的聚类研究,本文引入主题标签概念,针对在线社区数据,提出了主题标签的话题发现算法。该算法以词项为粒度,基于词项的权重和上下文信息获取论坛帖子线索文档的核心词汇,作为文档的主题标签,在向量空间模型的基础上结合主题标签间的相似性进行相关话题的聚类。该方法的提出,一方面获得的主题词项不仅准确,而且具有较强的语义关联性,有效的避免了向量空间模型中容易丢失特征词间语义信息的缺陷;另一方面,与潜在语义模型相比,本文在向量空间模型基础上的话题发现具有更高的效率和更好的聚类质量。 展开更多
关键词 话题发现 主题标签 大数据 上下文分析 向量空间模型
原文传递
渔业科学数据智能RSS阅读器的设计研究 被引量:1
18
作者 肖慧 王立华 +1 位作者 徐硕 陈孟婕 《中国农学通报》 CSCD 2013年第32期95-99,共5页
针对传统RSS阅读器在实际应用中接收大量冗余信息的问题,提出一种智能化的RSS阅读器。该阅读器基于渔业科学数据平台,采用向量空间模型,运用中文分词、对象持久化等技术实现智能原理,设计实现了智能化RSS阅读器。实验证明:该阅读器的过... 针对传统RSS阅读器在实际应用中接收大量冗余信息的问题,提出一种智能化的RSS阅读器。该阅读器基于渔业科学数据平台,采用向量空间模型,运用中文分词、对象持久化等技术实现智能原理,设计实现了智能化RSS阅读器。实验证明:该阅读器的过滤有效性为86.2%,过滤准确性为82.4%,能够较好地过滤掉与用户不相关的信息。应用结果表明:渔业科学数据智能RSS阅读器的实现可使用户获得更精准的信息。 展开更多
关键词 RSS阅读器 智能化 渔业科学数据 向量空间模型 中文分词 对象持久化
在线阅读 下载PDF
GIS中矢量与栅格数据模型比较 被引量:7
19
作者 刘晓洁 《吉林地质》 2005年第1期89-91,共3页
由于GIS软件的多样性,每种软件都有自己特定的数据模型,从数据结构上来说,矢量和栅格是地理信息系统中两种主要的空间数据结构。本文通过对栅格数据与矢量数据模型的应用比较,对于空间数据从需求分析,以满足对数据信息进行更改、更新、... 由于GIS软件的多样性,每种软件都有自己特定的数据模型,从数据结构上来说,矢量和栅格是地理信息系统中两种主要的空间数据结构。本文通过对栅格数据与矢量数据模型的应用比较,对于空间数据从需求分析,以满足对数据信息进行更改、更新、增加或者为了某种特定的需要。 展开更多
关键词 栅格数据 模型比较 空间数据结构 地理信息系统 矢量数据模型 GIS软件 需求分析 应用比较 数据信息 多样性 矢量和
在线阅读 下载PDF
处理多类不平衡数据的SVM分类算法 被引量:7
20
作者 李珍香 王文剑 郭虎升 《计算机工程与设计》 CSCD 北大核心 2014年第7期2499-2503,共5页
针对多类不平衡数据分类准确率低的问题,提出一种基于空间扩展的支持向量机学习算法(support vector machine algorithm based on space spreading,SS-SVM)。根据空间扩展原理,在多维欧式空间中通过空间扩展对少类数据进行上采样,使其... 针对多类不平衡数据分类准确率低的问题,提出一种基于空间扩展的支持向量机学习算法(support vector machine algorithm based on space spreading,SS-SVM)。根据空间扩展原理,在多维欧式空间中通过空间扩展对少类数据进行上采样,使其处理数据时减少小区块的影响;降低数据不平衡度以优化分类器组;在扩展的数据集上训练SVM分类器。标准数据集上的实验结果表明,与几种经典的算法相比,SS-SVM在多类不平衡数据分类上可获得令人满意的分类结果,对少类数据分类精度要求较高的问题尤为有效。 展开更多
关键词 多类不平衡数据 支持向量机 空间扩展 小区快 上采样 SS-SVM算法
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部