期刊文献+
共找到200篇文章
< 1 2 10 >
每页显示 20 50 100
Defend Against Adversarial Samples by Using Perceptual Hash 被引量:1
1
作者 Changrui Liu Dengpan Ye +4 位作者 Yueyun Shang Shunzhi Jiang Shiyu Li Yuan Mei Liqiang Wang 《Computers, Materials & Continua》 SCIE EI 2020年第3期1365-1386,共22页
Image classifiers that based on Deep Neural Networks(DNNs)have been proved to be easily fooled by well-designed perturbations.Previous defense methods have the limitations of requiring expensive computation or reducin... Image classifiers that based on Deep Neural Networks(DNNs)have been proved to be easily fooled by well-designed perturbations.Previous defense methods have the limitations of requiring expensive computation or reducing the accuracy of the image classifiers.In this paper,we propose a novel defense method which based on perceptual hash.Our main goal is to destroy the process of perturbations generation by comparing the similarities of images thus achieve the purpose of defense.To verify our idea,we defended against two main attack methods(a white-box attack and a black-box attack)in different DNN-based image classifiers and show that,after using our defense method,the attack-success-rate for all DNN-based image classifiers decreases significantly.More specifically,for the white-box attack,the attack-success-rate is reduced by an average of 36.3%.For the black-box attack,the average attack-success-rate of targeted attack and non-targeted attack has been reduced by 72.8%and 76.7%respectively.The proposed method is a simple and effective defense method and provides a new way to defend against adversarial samples. 展开更多
关键词 Image classifiers deep neural networks adversarial samples attack defense perceptual hash image similarity
在线阅读 下载PDF
A new discriminative sparse parameter classifier with iterative removal for face recognition
2
作者 TANG De-yan ZHOU Si-wang +2 位作者 LUO Meng-ru CHEN Hao-wen TANG Hui 《Journal of Central South University》 SCIE EI CAS CSCD 2022年第4期1226-1238,共13页
Face recognition has been widely used and developed rapidly in recent years.The methods based on sparse representation have made great breakthroughs,and collaborative representation-based classification(CRC)is the typ... Face recognition has been widely used and developed rapidly in recent years.The methods based on sparse representation have made great breakthroughs,and collaborative representation-based classification(CRC)is the typical representative.However,CRC cannot distinguish similar samples well,leading to a wrong classification easily.As an improved method based on CRC,the two-phase test sample sparse representation(TPTSSR)removes the samples that make little contribution to the representation of the testing sample.Nevertheless,only one removal is not sufficient,since some useless samples may still be retained,along with some useful samples maybe being removed randomly.In this work,a novel classifier,called discriminative sparse parameter(DSP)classifier with iterative removal,is proposed for face recognition.The proposed DSP classifier utilizes sparse parameter to measure the representation ability of training samples straight-forward.Moreover,to avoid some useful samples being removed randomly with only one removal,DSP classifier removes most uncorrelated samples gradually with iterations.Extensive experiments on different typical poses,expressions and noisy face datasets are conducted to assess the performance of the proposed DSP classifier.The experimental results demonstrate that DSP classifier achieves a better recognition rate than the well-known SRC,CRC,RRC,RCR,SRMVS,RFSR and TPTSSR classifiers for face recognition in various situations. 展开更多
关键词 collaborative representation-based classification discriminative sparse parameter classifier face recognition iterative removal sparse representation two-phase test sample sparse representation
在线阅读 下载PDF
Application of Artificial Neural Network to Battlefield Target Classification
3
作者 李芳 张中民 李科杰 《Journal of Beijing Institute of Technology》 EI CAS 2000年第2期201-204,共4页
To study the capacity of artificial neural network (ANN) applying to battlefield target classification and result of classification, according to the characteristics of battlefield target acoustic and seismic sign... To study the capacity of artificial neural network (ANN) applying to battlefield target classification and result of classification, according to the characteristics of battlefield target acoustic and seismic signals, an on the spot experiment was carried out to derive acoustic and seismic signals of a tank and jeep by special experiment system. Experiment data processed by fast Fourier transform(FFT) were used to train the ANN to distinguish the two battlefield targets. The ANN classifier was performed by the special program based on the modified back propagation (BP) algorithm. The ANN classifier has high correct identification rates for acoustic and seismic signals of battlefield targets, and is suitable for the classification of battlefield targets. The modified BP algorithm eliminates oscillations and local minimum of the standard BP algorithm, and enhances the convergence rate of the ANN. 展开更多
关键词 artificial neural network sample data classifier TRAINING
在线阅读 下载PDF
基于改进辅助分类生成对抗网络的小样本轴承故障诊断
4
作者 谢莹 刘雪伟 鲁振杰 《轴承》 北大核心 2026年第1期100-110,共11页
针对实际工业生产中故障数据较难采集,而训练具有良好性能的深度学习模型又依赖于大量数据样本的问题,提出一种改进辅助分类生成对抗网络与注意力机制相结合(M-ACGAN-A)的故障诊断模型。首先,对振动信号进行短时傅里叶变换,将其转化为... 针对实际工业生产中故障数据较难采集,而训练具有良好性能的深度学习模型又依赖于大量数据样本的问题,提出一种改进辅助分类生成对抗网络与注意力机制相结合(M-ACGAN-A)的故障诊断模型。首先,对振动信号进行短时傅里叶变换,将其转化为二维时频图,从而增强数据特征;其次,采用辅助分类生成对抗网络(ACGAN)的生成器学习实际数据样本的分布,生成大量模拟数据样本;然后,利用嵌入注意力机制的分类器进行模型训练,引入Wasserstein距离指导模型缩短源分布与目标分布的差距,并通过谱归一化来防止模型梯度爆炸;最后,利用训练完成的判别器进行故障诊断。采用凯斯西储大学轴承数据集和帕德博恩大学轴承数据集进行试验,结果表明所提模型能够利用有限的数据信息实现故障诊断,相比于其他深度学习模型具有更高的诊断精度和泛化性。 展开更多
关键词 滚动轴承 故障诊断 特征提取 傅里叶变换 小样本 辅助分类生成对抗网络
在线阅读 下载PDF
基于不平衡样本特征的电缆发热故障自动化诊断技术
5
作者 杨锟 《电力信息与通信技术》 2026年第3期60-66,共7页
在电缆发热故障自动化诊断中,正常运行的电缆数据远多于故障数据,导致传统的故障诊断模型在训练时容易偏向多数类(正常类),而忽视少数类(故障类),降低了对故障识别的准确性。为此,文章提出基于不平衡样本特征的电缆发热故障自动化诊断... 在电缆发热故障自动化诊断中,正常运行的电缆数据远多于故障数据,导致传统的故障诊断模型在训练时容易偏向多数类(正常类),而忽视少数类(故障类),降低了对故障识别的准确性。为此,文章提出基于不平衡样本特征的电缆发热故障自动化诊断方法。通过提取电缆发热故障特征向量,利用XGBoost决策树预测电缆发热故障诊断所需的不平衡样本特征集。采用Bagging-异质K近邻集成算法对训练后的特征集进行规划和分类,并建立特征集分类器,根据分类正确率权值矩阵实现电缆发热故障自动化诊断。实验结果表明,所提方法的损失函数(Loss)在训练过程中迅速收敛且保持平稳,能够准确捕捉并判断电缆的发热故障状态。通过计算得到的F1值整体保持在0.95以上,进一步验证了该方法在电缆故障诊断领域的有效性和高精度。 展开更多
关键词 电缆发热故障 自动化诊断 不平衡样本特征 XGBoost决策树 卷积神经网络 特征集分类器 Loss函数
在线阅读 下载PDF
Importance-Weighted Transfer Learning for Fault Classification under Covariate Shift
6
作者 Yi Pan Lei Xie Hongye Su 《Intelligent Automation & Soft Computing》 2024年第4期683-696,共14页
In the process of fault detection and classification,the operation mode usually drifts over time,which brings great challenges to the algorithms.Because traditional machine learning based fault classification cannot d... In the process of fault detection and classification,the operation mode usually drifts over time,which brings great challenges to the algorithms.Because traditional machine learning based fault classification cannot dynamically update the trained model according to the probability distribution of the testing dataset,the accuracy of these traditional methods usually drops significantly in the case of covariate shift.In this paper,an importance-weighted transfer learning method is proposed for fault classification in the nonlinear multi-mode industrial process.It effectively alters the drift between the training and testing dataset.Firstly,the mutual information method is utilized to perform feature selection on the original data,and a number of characteristic parameters associated with fault classification are selected according to their mutual information.Then,the importance-weighted least-squares probabilistic classifier(IWLSPC)is utilized for binary fault detection and multi-fault classification in covariate shift.Finally,the Tennessee Eastman(TE)benchmark is carried out to confirm the effectiveness of the proposed method.The experimental result shows that the covariate shift adaptation based on importance-weight sampling is superior to the traditional machine learning fault classification algorithms.Moreover,IWLSPC can not only be used for binary fault classification,but also can be applied to the multi-classification target in the process of fault diagnosis. 展开更多
关键词 Covariate shift adaption nonlinear multi-mode process importance weight sampling multi-fault classification
在线阅读 下载PDF
面向低能耗高性能的分类器两阶段数据选择方法
7
作者 崔双双 王宏志 +1 位作者 朱加昊 吴昊 《计算机应用》 北大核心 2025年第6期1703-1711,共9页
针对利用海量数据构建分类模型时训练数据规模大、训练时间长且碳排放量大的问题,提出面向低能耗高性能的分类器两阶段数据选择方法TSDS(Two-Stage Data Selection)。首先,通过修正余弦相似度确定聚类中心,并将样本数据进行基于不相似... 针对利用海量数据构建分类模型时训练数据规模大、训练时间长且碳排放量大的问题,提出面向低能耗高性能的分类器两阶段数据选择方法TSDS(Two-Stage Data Selection)。首先,通过修正余弦相似度确定聚类中心,并将样本数据进行基于不相似点的分裂层次聚类;其次,对聚类结果按数据分布自适应抽样以组成高质量的子样本集;最后,利用子样本集在分类模型上训练,在加速训练过程的同时提升模型精度。在Spambase、Bupa和Phoneme等6个数据集上构建支持向量机(SVM)和多层感知机(MLP)分类模型,验证TSDS的性能。实验结果表明在样本数据压缩比达到85.00%的情况下,TSDS能将分类模型准确率提升3~10个百分点,同时加速模型训练,使训练SVM分类器的能耗平均降低93.76%,训练MLP分类器的能耗平均降低75.41%。可见,TSDS在大数据场景的分类任务上既能缩短训练时间和减少能耗,又能提升分类器性能,从而助力实现“双碳”目标。 展开更多
关键词 分类器 层次聚类 自适应采样 数据选择 小样本学习
在线阅读 下载PDF
降水预报机器学习订正及其在分类型降水测试的效果研究?
8
作者 钟琦 梁红丽 +3 位作者 代刊 方祖亮 申莉莉 侯邵禹 《气象》 北大核心 2025年第8期914-927,共14页
强降水是对我国国计民生影响最为广泛的灾害性天气之一,其精准预报也是最具挑战的科学问题之一,湿物理过程的多尺度、非线性特征使数值预报和客观订正处理降水问题比处理一般气象要素困难得多。文章以京津冀地区3 h累计降水量为对象,基... 强降水是对我国国计民生影响最为广泛的灾害性天气之一,其精准预报也是最具挑战的科学问题之一,湿物理过程的多尺度、非线性特征使数值预报和客观订正处理降水问题比处理一般气象要素困难得多。文章以京津冀地区3 h累计降水量为对象,基于站点观测和数值模式预报,通过降水样本构建和采样、降水相关物理特征输入、使用残差训练等策略,探索了机器学习算法LightGBM应用于降水预报订正的效果。结果显示,面对降水样本的长尾分布难题,构建数据集时综合考虑保持降水的真实分布,同时适度增大较强量级降水样本的比例,是提升强量级降水订正效果的关键一环。独立测试集的统计检验表明,LightGBM订正方案在所有阈值降水的客观评分均较原模式预报显著提升,且提升率随降水阈值增大而增加。分类型降水的统计检验和个例评估显示,LightGBM订正方案在不同类型降水预报均体现出强度和落区的综合调整,其中:强天气系统强迫类型降水样本数量相对占优,在各降水阈值订正效果均较显著;而弱天气系统强迫类型降水订正在≥15 mm阈值时较难获得提升,落区的调整也更具挑战。这说明降水样本的不平衡分布仍是机器学习订正面临的挑战,但机器学习体现出对模式预报准确率更低的较大量级降水的订正潜力,即模式预报能力越低,机器学习订正提升的空间和幅度越大。特征重要性分析表明,输入与降水密切相关的动力、热力和水汽等物理特征,对提升LightGBM订正评分具有正贡献。 展开更多
关键词 京津冀地区 降水预报订正 机器学习 样本构建 分类降水
在线阅读 下载PDF
基于多流形的单样本人脸模糊分类算法 被引量:1
9
作者 徐洁 杨长茂 +1 位作者 陈建平 王文琰 《计算机工程与设计》 北大核心 2025年第3期719-725,共7页
为解决单个人脸样本分类中样本数量不足的问题,提出一种多流形模糊分类算法(FMMC)。通过分割图像增加“样本”数量,构造类别子流形。引入模糊集理论,定义类别流形隶属度,弱化不同类别子流形上语义相同的图块相似度,强化同一类别子流形... 为解决单个人脸样本分类中样本数量不足的问题,提出一种多流形模糊分类算法(FMMC)。通过分割图像增加“样本”数量,构造类别子流形。引入模糊集理论,定义类别流形隶属度,弱化不同类别子流形上语义相同的图块相似度,强化同一类别子流形上不同位置图块的类别信息相关性,有效限制离群图块对分类结果的影响,提高分类的性能。在3个公开人脸数据库上进行实验,其结果表明,FMMC对单个样本问题的分类可行且有效。 展开更多
关键词 单样本 K最近邻分类器 模糊集 多流形 切割 流形隶属度 分类
在线阅读 下载PDF
基于交易采样子图的以太坊钓鱼检测方法
10
作者 雷帮春 孟坤 +1 位作者 宋登科 陈大兴 《计算机工程与设计》 北大核心 2025年第3期690-697,共8页
以太坊提供了图灵完备的去中心网络应用开发和部署环境,所充斥的钓鱼诈骗类应用已成为以太坊的最大安全威胁。为提高以太坊钓鱼检测的效率问题,提出一种基于交易采样子图网络的以太坊钓鱼检测方法。构建目标地址的原始交易子图;设计分... 以太坊提供了图灵完备的去中心网络应用开发和部署环境,所充斥的钓鱼诈骗类应用已成为以太坊的最大安全威胁。为提高以太坊钓鱼检测的效率问题,提出一种基于交易采样子图网络的以太坊钓鱼检测方法。构建目标地址的原始交易子图;设计分层网络采样方法和时序映射机制构建它的4种交易采样子图并提取图特征;利用去重特征融合来消除冗余,输出融合特征来训练随机森林分类器。实验验证了该方法的合理性和有效性,获得了较高的F1值。 展开更多
关键词 以太坊 钓鱼检测方法 交易采样子图网络 网络采样方法 图特征方法 去重特征融合 随机森林分类器
在线阅读 下载PDF
小样本类增量提示的细粒度车辆识别
11
作者 冉烨军 金良琼 +2 位作者 罗树霞 李琼忆 陶永 《电子测量技术》 北大核心 2025年第19期51-59,共9页
在细粒度车辆识别领域,深度学习面临一个挑战:各种新车型源源不断推出,然而我收集并标注数据的能力有限,这会导致“小样本类增量学习问题”问题。针对上述挑战,本文提出了一种新方法,基于提示的小样本类增量学习,旨在使模型在少量新车... 在细粒度车辆识别领域,深度学习面临一个挑战:各种新车型源源不断推出,然而我收集并标注数据的能力有限,这会导致“小样本类增量学习问题”问题。针对上述挑战,本文提出了一种新方法,基于提示的小样本类增量学习,旨在使模型在少量新车辆类别样本下既能识别原有类别又能学习新增类别,而无需重新训练或依赖大量原始数据。这种方法结合了提示机制和预训练的视觉转换器(ViT)模型的优势。我们设计了两种提示——域提示和FSCIL提示,以解决FSCIL中的挑战。在类增量学习中,Stanford Cars和CompCars这两个数据集的平均精度到达了70.47%和73.56%,优于目前现有的方法。 展开更多
关键词 小样本学习 提示学习 视觉转换 原型分类器
原文传递
不平衡数据的降采样方法研究 被引量:33
12
作者 林舒杨 李翠华 +2 位作者 江弋 林琛 邹权 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期47-53,共7页
提出了一种处理不平衡数据的降采样方法,以解决机器学习中分类器在训练时因为样本集中的样本类别不平衡而导致过拟合造成分类器性能下降的问题.利用K-Means方法,对大类样本进行聚类并提取聚类中心,获得与较小样本集样本数目近似的样本,... 提出了一种处理不平衡数据的降采样方法,以解决机器学习中分类器在训练时因为样本集中的样本类别不平衡而导致过拟合造成分类器性能下降的问题.利用K-Means方法,对大类样本进行聚类并提取聚类中心,获得与较小样本集样本数目近似的样本,组成新的样本集用以训练.为了避免在小类样本数目较小的情况下,单纯使用聚类降采样算法造成训练集样本的过度稀疏,使用SMOTE过采样算法结合聚类降采样,既避免了SMOTE为样本集引入较多的噪声,又有效地解决了训练集样本稀疏的问题.6组UCI测试数据和5组生物信息学实验证明了它在对类别不平衡数据进行降采样上的有效性. 展开更多
关键词 类别不平衡 聚类 降采样 分类 机器学习
在线阅读 下载PDF
不同训练样本对识别系统的影响 被引量:15
13
作者 刘刚 张洪刚 郭军 《计算机学报》 EI CSCD 北大核心 2005年第11期1923-1928,共6页
分析了训练样本对于识别系统性能的影响,将训练样本分为三种:好样本、差样本和边界样本,分析了它们在训练中所起的作用,并结合基于HMM的手写数字识别系统,给出了一种简单的边界样本定义和选择的方法;通过实验证明了采用边界样本训练可... 分析了训练样本对于识别系统性能的影响,将训练样本分为三种:好样本、差样本和边界样本,分析了它们在训练中所起的作用,并结合基于HMM的手写数字识别系统,给出了一种简单的边界样本定义和选择的方法;通过实验证明了采用边界样本训练可使系统误识率降低17.51%,并证明了边界样本的重要性,且指出非边界样本的存在会影响训练的效果. 展开更多
关键词 训练样本 样本分类 边界样本 HMM
在线阅读 下载PDF
一种基于预分类的高效最近邻分类器算法 被引量:8
14
作者 王卫东 郑宇杰 +1 位作者 杨静宇 杨健 《计算机科学》 CSCD 北大核心 2007年第2期198-200,共3页
本文的最近邻分类器算法是采用多分类器组合的方式对测试样本进行预分类,并根据预分类结果重新生成新的训练和测试样本集。对新的测试样本采用最近邻分类器进行分类识别,并将识别结果与预分类结果结合在一起进行正确率测试。在ORL人脸... 本文的最近邻分类器算法是采用多分类器组合的方式对测试样本进行预分类,并根据预分类结果重新生成新的训练和测试样本集。对新的测试样本采用最近邻分类器进行分类识别,并将识别结果与预分类结果结合在一起进行正确率测试。在ORL人脸库上的实验结果说明,该算法对小样本数据的识别具有明显优势。 展开更多
关键词 最近邻分类器 预类别 多分类器组合 小样本问题 人脸识别
在线阅读 下载PDF
植物抗性基因识别中的随机森林分类方法 被引量:15
15
作者 郭颖婕 刘晓燕 +1 位作者 郭茂祖 邹权 《计算机科学与探索》 CSCD 2012年第1期67-77,共11页
为了解决传统基于同源序列比对的抗性基因识别方法中假阳性高、无法发现新的抗性基因的问题,提出了一种利用随机森林分类器和K-Means聚类降采样方法的抗性基因识别算法。针对目前研究工作中挖掘盲目性大的问题,进行两点改进:引入了随机... 为了解决传统基于同源序列比对的抗性基因识别方法中假阳性高、无法发现新的抗性基因的问题,提出了一种利用随机森林分类器和K-Means聚类降采样方法的抗性基因识别算法。针对目前研究工作中挖掘盲目性大的问题,进行两点改进:引入了随机森林分类器和188维组合特征来进行抗性基因识别,这种基于样本统计学习的方法能够有效地捕捉抗性基因内在特性;对于训练过程中存在的严重类别不平衡现象,使用基于聚类的降采样方法得到了更具代表性的训练集,进一步降低了识别误差。实验结果表明,该算法可以有效地进行抗性基因的识别工作,能够对现有实验验证数据进行准确的分类,并在反例集上也获得了较高的精度。 展开更多
关键词 随机森林 分类器 抗性基因 聚类 降采样
在线阅读 下载PDF
不平衡数据分类方法综述 被引量:28
16
作者 杨明 尹军梅 吉根林 《南京师范大学学报(工程技术版)》 CAS 2008年第4期7-12,共6页
分类问题是机器学习领域的重要研究内容之一,现有的一些分类方法都已经相对成熟,用它们来对平衡数据进行分类一般都能取得较好的分类性能,但在现实世界中数据往往都是不平衡的,而现有的分类器的设计都是基于类分布大致平衡这一假设的,... 分类问题是机器学习领域的重要研究内容之一,现有的一些分类方法都已经相对成熟,用它们来对平衡数据进行分类一般都能取得较好的分类性能,但在现实世界中数据往往都是不平衡的,而现有的分类器的设计都是基于类分布大致平衡这一假设的,如果用这些方法来对不平衡数据进行分类就会导致分类器的性能下降,因而研究用于处理不平衡数据集的分类方法显得相当重要.为便于读者更清晰地了解数据不平衡分类问题的研究现状和未来研究的动向,本文对相关的研究进行了综述和展望. 展开更多
关键词 不平衡数据 过抽样 欠抽样 代价敏感 单分类器 特征选择 子空间
在线阅读 下载PDF
临床检验中心不合格标本分类统计及原因分析 被引量:10
17
作者 王秋桐 安跃震 刑洁 《国际检验医学杂志》 CAS 2014年第21期2945-2946,共2页
目的对沧州市中心医院临床检验中心出现的不合格标本进行分类统计和原因分析。方法对临床检验中心不合格标本按照类别、数量、拒收原因分别进行计数统计。结果采血量少、溶血、凝血、抗凝管使用错误等是血液标本不合格的主要原因。尿液... 目的对沧州市中心医院临床检验中心出现的不合格标本进行分类统计和原因分析。方法对临床检验中心不合格标本按照类别、数量、拒收原因分别进行计数统计。结果采血量少、溶血、凝血、抗凝管使用错误等是血液标本不合格的主要原因。尿液和粪便标本不合格的原因主要有采集量少、标本被污染、送检不及时等。结论分析不合格原因,在标本采集前准备运输、拒收等方面进行整改,做好分析前的质控工作。 展开更多
关键词 血液标本 尿液标本 粪便标本 分类统计 原因分析
暂未订购
基于最大似然分类算法的土地覆盖分类精度控制研究 被引量:13
18
作者 李全 王海燕 李霖 《国土资源科技管理》 2005年第4期42-45,共4页
在土地覆盖分类应用中执行最大似然分类算法存在许多可能影响精度的问题,包括确定分类类别及数量、光谱波段、先验概率、选择和改进样本区等。在总结了这些问题后,提出了解决方法,并应用ERDASIMAGINE8.6软件以南京市TM数据为例进行了分... 在土地覆盖分类应用中执行最大似然分类算法存在许多可能影响精度的问题,包括确定分类类别及数量、光谱波段、先验概率、选择和改进样本区等。在总结了这些问题后,提出了解决方法,并应用ERDASIMAGINE8.6软件以南京市TM数据为例进行了分类实验,结果证明此方法能有效提高分类精度。 展开更多
关键词 最大似然分类 先验概率 样本区选择
在线阅读 下载PDF
基于分组提升集成的跨领域文本情感分类 被引量:12
19
作者 赵传君 王素格 +1 位作者 李德玉 李欣 《计算机研究与发展》 EI CSCD 北大核心 2015年第3期629-638,共10页
针对目标领域带标签数据偏少的问题,综合运用半监督学习、BootStrapping、数据分组、AdaBoost、集成学习等策略与技术,提出了一种基于分组提升集成的跨领域文本情感分类方法.该方法首先利用少量人工标注的目标领域数据,基于合成过抽样... 针对目标领域带标签数据偏少的问题,综合运用半监督学习、BootStrapping、数据分组、AdaBoost、集成学习等策略与技术,提出了一种基于分组提升集成的跨领域文本情感分类方法.该方法首先利用少量人工标注的目标领域数据,基于合成过抽样技术产生一定数量的虚拟数据.在此基础上,采用BootStrapping方法获得更多目标领域高可信度的带标签数据.在分类器的构建方面,首先将源领域的带标签数据等量分割,并分别与目标领域带标签数据组合,在每个组合数据块上运用AdaBoost方法提升地训练多个分类器,并将这些分类器线性地集成为一个分类器.在亚马逊购物网站4个领域的情感数据集上的实验表明,基于分组提升集成的跨领域文本情感分类方法一定程度上提高了跨领域文本情感分类的精度. 展开更多
关键词 情感分类 跨领域 合成过抽样技术 分组提升 集成分类器
在线阅读 下载PDF
采用虚拟训练样本的二次判别分析方法 被引量:16
20
作者 王卫东 杨静宇 《自动化学报》 EI CSCD 北大核心 2008年第4期400-407,共8页
小样本问题会造成各类协方差矩阵的奇异性和不稳定性.本文采用对训练样本进行扰动的方法来生成虚拟训练样本,利用这些虚拟训练样奉克服了各类协方差矩阵的奇异性问题,从而可以直接使用二次判别分析(Quadratic discriminant analysis,QDA... 小样本问题会造成各类协方差矩阵的奇异性和不稳定性.本文采用对训练样本进行扰动的方法来生成虚拟训练样本,利用这些虚拟训练样奉克服了各类协方差矩阵的奇异性问题,从而可以直接使用二次判别分析(Quadratic discriminant analysis,QDA)方法.本文方法克服了正则化判别分析(Regularized discriminant analysis,RDA)需要进行参数优化的问题.实验结果表明,QDA的模式识别率优于参数最优化时RDA算法的识别率. 展开更多
关键词 小样本问题 二次判别分析 虚拟训练样本 扰动方法 分类器 人脸识别
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部