针对无法直接获取训练样本的遥感影像分类问题,从满足条件的其他影像中选择替代训练样本是最直接的方法,但由于地物类型在不同影像中的辐射环境不同,导致替代训练样本对待分类影像的代表性较差,无法保证分类精度。以直推式支持向量机(tr...针对无法直接获取训练样本的遥感影像分类问题,从满足条件的其他影像中选择替代训练样本是最直接的方法,但由于地物类型在不同影像中的辐射环境不同,导致替代训练样本对待分类影像的代表性较差,无法保证分类精度。以直推式支持向量机(transductive support vector machine,TSVM)分类为例,发展了一种基于半监督学习的遥感影像训练样本时空拓展方法。该方法采用非监督方法从待分类影像中选择大量未标记样本,挖掘各类地物在特征空间中的结构信息;以替代训练样本所拟合的分类面为初始面,通过自适应渐进式的优化,实现对待分类影像的高精度分类。该方法要求训练样本的来源影像与待分类影像具有相似的地物分布和相近的时相。以SPOT5和QuickBird影像分类为例,分别通过基于像元的和基于分割对象的分类实验证实,该文提出的方法可有效地实现训练样本的时空拓展应用。展开更多
为了提高机器学习在大数据集中的学习性能,提出了一种基于局部敏感Hash的半监督支持向量机增量学习算法.首先利用局部敏感Hash能快速查找相似数据特性的能力,筛选出第一次增量中与有标签样本相似的样本,通过TSVM(Transductive support v...为了提高机器学习在大数据集中的学习性能,提出了一种基于局部敏感Hash的半监督支持向量机增量学习算法.首先利用局部敏感Hash能快速查找相似数据特性的能力,筛选出第一次增量中与有标签样本相似的样本,通过TSVM(Transductive support vector machine)得到支持向量并筛选出再次增量中有可能成为支持向量的无标记样本,然后与已有支持向量和有标签样本一起作为后续训练的基础,最后使用多个数据集对算法进行验证.实验表明:提出的半监督TSVM增量学习算法能有效地提高训练学习的速度和分类准确率.展开更多
网络入侵检测技术是入侵检测领域研究的热点内容,但仍然存在误报率较高、对建立检测模型的数据要求过高、在缺乏足够训练数据的"小样本"环境下检测性能明显下降等问题.基于TSVM分类机器学习算法,提出了一种有指导的网络入侵...网络入侵检测技术是入侵检测领域研究的热点内容,但仍然存在误报率较高、对建立检测模型的数据要求过高、在缺乏足够训练数据的"小样本"环境下检测性能明显下降等问题.基于TSVM分类机器学习算法,提出了一种有指导的网络入侵检测新方法,能够高效地检测网络入侵.通过基于著名的KDD Cup 1999数据集的实验,表明其相对于传统的入侵检测方法具有较高的检测率和较低的误报率;特别是在采用"小样本"训练集的情况下,其仍能保证较高的检测性能.展开更多
邮件作者身份分类技术尝试根据邮件作者的写作特征自动把邮件分类到预定的作者类别中,但是,无论是个人或公司不可能提供非常大的训练集,因此,本文采用对小样本数据分类效果较好的"交换支持向量机"(TSVM,transductive support ...邮件作者身份分类技术尝试根据邮件作者的写作特征自动把邮件分类到预定的作者类别中,但是,无论是个人或公司不可能提供非常大的训练集,因此,本文采用对小样本数据分类效果较好的"交换支持向量机"(TSVM,transductive support vector machines)做分类学习算法.本文对TSVM的原理进行了介绍,并通过实验与普通支持向量机分类学习算法进行了比较,结果表明TSVM对小样本分类效果较好,适合邮件作者身份分类技术的研究.展开更多
分类算法应用于图像检索中,可有效解决图像检索中的分类问题,缩小低层特征与高层特征之间的鸿沟,提高检索精度。以图像颜色与纹理特征并结合图像分块特征作为低层综合特征,借鉴词袋(Bag of Words)模型,利用K均值(K-means)聚类算法,分别...分类算法应用于图像检索中,可有效解决图像检索中的分类问题,缩小低层特征与高层特征之间的鸿沟,提高检索精度。以图像颜色与纹理特征并结合图像分块特征作为低层综合特征,借鉴词袋(Bag of Words)模型,利用K均值(K-means)聚类算法,分别采用支持向量机(SVM)、直推式支持向量机(TSVM)以及极限学习机(ELM)三种学习机制,对corel图像库进行分类检索。实验表明,ELM分类器的识别准确率高于SVM和TSVM分类器,且检索速度快。展开更多
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向.本文介绍了当今世界上较先进的"变换支持向量机"(TSVM,transductive support vectormachines)技术,它与...随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向.本文介绍了当今世界上较先进的"变换支持向量机"(TSVM,transductive support vectormachines)技术,它与普通的"支持向量机"(SVM)相比,TSVM方法所需的样本量大大降低,它能有效地对小样本数据集进行分类,同时重点分析了实现它的关键技术、算法及其实现过程.展开更多
In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficie...In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficient and effective searching environment for users to query their images more easily. In this paper,a semi-supervised learning based probabilistic latent semantic analysis( PLSA) model for automatic image annotation is presenred. Since it's often hard to obtain or create labeled images in large quantities while unlabeled ones are easier to collect,a transductive support vector machine( TSVM) is exploited to enhance the quality of the training image data. Then,different image features with different magnitudes will result in different performance for automatic image annotation. To this end,a Gaussian normalization method is utilized to normalize different features extracted from effective image regions segmented by the normalized cuts algorithm so as to reserve the intrinsic content of images as complete as possible. Finally,a PLSA model with asymmetric modalities is constructed based on the expectation maximization( EM) algorithm to predict a candidate set of annotations with confidence scores. Extensive experiments on the general-purpose Corel5k dataset demonstrate that the proposed model can significantly improve performance of traditional PLSA for the task of automatic image annotation.展开更多
正交频分复用系统(Orthogonal Frequency Division Multiplexing,OFDM)的信道估计是进行相干解调的前提,通常采用孪生支持向量机(Twin Support Vector Machines,TSVM)对信道参数进行估计。提出的算法利用TSVM适用于非线性函数回归的特点...正交频分复用系统(Orthogonal Frequency Division Multiplexing,OFDM)的信道估计是进行相干解调的前提,通常采用孪生支持向量机(Twin Support Vector Machines,TSVM)对信道参数进行估计。提出的算法利用TSVM适用于非线性函数回归的特点,提高信道参数的回归性能。在信道估计过程中,利用最小二乘算法对导频位置处的信道参数进行估计,得到对TSVM的训练样本,然后通过求解TSVM的二次优化问题得到OFDM系统的信道参数。理论分析和仿真实验结果显示,提出的孪生支持向量机信道估计算法与其他算法相比具有良好的估计性能和抗噪声能力。展开更多
文摘针对无法直接获取训练样本的遥感影像分类问题,从满足条件的其他影像中选择替代训练样本是最直接的方法,但由于地物类型在不同影像中的辐射环境不同,导致替代训练样本对待分类影像的代表性较差,无法保证分类精度。以直推式支持向量机(transductive support vector machine,TSVM)分类为例,发展了一种基于半监督学习的遥感影像训练样本时空拓展方法。该方法采用非监督方法从待分类影像中选择大量未标记样本,挖掘各类地物在特征空间中的结构信息;以替代训练样本所拟合的分类面为初始面,通过自适应渐进式的优化,实现对待分类影像的高精度分类。该方法要求训练样本的来源影像与待分类影像具有相似的地物分布和相近的时相。以SPOT5和QuickBird影像分类为例,分别通过基于像元的和基于分割对象的分类实验证实,该文提出的方法可有效地实现训练样本的时空拓展应用。
文摘为了提高机器学习在大数据集中的学习性能,提出了一种基于局部敏感Hash的半监督支持向量机增量学习算法.首先利用局部敏感Hash能快速查找相似数据特性的能力,筛选出第一次增量中与有标签样本相似的样本,通过TSVM(Transductive support vector machine)得到支持向量并筛选出再次增量中有可能成为支持向量的无标记样本,然后与已有支持向量和有标签样本一起作为后续训练的基础,最后使用多个数据集对算法进行验证.实验表明:提出的半监督TSVM增量学习算法能有效地提高训练学习的速度和分类准确率.
文摘网络入侵检测技术是入侵检测领域研究的热点内容,但仍然存在误报率较高、对建立检测模型的数据要求过高、在缺乏足够训练数据的"小样本"环境下检测性能明显下降等问题.基于TSVM分类机器学习算法,提出了一种有指导的网络入侵检测新方法,能够高效地检测网络入侵.通过基于著名的KDD Cup 1999数据集的实验,表明其相对于传统的入侵检测方法具有较高的检测率和较低的误报率;特别是在采用"小样本"训练集的情况下,其仍能保证较高的检测性能.
文摘邮件作者身份分类技术尝试根据邮件作者的写作特征自动把邮件分类到预定的作者类别中,但是,无论是个人或公司不可能提供非常大的训练集,因此,本文采用对小样本数据分类效果较好的"交换支持向量机"(TSVM,transductive support vector machines)做分类学习算法.本文对TSVM的原理进行了介绍,并通过实验与普通支持向量机分类学习算法进行了比较,结果表明TSVM对小样本分类效果较好,适合邮件作者身份分类技术的研究.
文摘分类算法应用于图像检索中,可有效解决图像检索中的分类问题,缩小低层特征与高层特征之间的鸿沟,提高检索精度。以图像颜色与纹理特征并结合图像分块特征作为低层综合特征,借鉴词袋(Bag of Words)模型,利用K均值(K-means)聚类算法,分别采用支持向量机(SVM)、直推式支持向量机(TSVM)以及极限学习机(ELM)三种学习机制,对corel图像库进行分类检索。实验表明,ELM分类器的识别准确率高于SVM和TSVM分类器,且检索速度快。
文摘随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向.本文介绍了当今世界上较先进的"变换支持向量机"(TSVM,transductive support vectormachines)技术,它与普通的"支持向量机"(SVM)相比,TSVM方法所需的样本量大大降低,它能有效地对小样本数据集进行分类,同时重点分析了实现它的关键技术、算法及其实现过程.
基金Supported by the National Program on Key Basic Research Project(No.2013CB329502)the National Natural Science Foundation of China(No.61202212)+1 种基金the Special Research Project of the Educational Department of Shaanxi Province of China(No.15JK1038)the Key Research Project of Baoji University of Arts and Sciences(No.ZK16047)
文摘In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficient and effective searching environment for users to query their images more easily. In this paper,a semi-supervised learning based probabilistic latent semantic analysis( PLSA) model for automatic image annotation is presenred. Since it's often hard to obtain or create labeled images in large quantities while unlabeled ones are easier to collect,a transductive support vector machine( TSVM) is exploited to enhance the quality of the training image data. Then,different image features with different magnitudes will result in different performance for automatic image annotation. To this end,a Gaussian normalization method is utilized to normalize different features extracted from effective image regions segmented by the normalized cuts algorithm so as to reserve the intrinsic content of images as complete as possible. Finally,a PLSA model with asymmetric modalities is constructed based on the expectation maximization( EM) algorithm to predict a candidate set of annotations with confidence scores. Extensive experiments on the general-purpose Corel5k dataset demonstrate that the proposed model can significantly improve performance of traditional PLSA for the task of automatic image annotation.
文摘正交频分复用系统(Orthogonal Frequency Division Multiplexing,OFDM)的信道估计是进行相干解调的前提,通常采用孪生支持向量机(Twin Support Vector Machines,TSVM)对信道参数进行估计。提出的算法利用TSVM适用于非线性函数回归的特点,提高信道参数的回归性能。在信道估计过程中,利用最小二乘算法对导频位置处的信道参数进行估计,得到对TSVM的训练样本,然后通过求解TSVM的二次优化问题得到OFDM系统的信道参数。理论分析和仿真实验结果显示,提出的孪生支持向量机信道估计算法与其他算法相比具有良好的估计性能和抗噪声能力。