孪生支持向量机(twin support vector machine,TSVM)能有效地处理交叉或异或等类型的数据.然而,当处理集值数据时,TSVM通常利用集值对象的均值、中值等统计信息.不同于TSVM,提出能直接处理集值数据的孪生支持函数机(twin support functi...孪生支持向量机(twin support vector machine,TSVM)能有效地处理交叉或异或等类型的数据.然而,当处理集值数据时,TSVM通常利用集值对象的均值、中值等统计信息.不同于TSVM,提出能直接处理集值数据的孪生支持函数机(twin support function machine,TSFM).依据集值对象定义的支持函数,TSFM在巴拿赫空间取得非平行的超平面.为了抑制集值数据中的离群点,TSFM采用了弹球损失函数并引入了集值对象的权重.考虑到TSFM是无穷维空间的优化问题,测度采用狄拉克测度的线性组合的形式,这构建有限维空间的优化模型.为了有效地求解优化模型,利用采样策略将模型转化成二次规划(quadratic programming,QP)问题并推导出二次规划问题的对偶形式,这为判断哪些采样点是支持向量提供了理论基础.为了分类集值数据,定义集值对象到巴拿赫空间的超平面的距离并由此得出判别规则.也考虑支持函数的核化以便取得数据的非线性特征,这使得提出的模型可用于不定核函数.实验结果表明,TSFM能获取交叉类型的集值数据的内在结构,并且在离群点或集值对象包含少量高维事例的情况下取得了良好的分类性能.展开更多
开集分类识别要求分类器不仅能够“辨识”已知类别的测试样本,而且还要有效地“拒识”未知类别的测试样本;在光谱分析中有关的研究与应用相对较少。改进了Ishibuchi提出的经典的闭集框架下的模糊规则多类别分类器,将其应用于开集分类识...开集分类识别要求分类器不仅能够“辨识”已知类别的测试样本,而且还要有效地“拒识”未知类别的测试样本;在光谱分析中有关的研究与应用相对较少。改进了Ishibuchi提出的经典的闭集框架下的模糊规则多类别分类器,将其应用于开集分类识别领域。首先,使用主成分分析法进行原始光谱曲线向量的光谱维度约简,降维至4维~6维的光谱特征向量。其次,将Ishibuchi提出的模糊规则多类别分类器简化为二元分类器版本,采用1-vs-1二元分类器进行分类处理,并且确定该测试样本在相应类别的得票。最后,将所有二元分类器的投票数进行统计,如果某个已知类别的得票数最高,并且该最高得票数大于预先确定的阈值τ,那么测试样本判决为该已知类别;否则就“拒识”为未知类别,从而实现了多类别的开集分类识别。在实验验证中,对于木材和芒果光谱数据集进行了分组的对比实验,结果表明,本方法优于其他的主流的开集分类识别,包括基于广义基本概率分配(generalized Basic probability assignment,GBPA)的改进的开集框架下的模糊规则多类别分类器;具有最好的评价指标F-Score,Kappa系数及总体识别率。此外,还针对芒果光谱数据集的对比实验进行了双尾McNemar s Test统计检验,进一步表明该方法相对于其他的开集分类识别方法来说,具有统计检验意义的优势。展开更多
文摘孪生支持向量机(twin support vector machine,TSVM)能有效地处理交叉或异或等类型的数据.然而,当处理集值数据时,TSVM通常利用集值对象的均值、中值等统计信息.不同于TSVM,提出能直接处理集值数据的孪生支持函数机(twin support function machine,TSFM).依据集值对象定义的支持函数,TSFM在巴拿赫空间取得非平行的超平面.为了抑制集值数据中的离群点,TSFM采用了弹球损失函数并引入了集值对象的权重.考虑到TSFM是无穷维空间的优化问题,测度采用狄拉克测度的线性组合的形式,这构建有限维空间的优化模型.为了有效地求解优化模型,利用采样策略将模型转化成二次规划(quadratic programming,QP)问题并推导出二次规划问题的对偶形式,这为判断哪些采样点是支持向量提供了理论基础.为了分类集值数据,定义集值对象到巴拿赫空间的超平面的距离并由此得出判别规则.也考虑支持函数的核化以便取得数据的非线性特征,这使得提出的模型可用于不定核函数.实验结果表明,TSFM能获取交叉类型的集值数据的内在结构,并且在离群点或集值对象包含少量高维事例的情况下取得了良好的分类性能.
文摘开集分类识别要求分类器不仅能够“辨识”已知类别的测试样本,而且还要有效地“拒识”未知类别的测试样本;在光谱分析中有关的研究与应用相对较少。改进了Ishibuchi提出的经典的闭集框架下的模糊规则多类别分类器,将其应用于开集分类识别领域。首先,使用主成分分析法进行原始光谱曲线向量的光谱维度约简,降维至4维~6维的光谱特征向量。其次,将Ishibuchi提出的模糊规则多类别分类器简化为二元分类器版本,采用1-vs-1二元分类器进行分类处理,并且确定该测试样本在相应类别的得票。最后,将所有二元分类器的投票数进行统计,如果某个已知类别的得票数最高,并且该最高得票数大于预先确定的阈值τ,那么测试样本判决为该已知类别;否则就“拒识”为未知类别,从而实现了多类别的开集分类识别。在实验验证中,对于木材和芒果光谱数据集进行了分组的对比实验,结果表明,本方法优于其他的主流的开集分类识别,包括基于广义基本概率分配(generalized Basic probability assignment,GBPA)的改进的开集框架下的模糊规则多类别分类器;具有最好的评价指标F-Score,Kappa系数及总体识别率。此外,还针对芒果光谱数据集的对比实验进行了双尾McNemar s Test统计检验,进一步表明该方法相对于其他的开集分类识别方法来说,具有统计检验意义的优势。