期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
加权SPXYE(WSPXYE)算法及其在近红外光谱模型转移中的应用 被引量:5
1
作者 郑开逸 封韬 +6 位作者 张文 黄晓玮 李志华 张迪 石吉勇 Yoshinori Marunaka 邹小波 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2021年第3期984-989,共6页
样本选择是模型转移的重要组成部分,其目的是在主光谱和从光谱中选择合适的样本,建立二者的转移模型,使得从光谱的预测样本能通过转移模型校正成类似于主光谱的样本,进而用主光谱的模型直接预测其浓度。目前,常用的样本选择算法有:Kenna... 样本选择是模型转移的重要组成部分,其目的是在主光谱和从光谱中选择合适的样本,建立二者的转移模型,使得从光谱的预测样本能通过转移模型校正成类似于主光谱的样本,进而用主光谱的模型直接预测其浓度。目前,常用的样本选择算法有:Kennard-Stone法(KS法),SPXY法和SPXYE法。根据上述算法的特点,提出了一种新的样本选择方法:加权SPXYE法(WSPXYE法),进而将其用于选择合适的转移集样本。WSPXYE同样先计算样本间的距离,其距离有三个部分组成:光谱(X)之间的归一化距离dxs,浓度(y)之间的归一化距离d_(ys),以及校正误差(e)之间的归一化距离d_(es)。其加权代数和d wspxye=αd_(xs)+βd_(ys)+(1-α-β)d_(es)即为WSPXYE距离。计算了WSPXYE距离之后,可以根据其距离选择距离较大的样本作为转移集样本。WSPXYE是Kennard-Stone法(KS法),SPXY法和SPXYE法的推广,而KS法(α=1,β=0)、SPXY法(α=0.5,β=0.5)以及SPXYE法(α=0.333,β=0.333)则是WSPXYE法的特例。直接校正法(DS)、有信息成分提取-典型相关分析法(CCA-ICE)作为模型转移算法验证了WSPXYE方法的效果。结果显示,与KS法、SPX Y法以及SPXYE法相比,WSPXYE法可以通过调节参数,选择合适的样本,获得较低的误差。 展开更多
关键词 WspxyE Kennard-Stone spxy spxyE 样本选择 模型转移
在线阅读 下载PDF
SPXY样本划分法及蒙特卡罗交叉验证结合近红外光谱用于橘叶中橙皮苷的含量测定 被引量:67
2
作者 展晓日 朱向荣 +2 位作者 史新元 张卓勇 乔延江 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2009年第4期964-968,共5页
在近红外光谱PLS定量模型的建立过程中训练集样本的选取和潜变量数的确定是十分重要的。因此,该研究以橘叶中橙皮苷的含量检测为例,分别比较了random sampling(RS),Kennard-Stone(KS),duplex,sample set partitioning based on joint x-... 在近红外光谱PLS定量模型的建立过程中训练集样本的选取和潜变量数的确定是十分重要的。因此,该研究以橘叶中橙皮苷的含量检测为例,分别比较了random sampling(RS),Kennard-Stone(KS),duplex,sample set partitioning based on joint x-y distance(SPXY)四种训练集样本的选取方法对模型的影响,以及留一交互验证法和蒙特卡罗法对潜变量数确定的影响。结果表明,SPXY法选取的训练集建立的模型优于其他三种方法,蒙特卡罗法能够较好地确定模型的潜变量数并有效地减少过拟合风险,所建模型的交互验证均方根,预测均方根及预测集相关系数分别为0.7681,0.7369,0.9752。 展开更多
关键词 近红外光谱法 训练集选择 spxy 潜变量数 蒙特卡罗法
在线阅读 下载PDF
一种利用SPXY采样的标签噪声主动清洗方法 被引量:6
3
作者 门昌骞 孟晓超 +1 位作者 姜高霞 王文剑 《小型微型计算机系统》 CSCD 北大核心 2021年第9期1865-1870,共6页
基于主动学习的标签噪声清洗方法(Active label noise cleaning,ALNC)是一种通过主动学习筛选疑似噪声样本,进而交给人工专家进行再标记的标签噪声清洗方法.虽然该方法既有很好的噪声识别效果又能保持原有数据的完整性,但仍存在人工额... 基于主动学习的标签噪声清洗方法(Active label noise cleaning,ALNC)是一种通过主动学习筛选疑似噪声样本,进而交给人工专家进行再标记的标签噪声清洗方法.虽然该方法既有很好的噪声识别效果又能保持原有数据的完整性,但仍存在人工额外标记代价较高的问题,即筛选出的疑似噪声样本中存在一定比例的正常样本.为了解决这一问题,降低标签噪声清洗过程中的人工额外检验代价,本文提出了一种基于SPXY(Sample Set Partitioning based on Joint X-Y Distance Sampling)采样的标签噪声主动清洗方法(Active label noise cleaning based on SPXY,SPXYALNC),该方法在主动学习筛选疑似噪声样本的过程中结合了SPXY采样方法,这样既考虑了样本的不确定性,又考虑了样本的代表性,并且在原有标准数据集上针对分类问题进行了实验,实验结果表明该方法在保持原有噪声识别效果的同时可以明显降低人工额外检验代价. 展开更多
关键词 标签噪声 噪声清洗 主动学习 spxy采样
在线阅读 下载PDF
基于SPXY-WT-CARS算法的草莓糖度近红外光谱检测研究 被引量:6
4
作者 张娟 《食品与发酵科技》 CAS 2020年第6期136-139,142,共5页
基于样品集划分、特征波长选择、偏最小二乘法(PLS)等基本理论,利用近红外光谱技术对草莓糖度建立定量分析模型。首先,采用光谱-理化值共生距离算法(SPXY)将草莓样品集划分为40个校正集和15个预测集。其次,采用小波变换(WT)结合竞争性... 基于样品集划分、特征波长选择、偏最小二乘法(PLS)等基本理论,利用近红外光谱技术对草莓糖度建立定量分析模型。首先,采用光谱-理化值共生距离算法(SPXY)将草莓样品集划分为40个校正集和15个预测集。其次,采用小波变换(WT)结合竞争性自适应重加权算法(CARS)对原始光谱进行分解和重构。最后,利用偏最小二乘法(PLS)建立草莓糖度预测模型。结果表明,SPXY样品集划分合理有效,有利于建立稳健的预测模型。小波变换能够有效剔除高频噪声干扰,重构得到的光谱特征波形轮廓清晰。PLS预测模型不仅能够提高模型预测精度和稳定度,而且还能降低建模变量和模型复杂度。该研究结果为实际生产中利用近红外光谱技术快速无损检测其它水果糖度提供了技术可行性。 展开更多
关键词 草莓糖度 近红外光谱 spxy算法 WT算法 CARS算法 PLS算法 特征波长
在线阅读 下载PDF
基于正交变换与SPXY样本划分的冬小麦叶绿素诊断 被引量:21
5
作者 毛博慧 孙红 +3 位作者 刘豪杰 张俊逸 李民赞 杨立伟 《农业机械学报》 EI CAS CSCD 北大核心 2017年第S1期160-165,共6页
冬小麦叶绿素含量的准确预测,可为冬小麦田间精细化管理提供依据。采集冬小麦冠层400~900 nm范围反射光谱,经一阶微分预处理后,为了抑制由于连续波长自变量多重共线性对叶绿素含量诊断模型的干扰,利用Gram-Schmidt正交变换算法初步提取... 冬小麦叶绿素含量的准确预测,可为冬小麦田间精细化管理提供依据。采集冬小麦冠层400~900 nm范围反射光谱,经一阶微分预处理后,为了抑制由于连续波长自变量多重共线性对叶绿素含量诊断模型的干扰,利用Gram-Schmidt正交变换算法初步提取叶绿素敏感波长特征参数为848、620、677 nm。在定量模型的建立过程中,对比了传统随机样本集划分与以空间中样本间距离远近为指导的SPXY样本集划分方法,并讨论了大田冠层反射光谱对叶绿素浓度诊断的最优精度,研究结果表明,以620 nm和677 nm两个敏感波长结合SPXY样本划分方法建立的多元线性回归模型预测精度较高,且叶绿素质量浓度为0.3 mg/L分辨间隔时,建模决定系数和验证决定系数分别达0.730和0.739,可为无损检测冬小麦拔节期叶绿素含量提供技术支持。 展开更多
关键词 冬小麦 叶绿素 光谱分析 Gram-Schmidt算法 spxy样本划分
在线阅读 下载PDF
SPXY算法的西瓜可溶性固形物近红外光谱检测 被引量:41
6
作者 王世芳 韩平 +3 位作者 崔广禄 王冬 刘珊珊 赵跃 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第3期738-742,共5页
可溶性固形物(SSC)是一种综合参数,主要包括糖、酸、纤维素、矿物质等成分,对评价果实成熟度和品质具有重要意义,影响果实口感、风味及货架期。西瓜可溶性固形物含量的无损快速检测对西瓜成熟度的确定、贮藏及运输过程中西瓜内部品质监... 可溶性固形物(SSC)是一种综合参数,主要包括糖、酸、纤维素、矿物质等成分,对评价果实成熟度和品质具有重要意义,影响果实口感、风味及货架期。西瓜可溶性固形物含量的无损快速检测对西瓜成熟度的确定、贮藏及运输过程中西瓜内部品质监控具有十分重要的意义,有助于提高西瓜生产效益和市场竞争力。在西瓜可溶性固形物含量的快速无损近红外光谱检测中,近红外漫透射的方式所需光源的能量大,同时大功率透射会对水果的内部品质产生影响;采用近红外漫反射方式的研究较少,但漫反射采集所需的能量小,有助于实现仪器小型便携化,成本低,同时避免透射引起的水果品质变化。以小型西瓜为研究对象,利用JDSU便携式近红外光谱仪采集西瓜样品瓜梗、瓜脐、赤道部位的近红外反射光谱,在976, 1 186和1 453 nm附近有明显的吸收,利用偏最小二乘回归定量分析方法建立西瓜可溶性固形物的近红外光谱无损预测模型。首先,采用光谱-理化值共生距离(SPXY)算法对西瓜不同检测部位的样品集进行划分,以可溶性固形物含量为y变量,光谱为x变量,利用两种变量同时计算样品间距离,以保证最大程度表征样本分布,有效地覆盖多维向量空间,增加样本间的差异性和代表性,提高模型稳定性。将西瓜样品划分为51个校正集和15个预测集,校正集样本的SSC含量涵盖了预测集样本的SSC含量范围,且变异系数均小于9%,样品集划分合理,有助于建立稳健可靠的预测模型。其次,对比分析西瓜瓜梗、瓜脐、赤道检测部位的近红外反射光谱与可溶性固形物含量之间的定量模型的预测精度,结果得出西瓜赤道部位的反射光谱与可溶性固形物含量相关性较高,预测效果较好,预测集相关系数为0.629,预测集均方根误差为0.49%。对于不同检测部位获取的光谱信息所建立的近红外光谱SSC预测模型的精度问题,一方面与光谱的采集方式有关,另一方面与西瓜的产地、品种、成熟期等因素引起的其性状上的差异有关。在模型建立过程中根据实际情况确定西瓜的检测部位。最后,为提高西瓜赤道部位近红外反射光谱与可溶性固形物含量之间的预测模型精度,采用光谱预处理方法进行优化,结果得出经标准归一化预处理后,建立的偏最小二乘回归预测模型效果最佳,预测集相关系数为0.864,预测集均方根误差为0.33%,模型相关性较好,预测精度得到了很大提升。研究结果表明,近红外反射光谱检测小型西瓜赤道部位能很好预测其可溶性固形物含量,为实际生产中近红外光谱无损快速检测西瓜可溶性固形物含量及小型便携式仪器研发提供了技术储备。 展开更多
关键词 小型西瓜 近红外反射光谱 spxy算法 检测部位 可溶性固形物
在线阅读 下载PDF
基于多光谱遥感与SPXY的采煤沉陷水域水深反演 被引量:2
7
作者 徐阳 徐良骥 +2 位作者 张坤 王明达 吴剑飞 《赤峰学院学报(自然科学版)》 2022年第9期53-57,共5页
两淮矿区是我国大型的煤炭基地之一,经过多年的开采已形成大面积的沉陷水域,为推进水资源合理利用,水深的测量尤为关键,使用遥感反演水深的方法可高效便捷获取大范围水深数据。本文以淮南矿业集团谢桥煤矿范围内沉陷水域为研究区域,利用... 两淮矿区是我国大型的煤炭基地之一,经过多年的开采已形成大面积的沉陷水域,为推进水资源合理利用,水深的测量尤为关键,使用遥感反演水深的方法可高效便捷获取大范围水深数据。本文以淮南矿业集团谢桥煤矿范围内沉陷水域为研究区域,利用Sentinel-2B多光谱影像,研究了相对于随机样本数据集划分法(RS,Random sampling)和光谱-理化值共生距离法(SPXY,Sample set partitioning based on joint x-y distance)对线性拟合模型和神经网络模型的优化作用。实验结果表明:(1)神经网络模型在研究区域内的反演效果较为理想,随机样本数据集划分法和SPXY样本数据集划分法的决定系数分别为0.737和0.787;(2)由于水中悬浮物对光谱反射率的影响很大使得在6-9m的深水域反演效果较差,两种样本数据集划分方法构建的神经网络模型的均方根误差分别为1.178m和1.059m;(3)SPXY样本数据集划分法对构建沉陷水域水深反演模型有着优化作用,对神经网络模型的改进效果最为明显其决定系数提高了0.05,均方根误差和平均绝对误差分别降低了0.097m和0.065m。 展开更多
关键词 沉陷水域 水深反演 多光谱 spxy
在线阅读 下载PDF
SG平滑和IBPLS联合优化水中油分析方法的研究 被引量:9
8
作者 侯培国 李宁 +2 位作者 常江 王书涛 宋涛 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2015年第6期1529-1533,共5页
快速准确地检测水中矿物油的种类与含量对污染源及时排查和控制具有重要的意义,而红外光谱分析技术检测水中矿物油具有高效、快速、无污染的优势。为获得更加可靠的分析结果应用傅里叶变换衰减全反射红外光谱(FTIR-ATR)技术获取矿物油... 快速准确地检测水中矿物油的种类与含量对污染源及时排查和控制具有重要的意义,而红外光谱分析技术检测水中矿物油具有高效、快速、无污染的优势。为获得更加可靠的分析结果应用傅里叶变换衰减全反射红外光谱(FTIR-ATR)技术获取矿物油样品的光谱信息,采用SPXY法划分样本集。对偏最小二乘法(PLS)和迭代Bagging偏最小二乘法(IBPLS)这两种建立回归模型的方法进行对比分析,还比较了采用Savitzky-Golay(SG)平滑方法与迭代Bagging偏最小二乘法(IBPLS)相结合和单一采用迭代Bagging偏最小二乘法建立回归模型的区别。通过对预测回归曲线进行对比,得出通过SG平滑的预测效果明显优于未做的。而且采用SG平滑方法和IBPLS相结合的方法建立回归模型时,汽油模型参数RMSEP为0.001 125g·mL-1,r为0.992 5;柴油模型参数RMSEP为0.001 384g·mL-1,r为0.989 3。 展开更多
关键词 矿物油检测 FTIR-ATR spxy SG平滑 迭代Bagging偏最小二乘法
在线阅读 下载PDF
不同分集方法对牛肉嫩度高光谱检测模型的比较 被引量:8
9
作者 朱荣光 段宏伟 +2 位作者 王龙 姚雪东 许程剑 《食品与发酵工业》 CAS CSCD 北大核心 2016年第4期189-192,共4页
选用牛肉嫩度作为研究对象,开展了4种不同样品集划分方法的选取对其高光谱模型的影响研究。首先选取了70个具有代表性的牛肉样品并提取其肌肉感兴趣区域(ROIs)的光谱,比较分析了浓度梯度法(C-G)、随机法(R-S)、Kennard-Stone(K-S)和光谱... 选用牛肉嫩度作为研究对象,开展了4种不同样品集划分方法的选取对其高光谱模型的影响研究。首先选取了70个具有代表性的牛肉样品并提取其肌肉感兴趣区域(ROIs)的光谱,比较分析了浓度梯度法(C-G)、随机法(R-S)、Kennard-Stone(K-S)和光谱-理化值共生矩阵法(SPXY)获取的校正集建立的牛肉嫩度PCR和PLSR模型效果。结果表明:在PCR和PLSR中,SPXY均为最适的样品分集方法,并且4种样品集划分方法下的PLSR模型效果均较优。最优模型SPXY-PLSR校正集的相关系数(Rcal)和均方根误差(RMSEC)分别为0.94和0.48,预测集的相关系数(Rp)和均方根误差(RMSEP)分别为0.93和0.63。研究表明SPXY方法结合高光谱PLSR模型能够实现牛肉嫩度的快速无损检测。 展开更多
关键词 高光谱图像(HSI) 牛肉嫩度 分集方法 spxy
在线阅读 下载PDF
近红外光谱结合不同偏最小二乘法测定乳块消片醇沉液中丹参素和橙皮苷含量 被引量:13
10
作者 刘冰 毕开顺 +3 位作者 孙立新 史新元 乔延江 刘珍清 《世界科学技术-中医药现代化》 2009年第3期388-394,共7页
目的:应用近红外分析技术结合化学计量学方法建立中药乳块消片醇沉液中丹参素和橙皮苷含量测定的新方法。方法:采用Sample set Partitioning based on jointx-ydistance(SPXY)法对训练集样本和预测集样本进行划分,应用不同的偏最小二乘... 目的:应用近红外分析技术结合化学计量学方法建立中药乳块消片醇沉液中丹参素和橙皮苷含量测定的新方法。方法:采用Sample set Partitioning based on jointx-ydistance(SPXY)法对训练集样本和预测集样本进行划分,应用不同的偏最小二乘方法进行有效波段范围选择以及建立定量校正模型,分别比较了间隔偏最小二乘算法(interval partial least squares,iPLS),组合间隔偏最小二乘算法(Synergy interval partial least squares,SiPLS),向后间隔偏最小二乘算法(backward interval partial least squares,BiPLS),窗口移动偏最小二乘算法(moving window partial least squares,MWPLS)。结果:丹参素采用SiPLS三个区间组合、橙皮苷采用SiPLS四个区间组合建立的回归模型性能最好,预测相关系数(R)分别为0.9956和0.9940,交互验证误差均方根(RMSECV)分别为0.0096和0.0083,预测误差均方根(RMSEP)为0.0062和0.0074。结论:该近红外光谱法对丹参素和橙皮苷含量预测结果较好,且方便快捷、无前期预处理和无污染,为中药生产过程的在线检测提供了依据。 展开更多
关键词 近红外光谱法 丹参素 橙皮苷 spxy 偏最小二乘法 在线检测
暂未订购
虫害胁迫下毛竹叶绿素含量高光谱估算方法 被引量:11
11
作者 李凯 陈芸芝 +3 位作者 许章华 黄旭影 胡新宇 汪小钦 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2020年第8期2578-2583,共6页
叶绿素作为参与植被光合作用最重要的色素,是监测毛竹虫害的一项重要指标。通过对不同光谱数据集进行波长筛选,建立虫害胁迫下竹叶叶绿素含量的高光谱估算模型,为利用高光谱遥感监测毛竹虫害提供理论依据。试验在福建省毛竹生产基地顺... 叶绿素作为参与植被光合作用最重要的色素,是监测毛竹虫害的一项重要指标。通过对不同光谱数据集进行波长筛选,建立虫害胁迫下竹叶叶绿素含量的高光谱估算模型,为利用高光谱遥感监测毛竹虫害提供理论依据。试验在福建省毛竹生产基地顺昌县进行,使用ASD FieldSpec 3光谱仪采集不同虫害程度竹叶光谱102条,并利用SPAD-502叶绿素计测定相应叶片叶绿素含量。通过对比不同虫害程度竹叶的光谱特征,探测利用高光谱数据估算叶绿素含量的机理。对竹叶原始光谱(OS)进行包络线去除(CR)、一阶导数(FD)、包络线去除一阶导数(CR-FD)变换,分析不同光谱数据与叶绿素含量的相关性,并利用连续投影算法(SPA)分别提取4种光谱的特征波长。采用基于x-y距离结合的样本划分法(SPXY)和随机法对4种光谱数据集进行划分,结合多元逐步回归(MSR)建立竹叶叶绿素含量估算模型,分析光谱变换及样本划分对估算叶绿素含量的影响。结果表明,不同虫害程度竹叶光谱反射率差异明显,主要表现为可见光波段范围内的"绿峰"和"红谷"的逐渐消失,"红边"斜率减小,近红外波长反射率降低。通过光谱变换可有效提升光谱与叶绿素含量的相关性,其中CR-FD光谱与叶绿素含量在724 nm处的相关系数最大。经连续投影算法提取的不同光谱数据集的特征波长集中分布在绿光、红光、"红边"位置,多个被选择波长位于与叶绿素含量相关性较高的波长区(600~750 nm)。基于SPXY样本划分法建立的MSR模型相比于随机样本划分法能显著提升叶绿素含量的估算精度,其中R^2和RPD平均提高0.1和0.5, RMSE平均降低0.7。以CR-FD光谱特征波长结合SPXY样本划分法建立的多元逐步回归模型对竹叶叶绿素含量的估算精度最高,R^2, RMSE和RPD分别为0.835, 2.604和2.364,可对虫害胁迫下毛竹叶片叶绿素含量进行准确的估算。 展开更多
关键词 叶绿素含量 高光谱 光谱变换 波长筛选 spxy样本划分
在线阅读 下载PDF
基于CARS变量选择方法的小麦硬度测定研究 被引量:3
12
作者 姜明伟 王彩红 张庆辉 《河南工业大学学报(自然科学版)》 CAS 北大核心 2020年第6期91-95,105,共6页
为满足快速测定小麦硬度的需求,实现对未知小麦样本硬度的快速、无损检测,建立了小麦硬度预测模型。利用蒙特卡洛交叉验证统计规律对小麦硬度光谱数据进行识别,剔除异常样本。为获得具有代表性的小麦硬度预测集和校正集,基于光谱理化值... 为满足快速测定小麦硬度的需求,实现对未知小麦样本硬度的快速、无损检测,建立了小麦硬度预测模型。利用蒙特卡洛交叉验证统计规律对小麦硬度光谱数据进行识别,剔除异常样本。为获得具有代表性的小麦硬度预测集和校正集,基于光谱理化值共生距离法对小麦光谱数据进行集合划分,并获得预测集样本。对光谱数据进行一阶导数预处理,消除获取的小麦光谱数据中包含的高频噪声、基线漂移、样本背景等无关信息,减弱了各非目标因素对检测模型的影响。基于竞争性自适应重加权算法,筛选对模型有用的波长变量,从而提高预测模型的稳定性和预测性。建立偏最小二乘法的小麦硬度预测模型(CARS-PLS模型),该模型评价参数预测相关系数(R)和预测均方根误差(RMSEP)分别达到0.8843和0.5436,表明基于近红外光谱的CARS-PLS预测模型能够准确预测小麦硬度。 展开更多
关键词 预处理 spxy CARS-PLS模型 蒙特卡洛交叉验证法 模型评价参数
在线阅读 下载PDF
可见-近红外反射光谱检测小米糊化特性 被引量:4
13
作者 吴建虎 李桂峰 +3 位作者 彭彦昆 杜俊杰 徐建国 郜刚 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2020年第10期3247-3253,共7页
糊化特性是小米的最重要加工特性之一,对小米的加工性能及产品质量有重要的影响。基于可见-近红外光谱特征信息,在不粉碎小米颗粒的状态下,提出了一种快速无损检测小米的糊化特性的方法。首先,获取小米在370~1020 nm范围内漫反射光谱后... 糊化特性是小米的最重要加工特性之一,对小米的加工性能及产品质量有重要的影响。基于可见-近红外光谱特征信息,在不粉碎小米颗粒的状态下,提出了一种快速无损检测小米的糊化特性的方法。首先,获取小米在370~1020 nm范围内漫反射光谱后,将小米粉碎成小米粉,使用RAV快速粘度分析仪测定小米粉的峰值粘度(PV)、最低粘度(TV)、衰减值(BD)、最终粘度(FV)、和回升值(SB)、糊化温度(GT)以及峰值时间(PT)等7个糊化特性指标。然后,对原始光谱进行Savitzkye-Golay(SG)平滑、多元散射校正(MSC)和一阶导数法(1-D)预处理。最后,结合三种处理光谱和小米糊化特性指标值,通过Sample set partitioning based on joint x-y distances(SPXY)方法确定样本的校正集和验证集;基于连续投影算法(SPA)选择了特征波长,利用特征波长反射光谱信号建立了小米糊化特性指标的多元线性回归(MLR)预测模型,并使用验证集样本验证MLR模型的预测准确性。糊化指标预测结果:对于粘度指标中的PV、TV和SB参数值,经过MSC预处理后光谱,分别选择了9,17和18个特征波长建立的MLR模型的预测结果最好,预测相关系数(R p)分别为0.9347,0.8255和0.8746,预测误差(SEP)分别为174.0397,67.2203和74.2818;对于BD值,经过S-G预处理后选择了14个特征波长的MLR模型预测结果最好,R p为0.9244,SEP为178.0201;此外,对于FV参数值,经过1-D处理后选择了16个特征波长所建立MLR模型的预测相关系数R p为0.8531,SEP为132.1667。研究结果表明,利用可见-近红外光谱结合SPXY和SPA算法在不粉碎小米的状态下对其糊化特性进行检测是可行的。本研究为小米产品相关企业在生产前期,通过快速测定小米原料糊化特性,进而评估产品加工品质提供一种新的技术手段,具有较强的实际应用潜力。 展开更多
关键词 小米 糊化特性 可见-近红外反射光谱 spxy算法 SPA算法
在线阅读 下载PDF
近红外光谱法快速测定液态奶中蛋白质和脂肪含量 被引量:21
14
作者 朱向荣 单杨 +1 位作者 李高阳 苏东林 《食品科学》 EI CAS CSCD 北大核心 2011年第12期191-195,共5页
采用近红外光谱法结合化学计量学方法测定液态奶中蛋白质和脂肪的含量,比较分析随机法(randomsampling,RS)、kennard-stone(KS)、Duplex、基于x-y距离结合的样本划分方法(sample set partitioning based onjoint x-y distance,SPXY)4种... 采用近红外光谱法结合化学计量学方法测定液态奶中蛋白质和脂肪的含量,比较分析随机法(randomsampling,RS)、kennard-stone(KS)、Duplex、基于x-y距离结合的样本划分方法(sample set partitioning based onjoint x-y distance,SPXY)4种训练集和预测集样本划分方法,使用Haaland法对异常值进行剔除,并对光谱预处理方法进行讨论。所建立的脂肪模型交叉验证均方根(RMSECV)与预测均方根(RMSEP)分别为2.434和2.099,预测集的决定系数Rp2为0.964;蛋白质模型的RMSECV与RMSEP分别为2.270和2.564,Rp2为0.940。结果表明,该方法快速、准确,可为液态奶的现场质量控制提供了有效途径。 展开更多
关键词 液态奶 近红外光谱 spxy Haaland法
在线阅读 下载PDF
利用VIS/NIR反射光谱快速检测柿饼加工中水分含量 被引量:1
15
作者 赵鹏瑶 彭月梅 吴建虎 《农产品加工》 2021年第17期49-52,56,共5页
水分是柿饼的重要组成成分,也是影响柿饼制作过程的重要因素。利用可见/近红外反射光谱对柿饼制作过程中的水分含量进行检测。首先,获取柿饼在不同加工阶段的可见/近红外反射光谱(400~1000 nm),采用烘干法测定柿饼水分含量。然后,对光... 水分是柿饼的重要组成成分,也是影响柿饼制作过程的重要因素。利用可见/近红外反射光谱对柿饼制作过程中的水分含量进行检测。首先,获取柿饼在不同加工阶段的可见/近红外反射光谱(400~1000 nm),采用烘干法测定柿饼水分含量。然后,对光谱进行Mean smoothing(MS)平滑、多元散射校正(MSC)和一阶导数(1-D)预处理。最后,对不同预处理光谱,结合样本水分含量,使用Samples set partitioning based on joint x-y distance(SPXY)方法划分校正集和验证集,基于SPA方法选择特征波长,建立多元线性回归(MLR)预测模型。结果表明,反射光谱经过MS处理后,确定的9个最优波长组合建立水分检测模型的预测结果最好:预测相关系数(Rp)为0.9690,预测标准残差(SEP)为3.4729%,可见/近红外反射光谱技术可以较好地预测柿饼制作过程中的的水分含量。研究可为柿饼加工过程中的品质快速检测提供一定的技术支撑。 展开更多
关键词 柿饼 水分含量 VIS/NIR光谱反射 spxy算法 SPA算法
在线阅读 下载PDF
可见近红外光谱的山西玉米地土壤氮含量建模 被引量:1
16
作者 马玮键 邢泽炳 +3 位作者 韩春风 桑梓繁 尚恺霖 李宇航 《山西农业科学》 2023年第7期750-755,共6页
土壤的粒度、水分等因素均会影响土壤的光谱特征,不同地区土壤因不同的气候和地理条件导致其土壤光谱特征存在差异,利用近红外光谱技术建立的土壤成分预测模型往往也有其特殊性。为了为后续开发基于近红外光谱技术的土壤氮含量速测仪提... 土壤的粒度、水分等因素均会影响土壤的光谱特征,不同地区土壤因不同的气候和地理条件导致其土壤光谱特征存在差异,利用近红外光谱技术建立的土壤成分预测模型往往也有其特殊性。为了为后续开发基于近红外光谱技术的土壤氮含量速测仪提供参考,以山西玉米地土壤为研究对象,利用可见近红外光谱快速分析技术预测土壤氮含量,试验采集山西农业大学玉米试验田土壤样本120个,并测定总氮含量和采集可见近红外光谱。利用光谱-理化值共生距离(SPXY)算法按2∶1的比例划分校正集和预测集,分析采用平滑处理(Smoothing)、标准状态变换(SNV)、基线校正(Baseline)、去趋势处理(Detrend)、归一化(Normalize)和多元散射矫正(MSC)6种预处理方法并结合偏最小二乘法(PLS)、支持向量机(SVM)、主成分回归(PCR)3种建模方法建立土壤氮含量预测模型的效果,并选出最佳预测模型。结果显示,在所建立的21种预测模型中,采用Smoothing预处理方法并结合PLS建立的预测模型效果最佳,其决定系数为0.907,预测均方根误差(RMSEP)为0.086。此预测模型可有效预测山西玉米地的土壤氮含量。 展开更多
关键词 土壤 可见近红外光谱 全氮 光谱-理化值共生距离算法 快速检测 山西玉米地
在线阅读 下载PDF
校正样品的选择对南疆红枣水分NIR定量模型的影响研究 被引量:3
17
作者 石鲁珍 张景川 +2 位作者 蒋霞 陈杰 白铁成 《食品科技》 CAS 北大核心 2016年第1期82-85,共4页
研究校正样品对近红外光谱分析的影响为目的,以南疆灰枣为研究对象,通过比较4种不同的校正样品选择方法,及同一种方法选择的不同校正样品数量得到的模型预测能力的好坏。结果表明:SPXY方法选择的校正样品建立的模型预测能力最强,且151... 研究校正样品对近红外光谱分析的影响为目的,以南疆灰枣为研究对象,通过比较4种不同的校正样品选择方法,及同一种方法选择的不同校正样品数量得到的模型预测能力的好坏。结果表明:SPXY方法选择的校正样品建立的模型预测能力最强,且151个灰枣原始样本中选择138个作为校正集得到的模型预测标准偏差SEP为1.2562,预测相关系数RP为0.9471,其模型的预测效果最佳。 展开更多
关键词 校正集 spxy方法 近红外光谱 红枣
原文传递
On Splitting Training and Validation Set:A Comparative Study of Cross-Validation,Bootstrap and Systematic Sampling for Estimating the Generalization Performance of Supervised Learning 被引量:11
18
作者 Yun Xu Royston Goodacre 《Journal of Analysis and Testing》 EI 2018年第3期249-262,共14页
Model validation is the most important part of building a supervised model.For building a model with good generalization performance one must have a sensible data splitting strategy,and this is crucial for model valid... Model validation is the most important part of building a supervised model.For building a model with good generalization performance one must have a sensible data splitting strategy,and this is crucial for model validation.In this study,we con-ducted a comparative study on various reported data splitting methods.The MixSim model was employed to generate nine simulated datasets with different probabilities of mis-classification and variable sample sizes.Then partial least squares for discriminant analysis and support vector machines for classification were applied to these datasets.Data splitting methods tested included variants of cross-validation,bootstrapping,bootstrapped Latin partition,Kennard-Stone algorithm(K-S)and sample set partitioning based on joint X-Y distances algorithm(SPXY).These methods were employed to split the data into training and validation sets.The estimated generalization performances from the validation sets were then compared with the ones obtained from the blind test sets which were generated from the same distribution but were unseen by the train-ing/validation procedure used in model construction.The results showed that the size of the data is the deciding factor for the qualities of the generalization performance estimated from the validation set.We found that there was a significant gap between the performance estimated from the validation set and the one from the test set for the all the data splitting methods employed on small datasets.Such disparity decreased when more samples were available for training/validation,and this is because the models were then moving towards approximations of the central limit theory for the simulated datasets used.We also found that having too many or too few samples in the training set had a negative effect on the estimated model performance,suggesting that it is necessary to have a good balance between the sizes of training set and validation set to have a reliable estimation of model performance.We also found that systematic sampling method such as K-S and SPXY generally had very poor estimation of the model performance,most likely due to the fact that they are designed to take the most representative samples first and thus left a rather poorly representative sample set for model performance estimation. 展开更多
关键词 Cross-validation BOOTSTRAPPING Bootstrapped Latin partition Kennard-Stone algorithm spxy Model selection Model validation Partial least squares for discriminant analysis Support vector machines
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部