随着近红外光谱检测仪种类的增多,不同仪器间的校正模型存在无法共享问题,可利用模型传递解决。以食用油为研究对象,在主机上建立油酸质量比的极限学习机校正模型,利用迁移学习中的TrAdaBoost算法把主机模型传递到从机上,探讨标准化样...随着近红外光谱检测仪种类的增多,不同仪器间的校正模型存在无法共享问题,可利用模型传递解决。以食用油为研究对象,在主机上建立油酸质量比的极限学习机校正模型,利用迁移学习中的TrAdaBoost算法把主机模型传递到从机上,探讨标准化样品数量对模型传递效果的影响,并与直接标准化算法、缺损数据重构算法和极限学习机自编码器的模型传递算法进行对比。结果表明:主机模型经TrAdaBoost算法模型传递后,从机预测集决定系数R^(2)从0.489上升到0.892,预测集均方根误差(Root mean square error of prediction,RMSEP)从4.824 mg/g下降到0.267 mg/g,且模型效果几乎不受标准化样品数量的影响。说明TrAdaBoost算法可以有效应用于模型传递领域,实现了不同光谱仪器之间的共享。展开更多
地质灾害易发性评价对防灾减灾至关重要,但镇域常因样本稀缺导致评价因子权重难以确定。以陕西省安康市镇坪县城关镇(目标域)为例,提出基于迁移学习的地质灾害易发性预测模型。采用TrAdaBoost算法,将镇坪县全域数据(源域)与城关镇数据结...地质灾害易发性评价对防灾减灾至关重要,但镇域常因样本稀缺导致评价因子权重难以确定。以陕西省安康市镇坪县城关镇(目标域)为例,提出基于迁移学习的地质灾害易发性预测模型。采用TrAdaBoost算法,将镇坪县全域数据(源域)与城关镇数据结合,以CatBoost为基准学习器构建TrAdaBoost-CatBoost模型,实现知识迁移。结果表明:迁移策略显著提升了目标域性能,TrAdaBoost-CatBoost模型受试者工作特征曲线(receiver operating characteristic curve,ROC)下面积(area under the curve,AUC)达0.96,较仅用城关镇数据的CatBoost模型ROC曲线AUC(0.94)提升了0.02;与传统模型对比,TrAdaBoost-CatBoost模型ROC曲线AUC显著优于支持向量机(support vector machine,SVM)模型ROC曲线AUC(0.92)和随机森林(random forest,RF)模型ROC曲线AUC(0.93),分别高出0.04和0.03;迁移框架具普适性,TrAdaBoost-SVM模型ROC曲线AUC为0.94(较SVM模型ROC曲线AUC提升了0.02),TrAdaBoost-RF模型ROC曲线AUC为0.95(较RF模型的AUC提升了0.02),两者性能均得到提升,但TrAdaBoost-CatBoost模型(AUC=0.96)仍保持最优。该模型为小样本区域地质灾害评价提供了高精度解决方案,验证了迁移学习在数据稀缺场景的有效性,对类似区域灾害风险防控具有实际参考意义。展开更多
文摘随着近红外光谱检测仪种类的增多,不同仪器间的校正模型存在无法共享问题,可利用模型传递解决。以食用油为研究对象,在主机上建立油酸质量比的极限学习机校正模型,利用迁移学习中的TrAdaBoost算法把主机模型传递到从机上,探讨标准化样品数量对模型传递效果的影响,并与直接标准化算法、缺损数据重构算法和极限学习机自编码器的模型传递算法进行对比。结果表明:主机模型经TrAdaBoost算法模型传递后,从机预测集决定系数R^(2)从0.489上升到0.892,预测集均方根误差(Root mean square error of prediction,RMSEP)从4.824 mg/g下降到0.267 mg/g,且模型效果几乎不受标准化样品数量的影响。说明TrAdaBoost算法可以有效应用于模型传递领域,实现了不同光谱仪器之间的共享。
文摘地质灾害易发性评价对防灾减灾至关重要,但镇域常因样本稀缺导致评价因子权重难以确定。以陕西省安康市镇坪县城关镇(目标域)为例,提出基于迁移学习的地质灾害易发性预测模型。采用TrAdaBoost算法,将镇坪县全域数据(源域)与城关镇数据结合,以CatBoost为基准学习器构建TrAdaBoost-CatBoost模型,实现知识迁移。结果表明:迁移策略显著提升了目标域性能,TrAdaBoost-CatBoost模型受试者工作特征曲线(receiver operating characteristic curve,ROC)下面积(area under the curve,AUC)达0.96,较仅用城关镇数据的CatBoost模型ROC曲线AUC(0.94)提升了0.02;与传统模型对比,TrAdaBoost-CatBoost模型ROC曲线AUC显著优于支持向量机(support vector machine,SVM)模型ROC曲线AUC(0.92)和随机森林(random forest,RF)模型ROC曲线AUC(0.93),分别高出0.04和0.03;迁移框架具普适性,TrAdaBoost-SVM模型ROC曲线AUC为0.94(较SVM模型ROC曲线AUC提升了0.02),TrAdaBoost-RF模型ROC曲线AUC为0.95(较RF模型的AUC提升了0.02),两者性能均得到提升,但TrAdaBoost-CatBoost模型(AUC=0.96)仍保持最优。该模型为小样本区域地质灾害评价提供了高精度解决方案,验证了迁移学习在数据稀缺场景的有效性,对类似区域灾害风险防控具有实际参考意义。