摘要
传统甘蔗糖分含量检测相对困难,目前已经越来越多地将人工智能算法运用到甘蔗糖分检测当中。采用5种机器学习算法(决策树、支持向量机、逻辑回归、xgboost、AdaBoost)对甘蔗栽培品种(品系)2 043个以及野生种771个,共2 815个数据集建立甘蔗糖分预测模型,并采用过采样以及交叉验证(CV=5)对甘蔗糖分含量预测模型进行加强和评估,并对云南省几个主要蔗区甘蔗产量性状(株高、茎径)与工艺性状(锤度)进行相关性分析。结果表明:甘蔗的产量性状与工艺性状间存在极显著正相关关系,且5种机器学习算法能够较好地对甘蔗糖分含量进行预测分析,交叉验证5次准确度均在90%以上。其中,xgboost算法精度较高,准确率、精确率、召回率和F_(1)分数分别为77.51%、78.20%、77.54%、77.51%,其次是决策树模型,准确率、精确率、召回率和F_(1)分数分别为76.33%、76.24%、76.94%、76.33%;xgboost算法在混淆矩阵等级中也表现最优,准确率为76.56%。说明利用机器学习算法建立甘蔗糖分含量预测模型是十分有意义和必要的,并且使用这些指标可以详细评估预测模型的有效性。
出处
《江苏农业科学》
北大核心
2025年第20期181-187,共7页
Jiangsu Agricultural Sciences
基金
云南省重大科技专项(编号:202202AE090021)
云南省作物生产与智慧农业重点实验室专项(编号:2021ZHNY02)。