摘要
采用随机森林、支持向量机、梯度提升决策树和长短期记忆网络等机器学习算法构建模型,并使用Stacking方法进行集成优化。模型评估采用多项指标,包括准确率、AUC和Kappa系数,旨在构建和优化基于大数据分析的林业病虫害预测模型。研究整合了多源数据,包括遥感影像、气象数据、地理信息和历史病虫害记录,形成了一个跨越10年(2013—2022年)的综合数据集。通过特征工程,选取了25个关键特征。结果显示,Stacking集成模型表现最佳,准确率达89%,AUC值为0.95。模型在不同地理区域和病虫害类型上均展现出良好的适用性和时间泛化能力。