目的本研究旨在建立HIV感染者/AIDS患者(HIV/AIDS)合并肺孢子菌肺炎(Pneumocystis pneumonia,PCP)的早期诊断预测模型,对及时治疗、降低病死率具有积极意义。方法回顾性收集2011年11月—2019年6月在广西南宁市第四人民医院住院的HIV/AID...目的本研究旨在建立HIV感染者/AIDS患者(HIV/AIDS)合并肺孢子菌肺炎(Pneumocystis pneumonia,PCP)的早期诊断预测模型,对及时治疗、降低病死率具有积极意义。方法回顾性收集2011年11月—2019年6月在广西南宁市第四人民医院住院的HIV/AIDS的住院记录。通过特征工程筛选临床特征训练7个机器模型,并采用曲线下面积(area under the curve,AUC)、灵敏度、特异度、F1-score等一系列指标来评价模型性能,以选出最佳预测模型。采用SHapley加性解释工具(SHapley Additive exPlanations,SHAP)评估每个个体对模型的影响,使用病例误判分析错分患者的临床特征。结果通过筛选病例和倾向性评分匹配后,共纳入3231个HIV/AIDS和1077个HIV/AIDS合并PCP。综合评价7个模型的预测效果,发现CatBoost模型是本研究中预测效果最佳的模型(灵敏度_(训练集/测试集)=0.7955/0.7037,特异度_(训练集/测试集)=0.9991/0.9670,AUC_(训练集/测试集)=0.9939/0.9230,F1-score_(训练集/测试集)=0.8848/0.7808)。SHAP评估发现,白细胞计数和乳酸脱氢酶是诊断PCP的2个关键特征。病例误判分析发现,CatBoost模型在训练集和测试集上的准确率分别为94.83%和90.10%。结论CatBoost模型是一个很好的预测诊断HIV/AIDS合并PCP的模型,该模型在早期诊断PCP以开展及时治疗、改善预后、降低病死率方面具有潜在的应用价值。展开更多
文摘目的本研究旨在建立HIV感染者/AIDS患者(HIV/AIDS)合并肺孢子菌肺炎(Pneumocystis pneumonia,PCP)的早期诊断预测模型,对及时治疗、降低病死率具有积极意义。方法回顾性收集2011年11月—2019年6月在广西南宁市第四人民医院住院的HIV/AIDS的住院记录。通过特征工程筛选临床特征训练7个机器模型,并采用曲线下面积(area under the curve,AUC)、灵敏度、特异度、F1-score等一系列指标来评价模型性能,以选出最佳预测模型。采用SHapley加性解释工具(SHapley Additive exPlanations,SHAP)评估每个个体对模型的影响,使用病例误判分析错分患者的临床特征。结果通过筛选病例和倾向性评分匹配后,共纳入3231个HIV/AIDS和1077个HIV/AIDS合并PCP。综合评价7个模型的预测效果,发现CatBoost模型是本研究中预测效果最佳的模型(灵敏度_(训练集/测试集)=0.7955/0.7037,特异度_(训练集/测试集)=0.9991/0.9670,AUC_(训练集/测试集)=0.9939/0.9230,F1-score_(训练集/测试集)=0.8848/0.7808)。SHAP评估发现,白细胞计数和乳酸脱氢酶是诊断PCP的2个关键特征。病例误判分析发现,CatBoost模型在训练集和测试集上的准确率分别为94.83%和90.10%。结论CatBoost模型是一个很好的预测诊断HIV/AIDS合并PCP的模型,该模型在早期诊断PCP以开展及时治疗、改善预后、降低病死率方面具有潜在的应用价值。