文摘目的构建能够区分野生品、仿野生品及栽培品黄芪的评分卡。方法使用基于三元组的变分自动编码器(triplet-based variational autoencoder,TVAE)深度生成的600批虚拟数据作为训练集和验证集,对训练集数据进行分箱,并对分箱调整和优化,计算分箱的证据权重(weight of evidence,WOE)。对数据进行WOE编码,建立逻辑回归模型,使用训练集对逻辑回归模型进行训练,使用验证集对逻辑回归模型进行调参。以50分作为样品正负分类几率为1时的分数,根据公式和逻辑回归模型方程分别计算评分卡的基准分数和各分箱对应分数。评分时使用基准分数和样品所对应各分箱的分数相加,得出该样品的分数,以50分为阈值对样品正负类别的概率大小进行判定。构建了A卡和B卡分别实现黄芪样品是否为野生品和是否为栽培品的判别。结果以64批真实样品数据作为测试集分别对A卡和B卡进行评估,A卡和B卡对测试集的分类判别准确率为0.86和0.80。结论评分卡可以较准确地实现对黄芪样品来源的判别,模型稳定可靠,操作简单便捷且易推广。