目的构建适应中国人群的乳腺钼靶图像分类辅助系统,探讨人工智能技术在国内辅助乳腺癌早期筛查的潜力。方法为复现当前文献中的主流深度学习方法,利用乳腺X线筛查数字数据库子集(curated breast imaging subset of digital database for...目的构建适应中国人群的乳腺钼靶图像分类辅助系统,探讨人工智能技术在国内辅助乳腺癌早期筛查的潜力。方法为复现当前文献中的主流深度学习方法,利用乳腺X线筛查数字数据库子集(curated breast imaging subset of digital database for screening mammography,CBIS-DDSM)、乳房X线图像分析学会数据库(mammographic image analysis society database,MIAS)等国际公开数据集分别进行模型训练,并在华教科技有限公司提供的中国人群乳腺钼靶图像数据集(Chinese breast mammography dataset,CBMD)上进行测试和模型性能比较;针对中国人群数据在公开数据集训练模型性能测试不理想的问题,结合中国人群数据特点,提出基于滑动窗口调窗机制的优化策略,设计二阶段迁移学习方法,以提升模型的整体性能,并进行系统研发。结果使用滑动窗口调窗机制及二阶段迁移学习后的CBMD训练模型,以中国人群数据集为测试集,其准确度从默认窗口下公开数据集训练模型的0.50提升至0.80,精度从0.54提升至0.82,灵敏度从0.52提升至0.80,F1值从0.52提升至0.80,AUC值从0.51提升至0.89。结论本研究引入滑动窗口调窗机制和二阶段迁移学习策略,显著提升了乳腺钼靶图像分类模型在中国人群数据集上的性能,初步达到适应中国人群的乳腺钼靶图像辅助分类的目的。展开更多
文摘目的探讨基于乳腺X线摄影及动态增强磁共振成像(dynamic contrast-enhanced magnetic resonance imaging,DCE-MRI)的机器学习模型预测乳腺癌患者新辅助治疗(neoadjuvant therapy,NAT)后病理完全缓解(pathological complete response,pCR)的价值。方法回顾性分析2016年8月至2023年7月于青岛大学附属医院(机构1)及烟台毓璜顶医院(机构2)接受NAT后行手术的396例乳腺癌患者资料,来自机构1的320例患者按7∶3比例随机分为训练集和验证集,来自机构2的76例患者作为独立的外部验证集。对患者NAT前乳腺X线摄影及DCE-MRI图像进行感兴趣区域(region of interest,ROI)勾画、特征提取、特征筛选,使用支持向量机(support vector machine,SVM)机器学习算法构建影像组学模型。对临床特征进行单因素-多因素逻辑回归分析,保留具有统计学意义的临床独立预测因子并构建临床模型。将联合影像组学模型与临床独立预测因子使用SVM机器学习算法联合构建综合模型。采用受试者工作特征(receiver operating characteristic,ROC)曲线的曲线下面积(area under the curves,AUC)、准确性、敏感性、特异性和F1-score评价模型的性能,绘制校准曲线评价模型的拟合优度,采用决策曲线分析(decision curve analysis,DCA)评估模型的临床应用价值。结果联合影像组学模型预测性能高于临床模型、乳腺X线摄影影像组学模型和MRI影像组学模型,其在训练集、验证集和外部验证集AUC分别为0.899、0.850及0.765。综合模型预测性能最佳,其在训练集、验证集和外部验证集AUC分别为0.918、0.856、0.795,且该模型具有良好的校准能力和临床收益。Delong检验示临床模型与综合模型的AUC的差异有统计学意义(P<0.05)。结论基于乳腺X线摄影及DCE-MRI的机器学习模型可以预测乳腺癌患者NAT后pCR,且具有较高的预测性能。
文摘目的构建适应中国人群的乳腺钼靶图像分类辅助系统,探讨人工智能技术在国内辅助乳腺癌早期筛查的潜力。方法为复现当前文献中的主流深度学习方法,利用乳腺X线筛查数字数据库子集(curated breast imaging subset of digital database for screening mammography,CBIS-DDSM)、乳房X线图像分析学会数据库(mammographic image analysis society database,MIAS)等国际公开数据集分别进行模型训练,并在华教科技有限公司提供的中国人群乳腺钼靶图像数据集(Chinese breast mammography dataset,CBMD)上进行测试和模型性能比较;针对中国人群数据在公开数据集训练模型性能测试不理想的问题,结合中国人群数据特点,提出基于滑动窗口调窗机制的优化策略,设计二阶段迁移学习方法,以提升模型的整体性能,并进行系统研发。结果使用滑动窗口调窗机制及二阶段迁移学习后的CBMD训练模型,以中国人群数据集为测试集,其准确度从默认窗口下公开数据集训练模型的0.50提升至0.80,精度从0.54提升至0.82,灵敏度从0.52提升至0.80,F1值从0.52提升至0.80,AUC值从0.51提升至0.89。结论本研究引入滑动窗口调窗机制和二阶段迁移学习策略,显著提升了乳腺钼靶图像分类模型在中国人群数据集上的性能,初步达到适应中国人群的乳腺钼靶图像辅助分类的目的。