The old campus of Sichuan Academy of Fine Arts, located in the city’s industrial area, have long suffered dust and noise pollution from the thermal power plant, freight yards, the steel plant, the train station and s...The old campus of Sichuan Academy of Fine Arts, located in the city’s industrial area, have long suffered dust and noise pollution from the thermal power plant, freight yards, the steel plant, the train station and storehouses in the neighborhood.展开更多
目的基于以动力系统理论为核心的多模态数据算法框架,构建面向口腔微生物组学的肺结节“病证结合”数学表征模型,同时开展多种算法框架下的预测模型比较,验证最优模型用于预测是否存在肺结节的效能。方法前瞻性纳入2022年7月—2023年3...目的基于以动力系统理论为核心的多模态数据算法框架,构建面向口腔微生物组学的肺结节“病证结合”数学表征模型,同时开展多种算法框架下的预测模型比较,验证最优模型用于预测是否存在肺结节的效能。方法前瞻性纳入2022年7月—2023年3月成都中医药大学附属医院、四川省肿瘤医院及成都市中西医结合医院的213例受试者,其中肺结节患者173例,健康受试者40例。提出一种新的以动力系统理论为核心的多模态数据算法框架—VAEGANTF(Variational Auto Encoder-Generative Adversarial Network-Transformer),后基于“临床特征-证素-微生物”多维整合数据集,将所有受试者按比例7∶3划为训练集和测试集,分别用于构建模型和模型效能测试。分别以是否存在肺结节为因变量,联合临床特征、病位、病性和微生物菌属等候选标志物,在识别并处理多重共线性的基础上,根据变量重要性排序对自变量进行筛选,再对缺失值进行填充、数据进行标准化,随后分别采用随机森林、最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归、支持向量机、多层感知机、极端梯度提升(eXtreme Gradient Boosting,XGBoost)、VAE-ViT(Vision Transformer)、GAN-ViT和VAEGANTF共8种机器学习算法构建肺结节风险预测模型,使用k折交叉验证法进行模型参数调节与优化。使用混淆矩阵和受试者工作特征曲线评估8种预测模型效能,筛选出最优模型。最后,通过拟合优度检验和决策曲线分析对最优模型进行评价。结果健康受试者和肺结节患者在年龄、性别等人口学特征方面差异均无统计学意义。将213名受试者按7∶3随机划分为训练集和测试集,分别使用8种机器学习算法构建预测模型,在排除多重共线性等潜在问题后,共纳入301个临床特征信息、证素和微生物菌属标志物用于构建模型。其中,随机森林、LASSO回归、支持向量机、多层感知机和VAE-ViT模型的曲线下面积(area under the curve,AUC)值未达到0.85,效能较差。XGBoost、GAN-ViT和VAEGANTF模型的AUC值均为0.85以上,其中AUC值最高的是VAEGANTF模型(AUC=0.923)。拟合优度检验结果表明VAEGANTF模型的校准能力较好,决策曲线分析结果显示临床获益度较高。列线图结果显示,年龄、性别、心、肺、气虚、瘀、湿、卟啉单胞菌属(Porphyromonas)、短链小球菌属(Granulicatella)、奈瑟菌属(Neisseria)、嗜血杆菌属(Haemophilus)、放线杆菌属(Actinobacillus)可作为预测变量。结论基于以动力系统理论为核心的VAEGANTF算法框架构建“临床特征-证素-微生物”多维数据特征的肺结节“病证结合”风险预测模型相比于其他机器学习算法具有更好的性能,对肺结节早期无创诊断具有一定的参考价值。展开更多
背景肺癌作为发病率及死亡率均居首位的恶性肿瘤,其预防和治疗已成为研究热点,昼夜节律紊乱(CRD)被认为是肺癌发生的重要危险因素,但二者的因果关联尚不明确。目的探讨昼夜节律紊乱与肺癌发生风险之间的因果关系及可能机制,并进行潜在...背景肺癌作为发病率及死亡率均居首位的恶性肿瘤,其预防和治疗已成为研究热点,昼夜节律紊乱(CRD)被认为是肺癌发生的重要危险因素,但二者的因果关联尚不明确。目的探讨昼夜节律紊乱与肺癌发生风险之间的因果关系及可能机制,并进行潜在干预中药预测。方法通过UKBiobank等网站获取白天小睡、白天嗜睡、短睡眠时间、长睡眠时间、时间型、失眠及早起的全基因组关联研究(GWAS)数据,通过IEU Open GWAS数据库获取总体肺癌、肺腺癌(LUAD)、肺鳞状细胞癌(LUSC)、小细胞肺癌(SCLC)的GWAS数据,进行孟德尔随机化(MR)分析,以逆方差加权法(IVW)作为主要分析方法评估昼夜节律紊乱与肺癌发生的因果关系。根据单核苷酸多态性(SNPs)定位,并通过蛋白质互作(PPI)网络分析筛选核心基因,进行功能富集分析及生存分析。将核心基因上传至Coremine数据库查找具有潜在干预作用的中药,统计中药性味归经及功效,并筛选出核心中药,使用TCMSP及BATMAN-TCM数据库获得核心中药的关键成分,运用分子对接验证潜在中药关键成分与核心基因的结合能力。结果失眠(OR=1.149,95%CI=1.074~1.232,P=0.013)、短睡眠时间(OR=1.462,95%CI=1.033~2.061,P=0.031)与肺癌,失眠(OR=1.181,95%CI=1.061~1.322,P=0.001)、短睡眠时间(OR=1.563,95%CI=1.024~2.401,P=0.038)、白天嗜睡(OR=4.033,95%CI=1.062~15.434,P=0.042)与LUAD,失眠(OR=1.152,95%CI=1.028~1.281,P=0.001)与LUSC,短睡眠时间(OR=1.952,95%CI=1.120~3.383,P=0.017)与SCLC存在因果关联;筛选出139个核心基因,主要富集在G蛋白偶联受体(GPCR)、丝裂原活化蛋白激酶(MAPK)、磷脂酰肌醇-3-激酶(PI3K)/蛋白激酶B(Akt)等通路,排名前5的核心基因包括:组蛋白乙酰转移酶P300(EP300)、甘油醛-3-磷酸脱氢酶(GAPDH)、G蛋白亚基β1(GNB1)、G蛋白亚基γ13(GNG13)、肿瘤坏死因子(TNF),其中EP300表达量与LUAD、LUSC、SCLC患者生存时间呈正相关(P<0.05);CNB1表达量与LUAD患者生存时间呈负相关,与SCLC患者生存时间呈正相关(P<0.05);GAPDH、GNG13、TNF表达量与LUAD患者生存时间呈负相关(P<0.05)。筛选出水牛角、丹参、鱼脑石、黄芩、郁金、黄芪、灵芝、人参等共40味中药,药味以甘为主,苦、辛次之,药性寒为主,温、平次之,归经多归肝、脾、肺、胃、心、肾经,功效以补气、活血化瘀、清热解毒为主;筛选出水牛角、丹参、三七、黄芩、郁金、姜黄、玉米须、灵芝共8味核心中药,分子对接显示,与核心靶基因有良好的结合效能(结合能<-4kcal/mol)。结论昼夜节律紊乱与肺癌存在因果关系,其作用机制与GCPR、MAPK、PI3K/Akt等通路相关,所预测中药可为中医药调复昼夜节律防治肺癌提供参考依据。展开更多
文摘The old campus of Sichuan Academy of Fine Arts, located in the city’s industrial area, have long suffered dust and noise pollution from the thermal power plant, freight yards, the steel plant, the train station and storehouses in the neighborhood.
文摘目的基于以动力系统理论为核心的多模态数据算法框架,构建面向口腔微生物组学的肺结节“病证结合”数学表征模型,同时开展多种算法框架下的预测模型比较,验证最优模型用于预测是否存在肺结节的效能。方法前瞻性纳入2022年7月—2023年3月成都中医药大学附属医院、四川省肿瘤医院及成都市中西医结合医院的213例受试者,其中肺结节患者173例,健康受试者40例。提出一种新的以动力系统理论为核心的多模态数据算法框架—VAEGANTF(Variational Auto Encoder-Generative Adversarial Network-Transformer),后基于“临床特征-证素-微生物”多维整合数据集,将所有受试者按比例7∶3划为训练集和测试集,分别用于构建模型和模型效能测试。分别以是否存在肺结节为因变量,联合临床特征、病位、病性和微生物菌属等候选标志物,在识别并处理多重共线性的基础上,根据变量重要性排序对自变量进行筛选,再对缺失值进行填充、数据进行标准化,随后分别采用随机森林、最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归、支持向量机、多层感知机、极端梯度提升(eXtreme Gradient Boosting,XGBoost)、VAE-ViT(Vision Transformer)、GAN-ViT和VAEGANTF共8种机器学习算法构建肺结节风险预测模型,使用k折交叉验证法进行模型参数调节与优化。使用混淆矩阵和受试者工作特征曲线评估8种预测模型效能,筛选出最优模型。最后,通过拟合优度检验和决策曲线分析对最优模型进行评价。结果健康受试者和肺结节患者在年龄、性别等人口学特征方面差异均无统计学意义。将213名受试者按7∶3随机划分为训练集和测试集,分别使用8种机器学习算法构建预测模型,在排除多重共线性等潜在问题后,共纳入301个临床特征信息、证素和微生物菌属标志物用于构建模型。其中,随机森林、LASSO回归、支持向量机、多层感知机和VAE-ViT模型的曲线下面积(area under the curve,AUC)值未达到0.85,效能较差。XGBoost、GAN-ViT和VAEGANTF模型的AUC值均为0.85以上,其中AUC值最高的是VAEGANTF模型(AUC=0.923)。拟合优度检验结果表明VAEGANTF模型的校准能力较好,决策曲线分析结果显示临床获益度较高。列线图结果显示,年龄、性别、心、肺、气虚、瘀、湿、卟啉单胞菌属(Porphyromonas)、短链小球菌属(Granulicatella)、奈瑟菌属(Neisseria)、嗜血杆菌属(Haemophilus)、放线杆菌属(Actinobacillus)可作为预测变量。结论基于以动力系统理论为核心的VAEGANTF算法框架构建“临床特征-证素-微生物”多维数据特征的肺结节“病证结合”风险预测模型相比于其他机器学习算法具有更好的性能,对肺结节早期无创诊断具有一定的参考价值。
文摘背景肺癌作为发病率及死亡率均居首位的恶性肿瘤,其预防和治疗已成为研究热点,昼夜节律紊乱(CRD)被认为是肺癌发生的重要危险因素,但二者的因果关联尚不明确。目的探讨昼夜节律紊乱与肺癌发生风险之间的因果关系及可能机制,并进行潜在干预中药预测。方法通过UKBiobank等网站获取白天小睡、白天嗜睡、短睡眠时间、长睡眠时间、时间型、失眠及早起的全基因组关联研究(GWAS)数据,通过IEU Open GWAS数据库获取总体肺癌、肺腺癌(LUAD)、肺鳞状细胞癌(LUSC)、小细胞肺癌(SCLC)的GWAS数据,进行孟德尔随机化(MR)分析,以逆方差加权法(IVW)作为主要分析方法评估昼夜节律紊乱与肺癌发生的因果关系。根据单核苷酸多态性(SNPs)定位,并通过蛋白质互作(PPI)网络分析筛选核心基因,进行功能富集分析及生存分析。将核心基因上传至Coremine数据库查找具有潜在干预作用的中药,统计中药性味归经及功效,并筛选出核心中药,使用TCMSP及BATMAN-TCM数据库获得核心中药的关键成分,运用分子对接验证潜在中药关键成分与核心基因的结合能力。结果失眠(OR=1.149,95%CI=1.074~1.232,P=0.013)、短睡眠时间(OR=1.462,95%CI=1.033~2.061,P=0.031)与肺癌,失眠(OR=1.181,95%CI=1.061~1.322,P=0.001)、短睡眠时间(OR=1.563,95%CI=1.024~2.401,P=0.038)、白天嗜睡(OR=4.033,95%CI=1.062~15.434,P=0.042)与LUAD,失眠(OR=1.152,95%CI=1.028~1.281,P=0.001)与LUSC,短睡眠时间(OR=1.952,95%CI=1.120~3.383,P=0.017)与SCLC存在因果关联;筛选出139个核心基因,主要富集在G蛋白偶联受体(GPCR)、丝裂原活化蛋白激酶(MAPK)、磷脂酰肌醇-3-激酶(PI3K)/蛋白激酶B(Akt)等通路,排名前5的核心基因包括:组蛋白乙酰转移酶P300(EP300)、甘油醛-3-磷酸脱氢酶(GAPDH)、G蛋白亚基β1(GNB1)、G蛋白亚基γ13(GNG13)、肿瘤坏死因子(TNF),其中EP300表达量与LUAD、LUSC、SCLC患者生存时间呈正相关(P<0.05);CNB1表达量与LUAD患者生存时间呈负相关,与SCLC患者生存时间呈正相关(P<0.05);GAPDH、GNG13、TNF表达量与LUAD患者生存时间呈负相关(P<0.05)。筛选出水牛角、丹参、鱼脑石、黄芩、郁金、黄芪、灵芝、人参等共40味中药,药味以甘为主,苦、辛次之,药性寒为主,温、平次之,归经多归肝、脾、肺、胃、心、肾经,功效以补气、活血化瘀、清热解毒为主;筛选出水牛角、丹参、三七、黄芩、郁金、姜黄、玉米须、灵芝共8味核心中药,分子对接显示,与核心靶基因有良好的结合效能(结合能<-4kcal/mol)。结论昼夜节律紊乱与肺癌存在因果关系,其作用机制与GCPR、MAPK、PI3K/Akt等通路相关,所预测中药可为中医药调复昼夜节律防治肺癌提供参考依据。