目的为了揭示埃可病毒3型(Echovirus 3,E3)的分子进化特征与流行规律,完善其基因分型方法,阐明其在中国及全球的分子流行病学特征,为E3的防控策略制定提供科学依据。方法基于本实验室收集的2003-2023年30株E3毒株,对全长VP1区进行扩增...目的为了揭示埃可病毒3型(Echovirus 3,E3)的分子进化特征与流行规律,完善其基因分型方法,阐明其在中国及全球的分子流行病学特征,为E3的防控策略制定提供科学依据。方法基于本实验室收集的2003-2023年30株E3毒株,对全长VP1区进行扩增、测序,并结合GenBank中全球99条E3 VP1全长序列(45条中国序列和54条国外序列)进行系统发育分析。利用BEAST X软件估计进化速率、共同祖先时间(The most recent common ancestor,tMRCA)及有效种群大小,对代表性毒株进行全基因组测序与重组分析。结果75株中国E3分离株与原型株Morrisey的VP1区核苷酸相似度为79.7%–82.8%。系统进化分析将全球E3划分为A–E五个基因型,其中C和D基因型可进一步划分为C1–C6和D1–D4亚型。C基因型为全球当前优势基因型,中国优势基因型与全球一致。全球E3 VP1区平均进化速率为2.95×10^(-3)每个碱基每年,最近共同祖先追溯至1944年,中国E3分离株起源较晚(tMRCA为1981年)。全球E3经历了从A基因型到B、C、D基因型共同流行再到C基因型主要流行的更替,而中国流行的E3起源于1981年,由B基因型更替到C基因型。VP1区氨基酸突变位点分析发现不同基因型存在特异性突变位点,这为C基因型取代B基因型提供了线索。全基因组重组分析提示E3在非结构蛋白区(P2、P3)与EV-B组其他血清型存在重组。结论本研究完善了全球E3基于全长VP1的基因分型方法,揭示了E3在中国及全球的分子流行特征,明确了其进化历程和基因型更替规律,发现了不同基因型的特异性突变位点,证实了E3存在重组现象,为其防控策略制定提供了关键依据。展开更多
Model checking evaluates whether a statistical model faithfully captures the underlying data-generating process.Classical tests—such as local-smoothing and empirical-process methods—break down in high dimensions.Mor...Model checking evaluates whether a statistical model faithfully captures the underlying data-generating process.Classical tests—such as local-smoothing and empirical-process methods—break down in high dimensions.More recent approaches use predictiveness comparisons with flexible machine-learning model fitting procedures to yield algorithm-agnostic tests,yet they require large labeled samples.The authors introduce a prediction-powered,semi-supervised framework that:1)Imputes responses for unlabeled data via a pretrained model;2)Corrects imputation bias with a rectifier calibrated on labeled data;3)Adaptively balances these components through a data-driven power-tuning parameter.Building on algorithm-agnostic out-of-sample predictiveness comparisons,the proposed method integrates unlabeled information to enhance power.Theoretical analyses and numerical results demonstrate that the proposed test controls Type I error and substantially improves power over fully supervised counterparts,even under imputation-model misspecification.展开更多
文摘目的为了揭示埃可病毒3型(Echovirus 3,E3)的分子进化特征与流行规律,完善其基因分型方法,阐明其在中国及全球的分子流行病学特征,为E3的防控策略制定提供科学依据。方法基于本实验室收集的2003-2023年30株E3毒株,对全长VP1区进行扩增、测序,并结合GenBank中全球99条E3 VP1全长序列(45条中国序列和54条国外序列)进行系统发育分析。利用BEAST X软件估计进化速率、共同祖先时间(The most recent common ancestor,tMRCA)及有效种群大小,对代表性毒株进行全基因组测序与重组分析。结果75株中国E3分离株与原型株Morrisey的VP1区核苷酸相似度为79.7%–82.8%。系统进化分析将全球E3划分为A–E五个基因型,其中C和D基因型可进一步划分为C1–C6和D1–D4亚型。C基因型为全球当前优势基因型,中国优势基因型与全球一致。全球E3 VP1区平均进化速率为2.95×10^(-3)每个碱基每年,最近共同祖先追溯至1944年,中国E3分离株起源较晚(tMRCA为1981年)。全球E3经历了从A基因型到B、C、D基因型共同流行再到C基因型主要流行的更替,而中国流行的E3起源于1981年,由B基因型更替到C基因型。VP1区氨基酸突变位点分析发现不同基因型存在特异性突变位点,这为C基因型取代B基因型提供了线索。全基因组重组分析提示E3在非结构蛋白区(P2、P3)与EV-B组其他血清型存在重组。结论本研究完善了全球E3基于全长VP1的基因分型方法,揭示了E3在中国及全球的分子流行特征,明确了其进化历程和基因型更替规律,发现了不同基因型的特异性突变位点,证实了E3存在重组现象,为其防控策略制定提供了关键依据。
基金supported by the National Key R&D Program of China under Grant Nos.2022YFA1003800 and 2022YFA1003703the National Natural Science Foundation of China under Grant Nos.12531011,12231011 and 12471255+3 种基金the Natural Science Foundation of Shanghai under Grant No.23ZR1419400the Fundamental Research Funds for the Central Universities under Grant No.63253110supported by China Postdoctoral Science Foundation General Funding Program under Grant No.2025M7730792025 Annual Planning Project of the Commerce Statistical Society of China under Grant No.2025STY115。
文摘Model checking evaluates whether a statistical model faithfully captures the underlying data-generating process.Classical tests—such as local-smoothing and empirical-process methods—break down in high dimensions.More recent approaches use predictiveness comparisons with flexible machine-learning model fitting procedures to yield algorithm-agnostic tests,yet they require large labeled samples.The authors introduce a prediction-powered,semi-supervised framework that:1)Imputes responses for unlabeled data via a pretrained model;2)Corrects imputation bias with a rectifier calibrated on labeled data;3)Adaptively balances these components through a data-driven power-tuning parameter.Building on algorithm-agnostic out-of-sample predictiveness comparisons,the proposed method integrates unlabeled information to enhance power.Theoretical analyses and numerical results demonstrate that the proposed test controls Type I error and substantially improves power over fully supervised counterparts,even under imputation-model misspecification.