动脉粥样硬化性心血管疾病(Atherosclerotic cardiovascular diseases, ACVD)是全球高死亡率的主要原因之一。其源于动脉壁中脂质和纤维物质的积累,促动脉粥样化的脂质颗粒被氧化和聚集,并促进炎症反应、内皮损伤、血管纤维化,最终形成所谓的动脉粥样硬化斑块(atherosclerotic plaques, AP)。晚期动脉粥样硬化的不稳定斑块破裂会引发血栓事件,导致心肌梗死或中风。及早识别与动脉粥样硬化进展相关的标志物是主要研究重点,有助于理解AP形成的分子机制,并可用于预测斑块破裂和严重致命事件的风险。 2026年4月10日,西班牙加的斯大学研究团队在Mol Biomed(IF 10.1)上发表了题为“Machine learning integrated clinical-proteomics data identifies a 6-protein panel signature for atherosclerotic severity and enhanced patient stratification”的研究论文。研究通过血液蛋白质组检测并采用了五种机器学习分类算法(machine learning classification algorithms, MLCA),构建了可高效识别动脉粥样硬化患者的个6蛋白标志物panel。此外,结合临床-蛋白质组学机器学习的方法提供了更准确的患者分层。 研究结果 动脉粥样硬化患者表现出差异性蛋白质组谱 通过对照组(CTRL, n=42)、血脂异常患者(DLP, n=45)和颈动脉粥样硬化性狭窄(AT, n=40)患者的血清样本进行蛋白质组分析,证实AT血清蛋白质组谱与DLP和CTRL组不同,而后两者几乎难以区分。此外,根据以血浆蛋白质组为背景数据库的功能富集分析,鉴定出的差异蛋白主要参与血液凝固、脂质运输/代谢和免疫反应,其中许多与ACVD密切相关。 图1. 蛋白质组学显示AT患者蛋白谱差异 机器学习将临床数据和蛋白质组数据整合,提升预测性能和特征选择 研究应用了五种不同的MLCA:Naive Bayes(NB)、Linear SVM(LSVM)、Random Forest(RF)、Extra Trees Classifier(ETC)、AdaBoost(AB),用以评估发现队列中的个体或综合蛋白质组学和临床数据。单独区分获得13个临床特征以及39个蛋白,整合后精炼为16个特征panel:ApoAI, ApoB, LDL/ApoB比值, RDW%,蛋白质:ACTB, COR1A, FIBA, FIBB, FIBG, GPV, MMP9, PCOC1, PLF4, B2M, TSP1。 图2. 机器学习训练流程与功能选择 动脉粥样硬化生物标志物的鉴定 随后,鉴于临床-蛋白质组学的结合,16个特征panel被进一步筛选,以提供精细化的动脉粥样硬化血清标志物。最终保留了6蛋白panel:MMP9、B2M、GPV、PLF4、TSP1和FIB,其AUC-ROC > 0.97,与全16特征panel性能相当。其中AT患者的炎症蛋白B2M和纤维蛋白原显著上调,而GPV、MMP9、PLF4和TSP1均下调。并且这些蛋白质之间观察到强烈的相关性,尤其是在AT组内趋势更加显著。 图3. MLCA重点关注的蛋白质 上述panel中的蛋白质在同一发现队列中得到验证,同时还在独立的外部队列中接受了测试,这些蛋白表达与发现队列中呈现出相同的趋势。这些结果表明,无论是独立使用还是与检测的脂质特征整合使用,6蛋白panel在识别重度AT患者方面均具备较高的鉴别力。因此,这些发现支持了6蛋白panel作为动脉粥样硬化严重度分层血清生物标志物的潜力。 图4.6蛋白生物标志物panel的外部验证 临床-蛋白质组学的综合方法优化了患者分层 在确认MLCA模型的有效性后,文章进一步评估了它们在各研究组中的分层能力,并和AT患者的多普勒超声结果。研究发现,综合临床-蛋白质组学方法提供了最准确的分层,优于单个数据集的分析,强调了蛋白质组学对标准临床数据的加价价值,有助于患者进行最佳分层。并且基于临床和蛋白质组学数据的最终分层结果(MLCA后)显示出近97%与多普勒成像后分类结果的一致性,表明综合方法可以作为有效的初步筛查工具,可能会减少普遍影像学的需求。 图5. 基于临床、蛋白质组学或整合分析的患者分层示意图 文章结论 本研究采用五种MLCA方法,结合了CTRL、DLP患者及AT患者的临床和蛋白质组学数据,提供了患者状态的完整分子图谱,并比单靠临床参数更准确地进行患者分层。研究发现了一个高效的6蛋白panel(B2M、GPV、MMP9、PLF4、TSP1和FB异构体),所有应用算法的ROC-AUC>值均为0.9,可高度区分的AT患者。这些蛋白的水平在包括急性动脉粥样血栓性中风患者的独立外部队列中进一步验证,证实该panel作为动脉粥样硬化严重程度生物标志物的潜力。此外,结合临床-蛋白质组学机器学习的方法比单用临床或蛋白质组分析提供了更准确的患者分层。从机制角度看,已识别的生物标志物强调了血小板活化、失控血管生成和斑块内出血在动脉粥样硬化过程中的重要性,强调了多途径治疗以防止不良血栓事件的必要性。 参考文献 Extremera-García MJ, Rojas-Torres M, Priego-Torres B, Beltrán-Camacho L, Eslava-Alcón S, Rodríguez-Martín F, Benítez- Camacho J, Ballesteros-Ribelles A, Del Val AM, Olsen J, Lozano-Loaiza E, González-García MÁ, Sanchez-Morillo D, Fernández-Vega A, Montaner J, Doiz E, Rodriguez-Piñero M, Durán-Ruiz MC. Machine learning integrated clinical-proteomics data identifies a 6-protein panel signature for atherosclerotic severity and enhanced patient stratification. Mol Biomed. 2026 Apr 10;7(1):49. 青莲百奥体液蛋白质组解决方案









