《自然·医学》:一次血检预测52种疾病?!科学家基于40万人数据开发A...

每天聊点有用的 2024-07-26 01:35:03

*仅供医学专业人士阅读参考

蛋白质在生命过程中扮演着重要角色,特定蛋白质的存在和多少也能预示疾病的发生和进展,比如B型利钠肽之于心力衰竭、肌钙蛋白之于急性冠脉综合征。

人类血浆中存在数千种蛋白质,这些蛋白质承担着大量的健康信息,如果我们有方法解读,想必可以为临床预防、诊断、治疗提供极大的帮助。这也是诸多人类蛋白质组学项目的意义所在。

今日,《自然·医学》杂志发表了一项有关的新研究,科学家们利用迄今为止最大的蛋白质组学研究项目——英国生物库药物蛋白质组学项目(UKB-PPP)中40余万人、约3000种血浆蛋白和218种疾病的信息,生成了长期预测模型。

在67种疾病中,在现有的临床血检指标预测模型中添加5-20种相关蛋白可有效改善预测效果;在52种疾病中,基于蛋白质的预测模型效果甚至优于临床模型。效果最佳的疾病包括多发性骨髓瘤、非霍奇金淋巴瘤、扩张型心肌病和特发性肺纤维化。

论文题图

这项研究纳入的参与者共有41931名,在随访10年内病例超过80例的疾病被纳入分析,共计218种常见/罕见病,血浆蛋白质组学分析共涵盖了2923种蛋白质。

研究流程

通过机器学习框架分析相关数据,研究者发现,对67种疾病,在现有的血检数据基础上增添5-20个血浆蛋白质即可有效提升疾病预测效果,效果最好的要数多发性骨髓瘤、非霍奇金淋巴瘤、扩张型心肌病和特发性肺纤维化。在多发性骨髓瘤中,添加5种蛋白质可将模型的预测效果评估指标C指数提高0.25(C指数最大为1)。

在这67种疾病中,含蛋白质的预测模型中位检出率为45.5%,临床模型仅有25%;前者的中位似然比(LR)达到4.55,相较后者改善0.12到6.92不等。

对其中的52种疾病,蛋白质模型的LR比临床模型更好。

血浆蛋白质显著改善临床模型的似然比(LR)

研究者分析对比了11名新诊断多发性骨髓瘤患者和3名健康对照者的免疫微环境单细胞RNA测序数据,发现AI选定的5种预测蛋白中,有4种(FCRLB、QPCT、SLAMF7和TNFRSF17)的确在浆细胞中表达最丰富。

在67种疾病中,共有501个蛋白被选定为预测蛋白,其中147个出现于2或2种以上疾病中。研究者分析发现,这些蛋白对预测贡献较低,它们主要与年龄等因素有关,但预测效果仍旧优于传统危险因素。

也有部分蛋白仅被选择用于预测单一疾病,例如多发性骨髓瘤中的TNFRSF17。

单独预测一种疾病的蛋白质

在英国生物库数据中,有23种疾病可提供多基因风险评分(PGS)。分析结果显示,除乳腺癌外,蛋白模型的预测效果都优于PGS。

这项研究能够有效提升当前临床预测模型的效果,能够对高危个体实行早期识别、有针对的预防、及时诊断和治疗。以预测性能最佳的蛋白质为核心,我们还有希望进一步优化生物标志物组合,实现临床转化。

不过研究者也提及,虽然这项研究的规模非常庞大,但涉及的人群和诊断方法仍旧不够丰富。在临床转化之前,更仔细地讨论样本处理方法和蛋白质组学技术对结果精度的影响是很有必要的。

参考资料:

[1]https://www.nature.com/articles/s41591-024-03142-z

[2]https://www.nature.com/articles/s41591-024-03145-w

本文作者丨代丝雨

0 阅读:1