Nature列为研究热点| Nat Med:首次基于蛋白质组学和机器学习模型确定酒精相关性肝病的非侵袭性标志物

2022-12-21 17:47:22, shanR 上海吉凯基因医学科技股份有限公司


 


酒精相关肝病(ALD)是常见的慢性肝病。脂肪变性、酒精性肝脏炎症和纤维化是明显的组织病理学特征,标志着ALD向肝硬化的发展。目前约75%的ALD患者是在失代偿性肝硬化发生后被诊断的。由于疾病进展缓慢且无症状以及现有诊断法如侵入性的穿刺活检具有导致并发症的风险,而非侵入性的无创生物标志物在疾病早期阶段的准确性有限,因此迫切需要采用微创诊断策略来筛查高危人群中的患者,如有酗酒、肥胖、缺乏运动和糖尿病病史的患者。此外,ALD的分子病理生理学尚未完全了解,目前尚无针对该疾病的肝脏特异性干预措施。


生物标记物的发现工作通常集中于单个生物分子,但在临床上的接受率很低。基于MS的蛋白质组学使临床样品中存在的数百至数千种蛋白质的鉴定和定量具有特异性,使其原则上适合于疾病机制的研究和生物标志物的鉴定,将重点转移到生物标志物组,而不是单个蛋白质。


今年德国马克斯-普朗克研究所Matthias Mann课题组在医学TOP期刊Nature Medicine(影响因子: 87.241)上发表题为“Noninvasive proteomic biomarkers for alcohol-related liver disease”的文章,首次报道了基于质谱的蛋白质组学检测和机器学习,构建了可用于预测肝纤维化、肝炎和肝脂肪变的蛋白质生物标志物组合。



队列设计

研究人群由三个队列的参与者组成:

(1) GALA–ALD模型开发队列(ALD derivation cohort): n=459,有随访数据的前瞻性队列;其中79例患者提供肝活检组织;

(2) GALA–HP:与GALA–ALD相匹配的健康对照组的横断面队列,n=137;

(3) ALD验证队列:n=63。


实验技术

DIA蛋白质组学技术


实验流程


实验结果

1. 肝脏病变对肝脏和血浆蛋白质组的影响

(1)肝脏

GALA–ALD模型开发队列的79例肝组织蛋白质测到5515种蛋白质,总计717种蛋白质与脂肪变性、纤维化、脂肪肝炎相关(658种蛋白质在纤维化阶段、135种炎症活性和68种脂肪变性中显著失调)。纤维化对肝脏蛋白质组的影响最大,其次是炎症,84%的炎症蛋白失调也被发现在纤维化中。大多数失调蛋白随着纤维化阶段的增加而上调(63%(454个蛋白)上调,而37%(263个蛋白)下调)。根据人类蛋白质图谱的注释对失调蛋白进行分组时,87%被注释为“肝脏特异性”的蛋白随着纤维化阶段的增加而在肝组织中下调;相比之下,80%被标注为“分泌型”的蛋白质被上调。这与我们先前在NAFLD和肝硬化研究中报道的相似。


相关性分析发现1235种蛋白质与纤维化阶段显著相关,873种与炎症活性显著相关175种与脂肪变性评分显著相关。与纤维化阶段最相关的前20个蛋白质主要是肝脏分泌蛋白。前20个炎症相关蛋白中约50%是细胞骨架蛋白,可能表明炎症肝脏中的细胞结构变化。以往被认为是NAFLD患者从单纯性脂肪变性进展为非酒精性脂肪性肝炎的预测标志物的脂滴蛋白PLIN2和脂肪酸结合蛋白4(FABP4),与脂肪变性相关。



(2)血浆

225种蛋白质在纤维化(206种蛋白质)、炎症活性(163种蛋白质)和脂肪变性(48种蛋白质)显著变化。其中,随着纤维化阶段的增加,134种蛋白上调,91种蛋白下调。在那些被标注为肝脏特异性或分泌性的失调蛋白中,分别有83%和64%被发现下调。


106种蛋白质的循环水平与纤维化阶段显著相关,55种与炎症活动显著相关,5种与脂肪变性显著相关。补体成分C7、QSOX1和LGALS3BP与纤维化阶段的相关性最高(同样,前三位与炎症相关),代表了具有潜力的纤维化和炎症标记候选物。ALDOB也是NAFLD的潜在生物标志物,与脂肪变性的相关性位居第二。


2. 整合肝脏和血浆蛋白质组学

总共有420种蛋白质在肝脏和血浆中被定量,其中46种共调节蛋白质在肝脏和血浆蛋白质组中变化显著。它们可能是由于免疫细胞浸润和全身炎症增加、ECM重塑和肝纤维化中瘢痕组织形成以及组织渗漏所致。从纤维化阶段F0到F4,肝脏和血浆中的大多数共调节蛋白都大量增加,包括PIGR、LGALS3BP、TGFBI和C7,这些都是以前报道过的肝脏疾病的有潜力的标记物。少数蛋白在组织和血浆中表达不一致,推测可能是因为血浆水平是反映组织渗漏和肝脏合成受损的综合结果。



3. 模型开发队列筛选ALD早期病理学的生物标志物

研究团队比较了22个最先进的机器学习分类器,并确定了一个逻辑回归模型作为最终分类器。使用“最小冗余-最大相关性”(mRMR)特征选择算法,研究团队选择了一个由9种蛋白质构成的生物标志物组合来识别显著的纤维化(≥F2),6种蛋白质生物标志物组合来诊断轻度炎症活动患者(≥I2),12种蛋白质生物标志物组合用于诊断肝脏脂肪变性(≥S1),ROC–AUC分别为0.90、0.85和0.91


三组生物标志物组合的22种独特蛋白质中,八种在血浆和肝脏中共调节,包括C7、LGALS3BP、TGFBI、ALDOB、CLEC3B、FBLN1、ATRN和SERPINF1。炎症组的共调节蛋白比例最高,达到67%(纤维化组和脂肪变性组分别为33%和42%)。mRMR算法还检测到ALDOB、AFM和LGALS3BP,这是研究团队之前确定为NAFLD候选标记物的六种蛋白质中的三种。当与15项公认的临床试验进行比较时,所有蛋白质组学模型都具有最高的F1分数和平衡的准确度。



4. 独立队列中验证模型性能

在独立ALD验证队列(n=63)中,F2和I2蛋白质组学模型产生的ROC–AUC值高于其他模型,ROC–AUC分别为0.87和0.81。仅脂肪变性,CAP表现优于我们的S1模型,ROC–AUC为0.88。


通过对GALA–ALD队列中457名患者的随访,并定义了肝脏相关事件和全因死亡率事件。将蛋白质组学模型与竞争性商业生物标志物和肝纤维化的组织学分期进行了比较,蛋白质组模型对患者肝脏相关事件具有最高的判别准确(Harrell''s C=0.900 ,3年和5年AUC分别是 0.945和0.933);对于全因死亡率,蛋白组学模型的也表现最好(Harrell''s C=0.789、3 年和 5 年 AUC 分别是 0.836 和 0.818)。综上所述,这项研究构建的蛋白质组学模型是准确的预后指标。



研究结论

作者利用临床大队列肝脏样本和血浆样本配对的蛋白质组学分析,发现肝脏生理病例相关的肝脏和血浆均发生显著的蛋白质组重塑现象。首次利用基于质谱的蛋白组学和机器学习模型确定三组蛋白生物标志物组合,可识别肝纤维化、炎症和脂肪变性的早期阶段。模型验证表明,基于生物标记物群组的机器学习模型优于现有的测试方法,为临床诊断和精准医疗提供可靠依据。


吉凯基因拥有“组学+生物标志物筛”整套解决方案,现阶段针对4D-DIA新签项目,除享受机制挖掘生信分析外,还可获赠生物标志物分析算法(区别于常规做法,吉凯同时提供单变量模型和多变量模型结果,助力筛选最佳生物标志物模型),详情请咨询吉凯当地销售工程师。



往期推荐

1

超值性价比| 20例样本的生物标志物也能发3~5分期刊?

2

6个样本发7分杂志?吉凯尿液蛋白组学发现罕见病新型无创诊断标志物

3

血液蛋白标志物还能发高分?25分的J Hepatology实验竟一点不复杂!

4

不做实验,纯临床样本数据发16分?180例脑脊液样本的蛋白质组学揭示AD亚型特征

5

蛋白生物标志物新进展!JACC: 基于蛋白质组学的深度学习机器算法预测死亡

6

不同标志物模型筛选出的biomarker有何差异?——您想知道的都在这篇文章里(IF 12.5)



吉凯基因凭借多年在靶标筛选及验证服务领域的技术积累,建立的标准化 、工程化 、系统化的GRP平台,为中国研究型医生提供科研服务,加快科研成果转化。其中,多组学平台包含蛋白质组学平台和高通量测序平台


·蛋白质组学平台拥有多台timsTOF Pro、Exploris 480高精度质谱仪,专业领先的Spectronaut Plusar、Mascot等分析软件,提供专业的4D、DIA、TMT、PRM、磷酸化修饰组、olink蛋白质组等检测服务,强大的机器学习算法、IPA分析、蛋白基因组分析服务,系统的生物标志物、分子分型、药物靶点、基因功能研究等解决方案,真正让广大研究型医生的科研工作更省心、更省力、更高效;


·高通量测序平台分为常规测序服务和单细胞测序服务:单细胞测序拥有10x和BD两个平台,提供单细胞RNA-seq、单细胞核测序、单细胞混样RNA-seq、单细胞TCR/BCR、单细胞(RNA+ATAC)、空间转录组测序等服务;常规测序服务提供meRIP-seq(m6A/m1A/m7G/m5C 等RNA甲基化修饰测序)、acRIP-seq(ac4C RNA乙酰化修饰测序)、ATAC-seq、Ribo-seq(翻译组测序) 、mRNA/miRNA/LncRNA/circRNA-seq、全转录组测序(两文库/三文库)、外泌体miRNA/LncRNA-seq、WGS/WES、WGBS、RRBS、BSAS等服务。



1.实验技术干货

2.蛋白质组学研究

3.腺病毒简介及应用

4.临床基础研究思路解析    

5.组织特异性腺相关病毒

6.单细胞测序    

7.慢病毒实验操作指南

8.悬浮细胞专用病毒

9.靶点设计/数据库教程

10.测序技术研究与应用

11.非编码RNA研究技术与应用

12.腺相关病毒选择/应用    

13.表观遗传研究

14.文章解析

15.国自然课题设计思路解析

16.生物信息分析及工具      

17.外泌体研究    

18.肿瘤免疫研究

19.高分文章  

20.吉凯病毒神经方向应用案例 



  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved