Nat. Commun. | 迄今为止最深入研究——多层组学分析揭示脑肿瘤调控的新机制

2021-01-28 11:18:42, 多层组学定制服务 上海欧易生物医学科技有限公司


鹿明

生物

蛋白、代谢组学服务专家

关注我们收获更多

关注







前言


在肿瘤学的研究中,致癌基因如何影响信号通路变化是人们对致癌基因造成肿瘤发生的机制认知的关键所在。本文来自美国孟菲斯St. Jude Children'' s Research Hospital的研究员在国际知名期刊Nature Communications杂志(IF=11.878)发表题为“Deepmultiomics profiling of brain tumors identifies signaling networks downstreamof cancer driver genes”的研究论文,研究者以HGG小鼠模型为研究对象,采用蛋白质组学、磷酸化修饰组学和转录组学的多组学整合研究,比较了两种由致癌受体酪氨酸激酶(RTKs:PDGFRA D842V和TPM3-NTRK1融合)驱动的HGG小鼠模型。本项研究工作进一步证实了以蛋白质组学为核心的多组学整合分析在肿瘤等复杂疾病成因分析中的优势,并提供了新的肿瘤潜在治疗思路。







标题:脑肿瘤多组学分析识别肿瘤驱动基因下游的信号网络

研究对象:小鼠脑组织

期刊:Nature Communications

影响因子:11.878

运用生物技术:蛋白质组、磷酸化蛋白质组、转录组、多层组学联合分析


研究背景


近年来,基于质谱(MS)的蛋白质组学技术已成为全蛋白组学和磷酸化蛋白质组的主流技术。与先进的DNA测序技术一起,这些方法为深入的组学分析提供了前所未有的机会。现在有可能整合转录组、深层蛋白质组和磷酸蛋白质组来剖析致癌信号网络,拓宽我们对癌症生物学的理解。


高级别胶质瘤(HGG)是最常见的恶性脑肿瘤,可导致毁灭性死亡。尽管在胶质瘤测序方面的重大努力已经揭示了全基因组的突变景观,但对基因组改变如何导致特定主调节因子和特定途径的失调的机制仍不清楚。先前的HGG蛋白质组学和磷酸蛋白质组学研究扩展了我们对HGG信号的理解,但这些尝试大多使用相对较浅深度的蛋白质组学方法。


本文采用蛋白质组、磷酸化蛋白质组和转录组整合系统生物学分析,比较了两种由致癌受体酪氨酸激酶(RTKs:PDGFRA-D842V和TPM3-NTRK1融合)驱动的HGG小鼠模型。


研究思路



研究结果


1.小鼠HGGs的深度蛋白质组和磷酸蛋白质组分析

为了产生深层的小鼠HGG蛋白组和磷酸化蛋白组,作者采用了新开发的具有广泛肽分离能力和高质量分辨率的MS管道。小鼠HGG样本是通过颅内植入p530原代星形胶质细胞产生的,该细胞经PDGFRA(D842V)突变或TPM3-NTRK1融合(图1a,分别称为PDGFRA-HGG和NTRK-HGG)。两种模型都产生了具有高度有丝分裂多形性肿瘤细胞的HGGs,许多具有星形细胞分化的特征。HGGs呈局灶性生长,在肿瘤边界有明显的侵犯周围实质的区域(图1b)。将HGG和正常小鼠皮层(对照组)样品进行蛋白质组、磷酸蛋白质组和转录组分析。串联质谱标记(TMT标记定量蛋白组学)用于实现10个样品的大规模并行蛋白质组和磷酸蛋白质组定量(图1c)。碱性pH反相液相色谱(LC)预分馏,随后用超长酸性pH反向相LC,以促进最大的肽分离。结果,13860个蛋白质(11941个基因产物,200454个肽和3264804个MS2扫描)和30431个磷酸位点(5959个磷酸蛋白质,45574个磷酸肽,1829889个MS2扫描)被鉴定出来(<1%FDR,图1c)。其中,13567个蛋白质(11718个基因产物)和28527个磷酸化位点在每个样本中被定量,代表了迄今最深的HGG蛋白质组数据集之一。

图1 | 多维组学研究流程图


为了评估数据集的质量,作者检查了两种转基因人癌基因的数据库结果,并与我们先前研究中所报告的Western blotting检测的磷酸化事件进行了比较以及所有测量的分类。外源性人PDGFRA (D842V)和TPM3-NTRK1蛋白表达水平与HGG基因型一致(图1d)。特异性磷位点的MS数据也与之前在这些HGG小鼠模型中描述的免疫印迹分析一致:AKT S473、PRAS40 T247、PDGFRA Y742、S6 S235和S6 S23622(主成分分析和层次聚类分析表明,两种RTK癌基因驱动不同的蛋白质组、磷酸蛋白质组和转录组图谱(图2a-d)在质谱分析中,组内复制样品显示出最小的变化和较低的标准偏差,而组间比较显示出差异和较大的标准偏差。对于转录组分析,来自第二组HGGs的RNAseq复制显示了这些HGG小鼠模型的高再现性(R2>0.95)。此外,在小鼠HGGs中表达的突变PDGFRA或NTRK融合基因的表达水平与在具有这些突变的人类肿瘤细胞中发现的表达水平相关。总之,这些结果表明作者的组学数据集的高质量,并证明这两个致癌的RTK驱动HGGs具有重复的独特的全局蛋白质组和磷酸蛋白质组轮廓。


作者同时分析了蛋白质组转录组的相关性。转录水平和蛋白质丰度呈中度相关(图2e,R2=0.5),与先前报道的数据一致。作者首先对转录组应用FPKM>1的截止值来过滤低质量的数据。在12842个被接受的转录本中,10838个(84%)相应的蛋白质由质谱图绘制。研究了无偏蛋白质组学分析中每个蛋白质的肽覆盖率。此外,通过比较PhosphoSitePlus数据库(最全面的蛋白质修饰数据库)中所有先前固化的小鼠磷蛋白位点来估计磷蛋白组学轮廓深度。建立的磷酸蛋白质组覆盖了大约68%的从所有细胞类型和组织中收集的小鼠磷光体,并且在数据库中不含12354个新的磷光体。总之,这些数据提供了癌症研究中最深入的蛋白质组和磷酸化蛋白质组之一的范例。

图2 | 不同样本在多维组学层面的分离聚类



2.蛋白质组学分析揭示了HGG网络模块和途径

首先在小鼠皮层、PDGFR和NTRK-HGGs中鉴定出差异表达(DE)蛋白,并通过WGCNA和ClueGO包装31进行基因共表达聚类、通路分析和功能模块分类(图3a)。共鉴定出4703个DE蛋白和6768个DE磷酸位点(2301个磷酸化蛋白),分别分布于5个全蛋白组共表达簇(WP-C)和5个磷酸蛋白组共表达簇(PP-C)(图3b、c),形成67个功能模块。与正常皮层相比,肿瘤中重组的两个最大模块是与肿瘤细胞增殖相关的细胞周期(在WP-C1中,图3d)和PI3K信号级联(在PP-C2中,图3e),后者在RTK下游传递信号。在HGG肿瘤中,包括癌症信号传导、基因表达、细胞粘附、新陈代谢和神经功能在内的一系列模块群被重新连接起来(图3f)。值得注意的是,三个簇(WP-C1、PP-C1和PP-C2)显示出相似的改变模式:皮质<PDGFRA-HGG< HGG。大多数HGG癌信号通路只在磷酸蛋白质组中改变,而不是在整个蛋白质组中改变(图3f)这突出了磷酸蛋白质组分析在解码致癌信号中不可或缺的作用。因此,这些结果表明RTK癌基因在HGG小鼠的磷酸化。



图3 | 全局网络分析确定HGGs中的常规网络和新网络


然后作者调查了包括TFs、表观遗传基因、激酶和癌症基因在内的调节蛋白家族在HGG肿瘤中的全局变化。调控蛋白的丰度通常很低,因此如果没有高灵敏度的方法很难分析。然而,深入剖析系统特征蛋白质和大量的调节蛋白的磷酸化水平。引人注目的是,作者观察到一个全球增加的蛋白质表达和大多数监管蛋白质磷酸化家族HGG肿瘤。这些蛋白大部分在NTRK HGG肿瘤中表达和磷酸化更高与PDGFRA HGGs相比。事实上,大多数DE顶部基因显示了NTRK > PDGFRA >皮层的表达模式,包括HGG致癌通路中著名的主调节因子。许多其他调控蛋白也遵循这种模式。Lyn是一种SRC家族的酪氨酸激酶,它可以增强Glut-4向细胞膜的转运,从而增加葡萄糖的吸收,这是癌症代谢的一个标志。HMGB2和HMGA2是HGG35中促进茎干性和致瘤性的转录和染色质调节因子。CD74是一个有吸引力的免疫治疗候选靶点,因为它在正常组织中数量有限,但在各种血液学肿瘤中含量很高。CTNNB1调节细胞粘附和WNT信号。因此,作者的研究结果表明,TFs、表观遗传基因、激酶和癌症基因在重新编程信号网络和维持肿瘤稳态方面具有积极作用。此外,NTRK基因型比PDGFRA基因型更能驱动全局。


3.多组学整合识别主激酶和TFs

由于通过计算机程序可以通过底物磷酸化水平推断蛋白激酶的活性,作者使用IKAP38来评估187个激酶的活性,其中41个在小鼠HGGs中被重新编程。分级聚类分析将这些激酶活性分为多个主要簇(图4a),类似于图3c(即PP-C1、PP-C2、PP-C5)中皮层、PDGFRA和NTRK HGGs的三种主要差异调控模式。通过检查磷酸化数据库中报道的激酶-底物关系,这些激酶被进一步连接到激酶-激酶信号转导网络中(图4b)。HGGs中发现了多种已知的胶质生成激酶,包括AKT、PKC、MAP激酶级联和SRC家族激酶。调节关键细胞内系统的其他激酶也被重新连接,包括AMPK (PRKAA1, PRKAA2)和p21激活的激酶(PAK1, PAK3)。AMPK代谢主传感器调节葡萄糖转运体GLUT4生产脂肪酸β-氧化,线粒体生物合成。柏加斯调节细胞骨架重组与细胞动机与正常皮层相比,HGGs也显示出更高水平的CDK5、CAMK2A和CAMK2D。虽然这些激酶是具有良好特征的神经元功能和突触可塑性的调节因子,但它们也在胶质母细胞瘤中表达,它们在胶质母细胞瘤中发挥迁移、侵袭、线粒体调节和钙信号的作用。

图4a、b | 激酶活性分析证实了HGG肿瘤模型中揭示了AKT激酶以及其下游信号通路的关键性


作者进一步总结了这些激酶在激酶超家族水平上的活性。虽然AGC,CMGC和CAMK激酶是打开在HGG肿瘤显著,与PDGFRA HGGs相比,NTRK HGGs在AGC和CMGC超家族中的活性更高,支持更强的细胞增殖信号和细胞周期 (图4 c)考虑到AKT是激活RTK后PI3K-AKT信号级联的中心节点,进一步分析了AKT底物上激酶激活的输出(图4d)。AKT底物的磷酸化模式与AKT活性一致。顶部激活的AKT底物是细胞周期和增殖调节因子、中心糖代谢调节因子、迁移和血管生成调节因子。总的来说,作者全面的激酶活性分析使主人激酶的鉴定和下游激酶激活的结果,两个HGG肿瘤模型中PI3K途径激活是由不同的受体酪氨酸激酶驱动

图4c、d | 树图显示了成对激酶活性的比较,AMPKA1是AKT中磷酸化水平最高的底物之一



作者还通过多步骤的系统生物学方法,通过对小鼠HGGs中转录组、蛋白质组和磷酸蛋白质组的整合分析,探索TFs的活性。共有47种TF活性来源于转录组中的靶基因表达,其中38种TFs经MS鉴定。全蛋白质组或磷酸蛋白质组数据支持激活38种TFs中的23种(图5b)。例如,5个TFs基于报告的激活位点的磷酸化增加而显示活性状态。在最活跃的TFs中,有一般TFs的TFII家族,它们组装RNA聚合酶II启动前复合物并控制一般转录率;转录抑制物REST是brain48中的染色质修饰剂。一直以来,REST靶基因在肿瘤中的表达较低,而在正常皮质中的表达较高(图5b),表明REST可能通过抑制靶基因表达在HGG肿瘤转化中发挥作用。因此,这种综合分析揭示了TF激活物和抑制物的激活,从而导致肿瘤细胞转录组和蛋白质组的变化。

图5b | 转录组、蛋白组和磷酸化蛋白组中TF活性变化情况



最后,作者在HGG中构建了以激酶TF为中心的网络,在磷酸化数据库和ENCODE数据库中加入已知的激酶到激酶和TF到靶基因的连接,在数据集中具有一致的共激活模式,从而形成了一个由五种激酶和六个TFs(图5c)。c-MYC家族和AP-1家族在肿瘤发生中调节多种中枢生物学过程。事实上,超过100个c-MYC靶点是转录活性的,强烈支持cMYC在HGG肿瘤中的中心作用(图5c)

图5c | 通过激酶、TFs和具有共激活模式的基因靶点综合分析揭示了核心信号网络


对主TFs的仔细检查发现HGGs中主要的转录激活下游生物过程(图5c)。最活跃的生物过程与增殖有关,包括核糖体的生成、翻译和RNA处理(c-MYC、BRCA1和CEBPB的靶点),能量代谢包括线粒体和代谢(c-MYC、JUN和EP300的靶点),细胞迁移包括细胞外基质和局部粘附(JUN和CEBPB的靶点)。在激酶TF网络中,c-MYC、JUN和EP300通过主能量和增殖传感器激酶(AMPK和MAPK)的磷酸化被激活。值得注意的是,这三种TFs激活的多种代谢酶在增殖和能量胁迫过程中起着关键作用,如腺嘌呤磷酸核糖转移酶(APRT),它调节核苷酸补救途径以从头合成嘌呤和鸟氨酸脱羧酶(ODC1)用于多胺生物合成对生长刺激的响应。总之,我们的系统生物学方法利用多层信息来优先考虑HGG-TFs、激酶及其在HGG肿瘤中的相互作用。


跨物种组学整合可能是一种有效的方法来识别癌变,因此,作者还将小鼠HGGs中最显著改变的组学数据集映射回人类转录组数据,以搜索由跨物种NTRK和PDGFRA突变驱动的一致性改变,从而在小鼠和人类中产生20个稳定性改变的列表。据报道,这些基因中的大多数在癌症相关过程中发挥作用,包括调控癌细胞的干细胞、血管生成、肿瘤微环境和侵袭,同时突出了物种间分析的潜力,可以从大量的多组学数据集中优先选择与癌症相关的候选基因。


4.NTRK在小鼠HGG中是一个比PDGFRA更强的致癌因子

生物信息学分析显示NTRK-HGG的全球癌症网络重组能力强于PDGFRA-HGG,说明NTRK的致癌潜能高于PDGFRA突变。为了评估RTK肿瘤驱动基因的致癌潜能,作者改进了最初设计用于基因表达分析的PAC算法,以计算PI3K-AKT信号的总活性。该蛋白活性来源于具有已知的促进或抑制肿瘤发生功能的磷酸化位点。在这两种HGG中,PI3K-AKT通路明显活跃,并激活类似的下游通路,如蛋白质合成、细胞周期进程、细胞增殖和血管生成(图6a)。当比较这些蛋白的27个调节性磷酸位点时,这些蛋白在NTRK和PDGFRA-HGGs之间具有统计学差异,大多数(n=23)NTRK-HGG的变化高于PDGFRA-HGG(图6b)。一致地,NTRK-HGG显示出1.45倍的PI3K-AKT信号活性,表明TPM3NTRK1融合基因具有比PDGFRA-D842V更强的致癌潜能。

图6 | NTRK与PDGFRA突变的HGG模型差异


为了实验验证TPM3-NTRK1和PDGFRA-D842V的致癌潜能,作者分析了两种HGG小鼠的细胞增殖指数和Kaplan-Meier生存曲线。增殖指数是由表达增殖标志物Ki67的肿瘤细胞的比例决定的(图6c)。用增强的PI3K-AKT信号对4例NTRK1驱动的HGG和4例PDGFRA驱动的HGG的增殖指数进行定量分析,NTRK-HGG的增殖指数(0.32±0.04)比PDGFRA-HGG的增殖指数(0.22±0.07)高1.45倍,经Student''s t检验p值为0.048。一直以来,NTRK-HGG小鼠的潜伏期比PDGFRA小鼠短得多(中位生存时间分别为16天和30天,图6d)。


TPM3-NTRK1和PDGFRA D842V均激活PI3K-AKT信号,但作用强度不同。PDGFRA蛋白的物种特异性分析表明两种HGG模型在RTK上调方面存在差异。质谱测量显示由人PDGFRA D842V基因驱动的HGGs表达的小鼠野生型PDGFRA蛋白水平低于NTRK HGGs(图7a)。作者通过小鼠氨基酸序列特异性肽定量内源性小鼠PDGFRA,并通过Western blotting验证这一发现(图7b)。许多其他rtk(EphA2、EGFR、FLT4、PTK7和ROR2)在NTRK-HGG中的蛋白表达也高于PDGFRA-HGG(图7c)转录组学测量一致表明这些RTK上调。Western blotting进一步证实了伴随磷酸化反应的EphA2过度表达和激活(图7d)。为了确定促进RTK表达的潜在机制,作者搜索ENCODE和MsigDB数据库,以确定调节RTK转录的TFs,并通过其蛋白质水平或磷酸化状态验证TF活性(图7e)。同时用Western blotting证实延验证MYC的变化(图7f)。综上所述,这些生物信息学和实验结果表明,NTRK融合基因诱导了其他RTK的过度表达和激活,提示PI3K-AKT信号中存在一个调节,从而导致比PDGFRA-driven-HGG更具侵袭性的肿瘤(图7g)

图7 | NTRK增强其他RTK的表达和激活


5.CRISPR-Cas9筛选证实了HGG中的分子靶点

 为了研究肿瘤生存是否需要多组学方法优先考虑的主调节因子,作者首先建立了从NTRK-driven-HGG小鼠肿瘤组织中收集的HGG原代细胞的体外培养,然后设计了一个用于在CRISPR-Cas9分析中靶向这些主调节因子的集合mini-gRNA文库(图8a)


在CRISPR-Cas9筛选过程中,作者针对两类主调节因子(激酶和TFs),包括来自转录组蛋白质组数据的9个基因(图8b),还针对通过与小鼠和人类肿瘤的跨物种比较确定的6个基因,每个基因都有6个不同的gRNA(即3个不同的双gRNA结构)。CRISPR-Cas9筛选揭示了一种新的肿瘤能量代谢脆弱性,以及Jun和Myc参与NTRK融合诱导的肿瘤发生,同时证实了多组学综合方法发现主调节因子的有效性。

图8 | CRISPR-Cas9验证筛选识别新的靶点


相关讨论

转录组学和蛋白质组学分析对于理解癌症生物学中潜在的中枢调控机制起着不可或缺的作用。由于mRNA水平通常仅与蛋白质水平中度相关,因此需要对转录组和蛋白质组进行分析,以获得癌症生物学中基因表达的完整图像。在这里,展示了深度蛋白质组覆盖和多组学数据集整合的能力,以探索潜在的肿瘤发生的分子机制。优化的长梯度LC-MS/MS系统、定义的磷酸肽富集和先进的生物信息学工具的最新发展极大地提高了癌症研究中蛋白质组分析的深度,促进了几乎所有表达蛋白质的检测。


同位素标记(如TMT和iTRAQ)是一种高效、重复性好的复合深度蛋白质组学定量分析方法。同时,一个全面的磷酸蛋白质组分析提供了关于通路/网络活动的补充信息,因为通路中的许多成分在蛋白质水平上没有改变,但在信号转导过程中磷酸化状态发生了改变。尽管由于无偏蛋白质组学方法固有的局限性,一些已知的磷酸化位点被遗漏,但在这个深度磷酸化蛋白质组数据集中,本研究已经在KEGG数据库中检测到几乎所有NTRK和PDGFRA调节的途径。


在这里,进行加权共表达聚类分析,从4703个差异表达的蛋白质和6768个差异化的磷酸化磷酸酯中提取十个蛋白质组和磷酸化蛋白质组,这大大降低了数据的复杂性。这很容易识别出在胶质瘤生长中有明确作用的主要途径,以及与RTK激活12,17下游PI3K和mTOR信号传导的明确联系。通过整合多组学数据和各种数据库,为激酶和TFs开发了系统的蛋白质活性推断策略,以进一步确定41个激酶、23个TFs的优先级,以及由这些基因簇和网络模块的9个主调节组成的核心网络。


随着组学技术的快速发展和大数据集的积累,这种集成的生物信息学管道为癌症组学研究中主基因和核心信号网络的优先排序提供了一个通用平台。结合CRISPR-Cas9功能筛选,该管道将提供对致癌过程的增强机制理解,并阐明潜在的治疗弱点。


实验结论

高通量的组学方法为剖析肿瘤生物学中的分子机制提供了前所未有的机会。本文用突变的RTK癌基因PDGFRA和NTRK1对两种高级别胶质瘤(HGG)小鼠模型进行了全蛋白组、磷酸蛋白组和转录组的深度分析,用质谱分析了鉴定了13860个蛋白和30431个磷酸位点。系统生物学方法鉴定了许多调节因子,包括41个激酶和23个转录因子。通路活性计算和小鼠存活率表明,NTRK1突变诱导了AKT下游靶点MYC和JUN的高激活,驱动正反馈回路上调多种RTK,并赋予了比PDGFRA突变更高的致癌潜能。一个小型gRNA文库CRISPR-Cas9验证筛选显示,56%的被测主调节因子对NTRK驱动的HGG细胞的生存能力很重要,包括TFs(Myc和Jun)和代谢激酶(AMPKa1和AMPKa2),证实了多组学综合方法的有效性,寻找到潜在的肿瘤治疗靶点,为后续转化医学研究提供新思路



文末看点

本文运用全蛋白组、磷酸蛋白组和转录组的深度分析,证实了多层组学综合方法在脑肿瘤研究中的有效性。同时,鹿明生物是国内早期开展以蛋白组和代谢组为基础的多层组学整合实验与分析的团队,在蛋白质组学平台 ,公司建立起了iTRAQ/TMT、DIA、PRM、修饰蛋白组等蛋白组学技术平台,其中在磷酸化蛋白组学,目前鹿明生物也已经自主研发了大容量水稻DIA数据库深度水稻磷酸化DIA数据库,希望能够为您的科研助力添彩;详情请戳【1+1层层递进】蛋白质组学水稻DIA与水稻磷酸化DIA的碰撞


猜你还想看


项目文章mSystems | 多组学联合分析指导生产应用:人工窖泥培养技术及白酒质量优化

玩转生信—火山图中“亿点细节”,你会打造吗?

项目文章 | 地黄突破性研究:运用LC-MS非靶向平台掀起中药代谢组研究新航向

Nature Medicine重磅突破 | 迄今为止最大的阿兹海默症相关蛋白质组学研究


END



小鹿迷  撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

“阅读原文”了解更多


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved