癌症研究新篇章,Cell | 癌细胞系的蛋白质组百科全书

2021-01-28 11:18:42, 多层组学定制服务 上海欧易生物医学科技有限公司


鹿明

生物

蛋白、代谢组学服务专家

关注我们收获更多

关注







前言



迄今为止,包括癌细胞系百科全书(CCLE)在内的细胞系集合大规模分析,多数集中在遗传信息分析上,对蛋白质组的深入研究仍远远不足。2020年1月23日,Cell在线发表了题为:Quantitative Proteomics of the Cancer Cell Line Encyclopedia的最新研究成果。来自美国哈佛医学院Steven P. Gygi、David P. Nusinow等研究人员通过质谱法,对CCLE中375种不同来源细胞系的数千种蛋白质进行定量蛋白质组分析,为癌细胞百科全书增添了全新的篇章







标题:癌细胞系的蛋白质组百科全书

研究对象:癌症细胞系

期刊:Cell

影响因子:36.216

发表时间:2020年1月

运用生物技术:蛋白质组学


文章亮点



  对来自CCLE中不同谱系的375个癌细胞系的蛋白质组进行分析;

▶  分析了多种途径中相关蛋白质的表达;

▶  微卫星不稳定性细胞系中,复杂蛋白复合体下调表达;

▶  分析了与基因敲低和突变敏感性相关的蛋白复合物


研究背景



如今,癌症基因组学迎来了多模态、多层级、超高通量的全新时代,而CCLE计划也与时俱进地不断进行着更新与发展。2019年5月,CCLE项目组在Nature上发表长文,报道了癌细胞系百科全书的重大更新。在之前已有的DNA突变、基因表达和染色体拷贝数信息之外,CCLE项目人员对1000余种癌细胞系进行了基于RPPA的数百种蛋白定量、基于RNA-seq的可变剪切及miRNA定量、基于RRBS的启动子甲基化定量、以及基于代谢组学的数百种代谢物定量等。


尽管CCLE对癌细胞系的分子特征刻画已经渐趋完善,但对于蛋白质的全局描绘仍有不足,缺乏对不同人群中的人类样本进行大规模蛋白质组学研究。本篇为了弥补RPPA在蛋白定量规模上的不足,对于CCLE项目数据深度研究,可谓是更上N层楼。


研究思路




研究结果



1.高深度、高广度的蛋白质组定量分析

作者从CCLE中选择375个细胞系进行TMT蛋白质定量分析。这些细胞系分布在22个谱系中,以组织器官为主(图1A),共鉴定到12755个蛋白,其中9000个蛋白质可以在大多数样本中鉴定到(图1B)。对(图1A)中所示的前18个细胞系进行蛋白组学分析,每组3个生物学重复,且后2个生物学重复是在第一个生物学重复一年后产生的,聚类分析发现检测的所有细胞系中后2个生物学重复聚类更紧密。(图1C)


图1 | 375个不同肿瘤细胞的蛋白质组学定量分析


(A)数据分析流程;

(B)所有样本中定量的蛋白质重叠;

(C)前18个细胞系的生物学重复聚类(n=3)


层次聚类与组织谱系具有一定的一致性(图2A)。RNA数据的聚类具有类似的复杂聚类(图2A)。在这两种情况下,皮肤和造血淋巴系比其他系更紧密地聚集在一起,蛋白质数据的组织谱系一致性略低于RNA。通过蛋白和RNA表达的相关性,蛋白组数据与来自同一细胞系的相应RNA的相关性最高(图2B)。RNA和蛋白质表达之间的相关性变化很大,平均值略低于0.5,与前人的研究一致(图2D)

图2 | 蛋白质与RNA表达的相关性

(A)使用在所有样本中量化的蛋白质(左)及其相应的RNA-seq表达(中)进行分层聚类;

(B)蛋白质表达(Y轴)和RNA-seq(X轴)样本之间的相关性;

(C)基因和蛋白表达的Pearson相关性图;

(D)低(左)相关基因和高(右)相关基因的RNA和蛋白质表达示例。


2.相关的生物学途径和过程组织了大量的蛋白质表达

主成分分析(PCA)表明:造血和淋巴系与组织器官分离,构成PC1投射的很大一部分(图3A),之后,作者进一步的从分析中移除造血和淋巴系(图3B)。基于前人研究,蛋白质复合物的组成被描述为蛋白质组变异的主要驱动因素。但这些共变异表达如何影响的结果尚不清楚。作者假设PC1的投射可能是由有组织的蛋白质共同表达引起的,因为它们具有共同的生物功能,而不是组织谱系或突变。为了测试这一点,作者使用GSEA对PC1中的蛋白质进行信号通路分析,超过200条信号通路富集(图3C和4B)。GO分类富集分析发现还有数百个基因集具有丰富的共表达(图4A和4C)。然而,当对RNA数据的PC1进行GSEA富集分析时,沿着RNA PC1富集的pathway和GO类别要少得多(图4B和4C)


图3 | 大多数细胞系主要由蛋白质复合物和pathway协调表达


(A)所有样本的蛋白质表达数据的主成分分析,暗橙色点是造血和淋巴系;

(B)去除造血和淋巴系后的PCA投影;

(C)信号通路中协同表达量的聚类热图。


图4 | 跨生物过程的协同表达与细胞蛋白质组变化有关


(A)在PC1载荷中富集选定的GO term聚类热图;

(B-D)RNA PC1的功能分析(pathway、GO、转录因子结合位点)。


3.蛋白复合物在微卫星不稳定细胞系中的差异表达

作者试图研究高突变负荷对蛋白质组的影响。而MSI是CCLE超突变的主要形式。mRNA数据中有超过1000个与MSI相关的显著上调和下调基因(图5A)。然而,与之形成鲜明对比的是,蛋白质表达数据显示与50个蛋白表达与MSI相关,其中30个与mRNA数据中鉴定到。

图5 | 微卫星不稳定性与蛋白复合物的下调有关


(A)与MSI相关的mRNA和蛋白分析;

(B)蛋白互作网络分析;

(C)在微卫星稳定(MSS)和MS中的蛋白表达量分析。


4.MSI相关蛋白与MutL和MutS复合物表达的差异相关

虽然同一个复合物的成员之间的关系很清楚,但不同的复合物是如何相互联系的还不清楚。将在所有样本中发现的蛋白质的MSI系中的表达模式关联起来,显示出多个簇(图6A)。正如所料,同一复合体内的蛋白质聚集在一起。HMT复合蛋白存在于含有MutL的簇中。相反,MRN和SKI复合体以及LTN1与MutS复合体聚集在一起(图6A)。而在非MSI系中,这些复合物之间的相关关系非常不同(图6B)


MSI是超突变的一种形式,为了研究MSI、突变负荷或其组合是否是导致上述聚类的原因,作者比较了每种蛋白质表达的三个线性模型:一个使用MSI状态,一个使用总突变负荷,一个使用MSI状态和突变负荷之间的相互作用。其表达与MutL相关的一组蛋白质通常最适合单独使用MSI状态的模型(图6C)。而在包含MutS、SKIV2L、TTC37和LTN1的集群中,因为考虑突变负荷通常会改进模型,使其适合于单独的MSI状态(图6D)

图6 | MSI细胞系中蛋白质复合物变化的相关性

 

(A)和(B)在所有样品中量化的MSI细胞系中改变的所有蛋白质之间的相关矩阵的热图;(C)和(D) 蛋白质复合物成员根据MSI状态和总突变负荷的组合的差异表达;

(E)突变基因和蛋白质表达量之间的显著关联网络图;

(F)RPL22和RPL22L1的表达量;

(G)和(H)蛋白质表达与WRN和RPL22L1对shRNA敲除的敏感性相关;

(I)MSS和MSI细胞系中H3K4me1和me2的含量。



5.RPL22突变与MSI中差异表达的蛋白复合物有关

前期的研究鉴别出RPL22是MSI子宫内膜癌的突变热点,当RPL22缺失时,RPL22L1表达提供功能替代。RPL22与错配修复等复合物中的蛋白质表达变化有独特的关联(图6E)。RPL22在MSI细胞中的表达与MutS复合物聚集在一起(图6A),最适合RPL22和RPL22L1的模型是MSI和突变负荷的组合(图6F),如SKI复合物和LTN1。对DRIVE数据的分析表明,一些失配修复复合物成员的蛋白表达与WRN基因敲除的敏感性相关(图6G)。令人惊讶的是,SKI复合蛋白SKIV2L和TTC37也与WRN敏感性相关,进一步证明它们的下调与MSI相关。预测对RPL22L1和WRN丢失敏感的蛋白表达是SKIV2L(图6H)。因此推测RPL22L1的敏感性与引起MSI的蛋白质的状态没有紧密联系,但可能更与SKI复合物和核糖体相关的表型有关。


6.蛋白复合物水平与基因敲除和突变敏感性有关

在DRIVE数据中,有几个基因对敲除的敏感性与蛋白质复合物的至少一半成员相关(图7A)。其中包括与其组成部分之一的基因敲除相关的复合物,包括ATR-ATRIP和复制蛋白A(RPA)复合物(图7A-7C)。根据这些基因的已知功能,与基因敲除相关的复合物都与细胞分裂有关,包括染色体复合物(CPC)和细胞周期蛋白依赖激酶(CDK)复合物。MDM2基因敲除敏感性与微染色体维持蛋白复合物(MCM)复合物的数量有关(图7A、7D和7E)。与个别突变相关的蛋白质复合物变化的额外分析恢复了与RPL22突变相关的失配修复和SKI复合物以及如上所述的激酶插入域受体(KDR)(图6E和7J)。然而,SUMO E1异二聚体与丝氨酸内肽酶PCSK7的突变有唯一的关联(图7J-7L)。PCSK7与MSI改变的一些蛋白质有关(图6E),但与MSI或SUMO没有已知的联系。


图7 | 蛋白质复合物与特定基因敲除敏感性和突变相关


(A)与不同基因shRNA敲除敏感性显著相关的蛋白质复合物组分的热图;

(B-I)基因敲除敏感性(X轴)与蛋白表达(Y轴)的关联性;

(J)与特定基因突变相关的蛋白质复合物部分;

(K)和(L) 与PCSK7突变状态比较,SAE1(K)和UBA2(L)的表达。



研究结论



蛋白质组的一个基本组织原理是通路之间的协同表达,这种广泛的组织与大约75%的表达蛋白质相关。对微卫星不稳定(MSI)细胞系的分析发现,跨样本基因的蛋白水平和转录水平相关系数较低,暗示了利用RNA-seq数据推测蛋白表达水平具有一定的局限性。通过生物学途径与功能基因注释富集分析发现,蛋白质表达的主要变化是围绕生物学途径进行的,并且在不同的途径的组成成分之间存在一定的相关性。同时,研究者还利用本次定量蛋白质组学数据详细解读微卫星不稳定( microsatellite instable, MSI )细胞系与一些特定蛋白复合物表达之间的联系,探究了MSI状态下对基因敲除与突变具有敏感性的蛋白复合物的表达情况,为癌症基因组学和癌症精准治疗发展提供新思路。


文末看点


本篇对CCLE中375种不同来源细胞系的数千种蛋白质进行定量蛋白质组分析,为癌症细胞百科全书增添了全新的篇章。


进一步证实了蛋白组学在组学研究中发挥了巨大作用,其中针对蛋白组学新星DIA+PRM技术,鹿明生物拥有丰富完善的项目经验,已经自主研发了大容量水稻DIA数据库及深度水稻磷酸化DIA数据库,希望能够为您的科研助力添彩;


同时,鹿明生物也推出蛋白组学检测+验证一体化--1+1>2的蛋白组学黄金组合服务:DIA +PRM技术满24个样本,为您立省18000元详情请戳打破WB&ELISA的局限?  不用抗体也能做WB? 目标蛋白定量分析的新宠




部分文献参考

David P.Nusinow, John Szpyt,et al. Quantitative Proteomics of the Cancer Cell Line Encyclopedia [J]. Cell .,2020 Jan.



猜你还想看


项目文章 | GC-MS和LC-MS非靶向代谢组学助力南京医科大学的药物抗性研究

来看,技术大咖深度揭密(WB替代)PRM技术——内附技术视频

Nat. Commun. | 迄今为止最深入研究——多层组学分析揭示脑肿瘤调控的新机制

项目文章mSystems | 多组学联合分析指导生产应用:人工窖泥培养技术及白酒质量优化


END



小白龙 撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

“阅读原文”了解更多


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved