2021-01-28 11:18:42, 多层组学定制服务 上海欧易生物医学科技有限公司
前言
迄今为止,包括癌细胞系百科全书(CCLE)在内的细胞系集合大规模分析,多数集中在遗传信息分析上,对蛋白质组的深入研究仍远远不足。2020年1月23日,Cell在线发表了题为:Quantitative Proteomics of the Cancer Cell Line Encyclopedia的最新研究成果。来自美国哈佛医学院Steven P. Gygi、David P. Nusinow等研究人员通过质谱法,对CCLE中375种不同来源细胞系的数千种蛋白质进行定量蛋白质组分析,为癌细胞百科全书增添了全新的篇章。
标题:癌细胞系的蛋白质组百科全书
研究对象:癌症细胞系
期刊:Cell
影响因子:36.216
发表时间:2020年1月
运用生物技术:蛋白质组学
文章亮点
▶ 对来自CCLE中不同谱系的375个癌细胞系的蛋白质组进行分析;
▶ 分析了多种途径中相关蛋白质的表达;
▶ 微卫星不稳定性细胞系中,复杂蛋白复合体下调表达;
▶ 分析了与基因敲低和突变敏感性相关的蛋白复合物。
研究背景
如今,癌症基因组学迎来了多模态、多层级、超高通量的全新时代,而CCLE计划也与时俱进地不断进行着更新与发展。2019年5月,CCLE项目组在Nature上发表长文,报道了癌细胞系百科全书的重大更新。在之前已有的DNA突变、基因表达和染色体拷贝数信息之外,CCLE项目人员对1000余种癌细胞系进行了基于RPPA的数百种蛋白定量、基于RNA-seq的可变剪切及miRNA定量、基于RRBS的启动子甲基化定量、以及基于代谢组学的数百种代谢物定量等。
尽管CCLE对癌细胞系的分子特征刻画已经渐趋完善,但对于蛋白质的全局描绘仍有不足,缺乏对不同人群中的人类样本进行大规模蛋白质组学研究。本篇为了弥补RPPA在蛋白定量规模上的不足,对于CCLE项目数据深度研究,可谓是更上N层楼。
研究思路
研究结果
1.高深度、高广度的蛋白质组定量分析
作者从CCLE中选择375个细胞系进行TMT蛋白质定量分析。这些细胞系分布在22个谱系中,以组织器官为主(图1A),共鉴定到12755个蛋白,其中9000个蛋白质可以在大多数样本中鉴定到(图1B)。对(图1A)中所示的前18个细胞系进行蛋白组学分析,每组3个生物学重复,且后2个生物学重复是在第一个生物学重复一年后产生的,聚类分析发现检测的所有细胞系中后2个生物学重复聚类更紧密。(图1C)。
图1 | 375个不同肿瘤细胞的蛋白质组学定量分析
(A)数据分析流程;
(B)所有样本中定量的蛋白质重叠;
(C)前18个细胞系的生物学重复聚类(n=3)
层次聚类与组织谱系具有一定的一致性(图2A)。RNA数据的聚类具有类似的复杂聚类(图2A)。在这两种情况下,皮肤和造血淋巴系比其他系更紧密地聚集在一起,蛋白质数据的组织谱系一致性略低于RNA。通过蛋白和RNA表达的相关性,蛋白组数据与来自同一细胞系的相应RNA的相关性最高(图2B)。RNA和蛋白质表达之间的相关性变化很大,平均值略低于0.5,与前人的研究一致(图2D)。
图2 | 蛋白质与RNA表达的相关性
(A)使用在所有样本中量化的蛋白质(左)及其相应的RNA-seq表达(中)进行分层聚类;
(B)蛋白质表达(Y轴)和RNA-seq(X轴)样本之间的相关性;
(C)基因和蛋白表达的Pearson相关性图;
(D)低(左)相关基因和高(右)相关基因的RNA和蛋白质表达示例。
2.相关的生物学途径和过程组织了大量的蛋白质表达
主成分分析(PCA)表明:造血和淋巴系与组织器官分离,构成PC1投射的很大一部分(图3A),之后,作者进一步的从分析中移除造血和淋巴系(图3B)。基于前人研究,蛋白质复合物的组成被描述为蛋白质组变异的主要驱动因素。但这些共变异表达如何影响的结果尚不清楚。作者假设PC1的投射可能是由有组织的蛋白质共同表达引起的,因为它们具有共同的生物功能,而不是组织谱系或突变。为了测试这一点,作者使用GSEA对PC1中的蛋白质进行信号通路分析,超过200条信号通路富集(图3C和4B)。GO分类富集分析发现还有数百个基因集具有丰富的共表达(图4A和4C)。然而,当对RNA数据的PC1进行GSEA富集分析时,沿着RNA PC1富集的pathway和GO类别要少得多(图4B和4C)。
图3 | 大多数细胞系主要由蛋白质复合物和pathway协调表达
(A)所有样本的蛋白质表达数据的主成分分析,暗橙色点是造血和淋巴系;
(B)去除造血和淋巴系后的PCA投影;
(C)信号通路中协同表达量的聚类热图。
图4 | 跨生物过程的协同表达与细胞蛋白质组变化有关
(A)在PC1载荷中富集选定的GO term聚类热图;
(B-D)RNA PC1的功能分析(pathway、GO、转录因子结合位点)。
3.蛋白复合物在微卫星不稳定细胞系中的差异表达
作者试图研究高突变负荷对蛋白质组的影响。而MSI是CCLE超突变的主要形式。mRNA数据中有超过1000个与MSI相关的显著上调和下调基因(图5A)。然而,与之形成鲜明对比的是,蛋白质表达数据显示与50个蛋白表达与MSI相关,其中30个与mRNA数据中鉴定到。
图5 | 微卫星不稳定性与蛋白复合物的下调有关
(A)与MSI相关的mRNA和蛋白分析;
(B)蛋白互作网络分析;
(C)在微卫星稳定(MSS)和MS中的蛋白表达量分析。
4.MSI相关蛋白与MutL和MutS复合物表达的差异相关
虽然同一个复合物的成员之间的关系很清楚,但不同的复合物是如何相互联系的还不清楚。将在所有样本中发现的蛋白质的MSI系中的表达模式关联起来,显示出多个簇(图6A)。正如所料,同一复合体内的蛋白质聚集在一起。HMT复合蛋白存在于含有MutL的簇中。相反,MRN和SKI复合体以及LTN1与MutS复合体聚集在一起(图6A)。而在非MSI系中,这些复合物之间的相关关系非常不同(图6B)。
MSI是超突变的一种形式,为了研究MSI、突变负荷或其组合是否是导致上述聚类的原因,作者比较了每种蛋白质表达的三个线性模型:一个使用MSI状态,一个使用总突变负荷,一个使用MSI状态和突变负荷之间的相互作用。其表达与MutL相关的一组蛋白质通常最适合单独使用MSI状态的模型(图6C)。而在包含MutS、SKIV2L、TTC37和LTN1的集群中,因为考虑突变负荷通常会改进模型,使其适合于单独的MSI状态(图6D)。
图6 | MSI细胞系中蛋白质复合物变化的相关性
(A)和(B)在所有样品中量化的MSI细胞系中改变的所有蛋白质之间的相关矩阵的热图;(C)和(D) 蛋白质复合物成员根据MSI状态和总突变负荷的组合的差异表达;
(E)突变基因和蛋白质表达量之间的显著关联网络图;
(F)RPL22和RPL22L1的表达量;
(G)和(H)蛋白质表达与WRN和RPL22L1对shRNA敲除的敏感性相关;
(I)MSS和MSI细胞系中H3K4me1和me2的含量。
5.RPL22突变与MSI中差异表达的蛋白复合物有关
前期的研究鉴别出RPL22是MSI子宫内膜癌的突变热点,当RPL22缺失时,RPL22L1表达提供功能替代。RPL22与错配修复等复合物中的蛋白质表达变化有独特的关联(图6E)。RPL22在MSI细胞中的表达与MutS复合物聚集在一起(图6A),最适合RPL22和RPL22L1的模型是MSI和突变负荷的组合(图6F),如SKI复合物和LTN1。对DRIVE数据的分析表明,一些失配修复复合物成员的蛋白表达与WRN基因敲除的敏感性相关(图6G)。令人惊讶的是,SKI复合蛋白SKIV2L和TTC37也与WRN敏感性相关,进一步证明它们的下调与MSI相关。预测对RPL22L1和WRN丢失敏感的蛋白表达是SKIV2L(图6H)。因此推测RPL22L1的敏感性与引起MSI的蛋白质的状态没有紧密联系,但可能更与SKI复合物和核糖体相关的表型有关。
6.蛋白复合物水平与基因敲除和突变敏感性有关
在DRIVE数据中,有几个基因对敲除的敏感性与蛋白质复合物的至少一半成员相关(图7A)。其中包括与其组成部分之一的基因敲除相关的复合物,包括ATR-ATRIP和复制蛋白A(RPA)复合物(图7A-7C)。根据这些基因的已知功能,与基因敲除相关的复合物都与细胞分裂有关,包括染色体复合物(CPC)和细胞周期蛋白依赖激酶(CDK)复合物。MDM2基因敲除敏感性与微染色体维持蛋白复合物(MCM)复合物的数量有关(图7A、7D和7E)。与个别突变相关的蛋白质复合物变化的额外分析恢复了与RPL22突变相关的失配修复和SKI复合物以及如上所述的激酶插入域受体(KDR)(图6E和7J)。然而,SUMO E1异二聚体与丝氨酸内肽酶PCSK7的突变有唯一的关联(图7J-7L)。PCSK7与MSI改变的一些蛋白质有关(图6E),但与MSI或SUMO没有已知的联系。
图7 | 蛋白质复合物与特定基因敲除敏感性和突变相关
(A)与不同基因shRNA敲除敏感性显著相关的蛋白质复合物组分的热图;
(B-I)基因敲除敏感性(X轴)与蛋白表达(Y轴)的关联性;
(J)与特定基因突变相关的蛋白质复合物部分;
(K)和(L) 与PCSK7突变状态比较,SAE1(K)和UBA2(L)的表达。
研究结论
蛋白质组的一个基本组织原理是通路之间的协同表达,这种广泛的组织与大约75%的表达蛋白质相关。对微卫星不稳定(MSI)细胞系的分析发现,跨样本基因的蛋白水平和转录水平相关系数较低,暗示了利用RNA-seq数据推测蛋白表达水平具有一定的局限性。通过生物学途径与功能基因注释富集分析发现,蛋白质表达的主要变化是围绕生物学途径进行的,并且在不同的途径的组成成分之间存在一定的相关性。同时,研究者还利用本次定量蛋白质组学数据详细解读微卫星不稳定( microsatellite instable, MSI )细胞系与一些特定蛋白复合物表达之间的联系,探究了MSI状态下对基因敲除与突变具有敏感性的蛋白复合物的表达情况,为癌症基因组学和癌症精准治疗发展提供新思路。
文末看点
部分文献参考
David P.Nusinow, John Szpyt,et al. Quantitative Proteomics of the Cancer Cell Line Encyclopedia [J]. Cell .,2020 Jan.
猜你还想看
END
小白龙 撰文
欢迎转发到朋友圈
本文系鹿明生物原创
转载请注明本文转自鹿明生物
我知道你在看哟
点“阅读原文”了解更多
03-27 市场部
新年拆新书!与飞诺美一起加载2024色谱新旅程03-27 市场部
保护生命线——血液制品的质检03-27 Viny
会议提醒 | 基因疗法中的腺相关病毒(AAV)分析难点03-27 市场部
Empower控制质谱,系列使用小贴士来了!(二)| 沃特世质谱以旧换新进行时03-26 沃特世技术服务
赛默飞与蛋白设施达成战略合作,助力蛋白质科学创新发展03-26
女性在安捷伦的职业生涯--ACG集团新任总裁Angelica Riemann的分享03-26
焕新发展, 牛津仪器中国售后业务再升级 —— 访牛津仪器中国区总裁何峻、服务总监王方03-26
Oi Service直播讲堂:牛津仪器能谱仪及窗口的日常维护03-26 牛津仪器客户服务
论文征集活动丨安东帕 Absolutely Autosorb 奖03-26 Anton Paar China
仪器选型电子书 | 安东帕助力仪器设备更新升级03-26
Webinar | 第二届安东帕“先进材料表征技术”系列直播03-26 Anton Paar China
Service售后 | ViscoQC 黏度计保持长久精准测量的技巧03-26
邀请函 | 安东帕高精度旋光仪&折光仪用户培训会-4/12 广州03-26
邀请函 | 安东帕微波消解/萃取用户培训会-4/25-26 上海03-26
初代timsTOF Pro单个细胞蛋白质定量突破3000大关03-26 4D-组学老虎队
【制药大咖讲】高通量蛋白质-配体相互作用筛选,提升苗头化合物发现质量03-26 制药高能火箭队
【喜报】:科鉴检测成为首批“制造企业可靠性工程能力评价机构”03-25
GE医疗携手英伟达开创超声无界创新的新时代03-25
热点应用丨超光稳定小分子染料推动近红外生物光子学03-25 数联