4D-DIA技术 | 蛋白质组学领军科学家带您走进4D组学新时代

2021-01-28 11:03:41, 多层组学定制服务 上海欧易生物医学科技有限公司


点击上方“蓝色字体”关注我们

鹿明

生物

蛋白、代谢组学服务专家

关注我们收获更多

关注







前言


2020年12月蛋白质组领域领军科学家Matthias Mann团队(Max Planck Institute of Biochemistry)、Hannes Röst团队(University of Toronto)、Ben Collins团队(ETH Zurich)以及Ruedi Aebersold团队(ETH Zurich)在Nature methods发表题为“diaPASEF: parallel accumulation–serial fragmentation combined with data-independent acquisition”的文章,其共同开发的基于4D平台的DIA技术——diaPASEF能够全面提升蛋白质鉴定覆盖率、重现性和定量准确性。



中文标题:diaPASEF:平行累积连续碎裂技术与数据非依赖性采集相结合

研究对象:timsTOF Pro质谱仪 (Bruker Daltonik)

发表期刊:Nature methods

影响因子:30.822

发表时间:2020.12

运用生物技术:DIA-PASEF


研究背景


传统的蛋白质组学采用数据依赖性采集(Data-dependent Acquisition, DDA)策略,特定的肽段信号被连续的选择并碎裂,产生二级质谱图(MS/MS)。这种采集方法偏向于获取高丰度肽段,导致缺失值的问题。与之相比,数据非依赖性采集(Data-independent Acquisition, DIA)技术将质谱整个扫描范围(m/z)分为若干个窗口,并循环地对每个窗口中的所有离子进行选择、碎裂、检测,因此可以无遗漏地获得样本中所有离子的全部碎片信息。但DIA技术的谱图复杂度对后续分析提出了巨大挑战。虽然较窄的隔离窗口会降低谱图复杂度,但这增加了窗口的总数,因此增加了覆盖整个质量范围所需的DIA循环时间。


在色谱和质谱中增加离子淌度分离可以提高灵敏度并降低谱图复杂度。TIMS(trapped ion mobility spectrometer)是一种离子淌度分析仪,其中离子在气流的推动下向前运动,将离子按大小和形状分开,在离子运动的反方向施加电场,阻滞离子的运动,将离子捕获在特定的位置,然后逐渐降低电场,将离子由大到小逐个释放。在TIMS-四极杆-TOF结构的系统中,离子淌度分离可以与四极杆质量选择同步,这种方法被称为平行累积连续碎裂(parallel accumulation–serial fragmentation, PASEF)。本文将PASEF原理扩展到DIA,这将结合DIA数据采集方法的优点和PASEF的固有效率。


实验思路


图1 | diaPASEF采集方法


(a)timsTOF Pro质谱仪的离子路径示意图。

(b)HeLa细胞肽段离子淌度与m/z的相关性。

(c)在diaPASEF中,四极杆隔离窗口(灰色)根据离子淌度(箭头)动态定位。

(d)采用步进四极杆隔离方案实现diaPASEF肽段(母离子)选择。

(e)使用d中的肽段(母离子)选择方案进行的单个diaPASEF扫描的示例。


研究结果


1、diaPASEF原理

在timsTOF Pro仪器(Bruker Daltonik)中,通过液相色谱分离的肽被离子化,引入质谱仪中并立即被捕获在双TIMS设备中(图1a)。淌度分离的离子到达正交加速器,快速的TOF脉冲产生高分辨率的质谱图(在整个质量范围内,分辨率>35,000)。对于给定电荷的肽离子,离子淌度和质量是相关的(图1b)。作者认为与其他DIA采集方案相比,此功能可用于隔离DIA的母离子(肽段)质量窗口,而不会丢失各个质量窗口外的离子。鉴于低迁移率(通常为高m/z)离子被捕获在TIMS出口附近,它们首先被释放,因此质量选择四极杆必须首先定位在高m/z位置。随着更高迁移率(通常是降低的m/z)离子从TIMS依次释放,四极杆质量隔离窗口应向下滑动以降低m/z值以完全传输离子云(图1c)。为了逼近理想的diaPASEF扫描,作者根据TIMS斜坡时间逐步调整了隔离窗口,涵盖了2+和3+电荷状态的绝大多数母离子(图1d)。每个DIA窗口中的碎片离子都是在母离子的精确离子淌度位置处检测到的(图1e)。


2、量化增加的离子采样效率

为了在实践中探索diaPASEF原理,作者测量了BSA的胰蛋白酶酶切产物,并比较了通过DDA,DIA和diaPASEF采集方法获得的信号。作为一个典型的例子,肽段DLGEEHFK在9 s内被洗脱(图2a)。在DDA中,双电荷的母离子(肽段)在洗脱峰的开始处累积一次,持续100 ms然后破碎。这大约占总洗脱时间的1%,远小于由相对峰面积估算的整个前体离子总量的1%。在DIA中,由于相对较快的循环时间(1.6 s),该肽段在其洗脱曲线上破碎了7次。这足以重建色谱峰的形状,但仍只捕获了总离子信号的一小部分(小于5%)。相比之下,diaPASEF方案对每次扫描中的碎片进行了总计超过100次的采样,这使得每个时间点的碎片几乎都得到了完整的记录。接下来作者研究了HeLa细胞酶切产物的离子采样效率。为了解决数据中碎片离子密度高的问题,作者选择了四次diaPASEF扫描的方案,每次用50 m/z隔离窗口隔离大约四分之一的母离子,另一个方案有16个diaPASEF扫描和25 m/z隔离窗。DIA的离子流大约比DDA高出三倍,而四扫描diaPASEF方案与DIA相比使累积的肽离子流进一步增加了五倍(图2b,c)。由此得出结论,diaPASEF原理在简单和复杂的蛋白质组学中都能如预期般提高数据采集效率。

图2 | 不同数据采集方法的效率


(a)使用DDA、DIA以及diaPASEF方法获得的双电荷DLGEEHFK肽前体的y6离子的提取碎片离子色谱图。

(b)在通过DDA,DIA和两种diaPASEF方案获得的200 ng HeLa酶切产物的单次运行分析中,从多电荷母离子中检测到的离子电流。

(c)b中的累积离子电流。


3. 四维数据的数据提取

为了从这种新颖的数据结构中鉴定和定量肽段,作者开发了Mobi-DIK(离子淌度DIA分析试剂盒;图3a)。该工作流基于在色谱洗脱时间内从采集的数据集中有针对性地提取特定母离子的碎片离子集,然后进行统计评分。Mobi-DIK将该数据分析原理从DIA扩展到了diaPASEF。首先,使用DDA模式的PASEF产生有离子淌度信息的谱图库,使用一组高可信度的肽段,可以自动以m/z,保留时间和离子淌度维度执行参考库和实验数据之间的校准。限制离子淌度提取宽度可从同一母离子质量窗口的共洗脱肽中去除具有不同离子淌度的信号(图3b)。接下来,作者使用已建立的OpenSWATH模块选择峰组。与信噪比的增加相一致,相应的二级谱信噪比得分随着离子淌度提取窗口的缩小而按比例增加(图3c)。结果在一次完整蛋白质组的单次运行分析中,与传统分析相比,在离子淌度维度上进行有针对性的提取可使肽段鉴定率提高22%(图3d)。


图3 | 离子淌度目标数据提取


(a)Mobi-DIK工作流程中从diaPASEF扫描中提取碎片离子色谱图的步骤。

(b)diaPASEF实验中肽段DGLLIIGVHSAK的碎片离子谱,该肽段来自HeLa消化液(顶图无离子淌度限制,底图有离子淌度限制)。

(c)在HeLa消化液的三次diaPASEF分析中,从同一diaPASEF窗口中的共洗脱母离子中去除干扰信号。

(d)c中三次diaPASEF分析中检测肽段离子的百分比。


4. 单针(Single-run)蛋白质组分析

为了在典型的DIA实验中研究diaPASEF,作者首先从24个组分的HeLa消化液中构建了DDA PASEF的参考库,它由135,671个肽段和9,140种蛋白组成。对于200 ng的样品量和120分钟的液相色谱-质谱分析,作者设计了一个采集方法,每100 ms diaPASEF扫描中具有四个窗口(25 m/z的隔离窗)。在三次重复实验中,共检测到80,580个母离子(1%FDR)(图4a)。diaPASEF中的离子淌度值与参考库中的高度相关(r> 0.99,图4b),中位数绝对偏差为0.6%(图4c)。总体而言,在FDR为1%的情况下,鉴定出66,998个特异的肽序列,平均鉴定到7,601种蛋白,三次实验共鉴定7,800种蛋白。(图4d)。定量的蛋白质的动态范围大约为四个数量级(图4e)。其中三次重复样本中共同定量了7,348种蛋白(94%),从而得到了一个几乎完整的数据矩阵(图4f)。

图4 | 使用diaPASEF进行单针HeLa蛋白质组分析


(a)使用16次扫描diaPASEF方案,以120 min梯度注入200 ng HeLa消化液,三次重复进样中肽段离子的数量。

(b)母离子离子淌度在diaPASEF中与参考库的相关性。

(c)diaPASEF与参考库中离子淌度的相对偏差。

(d)定量蛋白质的数量。

(e)参考库中蛋白质数量与三次diaPASEF实验检测的蛋白质数量。

(f)三次重复进样中缺失的蛋白质定量数据点的累积数量与减少的蛋白质丰度有关。


5. 非标定量测试

接下来作者建立了两个蛋白质组实验。分别向200 ng HeLa样品中掺入了约45 ng和15 ng的酵母消化液,对两组样本进行三次重复检测。使用合并的人和酵母库进行的Mobi-DIK分析定量了101,395个人的质谱峰和7,992个酵母质谱峰中的82,808个人和7,483个酵母的特异性肽段序列,据此推断出7,943种人蛋白和2,250种酵母蛋白。尽管低丰度酵母掺入量仅占样品的7%,但作者在两个样品中的至少两次重复中定量了7,697种人蛋白和1,394种酵母蛋白。它们的蛋白质丰度比值根据混合比分为两个不同的群体(图5)。与上述定量精度一致,人源蛋白在整个丰度范围内以1:1的比例聚集(σ(log2) = 0.22)。低丰度的酵母掺入蛋白的定量总体精度较低(σ(log2) = 0.70)。结果表明非标diaPASEF工作流程可以准确地量化蛋白质丰度的变化。

图5 | 非标定量检测


(a)将HeLa细胞消化液掺入约45 ng(样品A)和15 ng(样品B)酵母消化物,并使用16扫描diaPASEF方案进行120分钟梯度的diaPASEF分析(重复三次)。

(b)a中数据的箱线图。


6. diaPASEF对高通量和高灵敏度蛋白质组学的适应性

diaPASEF方案可以进行优化,以平衡选择性(较窄的隔离窗口),灵敏度(较高的质谱效率,较少的diaPASEF扫描)和母离子覆盖范围(图6a)。快速色谱方法通常需要较短的质谱循环时间,以实现足够数量的数据点以进行准确定量。因此作者设计了一种采集方案,该方案以0.9 s的循环时间专注于更窄的母离子范围。为了测试该方案,作者使用了一种液相色谱系统,该系统具有快速的周转时间和预定义的标准梯度,用于每天分析60、100和200个样品(Evosep One)。用每天60个样品的方法(21分钟梯度)对200 ng HeLa进行三次分析,每次运行平均定量4,813种蛋白,总共定量5,183种蛋白,中位变异系数为5.8%(图6b,c)。值得注意的是,其中4,255种定量蛋白质的变异系数<20%。当通量增加到每天100和200个样品时,三次重复实验中仍然分别定量了超过4,000和3,000种蛋白质。在每天200个样本中,变异系数的中位数仅增加到10.3%,这表明更快的diaPASEF方法仍是可行的。


当diaPASEF扫描的次数减少并且四极杆隔离宽度增加时,由于离子淌度的分离,diaPASEF可以调整为利用更高比例的入射离子束,并且仍然实现较高的母离子(肽段)选择性。为了证明这一概念,作者用120分钟梯度分析了10 ng的HeLa消化液(三次重复),并使用diaPASEF方案对给定母离子的离子电流进行约25%的采样。与标准方法相比,高占空比平均将检测到的碎片离子信号增加了大约四倍,并导致更精确地定量了常见肽,特别是低丰度肽(图6d)。尽管该方法覆盖了较窄的母离子空间,但每种方法平均定量了约13,000个肽,高灵敏度方法将肽的检测范围扩大了约四倍(图6e)。对10 ng HeLa细胞消化液样品进行了三次重复定量,共定量到4,310种蛋白质,至少在2次重复中定量到的蛋白数为3,909(图6f)。

图6 | 高通量和高占空比(duty cycle)diaPASEF分析


(a)设计diaPASEF采集方案时参数的空间示意图。

(b)使用不同方法和快速diaPASEF采集方案在200 ng HeLa消化液的三次重复进样中的定量蛋白数。

(c)至少两次重复测定的蛋白质丰度变化系数。

(d)以两种不同的diaPASEF采集方案和120分钟梯度进样10 ng HeLa消化液(三次重复)的平均肽强度和共有肽段的变异系数。

(e)d中两个实验的肽段信号强度分布,均以丰度最强的肽段进行标准化。

(f)与d中一样,在10 ng,50 ng和100 ng HeLa消化液的三个重复进样中的定量蛋白数。


研究结论


本文在已经实现DIA原理的TIMS-TOF质谱仪中开发并演示了PASEF工作流程。为了利用离子淌度和肽段质荷比之间的相关性,在diaPASEF方案中母离子被捕获,随后与四极杆位置同步释放,从而完成了对前体离子束几乎完整的采样。这与DDA方法相反,DDA方法仅将入射离子束的一小部分(通常远小于1%)转换为碎片,甚至与典型的DIA工作流程(最多只能转换百分之几的离子束)相反。对于不太复杂的混合物,本方法可以近乎100%的达到理论最大值。而对于更复杂的混合物,使用四极杆可降低谱图复杂度并提高选择性。为了从参考库中提取信息,作者扩展了OpenSWATH工具,从而有效地利用离子淌度进行库匹配,以提供完整的FDR和更准确的定量。实验表明该流程使用200 ng HeLa样本在2h检测时间内实现超过7000种蛋白质的深度覆盖(重复性高),对10 ng HeLa样本进行三次重复也检测到4,000多种蛋白质。该结果表明diaPASEF可能具有意想不到的优势,即高离子采样率也完全转化为更高的灵敏度。同样,极短循环时间的新扫描模式对于短梯度具有优势,这对于需要高通量的大规模临床研究极为重要。



小鹿推荐

数据非依赖性采集模式通过循环预定义的母离子质荷比范围窗口来隔离并碎裂不同的母离子,尽管这些选择窗口共同覆盖了整个质荷比范围,但总的来说仅隔离了所有进入离子中的百分之几进行质量分析。本文作者利用timsTOF Pro中分子量和离子淌度的相关性来设计一种扫描模式,该模式可以在当前的质荷比和淌度窗口中采样近100%的肽段母离子。作者通过纳入用于信号提取和评分的离子淌度维度来扩展已建立的目标数据提取流程,从而提高母离子鉴定的特异性。数据表明即使样品量只有10 ng,也可达到蛋白质组深度覆盖,并具有高度重现性和定量准确性。文章表明蛋白质组学技术正式进入扫描速度、检测灵敏度、鉴定深度、检测周期、定量准确性等性能全面提升的4D时代。


鹿明生物timsTOF Pro · 投产使用

仪器安装已到位

高通量蛋白组学分离系统已到位

鹿明生物引入与其超高MSMS扫描速度完美匹配的Evosep One高通量色谱


技术咨询已到位


剩下的时间,等待着您的样本...


4D-DIA更灵敏、定量更准确、可鉴定出更多蛋白质

2020年11月19号鹿明生物最新购置的布鲁克timsTOF Pro已正式安装完成并投产使用timsTOF Pro以其更灵敏、定量更准确、可鉴定出更多蛋白质的特点,运用在4D-DIA、4D-PCT-DIA高通量修饰组学分析的研究中。毋庸置疑新一代的4D蛋白组学时代已经来临。我们将携手各位老师一起进入更深入的蛋白组学。

timsTOF Pro



长按|扫码

咨询|鹿明生物4D蛋白组学技术工程师


参考文献:

Florian Meier et al. diaPASEF: parallel accumulation-serial fragmentation combined with data-independent acquisition. Nat Methods. 2020 Dec;17(12):1229-1236.


猜你还想看


"稳中带皮"跨实验室比较展示基于DIA的质谱工作流程稳定性及潜力

鹿明生物再添高端质谱仪:tims TOF Pro—基于捕获离子淌度的4D蛋白质组学

恭喜 | 11月,欧易/鹿明生物蛋白/代谢方向17位合作课题组老师顺利发文

喜报!欧易/鹿明生物最新发明专利授权啦~


END

云起  撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

“阅读原文”查看更多精彩


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved