代谢组学数据归一化新选择!GCxGC-TOFMS 赋能 TDPA 方法,大队列样本无需对齐也能精准区分样品差异

2026-01-13 13:06:41, Vera, Gary, Lily 美国力可公司


点击蓝字 关注我们 ~

研究总览

作者简介

Prof. James Harynuk



James J. Harynuk 是加拿大阿尔伯塔大学化学系的教授,全二维国际研讨会主席。他在全二维气相色谱(GCxGC)和组学领域研究超过 20 年,实验室配备多台 GCxGC 和 GCxGC-TOFMS 仪器,借助相关样品制备和进样系统,可处理多种代谢组学样品类型。其研究兴趣在于通过使用多维分离技术和先进的数据处理工具来开发满足分析化学需求的新工具,以应对样品复杂性增加、分析时间更快和检测限更低等挑战。

研究背景

基于气相色谱(GC)的代谢组学研究中,为扩大代谢组覆盖范围,样品通常需经提取及甲氧肟化-三甲基硅烷化(TMS)两步衍生化处理。全二维气相色谱 - 飞行时间质谱(GCxGC-TOFMS)因高灵敏度和分辨率,成为该领域核心分析技术之一。

然而,样品制备及分析过程中易引入生物与技术变异,可能掩盖目标生物学差异,因此数据归一化是下游分析与结果解读的关键环节。

目前代谢组学领域缺乏标准化的归一化策略,现有方法(如样品质量归一化、总峰面积(TPA)归一化等)存在局限性,且针对 TMS 衍生化样品的专属高效归一化方法尚未完善,给大规模、复杂代谢组学研究带来挑战。

研究目的

以 GCxGC-TOFMS 为分析平台,对比不同归一化策略的性能(无归一化、样品质量归一化、总峰面积TPA、总有效峰面积TUPA、总衍生化峰面积TDPA),为代谢组学研究者提供针对性的方法选择依据,推动 GCxGC-TOFMS 技术在代谢组学中的深度应用,拓展其在复杂样品分析中的实用性与准确性。

研究路线&研究结果

1


设计模拟样品体系

以干燥狗粮为基质,构建两组样品(纯狗粮组 DF、添加氨基酸标准品组 DFAA),通过系统递增样品质量模拟浓度变异(从160毫克到300毫克,以20毫克为增量,共8个质量梯度),明确两组间核心差异为氨基酸浓度。

2


样品处理与数据分析

样品经TMS衍生化后,采用全二维气相色谱-飞行时间质谱(GCxGC-TOFMS)进行检测,获取代谢组数据。通过 ChromaTOF® 完成峰识别、对齐及谱库检索,计算五种归一化策略对应的参数,利用 MATLAB® 及 PLS Toolbox 进行主成分分析(PCA)



数据采集&处理软件:LECO ChromaTOF®(自动进行质谱解卷积)

基线偏移量:0.9

预期峰宽:一维12s,二维0.15s

峰查找S/N:100:1

质谱库:NIST库和Wiley库

谱库匹配阈值:MS相似度>700/1000



本研究采用ChromaTOF®软件的Statistical Compare统计比较功能对36组经衍生化处理过的全二维数据进行比对。(该功能现已升级为SYNC组学软件,如下图所示)

使用ChromaTOF®软件自带的“Script脚本”功能开发的脚本,用于TMS衍生化峰的自动化过滤以计算 TDPA,如下图所示

上图为GC×GC-TOFMS 色谱图:(A)氨基酸标准品(B)160 mg 狗粮样品(C)添加了氨基酸的 160 mg 狗粮样品(D)300 mg 狗粮样品(E)添加了氨基酸的 300 mg 狗粮样品

36 个样品经数据对齐后共获得 1944 个峰,其中1021个峰为所有样品共有(用于计算 TUPA),59 个峰被鉴定为氨基酸的 TMS 衍生物(用于计算 TAA)

分析结果显示,样本的总离子流图(TIC)与TMS特征碎片离子(m/z 73)的提取离子流图(EIC)在视觉上几乎完全一致。这有力地证明了TMS衍生化方法是高效且普适的,分析中检测到的大部分代谢物都被成功转化为TMS衍生物。

上图为散点图集合,横坐标均为目标样品质量(160–300 mg),纵坐标分别对应不同检测指标,核心用于呈现各指标随样品质量的变化趋势及两组样品(DF 与 DFAA)的差异特征。

上图为每个样品的总峰面积(TPA)、总有效峰面积(TUPA)、总衍生化峰面积(TDPA)值,按所有样品对应指标的平均值进行归一化处理结果。

数值越接近 1(标准值),其作为归一化因子的效果越好。上图显示,TPA表现最差: TPA值随样本质量增加的线性趋势最不明显,且波动较大。这归因于TPA计算中包含了大量无关峰,如衍生化伪影和污染物。

TUPA和TDPA表现更优: 这两个因子的值随样本质量增加呈现出更稳定、更清晰的线性增长趋势,表明它们受无关信号的干扰较小。

在排除了样本质量和氨基酸浓度这两个预设变量的影响后,定量分析显示TPA的相对变异最大(9.69),而TUPA(4.91)和TDPA(5.27)的变异最小,证明后两者是更稳定的标准化因子。

上图为五种归一化策略下的PCA得分图(红色为DF组,绿色为DFAA组)

失败的策略 (A, B, C):

  • 未归一化 (A) 和 按样本质量归一化 (B) 的数据显示,两组样本的95%置信椭圆严重重叠,无法实现有效区分。

  • TPA归一化 (C) 同样未能分离两组,并且数据点沿对角线呈现出双峰分布,揭示了该方法易受分析批次效应的影响。

成功的策略 (D, E):

  • TUPA标准化 (D) 表现最佳,两组样本的95%置信椭圆几乎完全分离,实现了清晰的组间区分。

  • TDPA标准化 (E) 的表现几乎与TUPA相当,仅有一个样本点落入重叠区域,同样提供了非常显著的区分效果。

这一结果表明,TUPA和TDPA能够有效校正与样本相关的生物学变异,从而揭示出由氨基酸差异引起的细微变化。

3


新型方法TDPA拓展验证&性能评估

在模拟样本获得的有前景的结果作为原理验证后,将 TDPA 应用于 54 个人类尿液样品(复杂生物样品),与肌酐归一化(尿液分析金标准)、TUPA 等方法对比。

TDPA 归一化后,尿液样品的组间分离度显著优于肌酐归一化,虽略逊于 TUPA,但无需依赖全样本数据对齐,可单个样品即时计算,更适配大规模、纵向研究场景,证实其实际应用价值。

特性

TUPA(总有效峰面积)

TDPA(总衍生化峰面积)

核心要求

必须进行跨所有样本的数据对齐,以识别“共有峰”

无需数据对齐,可基于单个样本独立计算

性能

在本研究中表现最佳,提供了最清晰的组间分离

性能接近TUPA,分离效果非常显著

优势

基于对齐数据,可确保跨样本比较的一致性

便捷、高效,可在样本分析后立即获得标准化因子,无需等待整个项目完成

劣势

计算依赖于整个研究的样本分析完成,对于耗时数月的大规模或纵向研究构成重大挑战

在本研究中的分离效果略逊于TUPA

TDPA 以 “无需数据对齐、操作便捷、适配大规模研究” 为核心优势,弥补了 TUPA 依赖全样本分析完成后才能计算的短板,为不同研究场景提供了灵活选择。

TDPA方法的提出和验证,为GC-MS代谢组学界提供了一个强大而简便的工具,有助于提高数据质量和研究结果的可靠性,特别是在那些因缺乏便捷方法而忽视标准化的研究中,其应用前景广阔。

延伸讨论

Q

GCxGC-TOFMS 凭借高分离度和灵敏度成为本研究的核心分析平台,其在 TMS 衍生化样品代谢组学分析中,除了提升峰容量外,对 TDPA 等归一化方法的性能发挥是否存在直接影响?

A

GCxGC-TOFMS 的技术特性与 TDPA 等归一化方法的性能密切相关,且这种影响是直接且关键的。

一方面,GCxGC 的二维分离能力可有效减少峰重叠,尤其能区分 TMS 衍生化产物与基质杂质等无关峰,降低 TDPA 计算中 “假阳性峰” 的干扰。 若采用传统一维 GC-MS,峰重叠率较高,可能导致 TDPA 筛选的特征峰中混入非衍生化杂质峰,影响归一化稳定性。

另一方面,TOFMS 的高灵敏度和快速数据采集能力(200张谱图/秒),能精准捕捉 TMS 特征碎片(如 m/z 73)的微弱信号,确保低丰度衍生化代谢物被纳入 TDPA 计算,避免因信号丢失导致归一化因子偏差。

此外,GCxGC-TOFMS 的高重现性(如保留时间稳定性、峰面积重现性)为 TUPA 所需的全样本峰对齐提供了基础,若仪器重现性不足,峰对齐误差会直接削弱 TUPA 的有效性。

因此,GCxGC-TOFMS 的技术优势不仅是数据采集的保障,更是 TUPA、TDPA 等归一化方法发挥优异性能的前提,二者形成 “高分离度分析 + 精准归一化” 的协同效应。

Q

TUPA 与 TDPA 均表现出优异的样品分离效果,在实际研究中应如何根据实验设计选择这两种方法?二者与 QC-based 校正等技术结合后,是否能进一步提升数据可靠性?

A

TUPA 与 TDPA 的选择需结合研究规模、数据处理流程及时效性需求:若为小规模研究(样品数量<100)、数据对齐难度低,且追求最高的组间分离精度,建议选择 TUPA;若为大规模、纵向研究(样品分析周期长、批次多),或需实时获取归一化结果以调整实验流程TDPA 更具优势,无需等待全样本分析完成即可计算,且避免了大规模数据对齐的复杂操作。

二者与 QC-based 校正结合后,可进一步提升数据可靠性:TUPA 和 TDPA 主要校正样品制备相关的生物变异与部分技术变异,但无法完全消除仪器长期运行带来的批次效应(如色谱柱衰减、离子源污染),而 QC 样品可通过监控保留时间漂移、峰强度稳定性,对数据进行二次校正,尤其在大规模研究中,这种 “归一化 + QC 校正” 的组合策略能同时解决样品内变异与仪器系统性偏差,使差异代谢物筛选结果更稳健。此外,对于基质复杂的生物样品(如粪便、组织匀浆),建议优先选择 TDPA,其靶向 TMS 衍生化峰的特性对基质杂质的耐受性更强,抗干扰能力更优。

仪器信息


仪器型号: GCxGC-TOFMS  Pegasus 4D   

厂家:美国LECO力可公司

调制器:两级四喷口热调制器(行业金标准)

色谱柱系统:1D:Rxi-5SilMS(60m x 0.25mm x 0.25 μm);2D:Rtx-200MS(1.6m x 0.25mm x 0.25 μm)

载气:氦气He

升温程序:起始温度80℃,保持4分钟,3.5℃/min升高到315℃,保持10分钟。

二维柱温箱和调制器补偿温度:+10℃和+15℃

调制周期:2.5s

传输线温度:250℃

离子源温度:200℃

m/z:40-800

飞行时间质谱采集速率:200张谱图/秒(全二维色谱联用必要条件)

全二维差异性统计学软件Tile

大队列质谱组学软件SYNC 2D


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2026 ANTPEDIA, All Rights Reserved