2023-02-02 16:59:05, Calibra 杭州凯莱谱精准医疗检测技术有限公司
上一篇我们讲了代谢组学及其主要的技术方法,今天我们将聊一聊如何运用这些基础知识,对代谢组学研究平台和技术手段的有效性进行评估等一些话题。
代谢物的鉴定
在确定了技术平台,技术路线,对样品进行检测得到了代谢组学数据以后,接下来的一个主要的研究瓶颈可能就是代谢物的鉴定了。代谢物的鉴定一直是代谢组学研究中一个令很多人头痛的瓶颈。以LC-MS检测为例,早期的代谢组学LC-MS研究通常的做法是用高质量精度质谱(如飞行时间质谱TOF)对待测物进行一级全扫描(full mass scan),用公共软件如XCMS等对原始数据进行离子峰提取和排列(alignment),这样一般能得到数千个峰以及这些峰在所有样品中的峰面积的列表。在事件组(case)和对照组(control)之间浓度没有统计学差别的离子峰先忽略,只看在两组之间统计上有显著差异变化的离子峰,然后对这些峰进行代谢物鉴定。很多初次接触代谢组学的同学会认为一个峰就是一个代谢物,但其实这些峰只能叫离子特征(ion features),而离子特征并不等同于代谢物,因为一个代谢物在检测时会出现多个ion features。
在没有用标品建立的包含每个代谢物在平台上出峰的保留时间等信息的自建数据库的情况下,代谢物的鉴定一般只能依靠用母离子的精确质量数和碎片离子的信息去搜索公共的数据库。这样搜索出来的结果会包含鉴定结果概率较低的候选代谢物。这些不确定的代谢物是不能用在对结果的生物学意义的分析中的,因为鉴定的代谢物存在错误就会把研究方向误导至错误的代谢通路和网络中。2007年Metabolomics Standard Initiative(MSI)把代谢组学研究中的代谢物鉴定分为四个级别(Tier 1-4):第一级是鉴定的化合物,即基于标准品,名称结构可以完全确定的代谢物;第二级是推断的化合物,即在没有标准品可以验证,只能搜索公共的或商业的数据库根据匹配度以及其他线索来辅助推断得到名称的代谢物;第三类是可推断化合物类别的代谢物;第四类是未知的代谢物(只有离子特征信息无法推测化合物的分类和名称)[1]。2016年发表的一篇文章中进一步把代谢物鉴定的可信度分为五个置信等级[2]。一级鉴定是最高置信度的鉴定,是与标准品在相同的分析条件下得到的属性进行匹配的鉴定。二级鉴定 是在没有标准品验证的情况下主要依靠 MS/MS碎片模式推测得出的代谢物鉴定。 三级鉴定是通过精确质量数和同位素分布模式搜索相关数据库得出的代谢物候选列表。四级鉴定是能够得到候选的分子式的鉴定,五级鉴定是只有离子特征的m/z 信息的鉴定(图1)。以LC-MS为例,要真正对一个代谢物的鉴定做到心中有数至少需要做到以下几点:正确的LC色谱上出峰的保留时间(与标准品相比),准确的一级分子离子m/z的匹配以及高质量的MS/MS 匹配。如果能够在代谢通路网络中根据通路共属或者上下游关系对一个代谢物的浓度变化做出合理的解释,则对这个代谢物的定性更加放心。
图1. 代谢物鉴定的可信度(从上到下依次增加)[2]
综上所述,在拿到一份代谢组学检测结果的代谢物名单时,首先需要了解其中有多少是一级和二级鉴定的代谢物。有些代谢组学实验室和服务公司提供的结果里还会有两个名单,一个是质谱正离子喷雾模式下检测到的代谢物,一个是负离子模式下检测到的代谢物。笔者经常碰到一些初次接触代谢组学结果的同学问这两个名单能合在一起进行数据分析吗?答案是完全可以。之所以会有正离子模式下检测到的代谢物和负离子模式下检测到的代谢物是因为不同代谢物的结构和性质差别很大,有的在离子化时容易带正电荷(比如偏碱性的化合物),有的容易带负电荷(比如酸性化合物)。只要将两个名单合并后对于在正离子和负离子模式下都能检测到的代谢物确定只使用一种极性下的数据结果(特别是要避免一个项目结果里同一个代谢物的值在有的样品里用正离子模式下的数据而在另一些样品里用负离子模式下的数据),就可以用一个合并的名单里的结果进行整个实验数据的统计学分析了。当然检测方也可以将正负离子模式下两个名单先行合并去除冗余代谢物后提供一个统一的代谢物名单以方便用户。
对代谢组学数据进行多变量的各种统计分析,找出差别代谢物,寻找潜在的生物标志物等进一步的代谢组学数据分析的内容在此不再展开,网络上公开的有大量的相关信息和文献大家可以自行参考。我们公众号正在推出的知组识谱系列文章也会对这些内容进行更详细的讲解,敬请大家关注。
如何搭建一个代谢组学研究平台
首先要确定技术平台和方法学,是做NMR, GC-MS, LC-MS或者是这三种方法的任意组合;是用非靶向检测的方法还是靶向检测的方法。确定了技术平台和方法学后要根据相关技术指标购买仪器。比如做LC-MS平台需要购买超高效液相色谱系统以及高分辨率高质量精度的质谱仪(HRAM);做广泛靶向的代谢组学方法还需要买三重四极杆质谱仪(TQMS)。仪器到位安装后要把方法学进行验证,把标准品用选择的方法学在系统上检测建立标品数据库。一般还有用固定基质类型的样品(比如血浆)按照每天运行样品数的最大通量连续上样数天到数周进行系统的稳定性验证。要保证重复样品中可检测的代谢物的数目和信号值的稳定,还要保证不同组生物样品中的组别差异性可以被稳定地测出。这是一个需要相当时间和精力的过程,绝不是一个短期可以一蹴而就的事情。
一个代谢组学平台的搭建需要大量的物力和人力的投入,整个过程的多个步骤需要有经过严格培训和具备一定技术能力的专业人士。代谢组学数据的分析要运用多变量统计分析(检测到的代谢物水平的变化除了和疾病以外还和众多其他的变量相关,比如年龄,性别,是否有其他慢病等等),需要具有统计学分析经验的专业人员。对代谢通路变化和代谢物在复杂代谢网络中上下游关系的相互影响的解读需要具有生化和医学知识的专业人员。所有这些对于研究方向不是专业代谢组学只是会使用到代谢组学数据的研究者来说都是一个浩大的工程,事实上不可能做到每个涉及代谢组学检测的研究组都使用自己搭建的代谢组学平台进行相关研究,这种情况下选择做专业代谢组学研究的实验室进行合作或者选择能提供代谢组学检测服务的第三方实验室进行检测可能是最好的选择。
专业的的大型代谢组学实验室和代谢组学服务中心为了保证代谢物鉴定的准确性一般有相对稳定的方法学并且通过严格的系统控制可以实现被检测代谢物的鉴定和浓度变化结果的准确性。这些专业实验室一般有自己用标准品建立的包括保留时间和高质量的MS/MS 碎裂图谱信息等在内的自建数据库。另外代谢组学数据采集和分析流程复杂,样品数量一般较大(队列样品的项目周期更长),加上仪器稳定性的差异,样品复杂性多,基质效应不同,样品间的信号残留和相邻样品的个体差异可能较大等诸多因素都会影响一个代谢组学研究的结果,这使得检测过程的质控成为一个非常重要的系统工程。如何做好一个代谢组学平台的全流程的质控和确保准确的代谢物鉴定有着相同的重要性。
另外一个大家可能比较关心的问题是如何对合作方或第三方实验室的代谢组学技术平台的能力和数据质量进行评估,尤其是初期合作在彼此之间还没有建立互相信任的情况下。一般来说对于代谢组学具体技术细节不太了解的用户除了考察对方在业界的名声,合作方有哪些,发表文章的状况等公开信息以外很难做出判断。在无法对对方宣称的技术指标做出真实性判断或对比多家服务无法做出选择的情况下,要求现场考察对方实验室,在实验样品中嵌入自己准备的质控样品或者进行盲样检测结果比对等都不失为合理的考虑和选择。
代谢组学研究方兴未艾,相关技术和研究手段也日趋成熟,为该领域获得进一步的发展奠定了必要的基础。希望本系列的科普介绍能帮助更多的研究人员对代谢组学不再感到陌生和望而生畏,能够更加自信地投入到代谢组学相关的讨论和研究中,为实现这个领域的重要突破做出自己的贡献。
● 往期推荐
04-22
CCMT2026开展即高能 | Equator-X™ 双模式测量仪引爆全场04-21
告别预测偏差!Percepta自建专属训练库,pKa预测更准更快04-21 ACDLabs 李丹
世界地球日,查看地球的【愿望清单】04-21
【前沿激荡,智汇北京】IGC 2026圆满落幕,益世科生物共绘细胞基因治疗新蓝图04-21
会议预告|华大吉比爱邀您共赴第六届北京临床质谱论坛04-21 华大吉比爱
叮咚!您有一份来自地球的“绿色盲盒”待拆封04-21 安捷伦科技
聚焦小核酸与多肽前沿分析:第一届创新药物研发与质量评价技术交流会在沪圆满举办04-21 安捷伦科技
糖基化全流程质控:消耗品方案一站式解决04-21 安捷伦科技
药物分析排忧解难系列 | 自动柱前衍生化方案,完美应对样品复杂前处理04-21 安捷伦科技
“衣”路前行,“安”全守护 | 安捷伦 PFAS 解决方案守护运动健康04-21 安捷伦科技
零压力,低成本 | 安捷伦官方认证翻新仪器开启“以租代售”新模式04-21 安捷伦科技
ESCMID 2026 爆点 | MiSeq i100系列携6项病原精准测序应用数据亮相04-21
高效+精准,VA-5000 让实验室气体分析从此不同!04-21 HORIBA
突破制药检测瓶颈,欧美克NS-180Z系列纳米粒度及电位分析仪重磅登场04-21 欧美克仪器
NS-180Z Pro丨纳米粒度电位分析仪04-21 欧美克仪器
【每天学点粒度知识】动态光散射测量粒径应用案例04-21
还有人不知道吗?代谢组才是多组学联用的灵魂04-20
【星品周 | 好礼翻倍】外泌体富集及miRNA提取攻略04-20
烷基汞检测技术及应用网络研讨会04-20 普立泰科







