2023-02-02 16:59:05, Calibra 杭州凯莱谱精准医疗检测技术有限公司
上一篇我们讲了代谢组学及其主要的技术方法,今天我们将聊一聊如何运用这些基础知识,对代谢组学研究平台和技术手段的有效性进行评估等一些话题。
代谢物的鉴定
在确定了技术平台,技术路线,对样品进行检测得到了代谢组学数据以后,接下来的一个主要的研究瓶颈可能就是代谢物的鉴定了。代谢物的鉴定一直是代谢组学研究中一个令很多人头痛的瓶颈。以LC-MS检测为例,早期的代谢组学LC-MS研究通常的做法是用高质量精度质谱(如飞行时间质谱TOF)对待测物进行一级全扫描(full mass scan),用公共软件如XCMS等对原始数据进行离子峰提取和排列(alignment),这样一般能得到数千个峰以及这些峰在所有样品中的峰面积的列表。在事件组(case)和对照组(control)之间浓度没有统计学差别的离子峰先忽略,只看在两组之间统计上有显著差异变化的离子峰,然后对这些峰进行代谢物鉴定。很多初次接触代谢组学的同学会认为一个峰就是一个代谢物,但其实这些峰只能叫离子特征(ion features),而离子特征并不等同于代谢物,因为一个代谢物在检测时会出现多个ion features。
在没有用标品建立的包含每个代谢物在平台上出峰的保留时间等信息的自建数据库的情况下,代谢物的鉴定一般只能依靠用母离子的精确质量数和碎片离子的信息去搜索公共的数据库。这样搜索出来的结果会包含鉴定结果概率较低的候选代谢物。这些不确定的代谢物是不能用在对结果的生物学意义的分析中的,因为鉴定的代谢物存在错误就会把研究方向误导至错误的代谢通路和网络中。2007年Metabolomics Standard Initiative(MSI)把代谢组学研究中的代谢物鉴定分为四个级别(Tier 1-4):第一级是鉴定的化合物,即基于标准品,名称结构可以完全确定的代谢物;第二级是推断的化合物,即在没有标准品可以验证,只能搜索公共的或商业的数据库根据匹配度以及其他线索来辅助推断得到名称的代谢物;第三类是可推断化合物类别的代谢物;第四类是未知的代谢物(只有离子特征信息无法推测化合物的分类和名称)[1]。2016年发表的一篇文章中进一步把代谢物鉴定的可信度分为五个置信等级[2]。一级鉴定是最高置信度的鉴定,是与标准品在相同的分析条件下得到的属性进行匹配的鉴定。二级鉴定 是在没有标准品验证的情况下主要依靠 MS/MS碎片模式推测得出的代谢物鉴定。 三级鉴定是通过精确质量数和同位素分布模式搜索相关数据库得出的代谢物候选列表。四级鉴定是能够得到候选的分子式的鉴定,五级鉴定是只有离子特征的m/z 信息的鉴定(图1)。以LC-MS为例,要真正对一个代谢物的鉴定做到心中有数至少需要做到以下几点:正确的LC色谱上出峰的保留时间(与标准品相比),准确的一级分子离子m/z的匹配以及高质量的MS/MS 匹配。如果能够在代谢通路网络中根据通路共属或者上下游关系对一个代谢物的浓度变化做出合理的解释,则对这个代谢物的定性更加放心。
图1. 代谢物鉴定的可信度(从上到下依次增加)[2]
综上所述,在拿到一份代谢组学检测结果的代谢物名单时,首先需要了解其中有多少是一级和二级鉴定的代谢物。有些代谢组学实验室和服务公司提供的结果里还会有两个名单,一个是质谱正离子喷雾模式下检测到的代谢物,一个是负离子模式下检测到的代谢物。笔者经常碰到一些初次接触代谢组学结果的同学问这两个名单能合在一起进行数据分析吗?答案是完全可以。之所以会有正离子模式下检测到的代谢物和负离子模式下检测到的代谢物是因为不同代谢物的结构和性质差别很大,有的在离子化时容易带正电荷(比如偏碱性的化合物),有的容易带负电荷(比如酸性化合物)。只要将两个名单合并后对于在正离子和负离子模式下都能检测到的代谢物确定只使用一种极性下的数据结果(特别是要避免一个项目结果里同一个代谢物的值在有的样品里用正离子模式下的数据而在另一些样品里用负离子模式下的数据),就可以用一个合并的名单里的结果进行整个实验数据的统计学分析了。当然检测方也可以将正负离子模式下两个名单先行合并去除冗余代谢物后提供一个统一的代谢物名单以方便用户。
对代谢组学数据进行多变量的各种统计分析,找出差别代谢物,寻找潜在的生物标志物等进一步的代谢组学数据分析的内容在此不再展开,网络上公开的有大量的相关信息和文献大家可以自行参考。我们公众号正在推出的知组识谱系列文章也会对这些内容进行更详细的讲解,敬请大家关注。
如何搭建一个代谢组学研究平台
首先要确定技术平台和方法学,是做NMR, GC-MS, LC-MS或者是这三种方法的任意组合;是用非靶向检测的方法还是靶向检测的方法。确定了技术平台和方法学后要根据相关技术指标购买仪器。比如做LC-MS平台需要购买超高效液相色谱系统以及高分辨率高质量精度的质谱仪(HRAM);做广泛靶向的代谢组学方法还需要买三重四极杆质谱仪(TQMS)。仪器到位安装后要把方法学进行验证,把标准品用选择的方法学在系统上检测建立标品数据库。一般还有用固定基质类型的样品(比如血浆)按照每天运行样品数的最大通量连续上样数天到数周进行系统的稳定性验证。要保证重复样品中可检测的代谢物的数目和信号值的稳定,还要保证不同组生物样品中的组别差异性可以被稳定地测出。这是一个需要相当时间和精力的过程,绝不是一个短期可以一蹴而就的事情。
一个代谢组学平台的搭建需要大量的物力和人力的投入,整个过程的多个步骤需要有经过严格培训和具备一定技术能力的专业人士。代谢组学数据的分析要运用多变量统计分析(检测到的代谢物水平的变化除了和疾病以外还和众多其他的变量相关,比如年龄,性别,是否有其他慢病等等),需要具有统计学分析经验的专业人员。对代谢通路变化和代谢物在复杂代谢网络中上下游关系的相互影响的解读需要具有生化和医学知识的专业人员。所有这些对于研究方向不是专业代谢组学只是会使用到代谢组学数据的研究者来说都是一个浩大的工程,事实上不可能做到每个涉及代谢组学检测的研究组都使用自己搭建的代谢组学平台进行相关研究,这种情况下选择做专业代谢组学研究的实验室进行合作或者选择能提供代谢组学检测服务的第三方实验室进行检测可能是最好的选择。
专业的的大型代谢组学实验室和代谢组学服务中心为了保证代谢物鉴定的准确性一般有相对稳定的方法学并且通过严格的系统控制可以实现被检测代谢物的鉴定和浓度变化结果的准确性。这些专业实验室一般有自己用标准品建立的包括保留时间和高质量的MS/MS 碎裂图谱信息等在内的自建数据库。另外代谢组学数据采集和分析流程复杂,样品数量一般较大(队列样品的项目周期更长),加上仪器稳定性的差异,样品复杂性多,基质效应不同,样品间的信号残留和相邻样品的个体差异可能较大等诸多因素都会影响一个代谢组学研究的结果,这使得检测过程的质控成为一个非常重要的系统工程。如何做好一个代谢组学平台的全流程的质控和确保准确的代谢物鉴定有着相同的重要性。
另外一个大家可能比较关心的问题是如何对合作方或第三方实验室的代谢组学技术平台的能力和数据质量进行评估,尤其是初期合作在彼此之间还没有建立互相信任的情况下。一般来说对于代谢组学具体技术细节不太了解的用户除了考察对方在业界的名声,合作方有哪些,发表文章的状况等公开信息以外很难做出判断。在无法对对方宣称的技术指标做出真实性判断或对比多家服务无法做出选择的情况下,要求现场考察对方实验室,在实验样品中嵌入自己准备的质控样品或者进行盲样检测结果比对等都不失为合理的考虑和选择。
代谢组学研究方兴未艾,相关技术和研究手段也日趋成熟,为该领域获得进一步的发展奠定了必要的基础。希望本系列的科普介绍能帮助更多的研究人员对代谢组学不再感到陌生和望而生畏,能够更加自信地投入到代谢组学相关的讨论和研究中,为实现这个领域的重要突破做出自己的贡献。
● 往期推荐
04-30
致敬每一位辛勤的劳动者04-30
实践校企联合 | 院士团队师生到访兰友科技04-30
职业健康,与您同行 | 英盛生物助力《职业病防治法》宣传周04-29
欢迎来到聚合物的神奇世界04-29 Nouryon诺力昂
五一劳动节 | 致敬每一位追光人(内含互动游戏,点击参与)04-29 光电行业都会关注
“劳”有所获 “动”有所乐 | 卓立汉光五一放假通知请查收04-29
如何站在“小巨人”的肩膀上做好质谱产品?——ACCSI2024访衡昇质谱(北京)仪器有限公司总经理祝敏捷04-29
探索国产自主创新 | 国科大杭州高等研究院师生一行到访谱育科技参观学习04-29 点击关注→
热点应用丨“小”花粉“大”奥秘—RMS1000带你解密花粉热(下)04-28 天美
仪器推荐丨一体化全自动显微共聚焦拉曼光谱仪 RM504-28
仪器推荐丨科研级模块化显微共聚焦拉曼光谱仪RMS100004-28
HyperQuant与您一起破解呕吐毒素之谜04-28
用户速递 | 酸碱度对混合SOA 代理物-无机气溶胶液滴液-液相分离的影响04-28 光电行业都会关注
“元素分析自动化创新的一大步”---ACCSI 2024衡昇质谱展示革命性创新产品04-28 衡昇质谱
In China, For Global|微纯生物科技参加LAB-Indonesia 202404-28
中关村论坛之高端仪器创新,天隆智造再获殊荣04-28
天隆产品说丨天隆方案为动物健康保驾护航04-27
世界兽医日 | 与他们共同守护动物健康04-27
政策响应丨奥谱天成显微拉曼光谱仪重磅来袭!所有ATR8300用户免费升级04-26