南京集思慧远生物科技有限公司
400-6699-117转1000
热门搜索:
分析测试百科网 > 集思慧远 > 新闻动态 > 通过整合代谢组学数据库和质谱化学信息学来识别未知代谢物

通过整合代谢组学数据库和质谱化学信息学来识别未知代谢物

发布时间: 2019-03-19 21:17 来源:南京集思慧远生物科技有限公司

     目前,在非靶向代谢组学中往往检测到许多未知峰,这在很大程度上是由于可获得的公共质谱库与6800多万种已知化合物的化学领域相比仍然非常小。虽然NIST和Wiley数据库已经以标准化的方式系统地收集了GC-MS谱图,30多年的时间已经超过了267,000种独特的化合物,只有约40%的可检测峰能够在典型的代谢组学中被识别。这类代谢组学的暗物质可以解释为:(a)缺乏酶转化的知识,包括底物混杂;(b)由于自发反应或酶错误引起的代谢损伤;(c)外部化合物的明显特征,例如来自环境来源;(d)物种共同体的代谢影响,如肠道微生物群;(e)在分析方案中形成化学伪像。  

  最近,新型术语“epimetabolite”认为包括通过在生物系统中获得生理功能的酶转化而修饰的代谢物,类似于受翻译后修饰影响的蛋白质。识别代谢物的策略旨在同时研究多个研究以减少重要(功能)未知物的数量,包括跨物种分析。一旦确定了这些未知物的来源,相关性和特异性,就可以使用精确的质谱和化学信息学工具来注释和验证化学结构。

  

  Figure 1 A workflow for the functional and structural identification of unknown metabolites.

  图1 功能和结构鉴定未知代谢物的工作流程

  

  在这里提出了一个统一的功能和结构注释未知的代谢产物的方法流程(如图1)。BinBase是基于GC-MS的大型非靶向代谢组学数据库,涵盖了1,561项研究,包括114,795个样品。迄今为止已经发现了9,563种独特的代谢物;通过与标准质谱库比较,已经鉴定了其中的1,020个,并且256个已知的化学物质。为了查询每个代谢物的生物元数据,开发了BinVestigate (http://binvestigate.fiehnlab.ucdavis.edu/),该工具可提供丰度,频率,物种和器官来源信息。

  

  MS-DIAL 2.0工具(http://prime.psc.riken.jp/)可从高分辨率GC-MS数据中获得解卷积谱图,作为化合物鉴定的先决条件。尽管MS-DIAL以前是为LC-MS数据处理开发的,但现在可以同时处理LC-MS/MS和GC-MS数据。最后,可以用MS-FINDER 2.0(http://prime.psc.riken.jp/)通过其元素分子式和电离质谱碎片来注释未知化合物。MS-FINDER集成了224,622种已知代谢物的结构和分子式,现在还包括来自酶混杂数据库MINE-DB(http://minedatabase.mcs.anl.gov/)的643,307种假想化合物。

  

  BinVestigate可用于代谢组学研究中查询未知物,并根据其交叉研究的特异性和相关性(online methods),优先考虑和选择目标未知物进行结构鉴定。在构建BinBase时,遵循Weat Coast代谢组学中心质量控制标准,使绝对信号强度保持在平均值的两倍偏差之内,并避免检测器饱和,从而使不同物种和样品类型的强度相当。除了特定器官和物种的检测频率外,BinVestigate还使用平均信号强度来突出研究间的相关性。

  

  举个例子  

  Figure 2 Metabolomic meta-analysis for origin exploration by BinVestigate.  

  图2 用BinVestigate进行原始探索的代谢组学分析

  

  在44,128个样本中检测到一个未知的BinBase代谢物(BB160842)(如图2),其中90%来自微生物,粪便或血浆。人体或动物排泄物中的信号强度比微生物细胞高5?10倍,比体液或组织高20倍以上。这表明一种微生物来源的化合物被排泄到人血浆中。另外代谢物BB106699在7228个样品中被检测到,最常见的是在不同的癌细胞系和癌症组织中(如图2)。它在骨髓瘤细胞系中的信号强度为其他细胞类型如小鼠肾细胞的100倍。这种化合物从来没有在粪便或细菌样品中发现,这支持了以下观点,即它可能是真核生物专有的,并且在癌症中具有特定的作用。

  

  为了通过此工作流程来识别未知化合物,使用不同的电离技术检测了高分辨率(HR)精确质量GC-MS数据,并使用LC-MS/MS进行验证。与LC-MS/MS代谢组学不同,基于GC-MS的分析甚至在软化学电离的情况下,在电离源处导致大量的碎裂。因此,开发了数据处理软件MS-DIAL 2.0的新版本来处理GC-MS数据,包括光谱解卷积和化合物鉴定(补充图2和3,补充数据集1和在线方法)。支持任何主要供应商的多个MS数据类型(低分辨率MS或HR-MS,以及GC-MS,LC-MS和LC-MS/MS)或补充图4的开放数据。使用MS-DIAL 2.0,从含有未知代谢物的代表性生物样品中提取GC-HR-MS和LC-HR-MS/MS的解卷积光谱。

  

  Supplementary Figure 2 Methodology and example for MS-DIAL 2.0 program.  

  补充图2 MS-DIAL 2.0程序的方法和示例

  

  注:(a)峰点:为了确定用于GC-MS谱的碎片离子,检测到的m/z-RT特征被称为具有计算的峰质量和峰值清晰度值的“峰点”。(b)特征检测:将具有相同峰宽和峰顶保留时间的所有峰点组合成单个阵列。对于每个阵列,将峰值锐度值合计,并应用导数滤波器来构建“峰值组”。(c)解卷积和鉴定:利用MS1Dec色谱图解卷积和开放存取MoNA质谱数据库,对0.4-0.6s峰顶差异的共洗脱代谢物-磷酸盐,亮氨酸和甘油进行注释。“匹配”和“R.匹配”分别表示在NIST MS搜索程序中计算的点积和反点积值。

  

  Supplementary Figure 3 MS-DIAL 2.0 deconvolution example for Agilent GC-Q(MS).  

  补充图3 Agilent GC-Q(MS)的MS-DIAL 2.0解卷积实例

  注:Agilent GC-Q(MS)系统分析生物样品证实GC-MS色谱图解卷积的准确性。补充数据1中显示了使用LECO GC-TOF(MS),Shimadzu GC-Q(MS),Bruker GC-Q(MS)和Thermo GC-QExactive(MS)数据的其他实例。

  

  Supplementary Figure 4 Data stream of the MS-DIAL 2.0 program.  

  补充图4 MS-DIAL 2.0程序的数据流程

  

  注:MS-DIAL 2.0为MS数据处理的通用软件。首先,将MS供应商格式或通用格式(mzML/CDF)数据转换为ABF二进制格式进行快速数据检索,而通用格式,而mzML和netCDF可以直接导入。然后MS-DIAL 2.0进行色谱图解卷积,支持任何MS分析平台,从低分辨率GC-MS(MS/MS)或LC-MS(MS/MS)到数据相关或数据独立采集方法。最后,程序通过与质谱库进行匹配和进一步的统计分析来实现复合标注。

  

  在此工作流程中,接下来使用MS-FINDER 2.0进行未知HR-MS谱的结构解析,如BB106699(图3,补充图5和6以及在线方法)中所示。首先,确定分子加合离子追踪未知化合物的化学式,发现初始甲基裂解碎片离子([M-CH3]+)的含量很低,阻碍了元素分子式的计算。GC-HR-MS产生了另一种高度特征分子加合离子。对于BB106699,基于m/z 611.118([M-CH3]+),m/z 627.214([M+H]+),m/z 655.244处的离子的排列,计算分子量为626.212Da([M+C2H5]+),m/z 667.245([M+C3H5]+)。MS-FINDER 2.0计算了C10H15N2O9P可靠性最高的元素分子式,通过使用适用启发式和化学规则的TMS衍生物的优化算法(图3b)。

  

  Figure 3 The identification of N-methyl-UMP by MS-DIAL 2.0 and MS-FINDER 2.0.  

  图3 通过MS-DIAL 2.0和MS-FINDER 2.0鉴定N-甲基-UMP

  

  通过将常规TMS衍生化与稳定同位素标记的d9-三甲基甲硅烷基(其直接产生TMS基团的数目)或未知分子中酸性质子的数目(图3b)进行比较,进一步验证了该分子式。基于GC-MS的代谢组学需要衍生化的事实允许省略具有少于四个酸性质子的C10H15N2O9P的同分异构体结构。此外,基于甲氧肟化与乙肟化的化学衍生化结果的比较显示未知化合物不具有醛或酮官能团。在随后的LC-HR-MS/MS分析中,用精确的质量和天然同位素丰度信息验证了分子式(图3b)。

  

  此方法揭示,与其他细胞类型或组织中的水平相比,N-甲基-UMP在癌细胞和癌症组织中高度上调。最近,小分子的甲基化已经显示出直接调节干细胞的细胞进程,从而提高了癌细胞相关机制的可能性,或使用甲基化代谢物作为癌症生物标志物。更广泛地说,已经非常规律地证明,代谢物的小的化学改变可以将这些化合物从主要的生物化学途径中移除,并且这种修饰的代谢物(即抗代谢物)随后获得调节功能,例如与氧化脂类似。为了发现抗代谢药物,BinVestigate,MS-DIAL和MS-FINDER的整合提供了一个系统的策略,可以利用完整的质谱信息和生物元数据来成功找到和排列最可能的化学结构。


相关产品
移动版: 资讯 直播 仪器谱

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved

京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号