知组识谱 | 收藏!自建代谢物标准品数据库指南,搞定代谢组学硬指标!

2023-05-09 21:11:03, Calibra 杭州凯莱谱精准医疗检测技术有限公司



如果把代谢组学比作最近大热的ChatGPT,标准品数据库就是ChatGPT训练模型的语料库。假设训练ChatGPT的语料库小且语病百出,那么输出的内容就像一个语言贫乏的AI在胡言乱语;同样的,当标准品数据库不够大或者信息不完善,与化合物相关的信息输入到该数据库中,便很有可能输出不准确的鉴定结果,导致代谢物的鉴定不准确,那么基于该鉴定结果的后续分析也是白费力气。

目前代谢组学界达成共识的化合物鉴定等级可分为以下5个[1]Level 1为通过参考标准品在相同分析条件下确证的化合物,包括匹配保留时间(RT)、一级(MS1)和二级(MS2),这也是唯一可以被认为是确证的代谢物鉴定等级;Level 2为通过文献/公共库检索所得或者可能的断裂方式推测所得化合物;Level 3为根据某类化合物的特定碎片所推断的一类化合物;Level 4为根据质谱信息(例如:加和离子、同位素峰、碎片信息等)推测出分子式的化合物;Level 5为分离得到、有精确质荷比(m/z)且感兴趣的未知化合物。

图1. 代谢组学中代谢物鉴定的5级鉴定体系[1]

相比于基于公共库或者参考文献的Level 2鉴定,Level 1鉴定有着如下的优势:(1)公共库所使用的仪器平台多样,分析条件不一,呈现的谱图也各异;再加上每台仪器的背景噪声不同、液相体系不同,同样的仪器平台和方法参数所获得的谱图并不相同。(2)同分异构体,顾名思义,是分子式相同、结构不同的化合物。相同的分子式导致他们的精确质量数和同位素分布一致,而不同的分子结构并不一定会在二级谱图中存在明显差异,这时就需要引入另一个维度——色谱分离。同分异构体是代谢组学中十分常见也是不可避免的,拿葡萄糖(glucose)和甘露糖(mannose)举例,他们拥有同样的“马甲”——化学式C6H12O6,但二者是差向异构体(见图2),通过质谱图,包括一级和二级很难将两者区分开,但从色谱上(见图3)看到两个峰可以得到完全分离,可见RT是化合物鉴定非常重要的一环。

图2. 葡萄糖与甘露糖在高分辨中的二级图谱

图3. 通过液相色谱,可以实现葡萄糖与甘露糖的色谱分离,从而利用保留时间完成精确鉴定

自建库工作的第一步,就是购买需要的标准品并按照说明书对标准品进行保存,易氧化的化合物需充氮气密封保存,易光解的化合物需要避光保存,热不稳定的化合物则需要低温保存。同时还建议在标准品入库时进行分类,入库时间、保存位置和保存条件都建议登记存档,以避免和方便回溯标品过期、标品保存条件不当和标品错位等导致的谱图错误问题。固体粉末的纯标需要通过说明书或检索文献查到对应溶剂以完全溶解标准品并记录溶剂,溶液标品也需要记录溶剂信息,用于母液逐级稀释成中间工作液时的溶剂选择。

图4. 天津阿尔塔科技有限公司,是中国领先的具有标准物质专业研发及生产能力的国家级高新技术企业,助力凯莱谱多组学平台自建代谢物标品数据库建设 

其次检索化合物的基本信息,包括化合物名、分子式、精确质量数、CAS ID、HMDB ID和KEGG ID等等。买过标品的朋友这时候就比较好奇了,买标品的时候商家至少会提供标品名称,为什么需要再查一遍化合物名?


来,我们看个例子。Pyridoxine hydrochloride是买到的标品名称,检索得到的化学式为C8H12ClNO3,以此去提EIC图会发现找不到对应的峰,这是怎么回事呢?回过头来再看一下Pyridoxine hydrochloride的分子结构

发现它是吡哆醇以盐酸盐形式存在的标品,进入质谱仅留下吡哆醇,分析的化学式也应为C8H11NO3。现在能get到重新查一遍化合物信息的必要性了吧?回过头再来看一下Pyridoxine hydrochloride和Pyridoxine所检索信息的区别(见表1),名称错误还会导致CAS、HMDB、KEGG ID错误,而这些ID对于通路分析十分重要,相对化合物名称而言,ID的准确性,是通路分析的唯一标识。诸如此类,因合成工艺、保存条件和溶解性质而使标准品以盐酸盐、氢溴酸盐、硫酸盐、钠盐水合物、马来酸盐等形式存在的情况在检索时需要引起注意。此外,对只含有C、H、O、N的有机化合物还可以使用氮规则来检查分子量是否正确。

表1 Pyridoxine hydrochloride和Pyridoxine检索信息对照表

接下去到了上机采集的阶段。化合物在体内的浓度不一,同一化合物使用相同分析条件在不同浓度下产生的二级碎片并不一致,因此,建库时建议选择3-5个浓度进行。纯溶剂采集的质谱图,无论是一级还是二级,干扰少,而真实样本基质复杂,背景干扰多,所以补充基质库对于鉴定而言更为可靠。质谱一般设置正、负两种扫描模式,碰撞能量小编同样建议设定3-5个,这样能够更全面地看到化合物的碎片,使谱图库更为完整。此外,以Orbitrap为例,在保证质谱仪质量精度稳定的前提下缩小isolation window能够避免背景干扰出现在目标物的二级谱图中。


前文提到,色谱分离是化合物分离的另一维度,在建库时建议使用液相色谱串联质谱,虽然会拉长数据采集时间,但这样采集一方面可以区分同分异构体,另一方面可以按照代谢组学日常做样的方法参数采集数据从而得到可用的保留时间和对应液相体系下的质谱数据,一举两得。目前常见的代谢组学方法为了提高覆盖率,将亲脂性化合物的反相液相色谱RPLC与水溶性化合物的亲水相互作用液相色谱HILIC相结合已变得越来越普遍。


单纯收集数据还不算完,还得通过数据质控来判断采集的谱图是否稳定可靠。向上机溶液中加入内标是常用的手段,它能够通过记录内标的“表现”来监测色谱及质谱的“行为”。选择的内标应稳定,不影响待测组分且相对均匀地分布在色谱梯度上。标品采集前使用内标进行系统适应性测试,标品采集中使用内标实时监控仪器状态,内标的“表现”主要有:保留时间偏差(<0.2 min)、响应波动(CV<15%)、质量精度偏差(<10 ppm)和半峰宽(<0.03 mim)。另外柱压的监测也常用于判断色谱漏液情况,提前避免保留时间出现较大偏差。要知道Level 1鉴定的化合物需要匹配RT、MS1和MS2,其中RT是最容易发生偏移且也是最难监控的指标,如果没有内标作“记号”,RT的偏移或柱效的变差会使互为同分异构体的化合物鉴定错乱或无法分离。由此可见,只有严格的质量控制才能保证建库稳定可靠,由此鉴定的化合物才不会出现假阳、假阴的情况。


到这里,大家可以稍微喘口气了,数据采集告一段落。但,也仅仅是数据采集,最后还需要将采集的数据整理成数据库。下机的数据还需要先根据前期查的精确质量数算出[M+H]+和[M-H]-的m/z进行提峰,但一些化合物,比如碳水化合物,它的加和形式的响应要高于加氢、减氢峰,因此需要进一步判断出目标物响应高且稳定的母离子。需要注意的是正离子扫描模式下的加钠峰在建库时不建议使用,因为加钠峰打出的二级碎片不够稳定。此外,许多化合物还会在离子源发生源内裂解,产生中性丢失、自由基丢失等,小编将常见的母离子形式列出供大家参考(表2)。找到母离子后再根据m/z提出的色谱峰提取一级质谱图和二级质谱图,一级质谱图可以通过同位素峰的相对丰度对照化学式再次确认,而二级质谱图需进行降噪处理,查看谱图质量。

表2 质谱扫描常见母离子

小结

建立一个高质量的自建代谢物标准品数据库需要投入大量的金钱(标准品购买、检测仪器机时等等)和时间(标准品处理、数据采集和整理、数据库建立与维护等等),但是也能实现准确可靠的代谢组鉴定。做代谢组学简单,做好代谢组学不简单,可靠的标准品数据库是硬指标。类似打羽毛球,准确的标准品名称、ID是标准品数据库的“装备”,拥有RT、MS1和MS2的信息是标准品数据库Level 1鉴定的“功底”,严格的质控要求是保证标准品数据库稳定可靠的“竞技规则”,谱图的正确注释和解析是标准品数据库输出的“落点”,做好以上几点自然“得分”。小编和大家介绍标准品建库的基本流程和化合物鉴定的注意事项,希望广大科研人不再踩坑,拿可靠的数据做可靠的科研!

图5. 自建代谢物标准品数据库基本流程

参考文献

[1] Schymanski E. L. , Jeon, J. , Gulde, R. , Fenner, K. , Ruff, M. , Singer, H. P. , Hollender, J. Identifying small molecules via high resolution mass spectrometry: communicating confidence[J]. Environmental Science & Technology, 2014, 48(4), 2097.

● 往期推荐

学术成果 | 凯莱谱代谢组学平台持续支持环境暴露因素对人群健康影响的队列研究

世界防治结核病日 | 认识结核,规范防治

新品发布 | 胆汁酸代谢研究解决方案

再续六年硕果,凯莱谱与SCIEX开启新一轮战略合作


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved