【前沿组学】首个包含 35203 个代谢物的大规模 CCS 库面世

2018-11-10 12:17:45, 安捷伦 TSA 安捷伦科技(中国)有限公司


新年伊始,2017 年将新增安捷伦前沿组学专栏,专注分享组学前沿研究及热点应用方案,为大家奉上组学盛宴。作为开放的组学乐园,欢迎大家踊跃投稿,分享您的课题组最新文章及您对组学的观点及展望 !




首个包含 35203 个代谢物的大规模 CCS 库面世

——推动离子淌度质谱在代谢组学中的深入应用


本文分享中国科学院上海有机化学研究所生物与化学交叉研究中心的朱正江研究员课题组在 Analytical Chemistry 上发表的题为 Large-ScalePrediction of Collision Cross-Section Values for Metabolites in IonMobility-Mass Spectrometry 的文章。作者阐述了一种基于机器学习的人工智能算法来大规模预测小分子代谢物的碰撞截面积(Collision Cross-Section, CCS),并建立了首个可以应用于非靶向代谢组学研究的大规模代谢物 CCS 数据库(MetCCS, Database)。

原文链接:http://pubs.acs.org/doi/abs/10.1021/acs.analchem.6b03091 

 

代谢物鉴定目前依然是非靶向代谢组学面临的最大挑战之一,离子淌度质谱(IM-MS)可以获得代表化合物尺寸大小的碰撞截面积数据、区分电荷异构体和同分异构体,进而提供超越传统质谱平台的第四维结构鉴定信息,同时大幅提高实验的动态范围和峰容量,无疑将有效提升对复杂样品中未知代谢物的鉴定能力。将离子淌度质谱应用在代谢组学领域的呼声越来越高,然而制约其广泛应用的一大瓶颈在于目前缺少可用于代谢物鉴定的大规模精确碰撞截面积(Collision Cross-Section, CCS)数据库,本文旨在通过实验数据结合计算机算法拓展这一领域的研究。

 

代谢物 CCS 预测方法的开发及优化

 

首先,利用安捷伦 DTIM-QTOF-MS 6560 离子淌度质谱分别在正负模式下准确测定了 400 个代谢物的实验 CCS 值,结合表征代谢物尺寸、形状、电荷等相关的 14 个物理化学性质的分子描述符,共同组成训练样本集,由此构建机器学习预测模型。

 

经过计算机反复学习并优化预测参数,建立最终的预测方法,实现从代谢物的 14 个常见的物理化学性质来快速预测其碰撞截面积(CCS)的新方法。



图1. CCS  预测方法开发及优化流程

 

预测方法的外部验证及预测性能评估

 

为了客观地评估该方法预测的准确性,通过两组完全独立于训练集的 78 和 79 个代谢物样本集分别评估该方法在正负离子模式下的预测精度。实验结果显示,预测方法所获得的 CCS 预测值与安捷伦DTIM-QTOF-MS 6560 离子淌度质谱得到实测值十分接近,相对偏差 MER(median relative error)仅为 1.77% 和1.56%,证实该方法具备优秀的预测能力。

 

同时,将该方法和当前普遍使用的理论计算 CCS 方法进行比较,在正负两种模式下通过两组独立样本( 94 和 111 个代谢物)进行评估,预测方法的相对偏差仅为 2.51% 和 1.53%,而理论计算的相对偏差则达到 4.18% 和 5.03%。因此,预测方法较理论计算 CCS 的方法更加准确。


基于开发的方法预测建立目前最大规模的代谢物 CCS 数据库

 

基于上述预测方法建立了首个大规模的代谢物 CCS 数据库—MetCCS Database,包含人类代谢组数据库(HMDB)中的 35203 个代谢物,对每一个代谢物分别预测了 5 种不同加合离子([M+H]+,[M+Na]+,  [M+H-H2O]+,[M-H]-,[M+Na-2H]-)的 CCS 值,最终的数据库中共包含了 176015 条CCS 值。在实际的生物样品中应用 MetCCS 数据库,结合 CCS 数据可以显著提升非靶标代谢组学研究中代谢物鉴定的准确性,离子淌度质谱也可以基于该数据库在代谢组学广泛、深入的使用。

 


图2. 预测性能评估及预测包含35203个代谢物的大规模CCS数据库

 

该研究开发了通过 14 个物理化学性质来大规模预测代谢物 CCS 值的方法,最终建立了包含 35203 个代谢物的 CCS 数据库,这是目前已知的最大规模的代谢物 CCS 数据库,结合 CCS 数据库,可以显著提升非靶标代谢组学研究中代谢物鉴定的有效性和精确度。建立的 CCS 数据库已在互联网开放使用(http://www.metabolomicsshanghai.org/software.php ),同时基于上述方法的碰撞截面积预测软件(MetCCS Predictor)也已上线并开放使用(http://www.metabolomics-shanghai.org/MetCCS/),这无疑将有助于推动离子淌度质谱在代谢组学中的深入应用。


参考文献:

Z. Zhou, X. Shen, J. Tu, and Z.J. Zhu, Large-Scale Prediction ofCollision Cross-Section Values for Metabolites in Ion Mobility - MassSpectrometry, Analytical Chemistry, 2016, 88, 11084-11091. 


点击文末“阅读原文”,查看安捷伦代谢组学解决方案。


本文使用权归安捷伦科技(中国)有限公司所有,未经授权请勿转载至其他公众号,如需转载,请与工作人员联系,并注明出处。



  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved