基于Structure Elucidator Suite辅助解析复杂天然产物biatractylonoid D的结构

2026-04-02 11:55:24, 编译| 胡炽文 Advanced Chemistry Development, Inc. (ACD/Labs)


  

背景


 

在天然产物化学领域,二聚倍半萜因其独特的结构多样性与显著的生物活性而广受关注。该类化合物以C₃₀碳骨架为特征,由两个单体单元通过化学键连接形成,其来源主要集中于菊科植物。据文献统计,目前已发现并鉴定的二聚倍半萜结构已逾290种

然而,在庞大的二聚倍半萜家族中,桉叶烷(eudesmane)型二聚体相对罕见。作为传统中药白术(Atractylodes macrocephala)的关键活性成分,此类化合物的发现数量极为有限,此前已报道的仅有6例

这一局面在2025年发表于《Journal of Organic Chemistry》的研究中取得了突破[1]。来自北京协和医学院药用植物研究所天然药物活性物质与功能国家重点实验室的研究人员从传统中药白术中成功分离并鉴定了五个结构新颖的桉叶烷型二聚倍半萜化合物,并将其命名为Biatractylonoids A–E

Biatractylonoid D的结构挑战

其中,Biatractylonoid D的结构尤为独特。它拥有一个全新的重排桉叶烷型二聚体骨架,该骨架由七个环系通过罕见的6/6/5/5/5/5/6模式稠合而成。两个单体单元通过一个五元含氧杂环以非经典方式连接,形成了一个具有显著几何张力的新颖分子结构。

图1. Biatractylonoid D的结构

 

计算机辅助结构解析(CASE)


 

面对如此复杂的结构,传统的核磁共振光谱学分析方法面临严峻挑战。高效、准确地确定其所有原子连接关系,关键在于采用计算机辅助结构解析Computer-Assisted Structure Elucidation, CASE)技术。

第一步:锁定核心信息

化合物 1 获得时为白色粉末,其分子式经高分辨电喷雾质谱测定为C₃₀H₃₈O₅HR-ESI-MS: m/z 479.2788 [M + H]⁺,计算值C₃₀H₃₉O₅ 479.2792)——这是解题的总纲。

接下来,研究人员通过一维和二维核磁共振数据(包括HSQCHMBCCOSY)获取了它的"光谱指纹",并与已知的类似化合物(Biatractylonoids A–C)进行比对。

表1. Biatractylonoid D 的一维与二维核磁共振波谱数据

图3. Biatractylonoid D的红外光谱


从红外光谱中可初步获取有关分子中所含官能团的重要信息。


第二步:软件眼中的"分子连接图"

将波谱数据输入ACD/Structure Elucidator软件后,系统首先生成了一个分子连接图,它可视化了已知的原子连接关系。

图4. Biatractylonoid D的分子连接图

碳原子颜色:紫色代表sp²,蓝色代表sp³。
关键标签:"fb"表示该碳原子禁止与杂原子相邻。
绿色箭头:HMBC相关信号(指示相隔两至三个键的连接)。
蓝色箭头:COSY相关信号(指示相邻氢原子的连接)。

这张图暴露了一个严峻的现实:挑战巨大。图中有三个碳原子(化学位移127.60、148.8、149.2 ppm)在HMBC和COSY谱中没有任何相关信号,这意味着它们是结构中的"孤岛"。此外,还有三个碳原子(化学位移92.7、94.8、110 ppm)的杂化状态不明,可能是sp²或sp³。

由于数据模糊,软件对这个结构的“解题”思路将是穷举法:它需要尝试所有可能性,将这些模糊不清的原子以不同方式插入到结构骨架中。这些组合如下所示:

这意味着候选结构的数量将是天文数字!


第三步:启动12小时的"结构风暴"

软件开始了全自动的结构生成与筛选。整个过程无需人工干预,就像一场大型的化学计算风暴。其核心逻辑是:生成所有可能的连接方式(即异构体),然后用计算出来的核磁谱图去和真实的实验数据比对,选出最匹配的。

  1. 结构生成:基于分子连接图,生成所有可能的化学结构。

  2. 化学位移预测:对每个候选结构,使用先进的算法(如基于HOSE码的经验方法、神经网络法和增量法)预测其碳13核磁共振化学位移。

  3. 结构过滤:计算每个候选结构的预测化学位移与实验值的平均偏差。偏差过大(>5 ppm)的结构被直接淘汰。



运行结果:
  • 初始生成结构数:235,040 个。
  • 过滤后数量:1,231 个。
  • 去重后数量:337 个。
  • 总耗时:12小时15分钟。


尽管耗时漫长,但这是完全自动化的过程。运行结束后,软件将所有候选结构按与实验数据的匹配度(平均偏差大小)进行了排序。

图5. 排序后输出文件中的结构

碳13化学位移预测采用了基于HOSE算法、神经网络法以及增量法。相应方法得出的化学位移平均偏差分别标记为dA、dN和dI。结构中的氧杂环丁烷(Oxetane)以红色标出。

一个令人振奋的发现是,排名第一的结构,与文献[1]中通过更复杂的密度泛函理论(DFT)计算和X射线衍射分析最终确定的结构,完全一致!

图5显示,约半数结构包含一个氧杂环丁烷环(以红色标出),此类结构在天然产物中较为罕见。考虑到这一点,我们从输出文件中移除了所有包含氧杂环丁烷环的结构,因此337个结构中仅余112个。重新排序后文件的前八个结构如图6所示。

此外,我们计算了图6所示前四个结构的DP4概率,结果如图7所示。

图6. 精简输出文件中排名前八的结构

碳13化学位移预测采用了基于HOSE算法、神经网络法以及增量法。相应方法得出的化学位移平均偏差分别标记为dA、dN和dI。每个原子的颜色用于标示其实验与计算所得的碳13化学位移之间的差值:绿色代表差值在0至3 ppm之间,黄色代表差值在3至15 ppm之间,红色代表差值大于15 ppm。

图7. 程序计算得出的结构正确性DP4概率

结果显示,排名第一的结构,其DP4概率在三种不同的预测方法下都达到了100%。这几乎是来自算法的"盖棺定论"。

 

效率优化:关键发现


 

12小时的运算看似漫长,但对于一个前所未见的七环复杂分子来说,效率已堪称惊人。为了探究效率瓶颈,研究人员进行了一次对照实验:他们对那几个"杂化状态不明"的碳原子(C 92.7、C 94.8、C 110)做了"明确指定"——将它们的杂化状态固定为sp³。

优化后结果
  • 总耗时:从12小时15分钟,大幅缩短至4小时35分钟!

  • 生成的结构:最终也收敛到了同一个正确答案。


这个实验清晰地揭示:数据模糊是计算耗时的"罪魁祸首"。一旦对关键信息做出明确限定,软件的计算效率将得到数量级的提升。这也提示科学家,在实验数据采集和解读阶段,若能尽可能地减少不确定性,将为后续的计算机解析铺平道路。

 

结语


 

Biatractylonoid D的解析案例,是一曲人机协作的凯歌。

面对一个前所未有的、七环交织的复杂二聚体,传统光谱分析手段望而生畏。但ACD/Structure Elucidator 这样的计算机辅助结构解析工具,却能够通过系统性的穷举、预测与比对,在全自动模式下,从海量(23.5万)可能性中,精准地锁定唯一正确的结构。

整个过程不仅验证了已知结果,更清晰地展示了各因素(如杂化状态不明确)对计算效率的影响。它提醒我们,在探索未知分子的边界时,强大的算力和算法已成为化学家不可或缺的“外脑”与“加速器”。

最终确定的结构及其化学位移归属如下图所示,一个化学世界的“奇观”就此被精准测绘。


参考文献:

[1] Zhang, L.; Yin, S.; Yu, H.; Jin, M.; Yu, L.; Li, T.; Zhang, K.; Zeng, Z.; Zou, Z. Biatractylonoids A−E, Five Eudesmane-Type Sesquiterpenoid Dimers from the Rhizomes of Atractylodes macrocephala with Antiinflammatory Activity. J. Org. Chem. 2025, 90, 15748−15759.


 

END


往期推荐


2025年度ACD/Structure Elucidator Suite应用案例总结

计算机辅助结构解析 (CASE) 在天然产物结构解析中的作用

运用ACD/Structure Elucidator软件辅助解析疣孢菌素C的结构

从实验数据中解析复杂结构——ACD/Structure Elucidator Suite

从结构到谱图:ACD/Labs如何让全球最大天然产物库“活”起来

利用人工智能突破一维核磁共振光谱的局限,实现自动化分子结构解析

计算机辅助解析天然产物Herqupenoid A的结构

计算机辅助解析天然产物Myrtinol E的结构


ACD/Labs CN

微信号|ACDLabsCN

长按识别二维码关注我们

联系我们:

阎作伟 13816084932  zuowei.yan@acdlabs.com

陈诚 17705179237  martin.chen@acdlabs.com


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2026 ANTPEDIA, All Rights Reserved