《自然-通讯》七叶树基因组揭示七叶皂苷和七叶树生物合成及进化机制

2023-12-28 15:06:56, Create 科瑞恩特(北京)科技有限公司


关键词:MALDI-MSI 质谱成像、Horse chestnut 七叶树、biosynthesis 生物合成、genomics 基因组学、whole-genome duplication 全基因组复制

2023年10月,陈士林团队在《自然-通讯》(Nature Communications)发表题目为“Characterization of the horse chestnut genome reveals the evolution of aescin and aesculin biosynthesis”的文章,刊登作者采用本草基因组学研究策略对天然药物七叶皂苷和七叶素特异性合成的分子机制及绿色合成开展研究的相关成果,利用多组学及MALDI质谱成像技术将中药活性成分的生物合成研究提升到空间组学水平。

该研究通过空间代谢组揭示七叶皂苷在娑罗子的子叶中特异性积累,解析了中华七叶树高质量基因组,并通过代谢组学、转录组学以及合成生物学等方法,成功解析七叶皂苷生物合成途径中关键的环化、氧化、酰基化和葡萄糖醛酸化等催化步骤。同时,还通过全被子植物基因组层面共线性研究,发现玉蕊醇型三萜代谢基因簇的招募和进化模式,更好地理解了玉蕊醇型三萜类化合物在无患子科植物中的形成机制。为七叶树的遗传改良和次生代谢产物的合成提供了一定基础,对七叶树的品种改良和药用价值的开发利用具有重要意义。


 前言 

七叶树是一种重要的药用树木,含有多种药用活性成分,如七叶皂苷(玉蕊醇型三萜皂苷)和七叶素(香豆素类成分)。这些化合物具有抗炎、抗氧化、抗肿瘤等药理活性。目前七叶皂苷制剂在临床上已被广泛应用于慢性静脉功能不全、水肿和痔疮等疾病的治疗。七叶素也与地高辛一起被用作七叶洋地黄苷滴眼液的原料,用以缓解眼疲劳、眼痛和干眼等症状。然而,关于七叶树基因组的了解非常有限,对于七叶皂苷和七叶素的生物合成途径和进化机制也知之甚少。因此,本研究旨在通过对七叶树基因组的特征分析和生物合成途径的研究,揭示七叶树中七叶皂苷和七叶素的生物合成进化过程。


  实验设计 

该研究的主要思路是利用基因组、转录组、代谢组、空间代谢组以及合成生物学等技术,揭示七叶树中七叶皂苷和七叶素生物合成的进化过程。具体研究内容包括以下4个步骤

01
七叶树基因组的测序和组装

通过使用Illumina和ONT测序技术,对七叶树基因组进行测序和组装。由于ONT测序的准确性较低,使用Illumina short reads对组装的contigs进行了三次校正,提高了基因组的完整性和准确性。

02
七叶树基因组的特征分析

通过对基因组的分析,确定了七叶树基因组的大小、重复DNA的含量和类型等。此外,还鉴定了七叶树基因组中的蛋白编码基因数量,并进行了功能预测和比较基因组学分析。

03
代谢物定量及空间分布分析

通过超高效液相色谱-三重四极杆串联质谱(UPLC-QQQ-MS/MS)技术,对七叶树中5个不同组织中(树枝、花、叶、果皮、种子)的代谢物进行了定量分析。并通过MALDI MSI(基质辅助激光解吸电离)技术确定了候选代谢物在种子中的空间分布情况。

04
基因家族分析

通过比较七叶树与其他植物物种的基因组,确定了在七叶树中显著扩张或唯一存在的基因家族。这些基因家族的功能预测有助于理解七叶树的进化和适应性。


  实验结果 

01
七叶树不同组织和蒴果中的代谢物图谱

利用LC-QQQ-MS/MS对七叶树5个不同组织中(树枝、花、叶、果皮、种子)的原七叶皂苷元、七叶皂苷IA、七叶皂苷IB、秦皮乙素和秦皮甲素的代谢谱进行分析。结果显示,秦皮甲素在叶和花中的含量显著高于种子,而七叶皂苷IA和七叶皂苷IB在种子中的含量最高。利用MALDI-MSI对候选代谢物在种子中的分布进行可视化分析,结果表明七叶皂苷IA和其同分异构体七叶皂苷IB (m/z 1169.5152)[C55H86O24 + K]+ 在子叶上大量积累。

图1 七叶皂苷及其相关化合物在七叶树发育过程中不同器官的发育图谱

A:七叶树叶子(L)、树枝(B)、花(F)、果皮(P)、种子(S)的形态;

B:原七叶皂苷元、七叶皂苷IA、七叶皂苷IB、秦皮乙素和秦皮甲素的绝对定量;

C:MALDI-MSI图像和种子横切面的显微镜图,以及七叶皂苷IA/七叶皂苷IB(m/z 1169.5152)在七叶树种子子叶上的分布。

02
七叶树基因组的组装及注释

利用流式细胞仪估计出七叶树基因组大小为481.90Mb。基于Illumina short reads对七叶树的基因组进行估计,大小为504.28 Mb,杂合峰较小,重复峰明显,表明该基因组杂合性较低(~0.37%)。利用ONT进行长读测序,获得34Gb的数据,覆盖率为68倍,N50长度为11.74 kb。经过校正、修剪和组装,过滤后的ONT reads组装成656个contigs,总大小为470.02 Mb,N50长度为2.05 Mb,占估计核基因组大小的97.50%。但由于ONT测序准确性较低,又使用Illumina short reads对该基因组进行了3次优化。采用BUSCOs估计鉴定出97.4%的植物单拷贝同源,表明优化后的七叶树基因组具有高度的完整性。此外,Hi-C染色体构象捕获测序得到344,838,272个原始配对末端reads,其中58.05%(189,382,086)作为唯一的配对端reads被定位到contig上。共461.08 Mb(98.09%)的组装基因组被锚定在20条染色体(2n = 40)上。

七叶树基因组中约59.14%的重复DNA与已报道的无患子科基因组转座子的含量一致。在这些重复元件中,24.37%的转座子是长末端重复逆转座子,其中 98.1%属于Gypsy超家族(32.7%)和Copia超家族(65.4%)。此外,还鉴定了 36,557个蛋白质编码基因,在20条染色体上可以定位到35,790个(97.9%)基因。

03
系统基因组年代测定和全基因组复制分析

选取13种植物的139个单拷贝基因构建系统发育树。系统发育树结果表明,七叶树与另外两种无患子科植物(文冠果和龙眼)的亲缘关系较近。利用单拷贝基因核苷酸序列和化石年代校准对所测谱系进行分子定年,结果表明,无患子科和芸香科的分化发生在大约36.3 MYA年前。七叶树和文冠果的分化发生在32.5 MYA年前。

WGD 是产生表型多样性、物种形成和驯化的主要进化力量。基因组内共线分析发现七叶树中至少有一个全基因组重复(WGD)事件。七叶树与文冠果、七叶树与克里曼丁红橘的共线性分析表明,七叶树的两个同源片段对应于文冠果与克里曼丁红橘的一个同源区域。这一结果也证实了当七叶树从与文冠果的共同祖先分化出来后,可能已经发生了一个物种特异性的WGD事件。此外,七叶树同源基因和anchor pairs(来自同一共线性块上面的旁系同源基因对)的每个同义位点分布的同义取代数进一步显示在0.24处有一个明显的峰值,在约1.75处有一个小峰,这表明七叶树可能经历了两次WGD事件。为了探究WGD对七叶皂苷生物合成的影响,该研究系统地计算了每一对重复的同源基因对的Ks值,尤其是参与萜烯生物合成的上游途径中的基因,发现Aα WGD只导致萜烯途径中重复物的保留,这表明代谢通量可能已经向三萜代谢转移,从而导致七叶皂苷的产生。

图2 七叶树基因组的进化分析

A:七叶树基因组的染色体水平组装(a:转座子;b:基因密度;c:种子与其他组织之间的基因表达量;d:GC含量;e:七叶树同源序列的共线性分析)。

B:从选定的植物类群中单基因家族的同源性推断出的系统发育树,分支上的红色圆圈突出了七叶树特有的WGD事件(Aα)。

C:七叶树、克里曼丁红橘和文冠果基因组区域的宏观共线性。

D:七叶树、克里曼丁红橘和文冠果的染色体比较。

E:七叶树、克里曼丁红橘和文冠果的同源基因和副同源基因的每个同义位点的同义替换(KS)分布。

04
通过BGC和WGCNA分析挖掘七叶皂苷A通路

为了鉴定七叶树中参与三萜生物合成的BGCs,该研究寻找了已知参与这种代谢的OSCs/裁剪酶(例如,最常见的CYP716家族)的基因组区域,发现了4个含有OSCs的BGC和1个含有CYP716基因的BGC,称为AcClustersI-V;这些BGCs参与了七叶树中的三萜生物合成。

共线性分析分析表明,AcCluster II与AcCluster I在物理上是同源的。其中,AcCluster I位于15号染色体上,包含两个OSC同源物(AcOSC6AcOSC9),7个P450(ACCYP716A274ACYP7CYP716A276、AcCYP716A277AcCYP716A278AcCYP716BX1AcCYP716BX3AcCYP716BX6)和350kb区域内的5个BAHD(AcBAHD1-AcBAHD5)。AcCluster II位于8号染色体上,由两个P450基因(AcCYP716A275AcCYP716BX2)和一个类纤维素合酶基因(AcCSL1)组成。RNA-seq数据进一步显示,1个OSC(AcOSC6),4个P450(AcCYP716A275AcCYP716A278AcCYP716BX1AcCYP716BX2),和3个BAHD基因(AcBAHD1AcBAHD3AcBAHD5)在七叶树种子中大量表达,这与七叶皂苷IA/IB的积累规律一致,因此推测其参与了三萜的环化、羟化、葡萄糖化醛酸化和酰化。为了扩大候选基因的范围,进一步进行了WGCNA分析,在turquoise模块发现了1个OSC、3个CSL、9个UGT、13个p450和19个BAHD基因。

05
七叶皂苷A合成通路中基因的鉴定

为了探索来自 AcClusters I 和 II 的CYP716基因是否能催化七叶皂苷A的生物合成途径的早期步骤,在烟草系统中与AcOSC6AstHMGR共表达 AcCYP716A275AcCYP716A278,分别在13.6和14.9 min处产生峰值,13.6 min时为AcCYP716A275AcOSC6共表达产生的16α-hydroxy-β-amyrin,14.9 min时为AstHMGR/AcOSC6/AcCYP716A278生成的化合物21β-hydroxy-β-amyrin。将AcCYP716A275BfCYP716Y1AcCYP716A278GmCYP72A69分别转染到工程酵母菌Y1-20-6中,产生的催化活性与本氏烟草中的一致。该研究发现AcCYP716A275催化β-amyrin的区域特异性C-16α氧化,这与CYP716A亚家族在三萜氧化中更广泛的功能一致。

然而,我们发现CYP716A亚家族成员而不是CYP72A亚家族成员对七叶皂苷IA的生物合成进行C-21β羟基化。为了检测AcCSL1是否具有葡萄糖醛酸转移酶的作用,以GmCSyGT1作为阳性对照,进行了体内底物喂养和体外酵母菌检测。在酵母中进行重组表达的底物喂养实验表明,GmCSyGT1和AcCSL1作用于底物原七叶皂苷元,导致分子离子在m/z 681.3 Da处达到峰值;该分子量相当于[M+COOH]加葡萄糖醛酸。用含有重组AcCSL1或GmCSyGT1的酵母微粒体进行酶学分析,得到了相同的结果。为了研究以乙酰辅酶A为供体的WGCNA中转录的BAHD(AcBAHD1和AcBAHD6)对底物原七叶皂苷元的活性,采用大肠杆菌重组蛋白。AcBAHD3AcBAHD6可以乙酰化原七叶皂苷元的羟基,得到产物m/z 593.3。但AcBAHD3的转化率远低于AcBAHD6。此外,AcBAHD3和AcBAHD6可以利用乙酰辅酶A作为乙酰供体催化去乙酰七叶皂苷A,生成七叶皂苷IA。研究结果表明,AcCluster I和AcCluster II BGCs有助于BAT的生物合成,并将其命名为BAT BGCs。

图3 七叶皂苷IA通路的挖掘与鉴定

A:两个BAT BGC的共线性。

B:三萜生物合成相关的共线基因和AcBAHD6在七叶树不同组织中的表达。

C:推测的七叶皂苷IA生物合成途径和每个步骤的候选酶。实心箭头表示在本研究中已经验证,虚线箭头表示推测的步骤。

D-F:化合物GC-MS图谱。

06
Ac4CLs、AcF6’Hs和AcUGTs对秦皮甲素生物合成的功能鉴定

该研究从七叶树基因组中鉴定出7个PALs、3个C4Hs、5个C3Hs、4个4CLs、和 5 个 F6''Hs。克隆了3个Ac4CLs (Ac4CL1-3)和4个AcF6''H (AcF6''H1-4)。分光光度法测定结果表明,三种特征的Ac4CL酶对咖啡酸具有催化亲和力,可催化其生成咖啡酰辅酶A,其中Ac4CL2的催化性能最佳。酶学分析结果表明,在以咖啡酰辅酶A为底物时,AcF6''H1AcF6''H2均表现出羟基化活性。经LC-MS/MS检测,羟基化产物为秦皮乙素。

从七叶树中克隆了19个UGT基因,将其在大肠杆菌中表达,以产生重组蛋白,然后以秦皮乙素为受体,以UDP-葡萄糖为供体底物,研究这些蛋白的酶活性。研究发现AcUGT84A56和AcUGT92G7的催化产物相对于相应的苷元的分子量增加,引起了一个葡萄糖的加入。通过质谱数据比较,确定以秦皮乙素为底物的AcUGTs酶促产物为秦皮甲素。酶动力学试验结果表明,AcUGT92G7 (KM = 48.96μM)的催化活性强于AcUGT84A56(KM = 177.25μM)。

07
在大肠杆菌中从头生成秦皮甲素

该研究利用特征酶Ac4CL2、AcF6’H1和AcUGT92G7组装了秦皮甲素的从头生物合成途径。通过表达四种关键酶来提高莽草酸盐途径中的碳通量。为了减少PEP向丙酮酸的转化,选择了BWΔpykAΔpykF菌株。将BWΔpykAΔpykF与质粒pZE-649T和pCS-TPTA-HpaBC共转化,形成菌株BW1。菌株在发酵0-24h时生长速度较快,24 h后生长速度减慢,72 h时生物量OD600为18.1。随着发酵过程的进行,秦皮甲素的产量也稳步增加。72 h的最终产量达到16.3±0.7 mg/L。

图4 参与秦皮甲素的Ac4CLs、AcF6´H和AcUGTs的功能鉴定,以及秦皮甲素的从头生物合成途径。

A:秦皮甲素生物合成途径中的酶。

B:Ac4CL酶活性测定。

C:AcF6´H酶活性测定。

D:AcUGT92G7或AcUGT84A56生成秦皮乙素的UPLC分析。

E:在大肠杆菌中合成秦皮甲素的人工途径。

F:用菌株XC-6(BW-1, pCS-TPTA-HpaBC, and pET-648T)的生成秦皮甲素的从头生物合成途径。

08
BAT BGCs的进化与组织

分布在AcCluster I和AcCluster II中的AcOSC6CYP716BAHD IIIa和CSL基因是催化BAT生物合成的关键酶。在AcCluster I和AcCluster II的同源区块中,17对同源基因对的平均KS值为0.27,与七叶树中的旁系同源基因的KS较相似,说明了AcCluster I和AcCluster II的重复事件可能来源于AαWGD。共线性分析表明,在七叶树亚科中,AcCluster I和AcCluster II是保守的。

该研究又进一步对21个已发表的植物基因组进行了进化动态分析,包括早期分化的被子植物、单子叶和双子叶基因组。在早期分化的被子植物无油樟中,有64个基因的约1Mb片段,包括CAS基因和一个BAHD IIIb基因。CYP716A成员首次出现在毛茛目物种的相应区域。在与超菊类物种分裂后,除十字花科的一些代表物种外,几乎所有的syntenic segments都保留了至少一个OSC基因。值得注意的是,在葡萄基因组的保守syntenic region发现了10个完整和10个部分OSC基因的大量物种特异性串联重复。BAS/CYP716/BAHD BGC一直存在于超蔷薇类物种种的syntenic region,但会发生动态复制和重组。该研究认为,完整的BAT BGC BAS/CYP716/BAHD/CSL首次在七叶树亚科中组装,即产生BAT的植物。此外,BGC在物种形成过程中经历了进一步的动态进化,如CYP716ACYP716BX的串联基因复制,以及本文观察到的AαWGD事件中AcCluster I和AcCluster II的群体特异性复制。

为了进一步研究OSCsP450sCSLsBAHDs的进化起源,该研究还构建了ML进化树,证实了BASCYP716CSLBAHD III基因在三萜生物合成中是保守的。纤维素合酶基因家族系统发育树分析表明,AcCSL与其在漾濞槭和文冠果中的共线基因,以及功能验证的催化葡萄糖醛酸与三萜主干结合的CSLs具有密切的系统发育关系(序列同源性为 44.7% ~ 55.2%)。

综上,该研究提出了基于祖先状态重建的被子植物中BAT BGC的出生、死亡和进化轨迹。(1)出生于早期被子植物:在无油樟中,BGC的祖先包含1个 CAS和1个BAHD IIIb;(2)死亡于单子叶植物:包含CAS等非BAT功能基因的区域被保留,但BAHD IIIb丢失;(3)进化于特定的早期分化的真双子叶植物:BAS经过了进化,并加入了CYP716;(4)死亡于超菊类植物:BGC在这个谱系中消失;(5)BAT BGC在七叶树亚科中的组装:功能性BGC(BAS/CYP716/CSL/BAHD)的形成,导致BAT的产生;(6)BAT BGC的重组和多元化:该BGC通过串联复制和WGD以物种特异性的方式进行动态进化。

图5 被子植物中BAT三萜生物合成相关基因簇的进化。

A:基于已报道的基因组信息,利用OrthoFinder构建了系统发育树。

B:被子植物间共线性基因块的长度分布。

C:被子植物同源区块的基因数量。

D:定位于BAT BGCs中的OSCs、P450s和BAHDs的系统发育关系。

E:BAT BGCs经过多次串联复制、基因插入、基因丢失和WGD后的进化模型。


  总结 

该研究首次对七叶树基因组进行了全面的特征分析,揭示了七叶素和七叶皂苷生物合成途径的进化过程。通过整合多种方法,包括基因预测、同源蛋白搜索和转录组测序,成功鉴定了七叶树基因组中的相关基因。通过比较基因组学分析,发现了七叶树中与其他物种相比扩张或特异表达的基因家族。

该研究首次对七叶树基因组进行了全面的特征分析,并揭示了七叶树中七叶素和七叶皂苷生物合成的进化过程。该研究组装了完整性较高的七叶树基因组。并且成功地鉴定了七叶树基因组中的重复序列和转座子元件。此外,研究还鉴定了七叶树基因组中的蛋白编码基因,并对其进行了功能预测。还通过比较七叶树与其他植物物种的基因组,发现了在七叶树中显著扩张或独特存在的基因家族。这些基因家族可能与七叶素和七叶皂苷的生物合成过程相关。总的来说,这项研究提供了对七叶树基因组的全面描述,并揭示了七叶素和七叶皂苷生物合成的进化过程,为进一步研究七叶树的生物合成途径和潜在应用提供了重要的基础,也为七叶树的遗传改良和次生代谢产物的合成提供了基础数据和候选基因,有助于七叶树的品种改良和药用价值的开发利用。

https://www.nature.com/articles/s41467-023-42253-y


「科瑞恩特」独家代理质谱成像离子源

在大中华区独家代理的两款质谱成像离子源,都可搭载Thermo ScientificTM Q ExactiveTM或Obitrap ExplorisTM系列质谱仪。

AP-SMALDI 5AF高分辨自动聚焦3D快速质谱成像系统,常压操作环境,空间分辨率可达到3 μm,独特3D检测模式可以检测凹凸不平的样品表面,快速检测模式可达18pixel/s,全像素检测大大提高检测灵敏度,高空间分辨率和高质量分辨率使样本中的分子化合物达到最佳成像效果。

MALDI ESI InjectorTM 透射式超高分辨质谱成像系统,可以同时搭载MALDI离子源与ESI离子源,既可用于传统LC-MS/MS实验,也可用于质谱成像检测,通过双离子漏斗接口实现离子源快速切换,无需拆卸,操作便捷,并且接口可以进一步升级为MALDI-2和t-MALDI检测,大大提高空间分辨率和检测灵敏度。

「Create质谱成像」

第63期

文献整理:李俊

责任编辑:杜丽媛

新媒体:万润


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved