NC项目文章 | 中国人民解放军总医院何昆仑教授团队揭示藏族人高海拔适应新机制

2024-03-22 10:02:53, 莲莲看 北京青莲百奥生物科技有限公司


藏族人对高海拔的适应是研究现代人类进化史上适应的理想模型,因为其环境控制的很好。在高海拔地区,高原反应(包括急性高山病、肺水肿和脑水肿等)较为常见,但藏族人群的患病率低于汉族人群,以往的研究主要集中在缺氧诱导因子(HIF)途径上。然而,这种适应性在种群规模上仍然不足。结构变异(SVs)在基因组生物学功能和人类进化适应中扮演重要角色,可以影响远程基因调控、基因簇扩增和强效适应性变化。然而,但人类基因中SV热点的分布模式仍不完全清楚。

2023年12月,中国人民解放军总医院何昆仑教授团队在期刊Nature Communications(IF=16.6)发表题为《Structural variants involved in high-altitude adaptation detected using single-molecule long-read sequencing》的研究论文,该研究构建了一个大规模的汉族和藏族人口的SV景观,揭示了SVs藏族人对高海拔适应的潜在作用。通过增强子报告基因,细胞敲除,DNA pull-down实验,研究发现藏族基因特性的缺失破坏了超级增强子,并下调了EPAS1的表达,揭示了基因调控回路重组在人类适应中的作用。青莲百奥为该研究提供了DNA pull-down质谱检测分析服务。

文章题目:Structural variants involved in high-altitude adaptation detected using single-molecule long-read sequencing

发表期刊:Nature Communications

影响因子:16.6

发表时间:2023年12月13日

发表单位:中国人民解放军总医院


研究策略


  • 样本选择:320例人血液(201例汉族和119例藏族)用于ONT长读长测序;150例人血液(75例汉族和75例藏族,其中123例既测长读长又测短读长)用于短读长测序。

  • 实验技术:单分子长读长测序,短读长测序,CRISPR/Cas9介导的基因敲除,RT-qPCR,DNA pull-down


研究结果


一、构建和验证汉族和藏族SVs调用集

这项研究使用了ONT(Oxford Nanopore Technologies)的PromethION平台对201个汉族和119个藏族个体的基因组进行了长读长测序,平均覆盖深度为20.24。每个样本通过cuteSV,sniffles和nanovar调用的SVs,并使用dbSVmerge将320个SV调用合并成最终的汉族和藏族SV调用集。在汉族人群中检测到了116,773个SVs,在藏族人群中检测到了94,312个SVs,总共检测到了136,257个SVs。这些SVs主要包括71,437个删除、56,799个插入、7198个复制和823个反转,平均每个样本包含19,272个SVs(图1b)。在50%的样本中,汉族和藏族种群中超过90%的SVs被捕获,表明,样本量足以描述汉族和藏族人群的SV景观。

通过手动验证、PCR验证和与其他平台(如PacBio、HiFi)的结果进行比较,来验证SV调用集的质量,结果显示,他们的SV调用集具有高质量。结果还显示,长读长测序平台在处理具有GC偏向性的基因组区域时也表现良好。与NGS相比,ONT平台在GC含量较高的区域中检测到了更多的SVs。最后,将SV调用集与其他公共SV集进行了比较,发现该研究扩展了东亚人群的SV调用集,增加了约43%的新SVs。此外,该研究还贡献了42,261个新的全局SVs,其中包括11,137个藏族特有的SVs和20,571个汉族特有的SVs。

总的来说,这项研究为汉族和藏族人群提供了高质量的SV调用集。

图1:119例藏族样本和201例汉族样本中SV的发现

二、SV的全基因组特性

SVs主要分布在重复区域(约67%在重复区域),如转座子和卫星重复区域。这可能是因为重复区域更容易发生非等位同源重组、复制滑脱和非同源末端连接等过程,导致SVs的产生。在各类重复元素中,SVs在SINEs、LINEs和LTRs中的分布比例分别为15%、8%和4%,而在卫星重复区域和简单重复中的比例分别为4%和21%(图2a)。不同类型的SVs在各类重复和功能元素中的分布存在偏差。例如,删除、插入和复制与SINEs和简单重复相关,而反转则与LINEs、SINEs、简单重复和LTRs相关。此外,SV的长度分布显示了两个明显的峰值,分别位于约300bp(Alu)和约6kb(LINE)。SVs在基因组中的热点区域也被揭示,这些热点区域是SVs密度极高的区域,与其他区域相比,它们更容易发生SVs。例如,C7orf50区域就与大量的SVs相关,表明这个区域容易发生DNA断裂和SVs的形成。SVs与基因表达的调控密切相关。由于启动子和增强子与SINEs相关,因此它们也与SINE相关的SVs相关。此外,删除、复制、插入和SINE相关的SVs在调控基因转录方面比其他类型的SVs更为重要。

图2 SV组成、长度频率和染色质分布

三、汉族-藏族群体遗传和功能性SV在进化适应中的作用

结构变异是一种基因组的变异形式,可以作为区分不同人群的一个重要特征。研究发现,汉族和藏族共同拥有74,828个SVs。通过主成分分析(PCA),汉族和藏族的SVs可以明显区分。当将PCA扩展到1KGP数据库中的其他人群(如非洲、美洲、东亚、欧洲和南亚人群)时,发现汉族和藏族与东亚人群关系密切,而与其他人群距离较远。这表明藏族在遗传上与汉族更接近,与其他人群相比,这两个人群可能来源于一个共同的祖先(图3a)。此外,通过混合分析和所有SVs的进化树分析,发现汉族和藏族在SVs上存在明显的分离(图3b)。层次聚类分析也显示,汉族和藏族具有民族特异的SVs和共同的SVs。基于也清楚地显示了汉族和藏族之间的分离(图3c)。

这些结果表明,除了单核苷酸多态性(SNPs)外,SVs也是区分遗传上密切相关人群的一个稳健的代表性特征。

图3 汉族和藏族群体遗传学

本文研究了藏族人适应高海拔环境的基因组信号,藏族人适应高海拔环境的基因组信号是由SNPs、InDels和SVs协同作用所实现的。通过深度短读长测序和长读长测序数据的综合分析,在EGLN1和EPAS1等基因区域中发现了明显的进化选择信号。在藏汉人群的差异研究中,筛选了FST>0.1的SVs,发现了240个SVs,其中19个是新颖的,169个在藏族人中的频率高于汉族人(图4b)。这些SVs可能与高海拔适应性相关,特别是EGLN1基因中的一个插入物与先前报道的高海拔相关性一致。SVs可以通过改变顺式调控电路来实现广泛的远端调控,作者发现52%的SVs与增强子、沉默子或拓扑关联域(TAD)边界重叠,进一步表明了SVs在调控网络中的重要性。

深入研究了17个FST>0.2的SVs,包括3个新颖的SVs,这些SVs附近的蛋白编码基因与缺氧反应、炎症、葡萄糖、脂质和能量代谢、胰岛素受体信号传导、血液凝固和角蛋白丝等生物学特性有关。特别是dbsv66240 SV破坏了一个超级增强子,下调了EPAS1的表达,这是藏族人中最强的特异性信号,表明SVs在高海拔适应性中的重要作用。这些结果表明,这个SV与这些SNPs和InDels协同作用,影响高海拔适应性。此外,EPAS1和TMEM247在藏獒中也受到正向选择,并显示出不同的关联信号,表明它们都对适应性有功能贡献。

图4 汉族、藏族种群比较揭示进化适应的遗传景观

研究了藏族人群体中的两个特定结构变异(SVs):dbsv66240的删除和dbsv124029的插入,以及它们对生物学功能和适应性的影响。研究发现:dbsv6620删除涉及基因调控增强子和启动子,可能在肾脏细胞中发挥顺式调控作用,影响缺氧反应相关基因的表达,如EPAS1。该删除还通过反式调控电路影响基因转录活性,改变了与转录因子结合的基因组区域,从而可能下调基因表达。通过DNA pull-down实验,发现202个结合蛋白,包括转录因子、中介复合物和锌指蛋白。GO分析显示,与dbsv66240序列结合的蛋白质主要富集在与转录共调节因子结合、转录共激活因子结合和DNA结合转录阻遏活性等分子功能相关的类别中。另一方面,dbsv124029插入与藏族人的长寿、睡眠质量和情绪有关,位于C7of50和ZFAND2A之间,且位于与失眠症状和舒张压相关的遗传区域内,并可能通过复杂的顺式和反式调控电路影响相关基因的表达。这些发现表明,藏族人中最具特色的SVs通过重塑与高原适应相关的基因表达,对适应性表型差异有所贡献。研究还发现了与藏族人头痛发生率、脂质代谢、跟骨密度和出生体重相关的基因变异。例如,位于TIMD4基因内含子中的一个变异可能会影响TIMD4的表达,从而影响头痛发生率,同时也与甘油三酯、低密度脂蛋白(LDL)胆固醇和总胆固醇水平有关。此外,研究还发现了一些功能不明的基因变异,这些变异可能与学习、发声行为、突触前组装和自闭症等相关。

这些发现揭示了藏族人通过基因变异来适应高海拔地区的环境压力,增进了对人类适应性进化的理解,也提供了新的视角来研究其他复杂的人类性状和疾病。

图5 藏族高原适应基因的进化选择



研究结论


该研究通过对320例藏族和汉族样本进行长读长测序,破译结构变异在高海拔适应中的作用,发现基因间缺失通过破坏超级增强子来下调EPAS1的证据。






青莲百奥合作文章


青莲百奥深度参与众多前沿研究,与中国医学科学院、中国科学院、军事医学研究院、国家蛋白质科学中心、四川大学华西医院等单位通力合作,累计发表SCI论文100余篇,累计影响因子(IF)1000+,多项重磅文章问鼎NatureScience Translational MedicineNature Communications等顶级期刊。







关于青莲百奥



  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved