文献解读|苏格兰万人队列表观基因组关联研究揭示DNA甲基化与多种疾病之间的关系

2023-08-10 15:32:05 Illumina因美纳(中国)科学器材有限公司


表观基因组关联研究(Epigenome-wide association studies,EWAS)将表观遗传信息如DNA甲基化与复杂疾病进行关联,揭示非遗传信息变异在复杂疾病的致病病因等方面的潜在作用,弥补了全基因组关联分析的不足。目前,针对复杂疾病的EWAS研究大体上可以分为两类,一类是患病分析(prevalence analyses),另一类是发病分析(incidence analyses)。前者是对整体人群的横向分析,后者是在未发病人群中进行纵向分析评估观察发病情况。

然而,目前EWAS所选取的样本较小,通常少于1,000个样本,这限制了表观遗传与复杂疾病关联的发现。荟萃分析(Meta-analyses)虽然可以弥补样本量上的不足,但却忽视了不同研究之间的异质性。因此需要大队列的针对单一人群的EWAS研究以揭示多种复杂疾病的患病和发病状况。这种研究也会有助于开发常见疾病的血液甲基化分子标记。此外,也需要进行结构性的文献回顾以评估EWAS所发现的位点与疾病之间的相关性和一致性,从而进一步证明EWAS在揭示常见复杂疾病潜在分子机制中的实用性。

近日,英国爱丁堡大学Riccardo E. Marioni 团队在PLOS Medicine上发表了文章Blood-based epigenome-wide analyses of 19 common disease states: A longitudinal, population-based linked cohort study of 18,413 Scottish individuals,通过对单个族裔大样本队列——18,413个苏格兰志愿者全血样本的752,722个CpG甲基化位点进行分析,评估了19疾病与DNA甲基化的关联性。

首先,研究人员选择了Generation Scotland: the Scottish Family Health Study(GS)队列作为研究对象。GS由爱丁堡皇家学会于2001年提出,该计划以家庭结构为基础。参与者必须在35岁-65岁之间(后放宽到18-65岁),必须拥有一位直系亲属或兄弟姐妹。

截止2023年5月,该计划已经招募了约7,000个家庭(有5,573个家庭,平均家庭成员数为4人,还有1,400名没有亲属参与的个体)共计24,000名志愿者(包括6,665名患者、16,007名家庭成员和1,288名未经邀请主动自愿参加的个体),这些志愿者均填写了相关调查如病史,个人健康数据,并被采集了血液、尿液等样本。

研究人员选择了2006-2011年招募的18,413名志愿者,平均年龄47.5岁,女性占比58.8%,并将分析分成了两部分:

1)患病分析(prevalence analyses),该组志愿者招募时已自述疾病状态并提供了血液样本;

2)发病分析(incidence analyses),该组志愿者在14年随访中出现新发疾病。

前一部分包括14种疾病:阿尔茨海默症、乳腺癌、慢性肾病、慢性颈背疼痛、慢阻肺、结直肠癌、2型糖尿病、缺血性心脏病、肺癌骨关节炎、帕金森病、前列腺癌、风湿性关节炎和中风。后一部分疾病包括19种:在前一部分的14种疾病的基础上加上新冠严重性、炎症性肠病、肝硬化、持久性新冠和卵巢癌。

该工作的设计路线图

接下来,研究人员利用Illumina Infinium™ MethylationEPIC Array芯片对18,413例志愿者的全血样本进行了DNA甲基化检测。通过年龄、性别、血细胞计数校正后发现了10种疾病里的1,340个显著相关(association),其中90%的相关是2型糖尿病、慢阻肺和慢性疼痛。当进一步纳入生活方式与人群结构校正后,发现7种疾病的78个相关。交叉对比发现有4种疾病的69个相关,其中2型糖尿病(52个CpG)、乳腺癌(10个CpG)、缺血性心脏病(6个CpG)、慢性肾病(1个CpG),具体相关基因信息可见下图。

14种疾病的患病分析关联结果以及4种疾病的EWAS展示

研究人员在分析了DNA甲基化与14种不同疾病的患病分析后,进一步分析了上述19种疾病的发病分析,通过年龄、性别、血细胞计数校正后发现了11种疾病里的14,237个显著相关(association),其中分别有11,305和2,657个与慢阻肺和2型糖尿病相关。当进一步纳入生活方式与人群结构校正后,发现5种疾病的79个相关。交叉对比发现有2种疾病的64个相关,其中2型糖尿病(58个CpG)、慢阻肺(6个CpG),具体相关基因信息可见下图。

19种疾病的发病分析关联结果以及2种疾病的EWAS展示

最后,研究人员对分析得到的Top CpGs进行了通路富集分析,发现仅有2型糖尿病以及缺血性心脏病得到了显著的通路富集,其代表性通路有胆固醇代谢以及酒精代谢。另外,通过多种计算模型分析,如柯克距离分析(Cook’s distance)、Harrell’s C-statistic等进一步确认了CpG关联的鲁棒性(Robust)。进一步,研究人员系统性查阅了已发表文献,发现患病分析中的69个关联中的11个,发病分析中64个关联中的8个已经被报道。

总之,该项研究通过对单一人种的大规模队列进行表观基因组关联分析,发现了超过100多个CpG与疾病之间的关联,证明了血液DNA甲基化可以作为常见疾病的标志物,也提出在人类生物资源库扩充的背景下,对于疾病的关联分析应该在协变量策略、表型定义、报告指南等方面达成一致。

此外,文章中使用了Illumina Infinium™ MethylationEPIC Array对样本进行了全基因组甲基化检测。2022年12月,因美纳发布了甲基化芯片产品的升级版本Infinium™ MethylationEPIC v2.0 BeadChip。全新上市的Infinium™ MethylationEPIC v2.0 BeadChip 以Infinium™ MethylationEPIC v1.0 BeadChip全基因组骨架为基础,超过935K CpG,覆盖增强子、CTCF结合位点和常见癌症驱动突变,并为甲基化分类方法用户优化了拷贝数变异(CNV)检出。

Infinium™ MethylationEPIC v2.0 BeadChip可以相对低廉的单样本成本产出高度精准的DNA甲基化数据,并兼容从FFPE组织样本提取的DNA。相比于WGBS、RRBS和靶向甲基化测序相比,用EPIC v2.0获取全基因组DNA甲基化数据的成本显著降低,更适合大型队列研究中对大规模样本行进表观遗传标志物筛查。在表观基因组关联研究(EWAS)方面,目前大多数已发表的EWAS文章都是利用因美纳MethylationEPIC或其前代产品HumanMethylation450完成的,作为升级版的EPIC v2.0将会在未来进一步助力各种复杂疾病的EWAS分析。

原文链接:

https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1004247#sec008

*本文转自BioArt公众号

.


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved