Illumina DNA甲基化芯片生信分析文章复现,结果硬核到爆炸!

2023-06-22 13:03:32, APT-MKT 上海中科新生命生物科技有限公司


表观基因组是目前多组学研究的热点,而DNA的甲基化修饰又是表观遗传研究中最重要的领域,与癌症、神经系统疾病及衰老等多种疾病相关。中科新生命作为引领大生命科学领域质谱多组学潮流的头部公司,为建立更加全面的多组学技术服务平台,强力引入Illumina iScan系统,同期发布Illumina DNA甲基化芯片生物信息分析流程,旨为表观基因组研究者提供性能优越且经济的一站式DNA甲基化解决方案。

Illumina iScan系统

Illumina DNA甲基化芯片生信分析流程图

原文结果复现是检验生物信息分析流程可靠性的金标准,下面我们就以一篇Nature子刊研究,一起来见证Illumina DNA甲基化芯片生信分析流程的硬核复现吧!


文章题目:Methylation profiling identifies two subclasses of squamous cell carcinoma related to distinct cells of origin

期刊:Nature Communications

研究背景:鳞状细胞癌(squamous cell carcinoma, cSCC)是发生于表皮或附属器细胞的一种恶性肿瘤,是比较常见的皮肤癌之一。通常是由紫外线诱导的癌前病变恶化产生,这种病变称为光化性角化病(actinickeratosis, AK)。目前 cSCC 相关的表观遗传变化主要由 CpG 岛启动子高甲基化沉默的数量适中的癌症相关基因组成,而对 AK 的病因及其发展到 cSCC 的过程只是部分了解,并没有详细阐明。该研究通过健康表皮到 AK 和皮肤鳞状细胞癌 cSCC 过程中 DNA 甲基化变化的研究,提供了迄今为止最全面的 cSCC 发育表观基因组分析,并表明存在两个不同的亚类,反映了不同的细胞起源分化阶段。





样本类型

12个健康、16个AK和18个cSCC表皮样品





文章数据下载

Infinium MethylationEPIC BeadChip数据可从ArrayExpress数据库获得,登录号为E-MTAB-5738。数据下载链接:https://www.ebi.ac.uk/biostudies/arrayexpress/studies/E-MTAB-5738?query=E-MTAB-5738。





结果复现

Result 1:数据质控

数据质控是指通过对原始数据的基础分析,了解数据结构,其主要内容包括过滤掉对后续分析存在干扰的CpGs,进行批间差分析与矫正,以及数据标准化、可视化。

而主成分分析(Principal Component Analysis,PCA)是一种对数据进行简化分析的方法。该方法设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息,也是数学上用来降维的一种方法。

该文章使用850k CpG探针对12个健康、16个AK和18个cSCC表皮样品进行主成分分析,PCA清楚地将正常表皮与AK和cSCC样品分离,但也表明AK和cSCC之间存在高度重叠的模式,分析结果如下(图1a):

原文PCA分析结果

APT DNA甲基化流程PCA分析结果

Result 2:差异甲基化位点

差异甲基化位点(Differentially Methylated CpG Positions ,DMP)是甲基化研究的主要环节,对于寻找后续biomarker有重要意义;DMP的分析是比对case组与control组的β值,获得Δβ值,从而得到case组差异甲基化位点;DMP的展示可以通过绘制火山图、热图来反应组间整体差异情况。

在得到均一化beta值以后,使用champ包的champ.DMP函数(该函数调用limma包的线性回归和moderated t-test)进行组间的差异甲基化位点(DMP)分析。这种方法会计算出一个t值,该值的绝对值越大表明差异越明显,同时会计算该差异甲基化位点的P Value,最后对差异的甲基化位点进行多重假设检验,获得adj.P.Value。

文章使用Minfi软件对三个样本组的甲基化模式进行差异比较,结果显示在AK和正常表皮之间存在大量(372213) < 0.05,F-检验)的差异甲基化探针(图1b)。当比较cSCC和正常样品时,检测到类似高数量(310102)的差异甲基化探针(图1b)。然而,与主成分分析一致,在AK和cSCC之间没有检测到显著差异的甲基化探针(图1c)。

原文不同比较组的差异甲基化位点分析结果

APT DNA甲基化流程不同比较组的差异甲基化位点分析结果

该高分文献的结果复现的高度一致性,充分展示了中科新生命自主研发的Illumina DNA甲基化芯片生物信息分析流程的优越性能。当然除文章中出现的甲基化分析结果,我们还提供更加丰富的功能分析、CNV突变等内容。





更多分析结果展示

批次矫正

SVD(singular value decomposition) 这里用于评估数据集中变量的主要成分。这种成分可能确实是你感兴趣的生物因素,也可能是技术来源的一些变量成分。

SVD分析(矫正前)

 SVD分析(矫正后)

DMR分析

基因组中差异甲基化位点经常会成簇出现,形成一段差异性甲基化区域(Differentially Methylated Region, DMR),DMR被认为在基因印记调节中起重要作用。

DMR展示示例图

功能分析

可以根据GO/KEGG分析的结果结合生物学意义从而挑选用于后续研究的基因。

功能富集分析结果示例图

Functional Epigenetic Modules 分析

DNA 甲基化会调控基因的表达水平,进而影响基因的相互作用。将基因的相互作用网络和差异甲基化信息结合起来,基于那些甲基化水平发生差异的基因,从整个相互作用网络挖掘出这些基因的相互作用模块,这些模块可以看作是与样本表型数据相关的基因集合。

FEM结果示例图

拷贝数变异分析

拷贝数变异(Copy number variation, CNV)是由基因组发生重排而导致的, 一般指长度为1 kb 以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复。CNV位点的突变率远高于SNP,是人类疾病的重要致病因素之一。CNV分析在分析样本个体间的遗传差异,研究遗传致病因子等方面具有重要价值。

CNV展示图

甲基化和CNV的Circos图


中科优品推荐

Illumina DNA甲基化芯片是一种全基因组甲基化筛选工具,该芯片保留了以单核苷酸分辨率定量分析全基因组CpG的能力,同时提供高度准确和精确的甲基化测量,不受测序深度的影响。可使用精简、用户友好的Infinium甲基化检测分析多种DNA样本类型,包括从FFPE分离的DNA样本。与其他方法相比,Illumina DNA甲基化芯片具有可扩展性和更低的单个样本总成本,因此可用于探究疾病机制和生物标志物的筛选。

<<  滑动查看下一张图片  >>


更多合集推荐

蛋白业务线:

4D系列 | DIA系列 | 临床大队列系列 | 非靶向蛋白质组外泌体多组学系列 | 靶向蛋白质组 | 单细胞蛋白组 | 磷酸化修饰组 | 泛素化修饰组 | 酰化修饰组 | 糖基化修饰组 | 修饰蛋白质组 | 蛋白+修饰多组学 | 蛋白/修饰+代谢多组学 | 深度血液4D-DIA蛋白组 | Olink蛋白质组学 极微量蛋白质组学

代谢业务线:

医学代谢组 | 植物代谢组 | 非靶向代谢组学 | 靶向代谢组学 | 高通量靶向代谢组学 | 代谢流 | 空间代谢组学 | 代谢多组学 | 脂质组 | 非靶代谢plus | HA2000 | 非靶脂质组学绝对定量plus

高通量测序业务线:

肠道微生物系统解决方案 | 单细胞测序专题 | 转录调控专题

研究领域:

标志物研究 | 宿主微生物研究 | 单细胞研究 | 蛋白基因组与分子分型研究 | 肿瘤 | 神经精神 | 妇幼 | 代谢疾病 | 植物 | 动科 | 中医药 | 食品


我知道你

在看


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved