视频实操SCI作图课(10):多组学分析必会——Kegg富集分析小工具

2022-04-25 22:53:01, 小维 武汉迈特维尔生物科技有限公司



Kegg富集分析小工具


在转录组,蛋白质组,代谢组以及微生物分析中,经常会接触到KEGG通路的注释与富集分析,KEGG分析已经成为高通量测序和蛋白、代谢分析中最必不可少也是文章中展示最多的一个分析内容。


视频解说教程

迈维云链接:https://cloud.metware.cn


1

KEGG数据库是什么

KEGG 数据库1995 年由  Kanehisa实验室开发,全称为 Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书)。目前发展为一个综合性数据库,其中最核心的为 KEGG PATHWAYKEGG ORTHOLOGY 数据库。在 KEGG ORTHOLOGY 数据库中,将行使相同功能的基因聚在一起,称为 Ortholog Groups (KO entries),每个 KO 包含多个基因信息,并在一至多个 pathway 中发挥作用。


KEGG PATHWAY是KEGG数据库中最重要也是最常见的数据库,是由大量由科研人员根据已有研究文献,手动绘制的KEGG通路图,KEGG PATHWAY可以划分为 6 类,分别为:细胞过程(Cellular Processes)、环境信息处理(Environmental Information Processing)、遗传信息处理(Genetic Information Processing)、人类疾病(Human Diseases)、新陈代谢(Metabolism)、生物体系统(Organismal Systems)。


2

KEGG通路图怎么看

KEGG通路图是转录组的分析结果中最直观的数据库展示结果。转录组分析中,往往会涉及到几千甚至上万条基因,所以我们希望把基因进行分类,相同功能的基因尽量放到一起去分析,这个基因的分类可以通过基因的注释来实现。对于转录组分析,注释信息一般通过参考基因组的信息获得无参转录组则通过与特定数据库做比对,注释获得。通过对KEGG数据库进行注释后,我们可以讲某个差异分组的差异基因注释到KEGG通路上,并以图片化的的形式进行展示,直观方便的把差异基因进行分类查看。



KEGG通路图中,长方形的框框代表的是基因(酶),圆圈代表的是代谢物。差异基因KEGG通路图中,会发现有一些基因被标注成红色,绿色或者蓝色。那么这些颜色代表的含义是什么?如果某个基因被标注成红色,代表该差异分组中注释这个酶的基因表达是上调的,如果是绿色代表的该差异分组中注释这个酶的基因表达是下调的,如果是蓝色代表的该差异分组中注释这个酶的基因表达既有上调又有下调。


3

为什么做kegg富集分析

即使我们通过KEGG注释分析将差异基因进行了分类,我们仍然可以发现,在每个差异分组中会有多则几十个通路。所以我们通常会对基因功能进行富集分析,以发现在生物学过程中起关键作用的生物通路,从而揭示和理解生物学过程的基本分子机制。另外在不同实验条件下,激活的通路显然比简单的基因和蛋白列表更有说服力。富集分析是将功能相似的基因集通过统计学检验算法富集到一起,从而方便研究具有某一类功能的基因。富集分析原理是基于超几何分布,KEGG富集分析,以 qvalue小于0.05作为显著性富集的阈值。超几何分布的计算公式如下所示:



其中,N注释到KEGG数据库中的所有基因数量,n 注释到KEGG数据库中的所有差异基因的数量,M 代表注释到KEGG某个通路的基因的数量,m 注释到KEGG数据库中M相同通路的差异基因数量。


4

迈维云进行KEGG富集分析

使用迈维云平台进行KEGG富集分析,需要准备三个文件。


文件一:背景基因文件

可以直接选择ko.backup.xls文件,后缀直接修改问txt格式。如果找不到该文件可以按照示例数据进行修改,其中第一列为KEGG PATHWAY名称,第二列为KEGGPATH通路ID号,以ko开头的编号。第三列为注释到该通路的所有基因ID信息,使用英文分号(;)分隔,不含空格。第四列为对应到第三列的所有基因的KEGGID,以K号开通过的编号。



文件二:目标基因文件

可以直接选择结题报告中diff.xls文件,后缀直接修改问txt格式。如果找不到该文件可以按照示例数据进行修改,其中第一列为第一列为基因名称,第二列为log2FoldChange,第三列为基因的上下调信息。其中,第二列,第三列不是必须列,且顺序不固定。如果没有第二列及第三列信息,KEGG富集分析结果的KEGG通路图注释的差异基因默认用红点表示。



文件三:注释基因文件

可以直接选择结题报告中gene.KEGG.xlsx或者gene.KO.xls文件,后缀直接修改问txt格式。如果找不到该文件可以按照示例数据进行修改,其中第一列为基因名称,第二列为对应第一列基因的KEGGID编号即注释信息。



5

迈维云平台KEGG分析结果展示

使用迈维云进行KEGG富集分析后会得到以下结果。包括KEGG通路注释图,KEGG富集分析结果表,KEGG富集柱状图,即KEGG富集气泡图。


KEGG富集分析结果

KEGG富集分析结果表1


KEGG富集分析表2


KEGG富集分析柱状图


KEGG富集气泡图




往期精彩:

客服微信:metware888

咨询电话:027-62433042

邮箱:support@metware.cn

网址:www.metware.cn

我就知道你“在看”


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved