视频实操SCI作图课(15):高级富集气泡图

2022-06-12 06:40:13, 小迈 武汉迈特维尔生物科技有限公司




视频解说教程

迈维云链接:https://cloud.metware.cn


1
什么是富集气泡图

富集气泡图是主要展示生物功能富集程度的工具,可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,通常为富集因子,另一个变量放在纵轴,通常为富集条目,不同之处在于,气泡图允许在图表中额外加入表示大小的变量进行对比,即在笛卡尔坐标系中加入数量、p值等参数表示三个变量关系的图形,是一种可以快速了解目标代谢物/蛋白/基因部分功能趋向性的可视化方法。其可适用于多种组学数据,如代谢组、蛋白组、转录组、微生物组数据等。


    

图1 富集气泡图示例


2
富集气泡图应用范畴

富集分析是指与所有鉴定到的目标代谢物/蛋白质/基因背景相比,差异代谢物/蛋白质/基因中显著富集到的功能条目,从而给出差异代谢物/蛋白质/基因与哪些生物学功能显著相关,可以富集气泡图形式展现。富集气泡图适用于各种功能性数据库,常用的有GO数据库、KEGG数据库、COG/KOG数据库等。可从不同的方面了解代谢物/蛋白质/基因参与的生理功能、结构特征、亚细胞位置等,进而揭示代谢物/蛋白质/基因在各个生命活动中的生物学意义


GO数据库

GeneOntology[11](简称GO)是基因功能国际标准分类体系。作为基因本体联合会(GeneOnotologyConsortium)所建立的数据库,它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(MolecularFunction)、生物过程(biologicalprocess)、和细胞组成(cellularcomponent)三个部分。


    

图2 GO富集气泡图



KEGG数据库

KEGGKyotoEncyclopedia of Genes andGenomes,京都基因与基因组百科全书)数据库有助于研究者把基因、蛋白质以及代谢物含量作为一个整体网络进行研究。作为有关Pathway的主要公共数据库,KEGG提供的整合代谢途径(Pathway)查询,包括碳水化合物、核苷酸、氨基酸等的代谢及有机物的生物降解,不仅提供了所有可能的代谢途径,而且对催化各步反应的酶进行了全面的注解,包含有氨基酸序列、PDB库的链接等等,是进行生物体内代谢分析、代谢网络研究的强有力工具。


    

3 KEGG富集气泡图



KOG/COG数据库

KOGeuKaryoticOrthologousGroups)数据库针对真核生物,基于基因直系同源关系,结合进化关系将来自不同物种的同源基因分为不同的Orthologous簇,来自同一Orthologous的基因或其编码的蛋白具有相同的功能,这样就可以将功能注释直接继承给同一KOG簇的其他成员,以推导未知基因或蛋白的功能。


COG(Clusterof Orthologous Groups ofproteins)数据库功能与KOG相对,但COG数据库针对原核生物,根据细菌、藻类和真核生物完整基因组的编码蛋白系统进化关系分类构建而成。


    

4 KOG富集气泡图



3
富集气泡图怎么看

富集气泡图横坐标一般为Richfactor(代谢组、转录组)或FoldEnrichment(蛋白组)。Richfactor指该条目中富集到的差异基因/代谢物个数(Samplenumber)与注释到该条目所有基因/代谢物个数(Backgroundnumber)的比值。FoldEnrichmentGeneRatio(注释到该条目的差异蛋白质数与差异蛋白质总数的比值)/BgRatio(释到该条目的背景蛋白质数与背景蛋白质总数的比值)的值。RichfactorFoldEnrichment越大表示差异代谢物/蛋白质/基因富集程度越高。富集气泡图纵坐标一般为相应功能条目。


富集分析还会得到一个关键数值P-value,一般也会在图中进行展示。P-value为超几何检验p值,超几何分布的计算公式如下所示:



其中,N代表全部代谢物/蛋白质/基因中具有数据库注释的数量,n代表N中差异代谢物/蛋白质/基因的数量,M代表N中某条目的代谢物/蛋白质/基因数量,m代表M中某条目的差异代谢物/蛋白质/基因数量。P-value越接近于0,表示富集越显著。


图中点的大小代表富集到相应通路上的差异显著代谢物/蛋白质/基因个数。


    

差异代谢物KEGG富集气泡图



    

差异蛋白质KEGG富集气泡图


4
富集气泡图的作用

生物、医学等领域研究已经全面进组学时代,组学测序等技术广泛用于研究各类生物学问题的基因功能层面的发生原理。然而组学数据庞大,快速锁定关键代谢物/蛋白质/基因及阐明其功能困难,如转录组可检测几万条基因,筛选几千条差异表达基因,蛋白组、代谢组可检测几千个蛋白质或代谢物,富集气泡图一定程度上解决了此问题。


首先富集气泡图可快速锁定差异代谢物/蛋白质/基因富集关键功能条目了解生物学过程调控机理。其次通过锁定的关键条目反向再次筛选关键代谢物/蛋白质/基因,即锁定关键条目中差异最大代谢物/蛋白质/基因。


如在“人参茎叶提取物(GSE)对过量对乙酰氨基酚(APAP)所致的肝损伤起保护作用”研究文章中,首先通过富集气泡图快速锁定APAP诱导的肝损伤及GSE保护作用与胆汁分泌和代谢途径相关,如。其次在数据深入挖掘阶段通过相关途径视黄醇代谢,反向推导关键基因,最终结果如下:视黄醇代谢作为APAP影响的关键途径,在转录水平上受GSE调控,其中基因Adh7Cyp3a11Cyp26a1Cyp26b1Ugt2a1Ugt2b1Sdr9c7Ttc39c与代谢生物标志物4-羟色胺相关。


    

富集气泡图应用案例


由此可见富集气泡图可快速了解目标代谢物/蛋白质/基因参与的生理功能,揭示其在各个生命活动中的生物学意义,并反向推导关键代谢物/蛋白质/基因!


往期精彩:

视频实操SCI作图课(14):KEGG分类柱形图小工具

视频实操SCI作图课(13):样本相关性分析告诉你生物学重复如何选

视频实操SCI作图课(12):迈维云平台助你事半功倍提取序列

频实操SCI作图课(11):如何一眼看透你的数据分布——直方图

视频实操SCI作图课(10):多组学分析必会——Kegg富集分析小工具


微信:metware888

电话:027-62433042

邮箱:support@metware.cn

网址:www.metware.cn


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved