高效学会富集分析气泡图,还能免费领取高清总代谢通路图哦~

2021-11-05 11:41:49, 多层组学定制服务 上海欧易生物医学科技有限公司


点击上方蓝色字体关注我们

蛋白组学、代谢组学服务专家

者按

一图胜千言,好的数据呈现方式能够为文章增加光彩。

富集分析是将基因根据先验的知识(也就是常见的注释)进行分类的过程,最常见的富集分析是GO与KEGG富集。


KEGG 是从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,可以了解生物系统中基因、蛋白及代谢物的功能和相互作用关系,可以查询到与代谢物相关的代谢通路、人类疾病及药物研发等信息。


其中最为核心的数据库为KEGG PATHWAYKEGG ORTHOLOGY 数据库。而在KEGG PATHWAY数据库中,将生物代谢通路划分为7类,分别为:1.新陈代谢 2.遗传信息加工 3.环境信息加工 4.细胞过程 5.生物体系统 6.人类疾病 7.药物开发。


可以基于KEGG数据库对差异代谢物进行代谢通路富集分析,有助于理解在差异样品中代谢途径变化机制。在一些高分文献中会使用高效的气泡图(Bubble图)来展示富集分析结果。气泡图属于散点图的一种,它是在散点图的基础上改变点的形状、大小和颜色,而富集分析气泡图就是在笛卡尔坐标系中加入数量、p值等参数表示三个变量关系的图形。


1

geom_point()函数绘制散点图


要绘制气泡图就先从散点图开始绘制吧~

这里使用geom_point()函数来绘制散点图。

geom_point(  mapping = NULL,  data = NULL,  stat = "identity",  position = "identity",  ...,  na.rm = FALSE,  show.legend = NA,  inherit.aes = TRUE


mapping可以使用aes()函数来创建美学映射,在图层中展示的数据data有以下三种选项。


Stat指统计转换(statistical transformation),它的默认值identity表明变量的值就是统计的值;还有另一个常用值count表明需要对变量的值进行计数,统计值是计数的结果。Position指位置调整(Position adjustment),默认值是identity,表示不调整。


2

mtcars数据绘制散点图


散点图对于显示两个连续变量之间的关系最为有用,它可以显示一个连续、一个分类变量或者两个分类变量,而气泡图就是映射到点大小的第三变量的散点图。

这里使用到R中mtcars数据集绘制散点图,


以wt值为横坐标,mpg值为纵坐标来绘制。

ggplot(mtcars, aes(wt, mpg))+geom_point()


散点图中可以用size控制大小,shape控制形状。这里根据cyl字段设置点的形状和颜色,即将分组变量赋值给形状属性和颜色属性。

ggplot(mtcars, aes(wt, mpg))+geom_point(aes(shape = factor(cyl),colour = factor(cyl)),size=3)

向右滑动查看更多


也可以将连续性变量disp映射给颜色属性和大小属性,并且通过设置色阶使数值大小与颜色深浅保持一致。

ggplot(data=mtcars,aes(x=wt,y=mpg,color=disp,size=disp))+geom_point()+ scale_color_gradient(low="lightblue",high="darkblue")

向右滑动查看更多

做到这一步,是不是已经有我们熟悉的富集分析气泡图那味了?


3

代谢通路富集分析


赶紧趁热打铁来一份代谢通路富集分析的数据,包含Pathway、Count、Richfactor、Pvalue这四列,以RichFactor和Pathway为横纵轴,Count体现气泡大小,Pvalue映射颜色属性绘制气泡图。

Library(readxl)   #加载R包pathway=read_xlsx("enrich.xlsx") #读取数据pathway<-as.data.frame(pathway)  #把数据转换成data.frame格式ggplot(pathway,aes(RichFactor,Pathway,size=Count,color=Pvalue))+geom_point()+scale_color_gradient(low="red",high = "green")+labs(color=expression(Pvalue),size="Count",x="RichFactor",y="Pathway name",title="Pathway enrichment")

向右滑动查看更多

最后来解读下这张代谢通路富集分析气泡图,纵坐标为代谢通路名称,横坐标为富集因子即差异代谢物占该pathway中总代谢物的比例,Rich factor越大说明富集程度越大;气泡颜色由绿到红表示p-value依次降低;气泡越大,说明富集到该pathway上的代谢物数目越多。


4

结语

这期关于富集分析气泡图的分享就到这里结束了,请大家持续关注我们,后续还会有更多更实用的分享推出,帮助您在科研的道路上“披荆斩棘,乘风破浪”,实现您的科研梦想!


福利大放送

大家知道在KEGG PATHWAY Database里面,Map01100就是总的代谢图,但是下载下来的版本总是不清楚,看不清代谢物质,不满意。

划重点:高清的!免费获取!还附有翻译版本的总代谢物图来喽~

图 | 总代谢通路图

长按扫码免费领取


文末看点 鹿明生物

上海鹿明生物科技有限公司多年来,一直专注于生命科学和生命技术领域,是国内早期开展以蛋白组和代谢组为基础的多层组学整合实验与分析的团队。

同时,鹿明生物线上学习平台易明学院也拥有众多生信教程,欢迎访问:https://www.yimingxueyuan.com/


猜你还想看


恭喜 | 鹿明生物母公司欧易生物完成A轮及A+轮融资

投稿必看 | 代谢组学领域期刊介绍与投稿建议

NAT MED | 空间代谢组学+多组学技术探究人类结核肉芽肿中的炎症信号的空间分布

千万医学支持 | 鹿明生物空间代谢组计划“火热”启动


END

甜橙诚 撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

点“阅读原文”了解更多


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2023 ANTPEDIA, All Rights Reserved