2022-06-12 06:40:13, 小迈 武汉迈特维尔生物科技有限公司
视频解说教程
迈维云链接:https://cloud.metware.cn
富集气泡图是主要展示生物功能富集程度的工具,可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,通常为富集因子,另一个变量放在纵轴,通常为富集条目,不同之处在于,气泡图允许在图表中额外加入表示大小的变量进行对比,即在笛卡尔坐标系中加入数量、p值等参数表示三个变量关系的图形,是一种可以快速了解目标代谢物/蛋白/基因部分功能趋向性的可视化方法。其可适用于多种组学数据,如代谢组、蛋白组、转录组、微生物组数据等。
■ ■ ■ ■ ■
图1 富集气泡图示例
富集分析是指与所有鉴定到的目标代谢物/蛋白质/基因背景相比,差异代谢物/蛋白质/基因中显著富集到的功能条目,从而给出差异代谢物/蛋白质/基因与哪些生物学功能显著相关,可以富集气泡图形式展现。富集气泡图适用于各种功能性数据库,常用的有GO数据库、KEGG数据库、COG/KOG数据库等。可从不同的方面了解代谢物/蛋白质/基因参与的生理功能、结构特征、亚细胞位置等,进而揭示代谢物/蛋白质/基因在各个生命活动中的生物学意义。
GO数据库
GeneOntology[11](简称GO)是基因功能国际标准分类体系。作为基因本体联合会(GeneOnotologyConsortium)所建立的数据库,它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(MolecularFunction)、生物过程(biologicalprocess)、和细胞组成(cellularcomponent)三个部分。
■ ■ ■ ■ ■
图2 GO富集气泡图
KEGG数据库
KEGG(KyotoEncyclopedia of Genes andGenomes,京都基因与基因组百科全书)数据库有助于研究者把基因、蛋白质以及代谢物含量作为一个整体网络进行研究。作为有关Pathway的主要公共数据库,KEGG提供的整合代谢途径(Pathway)查询,包括碳水化合物、核苷酸、氨基酸等的代谢及有机物的生物降解,不仅提供了所有可能的代谢途径,而且对催化各步反应的酶进行了全面的注解,包含有氨基酸序列、PDB库的链接等等,是进行生物体内代谢分析、代谢网络研究的强有力工具。
■ ■ ■ ■ ■
图3 KEGG富集气泡图
KOG/COG数据库
KOG(euKaryoticOrthologousGroups)数据库针对真核生物,基于基因直系同源关系,结合进化关系将来自不同物种的同源基因分为不同的Orthologous簇,来自同一Orthologous的基因或其编码的蛋白具有相同的功能,这样就可以将功能注释直接继承给同一KOG簇的其他成员,以推导未知基因或蛋白的功能。
COG(Clusterof Orthologous Groups ofproteins)数据库功能与KOG相对,但COG数据库针对原核生物,根据细菌、藻类和真核生物完整基因组的编码蛋白系统进化关系分类构建而成。
■ ■ ■ ■ ■
图4 KOG富集气泡图
富集气泡图横坐标一般为Richfactor(代谢组、转录组)或FoldEnrichment(蛋白组)。Richfactor指该条目中富集到的差异基因/代谢物个数(Samplenumber)与注释到该条目所有基因/代谢物个数(Backgroundnumber)的比值。FoldEnrichment为GeneRatio(注释到该条目的差异蛋白质数与差异蛋白质总数的比值)/BgRatio(释到该条目的背景蛋白质数与背景蛋白质总数的比值)的值。Richfactor或FoldEnrichment越大表示差异代谢物/蛋白质/基因富集程度越高。富集气泡图纵坐标一般为相应功能条目。
富集分析还会得到一个关键数值P-value,一般也会在图中进行展示。P-value为超几何检验p值,超几何分布的计算公式如下所示:
其中,N代表全部代谢物/蛋白质/基因中具有数据库注释的数量,n代表N中差异代谢物/蛋白质/基因的数量,M代表N中某条目的代谢物/蛋白质/基因数量,m代表M中某条目的差异代谢物/蛋白质/基因数量。P-value越接近于0,表示富集越显著。
图中点的大小代表富集到相应通路上的差异显著代谢物/蛋白质/基因个数。
■ ■ ■ ■ ■
图5 差异代谢物KEGG富集气泡图
■ ■ ■ ■ ■
图6 差异蛋白质KEGG富集气泡图
生物、医学等领域研究已经全面进入组学时代,组学测序等技术广泛用于研究各类生物学问题的基因功能层面的发生原理。然而组学数据庞大,快速锁定关键代谢物/蛋白质/基因及阐明其功能困难,如转录组可检测几万条基因,筛选几千条差异表达基因,蛋白组、代谢组可检测几千个蛋白质或代谢物,富集气泡图一定程度上解决了此问题。
首先富集气泡图可快速锁定差异代谢物/蛋白质/基因富集关键功能条目,了解生物学过程调控机理。其次通过锁定的关键条目反向再次筛选关键代谢物/蛋白质/基因,即锁定关键条目中差异最大代谢物/蛋白质/基因。
如在“人参茎叶提取物(GSE)对过量对乙酰氨基酚(APAP)所致的肝损伤起保护作用”研究文章中,首先通过富集气泡图快速锁定APAP诱导的肝损伤及GSE保护作用与胆汁分泌和代谢途径相关,如。其次在数据深入挖掘阶段通过相关途径视黄醇代谢,反向推导关键基因,最终结果如下:视黄醇代谢作为APAP影响的关键途径,在转录水平上受GSE调控,其中基因Adh7、Cyp3a11、Cyp26a1、Cyp26b1、Ugt2a1、Ugt2b1、Sdr9c7和Ttc39c与代谢生物标志物4-羟色胺相关。
■ ■ ■ ■ ■
图7 富集气泡图应用案例
由此可见富集气泡图可快速了解目标代谢物/蛋白质/基因参与的生理功能,揭示其在各个生命活动中的生物学意义,并反向推导关键代谢物/蛋白质/基因!
04-26 赛默飞生命科学
【反射颜色测量】典型配置、硬件说明、软件操作04-26
【文末福利】东北人做实验,爆笑来袭!小嘴儿叭叭的~04-25 黑龙江办事处
直播预告 | 大规模设备更新-赛默飞生命科学专场直播04-25 赛默飞生命科学
【转载】「最佳的抗皱塑形运动方案」研究表明:这两类运动可有效延缓皮肤衰老,特别是对于女性!04-25 生物谷
【有奖征集】「寻找实验室最美身影」主题摄影大赛火热征稿中04-25
让你的干细胞研究“研”值飙升的秘密04-25 赛默飞生命科学
CIBF2024|H.E.L诚邀新老朋友莅临指导04-25 Don Lin
苏州佳谱科技有限公司参与制定国家标准,助力水泥窑固体废物处理技术规范发展04-25
DW行业解决方案|食品安全微生物实验室能力建设04-24 DW
全国排名公布!色谱大赛战况激烈,高手如云!04-24 市场宣传部
在众多可能中,找到你的“那一个”04-24 赛默飞生命科学
融合创新,质领未来—钢研纳克蝉联检测及科学仪器行业重磅奖项04-24 钢研纳克
4月24日直播 | 使用安捷伦Seahorse技术快速精准检测线粒体毒性04-24 安捷伦细胞分析
Nature 子刊|陆军军医大肿瘤微环境新成果,一作分享研究思路04-24 转载自生物学霸
4月25日直播 | 中国PIC/S成员资格对监管实验室的影响与含义04-24 安捷伦细胞分析
它来了,符合国家卫生行业标准的流式细胞仪性能校准服务!04-24 安捷伦科技
剑桥大学/阿斯利康利用RTCA揭示cGAS-STING 该明星分子在神经小胶质细胞炎症中的机制04-24 安捷伦细胞分析
4月26日直播 | 类器官研究大讲堂 开启精准医学新时代04-24 安捷伦细胞分析
追忆星空回响,坚守使命信念——中科科仪与“东方红一号”的峥嵘岁月04-24