代谢网络图四部曲(一):手把手教你绘制网络图R+Cytoscape

2019-09-18 17:29:07, 麦特绘谱 麦特绘谱生物科技(上海)有限公司


点击上方蓝字关注“麦特绘谱


前天9月10日,阿里巴巴发布了“新六脉神剑”,以“让天下没有难做的生意”为使命,价值观由六句阿里土话组成——客户第一,员工第二,股东第三;因为信任,所以简单;唯一不变的是变化;今天最好的表现是明天最低的要求;此时此刻,非我莫属;认真生活,快乐工作。同理,我们代谢组学研究者们,想要发高分SCI文章,也需要“六脉神剑”本领。除了有严谨专业的代谢组学实验数据外,您还得会做一手漂亮的网络分析图,助力您准确分析出研究结论,整理出一篇完整的paper。

对此,麦特绘谱生物信息分析团队特别推出“代谢网络图四部曲”,手把手教你绘制网络图R+Cytoscape。今天我们讲解第一部曲,主题为:网络图简介及数据格式说明。


本文主要内容

1. 网络图绘制原理


2. 网络图所需数据格式


在浏览组学文章的过程中,大家想必都见过类似下面这种的网络图,这种图能够清晰地展示高通量数据间的复杂关系,下面我们将为大家详细地介绍网络图以及其所需的数据格式:

基本概念

图(graph)是数据结构和算法学中最强大的框架之一,可以用于表现各种类型的结构或系统,从交通网络到信号通路、从最优流程到社交关系网络,都有图的用武之地。本文所说的图特指“节点”和“边”组成的抽象的网络。


下图A展示的是一个基因相关性网络图,图中绿色圆形/椭圆形的点就是“节点”(node/vertex),常用来表示某个实体或者对象。节点也可被叫做“点”、“结点”、“端点”、“顶点”,表示的意思相同。连接节点的连线即为“边”(edge),每个边只连接两个节点,代表两个节点具有某种联系。下图A中边没有方向、无箭头的图称为无向图。若边有方向(如下图B中所示)、有单相/双向的箭头,则这个图为有向图。双向箭头实际可看做两条单相的边的结合(在后面边的计数和数据准备时会用到)。

在代谢组学研究中,网络图常用来表示如下信息:


1. 用节点表示代谢物、菌群等变量,用边表示节点之间的相关性,此时绘制的是相关性网络图


2. 用不同节点表示基因、代谢物、酶等,用边表示节点之间的相互作用关系,用不同种类的箭头表示促进、抑制、催化等不同相互作用,此时绘制的是代谢通路图


网络图可以很好的诠释“一图胜千言”这句话,不仅能够帮助研究者从数据中总结、发现规律,也能让读者更快地对结果及规律有一个整体的直观感受。通过调整网络图中节点的颜色、大小、形状、位置等属性,可以传递各个节点的改变方向、在网络中的重要性、节点所属分类、节点间亲疏关系等信息。通过调整各个边的方向、颜色、粗细、线型等属性,可以传递节点间作用形式、相关关系或调控关系、相互关系强弱及相关关系的可靠程度等信息。

图片来源:https://kateto.net/network-visualization

Cytoscape数据在R中的前处理方法:节点文件+边文件 +导出为csv

1. 网络图所需的边文件说明


依据上文,我们可以知道,绘制一个网络图所要求的最低限度数据应该为一个包含各个节点相互作用关系的文件,如下表1. A所示:

这种文件的结构为,每行描述一条边(Edge),至少应当包含两列,分别描述这条边连接的两个节点。根据表中的连接关系,可以绘制出一个网络图,如下图 A所示。我们可以看到由于3个节点在表格中均有相互关联,所以在图中也两两相连。在两个节点存在上下游关系时,我们通常会将两列列名分别命名为“source”和“target”分别表示一个反应/调控关系的上游和下游,如表1 B。这时绘制出的图如下图 B所示,可见代谢物1发出两条箭头分别指向代谢物2,对应表格前两行,代谢物1作为两个反应的起始节点影响着代谢物2和代谢物3,代谢物2发出一条指向代谢物3的箭头,对应着表格中的第3行,反应代谢物2对代谢物3的调控作用。


当存在可逆反应或反馈调节时,假设代谢物2可以代谢为代谢物3,反过来代谢物3又可以逆反应为代谢物2,这时我们需要准备的是表 C中的形式,在原表格 B的基础之上添加了一行以代谢物3为source,以代谢物2为target。这样得到的网络图(因不同工具、不同参数可能会有不同)可能是图 C,也可能是图 D[W用1] ,但我们需要注意的是,无论网络图中节点显示的是一条边还是两条边,在原始数据中,我们都应当准备对应的两行,在对边进行计数时,应当算做方向不同的两条边。

2. 边的属性调整


上面介绍了表示边信息的表格(通常称为“边文件”)的准备方法,我们实际使用中通常会想要通过变更边的某些属性,来传递更多信息,比如相关性网络中常见的用法是用边的颜色表示相关系数的正负,暖色表示正相关,冷色表示负相关,用边的粗细表示p值,-log(p)值越小,连接线越粗。


通常我们会准备一个如下表所示的边文件来记录我们要使用的属性,对应的网络图如下图所示:

节点的属性调整

在调整好边及边属性后,我们可能会想要通过调整节点的属性来展示更多的信息,如通过节点颜色表示节点对应代谢物在干预组中相比对照的变化情况,通过节点形状表示代谢物所属类别,通过调整节点大小来展示代谢物在网络中的重要性。这时我们需要准备一个包含各个节点及节点属性的数据文件(通常被称为“节点文件”,Node Table)。下表展示了一个对应的节点文件示例,文件中第一列对应各个节点的名称,注意此列中节点名称应当与Edge Table中内容一致,否则无法完成节点属性的映射(mapping),第二列是该物质在处理组中相比对照改变的倍数取2为底的对数,第三列“height”是该倍数的绝对值,用来控制点的高度,第四列“IS_Upregulated”根据第二列得到,指示代谢物是否上调,第五列“color”列根据第四列得到,用来指示节点的颜色,第六列“class”列用来表示代谢物的分类,第七列“shape”列根据第六列得到,指示不同类型代谢物在图中对应的形状。将上述属性变更添加到之前的网络图中,我们可以得到下图。

小结

通过本期文章,我们介绍了网络图所需的节点文件、边文件的格式及通过节点属性、边属性来展示信息的基本思路。


下期文章中,我们会以一次模拟的代谢组学相关性结果为例,为大家展示如何在R中由代谢组学原始数据出发,计算其相关性结果,并展示从结果和原始数据出发生成绘制网络图所需的节点文件和边文件的完整过程。




微信公众号:麦特绘谱

Tel:400-867-2686

Web: www.metaboprofile.com


识别二维码,关注我们

解锁更多精彩「代谢组学」相关资讯!


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved