探“云”指南 | 如何进行共表达相关性分析

2023-06-16 14:05:37, 欧易生物 上海欧易生物医学科技有限公司



共表达相关性分析的基本思想是通过计算不同特征的表达量在样本中间的相关性,以此来揭示其之间的相互作用关系。常见的共表达相关性分析方法包括相关系数分析、主成分分析、聚类分析、因子分析等。这些方法可以用于挖掘具有生物学意义的跨组学特征对模式,预测未知基因的功能和生物学过程,甚至发现新的药物靶标。


功能介绍



共表达相关性分析小工具可以根据样本一一对应关系对,计算两个组学特征之间的相关性,或一个组学特征的自相关性(即两个不同的表或者相同的表),绘制热图,矩阵图和网络关系图。相关性算法可选用的有pearson相关性、spearman相关性、kendall相关性。如果不指定,默认使用pearson相关性计算方法。


文件要求



01

输入文件1

计算文件1和文件2为不同的数据:

接受两个特征表达量矩阵文件,两个文件的表头(样本)信息需要一一对应。


图1 | 输入文件1格式示例


02

输入文件2


图2 | 输入文件2格式示例


03

计算自相关表格

相关性表1和相关性表2和填写相同的特征表达量矩阵文件


图3 | 计算自相关表格格式示例


参数调整



01

主要参数


图4 | 主要参数


02

常用参数


图5 | 常用参数


作图步骤



01

准备工作

请于上传文件前首先查看“重要提示”的提示信息以及“使用说明”中的示例文件格式,根据提示进行文件准备。


02

主要参数设置

请于主要参数中的相关性表1、相关性表2处上传您所要进行分析的文件,二者为必填参数。如果您要进行自相关分析,请在相关性表1、相关性表2处上传同一份文件。我们以计算两个组学特征之间的相关性为例,上传不同的文件。在“选择文件”后显示上传的文件名说明上传成功。

此处为上传成功示例:


图6 | 文件上传成功示例


相关性计算方法:相关性算法可选用的有pearson相关性、spearman相关性、kendall相关性。如果不指定,默认使用“pearson”;

任务命名:对结果进行命名用于区分不同的任务,默认为结果创建日期时间,在历史记录的注释处可见,可接受默认或自行输入。


03

常用参数设置

选择top特征:选择top特征进行绘图,最大不超过200,若相关性表中特征数超过200,则将选取丰度值top200进行计算;

是否列聚类、是否行聚类:默认均为“是”;

是否显示x轴的标签、是否显示y轴的标签:默认均为“是”;

显著性标识绘制方法:可选择pvalue或者qvalue;

作图颜色选择:可参考“重要提示”中的配色展示;

x轴标签名称的旋转度、坐标轴字体大小、字体类型、字体样式、格子高度、格子宽度:根据需求填写即可;

网络图特征关系对相关系数阈值:筛选绘制网络图特征关系对的相关系数阈值,默认为“0.8”;

网络图特征关系对显著性阈值:筛选绘制网络图特征关系对的显著性阈值,默认为“0.05”。


04

最终提交

文件上传成功后点击“提交”,右侧工作区将提示您所需时间。有时会遇到任务排队情况,请您耐心稍等。

如图所示区域:


图7 | 工具预估耗时提示处


结果分析


(本说明为上传两个不同文件及其他参数保持默认的情况)


01

结果展示及下载

分析结果保存6个月,请注意及时下载保存,点击“结果下载”可将结果保存至本地。


图8 | 结果展示处


02

结果说明

5.2.1、结果文件

图9 | 结果文件示例


5.2.2、Corheatmap图

列为表2特征,行为表1特征,其中的每个小方格都代表两特征的相关性,颜色代表相关性的大小,根据右侧的色阶我们可以看出红色表示正相关,蓝色表示负相关,且颜色越深表示相关性越大,越接近黄色表示相关性越接近零。左侧树状图表示来自表1特征的聚类分析结果,图片上方的树形图表示来自表2特征的聚类分析结果。图中的“*”为显著性标记,“*”代表p<0.05,“**”代表p<0.01,“***”代表p<0.001。


图10 | Corheatmap图示例


5.2.3、相关性矩阵图

列为表1特征,行为表2特征。根据右侧的色阶我们可以看出红色表示正相关,蓝色表示负相关,且颜色越深表示相关性越大,越接近白色表示相关性越接近0,同时,点的大小代表相关性的大小,点越大相关性越大。

图11 | heatmap_matrix图示例


该图展示了两表之间的特征以及同一表内特征之间的相关性值,红色为正相关,蓝色为负相关,颜色越深表示相关性越大,越接近白色表示相关性越接近零。点上都标记了对应的相似性大小,左下至右上的点相关性均为1,表明它们对应的是同一个变量的相关性,点的大小代表相关性的大小,点越大相关性越大。

图12 | heatmap_matrix_square图示


5.2.4、关联网络图

关联网络图中为基于 spearman 相关性分析计算相关性表1和相关性表2数据间的关联性,共表达关系对根据选择的显著性标识绘制方法的所选阈值及相关性系数的所选阈值镜像筛选。蓝点来自表2,红点来自表1,红线代表正相关,绿线代表负相关。线的粗细代表相关性系数的高低。


图13 | Correlation_cor0.8p0.05_Network图示例


历史记录



点击欧易集团云平台界面右上角的“登录”,您可以进行免费注册,用您注册的账号登录欧易云平台个人中心,在此之后使用云平台所有的小工具将会存有记录。您可以点击下图中的“历史记录”查看使用共表达相关性分析小工具的任务状态、任务结果等记录,或点击右上角“个人中心”查看所有小工具任务记录。


图14 | 历史记录示例


常见Q&A


请问我的相关性表中特征数超过200的话,在“选择top特征”参数填写200,绘图所选特征会怎么选择呢?

您好,首先感谢您的咨询。若上传的相关性表中特征数超过200,同时您在“选择top特征”参数处也填写200,则会选取丰度值top200进行计算。


往期推荐

探“云”指南 | 一文教你WGCNA分析

探“云”指南 | 微生物ROC曲线

探“云”指南 | 免费物种功能贡献度分析小工具不容错过!

探“云”指南 | 拜托!谁不喜欢清晰直观的条形图啊!!!

END

排版人:七七


原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。

点击“阅读全文” 收获更多精彩


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved