只要5分钟轻松掌握相关散布图~

2021-12-21 22:30:23, 多层组学定制服务 上海欧易生物医学科技有限公司


点击上方蓝色字体关注我们

蛋白组学、代谢组学服务专家

生物信息分析知多少?

Do you know

生信分析中,我们常会接触到各个因素之间的关系,这些变量之间的关系往往不能进行解析描述,不能由一个(或几个)变量的数值精确地求出另一个变量的值,这称为非确定性关系(或相关关系)


相关散布图就是用来研究两个变量之间是否存在相关关系的一种图形。它是用非数学的方式来辨认某现象的测量值与可能原因因素之间的关系。这种图示方式具有快捷、易于理解的特点。要注意的是,绘图数据必须是成对的(X,Y)。根据点的分布特点,就可以判断x和y 的相关情况。在生物统计中有许多呈规则或不规则的关联,我们要了解它,就可借助散布图统计手法来判断它们之间的相关关系。


一起绘制出这张相关散布图吧

Do you know

01


首先安装接下来绘图所需的R包

library(ggplot2)library(ggpubr)library(readxl)

向右滑动查看全部


02


然后读取两个表格内容

#该表格是样本中代谢物的表达量数据。data_expression<-read_excel(“expression.xlsx”,sheet=1)    

向右滑动查看全部


#该表格是样本中物质浓度数据。data_potency<-read_excel(“potency.xlsx”,sheet=1)          

向右滑动查看全部


03


提取所需数据

#分别选取一种代谢物和一种物质浓度expression <- data.frame(data_ expression [1], data_ expression [2])potency <- data.frame(data_potency [1], data_potency [2])

向右滑动查看全部


04


对数据进行处理

根据样本名合并表达量矩阵和浓度矩阵

#merge()获取两个不同数据框中交叉部分data <- merge(x = potency,y = expression ,all = T,by = "Sample_name") #提取新矩阵列名col_names <- colnames(data)

向右滑动查看全部


05


绘制相关散布图

以浓度1作为横坐标,Metabolites1作为纵坐标绘制相关散布图

ggplot(data,aes(x = data[,2],y = data[,3])) +      theme_bw() +      #设置散点颜色和大小      geom_point(color = "black",size=2) + # lm函数可对两组数据进行回归分析,使用geom_smooth()来画曲线拟合图      geom_smooth(method = "lm",color = "royalblue1") +       #使用Pearson相关分析       stat_cor(data = data,method = "pearson",size = 6) +       #设置横纵坐标名和标题      labs(x = col_names[2], y = col_names[3],title = "correlation") +       #设置标题格式      theme(plot.title = element_text(hjust = 0.5, size=20))+       #设置坐标轴和坐标轴名称格式        theme(axis.text = element_text(size = 12,face = "bold"),              axis.title = element_text(size = 15,face = "bold")) +     #设置绘图边距#设置绘图边距      theme(plot.margin = unit(rep(2,4),"lines"))  

向右滑动查看全部

可以得到有关Metabolites1和浓度1的相关散布图


06


对所有数据进行for循环绘制图片

for (i in 2:4){    #提取表达量数据    expression <- data.frame(data_expression [1],data_expression [i])  for (j in 2:3){    #提取浓度数据    potency <- data.frame(data_ potency [1],data_ potency [j])    data <- merge(x = potency,y = expression,all = T,by = "Sample_name")col_names <- colnames(data)
   pp<-ggplot(data,aes(x = data[,2],y = data[,3])) +      theme_bw() +      geom_point(color = "black",size=2) +      geom_smooth(method = "lm",color = "royalblue1") +      stat_cor(data = data,method = "pearson",size = 6) +      labs(x = col_names[2], y = col_names[3],title = "correlation") +      theme(plot.title = element_text(hjust = 0.5, size=20))+      theme(axis.text = element_text(size = 12,face = "bold"),            axis.title = element_text(size = 15,face = "bold")) +      theme(plot.margin = unit(rep(2,4),"lines"))
   #导出图片    ggsave(paste0("correlation-",i-1,"-",j-1,".jpg"), height=10, width=14, plot=pp)    ggsave(paste0("correlation-",i-1,"-",j-1,".pdf"), height=10, width=14, plot=pp)  }}

向右滑动查看全部


所有代谢物物质浓度之间的相关散布图就这样绘制出来啦。


好了,这期关于相关散点图的分享就到这里结束了,请大家持续关注我们,后续还会有更多更实用的分享推出,帮助您在科研的道路上“披荆斩棘,乘风破浪”,实现您的科研梦想!


文末看点 | lumingbio


上海鹿明生物科技有限公司多年来,一直专注于生命科学和生命技术领域,是国内早期开展以蛋白组学代谢组学为基础的多层组学整合实验与分析的团队。目前在多层组学研究已经有了成熟的技术方法,欢迎各位老师前来咨询哦~

同时,鹿明生物B站上线了5大频道板块,分别在空间代谢组学、生信分析、多层组学、代谢组学方向为各位科研老师提供有效的方法工具和思路~其中,生信板块也拥有着观看量1.5万的生信爆款视频~欢迎各位老师访问,鹿明生物B站:

https://space.bilibili.com/388691543

长按扫码咨询鹿明生物

技术工程师

项目咨询|样本咨询


猜你还想看


◆生信作图:高效学会富集分析气泡图,还能免费领取高清总代谢通路图哦~
生信作图上镜率持续走高的桑基图,如何用多种方法绘制?(附代码)
生信作图告别俗套相关性图,助您文章锦上添花!
生信作图拒绝“菜色”,如何绘制高级且美丽的箱线图?(代码分享)

END

甜橙诚 撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

点“阅读原文”了解更多


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2023 ANTPEDIA, All Rights Reserved