探“云”指南 | 欧易云交互式boxplot图——图都这么好看,该怎么选?

2022-12-06 01:47:55, 欧易生物 上海欧易生物医学科技有限公司



Boxplot(箱线图)相信大家都不陌生,或长或方的长方形,上下长着长长短短的“触手”,因此也被称为“盒须图”,通常用作显示一组及多组数据分布情况。在生物统计当中,特征的组内丰度及组间差异常用箱线图来进行展示。箱线图的绘制十分简单,但想必大家常见的箱线图都是静态的。


欧易云平台交互式boxplot图又有什么神奇之处呢?让我来带大家一起看看吧。


背景知识介绍



首先,箱线图的绘制需要先计算出每组数据的最大值、最小值、上四分位数、下四分位数和中位数这五个描述分布的参数(除去离群点);然后从上四分位数和下四分位数出发延伸出两条横向线段作为上底边和下底边绘制一个矩形(形状像箱子),再从中位数出发延伸出一条横向线段将矩形分割成上下两部分;最后从上四分位数和下四分位数出发延伸出两条纵向线段至最大值和最小值。



如图上展示的一般,A、B、C三个组的数据分布被绘制成三个不同颜色“带触手的箱子”。


而这三组数据两两间的差异,在Wilcoxon检验的计算下如下图所示,“*”标示差异显著性阈值p<0.05,而“ns”则表示连线两组数据间不存在显著性差异。



如果说上面的图片展示的是一个特征的数据在不同组间的分布情况,那么下面这张图则可将拥有相同分组的多个特征其数据分布展示在同一张图上。



看到这里,你也许想问:“这也没什么特别的呀,神奇的在哪?”不要着急,跟着下面的步骤一步一步来,神奇的还在后头呢。


数据输入、参数设置



01

数据输入


箱线图的输入文件非常简单,只需要一个特征在各样本中的丰度值文件,及样本对应分组信息的分组文件即可。首先,对于特征丰度文件,其第一行和第一列需要分别是特征名称和样本名称。



如上图所示,第一行和第一列无论哪个是特征名称哪个是样本名称,平台都会自动识别处理,只要样本名和分组信息表中的样本名对应上即可。在这里需要注意的是,无论特征名在第一行还是第一列当中,都需要有至少一项特征的数值才能绘制图片(巧妇难为无米之炊嘛)。


在样本分组信息文件中,第一列为样本分析名需要与特征丰度文件中的样本分析名一致,第二列为分组名,注意:表头名称必须为Sample及Group。



02

参数选择


在“参数调整”的“主要参数”中有如下选项;



(1)点击“特征丰度文件”和“样本分组信息文件”的选择文件按钮即可选择上传对应的文件。

(2)若想绘制每个特征在不同分组中的数据分布情况,“boxplot图片类型”应选择组间boxplot;若想展示多个特征的数据分布在同一张图上,则应选择特征丰度boxplot。


此外,在“参数调整”的“常用参数”中有如下选项;



(1)“是否显示显著性标识”和“差异比较方法”是为组间boxplot图设置的参数:

“是否显示显著性标识”:可以选择是否展示两两组间的显著性标识,默认为“否”。注意,当组的数量大于5时,受画布大小影响,则无法在各组间两两添加显著性标记;


“差异比较方法”:可以选择组间差异比较的检验方法,默认为kruskal-wallis。对于选择展示显著性标识的组间boxplot,需在各组间两两添加显著性标识的,请选择Wilcoxon或T检验。


(2)“选择特征数”和“y轴标题”是为特征丰度boxplot图设置的参数:

“选择特征数”:当特征数过多时,建议选择丰度值最大的前n个特征进行展示。这里默认选择前10个,也可通过输入来自定义;

“y轴标题”:y轴标题可通过输入修改,默认为“Abundance”(丰度)。


(3)“字体类型”、“字体样式”和“box配色方案”为全局配置参数:

“字体类型”:“Arial”、“Times”、和“Verdana”这三种常用的字体可供选择;

“字体样式”:默认无特殊字体样式,可选择“加粗”或“斜体”;

“box配色方案”:供提供如下三种配色方案:



在确认完上述数据输入和参数选择后就可以提交生成的交互式Boxplot图啦~


结果交互展示



(1)首选,对于“组间boxplot”图,对每一个特征分别生成其各组的boxplot,可以滚动屏幕查看所有的交互图片,并通过“进入交互式图”和“返回页面”来具体查看不同的特征boxplot图;



(2)在进入的每一个交互式图片中,可以通过鼠标悬停的方式查看对应boxplot的具体数值,从上到下依次对应min(最小值)、Q1(下四分位数)、median(中位数)、Q3(上四分位数)和max(最大值),而这些具体数值在静态图片上往往只能靠输出具体数值来进行查看,远不如交互式图来得方便;



(3)每组位置中线上的黑点即该组对应的各样本点的值。将鼠标移放至该点,可以直接看到该点的样本名和数值大小,对极值和异常值样本的查找非常方便,而这同样也是静态图所不具备的;



(4)其次,对于“组间boxplot”图,当特征数较多时,选择丰度值最大的前10个特征生成展示图片,点击“进入交互式图”来进入交互式boxplot图;



(5)在组间boxplot交互式页面中,同样可以通过鼠标悬停的方式查看对应boxplot的具体数值,于此同时还会高亮展示图中所有特征里与鼠标悬停的box属于同一分组的全部box;



(6)如果只想查看其中的某几组的box,可以在右侧图例处点击关闭对应组的box,留下需要展示的box组,box将自动调节成合适的宽度;



(7)最后,无论是哪种类型的交互图,都可以在右侧的配置页面进行全局和各组间的调节,例如在“全局设置”中修改字体风格、类型、粗细,并保存成想要的图片格式;在“标题设置”中修改标题及其位置、字体大小;在“图例配置”中修改图例的排列方式,字体大小等;



(8)在“X轴配置”中,可以添加X轴的名称,如对于示例数据,可添加X轴名称“Feature”,并根据用户的喜好调节X轴刻度标签的角度、字体大小等使图片更加和谐;



(9)同样的,在“Y轴配置”中,可以修改Y轴名称,字体大小,标签角度等,还可以通过输入数值调节Y轴的展示范围;



(10)最后,在新版的页面中,点击箭头可以实现侧边栏的拉出和隐藏



(11)在系列项配置中,还可以选择对应的节点调整想要的颜色哦;



关于交互式boxplot图的使用和展示就介绍到这里啦,那么这两种交互式boxplot图究竟应该怎么选呢?如果想要对比多个特征的丰度值,建议选择“特征丰度boxplot”;如果想要专注与单个特征数据的组间比较,建议选择“组间boxplot”;结合特征丰度比较选择感兴趣的特征进行组间比较更是科研欧的吧“不二之选”。


感兴趣的小伙伴欢迎登录欧易云平台官网进行作图哦!云平台竭力为您提供更优质的用户体验~


如果你还在为不知如何绘制SCI图表而忧愁,还在为毕业论文制图效率低下美观度不满意而焦心,或者想要找到一个高效制图的集中地……


欧易云是欧易/鹿明生物旗下的科研图表聚集地,里面火热绘图工具+教程,使用便捷且能自动调色增加科研图的美观度,同时还将上线更多科研图功能,请持续关注欧易云平台,相信聪明的你一定不会错过!


云平台地址:

https://cloud.oebiotech.cn/task/


猜你想看

1、探“云”指南 | 科学与艺术:circos图都能搞定!

2、探"云"指南 | 降维新成员:NMDS分析

3、探“云”指南 | 欧易云交互式火山图——助你轻松找到“理想型”(上)

4、探“云”指南 | 欧易云交互式火山图——助你轻松找到“理想型”(下)

END

排版人:小久


原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。

点击“阅读全文” 收获更多精彩


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2023 ANTPEDIA, All Rights Reserved