震撼来袭!7大生信工具助力,发文一镜到底!

2023-05-08 16:35:17, 质谱创新组学 上海欧易生物医学科技有限公司


    


研究蛋白代谢的各位老师们,是否经常会有这样的困惑:


  • 挖掘数据时,除了常规的差异筛选,还可以通过哪些分析手段呢?

  • 云工具看起来种类多样,纷繁复杂,让人晕头转向,经常花时间研究了一款新工具,结果发现不适用!

  • 如何按照研究思路来用好云流程和工具呢?




乱花渐入迷人眼,如何能让工具为我们所用,而不要让我们沦为工具的“傀儡”?下面为大家介绍一组蛋白代谢都适用的:7大云工具套装~



假设我们手头有这样一组研究数据:样本暴露于某药物,在3个不同时间点0h、24h、48h取样,其中每个时间点有5个重复样。


无论代谢组学还是蛋白组学分析,主要需要以下两部分信息(以代谢数据为例)


1. 矩阵文件

矩阵文件存储了代谢物/蛋白的定性定量信息,以及一些注释信息。



2. 分组 & 分组比较信息文件

分组&分组比较信息存储了各样本对应的分组信息,以及差异比较涉及到的分组。



注:对于代谢云流程,是将上述信息整合为1个包含4张sheets的excel表格;而对于蛋白组云流程,矩阵文件和分组&分组比较信息,分别拆解为2张excel,原理大同小异啦~


言归正传,正文开始~~~




Step1:常规分析


工具1:代谢一键化流程使用参照



工具2:蛋白一键化流程使用参照



准备好上述流程所需要的输入文件,并设置流程中重要参数(如p值、FC值、物种信息),就可以开始分析啦~仅需要几分钟,便可获取包含html结题报告的分析结果。


最终会得到样本质控、定性定量、差异筛选、功能富集、关联网络等分析内容~如下图:



常规分析中,我们主要得到了不同时间点,差异表达的代谢物/蛋白。同时可以进一步进行功能富集分析,看这些差异物质主要在哪些通路上富集。


比如在常规云报告中,我们锁定到了LysoPC(17:0/0:0)、15,16-dihydrosacrolide A、Ricinoleic acid、Punicic acid、ent-16-epi-16-D1t-PhytoP这5个差异代谢物。而差异代谢物主要富集于以下几个通路:Choline metabolism in cancer、Carbohydrate digestion and absorption、Fructose and mannose metabolism、Glycerophospholipid metabolism。





Step2:进阶个性化分析


当然仅仅做常规差异分析,已经不能满足我们的发文需求,拿到数据咱们就要充分挖掘。WGCNA、STEM、GSEA这3大利器,不可不会~



WGCNA分析


基因共表达网络(WGCNA, Weighted Gene Co-Expression Network Analysis),是一种从高通量的表达数据中挖掘模块(module)信息的算法,在该方法中module被定义为一组具有类似表达谱的基因,并探索module内基因网络与研究者关注的表型之间的关联关系。


工具3:WGCNA分析流程

https://cloud.oebiotech.cn/task/detail/wgcna-oehw/?id=100


只需要按照要求整理2个文件:1.表达量矩阵;2.表型文件,就可以进行WGCNA分析啦。那么WGCNA分析又有哪些结果呢?


1)feature的cluster聚类:按照权重共表达网络使用的算法,可以将features聚类到不同的module。



(2)表型和模块相关性:根据划分的module,计算0h、24h、48h分组和各个模块间的相关性,并分析各模块内Hub基因关联网络。



上图可以看出,MEtan模块和t0h呈显著正相关(p=0.001, 相关性系数 = 0.74)MEturquoise模块和t48h呈显著负相关(p=4e−04,相关性系数 = -0.8)


(3)模块功能分析:可继续基于各模块的feature列表进一步进行富集分析,以探究每个模块内主要富集在哪些通路上。具体可以使用哪个富集分析小工具呢?


工具4: 针对蛋白/基因,可以使用以下小工具链接:



工具5:针对代谢物,可以使用以下小工具链接:

https://cloud.oebiotech.cn/task/detail/keggrich-luming-oehw/?id=62



STEM分析


STEM分析即时间趋势分析,可以分析不同时间点、不同浓度梯度处理下,基因/蛋白/代谢物的表达趋势聚类。


工具6:STEM分析流程



按照云平台说明或者公众号说明操作后,就可以得到以下结果:

(1)不同变化趋势的feature聚类



如上图,分析结果显示,有3个显著性趋势的模块(即图中蓝色和橙色3个模块,灰色为非显著性模块),前2个模块呈现在24h先上升,在48h又下降的趋势。而第3个模块,从0h到24h无明显变化趋势,而在48h呈现下降趋势。


(2)各趋势模块的heatmap图



如果想基于Profile1中的蛋白/代谢物进行功能富集分析,参考上文中提到的功能富集工具模块。



GSEA分析


上面提到的功能富集分析,能够获取差异基因显著富集的通路和功能,及其对表型变化的潜在作用。但无法帮助我们知晓某条通路下差异基因的总体变化趋势,以及对应通路的状态,到底是激活还是抑制状态?


此外,设置差异基因筛选阈值可能会漏掉一些在统计学意义上无显著差异但实际有着重要生物学意义的基因,而GSEA则弥补了传统富集分析的这些问题。


工具7:GSEA分析



使用该工具后,得到如下结果:



如上图,可以得知,beta-Alanine metabolism(mmu00410)通路,ES值为0.941,NES值为1.94, p<0.001, FDR: 0.012。(注:上图为以代谢组数据进行的GSEA分析,代谢物compound注释相对基因和蛋白偏少,所以代表代谢物在该通路的竖线数目也相对较少)同时,可以基于注释到的代谢物/蛋白进行heatmap分析以及功能富集分析。


7大云工具套装,带大家尝试了一整套常见分析和挖掘套路,当然还有很多的图形优化工具(如heatmap、火山图、venn、气泡图、各类交互式作图工具等)可以用于作图细节调整。



今天只是带领大家浅尝辄止,更多炫酷又实用的小工具,欢迎老师们去云平台寻宝啦~~如果还有不清楚的,或者操作中遇到问题,可以下方微信,联系我们哦~




小鹿推荐


关注

鹿明生物提供优质的空间代谢组服务


空代仪器平台

已搭建2套AFADESI-MSI质谱成像系统


项目执行

已落地执行项目百余项、检测组织样本类型20+;


定性算法经过多维校准

定性结果同时考虑物质表达空间情况、加和离子及同位素峰表达强度相似性、同位素表达空间分布相似性、非靶向质谱数据和空代自建数据库进行校准。


项目实测结果

可实现定性代谢物数量:1000-3000个代谢物

无偏好性检测代谢物::70%为700Da以下的小分子物质,30%为脂质类物质,更加适合代谢组学研究方向;



猜你还想看


探云指南 | 代谢组学一键化报告上新啦——“代谢”你想要的科研图我都有~

探云指南 | 云平台蛋白分析流程全新升级啦!

“增” 技能 | 怎么看懂KEGG数据库中的通路图?

“涨”知识 | GC-MS代谢组全套技术流程、应用瓶颈、定量方式及数据库应用~


END

蚂蚁无所谓 撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

点“阅读原文”了解更多


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2023 ANTPEDIA, All Rights Reserved