悟空云平台交流视频第五十八期---《代谢物GSEA KEGG富集分析(自己上传背景库)》

2025-07-02 16:06:37, omicsolution.com 上海易算生物科技有限公司


悟空云

组学数据分析平台

易算生物




悟空云平台全新上线代谢物GSEA KEGG富集分析工具,帮你突破传统分析瓶颈。只要你有代谢物整体变化的排序信息(如Fold Change或其他统计值),就能迅速定位关键代谢通路。链接在文末



GSEAGene Set Enrichment Analysis)是一种基于基因集(这里对应代谢物集)的富集分析方法,它无需预先筛选差异分子,而是利用排序好的全谱数据评估特定通路代谢物集在排序列表顶部或底部的集中程度,从而判断该通路对表型的贡献。


方法优势


传统KEGG富集分析属于过度表达分析(Over-Representation Analysis),需要先按照阈值筛选出显著差异的代谢物,再检验这些代谢物在各通路中的富集情况。这种方法依赖于主观的阈值选择。


GSEA则不需要预先选定阈值,而是利用所有代谢物的排序信息,衡量整个通路代谢物集合是否在排序列表的两端集中出现。因此,GSEA能更灵敏地发现那些由众多微弱变化共同驱动的通路。




怎么使用?这里给你准备了使用视频

使用视频


打开模块以后


上传代谢物数据准备好代谢物列表,文件中应包含代谢物ID(如KEGG化合物IDHMDB号或名称)和对应的排名指标(如log2FC或统计值),格式为两列或多列形式。将数据文件上传至模块。


获取并上传背景库在悟空云平台中,使用“KEGG数据库查看模块(或等效工具)检索目标物种的KEGG通路-代谢物对应关系【在视频第5分半】,下载得到该物种下所有代谢物所属通路信息作为背景库。然后在本分析模块中上传该背景库文件,以供富集分析使用。


参数设置在分析界面中选择合适的物种(与背景库匹配)、显著性检验方法(如置换检验次数)、富集评分(ES)计算方法、调整多重检验的方法等。检查输入数据的列名和ID类型是否一致,并设置排序方向(上调在前或下调在前)。


运行分析并查看结果提交后,平台将自动运行GSEA算法,【在视频第九分钟】输出富集结果表(包含通路名、富集分数、P值和FDR等)和可视化图形(如富集曲线图、气泡图等)。重点关注FDR显著的通路,并根据富集曲线判断通路上调或下调的趋势。



注意

  • 确保输入的代谢物ID与背景库中的ID一致(例如都使用KEGG化合物ID或都使用HMDB号)

  • 富集曲线峰值为正表示通路主要由上调代谢物驱动(富集在排序列表前端),峰值为负则由下调代谢物驱动。需要结合生物学背景判断通路意义。

  • 若出现无显著结果,可检查背景库是否正确、代谢物ID是否匹配、是否对数据进行了合适的过滤(如去除缺失过多的代谢物)。此外,高度相关的代谢物(如代谢物簇)可能导致通路富集信息冗余,需结合其他手段(如网络分析)辅助解读。



复制下述链接或点击“阅读原文”进入分析页面

https://wkomics.omicsolution.com/wkomics/main/


END
易算蛋白组学前沿方案库



  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2026 ANTPEDIA, All Rights Reserved