探“云”指南 | 欧易云平台表达量计算详细教程

2022-07-15 08:11:51, 欧易生物 上海欧易生物医学科技有限公司



背景知识介绍



基因表达量常见的衡量指标有:FPKM、TPM、RPKM


FPKM:Fragments Per Kilobase Million或者Fragments Per Kilobase Per Million Reads

即每一百万条Reads中,比对到该基因的1000个base的fragments总数。

F1表示mapping到该基因的fragments总数

L1表示该基因长度

FT表示mapping到参考基因组的总fragments数


RPKM:Reads Per Kilobase Million或者Reads Per Kilobase Per Million Reads,即每一百万条Reads中,比对到该基因1000个base的Reads数。

R1 表示mapping到该基因的reads总数

L1表示该基因长度

RT表示mapping到基因组的总reads数


FPKM意义与RPKM的区别仅在于,Fragment 与 Read。


RPKM的诞生是针对早期的SE测序,FPKM则是在PE测序上对RPKM的校正。


Reads即是指下机后fastq数据中的每一条Reads,Fragments则是指每一段用于测序的核酸片段,在SE中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;在PE中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间。


TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)。

R1表示mapping到该基因的Transcripts总数

L1表示该基因长度

Rtotal表示矫正后的所有基因的counts总和。


计算TPM分为3步:
step1:根据基因/转录本长度校正count值;假设某基因count值为R1,则校正后count值为:R1/(L1/1000),L1为该基因的长度;
step2:计算total 校正后count值;即所有基因的校正后count值总和,Rtotal;
step3:根据公式计算TPM;



欧易云平台-表达量计算



2.1 表达量计算小工具用于将转录组的counts数据转换成FPKM或者TPM标准化的数据。

参考右侧的使用说明,正确整理数据格式即可实现数据转换。


注:表头含义,第一列列名为id,第2-n列为样本名称,没有的填写为0,这里不允许不填,不填写会报错。


2.2页面参数选择

将整理完的表格,上传至表达量矩阵表位置

进行转换之前要先选择物种,选择的物种要与研究的目标物种一致,不同物种所选择的基因的长度是不一样的,这里要特别注意,如果选错物种则计算出的结果是错的。



2.3 标准化方法的选择:

主要有两种方法FPKM和TPM,适用于当前欧易转录组报告数据标准化方法。



2.4 结果展示:

点击结果下载,自动下载标准化后的数据。



猜你想看

1、科研轻而“易”举——欧易生物云平台焕新归来!

2、探"云"指南 | 欧易云ROC分析曲线

3、技术指南 | CUT&Tag技术大放送,Q&A助力了解详情

4、免疫研究工具天花板—IOBR包说明书来啦~

END

排版人:小久


原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。

点击“阅读全文” 收获更多精彩


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved