欧易才子力荐:甘蔗无参全长转录组思路解读

2022-07-30 08:19:14, 才子 上海欧易生物医学科技有限公司


sugarcane(甘蔗)多倍体无参考基因组

取材:取自根、茎、叶不同的生长阶段具有22个特性的混合样本

测序平台:Pacbio RS II 与Illumina

取材:取自根、茎、叶不同的生长阶段具有22个特性的混合样本

二代文库:插入片段200bp

结论:总共获得107,598条unique transcript isoforms,呈现了约71%的unigene,其中约有92%可比对到已知植物蛋白库。约有2%的新转录本以及约2%的LncRNA。分别有56%和23%的序列可注释到GO和KEGG数据库。相同条件比较三代和二代转录本,其中有62%的三代转录本匹配到67%的二代拼接转录本。与高粱基因组比对,分布有69%的三代转录本和41%的转录本比对率。

分析内容简述:

  1. 二代转录组数据组装,使用了Trinity r2013-08-14, CLC-GWB, Velvet/Oases v1.2.10 和SOAPdenovo-Trans v1.03多种软件分别组装并最后使用CD-HIT-EST v4.6.5 进行结果整合

  2.  组装结果完整性评估借助BUSCO的数据库进行评估

  3. 三代数据的前期预处理都是基于三代官方的smrtanalysis分析软件完成

  4.  结合二代数据使用LoRDEC分析软件对三代数据进行矫正,大大提高了三代获得最终转录本的数量

  5. 基于TransDecoder 的开放阅读框及编码潜能预测分析

  6. 非编码RNA预测分析

  7. 使用RepeatMasker v4.0.6 对重复序列transposable element (TE) 进行分析

  8. 使用MISA v1.0 对SSR短重复序列进行分析

  9. 使用blastn比对NT数据库(<1e-5)进行比对注释分析,其中还包括植物转录因子数据库PlantTFDB v3.0 注释分析,以及常规的GO/KEGG数据库注释分析


结果与分析方法解读

1.  之前测了二代现在补测三代,两者一个很好的结合点是什么?

使用二代数据对三代数据进行矫正,目前矫正的方法有很多比如proovread and LoRDEC,通过本文的比较LoRDEC的效果会更好。另外对二代的数据输入方面也不是不假思素的有多少就输入多少,而是通过对二代输入数据首先进行标准化,这里采用的标准化方法采用了Trinity-normalized和BBnorm-normalized两种方法,并与非标准化方法矫正的结果进行比较,最终确定了Trinity-normalized+LoRDEC最佳整合形式。注意这一发现和研究成果已经整合到欧易生物的全长转录组分析中。

2.关于完成性评估内容

之前的数据完整性评估是基于CEGMA(http://korflab.ucdavis.edu/datasets/cegma/)标准的,但是由于该项目早在2015年5月18号就已经停止更新了,而且该项目主页在分析过程中也推荐使用BUSCO(http://busco.ezlab.org)数据库标准。因此还没有对此更新的小伙伴们抓紧了。

3.关于三代测序平台

由于本文是发表于2017年,但测序仪器的选择还是RSII平台。目前市场上的三代测序平台都是基于Pacbio公司的有Sequel和RSII两种。Sequel是RS II的升级版本,两者相比Sequel的自动化程序更高,减少了人为操作,且数据通量高和数据一致性较好。简单的通过全长转录组建库测序的流程图来看懂两者仪器的区别。


4.放送一张流程图看懂欧易生物全长转录组分析流程

5.关于三代全长转录组测序除了在RNAseq测序方面的应用还有那些:

在做基因组denovo的时候,基因预测往往是一个很大的难题,无论是基于

参考基因组训练模型进行基因预测的denovo方法,还是基于蛋白质同源比对的同源比对方法,都没有基于RNAseq的转录组数据预测方法来的更直接和准确。三代全长转录组测序由于免去了组装这一步骤,因此在经过后期的数据处理和矫正后,得到往往就是真实的转录本。常规情况下,我们在做基因预测时,基于denovo方法占的权重是1,同源比对所占比例为5,而转录组数据所占比例却为10,其重要性一目了然。最后送上小编送上欧易生物独有的基因组预测注释分析流程图。



  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved