2022-07-30 08:19:14, 才子 上海欧易生物医学科技有限公司
sugarcane(甘蔗)多倍体无参考基因组
取材:取自根、茎、叶不同的生长阶段具有22个特性的混合样本
测序平台:Pacbio RS II 与Illumina
取材:取自根、茎、叶不同的生长阶段具有22个特性的混合样本
二代文库:插入片段200bp
结论:总共获得107,598条unique transcript isoforms,呈现了约71%的unigene,其中约有92%可比对到已知植物蛋白库。约有2%的新转录本以及约2%的LncRNA。分别有56%和23%的序列可注释到GO和KEGG数据库。相同条件比较三代和二代转录本,其中有62%的三代转录本匹配到67%的二代拼接转录本。与高粱基因组比对,分布有69%的三代转录本和41%的转录本比对率。
分析内容简述:
二代转录组数据组装,使用了Trinity r2013-08-14, CLC-GWB, Velvet/Oases v1.2.10 和SOAPdenovo-Trans v1.03多种软件分别组装并最后使用CD-HIT-EST v4.6.5 进行结果整合
组装结果完整性评估借助BUSCO的数据库进行评估
三代数据的前期预处理都是基于三代官方的smrtanalysis分析软件完成
结合二代数据使用LoRDEC分析软件对三代数据进行矫正,大大提高了三代获得最终转录本的数量
基于TransDecoder 的开放阅读框及编码潜能预测分析
非编码RNA预测分析
使用RepeatMasker v4.0.6 对重复序列transposable element (TE) 进行分析
使用MISA v1.0 对SSR短重复序列进行分析
使用blastn比对NT数据库(<1e-5)进行比对注释分析,其中还包括植物转录因子数据库PlantTFDB v3.0 注释分析,以及常规的GO/KEGG数据库注释分析
结果与分析方法解读
1. 之前测了二代现在补测三代,两者一个很好的结合点是什么?
使用二代数据对三代数据进行矫正,目前矫正的方法有很多比如proovread and LoRDEC,通过本文的比较LoRDEC的效果会更好。另外对二代的数据输入方面也不是不假思素的有多少就输入多少,而是通过对二代输入数据首先进行标准化,这里采用的标准化方法采用了Trinity-normalized和BBnorm-normalized两种方法,并与非标准化方法矫正的结果进行比较,最终确定了Trinity-normalized+LoRDEC最佳整合形式。注意这一发现和研究成果已经整合到欧易生物的全长转录组分析中。
2.关于完成性评估内容
之前的数据完整性评估是基于CEGMA(http://korflab.ucdavis.edu/datasets/cegma/)标准的,但是由于该项目早在2015年5月18号就已经停止更新了,而且该项目主页在分析过程中也推荐使用BUSCO(http://busco.ezlab.org)数据库标准。因此还没有对此更新的小伙伴们抓紧了。
由于本文是发表于2017年,但测序仪器的选择还是RSII平台。目前市场上的三代测序平台都是基于Pacbio公司的有Sequel和RSII两种。Sequel是RS II的升级版本,两者相比Sequel的自动化程序更高,减少了人为操作,且数据通量高和数据一致性较好。简单的通过全长转录组建库测序的流程图来看懂两者仪器的区别。
4.放送一张流程图看懂欧易生物全长转录组分析流程
5.关于三代全长转录组测序除了在RNAseq测序方面的应用还有那些:
在做基因组denovo的时候,基因预测往往是一个很大的难题,无论是基于
参考基因组训练模型进行基因预测的denovo方法,还是基于蛋白质同源比对的同源比对方法,都没有基于RNAseq的转录组数据预测方法来的更直接和准确。三代全长转录组测序由于免去了组装这一步骤,因此在经过后期的数据处理和矫正后,得到往往就是真实的转录本。常规情况下,我们在做基因预测时,基于denovo方法占的权重是1,同源比对所占比例为5,而转录组数据所占比例却为10,其重要性一目了然。最后送上小编送上欧易生物独有的基因组预测注释分析流程图。
04-07 市场部
会议回放|screenIT™ - 以 CRYSTAL POWDERDOSE 简化催化筛选04-06 力扬 NIKYANG
气清景明 万物赋新04-04
清明祭祖,链接祖先 承接力量感与价值感04-04 SHINE
如何在环境监测的背景下,全面掌握三维荧光光谱?【4月16日 | 在线讲座】04-03 HORIBA
尽显仪器人才未来风采—— 厦大学子HORIBA学习实践圆满结束!04-03 HORIBA
【设备更新仪器推荐】 显微光谱测量系统 ——SMS04-03 HORIBA
新品发布丨LH-F112化学需氧量(COD)智能回流消解仪,智能高效!04-03
新品发布丨清淼系列LH-T6VFA挥发性脂肪酸测定仪,无需蒸馏快速出值!04-03
新品发布丨LH-BOD606生物化学需氧量(BOD5)测定仪,开启四屏互联时代!04-03
新品发布丨LH-S600红外测油仪,主机一体化设计,开机即用!04-03
新品发布丨新羽系列LH-C700便携式多参数水质测定仪,全能选手!04-03
新品发布丨清澜系列LH-P3VFA便携式挥发性脂肪酸测定仪,快速灵活!04-03
健康科普|安杰科技带您揭开“碘”的神秘面纱——碘元素检测的重要性及日常应用04-03
海能技术2024年渠道商交流会——郑州站04-03
可视化风味分析工具——气相离子迁移谱联用仪(GC-IMS)04-03
3000份DNA科学礼包免费领!“生命科学进校园”2024年科普公益项目启航04-03 小因
NovaSeq™ X系列助力食品可持续性研究04-03
踏上创新解决方案的世界之旅!04-03 aladdin
4月13-16日,法国CODRA & 宏集将参与香港InnoEX国际创科展,诚邀您的莅临!04-03 宏集科技