2022-07-15 08:31:21, 星标关注 上海欧易生物医学科技有限公司
Cell Ranger 软件是 10X genomics 官方提供的配套分析软件,相信使用过 10X genomics 平台进行单细胞转录组测序数据分析的老师们对它一定不陌生,但该软件在进行比对定量时究竟遵循什么样的原则?它是如何识别高质量细胞的?产生的结果各部分如何解读?在这里,我们将使用三篇文章的时间,为大家一一解惑~
Cell Ranger 是什么?
Cell Ranger 是 10X genomics 官方提供的一套针对单细胞 RNA 测序输出结果进行比对、定量、聚类及基因表达分析的分析流程,它包含有与单细胞基因表达分析相关的四个pipelines,分别是:
cellranger mkfastq 流程:其功能为将 Illumina 测序仪产生的 raw base call (BCL) 文件解析成 FASTQ 文件。
cellranger count 流程:其功能为将 cellranger mkfastq 产生的或其他来源的 FASTQ 文件进行比对、过滤、barcode 计数以及 UMI 计数,并可以生成 feature-barcode 定量矩阵,随后确定细胞群并进行基因表达分析。
cellranger aggr 流程:其功能为将多个 cellranger count 产生的数据进行整合、标准化,并可以对整合后的数据进行分析。
cellranger reanalyze 流程:其功能为使用 cellranger count 或 cellranger aggr 产生的表达矩阵重新进行降维、聚类等后续分析。
以上四个pipeline 均将转录组常用比对软件 STAR 封装其中,可以输出带有细胞信息的 BAM、MEX、CSV、HDF5 及 HTML 等格式的结果。
下面,我们着重介绍其进行基因比对的理论模型。
Reads 的修剪
针对 3’ 建库数据的基因表达比对,在比对之前会先对 reads 进行修剪。
cDNA 的全长结构中,在 3’ 和 5’ 端分别带有 poly-A 尾和TSO 序列结构(相对于比较长的 RNA 分子,一部分来自短 RNA 分子的 reads 可能仅包含 TSO 和 poly-A 序列的其中一种)。由于这种低复杂度的非模板序列的存在有可能混淆 reads 的映射,所以在比对之前一般会将 poly-A 尾和 TSO 序列分别从 reads 的 3’ 端和 5’ 端切除,这一步骤有助于提高分析的灵敏度和软件分析的效率。
如何判断 reads 比对到了基因组?
Cell Ranger 中封装了比对软件 STAR,根据转录本的注释文件 GTF 中的注释信息,使用 STAR 来判断reads 是比对到了外显子、内含子还是基因间区上,或者说来判断 reads 是否比对到了基因组上。
当一条 read 至少要有 50% 碱基序列与基因组上的外显子碱基互补配对,认为其比对到了外显子上;若 reads 未比对上外显子但与内含子相交,则认为其比对到了内含子上;否则为比对到了基因间区。若 reads 比对到了一个单一的外显子位点,但同时比对到了一个或多个非外显子位点,则优先认为该 read 比对到了外显子位点,MAPQ 为 255。
如何判断 reads 比对到了转录本?
Cell Ranger 通过检测 reads 比对上的外显子和内含子与转录本的相容性,进一步将 reads 与注释的转录本对齐。如下图所示,reads 根据它们是正义还是反义,以及它们是外显子还是内含子,或者它们的剪接模式是否与该基因相关的转录本注释兼容来分类。
上图中,绿色展示的是基因及基因中所包含的外显子,Transcript 1 和 Transcript 2 为基因经过可变剪切形成的两种转录本所包含的外显子。针对比对到正义链上的reads,如果 reads 比对到了一个外显子上或者比对到两个相邻的外显子上,则该 read 被分类为转录本 read(蓝色);如果 reads 比对到两个不相邻的外显子上,则该 read 被分类为外显子 read(浅蓝色);如果 reads 比对到内含子区域,则该 read 被分类为内含子 read(红色);紫色表示 reads 比对到反义链上。
小知识(敲黑板)
在默认情况下,只有蓝色的转录本 read 会被计入到 UMI 计数中。但在某些情况下,如在实验时输入的为细胞核时,未剪接的转录本有可能产生高水平的内含子序列,为了将这些内含子 read 计入,cellranger count 可以添加一个参数为 include-introns。当使用该参数时,任何比对到单个基因的 reads ---- 包括转录本 read(蓝色)、外显子 read(浅蓝色)和内含子 read(红色)都会计入 UMI 计数中。
此外,只有在基因组上有唯一比对位点的 reads 才被计入到UMI计数中。
如何进行 UMI 计数?
1. 在计算 UMIs 之前,Cell Ranger 会试图矫正 UMI 序列中的测序错误。
在转录本上有唯一比对位点的 reads 根据他们的barcode、UMI 和比对到的基因被分成不同的组。如果两个组的 reads 拥有相同的 barcode 序列并比对到同一个基因上,但是 UMI 序列中有一个碱基不同,那么其中一个 UMI 有可能是因为测序中的碱基替换错误而引入的。在这种情况下,UMI 的reads 数量少的那一组会被更正为 UMI 的reads数量多的那组。
2. 矫正可能的测序错误后进行 UMI 计数。
Cell Ranger 会再次按照 UMI(可能是修正后的)、barcode 和比对到的基因对 reads 进行分组。如果两组或者多组的 reads 拥有相同的 barcods 和 UMI 序列,但是比对到了不同的基因上,那么 reads 计数最高的那组比对到的基因会被进行 UMI 计数,其他的组则被舍弃掉。如果 reads 最高计数相同,则全部的组都被舍弃掉。
经过这两步过滤步骤后,每一个被统计到的barcode、UMI 和 基因都会被保存在未过滤的 feature-barcode 矩阵中,输出在 unfiltered feature-barcode matrix 文件夹中。
好啦,以上就是本篇的全部内容,在下篇文章中我们会重点介绍 Cell Ranger 如何判断识别高质量细胞,欲知后事如何,且听下回分解~
欧易生物 | oebiotech
www.oebiotech.com/cn
☏ 400-808-5350 /021-34781616
!
扫码联系客服 · 了解更多
更多精彩内容“阅读原文”
右边给我一朵小花花
04-24 汉尧
四方光电荣膺工信部“制造业单项冠军企业”04-24 四方光电
文末惊喜丨你的合成反应“翻过车”吗?这些痛点,中了几个?04-24 奥豪斯
传奇续写:奥豪斯旗下涡旋振荡器Vortex-Genie 2焕新登场04-24 奥豪斯
采用先进防静电技术,最大限度减少干扰04-24 奥豪斯
询价有礼 | 奥豪斯电化学产品解决方案04-24 奥豪斯
官宣!5月16日,第五届量子科仪节暨量子精密测量产业应用峰会与您相约合肥!04-23 CIQTEK
Angew速递:台式easyXAFS原位解析高效析氧反应的定向非晶到非晶重构04-23 Dr. Dai
安捷伦与西北农林科技大学共建“旱区农产品感官科学联合实验室”04-23
五一水机关不关?测测你是水机“杀手”还是“达人”04-23 默克MilliQ纯水
Adv Sci(IF 14.1) | 上海交通大学王慧/李晓光/李辰团队通过时空蛋白质组学图谱揭示食管鳞状细胞癌早期进展的预警信号04-23
在山野间畅快呼吸,于同心处共启新程04-23 毕克气体
MSTD系列显微镜专用电动滑台:显微镜下图像分毫必现04-23 光电行业都会关注
分光光度计怎么用?一步步教你正确操作与数据读取方法04-23 管理员
分光光度计的工作原理详解:从朗伯-比尔定律到现代检测技术04-23 管理员
2026国产化电镜技术前沿与产学研用协同发展论坛顺利召开!04-22 CIQTEK
2026 磁共振技术应用与创新学术交流会圆满落幕!聚焦磁共振前沿,共探国产仪器创新之路04-22 CIQTEK
展会回顾|“融两业共生之力 筑湾区超级枢纽”2026大湾区创新生态大会04-22 谱临晟
安捷伦的地球日|以科学之力,将可持续落实到每一天04-22 安捷伦
荧飒光学践行企业社会责任,赋能光电人才高质量培养04-22 荧飒光学



