【基因组学 | 新产品】分子条形码,低频变异的绝杀

2018-11-10 12:11:29, 安捷伦 DGG 团队 安捷伦科技(中国)有限公司


二代测序为精准的肿瘤遗传背景分析提供了强大的技术支撑,然而肿瘤的异质性却限制了对驱动突变,特别是低频驱动突变的检测。与此同时,大量肿瘤样本以 FFPE(福尔马林浸泡石蜡包埋)的形式保存,样本降解程度不同,质量参差,加大了二代测序的难度。新兴的液态活检技术为肿瘤的早期诊断开启了一扇大门,然而样本的低浓度以及高度的片段化为该项技术的应用设置了重重障碍。此局该如何破解?分子条形码技术可为它山之石。


随着高通量测序技术的应用越来越普遍,测序成本不断降低,测序深度也越来越深。相对于之前的全覆盖、低深度的测序来讲,目前越来越多的科学家将目光转移到高深度的目标区域捕获测序战略中来。极高的目标区域测序覆盖深度对于发现低频突变(尤其在肿瘤研究与应用)至关重要 [1]。虽然通过高深度测序的策略使得检测肿瘤异质性的低频突变变为可能,但是 PCR 及测序过程中的系统错误使得这一策略的使用大大受限。因为文库构建、目标区域捕获过程中都涉及到 DNA 聚合酶和扩增步骤,DNA 聚合酶和扩增会引入一些原始样本基因组上原本不存在的错误以及扩增的偏好性 [1]。而测序环节,以最常见的 illumina 测序来讲,取决于不同的测序读长,base calling 算法以及检测的突变类型,它的测序错误率会在 ~1%-0.05% [2]。这些系统错误,使得人们利用高深度测序检测低频突变的过程难以区分到底是真实的样本突变还是由于这些系统错误所造成的假阳性。分子条形码的引入可以提高这些低频突变检测的可信度,尤其是当突变频率低到与这些系统错误率相当的时候。


那么,什么是分子条形码呢?分子条形码又称分子标签(MolecularBarcode, 有时也称UID Unique identifiers, UMI Unique molecularidentifiers)是对原始样本基因组打断后的每一个片段都加上一段特有的标签序列,用于区分同一样本中成千上万的不同的片段,在后续的数据分析中可以通过这些标签序列来排除由于 DNA 聚合酶和扩增以及测序过程中所引入的错误。分子条形码通常由大约 10nt 左右的随机序列(比如 NNNNNNN),或者简并碱基(NNNRNYN)组成。有别于样品标签(sample index 或 sample barcode),分子条形码是针对同一个样本中的不同片段加上的标签序列,而样品标签是用于区分不同样本而加上的标签序列。因此,每一个样本只能有一个相同的样品标签,但可以有成千上万的分子条形码。


分子条形码作用的原理如图 1,同一个样本的 DNA 片段,每一个片段都带有一个特有的标签序列,它会随目标序列一起经过文库构建、PCR 扩增,然后被一同测序。最终测序得到的序列中,带有不同标签的序列,代表它们来自不同的原始 DNA 片段分子;带有相同分子标签的序列,代表这些序列都是从同一条原始的 DNA 片段扩增而来的。由于 PCR 和测序过程中的错误是随机发生的,因此根据这些分子标签,可以在去除冗余的过程中将PCR和测序等过程中带来的系统突变排除掉。 Peng et al. [1] 比较了利用分子条形码和不用分子条形码进行数据分析的结果,他们发现通过利用分子条形码这种方法,可以大大降低低频突变的假阳性率。


图 1. 分子条形码的工作原理。



安捷伦一直是目标区域捕获测序行业的佼佼者,其 SureSelect 捕获技术以其固有的技术优势和良好的实验数据一直受到业内人士的好评。针对于分子条形码在低频突变检测的应用优势,安捷伦在 SureSelect 上开发了对应的产品 SureSelet XT HS (HS 是 High Sensitivity 的缩写)。在没有分子条形码技术之前,受制于常规技术的局限,二代测序的用户通常将变异检测域值设置为 3-5% 的等位基因频率,而 SureSelect XT HS 大大提高了变异检出的灵敏度,可以检测突变频率 <1% 的稀有变异(图 2);同时有效去除 PCR 和测序过程等引入的系统突变(图 3)。


图 2.等位基因频率低至 1%时的检测结果。SureSelectXT HS 生成的文库在测序深度 3000X 时,即使在 VAF 频率低至 1% 时观测值和频率预计值之间也具有高度关联性(HD200 定量多重参考标样和 ClearSeq 综合癌症基因组合)


图 3. 利用安捷伦的分子条形码建库方案,有效的去除 PCR 和测序过程中引入的突变。SureSelect XT HS 对 Horizon cfDNA 参照以及定制的一个 164kb SureSelect panel 进行靶向测序,在去冗余后获得 808(常规建库方案)/906(分子条形码建库方案)的中值。在变异等位基因频率低于 2% 的情况下,常规方案检测到了 216 个非参考等位基因变异,而使用分子条形码的方案仅检测到 18 个。表明分子条形码的建库方案去除了 92% 的错误数据。Courtesy of Dr. L.J. Barber and Dr. M.Gerlinger, Centre for Evolution and Cancer, The Institute of Cancer Research,London, UK。


SureSelect XT HS 能够为广泛种类的样本构建高复杂度的文库,包括 FFPE 样本和 ctDNA,样本起始量可低至 10 ng。SureSelect XT HS 针对 FFPE 样本进行了优化,对 FFPE 的质量有很好的宽容度(图 4)。


图 4.上:SureSelect XT HS针对 FFPE 的优化的表现,对于不同降解程度的样本,大部分的碱基都能够达到 20×的覆盖。下:在 100× 覆盖度下,SureSelect XT HS 优于其它文库制备方案,特别是随着样本质量下降时优势更加明显。


SureSelect XT HS 采用快速杂交的方法,杂交时间低至 90 分钟,整个文库构建周期为 8 小时,同时支持高达 32 重混合文库的深度多重测序(图 5)。


图 5. SureSelect XT HS 文库制备工作


SureSelect XT HS 现已上市,同期推出的还有 SureSelect XT Low Input 建库试剂盒,支持 10 ng 低样本起始量、针对 FFPE 优化,90 分钟快速杂交和 192 个样品标签。更多信息请登陆安捷伦基因组学官网 www.genomics.agilent.com。


参考文献:

  1. Penget al. Reducing amplification artifacts in high multiplex amplicon sequencingby using molecular barcodes. BMC Genomics. 2015 Aug 7;16:589.

  2. Kinde et al. Detection and quantification ofrare mutations with massively parallel sequencing. Proc Natl Acad Sci U S A.2011 Jun 7;108(23):9530-5.

  3. AgilentNote:5991-7421 Molecular Barcodes - FAQ Detect low allele frequency variantswith HaloPlexHS 


推荐阅读:



本文使用权归安捷伦科技(中国)有限公司所有,未经授权请勿转载至其他公众号,如需转载,请与工作人员联系,并注明出处。


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved