生物育种智库第四期 | Rice3K56 SNP芯片是水稻基因组遗传研究和育种的高效工具

2024-01-11 16:22:59, 赛默飞基因科学 赛默飞世尔科技生命科学产品





研究亮点



单核苷酸多态性(SNP)基因分型芯片是动植物遗传研究和分子育种的理想的高通量平台。在本项由安徽农业大学农学院、中国农业科学院作物科学研究所、三亚中国农业科学院国家南繁研究院、华智生物技术有限公司的研究人员开展的工作中,利用来自全球89个国家地区的3024份水稻材料的重测序数据,基于Axiom基因芯片技术开发了高质量的包含56,606个标记的定制化Rice3K56 SNP芯片,并在192份代表性水稻样本中进行了广泛测试。与之前开发的水稻SNP芯片相比,Rice3K56芯片具有高基因分型可靠性(99.6%),高且均匀的基因组覆盖率(相邻SNP之间平均距离6.7 kb),丰富的多态性信息和易于自动化的特点。在水稻品种区分、群体多样性分析、通过全基因组关联分析(GWAS)对13个复杂性状进行基因定位以及重组自交系和多亲本高级世代互交群体的基因组选择中,Rice 3K56芯片的优异性能得到了很好的验证。由于其强大的功能和巨大的应用潜力,它将成为水稻遗传研究和基因组育种的高效工具。





研究背景



开发一个低成本、高通量、高灵活性和高效率的基因分型平台,对于加快植物功能基因组研究进展与育种应用的整合至关重要。


作为一种重要的基因分型技术,SNP芯片(阵列)平台比NGS更具成本效益,并能提供稳定的数据分析流程。迄今为止,SNP芯片已越来越多地用于植物和动物育种中的全基因组关联研究(GWAS)、数量性状位点(QTL)鉴定、遗传多样性测定、基因组选择(GS)、基因挖掘、混合群体分离分析(BSA)和标记辅助选择(MAS)。


水稻因其较小的基因组大小、极其丰富的遗传变异以及高质量的基因组测序数据而被作为作物功能基因组研究的模式物种。目前已有一系列具有不同标记数目和基因组覆盖率的水稻SNP芯片,这些芯片是利用不同的技术设计和开发的。然而,由于各种限制,如标记密度不足、基因组覆盖率不足、应用稳定性低等,这些芯片都没有得到广泛应用。为了克服这些问题,需要开发一款高密度的SNP芯片,以覆盖足够的基因组变异,并以合理的成本确保特定和广泛的应用。新的Rice 3K56 SNP芯片包含>56K个标记位点,具有更好的基因组覆盖率。通过对水稻多亲本遗传群体的品种区分、多样性分析、遗传作图和基因组选择,验证了该芯片的优势和效率。


研究方法

植物材料

本研究共选用了192份具有代表性的水稻材料,收集自33个国家和地区。

SNP挖掘与过滤

通过与粳稻Nipponbare(NipRef)和籼稻9311参考基因组的比对,从3KRGP(3024份水稻材料)的NGS测序数据中挖掘了>18.9 M个高质量的SNP(比对质量>20,深度>2,MAF>0.001)和InDel位点。从中过滤出约2.5 M个多态性SNP位点用于基因芯片设计。

SNP挑选和验证

为了确保开发的芯片能够满足水稻基因分型的多种应用需求,选定了赛默飞Axiom基因芯片平台进行芯片的开发,因为它提供了简单的基因分型流程,具有极高的精度和重复性,并可以覆盖从相近个体的准确区分到复杂的全基因组分析的多种分辨率和应用场景。


将初步筛选出的2.5 M个多态性SNP位点分别设计到4张Axiom筛选芯片上。为了测试这2.5 M个候选SNP位点的质量,使用这4张Axiom筛选芯片对192份代表性水稻材料进行基因分型,然后根据Axiom平台的标准对基因分型结果进行评估,从而挑选出高质量的SNP位点。


图1. Rice3K56 SNP芯片的开发及192份样品的遗传多样性分析。(A)单核苷酸多态性(SNP)位点的挖掘、过滤和挑选流程方案,用于Rice3K56基因芯片的开发。简单地说,从3024份材料的重测序数据中确定了初始位点。然后,利用日本晴(粳稻)和9311(籼稻)的参考基因组挖掘了独特的多态性位点。共挖掘出约2.5 M个多态性SNP位点设计了4张筛选芯片,并以192份代表性水稻材料作为测试样本。最终挑选出56,606个高质量SNP位点设计成Rice3K56芯片。(B)Rice3K56芯片的多态性信息量(PIC)。(C)SNP位点在整个水稻基因组中的分布,SNP位点包括了来自日本晴和9311参考基因组的位点,每一行代表一条染色体,单个染色体的每个竖条表示每1Mb间隔内的SNP位点,右下角的不同颜色表示SNP位点的密度。(D)基于所有SNP位点构建的NJ树。(E)基于主成分分析(PCA)的192份测试材料的群体结构,其中PC1和PC2分别表示第一和第二主成分。


研究结果



Rice3K56芯片的特点

Rice3K56芯片共包含56,606个高质量SNP位点(图1A)。多态性信息量(PIC)在0.1-0.2的SNP位点占10.4%,0.2-0.3的占25.4%,0.3-0.4的占31.0%,0.4 - 0.5的占27.9%(图1B)。总的来说,该芯片在水稻基因组中的基因覆盖率高,SNP位点均匀分布在全部12条染色体上,不同染色体上的SNP位点数目范围为3400个SNP位点(10号染色体)到7158个SNP位点(1号染色体)之间,其中79.9%的SNP位点在整个基因组中间隔10 kb均匀分布(图1C)。Rice3K56芯片中相邻SNP位点之间的平均距离为6.7 kb,中位数为5.3 kb,只有0.13%的SNP间隔大于100 kb。不同染色体上的SNP位点数目与染色体长度呈正相关(r = 0.96,P < 0.001)。在功能上,Rice3K56芯片分别有8916和3222个SNP位点位于注释基因区域的3’UTR和5’UTR,5230个SNP位点位于基因内含子区域,10,364个SNP位点位于基因间隔区,6381个SNP位点位于基因上游2kb区域,940个SNP位点位于56个重要性状基因的上游2kb、下游2kb或基因编码区域。


Rice3K56芯片在品种鉴定中的应用

为确定Rice3K56芯片在水稻品种鉴定中的有效性,利用Rice3K56芯片对一系列亲缘关系较近的商品化粳稻品种(龙粳31、龙粳39、龙粳44、龙盾104、龙庆稻3号、龙生03011、龙花08752和龙糯98-325)进行基因分型。基因分型结果表明,Rice3K56芯片对水稻品种(包括近缘水稻品种)的鉴别非常有效。


采用Rice3K56芯片通过全基因组关联分析(GWAS)进行基因/QTL定位

为了检验Rice3K56芯片通过全基因组关联分析(GWAS)进行基因/QTL定位的有效性,研究中从192份水稻材料中选取了84份材料,初步鉴定出了影响13个重要农艺性状的基因/QTL,因为预测GWAS在小群体中定位QTL的有效性较低。共鉴定出影响13个相关性状的108个位点,分布在全部12条染色体上。这些结果清楚地表明,Rice3K56芯片是一个能够有效用于全基因组关联分析(GWAS)的工具。

图2. Rice3K56芯片在全基因组关联研究(GWAS)中的应用


Rice3K56芯片在基因组选择(GS)中的应用

研究中采用9种预测模型对多亲本高代互交系(MAGIC)群体DCI、DC2和8-way中株高(PH)和抽穗期(HD)两个高遗传力性状的后代性能进行了预测。9种预测模型分别为贝叶斯A、贝叶斯套索算法(BL)、贝叶斯岭回归(BRR)、EGBLUP、弹性网络回归算法(EN)、基因组最佳线性无偏预测(GBLUP)、套索回归(LASSO)、再生核希尔伯特空间(RKHS)和岭回归(RR)。总的来说,结果证明了Rice3K56芯片在基因组选择(GS)中的有效性,尽管不同模型在GS中对不同目标性状的预测精度存在差异的原因仍有待阐明。

图3. Rice3K56芯片在基因组选择中的应用



讨论

目前,DNA标记在动植物育种中的应用越来越广泛。SNP作为最丰富的分子标记,被广泛用于遗传研究和育种。与传统分子标记相比,包含大量SNP位点的高密度SNP芯片为大量样品的高通量基因分型提供了理想的高通量平台,在复杂性状的遗传解析、群体结构分析、分子标记辅助选择(MAS)和基因组选择(GS)育种计划中具有广泛的应用。此外,DNA测序技术正在迅速发展,成本也在下降。与NGS和GBS技术相比,SNP芯片的优势主要在于其用户友好性,在SNP检测时无需进行复杂的生物信息学分析,并且在整合多个基因分型实验数据时具有极高的简便性和一致性。


与以往基于少量样本测序而开发的其它水稻SNP芯片相比,Rice3K56芯片是基于3024份水稻材料的大量样本的重测序数据开发的,因此具有以下优势:首先,它具有高的基因分型可靠性(99.6%)、密度、基因组覆盖率和均匀性。其次,Rice3K56芯片遗传稳定性高,重复性好,易于自动化;因此,可以很方便地对多个基因分型实验的相同数据进行联合分析和比较。第三,由于它是基于最大的重测序数据集开发的,因此具有很高的稳定性和区分能力,适用范围广泛。第四,高通量,单个数据点成本低。最后,由于包含了2300多个水稻基因中的2-3个SNP位点,以及56个水稻重要农艺性状基因区域中的940个SNP位点,具有较高的多态性信息量(PIC),在水稻育种、基因/QTL定位和功能分析中具有很高的应用价值。例如,使用Rice3K56芯片进行SNP基因分型将提供平均56,379个有效数据点,或是说假设每份水稻材料的基因数量在40,000 - 45,000之间,那么提供的是每个基因约1.3个SNP位点的信息。


上述优势在我们的应用中得到了清晰的证明,特别是通过全基因组关联分析(GWAS)在84份小样本量的水稻材料中鉴定出与13个性状相关的108个高度显著的SNP位点,其中15个SNP位点被定位到包含11个克隆基因的相同或重叠的基因区域。这证明了Rice3K56芯片在基因/QTL鉴定中的有效性。综上所述,本项研究中开发的高密度Rice3K56芯片有望在各种水稻遗传研究和育种项目中得到越来越多的应用,包括作图群体的连锁图谱构建、QTL分析、不育系的区分、基因组选择(GS)和种质资源鉴定。






结论

本项研究中,基于先前的3024份水稻材料的重测序数据开发了一个高通量的Rice3K56 SNP芯片。该水稻SNP芯片包含56,606个SNP位点,这些SNP位点均匀分布在水稻全基因组中。大约80%的SNP位点在水稻基因组中间隔10 kb均匀分布,相邻SNP位点之间的平均距离为6.7 kb。该芯片还包含了2300多个水稻基因中的2-3个SNP位点以及56个水稻重要农艺性状基因区域中的940个SNP位点。通过对192份水稻材料的测试,证明了Rice3K56 SNP芯片是一个高效的基因分型平台,在水稻群体结构分析、商业化品种鉴定、全基因组关联分析(GWAS)和基因组选择(GS)等方面具有良好的应用前景。

参考文献

C.P. Zhang, M. Li, L.P. Liang, J. Xiang, F. Zhang, C.Y. Zhang, Y.Z. Li, J. Liang, T.Q. Zheng, F.L. Zhang, H. Li, B.Y. Fu, Y.Y. Shi, J.L. Xu, B.C. Tian, Z.K. Li, W.S. Wang, Rice3K56 is a high-quality SNP array for genome-based genetic studies and breeding in rice (Oryza sativa L.), The Crop Journal 11 (2023) 800–807

拓展阅读

生物育种智库第三期 | 小麦660K与55K SNP芯片在基础与应用研究领域的应用

生物育种智库第二期|全球用量最大的玉米基因芯片之一 :Maize6H-60K

世界人口日 | 生物育种智库系列第一期:ŸNSECT 发布首个应用于昆虫育种的高密度基因分型芯片




  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved