在药物研发中,基因编辑+AI=?

2023-01-28 10:01:39, 上海汇像 上海汇像信息技术有限公司



这是一个正在逐步打开的领域,尚有许多空白。本文仅作引子,余下靠大家去书写!


新冠突袭的2020年初,比尔·盖茨在AAAS(美国科学促进年会)上提出,“未来,人工智能基因编辑技术会以指数级的速度发展,我们将有机会构建新一代的健康解决方案。”



巧合的是,这两大技术均于2012年左右爆发,几年之内席卷世界,并将持续产生重要影响。目前,AI被广泛运用于很多生活场景,无人驾驶、人脸识别、各类网站和app的个性化推荐、医学图像处理等。


图1:基因编辑+AI


基因编辑,正推动着生命医学研究的革命性发展。药物研发是人类备受掣肘的行业,我们不禁畅想,假如基因编辑+AI,会产生什么样的效应?



“上帝之手”基因编辑


2012年到2013年,四篇关于 CRISPR/Cas 9系统的论文先后发表,特别是张锋等改进技术,系统操作简洁高效,  成本低廉,开启了CRISPR/Cas 9系统在真核生物(哺乳动物)细胞中广泛运用的先河。


图2:张锋经典论文—CRISPR/Cas9应用于哺乳动物


如果说生物的全基因序列是一本写满“生命密码”的天书,基因测序技术的快速成熟和普及,让科学家获得了阅读天书的权限。那么,基因编辑技术,则赐予了他们一支“修改、调整”基因序列的笔


图3:基因魔剪与上帝之手


在CRISPR/Cas9编辑系统中,sgRNA  (small guide RNA,向导RNA),如体内的GPS导航,识别基因“出错”的位置。Cas9是一种核酸内切酶,会抵达“事发地”剪掉错误的基因片段,因此CRISPR/Cas9常被业内称为“魔剪”和“上帝之手”。


图4:CRISPR/Cas9基因编辑系统技术原理图


CRISPR/Cas9基因编辑系统,是细菌和古细菌中一种为抵御病毒和质粒的不断攻击演化而来的获得性免疫防御机制当Cas9对靶标DNA进行切割时, DNA双链断裂 (double strand break, DSB), 细胞启动DNA修复机制:


  • 非同源末端连接:基因敲除;

  • 同源重组:基因插入


基因编辑系统最大的特点是具有可编程性。只要有一个向导RNA,就能与特定的DNA序列结合来行使后续功能:启动、关闭某个基因,或介导外源基因的插入

例如,有研究者曾将来自深海鱼类的防冻基因插入到草莓基因组中,成功培植出防寒草莓。



基因编辑在药物研发中的作用


图5:CRISPR/Cas9辅助药物研发


1

功能基因的筛选和高通量化合物筛选


基于CRISPR技术的高通量筛选系统,可用于大规模地敲除、抑制或插入、激活大量候选基因。


  •  找到潜在的药物作用靶点

  •  加速靶点验证进程

  • 寻找潜在的治疗候选药物

    上期我们已讨论过分子水平的高通量筛选AI制药超级实验室|高通量筛选技术,这里指细胞水平上基于基因编辑技术的筛选方法


图6:CRISPR-Cas在构建细胞模型和大规模筛选中的应用


2

先导化合物验证


构建细胞系模型和动物模型,评估先导化合物有效性和安全性,大大加快了先导化合物验证的进程。


图7:CRISPR-Cas在体内筛选和动物模型构建中的应用



基因编辑的技术缺陷


基因编辑因脱靶效应、体外编辑工具的递送难等缺陷,在应用上一直受限。最有安全隐患的是不可预测性,当编辑其中一个基因,很难预测它会如何影响其他基因的表达


比如CCR5 基因缺失的个体,对艾滋病病毒是免疫的。但敲除CCR5 基因之后,个体感染西尼罗病毒 (West Nile V irus, WNV) 的风险明显比正常人高很多。假如所有人CCR5 基因敲除,那么当这个病毒流感爆发时,事态将一发不可收拾。


要解决这个问题,“AI可以帮助我们拿到更多生物学的数据,不仅是基因序列,还包括它们直接的互相作用,因此能帮助我们预测编辑一个基因后,其他的基因水平将会如何变化。“        

                                                                                                      ——张锋



药物研发中,基因编辑+AI,有待挖掘


根据《人工智能:现代方法》中的讨论,人工智能有七种分类,分别是推理和问题解决、知识表示、规划和社会智能、感知、机器学习ML,分为三个重要子集:监督学习、无监督学习和深度学习(DL))、机器人:运动和操纵和自然语言处理。DL是ML的子集,ML是AI的子集,进化的顺序是AI>ML>DL。


图8:人工智能的分类


AlphaFold2 能成功地从蛋白质序列中预测蛋白质的 3D 结构,这个消息给AI在基因组工程领域的应用带来了希望。在药物研发中,我国基因编辑与AI的结合这块起步较晚,目前大部分能够实现的是机器人的运动和操纵部分、智能超算


机器人的运动和操纵



01


代表

  • 实验自动系统—汇像的高通量细胞株筛选自动化系统、NGS二代测序自动化系统

    将高通量的重复性工作交给机器臂处理,快速完成细胞株的筛选和测序,确保高通量筛选结果的准确、可重复性,实时追踪记录实验过程及数据,为药物研发打下扎实的基础


图9:高通量细胞株筛选自动化系统

  • 递送难—Millirobot


    斯坦福团队的最新研究,磁驱动的无线毫米级折纸微型机器人,可进入体内各种复杂狭小的空间,完成药物的精准递送,有望成为生物医学领域的救星,也许能将体外编辑工具递送到目标位置


智能超算平台



02


代表

  • 汇像超级实验室

    有AI超算平台,确保自动化操作系统产生的“海量实验过程数据”安全智能高效管理;

    提供海量数据存储、实时数据分析和决策、数据AI算法开发、智能化的数据解决方案;

    可实现算力、存储、数据和应用等计算资源的充分共享和高效调度,让超算更智能化地满足实验室要求


机器学习



03


自2014年以来,机器学习已逐步应用于优化设计sgRNA(高效的序列、预测活性)、预测脱靶位点等,可提高基因编辑效率与特异性,降低脱靶效应。


代表

  • Driver ML

    指出与癌症相关的驱动基因


深度学习



04


与ML相比,深度学习(deep learning)可以避免耗时费力的特征提取过程,预测性能更优,是趋势。但未来的挑战在于理解这些模型。目前技术比较成熟的当属国外的SYNTHEGO公司。

预测编辑结果的代表

  • OPTI-CGBEs

    能够准确预测具有特定序列上下文的目标位点的编辑结果,提高了基因编辑效率,降低了脱靶效应。

  • DeepCpf1

    预测CRISPR/Cpf1系统sgRNA的编辑活性,比传统机器学习方法(如L1/L2正则线性回归、梯度上升回归树)性能更优



小结


无论基因编辑,还是AI,都是一种工具,未来的药物研发方向就是改造工具,发挥工具联合使用的最大效益,缩短药物研发时间,降低药物成本,让更多疾病有药可医。


参考资料:

1.Lin, D. Y. (2021). High Throughput Screening for Active Small Molecules Affecting Protein Expression by Luciferase Reporter System. // High-throughput Screening Protocol eBook. Bio-101: e1010865. DOI: 10.21769/BioProtoc.1010865

2.https://zhuanlan.zhihu.com/p/349875798

3.https://mp.weixin.qq.com/s/2459t9HhqJQQIzXgTmVfLw

4.https://zhuanlan.zhihu.com/p/399148158

5.http://www.chinagene.cn/article/2018/0253-9772/0253-9772-40-9-704.shtml

6.https://new.qq.com/omn/20211009/20211009A05DJ700.html

7.https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5459481/#

......



  1.    关于汇像


  2. 上海汇像始终坚持将AI和生命科学及高通量实验相结合,致力于为生物化学、医疗医药及安全检验检测,提供从分子到细胞的全流程自动化·智能化综合解决方案,产品范围涵盖从食品安全、药品安全到生命科学领域的智能机器人工作站系统、全流程检验检测实验室自动化、智能化整合系统以及配套自动化·智能化仪器设备及相关耗材等。
    我们立志成为全球领先的生命健康自动化·智能化解决方案提供商,立志让世界每一个人都享受健康安全品质的生活,立志为业界提供优质的技术、产品与服务。




  3. 专业实验室自动化·智能化系统提供商

    -----------------------------------





  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2023 ANTPEDIA, All Rights Reserved