总裁回顾:2023是AI之年么?

2023-12-13 18:10:38, Daria Thorp Advanced Chemistry Development, Inc. (ACD/Labs)


总裁回顾:2023是AI之年么?

Daria Thorp, CEO ACD/Labs

今年将因全球经济和地缘政治方面的许多复杂和具有挑战性的情况而被铭记。我和许多人一样,希望这些地区能够迅速和成功地稳定下来。

相比之下,过去一年里一些AI上取得的成就,例如ChatGPT让科技爱好者非常愉悦。当一项新兴技术发展到人们的第一印象是“哇,这太神奇了!”时,每个人都开始寻找进一步的工业应用前景。对我来说,生成式人工智能(AI)和机器学习(ML)在药物发现和开发中的应用已经成为2023年几个“有趣”的话题之一!

是的,我有一个OpenAI账户,我能告诉你什么你不知道的吗?今天的生成式AI非常适合写作,但化学专家却觉得没那么好; 考虑到它的预期范围和目的,这并不奇怪。人们正在努力增强具有化学意识的大型语言模型,特别是在文献/专利领域。然而,人工智能技术不仅仅是基于自然语言的应用程序。ACD/Labs正在密切关注的行业领域中的AI/ML进展是什么?

早期药物发现在预测建模方面最有希望,计算机算法已经为科学家服务了几十年。传统上ACD/Labs在该领域闻名,并已将我们的核磁预测模型集成到客户的机器学习工作中超过25年。然而,最近将AI/ML框架和新的建模功能集成到药物发现过程中的努力令人印象深刻。最新的技术可以管理、安排和分类大量的数据,这超出了人类的能力。与此同时,它可以通过各种学习算法在更小的训练集上工作,这是经典统计分析永远无法做到的。甚至FDA也在2023年发布了一份关于AI/ML的讨论文件(1)。我们都密切关注着一些行业领导者将他们的候选药物通过临床试验所取得的进展。

毫无疑问,学习技术和讨论生成式人工智能的可能性是2023年的亮点。我怀疑这个话题的流行是由我们所有人有意或无意地推动的。在看过ChatGPT之后,我们的心都跳了一下,我们可能会期待一个奇迹。当它起作用时,确实看起来像一个奇迹!但与任何技术一样,它也有局限性,需要将知识放入算法中才能使模型工作。当我准备好希望和等待未来获得要求实际的、切实的、有用的成就。

在今天的药物发现中,有许多常见的应用。它们都或大或小的依赖于实验数据。要注意的是数据不是中立的,它有偏见。这绝对是一个比这个博客所能容纳的更广泛的话题,但如果你考虑一下:定义谁,何时,以及如何收集你的数据;它的质量、模式、异质性、来源和纳入标准都可能影响结果。负面数据也有价值——失败的实验数据,很少作为常规操作的一部分保留下来。最近我很喜欢看同事在《美国医药评论》(2)上发表的一篇关于数据的文章,总结了我们的一些经验。数据工程对AI/ML的成功至关重要,但没有得到足够的讨论和描述。

除了数据科学,为什么我们没有看到人工智能和机器学习的即时突破?药物发现是一个未知的未知领域……当主题已知,训练数据得到很好的管理,基础机制/过程得到很好的定义时,算法才能达到最佳状态。所有这些在药物发现中从来没有出现过。当呈现给ML应用程序时,生物和目标行为面临重大风险。与任何药物发现过程一样,数据的质量和管理以及实验设计的清晰度在人工智能和机器学习虚拟研究中至关重要。这些技巧并不是魔法;他们是科学和技术的推动者,新一代的科学家正在计划和实施这些实验。最后,将用临床试验证明。

鉴于对目前进展的不同看法,我欢迎您浏览2022年麦肯锡和公司的总结(3)和德里克·洛(Derek Lowe)的博客(4)(请搜索最新的博客,太多了,无法链接)。

在我们的产品环境中,ACD/Labs的predcitor应用机器学习技术和神经网络算法在物化性质和光谱领域有了极好的预测能力。正如我们的产品在用户中的流行和长寿所证明的那样,我们专注于此且不断的改进努力,我们的产品预测功能越来越可靠。在AI/ML讨论中,除了预测和筛选候选物分子ADMET特征的传统好处外,我想特别强调我们提供的电离预测能力(也称为pKa预测)。对于任何具有代表性的生物测定试验和任何软件模型来说,充分了解和保证测试物质的化学特性至关重要。可电离化学实体的行为随其环境的pH值而变化,这对化学家来说可能是显而易见的。此外,在体外测试中,局部电荷状态也可能影响靶标的生物活性,改变分子的药物行为(如ADME, Tox等)。此外,测试样品的制备和药品配方受到电离的很大影响。还有一件事:建议科学家使用logD而不是logP来确保在pH范围内的离子形态!所有这些挑战都可以通过一些pKa预测有关。

后期研发阶段和依赖化学的行业的工艺/产品开发阶段,我们观察到不同的动态。坦率地说,围绕人工智能和机器学习的讨论很快就变成了关于加速数字化转型的讨论,这是提高流程效率的先决条件,包括人工智能/机器学习带来的好处。我认为,在这个时候,自动化数字化带来的生产力和效率的投资回报率是最大的实际效益。麦肯锡和公司在给QC实验室的建议中(5),在他们的数字启用和自动化愿景之后,也将AI/ML放入必做的基础工作。

与其他应用一样,在分析化学中,数据和过程的质量决定了计算机辅助结果的质量。我们正在与几家排名前十的制药公司合作,自动创建精心策划的分析数据库。目前在生产中,这些数据库的大小超过15TB,并且还在不断增长;这种努力显然是一种投资。ACD/Labs Spectrus帮助客户汇总全面且“实时”的分析化学数据。为进一步的机器使用设计数据点,以及按需数据抽象所需的级别仍然是需要专家努力的项目的关键部分。当设计为人类和机器都可以重用,并与FAIR(可查找、可访问、可互操作、可重用)和ALCOA+标准保持一致时,以前属于不可访问孤岛的数据的数字化和规范化变得适合更深入的了解。

以上的关于Dead Data 和Live Data这些见解影响到测试方法的改进、硬件利用率、测试量优化、问题预防和准确性的改进。应用好Live Data的公司应可以最大限度地减少重复实验,并在整个组织内实现数据共享,从而带来广泛的商业利益。为此,ACD/Labs 2023 Spectrus Conduit 分析数据管道技术的引入,特别是与Spectrus JS基于云的分析处理软件配合使用时,大大简化了标准化、自动化和对结果的分布式访问。我们的客户也在致力于提高实验结果的自动化和高级分析解释(例如ACD/Labs支持的自动分子身份验证或ASV;这种自动化决策支持从实验上下文数据的利用中受益匪浅)。我们的制药客户正在进行的一些项目在2023年10月的虚拟研讨会上进行了介绍。

最后但并非最不重要的是,一个准备好进行计算机建模的领域是高通量实验和新兴的直接面向生物学的技术。根据它们的定义,这些技术是实验结果的来源,对算法学习/训练至关重要,并且可以从无偏倚的解释中受益,以优化未来的实验设计。

根据我们的观察,企业和行业之间的参与度差异很大。共同的主线是,成功的项目是由我们的研发、科学和业务团队中的最终用户,以及IT和数据科学家共同承担的,这标志着模型与日常运营的更深层次集成。

对我来说,除了AI/ML话题的流行之外,决策必须基于简单的业务准则:

  • 在效率、生产力或创新方面有什么好处?

  • 在金钱、时间、人员技能和业务流程变更方面的投资是什么?

这两者比较起来如何?

在理解了化学和计算机科学前沿的可能性之后,这种愿景可以应用于人员、流程和成本。许多组织正在选择制定一个全面的战略,并继续数字化实现他们的关键路径要素。有时,他们正在解开瓶颈,有时,提供分布式解决方案或创新驱动。我期待着在2024年和接下来的几年里,把这些战略变成现实,看到它们变成现实!

新年快乐!



References

  1. FDA. (2023, May 5). AI/ML for Drug Development Discussion Paper. US Food & Drug Administration. 

    https://www.fda.gov/media/167973/download

  2. A. Anderson. (2023, Oct. 1). The Role of Data in the Pharmaceutical Lifecycle. American Pharmaceutical Review. 

    https://www.americanpharmaceuticalreview.com/Featured-Articles/607993-The-Role-of-Data-in-the-Pharmaceutical-Lifecycle/

  3. A. Devereson, et al. (n.d.). AI in biopharma research: A time to focus and scale. McKinsey & Company. 

    https://www.mckinsey.com/industries/life-sciences/our-insights/ai-in-biopharma-research-a-time-to-focus-and-scale

  4. D. Lowe. (2021, Nov. 8). AI-Generated Clinical Candidates, So Far. Science. 

    https://www.science.org/content/blog-post/ai-generated-clinical-candidates-so-far

  5. N. Carra, et al. (2021, Apr. 14th). Digitization, automation, and online testing: Embracing smart quality control. McKinsey & Company.

    https://www.mckinsey.com/industries/life-sciences/our-insights/digitization-automation-and-online-testing-embracing-smart-quality-control

  6. ACD/Labs. (2023, Aug. 14). A Leap in Ionization Prediction: ACD/Labs Unveils Groundbreaking  Version of Modeling Software at ACS Fall 2023. Advanced Chemistry Development, Inc. 

    https://www.acdlabs.com/resource/a-leap-in-ionization-prediction-acd-labs-unveils-groundbreaking-version-of-modeling-software-at-acs-fall-2023/

  7. S. Bhal. (2023, Aug. 10). The Importance of Ionization in Pharmaceutical R&D. Advanced Chemistry Development, Inc. 

    https://www.acdlabs.com/blog/the-importance-of-ionization-in-pharmaceutical-rd/

  8. ACD/Labs. (2023, Oct. 25). Driving Efficiency with Spectrus®. Structure Characterization, Method Development & Analytical Data Management. Advanced Chemistry Development, Inc. 

    https://www.acdlabs.com/resources/virtual-symposium-driving-efficiency-with-spectrus/

  9. ACD/Labs (n.d.). Structure Elucidation & Verification. Advanced Chemistry Development, Inc. 

    https://www.acdlabs.com/solutions/structure-elucidation-verification/


ACD/Labs CN

微信号|ACDLabsCN

长按识别二维码关注我们

联系我们:

阎作伟 13816084932  zuowei.yan@acdlabs.com

陈诚 17705179237  martin.chen@acdlabs.com



  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2023 ANTPEDIA, All Rights Reserved