AutoChrom梯度培训文稿

2021-03-23 10:15:50, ACD/Labs 阎作伟 Advanced Chemistry Development, Inc. (ACD/Labs)


2021318日上午,笔者做了一次名为“AutoChrom培训:梯度单因素建模“的网课,时长大约为1小时40分钟。此次培训是面向ACD用户的技术培训,参加人员超过50人。培训的视频将向客户提供。

但同时也有一些非客户的同事对培训内容有兴趣,希望学习。笔者考虑培训的内容里的软件操作部分对他们帮助不大,也没有能力凭空描述软件本身的操作。所以决定在周末对ppt内容进行一次文字性的描述,忽略所有的和软件操作相关的技术细节探讨,只讨论其中的知识内容。因此写成了此次注释性的文字。

如果所传递的知识对看这篇文章的读者有所帮助,将深感荣幸。如果有讲错的地方,请大家指出和批评。以上有笔者的联系方式,以及团队的微信公众号,欢迎大家关注。

另外,此文内容一定和原视频内容有一些区别。此文属于信息的重新整理,希望对用户也有帮助。


这是此次培训的内容概要。梯度研究是单因素研究里最复杂的,也是液相方法开发里非常倚重的一个因素。笔者亲眼见到很多研究员坐在工作站电脑面前微调他们的梯度方法,以期获得一个能够让人满意的分离。非常想告诉研究员,可以用色谱模拟软件来进行梯度研究,不做这种微调梯度的工作。我们的手段就是用数学模型化的技术进行梯度研究。


构建一个数学模型是解决一个工程问题的常规手段。比如修一座桥,或者设计一个飞行器,都会用到复杂的数学模型。分析工作在日常工作中也经常做一些数学模型,比如制作一个标准曲线。我们对梯度的研究策略是对保留时间与梯度进行相关性研究,总结其数学模型,并应用这个数学模型。


施耐德等人的著作<<现代液相色谱导论>>里的第九章,专门介绍梯度的研究策略,这一章已经奠定了软件建立的梯度模型的基础。由于内容里有丰富的有关公式,我们抽取9.19.4b的公式给大家来看。如上图所示,公式的含义基本可以描述为物质的保留因子的对数在等度时与有机相比例成线性相关,在梯度时与梯度的变化线性相关。统计学上进行拟合时,应用简单的多项式拟合。


让我们来看一下小分子的保留因子的logk与等度实验的相关性。图片来自于同一本书。用不同比例的甲醇洗脱左侧的小分子,记录其保留时间换算成保留因子再取对数,这8个试验点显然很好的体现出线性关系。换用不同比例的乙腈洗脱,在中间部分依然都有很好的线性关系,但是在低比例和高比例的乙腈时则体现出一定的非线性,这种水平的非线性用二项式函数就可以很好的表达。要拟合一条直线,最少需要两个实验,最好实验在2个以上。要拟合一个二次函数,最少需要3个实验,最好实验在3个以上。


当我们用两个实验进行同一个样品进行研究时,这个样品里有3个物质。低比例有机相40%乙腈让所有的物质保留时间偏大,高比例有机相60%已经让保留减弱,出峰偏早。由于每个物质都有两个数据,因此可以在一个二维空间来用线段来表示某个物质的保留因子的轨迹。由于都呈线性,因此在右侧的图上可以看到三条斜线,这就是物质的等度保留模型的数学体现。


如果研究的对象在结构上极为类似,只在疏水性上有差异,比如甲苯,乙苯,丙苯等等,虽然物质的数量很多,但是其保留的行为具有相似性。在图形上看起来类似不相交的发散射线。而实际的药物有关物质研究中,有关物质所含有的基团和性质差异很大,导致某两条线段在研究的范围之内会发生靠近甚至相交。相交点在色谱上就是共流出点,因为此时两个物质的保留因子一致。对于进行分离最大化的目标来说,是确保所有的线段在一定范围内彼此远离,并且最近的两个点也达到一定的距离要求。此时如果再加上峰宽因素的考虑,分离度的全局和局部要求都有可能达到。在右侧这个图上,更有机会的范围是左侧两点之间。比较而言k的大小和分布更符合要求。当然此图没有体现峰宽以及拖尾的影响,实际情况必须加以考虑,找到实际的有效范围看起来还有很大难度。

这个并没有关系,这种图形只是用来描述基本概念,ACD AutoChrom已经有界面更友好的软件可以直接使用。就是接下来要培训的内容。


之所以要拿住这么多的内容来讲述数学原理,目的是让读者有一个深刻的印象,将来在分析方法开发追求更好的分离时中使用数学建模工具。还有一点要指出,分子结构并不是进行数学模型的模拟的前提条件。


虽然梯度很重要,但在进行分析方法的过程中,梯度优化并不处于优先研究的位置。这是由于色谱柱,强洗脱的种类,弱洗脱剂的差异对物质的保留k和选择性a的影响更显著。从大的步骤来说,应对这些主要因素筛选之后,再进行次要因素优化。梯度研究是优化中的一个环节。从筛选来讲如果有自动化的仪器条件(多流路和多柱筛选),正交化筛选工作可以进行的比较快捷。而优化实验,在一个四元泵上即可以完成。所以筛选和优化有的时候可以不在一个仪器上完成,当然最好是在一个仪器上完成,因为跨仪器就会有梯度延迟的差异问题带来一些负面影响,不过这个可以解决。

优化时可以做部分因子正交化的设计,做两因素的优化甚至同时优化三因素。当然不用AutoChrom这样的软件时,研究员们更习惯用单因素的方式进行优化。

梯度单因素是所有单因素里最复杂的一个,因为它自身存在3个可变值,起始比例,结束比例和梯度时长。对梯度研究透彻后就可以和其他因子进行同时研究,比如和温度,pH,混合流动相,盐浓度等等。

可见研究好梯度模型非常重要。我们先来讲一下梯度数学模型的梯度空间的设计问题。


梯度空间的大小是进行梯度实验设计时的关键词。在简单线性梯度的三个可变量里,固定了起始比例和结束比例,只变动tG长短来设计,简单有效。设计时tG时间一定要有明显的不同。由于这种设计方法和从一个起点开始通过不断加拐点微调梯度传统方式有显著的差异,很多研究员需要一个适应期。构建模型方法是对传统微调手段的一种颠覆。



在梯度设计时,是不应在初始的梯度里加拐点的。由于梯度倒角的存在,拐点越多,引入的误差就越大。用一组存在多拐点的预实验来构建梯度模型,模型和实际表现的误差会很大。


EXCEL绘制一个梯度图例,有时候挺有必要,尤其是在初学阶段,也建议把这样的图例列入到实验报告里。


可以看到,tG的增大,物质的保留在变大,6号峰之后疏水性大的物质之间的分离逐步在增大。当然也看到了6,7以及9,12这两对峰的分离选择性的相反趋势。图里1-5号峰极性大的物质的关系显得更加复杂,是当前空间里能直接看到的分离风险。


从以上的三张图设计的范围里,如果我们虚拟的走一个黄色的梯度,然后用人脑来预测结果,我们基本上可以判断出,6号峰之后的物质是没有分离风险的。而1-5号峰之间的关系很可能还是不能分离的很好。


如果我们运行一个有拐点的梯度如上图的黄色所示,1-5号峰依然还是不会太大的改善,而6号峰之后的色谱峰的相互关系因为拐点的引入且斜率不同,难以判断。


如果如上图所示,把分段梯度设计的更夸张,明显超出了原设计范围,人脑的预测能力更是大打折扣。从数学建模的角度上来说,这是超出了原设计空间,可以通过外延来进行模拟。


如上图这种情况的一个近似等度的梯度,所需要数学模型尽可能的外延才能预测。以上的这些黄线的完全都可以在建好的模型里进行虚拟实验,来查看这些梯度效果会如何。当然模型还有更高级的功能:去找一些人没有设计和探索过的新梯度,这些工作对一个软件来说,那真是轻而易举。


如果样品里有保留较强的物质,需要增加大比例等度洗脱的时间,可以如上图设计。


除了改变tG时长,我们可以用改变起始比例,而保持tG不变和结束比例不变的设计策略。


效果如图所示,物质的保留时间都会减小。至于分析的效果,可以用建模的方式在数学模型里寻找。


只保持结束比例不变而同时变动tG和起始比例带来的保留差异会更显著,但是也造成了色谱峰追踪和匹配的难度。


在进行数学模型构建时,切忌初期使用相同的等度。等度的时间越长,带来的副作用越大,受影响最多的就是出峰较为靠前的的物质。

那什么时候加这段等度呢?这段等度的增加是为了不同色谱系统进行方法转移时用于适配不同的柱前体积的差异而使用。因此可以在梯度研究完毕后再增加合适时长的等度。

如上图,在研究初期预实验都加5%2min等度,实际严重限制了初期的梯度变化的变化率,降低了出峰较早的物质的预测准确度。


接下来笔者要用一个梯度设计的例子构建一个梯度模型。梯度为5-80%,梯度时长分别是40min,70min, 90min 130min,之所以用130min的超长时长,是因为这个方法杂质比较多,难度可能较大。

如上图所看到的,40min的梯度的问题在于1-5号色谱峰的分离,tG增加到70min90min后反而暴露出很多共流风险,比如4,56,79,12.

当时间到130min后方法的分离问题得以解决,但是时长太长。


这是本讲座要用到的第二个案例。与上一个案例不同的是样品的研究,原方法检测样品时主峰后出现了未知物。不得已调整使用了复杂的多阶梯度,保证主峰和主峰后杂质都在分离效果最好的等度上,不能奏效。当然换了3微米的色谱后,主峰并没有如想象的那样瘦下来,反而变胖了不少,分离困难更大。


在解决这个问题时,保留原来的多阶梯度,设计了新的tG增大的两个平缓梯度,为了缩短实验时间,在确保主峰能出峰后,如原方法一般,增加了加快最后两个色谱峰出峰的梯度陡度。


使用多阶梯度保证了主峰和主峰后杂质在一个等度上。然而等度前的曲折梯度对主峰以及其后杂质的保留或者说选择性同样有贡献。从两个平缓梯度的结果来看,反而是时间战胜了曲折的多点设计,解决了主峰和主峰后的分离。用于梯度设计的预实验解决了主要的矛盾,这种情况下模型将用于缩短时间。


这是实验数据的模拟重建图,为修正模型在主峰拖尾上模拟的步骤准确带来的分离度计算的误差。主峰的峰宽被人为夸大了三倍!


这是在分离度模型上经过人工调整的模拟结果,主峰和主峰后杂质看起来主峰峰尖和其后杂质的峰尖的时间差达到了目标值。

的确,如果主峰有很极端的拖尾,它和其后杂质的分离度有时会出现很大的计算误差,用峰尖时间差的人工计量是有效的分离指标。

这也是梯度模型做多了之后,应对主峰拖尾不得不使用的方法。梯度放缓或者使用等度时,主峰一定会产生最大程度的拖尾,这是一种技巧。


这是预测图和实际图的比对,看起来还似乎有一些瑕疵,还有一点再优化的余地。


不同的HPLC液相体统有不同的系统滞留体积,这个系统滞留体积Dwell Volume实际影响了梯度方法转移时的耐用性,导致色谱峰保留时间有偏差还在其次,主要会引起某些梯度敏感的物质的保留时间变动过大与原本有较好分离的物质的分离度变差甚至共流。


这里有一个Dwell Volume的测量方法。这实际上是两个方法。一个是根据这个曲线做切线,切线的相交之处是tDwell。另外一个是测丙酮曲线的高点,然后取其50%的点,计量时间,减去1/2tG时间,也是tDwell。流速再乘以时间后就能够获得Dwell Volume


测得方法开发仪器和被转移仪器的Dwell Volume很有用。在方法开发的后期,在原方法内故意增加一段等度时长,这个等度时长要大于两台仪器的可能的Dwell Volume差值。这样进行转移时可以根据实际差值减少这段等度时长。这种裁剪在似乎在美国药典上规定是允许的。

那么这段等度时长的增加就是一个挑战,应当在模型上进行各种时长的模拟,来确保其不会影响系统整体的分离度,尤其是关键Pair的分离度。


摒弃掉增加等度时长的方法,换一个思路去考虑这个问题,本身这可以用梯度的起始比例耐用性来进行解决。目标仪器比方法开发仪器的Dwell Volume大,可以用起始比例降低来进行模拟,在目标仪器上保留时间会增大。目标仪器比方法开发仪器的Dwell Volume小,可以用起始比例增高来模拟,目标仪器上保留时间会减小。保留时间发生微小的变化并不足畏惧,只需分离度始终达标,不会进入分离度变差的境地即可。如图就是如此,选起始比例,应该选耐用性好的平台顶端,而不是选择悬崖一边。


我们再强调一点,梯度的设计初期绝对不能每一针都刻意加一段等度,这会严重影响出峰较早的色谱峰的模型预测的准确性,同时几乎会丧失起始比例的调整的可能性。这个等度时间越长,副作用越大。

如上文所述这个等度的时长是在方法开发,优化到后期才添加使用的。而且使用时还应该根据Dwell Volume之差值进行时长的裁剪。


在优化阶段,梯度可以和任意的因素进行组合进行两因素以上的设计。当然所需的仪器条件各有不同。掌握了以上5种两因素模型,才能够说DOEAQbD超越了初级阶段。


梯度和pH的两因素研究往往是解决分离问题最有效的手段。


方法的终末阶段对pH, 梯度,温度进行三因素的设计,并求得中心点。则中心点出发的单因素两水平的验证实验是一定可以顺利完成的。

耐用性的预验证的成功将为这个方法的开发的完成画上一个圆满的句号。


最后再讲一个更高级的小技巧,如果方法开发需要兼顾所有标品以及实际样品,而没有做样品加标的条件的话,可以将标品实验和样品实验里数据进行合并和去重,这样就可以用模型完成对所有潜在的风险的全控制,在模型中找到最佳耐用区,然后分别用标品和样品进行验证。


如果做的是不同条件的强制降解实验,希望某些不同条件下的不同杂质能够用同一个方法在同一个模型里进行控制,可以使用同样的策略来处理。这种处理方法是用软件的功能构建了一个虚拟样品。


用一段话来结束这篇ppt注释文章。列出以下几点

  1. 用数学建模的方法来解决分离问题是最有效率的。

  2. 正交化DOE设计适合用于建立色谱分离数学模型,过于天才式的多因素间无法互相比较参考的跳跃试错是不适用的。

  3. 了解单因素的影响效果,选择合适的因子来组合DOE能体现一个人解决问题科学素养。

  4. 当前社会缺乏能够用数学解决复杂分离问题的高级人才。

希望各位用户多使用软件!希望还没有成为AutoChrom用户的同仁们早日成为用户。


END



  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2023 ANTPEDIA, All Rights Reserved