2023-06-06 14:57:34 Illumina因美纳(中国)科学器材有限公司
历经三十年,全球科学家绘制出完整的人类基因组图谱,开启了基因世界的大门。然而,每个人的遗传密码中都存在数百万个变异,迄今为止只有0.07%的人类已被测序,并存在数据代表性不足。
如何加速解码生命密码?
如何解决基因组数据代表性不足?
如何推动基因组学应用于改善人类健康?
基因组学领域的“ChatGPT”——
PrimateAI-3D,正加速解码精准医疗和药物靶点发现!
6月1日,全球基因测序和芯片技术的领导者因美纳(纳斯达克股票代码:ILMN),宣布推出全新的人工智能(AI)算法——PrimateAI-3D,利用灵长类动物基因和先进的人工智能技术来改善遗传风险预测和药物靶点发现。
同期,《科学》(Science)杂志发表主题特刊(第6648期)该期特刊中8篇论文中的4篇来自因美纳和24个国家/地区的科学家们的合作,其中两篇由因美纳人工智能副总裁Kyle Farh担任通讯作者,详细介绍了PrimateAI-3D算法的训练方式及其在英国生物样本库(UK Biobank)队列中50万个基因组的应用情况。另外两篇有关灵长类动物进化研究的论文也同期发表,为PrimateAI-3D的开发提供了信息。
《科学》(Science)杂志封面(第6648期)
自人类基因组图谱绘成以来,全球科学家与临床医生不断致力于深入研究基因变异,解码基因与人类健康的奥秘。每个人都携带着数百万种基因变异,正是这些变异导致了健康和疾病风险的个体差异,但目前大多数变异的作用方式尚不明确。尽管全球有80亿人口,但全人类的遗传多样性仍然与10,000个共同祖先(起源种群)相似。要真正了解人类基因组,仅凭人类基因组测序中的数据远远不够。
DNA就是活历史
进化是世界上持续时间最长的实验。大自然在进化中不断通过随机突变来测试基因,那些危害动物健康的变异很快就会从基因库中剔除,而那些中性或有益的变异则会留存并传递下去。Farh表示:“这些大自然实验的结果记录在每个物种的基因组中,并一直留存下来,形成一份活档案。”
尽管在形态上千差万别,但现存灵长类动物(包括猿、猴、原猴亚目,例如狐猴和懒猴)与人类之间仍有90%以上的DNA是相同的。在黑猩猩或倭黑猩猩身上发生的突变同样会在人类身上发生,而因美纳科学家的研究表明,如果某种变异在另一种灵长类动物身上是接受自然选择的结果,则该变异有99%的概率不会在人类身上引发疾病*[1]。
巴西马米拉瓦可持续发展保护区的洪堡松鼠猴(cassiquiarensis) |马塞洛·桑塔纳摄
因此,通过对现代灵长类动物进行测序,我们可以更好地了解哪些变异不会致病。本期《科学》(Science)杂志中题为《The landscape of tolerated genetic variation in humans and primates》的研究对来自233个非人灵长类的800余个动物进行了测序,物种涵盖全部16个科和86%以上的现存属。但测序只是第一步:掌握所有数据之后,还需要进行解读。为此,因美纳开发了PrimateAI-3D用作数据解读方法。
通过自然选择训练的AI算法
由因美纳研发的PrimateAI-3D可高度准确地发现致病变异,解决疾病面临的关键挑战,从而成功实现个体化基因组精准医学。
为了获得先进的性能,PrimateAI-3D采用了与ChatGPT和AlphaFold类似的深度神经网络架构,不同之处在于PrimateAI-3D是根据基因组序列而不是人类语言来进行训练。另外,在ChatGPT等生成性语言模型中,现有的文本就可以为训练提供信息,而人类基因组中导致疾病的基因变异在很大程度上却是未知的。
为解决这个问题,PrimateAI-3D有效地利用自然选择来训练深度神经网络的参数。这种训练基于此前对233种不同灵长类动物进行测序时发现的数百万种良性基因变异来开展,这也是迄今为止开展的最大规模的非人类灵长类物种测序工作。神经网络会学习基因中代表良性变异的位置,并通过自然淘汰过程判断哪些区域如果发生突变可能致病。PrimateAI-3D通过这种方式学习如何准确预测人类的致病变异,准确度高于任何人类预测。
PrimateAI-3D
解码精准医疗和基于基因的药物靶点发现
《科学》(Science)杂志上发表的《Rare penetrant mutations confer severe risk of common diseases》研究使用以下4种专病队列比较了PrimateAI-3D与其他15种机器学习方法:神经发育障碍队列、自闭类障碍队列、先天性心脏病队列和英国生物样本库(UK Biobank)。前三个队列是迄今为止最大规模的测序研究之一,研究对象包括患病儿童及其未患病的父母;而英国生物样本库中的50万个基因组则大多来自普通人群中的健康成员。该研究还在国立卫生研究院的ClinVar数据库和其他数据集中评估了该算法。在6种不同的临床基准方面,PrimateAI-3D的表现均远胜过所有其他现有方法。这些发现有助于研究人员优先考虑一小部分最有可能影响人类健康的变异。
罕见基因变异对复杂人类特征的多基因贡献,以血清胆固醇为代表
此外,PrimateAI-3D在预测英国生物样本库队列中的常见病患病风险升高人群方面表现出惊人的提升,特别是在非欧洲种族群体中,首次证明了多基因风险评分在很大程度上不受祖先偏差影响,为公平地实施基于基因的精准医疗迈出关键一步,适用于更多元化的人群。
PrimateAI-3D将集成在因美纳的互联软件中,供基因组学界广泛使用。
4篇最新Science论文
带您了解因美纳AI算法驱动的
基因组学“ChatGPT”:
[1]这一结论不适用于亲缘关系较远的哺乳动物,比如一种在老鼠或狗身上无害的变异,在大猩猩或人类身上可能就是致病的。
04-22 华大吉比爱
精彩回顾|华大吉比爱质谱整体解决方案亮相第五届北京临床质谱论坛04-22 华大吉比爱
汪建:三十而立,要立得正、立得稳,走出一片新的光辉04-22 华大集团
尹烨:想成为对人类历史有伟大贡献的组织,就必须秉承痴心和使命04-22 华大集团
环境应急演练:苏州佳谱科技展现实力!04-22
ACCSI2024珂睿科技入围科学仪器行业投资潜力榜单并荣获成长潜力企业奖!04-19 珂睿marketing
宁波市政协主席陈龙一行莅临华仪宁创考察调研04-19
鄞州区人民政府副区长陈建恩带队赴华仪宁创开展企业帮扶现场办公会04-19
多因子实验操作二三事,轻松get高通量数据!!!04-19 赛默飞生命科学
高压均质技术在处理淀粉中的应用04-19 SCIENTZ
湖北省一天科技有限公司选购我司HS-STA-001同步热分析仪04-19
科普知识丨聚酰胺PA塑料的机械物理性能04-19
我司HS-STA-002同步热分析仪落户中国-东盟科技创新公共服务平台04-19
广东广纺检测技术股份有限公司二次选购我司炭黑含量测试仪04-19
【展会通知】2024年陕西省药学会第三届药品质量控制与检验技术大会04-19
世界地球日将至,与Detelogy一起守护地球!04-19 得泰仪器Detelogy
华谱科仪携S6000高效液相色谱仪亮相中国医药全产业链新资源大会04-19 华谱科仪
24节气|匠心随春风,天隆燃智造04-19
全域感知,“育”见环博 | 谱育科技再赴上海环博会之约04-19 点击关注→
光谱学常用术语04-19