DeepMind AlphaFold背后的人工智能——及其对未来药物发现的影响

KristófZsolt Szalay
头像

Kristof Zsolt Szalay是Turbine.ai的创始人和首席技术官,仿真驱动的药物发现公司 - emerj人工智能研究的顾客贡献者。欧洲杯网投网址克里斯特福克斯托夫培养了Semmelweis大学的分子生物学和生物信息学的博士学位。

DeepMind的Alphafold 950x540后面的AI

这是一个贡献的文章KristófZsolt Szalay.Kristóf是Turbine公司的创始人兼首席技术官。拥有分子生物学和生物信息学博士学位。咨询外部专家的投稿,请联系editorial@www.hnjhtmall.com。

你能仅仅根据零部件的库存来预测一架飞机如何飞行吗?

这-与蛋白质-是本质的蛋白质折叠的挑战

两周前,CASP蛋白折叠挑战的组织者刚刚宣布DeepMind的AlphaFold基本上解决了这一挑战——它的预测得分仅略低于实验误差。

这个事实应该可行的活动已知一段时间 - Live Celler没有装配手册,因此部分代码的部分必须也为程序集编写代码。我们甚至可以从Schrödinger的等式以及建设——唉,就目前而言,即使是地球上所有计算机的综合能力也不足以做到这一点。

DeepMind的AlphaFold成就

对于蛋白质,看起来就是一切。

喜欢与keyholes的搭扣,形状蛋白质定义其互动伙伴,相反地是其在复杂的20,000种不同类型蛋白质的复杂机械中的位置和功能。

对于一些蛋白质,它们的形状可以通过实验来确定——这就是CASP的黄金标准最初形成的原因。其他的适应性很强,它们并没有明确的形状。虽然有其他研究方法可以查明特定蛋白质的功能,但AlphaFold应该有助于查明人体中有多少蛋白质在运作。在这方面,这一发现意义重大。

但这也可以在没有AlphaFold的情况下完成。尽管20000个蛋白质是个大数目,但我们最终能发现的数量有限。

然而,如果没有AlphaFold这样的工具,有大量的蛋白质是不可能被研究的。只有一种方法可以使蛋白质正确,但有很多方法可以使蛋白质错误。这样的突变体蛋白相信许多重要疾病,最值得注意的是,癌症

alphafold及其后续人员可能是只有我们可以弄清楚如何损坏的蛋白质看起来像和毒品靶向。

为了了解这一突破的巨大规模,以下是《自然》杂志的一张图表,展示了过去15年蛋白质折叠预测的准确性:

alphafold2.
来源:DeepMind

它基本上停滞在40%左右,直到AlphaFold2出现,并在4年内主导了所有其他竞争方法的任务。

肯定背后突破这种幅度,必须有一些精学的科学洞察力,对吧?

建筑和计算中的优势

这里有一个突破,它刚与之相关蛋白质

alphafold2建立在同一个变压器机器学习建筑〇另一个突破生成式预训练变压器3 (GPT-3)- Openai语言模型,在许多案例中生成文本,无法从人类写作中无法区分。

模型大小GPT-3
竞争预先训练的NLP模型的相应模型大小 - 突出了相对庞大的GPT-3,它使用与DeepMind的alphafolf相同的变压器架构。来源:分析方面

变压器设计为减少机器学习培训时间.它不是一种方法,即某种方式从相同数量的参数产生更好或“更智能”。相反,变形金刚确实允许培训模型数十亿个变量同时,使用数十万个机器小时。

为此,alphafold2可以被认为比科学第一的工程突破更多。由于DeepMind与Google合并,他们可以使用从基础架构中的资源和方法来支持很多互联网本身。我从多个科学家听到它,如果AlphaFold2释放他们的源代码,它甚至没有重要,只要它刚刚开始“导入谷歌”,这是一个巨大的竞争优势。

IBM的“深蓝”超级计算机1997年击败了Kasparov他被一些人指责没有真正掌握国际象棋,只是简单地将蛮力计算能力应用到一系列可能的走法和组合上。即使对人工智能持悲观态度的人也可以说,这一成就意义重大。

我们可能会对alphafold说同样的说法。它没有“掌握”蛋白质折叠,它简单地汇编了近乎无限的计算能力(尽管以一种显着复杂的方式)来寻找可能已经花费数百万年来计算的组合而没有硬件和深度可以访问的方法。

与深蓝色一样,alphafold没有改变药物发现 - 我变化了科学。我们可以期待这些工程技术上的突破能在科学和工业领域的其他离散问题上取得进展,而且我们很可能会看到AlphaFold或类似gpt -3的应用在未来一年里出现在其他科学或工业领域。

学术和私营部门研究团队的影响

我相信AlphaFold近期的主要影响将是一系列针对特定突变的新药,使患者多活许多年。

蛋白质折叠科学家在短短几年内被Deepmind粉碎了他们的领域,但这适用于我们所有人。没有许多研究团队或研究所在一个甚至支付模型的培训的位置,更不用说招募或保留一个技术团队这可以改善它。

我们这些不在谷歌支持的公司工作的人可能仍然需要科学上的聪明,但我们必须锻炼肌肉,以便能够竞争。

学术研究不一定是命中注定的。然而,我也认为它需要改变以保持相关性。我想留下来的人会采用一种类似c-大量的人在很大程度上为同一个目标工作,共享一个共同的基础设施,只是在其上运行不同的、相关的项目。

具有讽刺意味的是,COVID-19可能起到了作用。这种规模的远程科学合作是闻所未闻的,但现在我们更熟悉Zoom、Slack和它们的朋友,所以这可能是可能的。见鬼,我们有办法让成千上万的人一起远程编写代码,我们只是没有真正用于研究的相同系统。也许是时候着手解决了。

编辑注意:

私营部门公司可以从学习由DeepMind(谷歌)和Openai等巨型公司部署的架构,工具和培训方法中获益微软),但他们不可能在计算机上竞争。他们也不太可能竞争原始的ML工程人才。深度和狭隘的专业知识将更有可能支持大型科技公司之外的有利可图的发现和突破。

保持在AI曲线的前面

发现区分未来商业赢家和输家的关键人工智能趋势和应用。

注册“AI Advantage”时事通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
保持在机器学习曲线的前面

加入超过2万名专注于人工智能的商业领袖,并接收我们每周发布的最新人工智能研究和趋势。

感谢您订阅Emerj“AI优势”时事通讯,请查看您的电子邮箱确认。