在一个老伦敦南部的饼干工厂、巨型搅拌机和工业烤箱已被机械臂、孵化器和 DNA 测序机取代。詹姆斯·菲尔德 (James Field) 和他的公司LabGenius并不生产甜食,而是生产甜品。他们正在开发一种革命性的、人工智能驱动的方法来设计新的医用抗体。
在自然界中,抗体是人体对疾病的反应,是免疫系统的前线部队。它们是特殊形状的蛋白质链,可以粘附外来入侵者,以便将它们从系统中清除。自 20 世纪 80 年代以来,制药公司一直在生产合成抗体来治疗癌症等疾病,并减少移植器官被排斥的机会。
但设计这些抗体对人类来说是一个缓慢的过程——蛋白质设计者必须费力地研究数百万种潜在的氨基酸组合,找到能够以完全正确的方式折叠在一起的氨基酸,然后对它们进行实验测试,调整一些变量以改进治疗的一些特点,同时希望这不会在其他方面使情况变得更糟。LabGenius 创始人兼首席执行官 Field 表示:“如果你想创造一种新的治疗性抗体,那么在这个无限的潜在分子空间中的某个地方就存在你想要找到的分子。”
2012 年,当他在伦敦帝国学院攻读合成生物学博士学位时,他创办了这家公司,当时他看到 DNA 测序、计算和机器人技术的成本都在下降。LabGenius 利用这三者来很大程度上自动化抗体发现过程。在伯蒙西的实验室,机器学习算法设计针对特定疾病的抗体,然后自动化机器人系统在实验室中构建和培养它们,运行测试,并将数据反馈到算法中,所有这些都在有限的人类监督下进行。这里有培养患病细胞、培养抗体和测序 DNA 的空间:穿着实验室外套的技术人员准备样本,并在机器在后台旋转时敲击电脑。
人类科学家首先确定治疗特定疾病的潜在抗体的搜索空间:他们需要能够区分健康细胞和患病细胞的蛋白质,粘附在患病细胞上,然后招募免疫细胞来完成工作。但这些蛋白质可以位于潜在选择的无限搜索空间中的任何位置。LabGenius 开发了一种机器学习模型,可以更快速、更有效地探索该空间。“作为人类,你给系统的唯一输入是,这是一个健康细胞的例子,这是一个患病细胞的例子,”菲尔德说。“然后让系统探索可以区分它们的不同[抗体]设计。”
该模型从 100,000 个潜在抗体的搜索空间中选择 700 多个初始选项,然后自动设计、构建和测试它们,目的是找到潜在的富有成效的领域以进行更深入的研究。想象一下从数千种汽车中选择一辆完美的汽车:您可能首先选择一种广泛的颜色,然后从那里过滤成特定的色调。