从猛犸象基因里挖抗生素
每年四百万人的沉默倒计时
César de la Fuente 二十年前还是学生时,给自己列了一张清单:全球最大的问题,按政府投入经费从少到多倒着排。抗微生物耐药性(antimicrobial resistance,简称 AMR)排在第一位——问题最大,钱最少。
二十年过去,这张清单的排序没有改善。细菌、真菌和病毒演化出绕过药物的手段,每年与超过四百万人的死亡相关。《柳叶刀》的一项近期分析预测,到 2050 年这个数字可能突破八百万。de la Fuente 和 MIT 合成生物学家 James Collins 在 2025 年 7 月的 Physical Review Letters 上写下一句冷峻的判断:抗生素发现管线”危险地稀薄”,被���昂的开发成本、漫长的时间线和低回报率三重扼住。
这不是学术界的危言耸听。过去十几年里,试图做抗生素研发的制药公司一家接一家倒闭——不是因为科学失败,而是因为商业模型不成立。一种新抗生素的开发周期动辄十年以上,上市后医生又被要求尽量少开以延缓耐药性,利润空间被压缩到几乎不存在。市场机制在这里失灵了。
一场在基因组深处的考古
传统的抗生素发现方式,de la Fuente 用一句话概括:科学家挖土、挖水,从复杂的有机物里试着提取抗菌分子。这种蛮力筛选法持续了几十年。问题在于,可能被合成的有机分子组合数量大约是 10 的 60 次方——地球上所有沙粒加起来也才 10 的 18 次方。用加拿大 McMaster 大学化学生物学家 Jonathan Stokes 的话说:”药物发现在任何领域都是一场统计游戏,你需要足够多的射门机会才可能进一个球。”
de la Fuente 的策略是换一种射门方式。他把生物学视为信息源:DNA 的编码用四个字母,蛋白质和肽用二十个字母,每个字母代表一种氨基酸。他在宾夕法尼亚大学的 Machine Biology Group(16 名科学家)训练 AI 模型识别这些字母序列中隐藏的抗菌肽(antimicrobial peptides,AMPs)——那些由不超过 50 个氨基酸链接而成的短分子。
有意思的是他搜索的地方。2025 年 8 月,团队在古菌(archaea,一类古老的单细胞生物)的基因组中发现了候选肽。在那之前,他们从蛇、黄蜂和蜘蛛的毒液里挖掘过一批。而最引人注目的项目,de la Fuente 称之为”分子去灭绝”(molecular de-extinction):扫描已灭绝物种的公开基因序列,寻找可能仍具功能的分子。
这份灭绝名单读起来像一座自然历史博物馆的展品目录:尼安德特人、丹尼索瓦人、猛犸象、大地懒、古代海牛、古代斑马、古代企鹅。从这些早已消失的基因编码中,团队”复活”了一系列化合物——mammuthusin-2 来自猛犸象 DNA,mylodonin-2 来自大地懒,hydrodamin-1 来自古代海牛。de la Fuente 的逻辑直截了当:在地球生命的漫长历史里,也许���种生物曾演化出一种抗菌防御机制,恰好对今天的耐药菌有效。过去几年,这种”分子考古”让他积累了超过一百万条基因配方的库。
为什么是肽,不是传统小分子
抗菌肽的吸引力在于它的作战方式。传统抗生素通常只有一种杀菌机制——比如破坏细胞壁,或者干扰蛋白质合成。细菌只需要演化出针对这一种机制的抵抗手段,耐药性就产生了。抗菌肽不同,它们往往同时攻击多个目标:破坏细胞壁、干扰内部遗传物质、扰乱多种细胞过程。面对这种多管齐下的打击,细菌要同时演化出多条逃逸路径,难度陡然上升。
另一个优势是,抗菌肽本来就是人体免疫系统的一部分,是对抗感染的第一道防线。这意味着它在生物相容性上有天然基础——虽然从候选分子到可用药物之间,剂量、递送方式、靶向性等细节仍然是漫长的工程问题。de la Fuente 对此并不回避:”实际上,我们还没有走到那一步。”
这种诚实的犹豫反而让他的工作更可信。他清楚地区分了”发现”和”开发”——前者是在基因组的海洋里找到有潜力的分子,后者是把这些分子变成真正能帮助病人的药物。目前整个领域仍处于发现阶段。
从预测到生成:AI 工具的代际跃迁
斯坦福大学计算机科学家 James Zou 观察到一个清晰的趋势:研究者已经从使用预测模型转向了生成式方法。预测模型的工作方式是从已知的候选分子库中筛选有潜力的;生成式方法则更激进——从零开始设计一个自然界从未存在过的分子。
de la Fuente 的团队去年就做了这样的尝试:用一个生成式 AI 模型设计一组合成肽,再用另一个模型评估它们的性质。团队随后在感染了耐药鲍曼不动杆菌(Acinetobacter baumannii,被世卫组织列为抗菌素耐药性研究的”关键优先级”病原体)的小鼠上测试了其中两种化合物,结果是安全且有效地治疗了感染。这是一个令人振奋的信号,尽管从小鼠到人类之间的距离,任何做过药物研发的人都知道有多远。
他目前正在推进的工具叫 ApexOracle——一个多模态模型,设计目标是分析一种新病原体、定��其基因弱点、匹配可能有效的抗菌肽,然后预测由这些肽构建的抗生素在实验室测试中的表现。de la Fuente 说它”融合了化学、基因组学和语言的理解”。他也承认这还是初步工作,即便不能完美运行,也能为下一代 AI 模型指明方向。
这种”即使失败也有价值”的思路,暗合了 AI 在科学研究中一个更广泛的角色转变。AI 不必每次都给出正确答案,它的价值在于大幅缩小搜索空间——把 10 的 60 次方种可能性压缩到人类研究者可以逐一验证的量级。正如《叉车也有超能力》中 Hannah Fry 所指出的,AI 擅长在已知的地图上充当侦察兵,指出未被探索的区域。de la Fuente 的工作正是这种侦察的极端案例——他的地图横跨数十亿年的进化历史。
一个”几乎不可能”问题里的”几乎”
de la Fuente 把抗微生物耐药性称为一个”几乎不可能”的问题。他感兴趣的是”几乎”这两个字里的空间。
这个空间正在被多个团队同时撬开。Collins 的团队在 2020 年用 AI 预测出广谱抗生素 halicin,目前处于临床前开发阶段。Stokes 在 McMaster 大学用生成式 AI 设计可合成的新分子。de la Fuente 专注于肽。三条路径各有侧重,但共享同一个底层信念:传统方法太慢了,而耐药菌不会等人类准备好。
冷静地看,这些工作距离真正的临床应用仍有相当距离。抗菌肽的稳定性、生产成本、体内代谢速度都是未解的工程难题。AI 能加速发现,但无法跳过验证。从候选分子到通过临床试验,依然是一条以年为单位计量的路。
但有一件事已经改变了:搜索的范围。当你可以扫描猛犸象的基因组、古菌的遗传密码、灭绝海牛的 DNA 序列,”去哪里找新抗生素”这个问题的答案不再局限于实验室里的培养皿和脚下的土壤。整个进化史变成了一个可被检索的数据库。
de la Fuente 说他喜欢挑战,而这是”终极挑战”。这话听起来像是科学家的标准豪言,但放在一个每年四百万人死亡、且数字还在攀升的背景下,它更接近于一种对赌——赌人类的计算能力能跑赢细菌的演化速度。目前,赌局还没有结果。但至少,筹码已经不一样了。


