《Science》点赞清华 AI:当研发效率提升百万倍,攻克癌症还有多远?
导读: 在制药界,有一个令人绝望的“双十定律”:一款新药的研发,往往需要耗时十年、耗资十亿美金。这种近乎“炼丹”的低效,让无数绝症患者在等待中失去希望。然而,清华大学的一项最新成果,正在用 AI 暴力拆解这个困局。

一、 “反摩尔定律”下的制药之困
在信息技术领域,我们有“摩尔定律”,每 18 个月芯片性能翻倍,成本减半。但在制药领域,却存在着一个尴尬的“反摩尔定律”(Eroom's Law):随着科技进步,研发出一款新药的成本反而每 9 年就翻一倍。
为什么制药这么难?
核心痛点在于“大海捞针”。人类已知的具有类药潜力的候选分子数量,估计在 个左右——这个数字比银河系中的星星还要多。而我们要做的,是为某一种特定的致病蛋白(靶点),寻找那个能像钥匙一样精准契合它的分子。
传统方法靠的是“药化学家的直觉”加上“实验室的高通量筛选”。即便有了初代的计算机辅助药物设计(CADD),面对海量的组合,算力依然捉襟见肘。
就在上周,清华大学智能产业研究院(AIR)联合生命科学学院、化学系团队,在顶级期刊《Science》上发表了重磅论文。他们研发的 AI 平台 DrugCLIP,完成了一次足以载入史册的实验:在一天之内,完成了 10 万亿次蛋白–分子配对。
10 万亿次是什么概念?如果靠传统实验手段,这需要耗费人类研究员数千年的时间。现在,时间被压缩到了 24 小时。

二、 DrugCLIP:给分子和蛋白拍一张“证件照”
清华团队这次推出的 DrugCLIP 到底是什么?
它的核心灵感来自于视觉领域的革命性模型——CLIP(Contrastive Language-Image Pre-training)。在计算机视觉里,CLIP 能够通过对比学习,让 AI 理解“猫”这个词和“猫的照片”之间的关联。
清华团队将这一逻辑迁移到了生物医药领域:
- 蛋白(蛋白质靶点): 相当于“文字描述”。
- 小分子(候选药物): 相当于“图片信息”。
DrugCLIP 的核心突破在于它改写了 AI 寻找药物的底层算法逻辑。
过去,主流的 AI 找药(如各种图神经网络 GNN)喜欢去“模拟”分子和蛋白之间复杂的物理碰撞和化学键合。这种方法虽然精确,但计算量极大,就像你要预测一万颗弹珠撞击后的路径,慢得惊人。
而 DrugCLIP 采用的是“特征表征学习”。它不纠结于细微的碰撞过程,而是通过海量数据训练,让 AI 学会提取蛋白和分子的“灵魂特征”。
它把蛋白和小分子分别投射到一个高维的数学空间里。如果这个分子能治这个病,它们在空间里的距离就会被拉近;如果不匹配,距离就会被推开。
这种“降维打击”带来的结果是恐怖的效率提升: 在 128 核 CPU 加上 8 张 GPU 的普通计算节点上,DrugCLIP 实现了百万倍的效率提升。这意味着,以往只有超级计算机中心才能跑的筛选任务,现在普通实验室就能完成。

三、 从抑郁症到癌症:AI 不是在“演戏”,是在“真救人”
很多人对 AI 研发药物的质疑在于:“模拟得再快,进到肚子里没用怎么办?”
为了回应这一质疑,清华团队直接在论文中给出了三组硬核实验验证:

1. 挑战“头号杀手”:抑郁症相关蛋白
在针对某种与抑郁症紧密相关的蛋白实验中,DrugCLIP 从海量库中筛选出的分子,其结合能力远超目前市面上的主流药物。这意味着,我们极有可能基于此开发出副作用更小、见效更快的抗抑郁新药。

2. 癌症与帕金森:牵手 AlphaFold
去年,谷歌的 AlphaFold 预测了几乎所有人类已知的蛋白质结构。清华团队这次更进一步,他们利用 AlphaFold 预测出的“虚拟结构”作为靶点,让 DrugCLIP 进行筛选。
实验结果显示,在癌症和帕金森相关蛋白的筛选中,AI 选出的分子被证明确实有效。这标志着,AI 已经完成了从“预测结构”到“设计药物”的闭环。

3. 高命中率:15% 的奇迹
在去甲肾上腺素转运体(NET)实验中,AI 筛选出的分子中,竟然有 15% 被实验证实为有效抑制剂。在制药界,初筛能有 1% 的命中率就已经是谢天谢地,15% 的成功率简直是开了“物理外挂”。

四、 范式转移:从“炼丹”走向“自动驾驶”
长期以来,制药行业更像是一门“手艺活”,充满了偶然性和神秘色彩。老牌药企的实验室里,白发苍苍的化学家凭借几十年的经验判断分子的修饰。这被称为“炼丹式研发”。
但 DrugCLIP 的出现,预示着药物研发正在进入“自动驾驶时代”。
1. 逻辑的转变:从试错到推理 以前是“试一试才知道行不行”,现在是“通过大规模预训练模型,推理出大概率行的方案”。这种确定性,是降低药物研发成本的关键。
2. 门槛的下放:研发的民主化 以前,只有辉瑞、默沙东这样财大气粗的巨头才玩得起高通量筛选。而 DrugCLIP 的百万倍提速,意味着算力成本的大幅下降。未来的药物研发,可能不再是少数实验室的专利,中小型初创企业甚至个人科研团队,都能在开放平台上寻找治愈罕见病的良方。
3. 数据驱动的良性循环
正如特斯拉通过行驶数据不断优化自动驾驶系统,DrugCLIP 也会在不断地筛选和实验反馈中进化。今天它能一天筛选 10 万亿次,明天它可能就能根据病人的基因组数据,进行“一人一药”的精准定制。

五、 攻克癌症,我们还有多远?
回到那个最令公众关心的问题:有了清华这个 AI,我们是不是马上就能攻克癌症了?
理性地看,答案是:“曙光初现,但道阻且长。”
AI 解决的是药物研发链条中最前端、最繁琐的“发现阶段”。但在这一步之后,依然面临着:
- 动物实验: AI 模拟不了复杂的生物体微环境。
- 临床三期: 安全性和有效性的验证是绕不开的监管红线。
- 工程化生产: 分子实验室合成容易,大规模量产难。
然而,我们不应因此低估 DrugCLIP 的意义。
想象一下,人类与癌症的斗争就像是在一间巨大的漆黑房间里寻找一把细小的钥匙。过去几十年,我们只能靠手摸,偶尔点燃一根火柴。而清华的这项成果,相当于在房间里安装了一台每秒扫描千万次的红外探测器。
它虽然还没直接把钥匙插进锁孔,但它已经帮我们排除了 99.99% 的错误区域,并指着其中一个小角落说:“钥匙大概率就在这,去拿吧。”
这种效率的提升,是量变引发质变。 当研发成本从 10 亿美金降到 1 亿美金,当研发周期从 10 年缩短到 3 年,会有更多的资金涌入那些曾经因为“不赚钱”而被放弃的孤儿病研究。
六、 结语:AI 4 Science,中国科研的新机会
《Science》对 DrugCLIP 的点赞,本质上是对 AI 4 Science(人工智能驱动的科学研究) 这一大趋势的认可。
在这个赛道上,中国正展现出极强的爆发力。清华大学智能产业研究院(AIR)的这种跨学科协作——让懂算法的人、懂生命科学的人、懂化学的人坐在一起——正是未来科研的最优解。
我们正处于一个历史性的节点:AI 不再只是手机里的语音助手,或者写周报的聊天机器人。它正深入人类知识最坚硬的腹地,去触摸生命的本质。
一天 10 万亿次,这不仅是一个傲人的数字,更是一个温柔的承诺:那些目前被视为“绝症”的阴影,终将在算力的光芒下消散。
未来的药瓶里,装的不仅是化学分子,更是人类智慧的算法总和。