清华大学团队研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP
新清华 2026年01月16日 第2390期 学术前沿

DrugCLIP主页。
本报讯 近日,清华大学智能产业研究院(AIR)教授兰艳艳联合生命学院、化学系团队创新研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP,筛选速度对比传统方法实现了百万倍提升,在预测准确率上也取得显著突破。依托该平台,团队首次完成了覆盖人类基因组规模的药物虚拟筛选,为创新药物发现带来了新的可能性。
目前,人类对靶向药物的探索约覆盖人体全部可成药靶点的10%。面对数以万计的潜在靶点,如何在广阔的化学空间中快速筛选苗头化合物,成为该领域研究的瓶颈。若使用当前最先进的分子对接工具筛选1万个蛋白靶点,假设每个靶点面对109个候选分子,则需完成约1013次蛋白-配体打分,一台计算机即使日夜不休也需数百年才可完成计算,严重制约了新靶点与新分子之间匹配的筛选效率。DrugCLIP将该计算量缩短为一台计算节点(高性能计算或分布式计算系统中的一个基本单元)一天的机时,首次打通了从蛋白结构预测到药物发现的关键通道,实现覆盖人类基因组规模的虚拟筛选。
硬件方面,基于128核中央处理器和8张图形处理器的计算节点,DrugCLIP即可实现万亿级蛋白口袋小分子对打分日吞吐能力。其核心突破在于将传统的分子对接转化为蛋白口袋与小分子在向量空间中的高效语义检索,较分子对接等传统方法的速度提升百万倍。
依托DrugCLIP,联合团队首次完成了人类基因组规模的虚拟筛选项目,可覆盖约1万个蛋白靶点、2万个蛋白口袋,分析筛选超过5亿个类药小分子,总共富集出超过200万个潜在活性分子,构建了目前已知最大规模的蛋白-配体筛选数据库。该数据库已免费面向全球科研社区开放,为基础研究与早期药物发现提供了强大数据支持。
同时,筛选服务平台已同步上线,支持对用户上传的靶点和蛋白口袋进行定制化筛选。截至论文发表,半年来该平台累计服务1400余名用户完成了1.35万余次筛选。未来,DrugCLIP将与科研与产业生态伙伴深度合作,在抗癌、传染病、罕见病等方向加速新靶点与First-in-class药物(首创新药)的发现。联合团队将持续优化引擎性能,拓展支持模态,助力构建一个更智能、高效与普惠的全球药物创新生态。
研究成果以“深度对比学习实现基因组级别药物虚拟筛选”为题,在线发表在《科学》(Science)期刊上。兰艳艳,生命学院副教授张伟、闫创业,化学系教授刘磊为该论文的共同通讯作者;智能产业研究院博士后贾寅君、计算机系2024级博士生高博文、生命学院博士后谭佳鑫、化学系博士后郑济青以及智能产业研究院博士后洪鑫为共同第一作者。
(智能产业研究院)