距离 AlphaFold2 刷屏学术圈已经一月有余,当时施一公在 DeepTech 独家专访中的“金句”也被频频引用,他评价 AlphaFold2 称:“依我之见,这是人工智能对科学领域最大的一次贡献,也是人类在 21 世纪取得的最重要的科学突破之一。”
中国工程院院士李国杰在《中国科学报》的评论文章中,也引用了这句话,但他同时表示:“ 目前我国的大学和企业的人工智能实验室大多遇到顶天顶不了、立地又落不下去的困境。”
与此同时,国内一家知名研究院的院长告诉 DeepTech,中国并非没有能力做到 AlphaFold,而是缺乏布局。
8 月 30 日,归国博士王鲁泉担任联合创始人的信华生物公布了一款VibrantFold 平台,其可用于抗体结构预测,并基于该公司的 Bumblebee 深度学习框架。
图 | 为纳米抗体的实验解析结构与 VibrantFold 预测结构对比(来源:受访者)
据悉,在创办该公司之前,王鲁泉是金斯瑞集团创始人、也是该公司基因密码子优化算法的共同发明者。1996 年,其博士毕业于美国新泽西州罗格斯大学。
他告诉 DeepTech,在从事生物信息工作之前,自己是传统分子生物学家。读博期间,就开始用代码解决生物学数据的分析问题。
毕业后,王鲁泉进入一家世界 500 强药企先灵葆雅(Schering-Plough),该公司在大分子药物的布局和研发上都比较领先,期间他参加了基于功能遗传学、药物基因组学、转录组学的系统性靶点发现平台的建设,并把这些平台应用于多个治疗领域的靶点发现的合作研究中,特别是该公司代表性药物之一的Zetia的靶点发现,推动了脂代谢生物学的进步。此外,他还曾担任纽约哥伦比亚大学医学信息学分析硕士讲师。
2003 年,他和当时在先灵葆雅一起工作的同事Frank共同回国,创立了金斯瑞。作为一家医药研发合同外包服务机构(CRO),该公司旨在为生物医药研发提供高质量、低成本的定制生物试剂服务。
图 | GenScript 官网(来源:资料图)
2015 年,金斯瑞在香港上市,后来在一切进入正轨后,王鲁泉决定换一个战场去追逐对于科研和信息技术的兴趣。
他告诉 DeepTech:“我逐渐看到了人工智能技术的巨大进步,以及其将为药物研发行业带来的革命浪潮的到来。生物学和制药学都非常复杂,信息技术表达的是这些学科的逻辑,而最终主宰故事的还是生物学本身。这几年,我全力投入到信息技术在制药研发当中的应用。信华对生物学的精准理解,以及对大分子药物工程的研究做了很多的努力和尝试。”
图 | 王鲁泉(来源:受访者)
VibrantFold:绝大多数抗体结构的预测可在 1 分钟内完成
谈及相比 AlphaFold2 和 RoseTTAFold,VibrantFold 有哪些优势,王鲁泉告诉DeepTech:“AlphaFold2 和 RoseTTAFold 都是非常出色的基于 AI 的结构预测软件,非常适合一次性结构预测,比如靶点结构预测。而 VibrantFold 主要聚焦于抗体及抗体无序区的结构,聚焦于抗体虚拟筛选的应用而生。
其主要优势有两点:第一是速度,VibrantFold 的速度及成本提升多个数量级,以满足大量虚拟筛选的需要;第二是解决了双链抗体的问题,由于大部分抗体是双链的,因此双链抗体的结构预测比单链抗体更困难。而双链问题需要解决双链间 PPI( protein protein interaction,蛋白质相互作用)的问题,而恰好 VibrantFold 能把双链抗体正确折叠出同样的精度。”
图 | 双链抗体的实验解析结构与 VibrantFold 预测结构对比(来源:受访者)
在公布该成果的部分消息之前,VibrantFold 也和 AlphaFold2 和 RoseTTAFold 一同进行了内测,并通过比较预测结构和实验结构的差异性,对以上三个结构预测平台进行评分。
在内测中,VibrantFold 对于绝大多数抗体结构的预测可以在 1 分钟内完成,其预测精准度经过了结构生物学家的测评和验证。
该公司表示,VibrantFold 在计算效率上,比上述两个软件提升多个数量级。信华生物资深 VP 张剑冰博士表示:“VibrantFold 精准预测抗体结构的速度使得我们筛选数以千万计的虚拟抗体成为可能。目前我们可以不用合成突变文库,完全用电脑就可以产生一个包含数以千万计抗体分子的虚拟抗体突变文库,而且这个结构抗体库的容量几乎可以无限放大。
结构是抗体性质和功能的基础,构建高通量抗体虚拟结构 Virtual Library 是实现 AI 主导的抗体药物工程的第一步。根据已经公开发表的文献,目前全球只有 VibrantFold 可以实现这一高效抗体结构预测和高通量虚拟抗体结构文库构建功能。”
图 | 纳米抗体的实验解析结构与 VibrantFold 预测结构对比(来源:受访者)
王鲁泉告诉 DeepTech:“很多人问到我们为什么能把模型做得这么轻巧,这是因为我们的算法通过模型压缩和知识蒸馏,大大提高了算法的效率,因此能做到精度与速度的统一。”
其还称:“清华大学的张林琦教授团队、王新泉教授团队和西湖大学的周强研究员团队提供了尚未发表的抗体结构用于预测。结果表明,上述三个预测平台都可以实现高精度结构预测。”
据介绍,信华生物成立于 2019 年,对于公司定位王鲁泉称:“这几年信华深度学习团队坚持抗体结构预测算法的攻关,在核心算法框架上有原创性突破。另外很重要就是聚焦,在细分领域(AI 大分子制药)里面做到极致。VibrantFold 仍然在进一步迭代的路上。”
由于该公司聚焦于解决大分子制药的痛点问题,这些问题同时也是具有挑战性的数学问题,因此研发团队主要由业内多年深耕的抗体药物工程学家和年轻一代的深度学习团队组队。
近年来,大分子药物在全球医药市场大放异彩,尽管发展历史远短于小分子药,但2020年全球20大畅销药物已有 14 个是大分子药物,而抗体是其中占比最高、发展最为成熟又增长迅速的一个类别。在小分子领域,虚拟筛选的应用已经颇为广泛,但由于大分子结构的复杂性,大分子药物的虚拟筛选仍然是全球范围内的难题。近年的 PEGS 会议趋势表明,双抗、多抗药物的发展更进一步加剧了大分子药物的工程化难度,极大增加了对大分子药物虚拟筛选的迫切需求。
西湖大学周强教授也表示,“蛋白质结构预测的突破是对以往所有结构生物学知识和信息的有效综合,同时也将促进这些知识和信息在产业上的有力应用。”
王鲁泉认为,药物开发的链条长且复杂,利用硅基计算的优势可实现 “端到端”的药物设计和药效预测,从而大大提升药物开发的效率。而幕后真正的英雄是近几十年辛勤结晶的结构生物学家们,AI 在结构预测的成功是站在这群巨人的肩膀上。VibrantFold 高效准确的抗体结构预测功能让科学家向着实现高效高质量的大分子药物多目标工程优化和筛选的梦想又迈进了一步。希望这些工具为智能大分子药物越发挑战的工程问题添砖加瓦。
目前 VibrantFold 已发布,正处于内测阶段。对于该产品的具体使用,该公司计划将其开放给全球学术用户和工业用户,以进行抗体精准结构的预测。目前,为了保证软件服务的质量,信华生物正在逐渐扩大内测用户。

