在所有可能的化学化合物中,预计有介于 $10^{20}$ 和 $10^{60}$ 的化合物可能作为小分子药物具有潜力。实验评估这些化合物对化学家来说耗时太长。因此,近年来,研究人员开始利用人工智能帮助识别可能成为良好药物候选者的化合物。MIT的助理教授Connor Coley博士是其中一位研究者,他在化学工程和电气工程与计算机科学系以及MIT Schwarzman计算学院担任职务。他的研究跨越化学工程与计算机科学的界限,开发和部署计算模型分析大量可能的化学化合物、设计新化合物以及预测生成这些化合物的反应路径。
Coley表示:“这是一种非常通用的方法,可以应用于有机分子的任何应用,但我们主要考虑的应用是小分子药物发现。”
Coley的科学兴趣源于家庭背景,他的家族中科学家多于非科学家,包括他的父亲(放射科医生)、母亲(获得分子生物物理与生物化学学位后进入MIT斯隆管理学院)以及祖母(数学教授)。在俄亥俄州都柏林的高中期间,Coley参加了科学奥林匹克竞赛,16岁毕业。随后,他就读于加州理工学院,选择化学工程作为专业,因为它结合了他对科学和数学的兴趣。在本科阶段,他还追求计算机科学的兴趣,在结构生物学实验室使用Fortran编程语言帮助解决蛋白质的晶体结构。
毕业后,Coley于2014年来到MIT攻读博士学位,受到Klavs Jensen和William Green教授的指导,致力于优化自动化化学反应。他的研究专注于将机器学习与化学信息学结合,运用计算方法分析化学数据,规划可能生成新药分子的反应路径。此外,他还设计了可以自动执行这些反应的硬件。这部分工作是通过一个名为Make-It的DARPA资助项目进行的,旨在利用机器学习和数据科学改进从简单构件合成药物和其他有用化合物的过程。
Coley在研究生期间开始申请教职,并在25岁时接受了MIT的聘请。他表示:“MIT在资源和跨学科流动性方面非常特别,支持AI与科学的交叉,形成了一个充满活力的生态系统。”
在加入MIT之前,Coley推迟了一年担任教职,以在Broad Institute进行博士后研究,积累化学生物学和药物发现的经验。在那里,他寻找小分子,筛选来自数十亿候选者的DNA编码库,寻找可能与疾病相关的突变蛋白结合的候选化合物。2020年回到MIT后,他建立了自己的实验室,旨在利用AI合成现有的具有治疗潜力的化合物,同时设计具有理想性质的新分子及其合成方法。
在过去几年中,他的实验室开发了多种计算方法来实现这些目标。Coley说:“我们努力思考如何将化学中的挑战与潜在的计算解决方案最佳匹配。”他实验室开发的一种被称为ShEPhERD的模型,能够根据药物分子的三维形状评估潜在的新药分子与目标蛋白的相互作用。目前,制药公司正在使用该模型帮助发现新药。
Coley表示:“我们试图为生成模型赋予更多的药物化学直觉,使模型了解正确的标准和考虑因素。”在另一个项目中,他的实验室开发了一种名为FlowER的生成AI模型,能够预测结合不同化学输入所产生的反应产物。在设计该模型时,研究人员纳入了基础物理原理的理解,例如质量守恒定律,并要求模型考虑从反应物到产品的路径中必须进行的中间步骤的可行性。这些约束提高了模型预测的准确性。
Coley表示:“考虑这些中间步骤、涉及的机制以及反应如何演变是化学家非常自然的思考方式。这是化学教学的内容,但模型并不自然考虑这一点。”
他的实验室学生还参与许多与化学反应优化相关的领域,包括计算机辅助结构阐明、实验室自动化和最佳实验设计。Coley总结道:“通过这些不同的研究方向,我们希望推动AI在化学领域的前沿发展。”
博主点评: 这项研究展示了AI与化学的结合如何推动药物发现的革新。通过机器学习模型的应用,不仅提高了药物筛选的效率,还为化学反应的理解提供了新的视角。未来,AI在化学领域的应用可能会大幅加速新药的开发进程。