荣格工业资源APP
了解工业圈,从荣格工业资源APP开始。
12 月 20 日,《自然》(Nature)报道了一套人工智能系统「科学家」(Coscientist),它可以设计、编码和执行若干反应,利用其机器人装置,在湿实验室中制造包括扑热息痛和阿司匹林在内的化合物。
人工智能(AI)的飞速发展使新工具的应用遍及整个科学领域。 但是,对于在工作台工作的研究人员,或那些不精通计算机代码的人来说,人工智能方法并不那么容易获得。
广为熟知的 ChatGPT 背后的大语言模型(LLM)的最新版本 GPT-4 于今年 3 月发布,美国宾夕法尼亚州匹兹堡卡内基梅隆大学的化学家Gabe Gomes和他的团队便随后开始着手让它为化学家服务。
Coscientist 的研究团队从美国西北大学美国国家科学基金会化学合成中心和圣母大学美国国家科学基金会计算机辅助合成中心获得支持和培训。
图:左至右为Robert MacKnight、Gabe Gomes、Daniil Boiko
他们的研究成果「Coscientist」,利用包括 GPT-4 在内的最新强大 LLM,搜索化学文献,并在人类的提示下设计出制造分子的反应路径。 LLM 会阅读互联网上的使用手册,并决定使用其武器库中的最佳试剂盒和试剂,在现实生活中制造分子。
该人工智能还使用了加利福尼亚州旧金山人工智能公司Anthropic开发的LLM Claude,以及阿联酋阿布扎比技术创新研究所构建的Falcon-40B-Instruct 系统。
通过软件模块,研究人员让 Coscientist 能够做所有研究化学家都会做的事情:搜索有关化合物的公共信息,查找和阅读有关如何控制机器人实验设备的技术手册,编写计算机代码以进行实验,以及分析所得数据以确定哪些有效,哪些无效。
设计、编码、合成
研究小组利用该系统计划合成几种已知分子,包括止痛药扑热息痛和阿司匹林,以及有机分子硝基苯胺和酚酞。 在计划阶段,Coscientist 能够计算出总反应产率最高的步骤。 它正确地制造了这些分子。这一结果展示了利用 LLM 探索文献,帮助提出可行化学反应的想法。
研究人员对大型语言模型进行了单独测试和比较,包括两个版本的 GPT,其中一个软件模块允许它像人类化学家那样使用谷歌在互联网上搜索信息。然后,根据是否能得到所需的物质、步骤的详细程度以及其他因素,对得出的程序进行检查和评分。支持搜索的 GPT-4 模块获得了最高分,它是唯一一个合成布洛芬的程序质量合格的模块。
进一步的测试包括软件模块,使 Coscientist 能够搜索和使用描述应用程序接口的技术文件,从而控制机器人实验室设备。 这些测试对于确定 Coscientist 能否将其合成化合物的理论计划转化为计算机代码,从而在物理世界中指导实验室机器人非常重要。
研究小组还尝试了一个更复杂的实验,即要求 Coscientist 执行「铃木反应」(Suzuki–Miyaura coupling),该系统也通过了这项测试。
该研究小组是众多致力于研究由 LLM 驱动的「化学机器人」(chemistry robots)的研究组织之一。
纽约罗切斯特大学的化学家 Andrew White 领导了开发另一个同时开发的机器人ChemCrow ,它也可以规划和制造一系列分子,包括杀虫剂DEET。
加速发现,推动科学研究普及
自然界的规模和复杂程度几乎是无限的,其中蕴藏着难以计数的发现,等待着被发现。 新的超导材料可以显著提高能源效率,新的化合物可以治疗原本无法治愈的疾病,延长人类寿命。 然而,获得实现这些突破所需的教育和培训是一个漫长而艰辛的旅程。 成为科学家很难。
Coscientist 的研究团队认为,类似的人工智能辅助系统是一种解决方案,可以弥合尚未开发的浩瀚自然与训练有素的科学家供不应求之间的差距。「人类科学家也有比如睡觉和偶尔走出实验室的需求,而由人类指导的人工智能可以全天候地帮助思考,翻阅文献,多次检查实验结果的可复制性。」人工智能可以实现资源和理解的大规模普及化。
不过,目前这些人工智能系统可以完成常规任务,但大多数研究问题,尤其是药物发现方面的问题,仍然遥不可及。不仅需要对化学有很好的理解,还需要对生物学有很好的理解。人工智能化学家机器人能做的事情,人类科学家也能做。人类的创新灵感、热情火花是无法被机器取代的。
打开AI的潘多拉盒子之后,我们也需要仔细考虑如何更加合理地使用这些新技术。
参考:
Boiko, D. A., MacKnight, R., Kline, B. & Gomes, G. Nature 624, 570–578 (2023).
Bran, A. M. et al. Preprint at https://arxiv.org/abs/2304.05376 (2023).