AI Agent 也能做量子物理实验了!
近日,英国牛津大学曹舒翔博士使用基于大模型的 AI Agent,成功地让真人实验人员告别了繁琐重复的实验工作。具体来说,曹舒翔博士和合作者所搭建的 Agent 能够理解科研人员使用自然语言所描述的实验过程和实验目标,结合它自带的知识库,自行完成量子物理实验的设计、执行和数据分析。
图 | 曹舒翔(来源:曹舒翔)
他们把这套系统部署在了自己的超导量子计算实验平台上,成功实现了单比特和两比特量子门的自动校准。而且,Agent 可以根据科研需要在量子计算机上生成量子态并进行分析。在这个案例展示之中,最复杂的部分是两比特门的自动校准。而本次设计的 Agent 在没有人为干预的情况下,进行了大约 3 个小时的自动实验,并成功找到多组可以实现两比特门的参数组合。
(来源:arXiv)
相比其他的工作,曹舒翔博士和合作者所搭建的 Agent 针对实验物理学研究场景实现了三个功能:
第一,Agent 能够根据科研人员提出的实验描述和实验目标,设计出全部的实验步骤,并把实验步骤转换为一个“状态机”,即无论是实验成功还是实验失败,Agent 都能知道下一步该做什么。在这种情况下,Agent 自动规划的工作流程更加可靠,要么能够工作到实验成功完成,要么会在进入无法恢复的不得已状态下向科研人员求助。
第二,Agent 能够动态分析并理解已经存在的操作仪设备的代码库,将每一步实验通过这些代码库实现出来。实验人员可以随时向代码库中修改或添加新的仪器操作接口增强 Agent 的实验能力。
第三,在每一个实验完成之后,Agent 能够自行分析实验数据,借此判断这次实验是否成功达到预期目的。如果不成功,它会先判断是否需要重新调整参数;如果需要,它将自行调整参数。与此同时,在这一步的结果会返回给“状态机”并驱动“状态机”的运行。
要实现以上的功能,需要让大模型掌握整个实验所需的知识。曹舒翔和所在团队设计的 Agent,相比此前已有系统有着三个重要改进。
首先,Agent 能够根据知识把实验步骤转化为“状态机”,并让大模型来决定状态的更新和跳转。曹舒翔表示通过本次研究,他们证明使用“状态机”可以成功稳定的实现复杂实验流程的自动化。
其次,Agent 能将知识同时从代码和文档里提取出来,并能进行结构化的整理和存储。在进行实验设计或代码生成时,Agent 可以进行高效快速的查询,并能翻译成实验脚本代码。相比直接生成大段的代码,这一方案更加符合自动化实验的场景,且具有较好的稳定性。
再次,在曹舒翔等人所打造的知识库之中,包含了图片的多模态数据,他们还通过引入小样本学习,并使用多模态大模型针对实验数据进行解读。借此发现,很多实验很难仅仅通过自然语言来对实验成功与否进行精确描述。而该团队先给模型展示一些成功和失败的案例图片,再把采集到的数据转化为图片并让模型进行分析,借此极大提升了模型准确率。
总的来说,Agent 可以极大降低超导量子计算平台的实验成本,并能把科研人员从技术细节和工程细节中解放出来。同时,曹舒翔认为本次解决方案的适用范围非常广泛,不仅能用于量子计算,也能用于其他类型的科学研究,甚至能用于工业和服务业的复杂自动化场景中。
(来源:arXiv)
据了解,曹舒翔本科毕业于浙江大学竺可桢学院,并在毕业后到牛津大学攻读博士。在此期间,由他联合创立的量子人工智能公司 Rahko 于 2022 年被美国生物技术公司 Odyssey Therapeutics 收购。曹舒翔目前在牛津大学从事博士后研究,主要研究 AI 在科研领域可能的运用场景。该研究的共同一作张子健来自加拿大多伦多大学的 Alan Aspuru-Guzik 课题组,他的研究专注于 AI Agent 的知识表示和人机交互。
曹舒翔表示,本次研究受到了早期 GPT Agent 工作 AutoGPT 的启发。最早的 AutoGPT 能在给定一个任务目标之后,一步一步地实现目标,并能使用搜索引擎和文件创建等简单的工具。
在本次研究之中,曹舒翔等人先是开展了一些预实验,比如让一些早期 Agent 直接控制量子计算设备。但是,实验效果却是差强人意,主要是因为模型无法了解他们的实验要求,只能照猫画虎地进行“看似有用实则无用”的操作。在曹舒翔等人看来,这其实就是模型在没有知识储备的情况下进行的“敷衍”。
后来,领域内的其他团队开始使用更复杂的检索增强生成(RAG,Retrieval-Augmented Generation)方法,来将具体场景的知识提供给模型,借此来增强模型的能力。
后来,曹舒翔等人调研了很多其他 Agent 的实现方法,借此提出一种适合该团队研究场景的解决方案。与此同时,他们提出一个针对实验知识进行整理和存储的方案,即通过撰写结构化文档的方式,不仅能让大模型进行快速索引并查找到相关内容,还能为人类进行分析和阅读。
通过以上方案,让模型拥有了使用量子实验设备的能力。在接下来的研究中 Agent 首先在模拟构建的量子计算设备测试环境中进行了进行交互,验证了准确性后在真实量子计算设备上进行了验证。
期间,该团队测试了很多方案。例如,在最早的方案之中他们并没有引入“状态机”,而是让模型直接生成长脚本并完成实验,但是他们发现,目前的模型还不足以直接完成这类复杂任务。
于是,他们通过引入更多的 Agent 并把任务加以细分,借此找到了每个功能的最佳实现方法,并将它们进行整合,进而在真实量子计算机上成功完成测试。
但是,测试中他们发现此前构建的系统稳定性欠佳,原因是大模型很难去解读实验数据。由于这些数据是模型完全没有见过的,因此通过语言描述很难进行准确区分。
为此,他们尝试了很多方法,包括直接分析文字数据、让模型自己写代码进行数据分析并解读分析结果等。最后,他们发现最稳定和最实用的方案是:使用小样本学习配合多模态的方式,来教会模型却解读数据。
完成以上步骤之后,他们使用大模型针对量子计算机进行自动校准的复杂实验,成功校准了单比特门和两比特门,同时展示了模型根据真人科研人员指令快速构建新实验的能力。
(来源:arXiv)
日前,相关论文以《应用于量子计算的自动化实验室智能体》(Agents for self-driving laboratories applied to quantum computing)为题发表在预印本网站arXiv上 [1]。同时,曹舒翔博士在 2025 年美国物理学会全球峰会上(APS Global Summit 2025)以《利用基于知识的 AI 智能体实现实验自动化:超导量子处理器案例研究》(Automating Experiments with Knowledge-Based AI Agents: A Case Study in Superconducting Quantum Processors)对相关工作进行了汇报 [2]。
图 | 相关论文(来源:arXiv)
未来,曹舒翔等人将研究如何让参数更小的模型来驱动他们所搭建的Agent。该团队目前的 Agent 框架尚未涉及到针对模型的微调,这就要求驱动这个框架的模型的本身能力必须足够好。比如,目前得使用 GPT-4、Claude-3-Opus 等模型才能产生比较稳定的效果。所以,未来他们将通过微调方式或蒸馏方式来使用参数更小的模型,以及降低框架所需要的推理开销。
图 | 美国物理学会全球峰会(来源:曹舒翔)
同时,他们还将增强模型对于科学数据的理解。目前,该团队将扫描到的结果生成为一张带有坐标系的二维图片,尽管模型可以识别出图片中科研人员感兴趣,并希望更进一步进行精细扫描研究的部分,但却不能准确指出具体的参数范围。因此,他们将进一步研究能够处理科学任务的多模态模型。
最后,他们将通过寻找合适的优化方法,来让模型更高效地部署到边缘计算设备上,从而让本次案能够适用于更多应用场景。
参考资料:
1.https://arxiv.org/pdf/2412.07978
2.https://summit.aps.org/events/MAR-G18/4
运营/排版:何晨龙