化学实验自动化

Search documents
化学实验指令生成模型ChemActor问世
Zhong Guo Hua Gong Bao· 2025-07-23 12:00
据课题组相关负责人介绍,ChemActor可实现非结构化实验描述与结构化实验操作指令"双向翻译",突 破了化学实验自动化的"语言壁垒",能够让AI真正"读懂实验、指导操作"。它并非只"能生成",更 能"写得真"。在两个公开化学实验数据集上,ChemActor相较现有方法在实验指令生成任务中性能提升 平均超过10%,在语义对齐、逻辑合理性与结构还原等方面全面领先。 突破"语言壁垒",让AI"读懂实验、指导操作" 中化新网讯 近日,上海交通大学人工智能研究院AI for Science团队推出业内首个融合链式数据生成和 分布差异筛选的实验指令生成框架大模型——ChemActor。该模型基于70亿参数模型进行微调训练,可 在不依赖人工标注的前提下,自动完成从单分子输入到完整实验流程生成的全过程。 ChemActor具备"读懂实验语言、写出操作指令"的闭环能力,其主要核心创新点有3个:一是首次以 LLaMA-2-7B大语言模型为基座,构建了具备化学实验语言理解能力的专用大语言模型,能够高效生成 结构化实验指令;二是首次提出链式大语言模型合成数据框架,集成了"反应—描述文本—操作指令"三 元组数据,能够缓解标注数据稀缺 ...