Workflow
2天完成人类12年工作,AI自动更新文献综述,准确率碾压人类近15%
量子位·2025-06-16 10:30

鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 当碳基生物还在为写文献综述,打开了一百个浏览器窗口时,隔壁AI已经卷起来了。 (doge) 两天完成人类12年工作 —— 医学研究领域中,系统评价 (SRs) 作为临床决策的黄金标准,平均耗时超过16个月,花费10万美元以上,且容易延长无效或有害治疗方法 的使用。 于是多伦多大学、哈佛医学院等机构联合开发了AI端到端工作流程—— otto-SR 。 结合 GPT-4.1 和 o3-mini 进行筛选和数据提取,仅花费两天时间就完成了传统方法需要12年才能完成的Cochrane系统评价更新。 用于系统综述自动化的智能工作流程 团队引入了一种基于LLM的端到端工作流程 otto-SR ,支持从初始检索到数据分析,完全自动化和人机协作的系统综述流程。 otto-SR首先会收集从原始检索中识别的RIS格式的引用文献,GPT-4.1随即会作为独立评审员进行筛选。 筛选出的文章集合将输入o3-mini-high模型进行数据提取,其中PDF格式将会由Gemini 2.0 flash处理并转换为结构化Markdown文件,并用 于下游任务。 具体而言,可以细分为筛选和提取 ...