DeepScientist系统
Search documents
首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%
量子位· 2025-10-08 13:06
△ 对比DeepScientist与人类专家的研究进展 在AI文本检测任务中,DeepScientist仅用两周时间就实施和验证了超过 1000种 不同的假设,在此期间取得了相当于人类三年的进展。 在RAID数据集测试中,DeepScientist设计的方法实现了 7.9% 的AUROC提升,成功 超越了人类现有SOTA方案 。 另外DeepScientist还在智能体失败归因、LLM推理加速等任务上也分别达成了新的SOTA。 DeepScientist团队 投稿 量子位 | 公众号 QbitAI 人类科学家三年的工作量,如今AI两周就能轻松搞定! 最近,来自西湖大学的自然语言处理实验室发布了 DeepScientist 系统,这也是 首个 具有完整科研能力,且在无人工干预下,展现出目标 导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。 下面是更多详细内容介绍。 从"科研助理"到"首席科学家":AI科研模式的变革 过去的AI Scientist系统,如果不给定一个清晰明了的科研目标,就很容易陷入对现有知识的机械组合与无效试探的窠臼中,最终形成的科研 产出在人类专家看来缺乏焦点,科学价值不高 ...