Workflow
Clinical Medicine
icon
Search documents
让科研人员不再做牛马!斯坦福大学华人团队打造首个通用生物医学AI智能体,从设计实验、数据分析到药物发现全自动搞定
生物世界· 2025-06-10 08:21AI Processing
编辑丨王多鱼 排版丨水成文 生物医学研究是增进人类对健康和疾病的理解、推动药物研发以及提升临床护理水平的基础。 然而,在生物医学实验室中,科研人员往往被复杂的实验方案、庞大的数据库、五花八门的分析工具以及不停更新的海量文献所淹没。生物医学研究日益受到这 些重复且分散的工作流程的制约,让科研人员疲于奔命, 严重减缓了科学发现的速度,限制了科学创新。这凸显了科学界对根本性新方法的迫切需求——一种能 够 有效扩展科学专业知识、简化研究工作流程,并充分释放生物医学研究潜力的全新路径。 2025 年 6 月 2 日, 斯坦福大学 黄柯鑫 、 Serena Zhang 、 王瀚宸 、 屈元昊 、 陆荧洲 等研究人员领衔的团队,联合 Genentech、Arc Institute、 加州大学 旧金山分校及 普林斯顿大学等 多个顶尖研究机构,发布了一款 通用生物医学 AI 智能体 —— Biomni ,该智能体能够自主完成横跨遗传学、基因组学、微生物 学、药理学和临床医学等多个生物医学分支领域的复杂研究任务 。 Biomni 的诞生标志着 AI 在生物医学研究中从"工具使用者"向"自主决策者"的跃迁 。通过将分散的科研资源整 ...
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
量子位· 2025-06-03 06:21
西风 发自 凹非寺 量子位 | 公众号 QbitAI 斯坦福最新大模型医疗任务全面评测, DeepSeek R1 以66%胜率拿下第一 ! 歪国网友纷纷被惊艳住了,原因在于该评测 重 点聚焦临床医生的 日常工作场景 ,而非仅局限于传统医疗执照考试题。 要评测就要全 方 位。 31页论文最终得出,DeepSeek R1、o3-mini、Claude 3.7 Sonnet等在内的9个前沿大模型,DeepSeek R1以66%胜率、0.75宏观平均分 领先。 为当前的基准测试结果,团队还打造了一个可公开访问的排行榜。 团队构建了 含35个基准测试的综合评估框架 ,覆盖 22个子类别 医疗任务。 整个评测的分类体系还经过了临床医生验证, 由29名来自14个医学专科的执业医师共同参与开发 。 光作者名单就老长,斯坦福大学医学院、斯坦福医疗中心、斯坦福大学基础模型研究中心 (CRFM) 、微软的研究人员均在列。 | Accuracy | Efficiency | General information | | | | | | | | | | --- | --- | --- | --- | --- | --- | --- ...