Workflow
AI 月报丨大模型下半场与产品成败的关键;拥有更多用户可能会让模型更强;全球算力投资又凉了一些
晚点LatePost·2025-05-09 07:11

2025 年 4 月全球 AI 重要趋势。 文 丨 贺乾明 编辑 丨 高洪浩 2025 年 4 月的 AI 月报,你会看到: 以下是我们第 6 期 AI 月报,欢迎大家在留言区补充我们没有提到的重要趋势。 评估(Evals):大模型下半场的焦点,AI 产品成败的关键 "评估(Evals)" 成为模型和 AI 产品开发的关键词 Google 继续提升 Gemini 模型能力的思路 OpenAI 的 GPT-4o 为什么变得谄媚,以及背后的问题 用户规模与模型能力提升关系不大?可能要有变化了 业务周期影响,全球的算力投资又放缓了一些 AI 安全成为投资新风向,单月有 10 家相关公司拿到超 5000 万美元融资 中国大厂的 Agent 产品上线,面临创新窘境 模型的基准测试得分≠实际能力,要靠更好的评估提升能力 OpenAI 研究员姚顺雨发布文章,称大模型行业将要进入下半场。上半场 AI 的发展主要是找到有效训 练模型的方法,让它解决图像识别、语言理解等广泛的问题,而下半场则需要找到可行的方案, 让模 型解决人们生活和工作中更实际的问题。 他认为,焦点将从解决问题转向定义问题,在这个时代 "评估(衡量模型效果)变 ...