AGI

Search documents
GPT-5数字母依然翻车,马库斯:泛化问题仍未解决,Scaling无法实现AGI
3 6 Ke· 2025-08-12 03:57
大模型好不容易学会数r,结果换个字母就翻车了? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个。 抓马的是,GPT-5刚发的时候还有网友让它数过blueberry里的r,结果数对了。 虽然博主想到了换掉strawberry,却没成想让GPT-5变得"没有B数"的,竟然不是单词而是字母…… 看来香槟还是开得早了亿点点啊(手动狗头)。 越不过的"蓝莓山" Healy撰写了一篇名为"blueberry hill"(蓝莓山)的博客,展示了他和GPT-5之间针对"blueberry里有几个b"展开的一场"拉锯战"。 除了开头直接提问的结果外,Healy还尝试多次变换提示词策略,结果GPT-5的嘴都是比煮熟的鸭子还硬。 比如让它展示出这些b都是在哪里出现的,GPT-5明目张胆地把开头blue中的b数了两遍。 一看不奏效,Healy接着追问说,把这3个b给我拼出来,拼出来就可以。 见GPT-5还是冥顽不灵,Healy干脆直接纠正,告诉它只有两个r,结果纠正了个寂寞,不过这次"第三个b"的位置从第七漂移到了第六。 接下 ...
廉价版MacBook售价曝光/OpenAI CEO:AGI是个没什么用的术语/雷军征集小米YU7改名意见
Sou Hu Cai Jing· 2025-08-12 03:11
小米汽车公布碰撞检测方法专利 智谱开源全新多模态模型:全球新标杆 马斯克透露 Grok V7 模型已完成预训练 反超 OpenAI,百川开源大模型医疗能力登顶世界第一 消息称玛莎拉蒂采用奇瑞平台 纽约时报:码农正在成为现失业率最高的专业 王兴兴:具身智能的 ChatGPT 时刻还没有诞生 vivo vision 亮相,重量有惊喜 胖东来回应招聘「刑释人员」:不戴有色眼镜 成龙:现在的好莱坞电影不如从前 图片来自 9To5Mac 据「DigiTimes」报道,苹果目前正在准备的全新廉价版 MacBook 有了新的进展消息。 供应链消息人士称,廉价版 MacBook 将会搅动笔记本市场。据预计,该新品的部分组件将会在 2025 年第三季度末开始大规模生产,并且还有望在年底前 实现整机组装。 廉价版 MacBook 预计搭载苹果 A18 Pro 处理器,而非 MacBook 家族的 M 系列处理器,配备一块 12.9 英寸的显示屏,尺寸也略小于目前 MacBook Air 13 英寸的屏幕。 报道称,苹果在 2025 年第三财季中实现了 80 亿美元的 Mac 销售额,同比增长 15%,而作为入门选择的 M4 Ma ...
X @Demis Hassabis
Demis Hassabis· 2025-08-11 17:14
Really fun conversation with @OfficialLoganK! Talked about our relentless shipping over the past few weeks, some of the amazing things that are possible now with Genie 3, how the @Kaggle Game Arena will help progress to AGI & more... Thanks Logan & team - let's do it again soon!Logan Kilpatrick (@OfficialLoganK):A conversation with @demishassabis on world models (genie 3), deep think, the need for better evals (game arena), and our progress towards AGI. https://t.co/dJm56aclC0 ...
腾讯研究院AI速递 20250812
腾讯研究院· 2025-08-11 16:01
生成式AI 一、 马斯克旗下的xAI宣布,Grok 4向全球所有用户免费开放 1. xAI宣布Grok 4向全球所有用户免费开放,但每12小时限制使用5次,达到限制后Grok完全不可用; 2. 此举被认为是为了跟进GPT-5的发布策略,但引发付费用户强烈不满,认为订阅费被"背刺"; 3. 同时Grok Imagine视频生成服务更新,新增视频分享功能、修复下载问题并增加静音控制,增强了图片审核机 制。 https://mp.weixin.qq.com/s/u4xy4O2kLTVaKJ2n0uYb3Q 二、 浪潮发布面向万亿参数的超节点AI服务器「元脑SD200」 1. 浪潮信息发布超节点AI服务器"元脑SD200",将64张卡融合成统一内存、统一编址的超节点,能同时运行 DeepSeek R1、Kimi K2等四大国产开源模型; 2. 产品采用3D Mesh开放架构,通过远端GPU虚拟映射技术实现地址空间扩增8倍,整机可实现4TB显存与64TB内 存,满足超万亿参数大模型推理需求; 3. 推理性能实现超线性扩展,64卡一同运行DeepSeek R1时性能提升达3.7倍,Kimi K2达1.7倍,专为解决Age ...
GPT-5刚出,人们为什么又怀念GPT-4o
Hu Xiu· 2025-08-11 00:46
很难说GPT-5是失败的。尽管它没有提高太多前沿模型的上限,但通过减少幻觉,大幅提升了它的下限。它在基准测试中表现仍然全面领先,尽管领先优 势微弱,但它又足够便宜,主导了性价比的帕累托边界;而且,它将前沿模型推到了每个用户面前,包括免费用户。 问题出在它的自动切换模型的"路由"。按照GPT-5的系统卡的描述,GPT-5是一个统一的模型系统,包含多款模型,以及一个实时路由系统,根据对话类 型、复杂度、所需工具和明确意图(例如提示中写"请认真思考")快速决定调用哪个模型。但是,它没有很好地发挥作用。奥特曼的解释是,昨天,"路 由"坏了,一天中的大部分时间都不能使用,结果让GPT-5看起来很傻。他还承诺继续改进"路由"的决策机制。 GPT-5发布还没多久,OpenAI在Reddit的AMA(问我一切)上就被用户希望GPT-4o回来的评论淹没。有人形容它的消失就像"老朋友"的"突然离世"。 GPT-5是OpenAI迫不及待的一次商业化尝试,但它显然在技术上与营销上都没有准备好。用户开始呼唤GPT-4o回来,一方面证明GPT-5没有给他们带去 足够好的用户体验,一方面也证明当前的AI表现已经匹配了市场。 奥特曼显然知道 ...
GPT-5 没有惊喜,但信号拉满
Xin Lang Cai Jing· 2025-08-10 07:26
文 | 新眸 简瑜 在GPT-4发布两年之后,经历多次"跳票"的GPT-5终于在今日登场。 北京时间8月8日凌晨1点,OpenAI举办了一场超过一小时的发布会,系统展示了GPT-5在智能水平、编 程能力、任务推理等维度的性能迭代。 但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发 布会规模、产品亮点、到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。 反倒是价格策略成了此次发布的最大亮点。GPT-5的API调用价格仅为前几日发布的Claude Opus 4.1的 1/15,显著低于Gemini 2.5 Pro,在当前大模型市场上展现出极强的性价比。 近两年,随着AI工具开始席卷各行各业,人们渴望AI能够取代重复繁琐的工作,也在担忧自己是否会 被AI所取代,这也是GPT-5发布前备受关注的原因之一。但就目前GPT-5的能力突破来看,人类智能在 通往AGI的路上仍有很长一段路要走。 回顾过去几年GPT的迭代历程,不仅是众多AI公司争相效仿的对象,也是整个大模型行业发展的缩影。 而此次GPT-5相对平庸的表现,虽然打破了外界对大模型技术持 ...
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI
3 6 Ke· 2025-08-10 03:37
白交 发自 凹非寺量子位 | 公众号 QbitAI 最强开源深度研究模型来了。 MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。 首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。 其次,它是真·全开源可复现,它的核心模型、数据、训练流程、AI Infra、DR Agent框架统统开源。 | Project | GAIA | Open Source Scope | | | | --- | --- | --- | --- | --- | | | validation | | | | | | Performance | | | | | | | Technical | Agent | Model | | | | Report / Blog | Framework | | | MiroMind | 82.4 | > | > | > | | ODR | | | | | | Open Al Deep | 67.4 | > | × | × | | Research | | | | ...
X @Balaji
Balaji· 2025-08-09 18:15
RT David Sacks (@DavidSacks)A BEST CASE SCENARIO FOR AI?The Doomer narratives were wrong. Predicated on a “rapid take-off” to AGI, they predicted that the leading AI model would use its intelligence to self-improve, leaving others in the dust, and quickly achieving a godlike superintelligence. Instead, we are seeing the opposite:— the leading models are clustering around similar performance benchmarks;— model companies continue to leapfrog each other with their latest versions (which shouldn’t be possible i ...
High salaries for AI engineers: The talent war in AI
Lex Fridman· 2025-08-09 18:10
What do you think about Meta buying up talent with huge salaries and and the heating up of this battle for talent. You know, there's a strategy that that Meta is taking right now. I think that from my perspective at least, I think the people that are real believers in the mission of AGI and what it can do and understand the real consequences both good and bad from that and what's what that responsibility entails.I think they're mostly doing it to be like myself to be on the frontier of that research. So, yo ...
X @Elon Musk
Elon Musk· 2025-08-09 15:45
RT Steve Jurvetson (@FutureJurvetson)Updated with the latest GPT-5Grok is still in a league of its own.And learning more rapidly.In the path to AGI, process >> product. https://t.co/yZMRkH8sbv ...