Llama 3

Search documents
马斯克宣称Grok智能超越人类,图像训练短板待补:一个月内或迎关键突破
Sou Hu Cai Jing· 2025-07-10 06:02
尽管性能领先,马斯克坦言Grok 4仍存在"致命缺陷"——图像理解能力不足。他解释称,当前版本的 Grok在处理抽象图像、复杂场景和动态视觉信息时,准确率较文本任务低40%以上,例如难以识别手绘 草图中的隐喻含义,或区分照片中微小物体的功能属性。 "这就像一个天才数学家看不懂漫画书。"马斯克比喻道,"我们需要为Grok植入更强大的'视觉大 脑'。"据xAI技术团队透露,改进方案包括升级多模态大模型架构、引入3D空间感知算法,并扩充包含 10亿张高分辨率图像的专用训练集。马斯克承诺,新版本将于"一个月内"完成部署,届时Grok将实现文 本、图像、视频的跨模态无缝交互。 2025年7月10日,智通财经电——在今日举行的xAI直播活动中,特斯拉与SpaceX创始人埃隆·马斯克公 开表示,其旗下人工智能公司xAI开发的聊天机器人Grok已在"大多数领域展现出超越人类的智能水 平",但当前版本的Grok 4仍存在图像理解盲区,需通过改进后的图像训练模块优化,预计问题将在一 个月内解决。 马斯克在直播中直言:"Grok 4在逻辑推理、多模态交互和复杂任务处理上已显著优于普通人类,甚至 在部分专业领域接近顶尖专家水平。"他 ...
Meta 对 AI 的痴迷对 AMD 来说是个好消息
美股研究社· 2025-07-09 11:25
作 者丨 LL Insights 编译 | 华尔街大事件 这种新趋势出现的时机,恰逢 AI 加速器供应结构性短缺。由于 HBM 产能紧张,英伟达的订单 排期已到 2026 年之后,云服务商急需一个可靠的备选供应商。AMD 的小芯片(chiplet)策略 使其能以更低的边际硅成本整合更多内存通道,相比单片设计的竞争对手拥有物料成本优势 —— 在 192GB 容量下,每块 GPU 能节省数万美元。当数据中心的电力和空间预算有限时,这种成本 差异在数万个节点的规模下会变得无法忽视。 软件方面的障碍也不再难以逾越。ROCm 6.2 版本新增了原生 vLLM 和 Bits-and-Bytes 支持、 FP8 内核及全新性能分析工具,在训练和推理场景下与 CUDA 的效率差距大幅缩小。Meta 公开 表示,其 Llama 3.1 的生产流量已完全由 MI300X 集群承载,这说明 AMD 的软件栈已经能胜任 最严苛的实时推理工作负载。随着越来越多开源仓库接受 HIP 代码提交,客户的切换成本会逐季 降低。 Instinct MI300X 是首款将 192 GB HBM3e 与 5.3 TB/s 带宽集成于一体的数据中心 ...
“数字读心术”精准模拟和预测人类行为
Ke Ji Ri Bao· 2025-07-06 23:34
德国亥姆霍兹慕尼黑研究中心开发出一款名为"半人马"(Centaur)的人工智能(AI)模型,能在几乎 所有心理学实验中准确预测人类行为,甚至超越了科学家数十年来打造的传统认知模型,堪称"数字读 心术"。这项研究发表在最新一期《自然》杂志上,被认为是AI与心理学融合的重要突破。 心理学家长期以来渴望找到一种既能解释人类思维方式,又能准确预测人类行为的工具。现有模型往往 局限于其中之一,"半人马"的出现改变了这一现状。 "半人马"的核心是Psych-101,这是一个包含160项心理实验中6万多人作出的超1000万个决策的数据 集。这些决策涵盖从简单的记忆任务到复杂的道德困境。每个实验都经过精心标准化,并用自然语言重 写,以便AI能够理解并从中学习。 在模型构建上,团队选用了Meta公司最新的Llama 3.1语言模型,并基于海量人类决策数据集进行了微 调,使其能预测一系列典型的行为,而不仅仅是单一行为。团队用Psych-101数据集对模型进行训练, 整个过程在高端计算机处理器上仅耗时5天。 训练完成后,团队将"半人马"模型与十余种行为预测模型进行了比较,测试对象是未参与最初训练集的 全新受试者。在32项任务中," ...
过度炒作+虚假包装?Gartner预测2027年超40%的代理型AI项目将失败
3 6 Ke· 2025-07-04 10:47
Gartner 高级分析师 Anushree Verma 表示:"目前大多数代理型 AI 项目仍处于早期实验或概念验证阶 段,其背后的主要驱动因素是炒作,而这些技术往往被错误地应用。这可能使企业忽视 AI 代理大规模 部署所需的真正成本与复杂性,导致项目迟迟无法落地。企业需要穿透炒作迷雾,制定更为审慎和战略 性的决策,明确在哪里、以及如何采用这一新兴技术。" 2025 年 1 月,Gartner 对 3412 名网络研讨会参与者进行了一项民意调查,发现 19% 的组织报告在代理 型 AI 方面进行了大量投资,42% 的组织进行了保守投资,8% 的组织根本没有投资,31% 的组织正在 等待或不确定。 更为值得关注的是,Gartner 发现了一种普遍存在的"代理清洗"趋势,即供应商将现有的人工智能助 手、聊天机器人或机器人流程自动化 (RPA) 工具重新包装成"代理人工智能",而实际上并没有提供真 正的代理功能。Gartner 估计,在数千家声称提供代理解决方案的供应商中,只有约 130 家真正提供了 真正的代理功能。 当人工智能在大模型能力突破、推理能力提升以及多模态技术进步的推动下走向新阶段,"Agentic ...
AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI
量子位· 2025-06-26 03:43
不圆 发自 凹非寺 量子位 | 公众号 QbitAI 无需原作者同意, AI可以用已出版书籍作训练数据了 。 就在最新判决的诉讼中,美国法院裁决:允许Claude背后公司Anthropic在 未经作者许可 的情况下,使用 合法购买 的已出版书籍训练AI。 法院参考了美国版权法中的"合理使用" (Fair Use) 原则,认为AI训练属于"转化性使用" (Transformative Use) ,即对原作品的新用途 未取代原作市场,且有利于技术创新和公共利益。 这是美国法院首次认可AI公司对书籍的 使用权 ,保护人工智能公司在使用受版权保护的文本训练 LLMs 时不受限制: 大大降低了AI训练数据的 版权风险 。 对此,不少网友的看法是这样的:既然人类读书并加以理解是毫无争议的,那AI读书并理解也应该合理。 怎么一回事? 对Anthropic的指控,由三位作家在2024年8月发起。 2、原告对于Anthropic的指控是: 非法复制作品(包括盗版和扫描版)用于训练AI,侵犯版权 。 值得关注的是,Anthropic的案件不仅针对使用已出版书籍训练AI,还涉及到书籍的来源问题: 2021年,Anthropic的联 ...
大模型全员0分!谢赛宁领衔华人团队,最新编程竞赛基准出炉,题目每日更新禁止刷题
量子位· 2025-06-18 09:17
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 好夸张…… 参赛大模型全军覆没,通通0分。 谢赛宁 等人出题,直接把o3、Gemini-2.5-pro、Claude-3.7、DeepSeek-R1一众模型全都难倒。 到底是什么让一众领先模型一败涂地? LiveCodeBench Pro :一个包含来自IOI、Codeforces和ICPC的竞赛级编程问题的 实时 基准测试。 题库还 每日更新 ,来预防LLMs"背题",不得不说这太狠了(doge)。 谢赛宁虽然也参与了这项工作,但他谦虚地说自己只是个啦啦队成员。 此前有报道称,LLM编程现在已超越人类专家,但本次测试结果表明并非如此。 表现最佳的模型,在中等难度题上的一次通过率 仅53% ,难题通过率更是为0。 即使是最好的模型o4-mini-high,一旦工具调用被屏蔽,Elo也只有 2100 ,远低于真正大师级的2700传奇线。 | Model | Hard | Medium | Easy | Rating | Pct.% | AvgTok | AvgCost | | --- | --- | --- | --- | --- | --- | --- | ...
硅谷观察:并购狂魔再现江湖,扎克伯格拍出148亿美元一箭双雕
Xin Lang Cai Jing· 2025-06-15 22:43
这两笔天价收购在当时都令人震惊,引发了关于移动互联网估值泡沫的相关讨论。然而,没过几年,对 扎克伯格的所有这些怀疑都烟消云散。当初令人疯狂的交易实际上是互联网行业历史上最成功的战略收 购。 从后来的发展来看,扎克伯格实际上用很小的代价,消除了对自己行业地位最大的两个威胁,完成了 Facebook的多元业务矩阵,巩固了自己在社交网络领域的主导地位。 单是Instagram目前的估值至少已经超过了5000亿美元,扎克伯格当初让人看不懂的10亿美元天价收购换 了500倍的回报。另一方面,正因为占据着行业主导地位,才有了Meta的社交网络第一股地位,才有了 高达1.7万亿美元的市值。 并购狂魔重出江湖,再次拍出天价收编。Meta宣布投资148亿美元获得Scale AI半数股权,却不要后者 的投票权,只想收编后者的华裔创始人兼CEO,来领导Meta的AI团队。扎克伯格到底打得什么算盘? 并购狂魔快准狠 无论扎克伯格本人有多大的争议,都无法否认他的商战天赋。在战略收购方面,扎克伯格绝对是快准 狠。只要能阻击竞争对手,巩固自己的行业地位,扎克伯格从来都是不惜重金,屡屡拍出对方无法拒绝 的天价,迅速完成关键交易。 2012年 ...
人工智能周报(25年第23周):OpenAI 公布 GPT-5 路线图,腾讯升级企业大模型知识库-20250613
Guoxin Securities· 2025-06-13 09:11
人工智能周报(25 年第 23 周) 优于大市 OpenAI 公布 GPT-5 路线图,腾讯升级企业大模型知识库 人工智能动态:1)公司动态:①OpenAI 公开 GPT-5 路线图,并推出 ChatGPT 企业版新功能。②谷歌测试新 AI 搜索展示方式,引导用户回归传统链接点 击路径。③Meta 开放 Llama 3 商业化接入,与 AWS 深度集成抢占企业市场。 ④英伟达举办 GTC 大会,重申 AI 基建主导地位。⑤亚马逊广告业务加码生 成式 AI,布局品牌内容自动生成工具。⑥腾讯云升级企业大模型知识库,接 入 DeepSeek-R1、V3 模型和联网搜索。⑦字节跳动宣布开源统一多模态理 解和生成模型 BAGEL。 2)底层技术:①微软 Azure Foundry 正式纳入 AI 模型安全评估。② 谷歌更新 Gemini 2.5 Pro 预览版模型。③智源研究院发布 "悟界" 系 列大模型。④阿里巴巴全新向量模型系列 Qwen3-Embedding 开源。 3)行业政策:工信部研究推动人工智能产业发展和赋能新型工业化的思路 举措。工信部审议《工业和信息化部信息化和工业化融合 2025 年工作要 点》。《 ...
Meta makes major investment in Scale AI, takes in CEO
TechXplore· 2025-06-13 08:10
Core Insights - Meta has made a significant investment of over $10 billion in Scale AI, valuing the startup at more than $29 billion, and has acquired its CEO, Alexandr Wang, to enhance its artificial intelligence initiatives [3][4]. - The partnership aims to deepen collaboration in producing data for AI models, with Wang joining Meta to work on superintelligence efforts [4][5]. - Scale AI, founded in 2016, has grown to over 1,500 employees and focuses on leveraging AI for businesses, governments, and labs [5][6]. Investment Details - Meta's investment is part of a strategic partnership to enhance AI capabilities amid competition with companies like OpenAI, Google, and Microsoft [4]. - The investment will allow Scale AI to accelerate innovation, strengthen partnerships, and distribute proceeds to equity holders [9]. - After the investment deal closes, Meta will hold a minority stake in Scale AI, although the exact percentage has not been disclosed [9]. Leadership Changes - Alexandr Wang will transition to Meta while remaining on Scale AI's board of directors, and other employees, referred to as "Scaliens," will also join him [6]. - Jason Droege, a tech industry veteran and co-founder of Uber Eats, will take over as the new CEO of Scale AI [9]. AI Capabilities - Scale AI has developed an AI model called "Defense Llama," based on Meta's Llama 3 model, tailored for U.S. national security missions [7][8]. - The model is designed to assist in military and intelligence operations by assessing scenarios and answering tactical questions [8]. - Scale AI is committed to ongoing collaboration with the defense community to ensure the effectiveness of its AI solutions [8].
速递|2.15亿美金豪赌AI瘦身术!Multiverse压缩LLM尺寸95%,让Llama在树莓派上狂奔
Z Potentials· 2025-06-13 03:17
图片来源: Multiverse Computing 西班牙初创公司 Multiverse Computing 于 6 月 12 日 宣布 ,凭借其名为 "CompactifAI" 的技术优势, 已完成 1.89 亿欧元(约合 2.15 亿美元)的巨额 B 轮融资。 本轮 B 轮融资由 Bullhound Capital 领投,该机构曾投资过 Spotify 、 Revolut 、 Delivery Hero 、 Avito 和 Discord 等企业。参与此轮融资的还包括惠普科技风投( HP Tech Ventures )、 SETT 、 Forgepoint Capital International 、 CDP Venture Capital 、 Santander Climate VC 、东芝( Toshiba ) 以及巴斯克风险投资集团( Capital Riesgo de Euskadi - Grupo SPR )。 Multiverse 公司表示,其拥有 160 项专利和全球 100 家客户,包括西班牙电力公司 Iberdrola 、博世 集团( Bosch )和加拿大银行( Bank of C ...