Workflow
大型语言模型
icon
Search documents
本周WWDC推出新Siri无望?华尔街质疑苹果AI能力
Hua Er Jie Jian Wen· 2025-06-09 02:43
今年的苹果全球开发者大会(WWDC)即将于美东时间6月9日(北京时间周二)开幕。 然而据最新报道,苹果在升级Siri以整合先进大型语言模型(LLM)时遭遇技术难题,导致其核心AI功能"Apple Intelligence"迟迟未能落 地。 苹果引以为豪的Siri如今成为华尔街质疑苹果创新能力的焦点,本周即将举行的WWDC可能再次成为投资者失望的源头,令这家万亿美元巨 头在AI军备竞赛中进一步落后。 "Apple Intelligence"功能多次跳票,导致市场对即将于下周开幕的2025年WWDC大会预期低迷。 摩根大通分析师Samik Chatterjee表示:"我们现在的情况是,投资者已经知道潜在的好消息可能是什么,但关键在于:首先请兑现你们去年 承诺的东西。" AI发展困境已严重拖累这家科技巨头的股价。2025年至今,苹果股价已下跌约18%,不仅是所谓"科技七巨头"中表现最差的,甚至低于基本 持平的科技股指数纳斯达克。 Siri升级遇阻,"Apple Intelligence"难产 据近期离职员工向英国《金融时报》透露,苹果试图通过自研LLM提升Siri的对话能力。这些技术旨在让Siri能对语音指令做出更 ...
世界顶尖数学家在测试中震惊地发现,人工智能模型已经接近数学天才了
3 6 Ke· 2025-06-08 23:49
"AI 推理模型已经接近数学天才" 五月中旬的一个周末,一个秘密的数学会议召开了。 30 位世界著名的数学家齐聚美国加州伯克利。小组成员与一个"推理"聊天机器人展开对决,该机器人 的任务是解决他们为测试其数学能力而设计的问题。 在向机器人抛出两天教授级别的问题后,研究人员震惊地发现,它能够回答一些世界上最难解决的问 题。"我的同事们真的说这些模型接近数学天才了,"弗吉尼亚大学数学家、会议领导者兼评委 Ken Ono 说。 该聊天机器人由o4-mini提供支持,这是一种推理大型语言模型 (LLM)。它由 OpenAI 训练,能够进行高 度复杂的推理。谷歌的同类产品Gemini 2.5 Flash具有类似的能力。与支持早期版本 ChatGPT 的 LLM 一 样,o4-mini 可以学习预测序列中的下一个单词。然而,与早期的 LLM 相比,o4-mini 及其等效模型更 轻量级、更灵活,它们在专门的数据集上进行训练,并有来自人类的强化训练。这种方法使聊天机器人 能够比传统的 LLM 更深入地研究复杂的数学问题。 为了追踪 o4-mini 的进展,OpenAI 此前委托 Epoch AI(一家负责对 LLM 进行基 ...
共封装光学,达到临界点
半导体行业观察· 2025-06-04 01:09
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容 编译自 semiengineering 。 基于共封装光学器件 (CPO) 的网络交换机已开始商业化,能够以每秒太比特的速度路由信号,但 在光纤到光子 IC 对准、热缓解和光学测试策略方面仍然存在制造挑战。 通过将光电数据转换尽可能靠近数据中心的 GPU/ASIC 交换机,CPO 显著提升了带宽,并降低了 运行生成式 AI 和大型语言模型所需的功耗。采用共封装光学器件有望大幅降低训练 AI 模型的能 源成本,并显著提高数据中心的能源效率。 Amkor Technology 产品营销副总裁 David Clark 表示:"尽管当今的 AI 加速器、GPU 和高容量 网络交换机正在快速突破计算能力的界限,但它们却受到芯片级、主板级、托盘级和机架级互连瓶 颈的制约。CPO通过提供 1 Tbps/mm 的带宽密度,实现更高的前面板端口密度,并在日益拥挤的 数据中心优化宝贵的机架空间,打破了这些限制。" 如今,在数据中心中,计算机机架中的网络交换机由 GPU/ASIC 芯片组成,这些芯片通过 PCB 电连接到机架前端的可插拔光收发器。这些光收发器集成了激光器、光路、 ...
人工智能和知识图谱:人工智能中知识图谱的概述
3 6 Ke· 2025-05-30 03:48
知识图谱 (KG) 是由现实世界实体(节点)及其相互关系(边)组成的结构化网络,以机器可读的形式 对知识进行编码。在人工智能领域,知识图谱是语义理解、推理和数据集成的强大工具。它们为人工智 能系统提供上下文,通过链接不同的数据源并揭示隐藏的关系,实现更易于解释、更准确的决策。 知识图谱的概念最初由谷歌 2012 年的知识图谱推广,实际上建立在语义网络和本体领域数十年的研究 基础之上,最早可追溯到 20 世纪 60 年代。如今,知识图谱已广泛应用于各行各业,从支持搜索引擎和 语音助手,到推动科学研究和企业分析的发展。未来的创新将致力于实现知识图谱构建的自动化,增强 推理能力,并将知识图谱与人工智能模型紧密结合,从而构建更值得信赖、更具情境感知能力和更智能 的系统。 定义和结构 知识图谱是一种将知识表示为一组实体(节点)及其之间关系(边)的网络。每个节点通常对应于由唯 一 ID 或 URI 标识的现实世界概念或对象(例如,人物、地点或物品);每条边表示连接两个实体(例 如, Person worksFor Company )的特定关系或谓词。属性 (Attribute) 可以注释节点和边以捕获其他详 细信息(例如 ...
ICML 2025 Spotlight | 谁导致了多智能体系统的失败?首个「自动化失败归因」研究出炉
机器之心· 2025-05-30 03:28
问题来了:到底是哪个 Agent 出了错?又是在对话流程的哪一环节?调试这样的多智能体系统如同大海捞针,需要翻阅大量复杂日志,极其耗时。 这并非虚构。在多智能体 LLM 系统中,失败常见但难以诊断。随着这类系统愈加普及,我们急需新方法快速定位错误。正因如此,ICML 2025 的一篇 Spotlight 论 文提出了「自动化失败归因(Automated Failure Attribution)」的新研究方向,目标是让 AI 自动回答:是谁、在哪一步导致了失败。 该工作由 Penn State、Duke、UW、Goolge DeepMind 等机构的多位研究人员合作完成。 论文标题:Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems 背景挑战 LLM 驱动的多智能体系统在诸多领域展现出巨大潜力,从自动化助手协同办公到多 Agent 合作完成 Web 复杂操作等。然而,这些系统 脆弱性 也逐渐显现:多个 Agent 之间的误解、信息传递错误或决策不当,都可能导致 ...
蔡崇信:大多数机器人不需要像人类,年轻人选老板比选岗位更重要
Sou Hu Cai Jing· 2025-05-26 03:36
ters we the 来源:猎云网 第五届BEYOND国际科技创新博览会(BEYOND Expo2025)于5月21日至24日举行。 5月24日,在闭幕式上,阿里巴巴集团董事长蔡崇信现身现场,提到阿里巴巴对组织架构进行了一些调整。 蔡崇信称,阿里巴巴将专注于几大核心业务:一是电子商务;二是云计算;三是希望确保人工智能渗透到业务的各个方面,既面向客户,也面向内部。 此外,蔡崇信还发表了年轻人就业的观点。 他认为,年轻人应因为想获取更多技能和知识而工作,这才是工作的意义。 同时,他表示,当你将机器人技术与人工智能结合起来时,想到了非常令人兴奋的事情。比如,机器人可以为你煮咖啡,或者可以到你家清洁地板。 但他也认为,世界上大多数智能机器人不需要看起来像人类。 他举例,如果你想让一个机器人来清洁你的地毯,回家打扫你的厨房或客厅,你真的想要一个看起来像人类的东西吗?我会感到害怕。我只想要一个看起来 像吸尘器的东西能智能地在房间里完成清洁工作。 "当我们谈论机器人时,我们总是会想起小时候看过的电影。它们看起来都像人,但它们显然不是人。现在,我们是否正在努力向与人类完全一样的机器迈 进?我认为这实际上是一种技术。还有很多 ...
腾讯混元TurboS技术报告首次全公开:560B参数混合Mamba架构,自适应长短链融合
AI前线· 2025-05-22 19:57
随着大型语言模型(LLM)的飞速发展,模型能力与效率的平衡成为了前沿研究的关键议题。 腾讯混 元团队最新推出的混元TurboS模型,是一款新颖的 超大型 Hybrid Transformer-Mamba架构MoE模型 。该模型通过Mamba架构在长序列处理上的卓越效率与Transformer架构在上下文理解上的固有优势的 有机协同,实现了性能与效率的精妙平衡。 混元TurboS引入了创新的自适应长短思维链机制,能够根据问题复杂度动态切换快速响应模式与深度 思考模式,从而优化计算资源分配。更重要的是,其模型激活参数达到了56B(总参数560B),是业 界首个大规模部署的Transformer-Mamba专家混合(MoE)模型。 架构创新以及参数量的保证,让模型效果进步明显,国际最权威的大模型评测榜单LMSYS Chatbot Arena最新排名显示: 混元Turbo S 取得了整体1356的高分,在所有239个参赛模型中位列全球前7名。 | Rank* | Rank | Model | Arena 4 | વેરૂર A | Votes | A Organizatio License | 4 | | --- | ...
何恺明等新作大道至简,瞬时速度改为平均速度,一步生成表现提升70%
量子位· 2025-05-21 06:31
白交 发自 凹非寺 量子位 | 公众号 QbitAI 何恺明等团队新作新鲜出炉,再次大道至简—— 他们引入平均速度,实现「一步生成」新SOTA。 CMU博士生耿正阳一作,何恺明的学生邓明扬、白行健参与。 他们提出的模型是从头开始训练的,没有任何预训练、蒸馏或课程学习,最终实现了3.43的FID值,明显优于之前最先进的一步扩散/流模型。 一步生成框架:引入平均速度 一次生成模型,指的是只需一步计算就产生高质量的结果,而无需多次迭代。 团队提出了一个原则性强且有效的单步生成框架MeanFlow。其核心思想是引入平均速度的概念来表征流场,这与流匹配方法所模拟的瞬时速 度截然不同。 △ 流匹配的速度场,瞬时速度 平均速度被定义为位移与时间间隔的比率,位移由瞬时速度的时间积分给出。 根据这一定义,这说明平均速度和瞬时速度之间定义明确的内在联系,这自然成为指导网络训练的原则基础。 我们的方法被称为MeanFlow模型,它自成一体,无需预先训练、提炼或课程学习。 演示1:通过jvp计算只需要一次后向传递,类似于神经网络中的标准反向传播,开销不到总训练时间的20%。 它在从零开始训练的ImageNet 256×256上通过1 ...
前景堪忧!苹果(AAPL.US)被曝在AI领域遭遇重重挫折
Zhi Tong Cai Jing· 2025-05-18 23:53
据媒体援引熟悉苹果(AAPL.US)内部讨论情况的人士的消息报道称,苹果在人工智能(AI)领域的持续挣 扎有可能破坏其在智能手机市场的主导地位,并危及该公司从机器人技术到下一代硬件等更广泛的雄心 壮志。 尽管苹果在2018年通过一项高调的人事任命曾一度激起外界对其AI战略的期待,但如今这家科技巨头 的AI之路却遭遇严重阻力。2018年,苹果聘请前谷歌(GOOGL.US)高管John Giannandrea领导AI战略。 这一任命曾被视为关键转折点,尤其在Siri远远落后于竞争对手的语音助手的背景下。 如今,苹果正进行架构重组。John Giannandrea已失去对Siri和相关产品开发的控制权,领导权转交给 Vision Pro头显项目负责人Mike Rockwell。苹果也在寻求与外部AI公司合作,例如OpenAI和Anthropic, 以增强自身能力。 测试聊天机器人 与此同时,工程师正在重构Siri架构,打造一个完全基于大型语言模型的新系统。苹果还在内部测试自 家聊天机器人,目标是实现与ChatGPT看齐的水平。在市场推广方面,苹果计划将Siri从"Apple Intelligence"这一更广泛品牌 ...
【中国那些事儿】俄专家:中俄人工智能合作跨越“小院高墙”,构建公平世界科技新秩序
Huan Qiu Wang Zi Xun· 2025-05-10 05:18
科洛宁还提到,人工智能的飞速发展引发了人们对滥用人工智能和通用人工智能的担忧。一些国家利用 其在人工智能领域的主导地位,对他国进行胁迫,阻挠它们与被视为威胁的国家开展合作。鉴于此,那 些希望建立公平世界秩序的国家需加深彼此间的合作,例如在金砖国家框架下,秉持互惠互利的原则, 共同推动全球科技治理体系的完善。 科洛宁强调,俄罗斯科学界对与中国以及其他志同道合的国家携手,共同推动全球在人工智能和通用人 工智能领域的协调发展与有效治理持开放态度。欢迎其他国家参与俄罗斯AGI社区研讨会等开放活动, 以及数学AI等联合会议,并期待各方逐步完善人工智能技术管理的联合战略。 另据相关报道,由外国顶尖专家组成的"瓦尔代"国际辩论俱乐部(Valdai Discussion Club)项目主任季 莫费·博尔达切夫(Timofei Bordachev)同样指出,人工智能是前沿科技领域,中国和俄罗斯都具备相 应技术和人才,两国可以通过在这一领域的合作,树立起科技合作的典范,并为全球南方国家在科学、 文化和教育领域的解放贡献力量。这不仅将为两国开辟全新的合作领域,还将切实推动南南合作,这对 于构建一个更加平衡、公正的世界秩序至关重要。 ...