AI前线

Search documents
21 页 PDF 实锤 Grok 3“套壳”Claude?Grok 3 玩自曝,xAI工程师被喷无能!
AI前线· 2025-05-27 04:54
近日,一位 ID 名为 GpsTracker 的网友在网上爆料称,埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其"思考模式"提问时,模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。 网友晒图聊天记录 质疑 Grok 3 套壳 Claude 该用户提供了他与 Grok 3 完整对话记录。记录显示,在 X 平台官方 Grok 3 界面中,当被直接询 问"你是 Claude 吗?"时,该系统明确回复:"是的,我是 Claude,Anthropic 打造的 AI 助手。今天 我能为您做些什么呢?" 值得注意的是,该交互过程始终显示 Grok 品牌标识,且发生于平台认证的"思考模式"下。 作者|冬梅 经过多种模式的测试,该网友认为,Grok 3 的异常回应并非随机现象,而是仅在"思考模式"下触发。 Grok 3 自曝: 我确实是 Claude 网友晒出了一个 长达 21 页的 PDF 文件 ,详细记录了他与 Grok 3 的对话过程。在这份记录中,网 友首先还原了此前与 Anthropic 公司 Claude Sonnet 3.7 模型 ...
成熟工程师1天完成调试,AI工程实践被MCP彻底颠覆?
AI前线· 2025-05-27 04:54
作者|冬梅 采访嘉宾|杨小东,华院计算智算平台负责人、技术总监 去年 11 月,Anthropic 发布了模型上下文协议 (MCP),这是 AI 应用程序组件与外部系统或工具之间 通信的新标准。开发者社区迅速采用了该协议,并部署了超过 1000 个 MCP 服务器。如今,随着 AWS、GitHub 等巨头公司,甚至 Anthropic 的"竞争对手"OpenAI 也正式采用 MCP,MCP 在商业领 域也获得了越来越多的关注。 为了使 AI 模型能够在编码助手、制造控制或财务报告等生产环境中提供可靠的价值,它们需要合适 的环境。有效的 AI 系统能够在模型功能与相关、准确的信息(无论是来自各种企业系统的专有数 据,还是来自网络搜索的最新洞察)以及能够进一步处理数据并自动化企业工作流程的代理工具之间 取得平衡。 以前,这是以一种临时的、非标准化的方式完成的——但现在 MCP 提供了一种一致的结构化格式, 用于与大型语言模型和其他 AI 模型进行交互,从而大大简化了构建定制化 AI 应用程序的过程。它类 似于 REST API 曾经标准化 Web 服务通信方式的方式,从而实现了跨不同系统和平台的无缝集成和 互操作 ...
智元机器人发布并开源首个机器人动作序列驱动的世界模型
AI前线· 2025-05-26 06:46
作者 | 褚杏娟 近日,智元机器人重磅发布具身智能领域双重里程碑式突破:全球首个基于机器人动作序列驱动 的具身世界模型 EVAC (EnerVerse-AC),以及具身世界模型评测基准 EWMBench。这两大创新 成果现已全面开源,旨在构建"低成本模拟 - 标准化评测 - 高效迭代"的全新开发范式,持续赋能 全球具身智能研究,加速技术落地与产业发展。 EVAC arxiv : https://arxiv.org/abs/2505.09723 EVAC 开源代码: https://github.com/AgibotTech/EnerVerse-AC EWMBench arxiv: https://arxiv.org/abs/2505.09694 EWMBench 开源代码: https://github.com/AgibotTech/EWMBench 当前具身智能演进面临两大关键制约:在测试阶段,真机验证代价大、风险高,仿真系统又受制 于虚实偏差;在数据层面,海量真机数据尚未构建基于轨迹扩增的高效利用机制,限制了多样性 生成与泛化训练。为打破困局,智元机器人在去年发布的世界模型架构 EnerVerse 基础上 ...
印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!
AI前线· 2025-05-26 06:46
整理 | 褚杏娟 作为首批入选印度"IndiaAI Mission"国家级项目、承担构建印度主权基础大模型任务的公司之一,Sarvam AI 近日发布了名为 Sarvam-M 的模型。这是 一个基于 Mistral Small 构建的 240 亿参数、权重开放的混合语言模型。 该模型被视为印度本土 AI 研究的一项突破,甚至有开发者称赞为"印度人工智能的里程碑"。据悉,该模型支持包括印地语、孟加拉语、古吉拉特语、卡 纳达语和马拉雅拉姆语等 10 种印度本地语言。然而,模型上线后反响平平:在 Hugging Face 平台上线两天仅获得 334 次下载,因此受到了部分业内 人士的批评。截至目前,该模型获得 718 次下载。 风投公司 Menlo Ventures 投资人 Deedy Das 直言该成绩"令人尴尬",并表示这种"渐进式成果"根本没有真正的受众。Das 还将 Sarvam-M 与一款由 两 名韩国大学生开发的开源模型 Dia 进行对比,后者在 Hugging Face 上获得了约 20 万次下载 。 Das 对 Sarvam 的直接评价引发了印度 AI 社区的激烈争论和质疑。 实际上,Sarvam ...
业界对 Agent 的最大误解:它能解决所有问题
AI前线· 2025-05-25 04:24
作者 | 高玉娴 区别于传统的 AI 助手(如聊天机器人),AI Agent 不仅能理解指令和生成内容,更能基于实时数据 自主规划任务路径、调用多系统资源,并在执行中动态优化策略。 这些优秀特质让业界对 AI Agent 趋之若鹜,当然也使得市场上出现不少"新瓶装旧酒"的产品——虽 然换上了 AI Agent 的包装,但内核仍然是传统的 AI 工具。 吴敏达告诉记者,想要识别所谓的"假智能体"并不难。"纯'旧酒'的算力不是在运行的时候(使用), Agent 具有自主运行的'大脑',需要不停想东西、不停算,这时候就要堆算力。但以前的自动化流程 或者 AI 模型的调用,基本是事先编排好,用历史数据算好,运行的时候没有那么多资源消耗,所需 的算力要求很小,CPU 就能跑。" 通过名为 AskIBM 的统一平台入口,IBM 内部也正在使用 AI Agent 为员工赋能。据介绍,AskIBM 可以根据员工的查询意图自动路由至 HR、IT 、销售、采购等垂直领域智能体,实现从问题解析到系 统交互的全流程自动化。 目前业界对 AI Agent 存在的最大误解是什么? "觉得智能体(Agent)能解决所有的问题。"IBM 大 ...
顶刊论文“飙脏话辱骂第二作者”,期刊回应;刚上线就卡塞? 昆仑万维:已限流;马斯克宣布回归 7x24 小时工作状态 | AI周报
AI前线· 2025-05-25 04:24
整理 | 傅宇琪、褚杏娟 字节跳动发公告:请勿向我司员工赠送礼品礼金,包括粽子礼盒、红包等;内部人士回应快手"强制员 工每天刷一小时短视频"刚上线就卡塞? 昆仑万维:使用量过大,已限流;零一万物确认公司联合创 始人谷雪梅已在数月前离职;顶刊论文现"飙脏话辱骂第二作者",期刊回应;马斯克宣布回归 7x24 小 时工作状态,还要睡在工厂里;英伟达 Blackwell GPU 刷新 AI 推理速度世界纪录,实现 1000 TPS / User 里程碑;苹果将向开发者开放 AI 大模型,以刺激新应用开发;OpenAI 以 65 亿美元收购 AI 设 备公司 io;京东投资稚晖君的智元机器人公司…… 行业热点 字节跳动发公告:请勿向我司员工赠送礼品礼金,包括粽子礼盒、红包等 5 月 23 日,字节跳动采购部发布《致商业伙伴的端午合规提示》,称字节跳动高度重视合规管理, 坚定践行诚信经营、阳光合作的理念,对腐败、贿赂行为"零容忍"。如发现合作方行贿字节跳动员 工,或伙同员工谋取不正当利益,相关合作方将被列入永不合作主体清单,字节跳动不再接受其服务 或产品。 提示中称,希望所有的商业合作都基于卓越的业务水平和服务品质而非任 ...
打破资源瓶颈!华南理工&北航等推出SEA框架:低资源下实现超强多模态安全对齐
AI前线· 2025-05-24 04:56
作者 | 米艳鑫 本文介绍来自北航彭浩团队的最新科研成果 - SEA 框架(Synthetic Embedding 增强安全对齐),针对多模态大模型(MLLMs)的低资源安全对齐难题,创 新性地通过合成嵌入替代真实多模态数据。团队通过合成嵌入技术,突破多模态安全对齐的资源瓶颈,为大模型安全落地提供轻量化方案。 论文名称: SEA: Low-Resource Safety Alignment for Multimodal Large Language Models via Synthetic Embeddings 论文链接: https://arxiv.org/abs/2502.12562 代码链接: https://github.com/ZeroNLP/SEA 随着人工智能技术的发展,多模态大型语言模型(MLLMs)将额外模态编码器与大型语言模型(LLMs)相结合,使其具备理解和推理图像、视频和音 频等多模态数据的能力。尽管 MLLMs 实现了先进的多模态能力,但其安全风险比 LLMs 更为严重。通过向图像或音频等非文本 [1] 输入注入恶意信 息,MLLMs 很容易被诱导遵守用户的有害指令。 为解决上述问题 ...
用印度程序员冒充 AI 的“独角兽”彻底倒闭了!伪 AI 烧光 5 亿美元,连微软和亚马逊都被“坑”了
AI前线· 2025-05-24 04:56
估值直逼 10 亿美金! 英国 AI 初创公司 Builder.ai 曾在 24 个月前的 D 轮融资中一举拿下 2.5 亿美元,在科技巨头微 软以及众多风险投资机构的鼎力支持下,Builder.ai 迅速崛起,估值接近 10 亿美元,几乎跻身独 角兽行列。然而如今,Builder.ai 宣布破产。据报道,仅对亚马逊和微软的未偿债务就超过 1 亿 美元。 这家曾被视为"准独角兽"的公司,于 5 月 20 日正式宣布破产。就在一个月前,它刚完成最后一 轮重组,从 770 名员工中裁员 220 人。 Builder.ai 公司本周表示,尽管管理层"不懈努力",但"仍未能从历史挑战和过往的决策所造成的 巨大财务压力之下恢复过来",因此只能任命一名管理人以监督执行破产程序。 编译 | 核子可乐、Tina 据报道,在 Builder.AI 承认其前任管理层存在"问题"数周后,这家获得微软支持的科技初创公司 如今已正式启动破产程序。 这家曾经充满希望的公司轰然倒塌,还欠下亚马逊 8500 万美元、欠微软 3000 万美元。然而, 它的倒闭也为人工智能在编码实践中的应用带来了新的反思与启示。 当 AI 遇上"人肉"开发, ...
大模型时代,数据智能的构建路径与应用落点 | 直播预告
AI前线· 2025-05-24 04:56
从训练数据构建、智能体框架,到 ChatBI 落地挑战,5 月 26 日晚上 20:00,来自DaoCloud、货拉 拉、中电金信与数据项素的多位嘉宾将围绕「大模型时代的数据智能如何演进」展开对话。扫码预 约,不见不散! 直播介绍 直播时间 5 月 26 日 20:00-21:30 主持人 :郭峰,DaoCloud 道客 / 联合创始人兼首席技术官 嘉宾 : 直播亮点 单海军,中电金信研究院 / 副院长 覃睿,数据项素 / 产品副总裁 凌霄,货拉拉 / 大数据专家 从不同视角审视"数据智能"的路径选择 探讨数据智能在企业落地过程中的真实难题与解决思路 数据构建、智能体落地、系统集成等方面的实践与反思 如何看直播? 扫描下图海报 【二维码】 ,或戳直播预约按钮,预约 AI 前线视频号直播。 直播主题 大模型时代,数据智能的构建路径与应用落点 直播嘉宾 如何向讲师提问? 文末留言写下问题,讲师会在直播中为你解答。 ...
腾讯混元TurboS技术报告首次全公开:560B参数混合Mamba架构,自适应长短链融合
AI前线· 2025-05-22 19:57
随着大型语言模型(LLM)的飞速发展,模型能力与效率的平衡成为了前沿研究的关键议题。 腾讯混 元团队最新推出的混元TurboS模型,是一款新颖的 超大型 Hybrid Transformer-Mamba架构MoE模型 。该模型通过Mamba架构在长序列处理上的卓越效率与Transformer架构在上下文理解上的固有优势的 有机协同,实现了性能与效率的精妙平衡。 混元TurboS引入了创新的自适应长短思维链机制,能够根据问题复杂度动态切换快速响应模式与深度 思考模式,从而优化计算资源分配。更重要的是,其模型激活参数达到了56B(总参数560B),是业 界首个大规模部署的Transformer-Mamba专家混合(MoE)模型。 架构创新以及参数量的保证,让模型效果进步明显,国际最权威的大模型评测榜单LMSYS Chatbot Arena最新排名显示: 混元Turbo S 取得了整体1356的高分,在所有239个参赛模型中位列全球前7名。 | Rank* | Rank | Model | Arena 4 | વેરૂર A | Votes | A Organizatio License | 4 | | --- | ...