智能体(Agent)

Search documents
赛道Hyper | 荣耀之剑指AI能力落地新竞逐
Hua Er Jie Jian Wen· 2025-06-20 10:55
作者:周源/华尔街见闻 5月21日,OpenAI以65亿美元收购苹果前首席设计官创办的硬件公司io,被业界视为AI从"云端模型"转向"物理硬件"的战略拐点。 这与OpenAI此前提出的AGI(生成式AI)的五个发展阶段"L1-L5"(L1聊天者→L2推理者→L3行动者→L4创新者→L5组织者)发展路径遥相呼应;其中, L3阶段的智能体(Agent)需实现自主任务执行,标志着AI正从"被动思考"向"主动行动"跨越。 智能体与硬件如何构成AGI技术落地的支柱? 6月19日,在上海世界移动通信大会(MWC Shanghai)上,荣耀CEO李健提出了系统性的技术构想框架。 李健明确指出,AI技术的落地能力已成为行业竞争核心。 李健强调,当模型能力趋同,AI的价值不再局限于参数比拼,而是要成为"它就在你身边"的生活伙伴,从技术在实验室的可用路径,进化为多场景的用户愿 用、常用的体验闭环。 荣耀的思考与行动,正暗合AI产业三大转变:竞争焦点从模型性能转向落地能力,价值逻辑从工具效率转向结果闭环,产品形态从云端计算转向贴身硬 件。 值得注意的是,即将于7月2日发布的荣耀新一代折叠屏智能手机"Magic V5",正是这一战略 ...
Seedance 1.0超越可灵2.0?豆包“双箭齐发” 字节跳动摁下Agent加速键
Mei Ri Jing Ji Xin Wen· 2025-06-12 07:05
每经记者|李宇彤 每经实习编辑|余婷婷 黑暗的场馆中,大屏幕上播放的宣传片吸引了全场人的目光。一段堪比动作大片的赛车竞逐之后,画面通过蒙太奇手法巧妙切换,观众瞬间穿越到艺术世 界,名画中的人物"活"了过来,花草也随之摇曳生姿——这,是字节跳动旗下火山引擎Force原动力大会的现场演示。 Seedance 1.0 pro的性价比同样受到市场关注。《每日经济新闻》记者现场了解到,Seedance 1.0 pro的价格是0.015元/千tokens(语言生成模型在运作时的最小 工作单元),相当于每生成一条5秒的1080P视频只需3.67元。据称,这个价格已经为当前行业最低。 把价格打下来的不只有视频生成模型,最新发布的豆包大模型1.6也展现了火山引擎要降低大模型使用成本的决心。 火山引擎总裁谭待 图片来源:企业供图 据火山引擎总裁谭待现场表示,豆包1.6首创按"输入长度"区间定价,深度思考、多模态能力与基础语言模型统一价格。豆包1.6的综合成本只有豆包1.5深度 思考模型或DeepSeek R1的三分之一。 豆包此番"双箭齐发",字节跳动摁下Agent(智能体)加速键。 6月11日,"2025火山引擎春季Force ...
从高考到实战,豆包大模型交卷了
机器之心· 2025-06-12 06:08
机器之心报道 编辑:Panda 高考余热尚在,依然还是有不少博主和媒体在测试各家 AI 模型解答最新高考题的能力。而现在,一个正被火热评测的主流模型迎来了重磅升级! 在 AI 基础设施方面,火山引擎围绕 AI 应用的实际需求,打造了三个套件: AgentKit 、 TrainingKit 和 ServingKit 。顾名思义,这三个套件的作用分别是智能 体、模型训练和模型 serving。 整场 Force 大会下来,我们最大的感受是火山引擎对「 AI 云原生 」概念的反复强调。简单来说,「AI 云原生」是指将云原生理念应用到 AI 领域,专注于 AI 工 作负载的云端构建和部署;其核心理念是以 AI 负载为中心,重新优化计算、存储与网络架构,让 GPU 可直接访问存储和数据库,降低 IO 延迟,并提供高速互联 和端到端安全保护。事实上,正如我们以前多次报道的那样,「AI 云原生」已经成为火山引擎「下一个十年」所遵循的云计算新范式。 事情发生在昨天、北京国家会议中心、火山引擎原动力大会 Forc e 202 5 现场。 火山引擎一口气发布了豆包大模型 1.6、Seedance 1.0 Pro、AI 云原生平台 ...
谷歌重磅发布最强通用AI模型!同声传译、全新AI模式搜索,直接通过自然语言发问,支持长达数百字提问
Mei Ri Jing Ji Xin Wen· 2025-05-20 22:37
每经编辑|杜宇 继微软之后,谷歌也全面拥抱人工智能(AI)智能体(Agent)。在开发者大会上,谷歌宣布要让智能体全面进驻谷歌的主打业务搜索以及AI助手Gemini, 并通过Gemini与搜索结合,推出全新的AI模式搜索。 当地时间5月20日,谷歌2025年度I/O开发者大会的主题演讲展示了在AI、多模态模型、跨设备整合与开发者工具方面的最新成果。从升级后的Gemini 2.5 Pro模型到智能眼镜的XR应用,再到AI驱动的搜索与网页浏览体验。谷歌展现的不仅是模型的性能提升,更是AI从"信息工具"进化为"通用智能体"的进步。 本次发布内容主要包括: 模型:Gemini 2.5 Pro/Flash/DeepThink;Diffusion;Imagine 4;Lyria; 应用:Gemini App、Canvas、Chrome助理、AI Mode、Agent模式; 搜索:AI Overview+Mode;支持个性化、多步推理、自动执行任务; 创作:Flow平台、文本转图像、图像转视频、原生音频合成| 硬件:Android XR头显、智能眼镜原型、WearOS、车载整合 谷歌最强通用AI模型Gemini 2.5 P ...
谷歌I/O开发者大会:AI发货史上最快 智能体进驻浏览、搜索及Gemini
Hua Er Jie Jian Wen· 2025-05-20 18:57
谷歌发布名为Google Beam 的新产品。它是一个AI驱动的视频通信平台,让人们的视频感觉如同面对面聊天。它是谷歌3D视频会议系统项目Starline 技术的 升级版。谷歌与惠普合作,将Google Beam 系统商业化,今年晚些时候,惠普将推出首批Google Beam设备。 Google Beam 采用六个摄像头阵列,从不同角度捕捉拍摄对象、比如人物。AI视频模型将实时拼接这些视图,渲染成类似 3D 的画面,从而创建3D 人物。 谷歌表示,该系统拥有近乎完美的头部追踪技术,精度可达毫米级,以视频帧率每秒60 帧(fps)的实时渲染速度呈现。 谷歌高层介绍,Gemini 2.5 Pro 很快就能实现实时翻译。Gemini模型产品团队负责人Tulsee Doshi现场进行了实时翻译的演示,让AI语音先用英语说话,在说 到一半时切换到印地语。 谷歌的2025年度Google I/O开发者大会开幕。 大会的主题演讲刚开场,登台的Alphabet兼谷歌CEO 皮查伊(Sundar Pichai)就强调了谷歌AI助手Gemini的重要性,称"在谷歌,每天都是Gemini季"。 皮查伊说,自上次I/O大会以来,谷歌 ...
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
Hu Xiu· 2025-05-08 11:50
5月8日,在海淀大恒科技中心的阶跃星辰北京办公地,阶跃星辰创始人、CEO姜大昕身着深色西服、蓝 色衬衫出现在阶跃星辰北京办公地的会议室里。他保持了一贯的风格,如二十一年前在新加坡南洋理工 教书时,像老师一样在屏幕前平静地讲述自己对于多模态模型行业的判断。这里距离姜大昕上一个东家 微软的中国办公地微软大厦仅有504米,在2023年创立阶跃星辰前,姜大昕是微软全球副总裁。 "多模态模型领域目前还没有出现GPT-4时刻。卡点是整个行业缺少多模态领域的理解生成一体化架 构。有了这个架构,才能基于此通过海量的图片视频去做预训练+指令跟随,最终演变为世界模 型。"姜大昕说。 "理解生成一体化架构"不只是姜大昕的技术判断,也正在影响这家公司的走向。 虎嗅独家获悉,近期阶跃星辰内部,进行了算法小组内的微调:原本阶跃星辰内部团队分为生成小组和 理解小组,而这两个小组已经整合为新的"生成理解"团队。 姜大昕向虎嗅表示,这一调整,确实是基于"理解生成一体化架构至关重要"这个判断。 虎嗅获悉,目前阶跃星辰的运转以三个男人为核心: 姜大昕 阶跃星辰创始人、CEO 负责公司整体战略、技术研发 张祥雨 阶跃星辰首席科学家 负责公司技术研发 ...
AI原生浪潮冲击下,互联网大厂的组织如何进化?
3 6 Ke· 2025-04-11 10:20
编者按 AI原生组织的崛起是一场技术与组织的双重革命。对于传统互联网大厂而言,这场竞速不仅是技术能力的较 量,更是组织形态、文化基因与人才战略的全面对决。 在AI浪潮的冲击下,传统科技互联网巨头和新兴的AI原生组织(AI Native)正展开一场前所未有的竞速。 与此同时,Midjourney凭借数百万量级的日生成能力,在数字艺术领域构建起"提示词即生产力"的新范式。"一项技术最 大的限制不是规模、成本或运行速度,而是我们如何与它互动。"Midjourney创始人大卫·霍尔茨(David Holz)在接受采 访时,多次提到在社区产品中构建Midjourney是其成功的关键之一。 DeepSeek现象正引发传统科技互联网巨头的集体焦虑,这场由AI Native组织发起的降维打击,暴露出大厂在决策机制、 资源调配与注意力管理上的深层困境。与2023年OpenAI带来的冲击不同,此次挑战更具本土化特征——即便坐拥百倍 于DeepSeek的研发资源,大厂仍难复现其"用算法榨干最后一滴算力"的技术锐度。 由此可见,这场竞速不仅是技术与应用的较量,更是组织形态、文化基因与人才战略的全面对决。摆在传统互联网科技 巨头面前的 ...
AI 写码一时爽,代码审查火葬场?GitHub Copilot 副总揭秘新瓶颈 | GTC 2025
AI科技大本营· 2025-03-31 06:55
我们距离 AI 在绝大多数软件开发任务中实现人类水平的能力和自主性大约还有 24 到 36 个月的时间。 责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 主持人: 大家好,我是 NVIDIA 开发者工具 AI 技术软件工程总监,马特·弗雷泽(Matt Frazier)。 众所周知,AI 辅助开发者工具,或者说代码生成、AI 代码生成——现在有很多叫法——正在从根本上改变我们开发软件的方式。NVIDIA 自然非常关 注这一趋势如何影响我们处理软件和加速计算的方法。 为此,在 GTC 2025(英伟达大会)上,我们邀请了来自多家公司和不同行业的 AI 代码生成通用应用专家,以及 CUDA 优化与相关研究领域的专家, 共同探讨这个话题。 我想快速问各位读者几个问题: 如果你对以上任何一个问题感同身受或感到好奇,那么接下来的讨论就值得你关注。下面,我想介绍一下参与本次讨论的嘉宾。 莎娜·达马尼(Sana Damani) ,她是 NVIDIA 架构研究组的研究科学家,致力于提升 GPU 上并行应用程序的性能,以及提高调试和优化工作的易用 性。 有多少人特别在 CUDA 调试中使用过 AI 驱动的代 ...
炒到10万,一夜爆火的Manus却不好用
盐财经· 2025-03-08 10:06
文| 荣智慧 编辑| 向由 值班编辑| 宝珠 视觉 | 顾芗 近日,自称"全球第一款通用AI Agent产品"的Manus一夜之间爆火。 其宣称性能"吊打"Open AI同款,邀请码被炒至天价,甚至能卖到9万、10万元一个。 Manus火得突如其来,但不算莫名其妙。 在二手平台上,Manus邀请码最贵已被炒至10万元级别 火的原因有两点,一是多家造势,风很大,但实测的人少,神秘感强,叠加"本土团队"光环,又是一个 后来居上的案例;二是大模型的好,大家都见识了,但一直停留在聊天上。现在急需趁手的聚合式工 具,把脑子里的想法变变现。 忽然,说曹操曹操就到,正中下怀。 Manus目前未有任何信息能证明自己是真正的智能体——没有人为设计的工作流程。因此,只能说它在 宣传里呈现出"智能体"或通用人工智能(AGI)的样子,并围绕这一概念作文章。 而Manus也绝非一无是处。作为一款应用,界面简洁友好;大脑(思考)、手(操作)、交付的层次非 常清晰,组合起来也是相对合格的当代"牛马",还是能帮你提高一点生产力。 下文将举例说明Manus如何完成工作任务、优势和局限以及技术逻辑是什么。省流版:别花好几万买什 么邀请码,一个" ...
晚点播客丨硅谷怎么看 DeepSeek?与 FusionFund 张璐聊开源、Agent 和除了 AI
晚点LatePost· 2025-02-13 13:01
技术的力量,开源的力量,初创生态的力量。 整理丨刘倩 ▲扫描上图中的二维码,可收听播客。《晚点聊 LateTalk》#100 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》推出的播客节目。"最一手的商业、科技访谈,最真实的从业者思考。" 2025 年 1 月,农历春节也没有让模型竞赛丝毫减速。DeepSeek 发布开源推理模型 R1,以相对低的成本,在一些 Benchmark 上比 肩,甚至超越了 o1 的表现,在全球掀起了广泛讨论。 这期节目,我们邀请了 2015 年,在硅谷创立了 Fusion Fund 的投资人张璐,来和我们一起聊一聊,当前美国科技圈和硅谷语境中, 对 DeepSeek 等模型的讨论。 我们也延展聊了 DeepSeek-R1 和 o1 等推理模型打开的 Agent(智能体)应用空间;以及在美国的科技投资视野中,除了 AI,大家还 在关注什么。 Fusion Fund 曾投资 Grubmarket、Al 会议公司 Otter.ai 还有 Al 与医疗结合的公司 Subtle Medical 等。在 Al ...