Workflow
通用人工智能
icon
Search documents
Gemini负责人爆料!多模态统一token表示,视觉至关重要
量子位· 2025-07-03 06:58
就在刚刚,Gemini模型行为产品负责人 Ani Baddepudi 在谷歌自家的开发者频道开启了爆料模式。 一水 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 一次性揭秘Gemini多模态技术! 他和OpenAI前员工、现谷歌AI Studio产品负责人 (Logan Kilpatrick,右) 探讨了诸多众人好奇已久的问题: 一言以蔽之,整个谈话几乎都围绕着 Gemini多模态 展开,包括其背后设计理念、当前应用以及未来发展方向。 之所以这场谈话值得关注,实在是因为Gemini多模态过于响当当和重要了。 2023年12月,谷歌原生多模态Gemini 1.0模型正式上线,一举将AI竞赛由ChatGPT主导的文本领域带入多模态领域。 而最新的Gemini 2.5 Pro(0605) ,不仅在代码、推理等任务上更上一层楼,而且还拿下视觉能力第一,可以说夯实了谷歌在多模态领域的 领先地位。 此时回看Gemini当时的一些设计理念,会发现其前瞻性与创新性不仅为后续的发展奠定了坚实基础,而且对未来仍具有指导意义。 敲黑板,整场谈话干货满满,咱们这就开始~ 为啥Gemini一开始就被设计为多模态? 一个智能体的 ...
扎克伯格晒出AI超级团队名单,11位成员中有8位是中国留学生
Sou Hu Cai Jing· 2025-07-03 05:12
硅谷最近爆出重磅新闻:Meta在短短一周内挖走了OpenAI至少八位核心研究人员,涵盖多模态、强化学习、人类反馈训练等关键方向。这场"出走 潮"引发行业地震,也令OpenAI内部出现罕见的动荡情绪。 硅谷最近爆出重磅新闻:Meta在短短一周内挖走了OpenAI至少八位核心研究人员,涵盖多模态、强化学习、人类反馈训练等关键方向。这场"出走潮"引 发行业地震,也令OpenAI内部出现罕见的动荡情绪。 据《Wired》《The Information》等媒体披露,跳槽者包括赵晟佳、余家辉、毕树超、任泓宇等知名研究人员,他们曾深度参与GPT-4、GPT-4o、o3/o4 mini等核心模型的训练与设计。OpenAI首席研究官Mark Chen在Slack留言中愤怒表示:"我现在有一种强烈的情绪,就像有人闯进了我们家,偷走了我们 的东西。" 从公司高管到普通研究员,OpenAI上下都感受到了前所未有的危机感。一位接近高层的员工透露:"这不是普通的离职,这是系统性的人才外流。" 扎克伯格"亲自上阵",Meta重押超级智能 图源:网络 Meta为何如此急切?背后是一场由马克·扎克伯格亲自发起的通用人工智能(AGI)战略重启 ...
论道AI:从AGI破界到机器人新纪元丨《两说》
第一财经· 2025-07-03 03:56
这场变革没有旁观者,80亿人已置身其中。 当机器人数量即将超越人类,当"硅基生命"开始重塑地球法则——我们离智能革命的奇点还有 多远? 中国AI领域旗帜人物、三院院士张亚勤,深度对话上海科学智能研究院首席战略官杨燕青 揭秘 更多精彩内容,锁定节目《两说》——论道AI:从AGI破界到机器人新纪元,与两位嘉宾共赴 一场智能未来的"思想远征" 。 AGI 五年破壁? 人工智能日新月异,科学家们乐观预测通用人工智能(AGI)或在5年内突破。实现AGI需融合三大智 能浪潮:处理信息的生成式AI、操控物理世界的机器人技术,以及探索生命奥秘的AI for Science和脑机接 口。目前产业焦点仍集中在信息智能层面——处理文字、图像、视频的能力。张亚勤院士认为,这类技术 有望5年内通过新版图灵测试,达到"类人"水平,如ChatGPT已展现对话智能,但自然图像/视频生成还需 4-5年沉淀。 然而,AGI发展面临核心挑战:大语言模型存在"边界认知缺失",导致混淆已知与未知,产生"幻 觉"(虚构信息)。 虽然幻觉率大幅下降,新型模型的问题引发新担忧。关键在于场景化应对:艺术创作 需保留幻觉激发创意,而信息检索、自动驾驶等则必须1 ...
大模型“上海队”进入丰产阶段(神州看点) 生成的“猫跳水”视频一周获三亿播放量
Ren Min Ri Bao· 2025-07-03 00:10
而Hailuo 02则直接"叫板"谷歌第三代视频生成模型Veo3。 过往AI视频里,体操、杂技等复杂动作常会出现肢体错乱、五官扭曲等状况。让谷歌Veo3和Hailuo 02 各生成一段"猫跳水"视频,前者的视频中,猫咪动作含糊,直扑入水;后者则在空中完整翻腾三周半后 入水,动作全程符合逻辑。 前不久,上海AI公司MiniMax(上海稀宇科技有限公司)在其官网和开源平台GitHub上,抛出全球首个 开源大规模混合架构推理模型——MiniMax—M1(以下简称"M1")。该模型在权威评测榜单中,位列 全球开源模型第二,仅次于DeepSeek—R1—0528。 之后,这家公司又连续发布视频生成模型Hailuo 02、通用智能体MiniMax Agent等。由Hailuo 02生成 的"猫跳水"视频,在海外社交平台发布后一周内,获3亿现象级播放量。 这家公司为何能做到?梳理其发展脉络可发现,这家注册于上海徐汇的大模型企业,有着"不跟随"的特 质——在2022年底ChatGPT爆火前就已投身AGI(通用人工智能),还是国内主动放弃大模型主流稠密 架构和传统注意力机制的创业公司。 实力 大模型竞争,正从单纯的参数规模比拼 ...
由互联网1994-2024历史回溯,展望AI的趋势
2025-07-02 15:49
由互联网 1994-2024 历史回溯,展望 AI 的趋势 20250702 摘要 2025 年 AI 领域将进入相对平淡的过渡期,前期市场喧嚣后,行业重心 转向技术积累和应用深化,百度等在图声视频领域的表现印证了这一趋 势。 AI 发展呈现周期性,可分为 2023-2031 年的上半场(生成式 AI 和巨神 智能基础设施建设)和 2031-2038 年的下半场,类似于互联网的发展 历程。 当前 AI 投资机会主要集中在生成式 AI 和巨神智能的基础设施建设阶段, 类似于 PC 互联网时代,商业模式探索需时日,爆发性增长预计在 2031 年后。 2025 年 AI 领域的主要变化在于应用层面的跟进,2023 年硬件投资先 行,2025 年软件应用将显著增长,预计 2027 年在巨神 AI 和生成式 AI 支持下,应用加速落地。 未来几年,自动驾驶、机器人等硬件将成为关键领域,2027-2028 年 生成式 AI 和巨神 AI 协同推动应用落地,探索新的业务和变现模式, 2030 年前后或达红利见顶期。 Q&A 目前处于生成式 AI 和巨神智能(巨神 AI)的基础设施建设阶段,这一阶段类似 于当年的 PC 互联 ...
青年科研人看过来!2025“蚂蚁InTech奖”来了
机器之心· 2025-07-02 11:02
机器之心发布 蚂蚁 InTech 奖 亲爱的科研追梦人: 第二届 "蚂蚁 InTech 奖" 正式开放提名推荐通道了!继首届圆满举办后,今年蚂蚁的奖项全面升级,除了继 续为 青年学者 提供 2 0 万元/人的 "科技奖" 资助 ,还首次增设了 5 万元/人的博士生 "奖学金" ,提供对 "青 年学者-博士生" 的全周期支持,全力护航您的科研梦想。 还记得去年上海外滩大会 10 位青年学者摘得首届 InTech 奖荣誉的场景吗?他们的人工智能、数据处理、安 全与隐私等成果,如今已有部分应用到产业前沿。首届奖项吸引了近百位学界泰斗参与推荐,两院院士和 世界顶级学者同台见证。 今年,蚂蚁聚焦四大核心方向: 通用人工智能(AGI)技术 、 具身智能技术 、 数字医学技术 、 数据处理 与安全隐私技术 。这些方向不仅是全球科技角逐的 "主战场",也是蚂蚁集团长期深耕的创新高地。 在这些方向上,蚂蚁期待见证更多青年科学家的突破性成果。 在奖项设置上 提供青年学者-博士生的双轨激励 1 "蚂蚁 InTech 科技奖" 面向全球高校或科研院所从事计算机相关领域科研工作,且获得博士学位未满 10 年的中国青年学者,每年 遴选不 ...
直播预告:「开箱」华为盘古首个开源大模型
机器之心· 2025-07-02 10:40
这周一,开源阵营又迎来一个重磅玩家 —— 华为盘古。 这次,这个新玩家一口气宣布了两个大模型的开源 ——70 亿参数的稠密模型 「 盘古 Emb edded 」和 720 亿参数的混合专家模型「 盘古 Pro MoE 」,甚至连基 于昇腾的模型推理技术也一并开源了。 | pangu-pro-moe | ☆ 108 | pangu-embedded | 公 37 | | --- | --- | --- | --- | | 盘古 Pro MoE (72B-A16B): 昇腾原生的分组混合专家模型 | | 盘古 Embedded (7B):灵活切换快慢思考的高效7B模型 | | | ‌ ‌ ‌ | | ☆ 37 ¥ 4 | | | ascend-inference-cluster | ☆ 115 | ascend-inference-system | △ 40 | | 昇腾超大规模MoE模型推理部署技术分享 | | 异腾盘古推理系统技术 | | | ☆ 115 ¥ 22 | | · Python ⭐ 40 ዓ° 6 | | 综合来看,这两个大模型都不是「等闲之辈」:在 SuperCLUE 5 月榜单上,盘古 Pro ...
李飞飞最新YC现场访谈:从ImageNet到空间智能,追逐AI的北极星
创业邦· 2025-07-02 09:49
来源丨Web3天空之城( Web3SkyCity ) 著名AI科学家李飞飞 这一次在YC创业学院峰会的最新访谈深入探讨了她的职业生涯与前瞻思考。她 分享了创办ImageNet,这一引爆深度学习革命的关键项目的幕后故事,并阐述了计算机视觉从物体 识别到场景叙事,再到她当前所专注的"空间智能"的演进路径。 李飞飞认为,理解和交互于三维世界是实现通用人工智能不可或缺的一环,并为此创立了World Labs。访谈还触及了她的个人经历,从移民少年到创办洗衣店,再到成为顶尖学者和企业家的历程, 强调了"智识上的无畏"是推动创新和个人成长的核心动力。 核心观点 ImageNet的诞生与深度学习的黎明 李飞飞 : 我整个职业生涯都在追逐那些极其困难,近乎妄想的问题。对我来说,没有空间智能的AGI 是不完整的。我想解决这个问题。我就是喜欢当企业家。忘记你过去所做的一切。忘记别人对你的看 法。埋头苦干,努力建设。那是我的舒适区。 主持人 : 所以,我非常兴奋能邀请到李飞飞博士。她在人工智能领域有着非常长的职业生涯。 我相信你们很多人都认识她,对吧?请举手。我也认识。她被称为人工智能教母。飞飞你创建的第一 个项目之一是2009年的 ...
OpenAI快被小扎“挖空”?!Meta斥上亿美元“偷家”,挖来了一个「最强AI团队」
AI科技大本营· 2025-07-02 09:30
整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 过去几个月,Meta 明显加快了 AI 人才争夺战的节奏: 扎克伯格亲自发 Offer 、薪资动辄千万美元起步、 甚至 还开出 1 亿美元的奖金…… " Meta 疯抢人才" 这件事 , 已 成为 整个 行业 中 人尽皆知 的 秘密 。 AI产品爆发,但你的痛点解决了吗?8.15-16 北京威斯汀·全球产品经理大会PM-Su m m it,3000+AI产品人社群已就位。 直面AI落地难题·拆解头部案例·对接精准资源扫码登记信息,添加小助手进群,抢占AI产品下一波红利 进群后,您将有机会得到: 直到 本周 , Meta CEO 马克·扎克伯格 终于 在一封发给全体员工的内部信中,首次 公开 了这场 AI 招募战的成果: 整合 内部多个 AI 核心团队 , 正式 组建 一支 名为 Meta Superintelligence Labs (MSL) 的新团队, 并 从 OpenAI、Anthropic、Google DeepMind 等头部机构 挖来 了 11 位 AI 顶尖研究者 , 目标直指下一代通用人工智能。 从 扎克伯格 放出的 MSL 团队 ...
OpenAI最新播客上线,高管首度还原ChatGPT发布前的内部拉锯战
3 6 Ke· 2025-07-02 08:06
当地时间7月1日,OpenAI在Youtube官方账号发布了第二期播客节目——由前工程师安德鲁・梅恩(Andrew Mayne)主持,公司首席研 究官马克・陈(Mark Chen)和ChatGPT负责人尼克・特利(Nick Turley)作为嘉宾参与。 这期节目不仅回顾了"ChatGPT"名称的由来、发布前的内部争议及病毒式走红的过程,还深入探讨了OpenAI发布策略的演变、模型在实 用性与中立性之间的平衡,以及记忆功能与个性化服务的未来发展等关键话题。核心观点有: 以下为此次播客节目的精华版内容: 01.ChatGPT名称的由来 在人工智能发展史上,ChatGPT的诞生充满戏剧性。特利回忆,它最初叫"Chat with GPT-3.5",发布前夕团队深夜临时决定简化名称,这 看似随意的调整,却让它成了科技史上辨识度极高的品牌。发布前,团队还在为"GPT"的释义争论:有人说是"generative pretrained"的缩 写,有人坚持是"generative pre-trained transformer",这一争议至今没完全统一。 产品发布后的爆火远超预期。特利说,发布首日看到数据还以为统计错了,直到第 ...