Workflow
AGI(通用人工智能)
icon
Search documents
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
Hu Xiu· 2025-05-08 11:50
5月8日,在海淀大恒科技中心的阶跃星辰北京办公地,阶跃星辰创始人、CEO姜大昕身着深色西服、蓝 色衬衫出现在阶跃星辰北京办公地的会议室里。他保持了一贯的风格,如二十一年前在新加坡南洋理工 教书时,像老师一样在屏幕前平静地讲述自己对于多模态模型行业的判断。这里距离姜大昕上一个东家 微软的中国办公地微软大厦仅有504米,在2023年创立阶跃星辰前,姜大昕是微软全球副总裁。 "多模态模型领域目前还没有出现GPT-4时刻。卡点是整个行业缺少多模态领域的理解生成一体化架 构。有了这个架构,才能基于此通过海量的图片视频去做预训练+指令跟随,最终演变为世界模 型。"姜大昕说。 "理解生成一体化架构"不只是姜大昕的技术判断,也正在影响这家公司的走向。 虎嗅独家获悉,近期阶跃星辰内部,进行了算法小组内的微调:原本阶跃星辰内部团队分为生成小组和 理解小组,而这两个小组已经整合为新的"生成理解"团队。 姜大昕向虎嗅表示,这一调整,确实是基于"理解生成一体化架构至关重要"这个判断。 虎嗅获悉,目前阶跃星辰的运转以三个男人为核心: 姜大昕 阶跃星辰创始人、CEO 负责公司整体战略、技术研发 张祥雨 阶跃星辰首席科学家 负责公司技术研发 ...
小米开源首个推理大模型 曾说不做OpenAI类大模型,现开出百万元年薪给团队“招兵买马”
Mei Ri Jing Ji Xin Wen· 2025-05-01 16:08
4月30日,小米开源其首个推理大模型Xiaomi MiMo,同时公开了一个此前未曾公开露面的团队:小米大模型Core团队。根据小米 自己的说法,该模型只是团队的初步尝试。至于为何还是赶了"晚班车",小米方面称,2025年虽看似是大模型逐梦的后半程,不 过还是坚信AGI(通用人工智能)征途仍漫长。 参数方面,根据介绍,小米经强化学习训练形成的MiMo-7B-RL模型,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,用7B参数规模,得分超过了OpenAI的闭源推理模型o1-mini和阿里Qwen开源推理模型QwQ-32B-Preview。 在这篇推介自家大模型的文章末尾,小米还默默公开了一个简历投递邮箱,为刚成立不久的团队"招兵买马"。 每经记者 杨卉 每经编辑 魏官红 曾说不做OpenAI类大模型的小米变了。 《每日经济新闻》记者注意到,在部分招聘软件上,小米已经上线了大量与大模型相关的招聘信息,如"大模型算法专家""大模型 推理工程师""大模型数据策略工程师"等,其中公布的年薪最高可达128万元。此外,从招聘详情里也能看到小米给大模型落地找 到的一些场景,如智能门 ...
AI浪潮录丨对话刘知远:通往AGI不易,长跑要顶住资本寒冬
Bei Ke Cai Jing· 2025-04-29 01:18
当人工智能的浪潮席卷全球,北京正以科技创新之姿,成为AI大模型领域的战略高地。从智源研究院的"悟道"大模型问世,到"天使投资人"模式孵化顶尖学 者,再到月之暗面、DeepSeek、智谱等人工智能独角兽崛起,这座城市不仅汇聚了前沿技术,更以开放生态孕育突破性成果。 如今,北京正积极打造"全球开源之都",一大批研发机构、企业积极拥抱开源,而开源也已深入到汽车、机器人等众多行业。发展AI将是一场科技长征,新 京报AI研究院将深度访谈此次AI浪潮的亲历者与见证人,讲述AI竞争新格局与背后的故事。 开栏语 刘知远向记者讲解AI技术发展历程。 新京报贝壳财经记者 罗亦丹 摄 迈入2025年,中国AI(人工智能)站上足以与美国分庭抗礼的战略制高点。这一年,刘知远已经在AI追赶的路上走了近20年。 作为清华大学副教授、面壁智能联合创始人兼首席科学家,五年前,他训练了中文预训练模型的第一个版本,而由他参与、智源研究院发布的"悟道2.0"也 成为中国第一个万亿大模型。 彼时,一个争论的焦点就是大模型研发应该"从大炼模型,到炼大模型"。2023年,ChatGPT破圈宣布了"炼大模型"路线的正确。 如今,面对DeepSeek走红,刘 ...
李善友:DeepSeek,是国运的AI支点
混沌学园· 2025-04-27 10:16
2025年4月25日,2025年李善友开年大课暨混沌·AI创新院开学典礼正式开讲。 Day1的主题是"AI的进击",在上午的大课中,教授动情表示:DeepSeek,将是国运的AI支点。 以下是李善友教授大课的笔记内容。 讲者 |李善友 我相信未来的20 年 , 必然是 AI 在中国的黄金 20 年 。 其实在大课开始 前,我们 同事 问我 :教授 你 为这堂课 , 做了多长时间的准备? 我想 : 这个准备 , 如果从长来说可能是十年, 往 短 里 说可能是 18 个月。 所以: 18 个月以来 , 我一直在思考,今天这个时代命题是什么?混沌要呼应什么样的命题? 我要 把最大公约数的那个命题 , 像旗帜一样举出来,跟 所有 同学们去呼应。 这个命题 究竟 是什么? 我一直 在 思考。 因为马斯克看见了一件事情,谷歌把之前最领先的 AI 实验室 DeepMind 给收购了。 马斯克心中有一个巨大的隐忧—— AI 比核武器更具威胁,任由 AI 发展下去,最终 AI 一定反过来控制人类,甚至会毁灭人类。 其实我认为, OpenAI 是这一轮 AI 革命的先驱。 我觉得 全世界的人,都应该向 AI革命的先驱OpenAI ...
4.25犀牛财经晚报:腾讯音乐拟收购喜马拉雅 传Manus融资7500万美元
Xi Niu Cai Jing· 2025-04-25 10:38
全国首例!上市公司董监高违反公开承诺案今宣判 上海金融法院4月25日公开宣判原告刘某某、郑某某诉被告上海金某泰化工股份有限公司、袁某、罗某 证券虚假陈述责任纠纷一案。该案是2019年修订《中华人民共和国证券法》以来,全国首例因上市公司 董监高未履行公开增持承诺引发的证券侵权纠纷案件。上海金融法院经审理认为,本案中,袁某、罗某 在首次作出增持承诺时并无资金准备,在后续延期过程中亦未积极筹措资金,且在面对交易所质询时以 过桥资金制作"虚假"存款证明,故难以认定其有增持的真实意愿。从增持主体、承诺增持金额、市场影 响力等角度看,袁某、罗某公开增持承诺信息的披露,对证券市场和投资者预期产生严重误导,其所主 张的未能履行增持承诺的抗辩理由明显不合理,故虚假陈述行为成立且具有重大性。再次,公开承诺人 袁某、罗某为法定信息披露义务人,而非金某泰。 从信息披露的全过程看,金某泰尽到了基本的审查义务,亦无证据证明金某泰明知或应知袁某、罗某存 在虚假陈述,故不应承担案涉虚假陈述行为的民事赔偿责任。综上,经委托第三方机构损失核定,上海 金融法院一审判令被告袁某、罗某共同赔偿原告刘某某投资损失506,130.96元,共同赔偿原告郑某 ...
3 位连续创业者打造 Manus,应用潮里有更多 “underdog” 的机会(文末附 Manus、Open Manus 实测)
晚点LatePost· 2025-03-08 12:17
编辑 丨 程曼祺 3 月 6 日,AI 产品 Manus 引发关注。开发 Manus 的三位关键人物是:创始人、CEO 肖弘(小红);联 合创始人、首席科学家季逸超(Peak);以及产品合伙人张涛(hidecloud)——两位 90 后连续创业者 和一位 15 年换了 10 家公司的 85 后产品老兵。 一个边缘地带的 "underdog" 小团队 ,以车库创业的开发方式,出乎意料地搅起了一场小风暴。 "硬科技创业者基本都是名门正派,光谱另一端的消费级产品创始人则几乎都是畎亩之中。" 真格基金投 资人刘元说。他也是 Manus 的天使投资人。 毕业于华中科技大学的肖弘是江西吉安人,创业起点在武汉,曾开发过两款微信生态的插件:微信公众 号排版工具壹伴和企业微信客户关系管理工具微伴,卖给一家独角兽公司。 高中阶段就开始创业的季逸超是北京人,他在苹果 App Store 上线不久,就开发出猛犸浏览器,后来做 了 Magi 知识搜索引擎。季逸超曾告诉我们,那时有投资人 "诱惑" 他:我给你一笔钱,敢不敢做个 Google?他拒绝了,不是觉得做不到,而是他觉得只有 "抛开利益" 才有可能。 重庆人张涛则先后在烽火国际、 ...
硅谷正在崛起“OpenAI黑帮”
创业邦· 2025-03-04 10:43
以下文章来源于硅兔君 ,作者旗舰 硅兔君 . 50万创投人关注的硅谷科技风向标 来源丨硅兔君(ID:gh_1faae33d0655) 图源丨Midjourney "OpenAI前员工"的名头,在市场上到底有多值钱? 当地时间2月25日,据Business Insider报道称,OpenAI前首席技术官Mira Murati 刚刚官宣的新公司 Thinking Machines Lab,正在以90亿美元估值启动10亿美元融资。 目前,Thinking Machines Lab尚未透露任何产品、技术的时间表或具体细节,这家公司的公开的信息只有 超过20人的OpenAI前员工团队,以及他们的愿景:构建"每个人都能获得知识和工具,让AI为人们的独特 需求和目标服务"的未来。 OpenAI系创业者的资本号召力已形成"滚雪球效应"。在Murati之前,OpenAI前首席科学家Ilya Sutskever创 立的SSI就已经仅凭OpenAI基因和一个理念和就拿到了300亿美元估值。 自2018年马斯克退出OpenAI以来,前OpenAI员工创办了超过30家新公司,总融资额超过90亿美元。这些 公司形成了覆盖AI安全(Ant ...
DeepSeek首次披露:理论成本利润率545%!
证券时报· 2025-03-01 08:38
3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘 密。 最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2美元/小 时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天, 成本利润率为545%。 最大程度优化推理系统,理论成本利润率高达545% 据文章介绍,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为了实现这两个目标,DeepSeek使用了 大规模跨节点专家并行(Expert Parallelism / EP)的方法,并通过一系列技术策略,最大程度地优化了大模型推理系统, 实现了惊人的性能和效率。 DeepSeek开源周收官,DeepSeek以最后一弹,再次在AI江湖激起了层层涟漪。 具体而言,在更大的吞吐的方面,大规模跨节点专家并行能够使得batch size(批尺寸)大大增加,从而提高GPU矩阵乘 法的效率,提高吞吐。 batch size在深度学习中 ...
刷新中的阿里:当它不再被认为只是一家电商公司
晚点LatePost· 2025-02-21 15:30
阿里向 "科技 + 零售" 公司转型。 2 月 20 日阿里巴巴发布 2024 年四季报,远超预期的业绩、单日涨超 10% 和一个月内涨近 50% 的股价, 让很多长期关注阿里的人感叹:"这还是阿里吗?" CEO 吴泳铭也不再像过去那样低调,在电话会中回答第一个提问时,就抛出了四个 "最",阿里巴巴集团 是 "最重要 AI 玩家""亚洲最大""规模最大""to C 最多应用场景"。分析师的提问几乎全部围绕 "AI",而此 前的 10 年,电商才是他们最关心的话题。 除了电话会,财报的数据中最值得在意的是,阿里本季度的资本开支 —— 318 亿元,环比增长 80%。吴 泳铭还强调,阿里将加大投入三大 AI 领域,未来三年将是云建设最集中的三年,在云和 AI 的基础设施投 入预计将超越过去十年的总和。这给了资本市场非常大的想象空间,提振了全球投资者对中国科技行业的 投资信心。 过去一年半,是阿里 "重新创业" 的一年半,也是阿里坚定 AI 投入的一年半,这家公司试图向市场提供一 个他们真正认可的新增长故事。 从吴泳铭 2023 年 9 月出任阿里 CEO 后不久提出的 "用户为先,AI 驱动" 战略,到当年互联网 ...
阿里预计未来资本开支超过去十年总和;瑞幸利润微增,迎接成本挑战;游戏和广告让B站连续两个季度盈利丨百亿美元公司动向
晚点LatePost· 2025-02-21 15:30
未来三年,阿里资本开支将超过过去十年总和。 今晚的阿里 2025 第三财季业绩会上,阿里集团 CEO 吴泳铭表示,AI 是几十年一遇的机会。阿里 的 AI 战略第一目标是 AGI (通用人工智能)的实现,可能远远超过现在可见的任何一个应用场 景。 他说,从实现 AGI 的商业价值来看,标准定义是能够完成 80% 以上的人类能力。全球 GDP 的 50% 支出是劳动工资支出,包括脑力劳动和体力劳动。如果实现 AGI ,人工智能相关产业大概率 将会是全球最大的产业,有可能影响或者替代现在 50% 左右的 GDP 构成。 管理层判断,阿里是亚洲市场具备几个关键要素的重要 AI 玩家,有亚洲最大、全球第四的云服务 和先进的自研 AI 模型,在 to c 生态上有最多应用场景。未来三年,阿里在云和 AI 的基础设施投 入预计将超越过去十年的总和(约 3800 亿元),要猛攻 AI 基础大模型和原生应用,死守技术领 先地位,以及用 AI 彻底改造电商等老业务,挖出用户新价值。 受 AI 相关利好推动,年初至今阿里股价已上涨近 49%,今日财报发布后,阿里盘前涨超 10% 至 138.2 港元。 9.9 价格战下,瑞幸咖啡 ...