Workflow
通用人工智能
icon
Search documents
小米开源首个推理大模型 曾说不做OpenAI类大模型,现开出百万元年薪给团队“招兵买马”
Mei Ri Jing Ji Xin Wen· 2025-05-01 16:08
4月30日,小米开源其首个推理大模型Xiaomi MiMo,同时公开了一个此前未曾公开露面的团队:小米大模型Core团队。根据小米 自己的说法,该模型只是团队的初步尝试。至于为何还是赶了"晚班车",小米方面称,2025年虽看似是大模型逐梦的后半程,不 过还是坚信AGI(通用人工智能)征途仍漫长。 参数方面,根据介绍,小米经强化学习训练形成的MiMo-7B-RL模型,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,用7B参数规模,得分超过了OpenAI的闭源推理模型o1-mini和阿里Qwen开源推理模型QwQ-32B-Preview。 在这篇推介自家大模型的文章末尾,小米还默默公开了一个简历投递邮箱,为刚成立不久的团队"招兵买马"。 每经记者 杨卉 每经编辑 魏官红 曾说不做OpenAI类大模型的小米变了。 《每日经济新闻》记者注意到,在部分招聘软件上,小米已经上线了大量与大模型相关的招聘信息,如"大模型算法专家""大模型 推理工程师""大模型数据策略工程师"等,其中公布的年薪最高可达128万元。此外,从招聘详情里也能看到小米给大模型落地找 到的一些场景,如智能门 ...
成立六年勇闯IPO,智谱AI有点急
Sou Hu Cai Jing· 2025-04-30 11:03
Core Viewpoint - Zhiyu AI, a prominent player among China's "six small dragons" in AI, has initiated its IPO process, marking it as the first among its peers to do so. Despite its strong backing and significant funding, the company faces substantial challenges, including reported losses of approximately 2 billion yuan and difficulties in commercializing its technology [1][3][4]. Company Overview - Founded in 2019, Zhiyu AI is considered an "older" player in the AI model startup scene, with its competitors established later. The company is rooted in Tsinghua University's Knowledge Engineering Lab and focuses on developing general artificial intelligence (AGI) models, particularly the GLM series [2][3]. - The company has achieved a valuation of 20 billion yuan, positioning itself as a leading unicorn in the domestic AI sector [2]. Financial Performance - In 2024, Zhiyu AI reported revenues of 300 million yuan but incurred losses of around 2 billion yuan, highlighting the imbalance between high R&D costs and commercial income [3][4]. - The company has completed 19 rounds of financing, attracting significant investments from major players like Meituan and Ant Group, reflecting strong market confidence in its future [5][6]. Competitive Landscape - The competitive environment is intensifying, with rivals adopting open-source and low-cost strategies, which have pressured Zhiyu AI's market share and profitability. The company continues to pursue a fully self-developed technology route, which, while maintaining investor interest, adds to its cost burdens [4][8]. - The emergence of competitors like DeepSeek has further complicated Zhiyu AI's position in the market, necessitating a focus on achieving profitability alongside technological innovation [4][8]. User Feedback and Commercialization Challenges - Despite technological advancements, Zhiyu AI has faced criticism regarding the performance of its products, particularly in user experience and meeting specific needs. Users have reported dissatisfaction with the functionality of its offerings, indicating a gap between technological capabilities and market expectations [9][10].
专访昆仑万维方汉:AI不能画饼,“能挣钱这件事很重要”
Xin Lang Cai Jing· 2025-04-30 10:23
2024年4月,昆仑万维发布第一代音乐生成模型Mureka V1,并于8月上线AI音乐创作平台Mureka。今年3月,公司再度发布Mureka O1与Mureka V6,其中 Mureka O1为首款加入MusiCoT(Chain of Thought)的音乐推理大模型,性能超越了其全球范围内最强劲的对手Suno。方汉透露,这次迭代是受到DeepSeek- R1的启发。 另一边,公司在2024年8上线集成视频大模型与3D大模型的AI短剧平台SkyReels,又于今年2月开源面向AI短剧创作的视频生成模型SkyReels-V1。 音乐和视频,是昆仑万维筛选出来最好的AIGC内容赛道。"全世界有80亿人可以消费视频,40亿人能消费音乐,但可能只有20亿人能消费漫画,10亿人能消 费小说。"方汉对智通财经记者表示。 方汉曾经不远千里飞往一座自己从未听说过名字的小县城,专程去"堵人"。作为昆仑万维(维权)董事长兼CEO,这是他代表公司去竞争AI人才时必要的自 觉。 他说自己从不会让这些人来公司,都是自己"巴巴地"上门,找一家餐馆或咖啡厅,一口气跟人家聊上几个小时。凭借这样的方式,方汉成功为昆仑万维吸引 了一批技术人才 ...
扎克伯格最新专访:AI 会在知识工作和编程领域,引发一场巨大的革命
Sou Hu Cai Jing· 2025-04-30 10:02
近日,Meta首席执行官马克·扎克伯格接受了媒体采访,全程信息量满满。访谈中, 扎克伯格谈到了 Meta如何看待下一步AI发展格局,并回应了外界认 为"DeepSeek吊打Meta"的质疑。 他表示,通过比较Llama 4 模型与 DeepSeek 的能力可知, 尽管 DeepSeek 可能在特定领域取得了显著进展,但Llama 4模型能够提供更高的效率和更广泛 的功能。 以下为采访内容(有删节): 马克·扎克伯格:在我看来,世界会变得更加有趣、甚至有些奇特。根据我的经验,如果你觉得别人做的事情不好,但他们自己却认为很有价值,那么通 常是他们对,你错了。 主持人Patel: 我们似乎正在消除技术利用奖励机制来完全操纵我们的所有障碍。 马克·扎克伯格:我们正在努力构建能推进 Llama 研究的编码代理。我估计 在未来 12 到 18 个月内,我们将达到一个阶段,届时这些研发工作所需的大部 分代码都将由 AI 编写。我倾向于认为,至少在可预见的未来,这反而会增加对人类工作的需求,而非减少。如果你将提供服务的成本降至原来的十分之 一,那么现在去做这件事实际上可能是有意义的。 主持人Patel:你上次来的时候,发布了 ...
OpenAI揭秘Deep Research实现始末
锦秋集· 2025-04-30 07:09
与市面上多数"通用Agent"不同,OpenAI 的 Deep Research 从诞生那一刻起就被锁定在一件事上—— 通过强化 学习,将搜索、浏览、筛选与整合信息的能力内化为模型的原生技能,直接训练进参数里,而不是仅靠 Prompt工程和外部工程组合 。 那么,OpenAI 是如何把这套复杂技能训练进参数里的?他们在数据筹备、强化微调、安全与记忆管理上又摸 索出了哪些最佳实践? OpenAI Deep Research团队核心成员Isa Fulford最近在一个访谈中做了分享: 我们认为这个访谈提供了一个透视 OpenAI 构建旗舰智能体 Deep Research 的独特视角,并提供了一些开发实 践经验,因此锦秋基金( 微信公号锦秋集ID:jqcapital)对本文进行了编译。 01 Deep Research 的起源与目标 OpenAI 团队在强化学习算法刚刚显露锋芒时,放弃了订汉堡、订花那条看似容易衡量的交易型赛道, 转而攻克浏览与知识整合——他们认为整合知识是AGI 必不可少的前置技能, 也因为"纯读取"比"直接 下单"更安全。 数据的质量比数量更重要。 Deep Research 倾向"小而准": ...
OpenAI与微软“蜜月期”终结?奥尔特曼与纳德拉的AI盟约出现裂痕
Jin Shi Shu Ju· 2025-04-30 03:46
过去六年里,微软向这家人工智能初创公司注入了数十亿美元的资金,为其快速增长提供了强劲动力, 助力OpenAI推出的ChatGPT获得了每周超过5亿用户。OpenAI则为微软提供了先进的生成式AI工具,也 推动了这家科技巨头股价翻了三倍。 但这段合作关系如今已出现裂痕。知情人士透露,两位CEO围绕微软为OpenAI提供的算力资源、微软 对OpenAI模型的访问权限,以及奥尔特曼领导下的AI系统是否即将实现类人智能等问题,分歧日益加 深。微软CEO纳德拉(Satya Nadella)已将推动ChatGPT竞争对手Copilot的销售和使用列为优先事项, 并在去年悄然聘请了奥尔特曼的一位竞争对手,着手组建团队开发微软自有的大模型,以减少对 OpenAI的依赖。 尽管两家公司正为未来可能的"分家"做准备,但在当下这场全球AI竞赛的关键时刻,彼此仍握有极大 的影响力。 据知情人士透露,微软有能力阻止OpenAI转型为独立的盈利性公司。如果这一转型在今年年底前无法 完成,OpenAI可能会损失数百亿美元。不过,有知情人士表示,截至目前,微软尚未威胁要采取此类 行动。与此同时,OpenAI的董事会也有权启动合同中的一项条款 ...
对话朱松纯:Agent喧嚣之上,“走心”才是AGI的未来?
AI科技大本营· 2025-04-30 03:02
作者 | 王启隆 出品|《新程序员》 2025 年的AI 领域,似乎没有哪个词比"Agent"更炙手可热。从 OpenAI 的 Operator 到"第一个通用智能体"Manus 的出圈,"智能体元年"的呼声不绝 于耳,仿佛我们距离那个能自主理解、规划、执行任务的通用人工智能(AGI)只有一步之遥。 喧嚣之下,一些根本性的问题挥之不去:究竟何为 Agent?我们真正踏上了通往通用人工智能(AGI)的那条路吗?当前主流的、依赖海量数据和算力 堆砌起来的大模型路径,是否足以孕育出真正拥有理解力、自主性甚至"灵魂"的智能? 当许多人沉浸在狂欢之时,全球知名人工智能科学家、北京通用人工智能研究院院长、北京大学人工智能研究院院长兼智能学院院长朱松纯教授,却在 疾呼一种不同的声音——当前许多所谓的Agent,可能连真正的"智能体"都算不上。 近日,《新程序员》在北京的一场围绕其新书《通用人工智能标准、评级、测试与架构》的媒体见面会上,采访了朱松纯教授。他的观点,或许能为我 们拨开Agent 的迷雾,提供一个审视 AGI 未来更深邃的视角。 《新程序员》: 朱院长您好,今年Agent 是个热词,很多人称 2025 年是"A ...
宇树科技董事王其鑫:AGI不是梦,具身智能技术路线要分三步走
Mei Ri Jing Ji Xin Wen· 2025-04-29 16:15
每经记者 赵李南 每经编辑 魏官红 4月29日,第八届数字中国建设峰会开幕。 由国家数据局主办,国家数据发展研究院、国家发展改革委城市和小城镇改革发展中心、中国信息通信 研究院等承办的数字中国建设峰会数字经济分论坛在同日举行。 杭州宇树科技有限公司(以下简称宇树科技)董事王其鑫发表了主题演讲。王其鑫表示,2024年国内的 具身/人形项目融资突破100亿元,在可展望的未来,人形机器人会走进千家万户。 王其鑫认为,以人形机器人实现具身智能在技术路线上的发展可分为三步。第一,建立第一视角下灵活 的具身认知系统;第二,实现高度自主的决策规划能力;第三,实现目标驱动与物理世界的精确运动交 互。 AGI的实现是非常有可能的 王其鑫介绍称,目前宇树科技的产品分为消费级和行业级的机器人。 "消费级的机器人就是普通消费者可以买回去(使用),比如帮你取外卖、取快递,跑步帮你背个水, 买菜帮你背包,做一些简单的事情,售价也会比较便宜,在天猫、京东就可以直接下单购买。"王其鑫 表示。 王其鑫称,宇树科技主要的销售来源其实是工业端。"我们工业级的四足机器人,它可以在电力巡检、 消防救援、园区安防等领域提供服务。一般应用场景都是一些有毒 ...
全网都在等梁文锋
凤凰网财经· 2025-04-29 12:39
以下文章来源于凤凰网科技 ,作者凤凰网科技 凤凰网科技 . 凤凰科技频道官方账号,带你直击真相。 来源|凤凰网科技 作者|姜凡 编辑|董雨晴 五月将至,中美科技巨头或将迎来新一轮巅峰对决。 先是在4月中旬,OpenAI一口气发布了GPT-4.1 o3、o4 mini系列模型;谷歌则拿出了Gemini 2.5 Flash Preview,一个混合推理模型;与谷歌同 一天,豆包在杭州巡展中正式发布了1.5·深度思考模型,在多模态上展现出了更强的实力。凤凰网科技从行业人士处了解到,阿里的下一代大模型 Qwen3也将于本月内发布。 混战之下,那股"神秘的东方力量"似乎也在悄悄准备着新的发布。 敏感的神经之下,一点蛛丝马迹都会被放大。 昨日,全球最大AI开源社区Hugging Face首席执行官Clément Delangue在社交平台发布了一条耐人 寻味的动态。这条动态仅由三个眼睛的表情符号构成,并附上了DeepSeek团队在Hugging Face平台的官方资源库入口。 这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。 01 DeepSeek R2发布已进入倒计时? 近半个 ...
阿里开源首个“混合推理模型”:集成“快思考”、“慢思考”能力
Xin Lang Cai Jing· 2025-04-29 06:28
Core Insights - Alibaba has open-sourced its new generation model Qwen3, which integrates "fast thinking" and "slow thinking" capabilities, significantly reducing deployment costs compared to other large models like Deepseek [1] - The Qwen3 model employs a "Mixture of Experts (MoE)" architecture, allowing it to mimic human problem-solving by providing multi-step deep thinking for complex issues and quick responses for simpler queries, thus saving computational resources [3] - Alibaba is focusing on building its AI strategy around the Qwen series, with plans to invest over 380 billion RMB in cloud and AI hardware infrastructure over the next three years, surpassing the total investment of the past decade [4] Industry Context - Following the release of Deepseek's low-cost high-performance R1 model, domestic tech companies in China, including Baidu and iFlytek, are rapidly launching a series of cost-effective AI model services [3] - Alibaba's Qwen series has surpassed the US Llama in terms of open-source model downloads, with over 300 million downloads and more than 100,000 derivative models [4] - On the same day Alibaba announced Qwen3, OpenAI released several updates to ChatGPT, enhancing its shopping features and optimizing for various consumer categories, indicating a competitive landscape in AI model development [4]