Workflow
scaling
icon
Search documents
10万美元成本训练的小模型,在特定任务超越GPT-4o,延迟低99倍
3 6 Ke· 2025-05-14 09:45
现有的SOTA级别大语言模型固然拥有较强智能,在部分任务上达到或超过了人类的水准,但他们的参数尺寸动辄达到数千亿甚至万亿,无论是训练,部 署,还是推理,都成本高昂。对于企业和开发者来说,这些SOTA模型在一些相对简单,但需要大规模和高并发的任务上,未必是综合成本及性能的最优选 择。 一家叫Fastino的早期初创公司看到了这个痛点,使用低端游戏GPU,以平均不到10万美元的成本,训练出一系列称为"任务特定语言模型"(TLMs,Task- Specific Language Models)的小型模型,能够在特定任务上性能媲美大型语言模型,并且推理速度快99倍。 近日,Fastino获得由Khosla Ventures领投的1750万美元种子轮融资,Insight Partners,Valor Equity Partners,以及知名天使投资人前Docker首席执行官Scott Johnston和Weights & Biases首席执行官Lukas Biewald参与。在2024年11月,Fastino获得M12(微软旗下)和Insight Partners领投的700万美元前种子轮融资, 累计融资近2500万美 ...
INTERIM REPORT OF MARIMEKKO CORPORATION, 1 January–31 March 2025: Marimekko’s net sales in the first quarter grew and operating profit was at a good level
Globenewswire· 2025-05-14 05:00
Core Insights - Marimekko's net sales increased by 5% in Q1 2025, reaching EUR 39.6 million, driven by growth in wholesale sales in Europe and retail sales in Finland [6][10][11] - The company anticipates net sales growth for 2025, with a comparable operating profit margin estimated at 16-19% [3][18] Financial Performance - Net sales for Q1 2025 were EUR 39.6 million, compared to EUR 37.7 million in Q1 2024, marking a 5% increase [5][6] - International sales rose by 14%, contributing to 53% of total net sales [5][11] - Operating profit decreased to EUR 4.3 million from EUR 5.1 million, with a margin of 10.8% [5][12] - EBITDA for Q1 2025 was EUR 6.7 million, down from EUR 7.4 million in the previous year [5] Market Dynamics - Retail sales in Finland grew by 9%, but total net sales in Finland decreased by 3% due to lower non-recurring promotional deliveries [11][12] - The company faced challenges from timing-related factors affecting net sales development, particularly in licensing income [6][22] Strategic Initiatives - Marimekko plans to open approximately 10-15 new stores in Asia in 2025, focusing on international growth [20][21] - The company is enhancing its omnichannel retail network, with new store openings and a franchise partnership in Canada [16][17] Future Outlook - The company expects continued growth in international sales, particularly in the Asia-Pacific region, despite uncertainties in the global economy [19][20] - Fixed costs are projected to rise in 2025, influenced by general cost inflation and increased marketing expenses [23]
2025 大模型“国战”:从百模混战到五强争锋
佩妮Penny的世界· 2025-05-13 10:24
大家好,我是佩妮。 AI 2.0 是最近几年投资行业最热赛道,没有之一。 我也一直在关注行业的进展和 AI 相关资本市场的变化。 如果到了 2025 年,你对 AI 大模型的认识还停留在 "AI 六小虎", 那已经远远过时了。 在 ChatGPT 爆火 2 年多后,咱们是时候一起从资本市场观察的视角,来聊聊现在国内AI 基座模型公司的格局演变,以及未来可能的变化趋 势。 本文得到了一些AI 行业和投资人朋友的信息帮助,非常感谢~ 1)AI六小虎,一场关于牛人和朋友圈的资本局; 六小虎中,除了 2019 年成立的智谱,和 2021 年创立的 Minimax,其他公司都是在 2023 年上半年成立的,直接的导火索就是 22 年底 ChatGPT 的横空出世。 不到两年,这几家公司在一级市场的估值就都超过了百亿人民币,领头的智谱 估值超过 250 亿人民币 。 考虑到这些公司的用户规模,收入进展(最多营收不过数亿,没有利润),相比估值的差距,这个火箭跃升的速度,在整个创投历史上都罕 见。 当时虽然也有百模大战之称,但是因为大模型的烧钱特性,能上牌桌的都不是无名之辈。 其中, 零一万物 核心团队已经并入阿里云,明确" ...
超过霉霉,她拿下全球最年轻女富豪
华尔街见闻· 2025-05-11 11:48
以下文章来源于投中网 ,作者张雪 投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识和洞见,在私募股权投资行业和创新商业领域拥有权 威影响力。官网:www.chinaventure.com.cn 这似乎是出人意料的 , 一时间"Lucy Guo是谁"成了各大媒体的头版标题 。的确,即便是Lucy最为人熟知的身份——Scale AI的联合创始人,也常 常是作为该公司和另一位创始人的后缀信息存在。 对于这一头衔,Lucy的态度也比较松弛,"我其实没怎么想过,有点儿疯狂。可惜那都只是纸面上的数字。"得知自己的新头衔后,她向《福布斯》透 露道。 但如果深入了解Lucy的成长经历,就会发现,她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。 辍学、创业、投资, 不被定义的"天才少女" 图片来源福布斯 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔,取而代之的是一位华裔科技创业者,年仅30岁的Lucy Guo。 | 姓名 | 年龄 | 身家 | 国籍 | 财富来源 | | --- | --- | --- | --- | --- | | Lucy Gu ...
早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗?
机器之心· 2025-05-10 13:10
本期通讯总计 21681 字,可免费试读至 6% 消耗 99 微信豆即可兑换完整本期解读(约合人民币 9.9 元) 机器之心PRO · 会员通讯 Week 19 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. 早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗? 什么是Native多模态模型?相较目前流行的「晚融合」方案,「早融合」的Native多模态模型的训练过程有何不同?苹果公司 近期发布的「NNM」技术报告中,有哪些反直觉的新发现?近期业内有哪些获得较好表现的多模态模型?「早融合」是否正在 成为主流?... 2. Agent产品,快者为王?Anthropic 和 Databrick CEO 对话解读 Dario Amodei 为什么说「AI 的未来是 Agents」?数据的「Scaling Law」依然乐观?围绕 Agents 进行数据创新?MCP和 A2A范式下,企业怎样维护数据系统安全?Agents产品迭代的关键缺口如何突破?人类如何把握 AI 技术的双刃剑?... 本期完整版通讯含 2 项专题解读 + 29 项 AI ...
Agent产品,快者为王?Anthropic 和 Databrick CEO 对话解读
机器之心· 2025-05-10 06:07
本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。 Anthropic 和 Databrick 近期以「人工智能的未来:面向各领域的专用 Agent」为主题的线上峰会。两家公司的 CEO Dario Amodei 和 Ali Ghodsi 在其中的对谈环节分享了有关 Agent 的未来、Amodei 此前的博文以及双方 所展开的相关合作等话题。 目录 01. 在谈论Agents之前,人们应该先关注什么? Dario Amodei 在《Machine of Loving Grace》中写了什么?为什么说「AI的未来是Agent」?... 02 . 数 据价值无可替代,但数据治理风险如何破解? Anthropic 和 Databrick 如何围绕数据 Agent 数据进行创新?人类如何把握 AI技术的双刃剑?... 03. AI 应用快速迭代的阻塞要靠 MCP 跨越? Agents 产品迭代的关键缺口如何突破?MCP 和 A2A 范式下,企业怎样维护数据安全?... 04. Anthropic 为何仍乐观看待「Scaling Law」? 3、Ghodsi 进而提出「AI 技术要多久才能 ...
她超过霉霉,拿下全球最年轻女富豪
36氪· 2025-05-09 12:37
以下文章来源于投中网 ,作者张雪 投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识和洞见,在私募股权投资行业和创新商业领域拥有 权威影响力。官网:www.chinaventure.com.cn 持股公司估值突破1800亿。 文 | 张雪 来源| 投中网(ID:China-Venture) 封面来源 | 《福布斯》杂志网站报道截图 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔,取而代之的是一位华裔科技创业者,年仅30岁的Lucy Guo。 这似乎是出人意料的,一时间"Lucy Guo是谁"成了各大媒体的头版标题。的确,即便是Lucy最为人熟知的身份——Scale AI的联合创始人,也常常是作为 该公司和另一位创始人的后缀信息存在。 对于这一头衔,Lucy的态度也比较松弛,"我其实没怎么想过,有点儿疯狂。可惜那都只是纸面上的数字。"得知自己的新头衔后,她向《福布斯》透露 道。 但如果深入了解Lucy的成长经历,就会发现,她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。 辍学、创业、投资 不被定义的"天才少女" 今年30岁的Lucy出生于 ...
万字长文带你读懂强化学习,去中心化强化学习又能否实现?
机器之心· 2025-05-07 04:34
选自 Symbolic Capital 作者:Sam Lehman 机器之心编译 AI / 机器学习 scaling 简史 (极简版) 强化学习(RL)是当今 AI 领域最热门的词汇之一。近日,一篇长文梳理了新时代的强化学习范式对于模型提升的作用,同时还探索了强化学习对去中心化的意 义。 原文地址:https://www.symbolic.capital/writing/the-worlds-rl-gym 「有时候几十年什么也不会发生;有时候几周时间仿佛过了几十年。」这句话形容当今的现代 AI 领域最为贴切。似乎每天都有新的突破性模型、训练方法或公司 涌现,迫使我们重新思考 AI 世界的可能性。今年早些时候是 DeepSeek,接下来是星际之门项目,现在还有 Qwen、Manus、MCP 等。谁知道接下来会发生什么? 目前,在打造更好的模型方面,通过预训练以及最近的测试时间计算进行 scaling 是引领性方法。但最近,随着 DeepSeek-R1 和 R1-Zero 的发布,人们开始更加亲 睐一种不同的模型 scaling 方法 —— 强化学习(RL)。本文的目标是探索基于 RL 的模型改进的含义,并会特别 ...
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
Founder Park· 2025-04-30 12:31
以下文章来源于海外独角兽 ,作者拾象 海外独角兽 . 研究科技大航海时代的伟大公司。 前段时间, OpenAI 陆续发布了 o 系列最新的两个模型 o3 和 o4-mini。其中, o3 模型 在融合了 tool use 能力后,模型表现已经覆盖了 Agent 产品常用的 use case。 Agent 产品开始分化出两类路线:一类是像 o3 那样把 tool use 通过 CoT 内化到模型中,模型可以用写代码调用的方式执行任务;另一类是类似 Manus, 把工作流程外化成人类 OS 中的 computer use。 同时,OpenAI 也已经把 Agent 产品作为了未来产品商业化收入占比的大头。 o3 这类基础大模型的 tool use 内化能力的提升,是否意味着专用 Agent 产品的技术护城河正在消失? 本篇文章针对于 OpenAI 发布的 o3、o4-mini 模型,开源的 Codex CLI,以及在 API 中使用的 GPT 4.1 进行了解读,尤其是 o3 agentic 和多模态 CoT 新能 力。 Founder Park 正在搭建「 AI 产品市集」社群,邀请从业者、开发人员和创业者,扫 ...
o3 深度解读:OpenAI 终于发力 tool use,agent 产品危险了吗?
海外独角兽· 2025-04-25 11:52
作者:cage, haozhen 我们在 2025 年 Q1 的大模型季报 中提到,在 AGI 路线图上,只有智能提升是唯一主线,因此我们持 续关注头部 AI Lab 的模型发布。上周 OpenAI 密集发布了 o 系列最新的两个模型 o3 和 o4-mini,开 源了 Codex CLI,还推出了在 API 中使用的 GPT 4.1。本文将着重对这些新发布进行解读,尤其是 o3 agentic 和多模态 CoT 新能力。 我们认为 OpenAI 在数次平淡的更新后,终于拿出了有惊艳表现的 o3。融合了 tool use 能力后,模型 表现已经覆盖了 agent 产品常用的 use case。Agent 产品开始分化出两类路线:一类是像 o3 那样把 和 o3 的发布模式一样, OpenAI 的 reasoning model 都是先训练出一个 mini reasoning 版本,再 scale 到 一个 long inference time、full tool use 能力的模型上。 而之前 GPT 模型总是先训练出最大的模型,再蒸 馏到小模型上。这个策略值得探讨其原因,我们的猜测是 RL 算法比较脆弱, ...