scaling - filings, earnings calls, financial reports, news - Reportify

scaling

Search documents

10万美元成本训练的小模型，在特定任务超越GPT-4o，延迟低99倍

3 6 Ke· 2025-05-14 09:45

现有的SOTA级别大语言模型固然拥有较强智能，在部分任务上达到或超过了人类的水准，但他们的参数尺寸动辄达到数千亿甚至万亿，无论是训练，部署，还是推理，都成本高昂。对于企业和开发者来说，这些SOTA模型在一些相对简单，但需要大规模和高并发的任务上，未必是综合成本及性能的最优选择。一家叫Fastino的早期初创公司看到了这个痛点，使用低端游戏GPU，以平均不到10万美元的成本，训练出一系列称为"任务特定语言模型"（TLMs，Task- Specific Language Models）的小型模型，能够在特定任务上性能媲美大型语言模型，并且推理速度快99倍。近日，Fastino获得由Khosla Ventures领投的1750万美元种子轮融资，Insight Partners，Valor Equity Partners，以及知名天使投资人前Docker首席执行官Scott Johnston和Weights & Biases首席执行官Lukas Biewald参与。在2024年11月，Fastino获得M12（微软旗下）和Insight Partners领投的700万美元前种子轮融资，累计融资近2500万美 ...

大语言模型

Artificial Intelligence

任务特定语言模型（TLMs）

大语言模型

Artificial Intelligence

任务特定语言模型（TLMs）

INTERIM REPORT OF MARIMEKKO CORPORATION, 1 January–31 March 2025: Marimekko’s net sales in the first quarter grew and operating profit was at a good level

Globenewswire· 2025-05-14 05:00

Core Insights - Marimekko's net sales increased by 5% in Q1 2025, reaching EUR 39.6 million, driven by growth in wholesale sales in Europe and retail sales in Finland [6][10][11] - The company anticipates net sales growth for 2025, with a comparable operating profit margin estimated at 16-19% [3][18] Financial Performance - Net sales for Q1 2025 were EUR 39.6 million, compared to EUR 37.7 million in Q1 2024, marking a 5% increase [5][6] - International sales rose by 14%, contributing to 53% of total net sales [5][11] - Operating profit decreased to EUR 4.3 million from EUR 5.1 million, with a margin of 10.8% [5][12] - EBITDA for Q1 2025 was EUR 6.7 million, down from EUR 7.4 million in the previous year [5] Market Dynamics - Retail sales in Finland grew by 9%, but total net sales in Finland decreased by 3% due to lower non-recurring promotional deliveries [11][12] - The company faced challenges from timing-related factors affecting net sales development, particularly in licensing income [6][22] Strategic Initiatives - Marimekko plans to open approximately 10-15 new stores in Asia in 2025, focusing on international growth [20][21] - The company is enhancing its omnichannel retail network, with new store openings and a franchise partnership in Canada [16][17] Future Outlook - The company expects continued growth in international sales, particularly in the Asia-Pacific region, despite uncertainties in the global economy [19][20] - Fixed costs are projected to rise in 2025, influenced by general cost inflation and increased marketing expenses [23]

Omnichannel Retail

Accessories & Luxury Goods

Omnichannel Retail

Accessories & Luxury Goods

2025 大模型“国战”：从百模混战到五强争锋

佩妮Penny的世界· 2025-05-13 10:24

大家好，我是佩妮。 AI 2.0 是最近几年投资行业最热赛道，没有之一。我也一直在关注行业的进展和 AI 相关资本市场的变化。如果到了 2025 年，你对 AI 大模型的认识还停留在 "AI 六小虎"，那已经远远过时了。在 ChatGPT 爆火 2 年多后，咱们是时候一起从资本市场观察的视角，来聊聊现在国内AI 基座模型公司的格局演变，以及未来可能的变化趋势。本文得到了一些AI 行业和投资人朋友的信息帮助，非常感谢～ 1）AI六小虎，一场关于牛人和朋友圈的资本局；六小虎中，除了 2019 年成立的智谱，和 2021 年创立的 Minimax，其他公司都是在 2023 年上半年成立的，直接的导火索就是 22 年底 ChatGPT 的横空出世。不到两年，这几家公司在一级市场的估值就都超过了百亿人民币，领头的智谱估值超过 250 亿人民币。考虑到这些公司的用户规模，收入进展（最多营收不过数亿，没有利润），相比估值的差距，这个火箭跃升的速度，在整个创投历史上都罕见。当时虽然也有百模大战之称，但是因为大模型的烧钱特性，能上牌桌的都不是无名之辈。其中，零一万物核心团队已经并入阿里云，明确" ...

Artificial Intelligence

Artificial Intelligence

超过霉霉，她拿下全球最年轻女富豪

华尔街见闻· 2025-05-11 11:48

以下文章来源于投中网，作者张雪投中网 . 投中网是领先的创新经济信息服务平台，拥有立体化传播矩阵，为创新经济人群提供深入、独到的智识和洞见，在私募股权投资行业和创新商业领域拥有权威影响力。官网：www.chinaventure.com.cn 这似乎是出人意料的，一时间"Lucy Guo是谁"成了各大媒体的头版标题。的确，即便是Lucy最为人熟知的身份——Scale AI的联合创始人，也常常是作为该公司和另一位创始人的后缀信息存在。对于这一头衔，Lucy的态度也比较松弛，"我其实没怎么想过，有点儿疯狂。可惜那都只是纸面上的数字。"得知自己的新头衔后，她向《福布斯》透露道。但如果深入了解Lucy的成长经历，就会发现，她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。辍学、创业、投资，不被定义的"天才少女" 图片来源福布斯 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔，取而代之的是一位华裔科技创业者，年仅30岁的Lucy Guo。 | 姓名 | 年龄 | 身家 | 国籍 | 财富来源 | | --- | --- | --- | --- | --- | | Lucy Gu ...

Scaling Law理论

Scaling Law理论

早融合 VS 晚融合，Natvie 多模态大模型的 Scaling Law 有所不同吗？

机器之心· 2025-05-10 13:10

本期通讯总计 21681 字，可免费试读至 6% 消耗 99 微信豆即可兑换完整本期解读（约合人民币 9.9 元）机器之心PRO · 会员通讯 Week 19 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. 早融合 VS 晚融合，Natvie 多模态大模型的 Scaling Law 有所不同吗？什么是Native多模态模型？相较目前流行的「晚融合」方案，「早融合」的Native多模态模型的训练过程有何不同？苹果公司近期发布的「NNM」技术报告中，有哪些反直觉的新发现？近期业内有哪些获得较好表现的多模态模型？「早融合」是否正在成为主流？... 2. Agent产品，快者为王？Anthropic 和 Databrick CEO 对话解读 Dario Amodei 为什么说「AI 的未来是 Agents」？数据的「Scaling Law」依然乐观？围绕 Agents 进行数据创新？MCP和 A2A范式下，企业怎样维护数据系统安全？Agents产品迭代的关键缺口如何突破？人类如何把握 AI 技术的双刃剑？... 本期完整版通讯含 2 项专题解读 + 29 项 AI ...

Native多模态模型

Artificial Intelligence

Native多模态模型

Artificial Intelligence

Agent产品，快者为王？Anthropic 和 Databrick CEO 对话解读

机器之心· 2025-05-10 06:07

本文来自PRO会员通讯内容，文末关注「机器之心PRO会员」，查看更多专题解读。 Anthropic 和 Databrick 近期以「人工智能的未来：面向各领域的专用 Agent」为主题的线上峰会。两家公司的 CEO Dario Amodei 和 Ali Ghodsi 在其中的对谈环节分享了有关 Agent 的未来、Amodei 此前的博文以及双方所展开的相关合作等话题。目录 01. 在谈论Agents之前，人们应该先关注什么？ Dario Amodei 在《Machine of Loving Grace》中写了什么？为什么说「AI的未来是Agent」？... 02 . 数据价值无可替代，但数据治理风险如何破解？ Anthropic 和 Databrick 如何围绕数据 Agent 数据进行创新？人类如何把握 AI技术的双刃剑？... 03. AI 应用快速迭代的阻塞要靠 MCP 跨越？ Agents 产品迭代的关键缺口如何突破？MCP 和 A2A 范式下，企业怎样维护数据安全？... 04. Anthropic 为何仍乐观看待「Scaling Law」？ 3、Ghodsi 进而提出「AI 技术要多久才能 ...

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

她超过霉霉，拿下全球最年轻女富豪

36氪· 2025-05-09 12:37

以下文章来源于投中网，作者张雪投中网 . 投中网是领先的创新经济信息服务平台，拥有立体化传播矩阵，为创新经济人群提供深入、独到的智识和洞见，在私募股权投资行业和创新商业领域拥有权威影响力。官网：www.chinaventure.com.cn 持股公司估值突破1800亿。文｜张雪来源｜投中网(ID:China-Venture) 封面来源｜《福布斯》杂志网站报道截图 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔，取而代之的是一位华裔科技创业者，年仅30岁的Lucy Guo。这似乎是出人意料的，一时间"Lucy Guo是谁"成了各大媒体的头版标题。的确，即便是Lucy最为人熟知的身份——Scale AI的联合创始人，也常常是作为该公司和另一位创始人的后缀信息存在。对于这一头衔，Lucy的态度也比较松弛，"我其实没怎么想过，有点儿疯狂。可惜那都只是纸面上的数字。"得知自己的新头衔后，她向《福布斯》透露道。但如果深入了解Lucy的成长经历，就会发现，她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。辍学、创业、投资不被定义的"天才少女" 今年30岁的Lucy出生于 ...

Scaling Law理论

Scaling Law理论

万字长文带你读懂强化学习，去中心化强化学习又能否实现？

机器之心· 2025-05-07 04:34

选自 Symbolic Capital 作者：Sam Lehman 机器之心编译 AI / 机器学习 scaling 简史（极简版）强化学习（RL）是当今 AI 领域最热门的词汇之一。近日，一篇长文梳理了新时代的强化学习范式对于模型提升的作用，同时还探索了强化学习对去中心化的意义。原文地址：https://www.symbolic.capital/writing/the-worlds-rl-gym 「有时候几十年什么也不会发生；有时候几周时间仿佛过了几十年。」这句话形容当今的现代 AI 领域最为贴切。似乎每天都有新的突破性模型、训练方法或公司涌现，迫使我们重新思考 AI 世界的可能性。今年早些时候是 DeepSeek，接下来是星际之门项目，现在还有 Qwen、Manus、MCP 等。谁知道接下来会发生什么？目前，在打造更好的模型方面，通过预训练以及最近的测试时间计算进行 scaling 是引领性方法。但最近，随着 DeepSeek-R1 和 R1-Zero 的发布，人们开始更加亲睐一种不同的模型 scaling 方法 —— 强化学习（RL）。本文的目标是探索基于 RL 的模型改进的含义，并会特别 ...

去中心化强化学习

预训练 Scaling Law

测试时间计算 scaling

Artificial Intelligence

DeepSeek-R1-Zero

去中心化强化学习

预训练 Scaling Law

测试时间计算 scaling

Artificial Intelligence

DeepSeek-R1-Zero

o3解读：OpenAI发力tool use，Manus们会被模型取代吗？

Founder Park· 2025-04-30 12:31

以下文章来源于海外独角兽，作者拾象海外独角兽 . 研究科技大航海时代的伟大公司。前段时间， OpenAI 陆续发布了 o 系列最新的两个模型 o3 和 o4-mini。其中， o3 模型在融合了 tool use 能力后，模型表现已经覆盖了 Agent 产品常用的 use case。 Agent 产品开始分化出两类路线：一类是像 o3 那样把 tool use 通过 CoT 内化到模型中，模型可以用写代码调用的方式执行任务；另一类是类似 Manus，把工作流程外化成人类 OS 中的 computer use。同时，OpenAI 也已经把 Agent 产品作为了未来产品商业化收入占比的大头。 o3 这类基础大模型的 tool use 内化能力的提升，是否意味着专用 Agent 产品的技术护城河正在消失？本篇文章针对于 OpenAI 发布的 o3、o4-mini 模型，开源的 Codex CLI，以及在 API 中使用的 GPT 4.1 进行了解读，尤其是 o3 agentic 和多模态 CoT 新能力。 Founder Park 正在搭建「 AI 产品市集」社群，邀请从业者、开发人员和创业者，扫 ...

Era of Experience

Artificial Intelligence

Era of Experience

Artificial Intelligence

o3 深度解读：OpenAI 终于发力 tool use，agent 产品危险了吗？

海外独角兽· 2025-04-25 11:52

作者：cage, haozhen 我们在 2025 年 Q1 的大模型季报中提到，在 AGI 路线图上，只有智能提升是唯一主线，因此我们持续关注头部 AI Lab 的模型发布。上周 OpenAI 密集发布了 o 系列最新的两个模型 o3 和 o4-mini，开源了 Codex CLI，还推出了在 API 中使用的 GPT 4.1。本文将着重对这些新发布进行解读，尤其是 o3 agentic 和多模态 CoT 新能力。我们认为 OpenAI 在数次平淡的更新后，终于拿出了有惊艳表现的 o3。融合了 tool use 能力后，模型表现已经覆盖了 agent 产品常用的 use case。Agent 产品开始分化出两类路线：一类是像 o3 那样把和 o3 的发布模式一样， OpenAI 的 reasoning model 都是先训练出一个 mini reasoning 版本，再 scale 到一个 long inference time、full tool use 能力的模型上。而之前 GPT 模型总是先训练出最大的模型，再蒸馏到小模型上。这个策略值得探讨其原因，我们的猜测是 RL 算法比较脆弱， ...

online learning

Artificial Intelligence

online learning

Artificial Intelligence