Workflow
潞晨云微调SDK
icon
Search documents
8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队
量子位· 2026-01-07 05:17
允中 发自 凹非寺 量子位 | 公众号 QbitAI 大模型下半场的战火,已经从"暴力预训练"烧向了"后训练"战场。 潞晨云微调SDK 正式开放上线——这是 国内首个全面开放、且兼容Tinker范式的Serverless微调平台 。 其基于Thinking Machine Lab开源的Tinker SDK构建,核心目标只有一个: 为复杂且昂贵的强化学习,提供一套更具成本优势的工业级解法。 拥抱后训练与RL:算法层与底层算力架构的解耦 随着OpenAI o1在推理能力上的突破,业界逐渐形成共识—— 无论是OpenAI o1的推理突破,还是DeepSeek-R1靠强化学习 (RL) 实现的性能飞跃,都释放了一个明确信号: 决定模型天花板的,不再只是算力堆砌,而是更精准的微调和RL迭代。 但现实很骨感——复杂的分布式基建、高昂的显卡租金、繁琐的架构调优,像一道道高墙,把无数算法工程师挡在了"炼丹房"外。 现在,这堵墙正在被推倒。 即大模型的能力突破已不再单纯依赖预训练 (Pre-training) 阶段的参数堆砌, 后训练(Post-Training) 特别是强化学习,正成为决定模 型实用价值的核心战场 。 以De ...
OpenAI前CTO首个创业产品Tinker,这里全量升级开放了,还有羊毛可薅
机器之心· 2026-01-07 05:16
机器之心发布 潞晨云微调 SDK 今日起全量开放,前 150 名用户通过专属链接注册,可获得 30 元 Token 使用额度: https://cloud.luchentech.com/account/signup?invitation_code=JQZX 当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward backward,optimizer step 等⼀系列基本原语,分 离了算法设计等部分与分布式训练基础设施关联,把 "训练" 大模型变成了简单的 "函数调用" 时,行业进入一场从 "作坊式炼丹" 到 "工业化微调" 的升级。 潞晨云微调 SDK 正式开放上线 :基于 Thinking Machine Lab 开源的 Tinker SDK 构建,作为 国内首个兼容 Tinker 范式且全面开放的 Serverless 微调平台 ,为复杂 昂贵的强化学习提供更具成本优势的工业级解法 —— 开发者无需囤卡,rollout→reward→update 全链路按 Token 计价,让每一 ...
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026
量子位· 2025-12-20 08:02
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 对企业来说,如何判断大模型究竟是真的有用,还是只是噱头? 对此, 潞晨科技创始人兼董事长,新加坡国立大学校长青年教授尤洋 给出了他的判断框架: 有三类企业需要行业模型或者私有模型:传统大型企业、有海量数据的中小型企业,以及颠覆行业的新兴公司。 具体落地方面,尤洋给出的判断标准也很明确。 首先, 如果只是业务只涉及日常办公,或主要处理文本数据,没必要上私有模型 。 直接调用现成的大模型API,或RAG+API,足以覆盖大多数需求。 但 如果企业本身拥有海量多模态数据,或对数据隐私有要求,构建私有模型是比较好的选择 。 为了完整呈现尤洋的思考,在不改变原意的基础上,量子位对演讲内容进行了整理编辑,希望能提供新的视角与洞察。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主 流媒体的广泛关注与报道。 核心观点梳理 大模型的应用肯定不仅限于聊天机器人或者编程助手,未来大模型在千行百业里边落地,才能产生它最大的价值。大模型的价值在很多场 景还没有真正发挥出来。 有 ...