Workflow
冲上热搜!美团大模型,靠「快」火了
机器之心·2025-09-02 03:44

机器之心原创 编辑:张倩 、陈陈 国内外开发者:亲测,美团新开源的模型速度超快! 当 AI 真的变得像水和电一样普及之后,模型强不强已经不是大家唯一关心的问题了。 从年初的 Claude 3.7 Sonnet、Gemini 2.5 Flash 到最近的 GPT-5、DeepSeek V3.1,走在前面的模型厂商无一不在思考:在保证准确性的前提下,如何让 AI 既能以最 少的算力去解决每一个问题,又能在最短的时间内给出回应?换句话说,就是如何做到既不浪费 token,也不浪费时间。 对于在模型上构建应用的企业和开发者来说,这种从「单纯构建最强模型到构建更实用、更快速模型」的转变是个好消息。而且更加令人欣慰的是,与之相关的 开源模型也逐渐多了起来。 前几天,我们在 HuggingFace 上又发现了一个新模型 —— LongCat-Flash-Chat 。 这个模型来自 美团的 LongCat-Flash 系列,官网可以直接使用 ( https://longcat.ai )。 它天然知道「not all tokens are equal」,因此会根据重要性为重要 token 分配动态计算预算。这让它在仅激活少量参 ...