Workflow
Kimi K2 Thinking
icon
Search documents
Kimi K2 Thinking is CRAZY... (HUGE UPDATE)
Matthew Berman· 2025-11-07 21:36
We may have another deepseek moment on our hands. Moonshot Labs, a Chinese frontier AI company, just released a completely open-source, completely open weights, frontier level model that is better than GPT5, better than Claude 4.5% on some of the hardest benchmarks. Let me break it all down for you. And this video is brought to you by Vulture. More on them later. This is Kimmy K2 thinking. This is a thinking model that is capable of thinking for a long time and using tools in its thought process and already ...
国产模型新盛况!王座易主:Kimi K2 Thinking开源超闭源
机器之心· 2025-11-07 04:26
机器之心报道 编辑:泽南、+0 很久没有这样的盛况了。 昨晚,月之暗面(Moonshot AI)刚刚开源了最新一代大模型 Kimi K2 Thinking,新模型一发布,就掀起了全网的大讨论。 作为一款开源模型,它在基准测试上毫无保留,多方面性能直接超越了 GPT-5、Claude Sonnet 4.5 等业界先进闭源模型。 现在,新发布的开源模型不比其他的开源模型,而是直接对标前沿闭源模型了,这不得不说是一种进步。 HuggingFace 联合创始人 Thomas Wolf 表示,我们正在见证又一次 DeepSeek 时刻: 昨天在正式推出前,Kimi K2 的推理版已经被正式并入了知名大模型推理服务框架 vLLM 的主线。广大开发者们已经获得了 Kimi 新模型的性能增益。 这一回,清华特奖得主、vLLM 主贡献者游凯超亲自审核、合并了代码。 K2 Thinking 模型发布还不到半天,官推的阅读量已达到 170 万。这会不会成为国产大模型爆发的拐点呢? 月之暗面表示,Kimi K2 Thinking 模型擅长多轮调用工具和持续思考,它在自主网络浏览能力(BrowseComp)、对抗性搜索推理(seal- ...
Kimi K2 Thinking突袭,智能体&推理能力超GPT-5,网友:再次缩小开源闭源差距
3 6 Ke· 2025-11-07 03:07
Kimi K2 Thinking,现已发布并开源! 主打一个"模型即Agent",不仅是Kimi"迄今能力最强的开源思考模型",还掌握边思考,边使用工具的能力—— 无需人工干预,即可执行200-300次连续工具调用。 作为今年最受关注的开源模型系列之一,Kimi K2的Thinking版本一上线,就成为热议对象:再次缩小了开源模型与闭源模型的差距。 更多技术细节速览在此: △ 技术细节 官方提到,K2 Thinking是月之暗面在Test-Time Scaling(测试时扩展)领域的最新进展,通过同时扩展思考Token和工具调用轮次,模型实现了更强的 Agent和推理性能。 智能体、推理能力全面提升 体现在测试上,在人类最后的考试(HLE)中,允许使用工具——搜索、Python、网络浏览工具的同等情况下,Kimi K2 Thinking取得了44.9%的SOTA成 绩。 在人类最后的考试(HLE)、测试自主网络浏览能力的BrowseComp,和复杂信息收集推理基准测试SEAL-0等评测基准中,Kimi K2 Thinking都刷新了 SOTA,超越GPT-5、Claude Sonnet 4.5(Thinkin ...
Kimi K2 Thinking突袭!智能体&推理能力超GPT-5,网友:再次缩小开源闭源差距
量子位· 2025-11-07 01:09
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI Kimi K2 Thinking,现已 发布并开源 ! 主打一个"模型即Agent",不仅是Kimi"迄今能力最强的开源思考模型",还掌握 边思考,边使用工具 的能力—— 无需人工干预,即可执行 200-300次连续工具调用 。 作为今年最受关注的开源模型系列之一,Kimi K2的Thinking版本一上线,就成为热议对象:再次缩小了开源模型与闭源模型的差距。 更多技术细节速览在此: 智能体、推理能力全面提升 1TB参数,激活参数32B,采用INT4而非FP8。 256K上下文窗口。 更多专家,更少head,更多思考。 △ 与DeepSeek R1的架构对比,图源x@rasbt 在人类最后的考试(HLE)、测试自主网络浏览能力的BrowseComp,和复杂信息收集推理基准测试SEAL-0等评测基准中,Kimi K2 Thinking都刷新了SOTA,超越GPT-5、Claude Sonnet 4.5(Thinking)等闭源模型。 Kimi K2 Thinking的代码和权重均遵循最为宽松的MIT协议。新模型也已第一时间上线kimi.com和最新版Kimi ...