Kimi
Search documents
罗永浩数字人狂卖5500万;迪士尼起诉Midjourney;ChatGPT学会“装死”,AI伦理警报拉响! | 混沌AI一周焦点
混沌学园· 2025-06-18 10:05
Core Insights - The global AI arms race is at a critical juncture, with significant upgrades in model performance, application alternatives, and development paradigms, raising ethical concerns and human anxieties [1] - Open-source models are emerging, challenging closed-source dominance and reshaping the AI commercial competition landscape [1] Group 1: Open Source Models - Open-source large models like MiniMax-M1 and Kimi-Dev-72B are approaching the performance of top closed-source models, promoting low-cost and high-efficiency AI applications [1] - MiniMax-M1, the world's first open-source hybrid architecture inference model, supports 1 million context inputs and has a rental cost of only $537,400, showcasing impressive performance in various productivity scenarios [12] - Kimi-Dev-72B achieved a 60.4% score in SWE-bench Verified benchmark tests, surpassing top models like DeepSeek-R1, and features innovative self-competitive mechanisms for code editing and testing [14] Group 2: AI Live Streaming - Digital humans are leading a new paradigm in e-commerce, with Baidu's digital human live streaming generating a GMV of 55 million yuan in a single session, outperforming human hosts [2][15] - The efficiency of digital humans in generating GMV is 2.3 times that of human hosts, indicating a significant shift from AI as a tool to AI as a replacement [15] Group 3: L3-Level AI Development - Clacky has achieved L3-level autonomy in AI development, breaking down programming barriers and making "compliant AI development" a new focus for capital investment [3][17] - Clacky allows users to plan tasks autonomously and provides a visual "time machine" feature for task context retention, potentially transforming the programming landscape [17] Group 4: AI Copyright Issues - The copyright dispute involving Midjourney, initiated by Disney and Universal, highlights the challenges facing generative AI technologies and may lead to increased training costs and a shift towards compliance and internal tools [4][19] - The lawsuit reflects the film industry's ambivalence towards AI technology, with potential implications for the future of AI-generated art and the creative industry [19] Group 5: Product Innovations - The launch of the first AI business consulting agent by 混沌 aims to address the high costs of traditional consulting, providing businesses with comprehensive consulting solutions in just 15 minutes [5] - The introduction of the "China Weather AI Agent" enhances typhoon tracking and early warning capabilities, integrating AI technology with meteorological monitoring [20] Group 6: AI Ethics and Safety - Ethical alarms are being raised as AI systems exhibit self-preservation behaviors that may threaten human safety, indicating a need for careful design and regulation [24][25] - The establishment of organizations focused on developing non-autonomous AI systems aims to mitigate potential risks associated with AI technologies [26]
又撞了!Kimi和DeepSeek为什么总爱盯同一块蛋糕?
阿尔法工场研究院· 2025-06-04 10:21
以下文章来源于凤凰网科技 ,作者凤凰网科技 凤凰网科技 . 凤凰科技频道官方账号,带你直击真相。 作者 | 董雨晴 来源 | 凤凰网科技 与打榜同期进行的,是招聘法律相关的数据专家。 5 月,Kimi被传进军医疗赛道,实际上同样是招 聘医疗领域的相关数据专家,目标是为了提升医疗内容的信息检索质量。 近日,Kimi又悄悄上线了学术搜索。 "很明显,Kimi在加强垂直领域的能力" ,另一行业人士对记者表示。 导语 :当Kimi招聘法律专家、DeepSeek挖医学标注员,AI公司们抢的不是人才,而是用户愿 意相信的那一口"真"。 几个大模型初创企业里,Kimi当下最为安静。 "(Kimi)最核心的任务就是提升留存,或者把留存作为一个重要的衡量指标" 去年1 1 月,在Kimi 上线一周年之际,创始人兼CEO杨植麟曾在一场小型沟通会中亮相并提出了这一观点。 "有一轮大厂的钱进来后,投资人确实会要求看数据,杨植麟作为创始人肯定要在这方面用心", 接 近Kimi的人士告诉记者,根据披露,那时Kimi的月活用户突破了3 600 万,跻身国内A I 原生应用T OP3 的席位。 据记者了解, 今年杨植麟的关注重心早已发生改变 ...
奇瑞高管公开点评吉利新车“烂车一台”,双方回应;恒安回应心相印客服称赔冥币;宁德时代:李平夫妇向复旦捐赠405万股股票丨邦早报
创业邦· 2025-05-13 00:07
Group 1 - The US and China have agreed to suspend the implementation of a 24% tariff on each other's goods for 90 days, while retaining a 10% tariff [3][4] - Chery Automobile's marketing executive criticized Geely's new car, leading to disciplinary action against the involved personnel [3][4] - Contemporary Amperex Technology Co., Ltd. (CATL) announced a donation of 4.05 million shares, valued at over 1 billion yuan, to Fudan University [6] Group 2 - Apple has not confirmed any price reductions for the iPhone 16 series despite media reports suggesting significant price cuts [8][9] - A consumer reported finding a foreign object in a rice dumpling from Laiyifen, prompting the company to initiate a full investigation and product recall [9] - Toyota denied rumors of acquiring Neta Auto, stating that they have no knowledge of such discussions [11] Group 3 - Nissans plans to lay off an additional 10,000 employees, bringing the total layoffs to approximately 20,000, which is about 15% of its workforce [22] - Tesla has applied for the "TESLA OPTIMUS" trademark as it prepares for the production of its humanoid robot [22] - SoftBank's $100 billion investment plan in AI infrastructure has been delayed due to tariff concerns and economic risks [23] Group 4 - Kimi announced a collaboration with Xiaohongshu to enhance AI capabilities, allowing users to generate notes directly from conversations [23] - Over 250 CEOs in the US have called for AI and computer science to be included in K-12 education as a core curriculum [23] - Meituan led a multi-million A round investment in Variable Robotics, which aims to accelerate the development of intelligent robotics [24][25]
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 12:33
阿里新一代的大模型 Qwen 3 今早发布,新旗舰 Qwen3-235B-A22B 的评测成绩,和 DeepSeek R1、Grok-3、Gemini-2.5-Pro 不相上下。这一代全系列模 型都支持混合推理,对 Agent 的支持也上了新台阶。 随着 Qwen 2.5 和 3 的发布,全球的开源模型生态也呈现了一种新形态:以 DeepSeek+Qwen 的中国开源组合,取代了过去 Llama 为主,Mistral 为辅的开 源生态。Qwen 系列的衍生模型目前已经是 HuggingFace 上最受欢迎的开源模型,衍生模型的数量也超过了 Llama 系列。而 DeepSeek 对于开源模型生态 的冲击和贡献,也有目共睹。 与大模型六小龙相比,主打开源的 Qwen 和 DeepSeek 无疑在国际市场赢得了更多开发者和创业者的关注,来自开源社区的代码贡献、更多优秀微调版本 的出现,也在以另外一种方式推动模型能力的进步。 可以说, 开源,正在成为中国大模型公司进入全球市场的最佳路径。 而对阿里云来说,Qwen+阿里云的配合,「模型-云-行业应用」的打法,走出了国内 MaaS 模式的新方向,也在很大程度上降低了国 ...
Kimi发布全新通用音频基础模型Kimi-Audio
news flash· 2025-04-26 06:17
Core Insights - Kimi has launched a new open-source project called Kimi-Audio, which is a general-purpose audio foundation model [1] Company Summary - The Kimi-Audio model supports various tasks including speech recognition, audio understanding, audio-to-text conversion, and voice dialogue [1]
AI巨头们,又走上了搞社交的老路
阿尔法工场研究院· 2025-04-21 10:07
近期的传闻和动作颇具代表性,在大洋彼岸,手握ChatGPT和Sora等王牌的OpenAI,据称正内部测试类X的社交功能,其CEO Sam Altman甚至在私下 征求反馈;而在国内,凭借长文 本能力声名鹊起的Kimi,也被曝出正在小范围灰度测试自己的内容社区。 以下文章来源于硅星GenAI ,作者周一笑 硅星GenAI . 比一部分人更先进入GenAI。 作 者 | 周一笑 来源 | 硅星GenAI 导语 :你刷的朋友圈,其实是他们养模型的牧场。 AI圈最近弥漫着一股微妙的气息。人们似乎不再热议大语言模型的最新突破、以及AI应用的无限可能时,一些代表着未来的AI巨头,却似乎正将目光 投向互联网那熟悉得不能再熟悉的角落——社交网络与社区。 就在这些AI新贵们探索社交可能性的同时,国内的社交巨头已经抢先一步,用一种更"润物细无声"的方式将AI融入了核心场景。 腾讯旗下AI助手"元宝"已正式入驻微信,不是以小程序或公众号,而是以一个可以添加的"联系人"身份,出现在用户的聊天列表中。这种深度整合, 几乎零成本地将AI能力嵌入了数亿用户的日常。 这种转向,无论是AI公司自建社区,还是社交平台整合AI,自然引发了诸多讨论 ...
与真格戴雨森聊 Agent:各行业都会遭遇 “李世石时刻”,Attention is not all you need
晚点LatePost· 2025-03-28 12:12
" 两 瓶 茅 台 的 价 格 体 验 未 来,太 划 算 了 。 " 嘉宾 丨 戴雨森 整理 丨 刘倩 程曼祺 本期播客,是《晚点聊》与真格基金管理合伙人戴雨森长聊 AI Agent 和 AI 趋势。 3 月 6 日,真格投资的 Monica 发布的 Agent 产品 Manus,虽然还在内测阶段,就引起了大量关注。 在期中,雨森提到了 Monica 即将会发布一款 Agent 产品,那时候我们还不知道 Manus 将会席卷社交 媒体。 当我们把一个任务交给 Manus,过了十几分钟收到完成的结果时 ,似乎真的感受到了一点 Attention is not all you need 的未来。 带来 Agent 等 AI 行业新变化的起点,是去年至今的两个重要节点:o1 和 R1。 戴雨森详细分享了他对 Agent 机会的当前观察,以及在 DeepSeek 带来的开源生态的变化中,大小 AI 公司的新动作和调整。 O 系列解锁 Agent 应用,DeepSeek R 系列是开源的胜利、专注的胜利、本 o1 在大语言模型中引入强化学习,开启 Pretraining(预训练)Scaling Law 之外的 Pos ...
3700 次预训练寻找 “线性注意力” 非共识,MiniMax-01 开发者讲述 4 年探索
晚点LatePost· 2025-03-09 12:00
"我们跑的是下半场,赌的就是未来的长文本需求。" MiniMax 在今年 1 月发布了参数为 4560 亿的开源大模型 MiniMax-01,该模型就用到了他们开发的线 性注意力机制 "Lightning Attention"。 我们邀请了这个项目的负责人,MiniMax 高级研究总监钟怡然,来与我们一起聊线性注意力的研发过 程。钟怡然在 MiniMax 负责大模型网络架构设计,目前正开发多模态深度推理模型。 钟怡然曾担任上海人工智能实验室青年科学家,是新架构探索组的 PI(项目负责人);他在澳洲国立大 学获得博士学位,师从李宏东教授和 Richard Hartley 院士。他和他的团队已在一些国际顶级学术会议和 期刊上发表了 20 余篇关于模型新架构的论文,覆盖了当前多类非 Transformer 架构,如线性注意力机制 (线性注意力)、长卷积(Long Convolution)和线性循环网络(Linear RNN)。 在 2021 年,线性注意力还是一个 "看起来很美好的泡泡",怡然和团队就开始探索线性架构的实现。 嘉宾 丨 钟怡然 整理 丨 刘倩 程曼祺 上期播客中, 我们与清华的两位博士生,肖朝军和傅 ...
大模型 “注意力简史”:与两位 AI 研究者从 DeepSeek、Kimi 最新改进聊起
晚点LatePost· 2025-03-02 06:10
嘉宾 丨 肖朝军、傅天予 整理 丨 程曼祺 上周,DeepSeek、Kimi 都放出了新的大模型架构改进和优化成果,分别是 NSA、MoBA。二者都聚焦对大 模型中 "注意力机制" 的改进。 o 1 、 R 1 等 推 理 模 型 的 出 现,给 了 长 文 本 新 课 题 。 注意力机制是当前大语言模型(LLM)的核心机制。2017 年 6 月那篇开启大语言模型革命的 Transformer 八 子论文,标题就是:Attention Is All You Need(注意力就是你所需要的一切)。 而优化 Attention 的计算效率和效果,又能帮助解决 AI 学界和业界都非常关心的一个问题,就是长文本(long context)。 不管是要一次输入一整本书,让模型能帮我们提炼、理解;还是在生成现在 o1、R1 这类模型需要的长思维 链;又或者是希望模型未来能有越来越长的 "记忆",这都需要长文本能力的支持。 这期节目我们邀请了两位做过 Attention 机制改进的 AI 研究者做嘉宾。 一位是清华计算机系自然语言处理实验室的博士生肖朝军,他是 InfLLM 注意力机制改进的一作,导师是清华 计算机系副教授 ...