基础模型

Search documents
月之暗面Kimi K2发布并开源 擅长代码与Agentic任务
news flash· 2025-07-11 15:02
月之暗面Kimi K2发布并开源 擅长代码与Agentic任务 智通财经7月11日电,月之暗面今天宣布,正式发布Kimi K2模型,并同步开源。Kimi K2是一款具备更 强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数1T,激活参数32B。 ...
月之暗面Kimi发布MoE架构基础模型K2并同步开源,总参数1T
news flash· 2025-07-11 15:00
月之暗面Kimi发布MoE架构基础模型K2并同步开源,总参数1T,激活参数32B,在自主编程、工具调 用、数学推理等领域超越全球其他开源模型。Kimi K2使用MuonClip优化器实现万亿参数模型的高效训 练,在高质量数据遇到瓶颈的背景下通过提升Token效率,找到新的预训练扩展空间。K2具备更强代码 能力,擅长通用Agent任务,在多个实际场景中展现出更强的能力泛化及实用性,新模型目前已上线开 放体验。(36氪) ...
从近30篇具身综述中!看领域发展兴衰(VLA/VLN/强化学习/Diffusion Policy等方向)
具身智能之心· 2025-07-11 00:57
今天为大家整理了几十篇具身相关的综述,设计数据集、评测、VLA、VLN、强化学习、基础模 型、DP等方向,为大家一览具身发展的路线, 内容出自具身智能之心知识星球。 A Survey on Vision-Language-Action Models: An Action Tokenization Perspective.2025 论文链接:https://arxiv.org/pdf/2507.01925 A Survey on Vision-Language-Action Models for Autonomous Driving.2025 论文链接:https://arxiv.org/pdf/2506.24044 Deep Reinforcement Learning for Robotics: A Survey of Real-World Successes.2025 论文链接:https://www.arxiv.org/abs/2408.03539 A Survey on Diffusion Policy for Robotic Manipulation: Taxonomy, Analysis, and ...
扎克伯格,上亿美元抢人的另一面
投中网· 2025-07-08 06:54
以下文章来源于直面AI ,作者毕安娣 直面AI . 聚焦前沿科技,抢先看到未来。 将投中网设为"星标⭐",第一时间收获最新推送 作者丨 毕安娣 编辑丨 肖阳 来源丨 直面AI Meta丝毫没有收手的意思。 就在刚刚,彭博社爆料称苹果的一员大将被Meta挖走。 直面AI推动那块会"砸死自己"的巨石。 这 也 是 一 名 华 裔 , 名 叫 R u o min g P a n g , 是 苹 果 基 础 模 型 团 队 ( A r tificial In t ellig e n c e M o d els , A F M ) 的 负 责 人 。 Meta CEO扎克伯格(Mark Zuckerberg)的时机找得很准。就在前几天,曾有报道称苹果的基础 模型研发成果并不理想,为此苹果甚至在考虑使用Anthropic、OpenAI等公司的第三方模型来驱动 新Siri。那么带领上百人,兢兢业业研发基础模型的Ruoming Pang处境的确有些尴尬了。 据称,Meta为Ruoming Pang也开出了数千万美元的巨额薪酬。 短短一个月内,Meta就完成了收购Scale AI并吸纳其创始人、挖走OpenAI多名高级研究员、 ...
V·STAR顶尖人才计划启动|不只是顶薪+期权,更与VAST一起定义下一代3D范式
机器之心· 2025-07-08 04:09
{V+STAR} V-STAR是VAST为 全球最顶尖的青年技术人才 -- *##@웅웅==*#Թ웅ԹಠԹ念웅=왕=*++−▪ 。 =+ 。(२%=* := =::: *+ %=*= == =%%8%%8%000%%=-+=+++++++++ . * : . +- : =+=+=+ : + . + a (a (a %= 038***=1}}}}} %(d*+: =%-. @= =# (d (d (d (d (d (d (d (d (d (a (d ) = + + (d % =##@@~~~~~~~~~~~~~~~~~~ +@%=%%% ==*-. #%*-.- #%@@##@++*+- =%#@@@@%+%##=%8=- =##**+++++- 9号号号 # ──AI基础模型突破 ag@@## 翻重新定义创造力的边界。 =# # a d d=%웅웅웅웅웅====+ 응**** *웅웅=*-: :+++: ###@웅웅=***+-@@გ=*+: 웅**++= : : : : : ==***+-응(d(d%*-: . . . . - : : . : . * (a (a (a (a (a (a (a = = * = ...
华山论剑!蛋白质AI模型哪家强?西湖大学/百图生科推出首个全面测试基准
生物世界· 2025-06-24 08:45
编辑丨王多鱼 排版丨水成文 蛋白质是生命活动的执行者,从疾病治疗到新药开发,都离不开对它们的理解。 在 人工智能 (AI) 浪潮中, 蛋白质科学 正迎来一场革命,从 AI 预测蛋 白质结构,到 AI 从头设计蛋白质,再到 ESM-2、ProtT5 这样的蛋白质基础模型 (PFM) 如雨后春笋般涌现。这些蛋白质基础模型通过分析数以百万计 的蛋白质序列来预测结构、功能和突变影响。但这些模型到底谁更强?为什么有些模型在特定任务上表现优异,在其他任务上却一言难尽? 近日, 百图生科首席科学家、西湖大学讲席教授 李子青 等人推出了首个全面的 蛋白质基础模型基准测试工具—— PFMBench 。 该研究以: PFMBench: Protein Foundation Model Benchmark 为题,于近日发表在了 预印本平台 arXiv 上。 该研究提供了一个全面的基准测试,用于评估蛋白质基础模型 (PFM) 在各种任务中的表现,并附带了一套简化评估方案。从 38 项任务和 17 个模型开 始,进一步确定了 12 个核心模型和 11 个代表性任务,以实现高效且有意义的评估。该研究通过大量实验发现,当前的蛋白质基础模型 ...
被 AI 大厂逼至绝望,这帮欧洲人发起了一场“科学复兴运动”
AI科技大本营· 2025-06-24 07:45
Core Viewpoint - The article discusses the emergence of LAION as a response to the increasing centralization and opacity in the field of artificial intelligence, emphasizing the need for open datasets and reproducibility in research [7][25]. Group 1: Emergence of LAION - LAION was founded to combat the trend of AI research being locked in "black boxes" controlled by a few tech giants, which hinders scientific reproducibility [2][7]. - The initiative began with Christoph Schuhmann's idea to create a dataset from Common Crawl, leading to the formation of a collaborative network of scientists and enthusiasts [3][4]. - The organization is defined by its commitment to being 100% non-profit and free, aiming to "liberate machine learning research" [3][4]. Group 2: Collaboration and Resources - The collaboration between LAION and top-tier computing resources allowed for the reproduction and even surpassing of models locked in proprietary systems [4][5]. - Key figures from various backgrounds, including academia and industry, joined LAION, contributing to its mission and enhancing its research capabilities [5][10]. - The organization has successfully released large-scale open datasets like LAION-400M and LAION-5B, which have been widely adopted in the community [16][17]. Group 3: Challenges and Achievements - The process of building reproducible datasets is complex and requires significant effort, including data collection and quality assurance [28][31]. - Despite initial expectations of mediocrity, models trained on LAION's open datasets performed comparably or better than proprietary models, demonstrating the potential of open research [17][29]. - The transparency of open datasets allows for the identification and rectification of issues, enhancing the overall quality of research outputs [30][31]. Group 4: The Future of AI Research - The article highlights the importance of open data and reproducibility in advancing AI research, suggesting that a collaborative approach can lead to significant breakthroughs [25][26]. - The ongoing exploration of reasoning models indicates a shift towards improving the robustness and reliability of AI systems, with a focus on expanding the dataset for training [41][43]. - The future of AI research may depend on the ability to create a more organized framework within the open-source community to harness collective talent and resources [45].
自动驾驶基础模型全面盘点(LLM/VLM/MLLM/扩散模型/世界模型)
自动驾驶之心· 2025-06-21 11:18
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 摘要 对于自动驾驶车辆而言,在复杂环境中安全导航依赖于应对广泛且多样化的罕见驾驶场景的能力。基于仿 真和场景的测试已成为自动驾驶系统开发与验证的关键方法。传统场景生成依赖基于规则的系统、知识驱 动模型和数据驱动的合成方法,但这些方法往往生成的场景多样性有限,且难以生成真实的高风险安全关 键场景。随着基础模型(Foundation Models)的出现——一种预训练的通用人工智能模型——开发者能够 处理异构输入(例如自然语言、传感器数据、高清地图和控制指令),从而实现对复杂驾驶场景的合成与 解析。本文围绕基础模型在自动驾驶场景生成与分析中的应用(截至2025年5月)开展综述研究。本综述提 出了一个统一分类体系,涵盖大语言模型(LLMs)、视觉-语言模型(VLMs)、多模态大型语言模型 (MLLMs)、扩散模型(DMs)和世界模型(WMs)在自动驾驶场景生成与分析中的应用。此外,我们回 顾了相关方法论、开源数据集、仿真平台和基准测试挑战,并探讨了针对场景生成与分析的专用评估指 标。最后,本文总结了当前面临的开放性 ...
库克官宣苹果首部原创电影《F1》将于6月27日全球公映
Huan Qiu Wang· 2025-06-10 02:09
《F1》电影后续也将在Apple TV+流媒体平台上线,但是目前尚未公布具体日期。 除影视跨界外,WWDC2025核心聚焦操作系统与AI技术升级。苹果软件工程高级副总裁克雷格·费德里 吉(Craig Federighi)宣布推出"基础模型框架"(Foundation Models Framework),允许开发者通过三行 代码调用Apple Intelligence核心大语言模型,实现本地化AI功能集成。例如,开发者可为应用添加实时 翻译、屏幕内容智能分析等功能,且数据全程无需上传云端,兼顾隐私与效率。 设计领域也迎来里程碑式更新。苹果首席设计官Alan Dye揭晓"Liquid Glass(液态玻璃)"设计语言,其 灵感源自Vision Pro空间交互界面,采用分层架构与半透明玻璃材质,模拟真实玻璃的物理特性。工具 栏、控件及应用界面通过光影反射呈现立体层次感,且圆角设计完美适配曲面屏设备。该设计将同步应 用于iOS 26、macOS Tahoe 26、watchOS 26等全平台系统,形成统一跨平台视觉风格。 苹果还首次打破传统命名规则,将全平台系统版本号统一调整为"26版"(如iOS 26、macOS ...
何恺明等新作大道至简,瞬时速度改为平均速度,一步生成表现提升70%
量子位· 2025-05-21 06:31
白交 发自 凹非寺 量子位 | 公众号 QbitAI 何恺明等团队新作新鲜出炉,再次大道至简—— 他们引入平均速度,实现「一步生成」新SOTA。 CMU博士生耿正阳一作,何恺明的学生邓明扬、白行健参与。 他们提出的模型是从头开始训练的,没有任何预训练、蒸馏或课程学习,最终实现了3.43的FID值,明显优于之前最先进的一步扩散/流模型。 一步生成框架:引入平均速度 一次生成模型,指的是只需一步计算就产生高质量的结果,而无需多次迭代。 团队提出了一个原则性强且有效的单步生成框架MeanFlow。其核心思想是引入平均速度的概念来表征流场,这与流匹配方法所模拟的瞬时速 度截然不同。 △ 流匹配的速度场,瞬时速度 平均速度被定义为位移与时间间隔的比率,位移由瞬时速度的时间积分给出。 根据这一定义,这说明平均速度和瞬时速度之间定义明确的内在联系,这自然成为指导网络训练的原则基础。 我们的方法被称为MeanFlow模型,它自成一体,无需预先训练、提炼或课程学习。 演示1:通过jvp计算只需要一次后向传递,类似于神经网络中的标准反向传播,开销不到总训练时间的20%。 它在从零开始训练的ImageNet 256×256上通过1 ...