基础模型架构
Search documents
速递|五大厂前员工联手创业“AI微信”,4800万美元种子轮押注“社交智能”新基础模型架构
Z Potentials· 2026-01-26 07:11
图片来源: Humans& AI 聊天机器人在回答问题、总结文档和求解数学方程方面越来越强,但它们大多仍像是为单一用户服务的助手。 它们并非为处理真实协作中更复 杂的任务而生:比如协调目标各异的成员、追踪长期决策过程、以及维持团队持续同心同力。 Humans& 是一家由 Anthropic 、 Meta 、 OpenAI 、 xAI 和 Google DeepMind 前员工共同创立的新创公司,他们认为缩小这一差距是基础模型的下 一个主要前沿领域。该公司本周筹集了 4800 万美元的种子轮融资 ,旨在为 " 人类 +AI" 经济构建一个 " 中枢神经系统 " 。 这家初创公司早期报道中强调的 " 赋能人类的 AI" 框架占据主导,但其实际愿景更具新意:构建专为社交智能设计的新基础模型架构,而不仅限 于信息检索或代码生成。 " 感觉我们正在结束规模化第一阶段,即问答模型被训练得在某些垂直领域非常擅长,现在正进入我们认为是第二波应用浪潮,普通消费者或用户 正在努力弄清楚如何运用所有这些技术, "Humans& 联合创始人、前 Anthropic 员工 Andi Peng 向 TechCrunch 表示。 Huma ...
阿里发布下一代基础模型架构Qwen3-Next
Di Yi Cai Jing· 2025-09-11 23:57
据通义千问Qwen官微消息,阿里发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B系列模型。 据介绍,该结构相比Qwen3的MoE模型结构,进行了以下核心改进:混合注意力机制、高稀疏度MoE结 构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制。Qwen3-Next-80B-A3B-Base模 型拥有800亿参数,激活参数仅30亿,实现了与Qwen3-32B dense模型相近甚至略好的性能,而训练成本 仅为Qwen3-32B的十分之一不到。 训练成本仅为Qwen3-32B的十分之一不到。 ...