Workflow
大模型开源
icon
Search documents
百度正式开源文心大模型4.5系列模型
第一财经· 2025-06-30 03:12
6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模 型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心 大模型4.5开源系列可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务 也可在百度智能云千帆大模型平台使用。 ...
腾讯,大动作!
中国基金报· 2025-06-27 15:00
开源模型灵活性、透明度和成本优势,为人工智能产业发展带来新机遇。今年年初 DeepSeek 出圈后,腾讯、阿里、字节等头部互联网公司旗下大模型开源悄然加速。 腾讯混元开源首款混合推理 MoE 模型 腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B ,总参数 80B ,激活参数仅 13B ,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高,这意味着,开发 者可以用更低门槛的方式获得更好的模型能力。 即日起,模型已经在 Github 和 Huggingface 等开源社区上线,同时模型 API 也在腾讯云官 网正式上线,支持快速接入部署。 【导读】腾讯混元推出首款开源混合推理模型,擅长 Agent 工具调用和长文理解 中国基金报记者 张燕北 头部互联网公司旗下大模型加速开源。 6 月 27 日,腾讯混元开源的首款混合推理 MoE 模型 Hunyuan-A13B 发布,该模型是业界 首个 13B 级别的 MoE 开源混合推理模型,其效果比肩同等架构领先开源模型。 据了解,这是业界首个 13B 级别的 MoE 开源混合推理模型,基于先进的模型架构, Hunyuan-A13B 表现出强大的 ...
135 个项目、七大趋势、三大赛道:撕开大模型开源生态真相,你会怎么卷?
机器之心· 2025-05-29 07:10
机器之心原创 编辑:吴昕 不要抗拒趋势 在微软 Build 、谷歌 I/O 、 Code with Claude 三大开发者大会接连登场的一周里,微软为 Windows 加装模 型上下文协议( MCP ), Google Gemini 野心初显「 AI 操作系统」, Claude 4.0 高调抢滩编程主战场。 就在这样的节奏下, 5 月 27 日,蚂蚁集团的开源团队「接棒」发布了一张《 2025 大模型开源开发生态全景 图》。 访问地址: https://antoss-landscape.my.canva.site 完整项目列表和相关数据: https://docs.google.com/spreadsheets/d/1av9kitgnRGtsmDp6AbW96m2cCR4jXZFQmUVG2di8Bjw/edit? gid=0#gid=0 这是一张由开源社区数据驱动的技术演进路线图—— 135 个社区核心项目、 19 个技术领域, 全面覆盖从智能体应用到模型基建,系统性梳理了开源力量在大模型浪 潮下的集结与演化路径。 其中, 模型训练框架、高效推理引擎、低代码应用开发框架 成为当前最具主导力的三条技术赛道。 ...
DeepSeek和李飞飞之后,英伟达也看上阿里千问?
Xin Lang Ke Ji· 2025-05-13 07:01
要说全球开源大模型生态圈里,谁最让人"魂牵梦绕"? 阿里,当仁不让。 就在上周,继DeepSeek和"AI教母"李飞飞之后,英伟达也相中阿里了。除了在最新的"混合推理模型"千 问3宣布开源当日,火速官宣接入适配后,5月9日,英伟达还 开源了全新的代码推理模型Open Code Reasoning (后续简称:OCR),包括7B、14B、32B三种尺寸, 基础模型用的都是通义千问。 在LiveCodeBench 评测中,成功超越Open AI 公司o3-mini和o1模型的英伟达OCR-Qwen-32B-Instruct模 型,正是基于Qwen2.5-32B微调形成的。 在通义千问已经迭代至3.0版本,模型性能再度突破的当下,英伟达居然还基于上一代千问模型做出了 比肩全球一流水平的模型,让人不禁想问,千问到底还有多少隐藏潜力待各方解锁? DeepSeek、李飞飞后,英伟达也相中了"通义千问" 目前,英伟达开源的OCR系列模型的代码及数据集,已公开分享至全球最大AI开源社区Hugging Face平 台上,供开发者们免费浏览学习。 其中,英伟达OCR-Qwen-32B-Instruct在LiveCodeBench ...
访清华孙茂松:中国“强音”推大模型开源,全球大模型文化正在扭转
Huan Qiu Wang Zi Xun· 2025-04-30 08:51
中新网北京4月30日电 (记者 夏宾)清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松近 日在北京接受中新网记者专访时称,中国科技公司在大模型领域掀起的开源浪潮向全球发出了中国"强 音",其技术在获得国际认可的同时,悄然扭转了全球大模型文化。 来源:中国新闻网 最新消息显示,4月29日凌晨,新一代通义千问模型Qwen3(千问3)宣布开源,总共涉及8款不同尺寸的 千问3模型。据悉,阿里通义已开源200余个模型,全球下载量超3亿次,其衍生模型数超10万个,超越 美国Llama,成为全球第一开源模型。 以DeepSeek、Qwen为代表的中国开源模型实现先进模型的参数权重、推理逻辑和工具链条的全开源, 正在打开人工智能商用的新局面。 "尽管DeepSeek总体上是一个'从1到2'的创新,但在人工智能反馈强化学习方面是开源大模型中走得最 远的,将人类反馈变成了人工智能反馈。"谈到DeepSeek时,孙茂松说。 孙茂松特别强调了小模型的重要价值。从应用的角度,小模型可降低成本,拓展应用的普及度;从研究 的角度,小模型可有助于高校科研机构应对资源约束带来的研究挑战,这些都有很强的必要性。 在他看来,大模型做得越 ...
一夜刷屏!Manus AI合伙人紧急澄清
21世纪经济报道· 2025-03-06 07:33
一夜"刷屏"! 3 月 6 日 , 一 款 名 为 "Ma n u s " 的 AI 工 具 在 网 络 上 走 红 并 登 上 了 微 博 热 搜 。 Ma n u s 在 其 官 网 上 称,Ma n u s是一个通用的AI代理,它能够独立思考、规划并执行复杂任务,直接交付完整成 果。 一时之间全网都在要邀请码,一度让官网注册页面崩溃。 刚 刚 , M a n u s A I 合 伙 人 张 涛 在 社 交 平 台 发 表 澄 清 回 应 表 示 , 感 谢 大 家 对 M a n u s 的 关 注,特此澄清: 1、我们从未开设任何付费获取邀请码的渠道; 2、我们从未投入任何市场推广预算; 3 、 内 测 期 间 系 统 容 量 有 限 , 我 们 将 优 先 保 障 现 有 用 户 的 核 心 体 验 , 并 逐 步 有 序 释 放 邀请。 据e公司报道,在分析特斯拉股票的演示视频中,Ma n u s详细演示了其全部思考和制作相关表 格的过程:通过收集信息、分析报表、市场情绪,到完成投资论文等。 值得注意的是,Ma n u s可以在云中异步工作,因此用户可以随时关闭笔记本电脑,等任务完成 后,Ma n ...
与 00 后开源者聊 DeepSeek 开源周:一直开源最强模型,可能是不想赚钱,也可能是想推动更大变化丨开源对话#2
晚点LatePost· 2025-02-27 14:03
"当 AI 足够强大后,开源还是不是一个好选择?" 整理丨刘倩 程曼祺 嘉宾丨美国西北大学 MLL Lab 博士王子涵 ▲扫描上图中的二维码,可收听播客。《晚点聊 LateTalk》#102 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。"最一手的商业、科技访谈,最真实的从业者思考。" 这是《晚点 LatePost》 「开源对话」系列的第 2 篇。该系列将收录与开源相关的访谈与讨论。系列文章见文末的合集#开源对话。 上周五,DeepSeek 在官方 Twitter 上预告了下一周会连续 5 天开源 5 个代码库,进入 "open-source week"开源周。 目前 DeepSeek 已放出的 4 个库,主要涉及 DeepSeek-V3/R1 相关的训练与推理代码 。 这是比发布技术报告和开源模型权重更深度的开源。 有了训练和推理 工具,开发者才能更好地在自己的系统里,实现 DeepSeek 系列模型的高效表现。 (注:所有 4 个库和后续开源可见 DeepSeek GitHub 中的 Open-Inf ...
对谈 98 年就做开源的章文嵩:要像维基百科那样,开源共建大模型数据集丨开源对话#1
晚点LatePost· 2025-02-27 14:03
"真正的大模型开源,应该把数据集也开源。" 文丨贺乾明 编辑丨宋玮 过去两个月,DeepSeek 重塑全球大模型格局,也扭转了整个行业对开源的理解。 OpenAI 反思走向闭源是 "站在历史错误的一边",百度、MiniMax、阶跃星辰等原本闭源的公司转向开源。 "如果在以前,一个拿几亿美金融资的公司说自己要开源,估计投资人会吐血。" 一位科技投资人说。 DeepSeek 还在加大开源力度。这周,DeepSeek 计划开源 5 个训练、推理大模型相关的代码库——而大多数开源模型的公司还停留 在开放模型权重层面。 到底该怎么看待 DeepSeek 的开源?它对大模型开源社区意味着什么?为什么不同公司选择不同的开源策略?选择开源对一家商业 公司到底意味着什么? 近期,我们访谈了中国开源先驱章文嵩。他 1995 年读硕士期间接触到开源,那时中国刚通互联网不久,不少 DeepSeek 的研究者还 没有出生。 1998 年,章文嵩在国防科大读博期间开源了 LVS(Linux 虚拟服务器)软件,这个均衡服务器访问流量、避免宕机的系统,是中国 最早在全球科技行业扩散的开源项目,如今是互联网基础设施的组件。 "几乎所有的互联网 ...