开源大模型

Search documents
Qwen3真香!通义App满血接入,一手实测在此
量子位· 2025-04-30 04:10
鱼羊 一水 发自 凹非寺 量子位 | 公众号 QbitAI 开源大模型新王者,正在受到空前关注。 Qwen3预告一出,直接开启不眠夜模式。 △ 来自编辑部本部 等到深夜正式上线并宣布登顶全球最强开源模型,更是瞬间引爆全网热议。 | | | Hope you enjoy our new models! | | | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 22B | Qwen3-32B Dense | OpenAl-o1 2024-12-17 | Deepseek-R1 | Grok 3 Beta BB Think | QwQ-32B | Qwen3-4B Dense | Qwen2.5-72B-Instruct | Gemma3-27BIT | | | 93.8 | 92.1 | 93.2 | | 89.5 | 76.6 | 81.2 | 86.8 | | | 81.4 | 74.3 | 79.8 | 83.9 | 79.5 | 73.8 | 18.9 | 32.6 | | | 72.9 | 79.2 | 70.0 | ...
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 12:33
阿里新一代的大模型 Qwen 3 今早发布,新旗舰 Qwen3-235B-A22B 的评测成绩,和 DeepSeek R1、Grok-3、Gemini-2.5-Pro 不相上下。这一代全系列模 型都支持混合推理,对 Agent 的支持也上了新台阶。 随着 Qwen 2.5 和 3 的发布,全球的开源模型生态也呈现了一种新形态:以 DeepSeek+Qwen 的中国开源组合,取代了过去 Llama 为主,Mistral 为辅的开 源生态。Qwen 系列的衍生模型目前已经是 HuggingFace 上最受欢迎的开源模型,衍生模型的数量也超过了 Llama 系列。而 DeepSeek 对于开源模型生态 的冲击和贡献,也有目共睹。 与大模型六小龙相比,主打开源的 Qwen 和 DeepSeek 无疑在国际市场赢得了更多开发者和创业者的关注,来自开源社区的代码贡献、更多优秀微调版本 的出现,也在以另外一种方式推动模型能力的进步。 可以说, 开源,正在成为中国大模型公司进入全球市场的最佳路径。 而对阿里云来说,Qwen+阿里云的配合,「模型-云-行业应用」的打法,走出了国内 MaaS 模式的新方向,也在很大程度上降低了国 ...
致远互联入选中国信通院“开源大模型+”软件创新应用典型案例
Zheng Quan Shi Bao Wang· 2025-04-25 04:12
Core Insights - The China Academy of Information and Communications Technology (CAICT) has released a report highlighting exemplary cases of "Open Source Large Models+" software innovation applications, with Zhiyuan Interconnect recognized as a benchmark in this field [1][3] - The report focuses on the practical implementation of artificial intelligence technologies, selecting benchmarks based on technological breakthroughs, scene innovation, and ecological synergy [3] Group 1: Company Innovations - Zhiyuan Interconnect has developed the AI-COP intelligent collaborative operation platform, integrating "large models + vertical domain models + scene intelligent agents" to create a replicable and scalable industry paradigm [3][4] - The company has launched the "CoMi Family" of intelligent agent products, which combines mainstream AI large models with self-developed vertical domain models, enhancing capabilities from single-process tools to multi-task AI agents [4] Group 2: Product Offerings - The CoMi Family features over ten vertical scene intelligent agents tailored for diverse business scenarios, such as enterprise intelligent inquiry, collaborative work assistants, and contract risk assistants, aimed at improving organizational efficiency and decision-making quality [5] - The intelligent agents utilize data interaction analysis to provide instant and accurate query results, significantly accelerating decision-making processes and breaking the constraints of traditional data querying methods [5][6] Group 3: Market Applications - The company has introduced a one-stop enterprise AI service platform, Zhihuiquan, which integrates over 50 mainstream large models, supporting private deployment and adaptation for various industries, including finance and manufacturing [5] - The applications cover multiple scenarios such as AI comprehensive portals, intelligent documents, and smart data analysis, contributing to quality improvement, cost reduction, and risk mitigation for enterprises [6]
中国AI模型全面爆发,AI大模型技术体系综合开源影响力榜单重磅发布!
AI科技大本营· 2025-04-18 05:53
一提到"大模型",很多人的第一反应往往是那个既能聊天,又会写代码、画画的"模型本身"。但其 实,大模型远不止是一个"能输出结果的程序"这么简单,其背后有一整套复杂而庞大的技术体系作为 支撑:从大规模、高质量、多样化的数据,到先进的模型架构与训练策略,再到推理部署、资源调度 等支撑落地的系统能力,以及不可或缺的科学评测机制。大模型更像是一个由模型、数据、系统、评 测平台 等多要素构成的"技术共同体",而非单一模块的堆叠。 如今在闭源技术壁垒与高昂商用门槛的对比下,开源大模型正迅速崛起,成为推动 AI 技术普惠化的 重要力量。但面对层出不穷的开源 AI 模型技术,我们该如何选型?不同的模型技术体系又各有怎样 的优势与短板? 在这一背景下,为系统呈现全球大模型生态的开源发展现状,CSDN 联合多家机构于 4 月 18 日在 2025 全球机器学习技术大会(ML-Summit 2025)现场重磅发布《AI 大模型技术体系综合开源影响 力榜单》,全面评估全球范围内开源大模型技术体系的贡献与影响力,旨在为行业提供参考坐标,推 动开源创新持续前行。 注:这里大模型是指 主要包括 decoder-only 以来的模型结构,包 ...
后DeepSeek时代:六小虎向左,BAT向右
投中网· 2025-04-09 02:27
以下文章来源于新熵 ,作者茯神 新熵 . 洞察商业变量,探寻商业本质。 将投中网设为"星标⭐",第一时间收获最新推送 国内大模型的竞争规则变了。 来源丨 茯神 编辑丨 思原 来源丨 新熵 DeepSeek给AI大模型行业,免费赠送了一波国民级别的市场教育,却也平等地在先行者们头上,悬起了一把达摩克利斯之剑。 其中,AI"六小虎"之中的智谱就是一个缩影,智谱脱胎于清华大学知识工程研究室,素来有"国家队"之称。然而就在最近开始频频出现融资动作,10天 之内补充弹药达15亿人民币;可与此同时,组织震荡颇有加剧之势,从一线团队到高管大牛皆有波及。冰火两重天的态势,可谓是目前除了DeepSeek 之外,大多数大模型从业者们,真实写照的一个缩影。 2024年底,智谱曾以200亿元的估值,完成一轮30亿元人民币的融资,在这之后,包括杭州城投、上乘资本、华发集团等国资背景的资方快马加鞭地 赶到为其注资。 不过,也有风投人士对「新熵」分析,DeepSeek的横空出世还是对智谱的估值造成了一定负面影响,快速拿钱也可能是为了抢下已经出现上涨瓶颈的 相对高价。 与大开现金粮仓之门形成反差的是,智谱在团队规模和对外投资上呈现出收缩之势 ...