Seek .(SKLTY)

Search documents
Qwen3深夜炸场,阿里一口气放出8款大模型,性能超越DeepSeek R1,登顶开源王座
3 6 Ke· 2025-04-29 09:53
今天凌晨,大模型领域最受关注的重磅消息来自阿里 Qwen 团队——他们正式发布了备受期待的全新 Qwen3 系列大模型。 8 大模型齐发! 这 8 款混合推理模型中,包括了 2 个 MOE 模型:Qwen3-235B-A22B 和 Qwen3-30B-A3B。 其中,Qwen3-235B-A22B 是本次发布中规模最大的旗舰模型,拥有 2350 亿个参数,激活参数超过 220 亿。 在代码、数学和通用能力等多个基准测试中,它的表现不仅超过了 DeepSeek 的 R1 开源模型,还优于 OpenAI 的闭源模型 o1。尤其在软件工程和数学领 域的 ArenaHard 测试(共 500 道题)中,成绩甚至接近了 Google 最新发布的 Gemini 2.5-Pro,可见其实力不容小觑。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | Open Al-o3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | MO ...
DeepSeek-R2发布在即,参数量翻倍,华为昇腾芯片利用率达82%!
Sou Hu Cai Jing· 2025-04-29 07:17
根据爆料信息,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),结合了更加智能的门 控网络层(Gating Network),以优化高负载推理任务的性能。在MoE架构的加持下,DeepSeek-R2的模型 总参数量预计将达到1.2万亿,较之DeepSeek-R1(6710亿参数)提升约1倍。从规模上来看,DeepSeek-R2 与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当。 昨日晚间,玩家@deedydas在社交媒体平台爆料了深度求索即将发布的下一代AI大模型DeepSeek-R2的参数 信息。 在硬件平台方面,DeepSeek-R2实现了基于华为昇腾 910B(Ascend 910B)芯片集群平台的训练方案,在 FP16 精度下实现了 512 PetaFLOPS 的计算性能,芯片资源利用率达到 82%。根据华为实验室的数据,这 一算力大约是英伟达上一代A100训练集群的91%。 可能得益于华为昇腾910B训练集群,DeepSeek-R2的单位推理成本较之GPT-4下降了97.4%,DeepSeek-R2 的成本约为0.07美元/百万token,而G ...
阿里发布并开源模型Qwen3,成本仅为DeepSeek-R1的1/3
Guan Cha Zhe Wang· 2025-04-29 03:27
4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的 1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等领先模型,登顶全球最强开源模型。 千问3是国内首个"混合推理模型",将"快思考"与"慢思考"集成进同一个模型,大大节省算力消耗。 根据官方的说法,千问3的旗舰版本 Qwen3-235B-A22B,在代码、数学、通用能力等基准测试中,达到 了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 同一梯度的水平。 在奥数水平的 AIME25 测评中,Qwen3-235B-A22B 斩获 81.5 分,刷新了开源模型的纪录;在考察代码 能力的 LiveCodeBench 评测中,Qwen3-235B-A22B 突破 70 分,表现甚至超过 Grok 3;在评估模型人类 偏好对齐的 ArenaHard 测评中,Qwen3-235B-A22B 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Dee ...
阿里Qwen3性能超越DeepSeek-R1;美媒曝马斯克孩子数量远超14个;ChatGPT推出购物功能
Guan Cha Zhe Wang· 2025-04-29 01:10
【观网财经丨智能早报 4月29日】 美股三大指数收盘涨跌不一,大型科技股互有涨跌 美股三大指数收盘涨跌不一,道指涨0.28%,标普500指数涨0.06%,纳指跌0.1%。大型科技股互有涨跌,英特尔涨超2%,苹果、特斯拉、奈飞、Meta小幅 上涨;英伟达跌超2%,微软、谷歌、亚马逊小幅下跌。 阿里巴巴通义千问Qwen3登顶开源王座 博客节目的主持人艾莉森·卡梅洛塔插话说,人们不知道所有其他孩子和女人的"原因是马斯克让他的孩子妈妈们签署了保密协议,他请了很多律师,他很爱 打官司,如果她们开口,他会起诉她们",马斯克付给孩子们的母亲很多钱,让她们保持沉默。据报道,马斯克第13个孩子的母亲艾希莉·圣克莱尔得到了 1500万美元封口费和每月10万美元的生活津贴,以掩盖他们孩子出生的消息,布鲁尼格补充说。(新浪科技) 库克或因对苹果AI进展失望再次重组团队 4月28日消息,据媒体报道,苹果CEO库克已经将苹果的机器人团队转移至该公司的硬件部门,该部门由苹果高管约翰·特努斯(John Ternus)领导。在苹果 智能(Apple Intelligence)功能推迟发布以来,库克一直在努力重组部分团队,例如将Siri团队移交 ...
阿里发布并开源千问3,称成本仅需DeepSeek-R1三分之一
Di Yi Cai Jing· 2025-04-29 00:33
阿里云方面表示,性能大幅提升的同时,千问3的部署成本大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为DeepSeek-R1的三分之一。 4月29日凌晨,阿里巴巴宣布推出新一代通义千问模型Qwen3(千问3)并进行开源。阿里云方面表示,千问3是国内首个"混合推理模型",将"快思考"与"慢 思考"集成进同一个模型,参数量仅为DeepSeek-R1的1/3,成本大幅下降,并在ChatBot Arena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶 全球最强开源模型。知情人士对记者表示,这是今年上半年阿里云最核心的技术产品发布。 | | Qwen3-235B-A22B MoE | Qwen3-32B Dense | OpenAl-o 1 2024-12-17 | | --- | --- | --- | --- | | ArenaHard | 95.6 | 93.8 | 92.1 | | AIME'24 | 85.7 | 81.4 | 74.3 | | AIME'25 | 81.5 | 72.9 | 79.2 | | LiveCodeBench v5. 2024.10-2025.02 | 7 ...
阿里开源千问3模型 成本仅需DeepSeek-R1三分之一
2 1 Shi Ji Jing Ji Bao Dao· 2025-04-29 00:24
阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个。 4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能 全面超越R1、OpenAI-o1等全球顶尖模型。 千问3是国内首个"混合推理模型","快思考"与"慢思考"集成进同一个模型,对简单需求可低算力"秒回"答案,对复杂问题可多 步骤"深度思考",大大节省算力消耗。 据了解,千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T ,并在后训练阶段多轮 强化学习,将非思考模式无缝整合到思考模型中。 同时,所有千问3模型都是混合推理模型,API可按需设置"思考预算"(即预期最大深度思考的tokens数量),进行不同程度的思 考,灵活满足AI应用和不同场景对性能和成本的多样需求。 比如,4B模型是手机端的绝佳尺寸;8B可在电脑和汽车端侧丝滑部署应用;32B最受企业大规模部署欢迎,有条件的开发者也 可轻松上手。 千问3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。 在评估模型Agent能力的BFCL评测中,千问 ...
超越DeepSeek?巨头们不敢说的技术暗战
3 6 Ke· 2025-04-29 00:15
无可置疑的,DeepSeek-R1模型的面世使中国AI技术发展有了极大的优势侧,也标志着人工智能领域的 里程碑式突破。 不过,技术创新往往伴随应用成本的转移。约65%的早期采用者反馈,在实际部署中需要投入大量开发 资源进行适配优化,这在一定程度上削弱了其理论上的效率优势。 这款具有颠覆性意义的推理模型不仅在研发效率上展现出显著优势,其性能指标可与OpenAI等业界领 军企业的产品分庭抗礼,甚至基于中国的应用场景,可能还有所超越,而其所需计算资源较同类产品大 幅缩减近30%。 该模型的成功实践既印证了算法创新的无限可能,也引出了关键的技术进化命题,即当未来算法突破与 传统计算架构出现适配瓶颈时,行业将面临怎样的转变挑战? 当前主流大模型(如GPT-4、Gemini Pro、Llama3等)正以每月迭代2-3次的频率推进技术革新,持续刷 新性能基准。DeepSeek-R1通过独创的分布式训练框架和动态量化技术,成功将单位算力下的推理效能 提升40%,其研发轨迹为行业提供了算法与系统工程协同进化的典型案例。 而且,该团队研发的多头潜注意力机制(MLA)在实现内存占用降低50%的突破性进展时,也带来了 开发复杂度的显 ...
比DeepSeek R2先发!阿里巴巴Qwen3上新8款,登顶全球最强开源模型
Tai Mei Ti A P P· 2025-04-28 23:27
Qwen3千呼万唤始出来,直接登顶全球最强开源模型。 4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),旗舰模型Qwen3-235B-A22B参 数量仅为DeepSeek-R1的1/3,总参数量235B,激活仅需22B,成本大幅下降,性能全面超越R1、 OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。 | | Qwen3-235B-A228 | Qwen3-32B | OpenAl-o1 | Deepseek R1 | Grok 3 Beta | Gemini2.5-Pro | OpenAl-o3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | Mil | Deces | 2024.12.17 | | Think | | Median | | ArenaHard | 95.6 | 93.8 | 92.1 | 93.2 | . | 96.4 | 89.0 | | AIME'24 | 85.7 | 81.4 | 74.3 | 79.8 | 83.9 | 92.0 | 79.6 | | AIME'25 | 81. ...
阿里Qwen3深夜开源,8款模型、集成MCP,性能超DeepSeek-R1,2小时狂揽16.9k星
3 6 Ke· 2025-04-28 23:23
此次全新升级的Qwen3系列有以下5大关键特性: 8种参数大小的稠密与MoE模型:0.6B、1.7B、4B、8B、14B、32B和Qwen3-235B-A22B(2350亿总参数和220亿激活参数)、Qwen3-30B-A3B(300亿总 参数和30亿激活参数); 引入混合思考模式:用户可切换"思考模式、"非思考模式",自己控制思考程度; 推理能力提升:在数学、代码生成和常识逻辑推理方面超越QwQ(在思考模式下)和Qwen2.5 instruct models(在非思考模式下); 阿里通义大模型新成员Qwen3系列模型终于亮相! 智东西4月29日报道,今日凌晨4点,阿里云正式开源Qwen3系列模型,包含2个MoE模型、6个稠密模型。发布2小时,Qwen3模型在GitHub上的star数已超 过16.9k。 | Product v | Solutions v | Resources v | Open Source v Enterprise V | | Pricing | | | | Q | Sign in | Sign up | | --- | --- | --- | --- | --- | --- | --- ...
Deep Seek分析:未来5年,钱放黄金、存银行、买房哪个更划算?
Sou Hu Cai Jing· 2025-04-28 22:51
再来说一下买房,很多人觉得现在正是买房的好时机。主要原因有两个:一个是,各地平均房价都较2021年跌去了30%。不少人觉得现在正是抄底买房的好 时机。另一个是,从去年开始,各地取消了限购。银行降低了房贷利率,首付比例。税务部门减免了契税、增值税等,这对于需要购房家庭来说,现在是政 策鼓励买房的最佳时期。 不过,现在投资房产也并不是好时机:①虽然全国平均房价下跌了30%,但是各地房价还是存在泡沫。像上海、深圳等大城市房价和收入之比高达40,这意 味着,当地居民不吃不喝要工作40年。所以,未来房价仍有下跌的空间。 在进入到2025年之后,国际金价出现了大幅波动,前些年买了金条的人据说都赚了不少钱。与此同时,房地产市场持续低迷,数据显示,一季度百城二手住 宅价格累计下跌1.51%,3月环比下跌0.59%,同比跌幅达7.29%。而存款利率虽然年初有所反弹,但总体上仍然呈现下行的趋势。于是,就有人提出:未来5 年,钱放黄金、存银行、买房子哪个更划算呢? 先来说一下黄金,很多人看到黄金价格上涨,都认为现在投资黄金最划算。但是,黄金的价格波动太大。而决定黄金涨跌的因素有两个:美元指数,以及全 球战争情况。比如,2024年俄 ...