FP8

Search documents
Deepseek发布V3.1 为何火的却是官方留言?
Huan Qiu Wang Zi Xun· 2025-08-23 05:26
来源:环球网 【环球网科技报道 记者 李文瑶】8月21日,Deepseek宣布正式推出DeepSeek-V3.1,在混合推理架构、 思考效率、Agent 能力等方面进行了全面升级。不过,最值得关注的是,官方在留言中补充说明道, UE8M0 FP8是针对即将发布的下一代国产芯片设计。 一石激起千层浪。作为国内最具代表性的AI大模型之一,DeepSeek的这一官方留言立刻在资本市场引 起连锁反应。8月22日,寒武纪、海光信息等企业的股价在短期内出现上涨。市场普遍认为,FP8技术 的优化将推动国产芯片在AI训练和推理场景下的性能提升,进而扩大市场份额。 据了解,在人工智能和高性能计算领域,数据精度与计算效率之间的平衡一直是技术演进的核心问题。 FP8(8位浮点数)作为一种新兴的数据格式,能够在几乎不损失模型精度的情况下,大幅提升计算速 度并降低功耗,尤其适用于大规模神经网络训练和推理。 目前,国内的芯片公司只有极少数GPU厂商支持FP8,比如摩尔线程,其旗舰产品MTT S5000就是国内 首批原生支持FP8并大规模量产的GPU。摩尔线程的MUSA架构原生支持硬件FP8张量加速计算,能够 很好地支持UE8M0 FP8 ...
算力股、芯片股都疯了!DeepSeek一句话让国产芯片集体暴涨!
是说芯语· 2025-08-22 07:49
克雷西 一水 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了: 新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。 国产芯片企业股价也跟风上涨,比如寒武纪今日收盘上涨20%,总市值跃居科创板头名。 半导体 ETF ,同样也是全天大涨10%。 (不知道作为放出消息的DeepSeek背后公司幻方量化,有没有趁机炒一波【手动狗头】) | 15:02 ■ ■ ■ ■ ■ ■ ■ ■ | | 9 13.6 5011 66% | | | --- | --- | --- | --- | | | 半导体ETF(512480.SH) 1.311 +0.110 +9.16% | | Q C | | 新闻 | 资金 简况 | 持仓 | 公告 | | 股票名称 | | 涨跌幅 | 净值占比 | | 寒武纪-U 科 688256 | | +20.00% | 8.62% | | 中芯国际 科 688981 | | +14.19% | 7.20% | | 北方华创 sz 002371 | | +6.21% | 6.01% | | 海光信息 科 68804 ...
究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片
机器之心· 2025-08-22 04:01
机器之心报道 Deepseek V3.1 的很多基准测试结果已经陆续在 SWE-bench 等榜单上出现。此外,新模型在 Aider 多语言编程基准测试中得分超越了 Anthropic 的 Claude 4 Opus,同时还有显著的成本优势。 | Benchmarks | DeepSeek-V3.1 | DeepSeek- | DeepSeek- | | --- | --- | --- | --- | | | | V3-0324 | R1-0528 | | SWE-bench Verified | 66.0 | 45.4 | 44.6 | | SWE-bench | 54.5 | 29.3 | 30.5 | | Multilingual | | | | | Terminal-Bench | 31.3 | 13.3 | 5.7 | 与 DeepSeek 自己此前的模型相比,V3.1 的性能提升显著,它解决问题需要更多步骤,但经过了思维链压缩训练,在任务表现持平的情况下,token 消耗 量可以减少 20-50%,因此有效成本与 GPT-5 mini 相当。 除了模型性能的提升之外, 值得关注的是,DeepSee ...