华为昇腾910B

Search documents
特朗普拒不妥协?美债危机倒逼中美谈判,英伟达CEO暗藏玄机
Sou Hu Cai Jing· 2025-05-06 07:27
特朗普拒不妥协?美债危机倒逼中美谈判,英伟达CEO暗藏玄机 但特朗普偏要硬撑。他一边喊话要谈判,一边挥舞芯片制裁大棒,甚至点名英伟达:连"阉割版"芯片都不许卖给中国!这操作看得人直摇头:一边求着中国 接盘美债,一边又掐中国脖子,哪来的底气? 第一部分:谈判大门敞开,特朗普为何装聋作哑? 最近国际舆论场炸开了锅——美国突然主动向中国递出谈判"橄榄枝",但中方回应却意味深长。商务部一句"正在评估",既没把话说死,也没直接拒绝,反 而给特朗普政府留了个"台阶":想谈?先拿出诚意! 第二部分:芯片战升级,特朗普的算盘能响吗? 特朗普的芯片政策,本质是"新瓶装旧酒"。拜登时期搞的芯片出口限制,他非但不松手,反而要加码。这次直接瞄准英伟达,要求连性能缩水的"特供版"芯 片都不准出口。表面看是"杀鸡儆猴",逼其他国家站队;实际上,这和加征关税一个套路——人为制造筹码,逼中国让步。 可问题是,这招真的管用吗?先看数据:2024年中国芯片自给率已突破30%,预计2025年将达45%。更关键的是,华为昇腾910B、寒武纪MLU370等国产芯 片性能直追英伟达A100。黄仁勋在闭门会上那句"限制出口只会加速中国自研",可不是客套话 ...
DeepSeek-R2发布在即,参数量翻倍,华为昇腾芯片利用率达82%!
Sou Hu Cai Jing· 2025-04-29 07:17
根据爆料信息,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),结合了更加智能的门 控网络层(Gating Network),以优化高负载推理任务的性能。在MoE架构的加持下,DeepSeek-R2的模型 总参数量预计将达到1.2万亿,较之DeepSeek-R1(6710亿参数)提升约1倍。从规模上来看,DeepSeek-R2 与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当。 昨日晚间,玩家@deedydas在社交媒体平台爆料了深度求索即将发布的下一代AI大模型DeepSeek-R2的参数 信息。 在硬件平台方面,DeepSeek-R2实现了基于华为昇腾 910B(Ascend 910B)芯片集群平台的训练方案,在 FP16 精度下实现了 512 PetaFLOPS 的计算性能,芯片资源利用率达到 82%。根据华为实验室的数据,这 一算力大约是英伟达上一代A100训练集群的91%。 可能得益于华为昇腾910B训练集群,DeepSeek-R2的单位推理成本较之GPT-4下降了97.4%,DeepSeek-R2 的成本约为0.07美元/百万token,而G ...
超越DeepSeek?巨头们不敢说的技术暗战
3 6 Ke· 2025-04-29 00:15
无可置疑的,DeepSeek-R1模型的面世使中国AI技术发展有了极大的优势侧,也标志着人工智能领域的 里程碑式突破。 不过,技术创新往往伴随应用成本的转移。约65%的早期采用者反馈,在实际部署中需要投入大量开发 资源进行适配优化,这在一定程度上削弱了其理论上的效率优势。 这款具有颠覆性意义的推理模型不仅在研发效率上展现出显著优势,其性能指标可与OpenAI等业界领 军企业的产品分庭抗礼,甚至基于中国的应用场景,可能还有所超越,而其所需计算资源较同类产品大 幅缩减近30%。 该模型的成功实践既印证了算法创新的无限可能,也引出了关键的技术进化命题,即当未来算法突破与 传统计算架构出现适配瓶颈时,行业将面临怎样的转变挑战? 当前主流大模型(如GPT-4、Gemini Pro、Llama3等)正以每月迭代2-3次的频率推进技术革新,持续刷 新性能基准。DeepSeek-R1通过独创的分布式训练框架和动态量化技术,成功将单位算力下的推理效能 提升40%,其研发轨迹为行业提供了算法与系统工程协同进化的典型案例。 而且,该团队研发的多头潜注意力机制(MLA)在实现内存占用降低50%的突破性进展时,也带来了 开发复杂度的显 ...