DeepSeek正式发布新模型,还透露国产AI芯片关键信息

8月21日,DeepSeek表示最新的V3.1版本使用了UE8M0 FP8 Scale参数精度,同时在留言里透露, UE8M0 FP8是针对即将发布的下一代国产芯片设计。 资料显示,FP8是当前AI计算的一种前沿低精度格式,在支持原生FP8的GPU上,大语言模型训练采用 FP8混合精度可大幅提高GPU算力,显著降低显存占用,在2022年首次被英伟达、Arm和英特尔联合提 出, A股算力芯片龙头:寒武纪、海光信息。 华为昇腾产业链:拓维信息、神州数码、华丰科技等。 此外,据官微介绍,本次升级后将支持混合推理架构,拥有更高的思考效率和更强的Agent能力。通过 Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。 对于AI芯片,上海证券认为,国产GPU虽然还未到对标国外产品的水平,但已经能够满足部分对算力 有一定要求的应用场景,目前国产GPU进入了快速发展阶段,将从"可用"阶段进入"好用"阶段。 除了寒武纪、海光信息以及华为等厂商,华鑫证券表示,其他国产AI芯片厂商也呈现加速渗透的态 势。如摩尔线程能够提供AI训练智算卡、AI推理卡及夸娥(KUAE)智算集群等。其最新一代GPU采 用" ...