DeepSeek低调上新:友好度跃升
DeepSeek低调上新:友好度跃升 除了性能提升,DeepSeek-V3-0324在部署方面也表现出优势。该版本模型采用宽松的MIT开源协议,且 可直接部署在M3 Ultra的Mac Studio上,这意味着大模型开发应用的门槛更进一步降低。苹果机器学习 工程师Awni Hannun 基于MLX框架和4-bit量化,在 512GB M3 Ultra上实现了超过20 token/s的运行速 度,将模型磁盘占用空间减少到352GB。 相比之前的自定义许可证,新协议还支持开发者自由修改、分发模型,支持模型蒸馏和商业化应用,进 一步推动了AI技术的共享与创新。 冲击行业格局 21世纪经济报道记者孔海丽 北京报道 DeepSeek低调发布了DeepSeek-V3模型的更新版本——DeepSeek-V3-0324。 没有主动传播,但引起了AI行业的一阵波澜,一个值得关注的信息点在于,该版本仍然基于V3的模 型,改进训练方法后,大幅提高了推理类任务的表现水平,在数学、代码类相关评测集上取得超过 GPT-4.5的得分成绩。 多维度性能改进 DeepSeek-V3-0324参数量为6850亿,较上一版本的6710亿略有增加。 ...