智谱联合华为开源图像生成模型 GLM-Image

GLM-Image是首个在国产芯片上完成全程训练的SOTA多模态模型,全流程均在昇腾Atlas 800T A2设备 上完成,验证了在国产全栈算力底座上训练前沿模型的可行性。 依托昇腾NPU和昇思MindSpore AI框架,使用动态图多级流水下发、高性能融合算子、多流并行等特 性,智谱自研了模型训练套件,全面优化数据预处理、预训练、SFT和后训练的端到端流程。通过动态 图的多级流水优化机制,将Host侧算子下发的关键阶段流水化并高度重叠,消除下发瓶颈;通过多流并 行策略,通信和计算互掩,打破文本梯度同步、图像特征广播等操作的通信墙,极致优化性能;使用 AdamW EMA、COC、RMS Norm等昇腾亲和的高性能融合算子,同步提升训练的稳定性和性能。 21世纪经济报道记者孔海丽 1月13日,智谱联合华为开源新一代图像生成模型GLM-Image,在科普插画、多格图画、社交媒体图 文、商业海报、写实摄影等方面均可落地。 近期,以Nano Banana Pro为代表的闭源图像生成模型正在推动图像生成与大语言模型的深度融合。技 术范式正从单一的图像生成,进化为兼具世界知识与推理能力的认知型生成,这些模型在海报、PPT ...