刘庆峰:讯飞星火是唯一基于全国产算力训练的主流大模型
"可以自豪地告诉大家,在今天中国所有的主流大模型中,讯飞星火是唯一基于全国产算力训练的通用 大模型。"刘庆峰表示,随着国产算力底层能力的进一步提升,讯飞星火的训练成本仍有较大的下降空 间。 科大讯飞董事长刘庆峰在会上表示,在全国产算力平台上,国产大模型即使在参数规模小一倍的情况 下,也已可对标国际领先水平。在芯片供应受限的背景下,自主可控的AI基础设施已初步成型。 刘庆 峰指出,过去几年在算力资源受限的条件下,科大讯飞为持续优化星火大模型的训练及推理成本效率, 投入了巨大精力。与直接使用英伟达卡上开展的各种工程优化不同,科大讯飞选择了更难的全国产算力 路线。 据介绍,自2023年5月起,科大讯飞联合华为先后攻克了万卡高速互联组网、计算通信隐藏、训练推理 强交互、高吞吐推理优化以及国产算子优化等一系列难题。这使得通用大模型及类o1深度推理模型的训 练效率(对标A100)从最初的30%-50%,大幅提升至85%-95%以上。 2025年以来,科大讯飞再次攻克 了国产算力训练的两座"大山":在长思维链强化学习方面,将深度推理训练效率(对标A800)从30%提 升至84%以上;在MoE模型全链路训练方面,将效率从20 ...