融资超5亿!梁军领航昉擎科技,以解耦架构开辟AI算力新赛道
机器人圈·2025-12-17 09:19
这一创新架构精准切中了当下 AI算力市场的痛点。随着大模型从云端训练向业务推理和端侧应用渗透,长 上下文推理、思维链、多模态生成等技术快速发展,推理侧算力需求爆发式增长,市场对多样化、低成 本、低延迟、高稳定的模型部署需求日益迫切。传统Transformer架构中,负责记忆和上下文的Attention 与负责逻辑和知识的FNN绑定运行,导致简单逻辑推理时需携带沉重记忆模块,处理超长文本时又面临内 存吞吐拥堵,严重影响计算效率。而昉擎的解耦架构通过系统层面的重构,实现了多维度扩展,不仅能提 升计算效率,还能降低芯片与开发成本,更可开拓出新的系统形态——例如让智能眼镜、耳机等边缘设备 摆脱手机SoC的附属地位,成为对等的计算节点。 对于行业内热门的 GPGPU路线,梁军有着清醒的认知:GPGPU架构面向高并发、高吞吐设计,追求低延 迟需付出更高成本,且国内企业在供应链与制程管制下面临更大挑战;同时,以兼容CUDA为目标的研发 模式虽简化了管理,却也限定了产品上限。昉擎选择的分离式架构路线,聚焦于更高层面的计算架构与编 程模型,原生支持异构计算,可基于现有系统构建,具备良好的兼容性,并非对现有系统的替代,而是通 过 ...