AI Infra 工程师们如何应对大模型流水线里的“暗涌”?
AI前线·2025-06-26 05:44
近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了 华为昇腾技术专家 ZOMI 酱、蚂蚁集团高 级专家马介悦和 SGLang 核心开发者尹良升 一起,在 AICon 全球人工智能开发与应用大会 2025 北京站 即将召开之际,共同探讨大模型 Infra 工程师的实战日常。 作者 | AICon 全球人工智能开发与应用大会 策划 | 罗燕珊 编辑 | 宇琪 Infra 虽然是看不见的"底座",但它却承担着支撑整个大模型系统运行的重量。那么,Infra 工程师 在日常工作中会遇到哪些真实需求与故障类型?开源 Infra 和国产卡适配训练推进过程中,又会 遇到哪些难点和挑战呢? 部分精彩观点如下: 在 6 月 27-28 日将于北京举办的 AICon 全球人工智能开发与应用大会 上,我们特别设置了 【 AI 基础设施与生态构建 】 专题。该专题将聚焦 AI 软硬件及生态系统的建设,讨论如何打造高效 的 AI 开发与应用环境。 以下内容基于直播速记整理,经 InfoQ 删减。 完整直播回放可查看: https://www.infoq.cn/video/kx2h235pHrE7fENMaxlH 大模型工程中 ...