Workflow
寄存器复用
icon
Search documents
一位常年做GPU优化的人对理想能让Orin跑VLA很高评价
理想TOP2· 2025-12-06 15:16
2025年12月5日TOP2在北京与一位常年做GPU优化的群友线下交流,其认为理想能让Orin跑VLA是一 个很有水准的工作。 认同"理想是在教英伟达怎么压榨芯片能力"这句话既偏颇又有事实依据是get到理想这项工作很有水 准的核心锚点。 能够显著优化寄存器复用效率(Register Reuse),有效规避Orin架构上因寄存器压力过大导致的溢出 (Register Spilling)。 理想可能通过显式插入Ampere架构特有的异步拷贝指令(Async Copy),将计算流水线与显存访问 的延迟掩盖(Latency Hiding)做到极致。 敢于投入资源深耕此领域,证明了理想团队具备深入分析SASS(流多处理器汇编)并在指令级挖掘 硬件潜能的核心能力。这是一项高门槛的系统工程。 2025年8月8日,理想詹锟表示:"我们与英伟达进行了深度架构对齐,基于PTX(Parallel Thread Execution)指令集重构了底层算子,并打造了自研推理引擎,成功突破了通用TensorRT算子集的性能 天花板。" 詹锟提及的与英伟达深度交流,实质是指在Orin芯片(Ampere架构)微架构层面获得了原厂级的技 术指引 ...