Workflow
分布式交易型数据库(OLTP)
icon
Search documents
申万宏源:AI Infra已成为AI应用落地关键 “卖铲人” 看好OLTP与向量数据库方向
智通财经网· 2025-12-24 06:49
RAG技术渗透率快速提升,Gartner预测2025年企业采用率将达68%。向量数据库作为RAG核心组件, 支撑海量数据毫秒级检索,市场需求持续高增。 智通财经APP获悉,申万宏源发布研报称,AI Infra作为AI模型训练与推理的底层支撑,已成为应用落 地的关键 "卖铲人"。算力调度是决定模型推理盈利水平的核心变量,国内模型Token收费显著低于海 外,成本敏感度更高。据测算,在单日10亿查询量下,若使用H800芯片,单卡吞吐能力每提升10%, 毛利率能够提升2-7个百分点。生成式AI+Agent加速渗透,AI infra软件作为应用部署的基础设施,有望 进入高速增长期。看好高实时性、可灵活拓展的分布式交易型数据库厂商(OLTP),以及增量的向量数 据库。 申万宏源主要观点如下: 算力调度是决定模型推理盈利水平的核心变量 国内模型Token收费显著低于海外,成本敏感度更高。阿里Aegaeon通过Token级调度可减少82% GPU用 量,华为Flex:ai提升30% 算力利用率,高效调度能力成为模型推理厂商盈利关键。根据申万宏源测算, 在单日10亿查询量下,若使用H800芯片,单卡吞吐能力每提升10%,毛利 ...