模型上新、降价,火山引擎急推AI应用落地
2 1 Shi Ji Jing Ji Bao Dao·2025-06-14 00:55
谁来做Agent大规模落地的核心推手? 火山引擎说,我想。 区间定价 "如果说2024年是中国大模型应用的元年,那2025年将很可能是中国Agent落地的元年。" 在火山引擎总裁谭待看来,以PC、移动、AI三个时代来划分,技术主体在发生变化,从PC时代的web,移动时代的APP,到AI时代,则是Agent。 Agent正逐步进入企业的各个业务流程。怎么让Agent星星之火可燎原,打通其规模化落地的堵点,火山引擎的一把火,烧向"区间定价"。 "Agent的Token消耗量是很大的。"会后接受《21CBR》等媒体采访时,谭待谈到,让Agent执行一项任务,可能需要20万tokens。因此,怎么把模型使用成本 降下来,非常关键。 新发布的豆包大模型1.6,首创按"输入长度"区间定价的模式,深度思考、多模态能力与基础语言模型,统一价格。 谭待表示,对同结构、同参数的模型而言,真正影响成本的,是上下文长度,而不是是否开启了思考和多模态功能。目前模型大部分的调用,输入范围都在 32K以内。 基于这一观察,团队意识到,如果在推理调度上,通过分桶调度做好优化,就能够让占大头比例的模型请求,享受到更低成本、更快速度。 在企业使 ...