Workflow
自然语言控制解码
icon
Search documents
HF日趋榜一!真端到端模型AutoDeco终结手动调参解码
机器之心· 2025-11-04 03:13
大语言模型(LLM)的「炼丹师」们,或许都曾面临一个共同的困扰:为不同任务、不同模型手动调整解码超参数(如 temperature 和 top-p)。这个过程不仅耗时 耗力,而且一旦模型或任务发生变化,历史经验便瞬间失效,一切又得从头再来。 这种繁琐的试错过程,在许多研发团队的日常沟通中屡见不鲜,正如下图所展示的那样: 图 1 :研发人员手动调整解码参数的日常。 一个灵魂拷问随之而来: 为何不能让模型自己学会如何解码,从而实现真正的「端到端」? 事实上,各大模型厂商的 API 文档也印证了这一难题。以 DeepSeek 为例,其官方文档明确建议针对不同场景设置截然不同的 temperature 值,这使得单一的静态 参数设置显得捉襟见肘。 | 场景 | 温度 | | --- | --- | | 代码生成/数学解题 | 0.0 | | 数据抽取/分析 | 1.0 | | 通用对话 | 1.3 | | 翻译 | 1.3 | | 创意类写作/诗歌创作 | 1.5 | 图 2 :不同任务需要不同的解码参数,这使得静态设置难以应对复杂多变的现实需求。 近日, 由腾讯 AI Lab 的王琰研究员及其团队领衔,联合 香港中 ...