雷军:第二届音频编码器能力挑战赛明年9月将同步亮相Interspeech 2026,已开放报名
雷军表示,本次挑战赛旨在推动音频编码器对音频大语言模型(LALM)的增效,欢迎报名! 12月15日,小米公司创始人、董事长、首席执行官雷军发文宣布,小米联合萨里大学、清华大学、海天 瑞声联合发起第二届音频编码器能力挑战赛,将于明年9月同步亮相国际语音顶级会议 Interspeech 2026,目前已正式开放报名。 国际语音顶级会议 Interspeech 2026 将于明年 9 月在澳大利亚悉尼举行。由小米、萨里大学、清华大 学、海天瑞声联合发起的第二届 Audio Encoder Capability Challenge(AECC)音频编码器能力挑战赛将 同步亮相 Interspeech 2026,目前已正式开放报名。 当前,音频大语言模型(LALMs)发展迅速,但大多数主流模型在音频前端编码器上选择非常单一, 几乎均基于 OpenAI Whisper Encoder。这种对单一技术的依赖不利于模型架构的多样化探索,也限制了 LALMs 整体能力的进一步提升。为应对音频理解能力不断增长的需求,本次挑战赛将聚焦于音频编码 器这一核心模块,重点评估其在复杂真实场景下的理解与特征表示能力。 一、比赛介绍 1.1 ...