Workflow
Gemma 3模型
icon
Search documents
T5Gemma模型再更新,谷歌还在坚持编码器-解码器架构
机器之心· 2025-12-19 03:42
从模型名称可以看出,T5Gemma 系列模型与 T5 息息相关。T5(Text-to-Text Transfer Transformer) 是 Google 在 2019 年提出的一种 编码器 - 解码器(Encoder– Decoder)大模型框架 ,「编解码器大模型」的思想源头,几乎都能追溯到 T5。 T5Gemma 使用了 「适应(adaptation)」 技术将已经完成预训练的仅解码器模型转换为编码器 - 解码器架构。 编辑|冷猫 最近,或许是年底了,谷歌的发布变得有些密集。比如昨天,谷歌发布了在智能 / 成本上全球性价比最高的模型 Gemini 3 Flash 。 在 Gemini 3 Flash 发布后,大家都以为谷歌今年的模型发布已经收官的时候,谷歌却又掏出了一个让大家都意想不到的模型更新: T5Gem ma 2 。 T5Gemma 系列模型似乎没能给大众留下什么深刻印象。今年 7 月,谷歌第一次发布了 T5Gemma 模型系列, 并且一口气发布了 32 个模型 。 但遗憾的是,「编码器 - 解码器架构」始终没有成为大模型世界的主流,在「仅解码器」大语言模型快速迭代的大背景下难逃逐渐被边缘化的命 ...