DeepSeek同款“外挂大脑”进军生命科学!中国团队发布Gengram,破解DNA天书
生物世界·2026-01-31 06:00

编辑丨王多鱼 排版丨水成文 如果说之前的 基因组大模型 是在逐字认识 ATCG 的排列组合,那么 Genos 团队此次推出的 Gengram 则相当于为其配备了一本" 基因字典 "。数据显示, 搭载 Gengram 后的大模型, 不仅刷新了多项基因组任务的 SOTA 记录,让模型在剪接位点识别等任务上 AUC 提升 16.1% ,还能自己悟出 DNA 双螺旋的物理规 律。 瓶颈:只会 "读字母"的基因组模型 在生物学中,很多 DNA 的功能元件 (例如启动子、剪接位点) 往往由特定的碱基组合 (Motif) 决定,但目前主流的基因组大模型都采用 单碱基分词 的形 式,也就是把 DNA 序列拆成一个个碱基来处理,这种方式虽然精准,但效率极低。 就像 我们看 "刻舟求剑",是一眼看懂成语的含义,而不是先分析"刻"字有几笔,"舟"字怎么写,然后一个字一个字拼在一起,这不仅浪费算力,还容易让模型在 长达数亿的碱基序列中迷路。 近日, DeepSeek 新发布的 " 外挂大脑 "模式在大模型圈内 爆火 ,仅 16 天后, 国内 一个名叫 Genos 的 团队 将这种模式引入了 生命科学 领域, 提出了 Gengram ...

DeepSeek同款“外挂大脑”进军生命科学!中国团队发布Gengram,破解DNA天书 - Reportify