Saprot蛋白质语言大模型

Search documents
 西湖大学原发杰团队发布SaprotHub开源平台:让生物学家能够轻松应用蛋白质语言模型,
 生物世界· 2025-10-27 10:00
该研究首先提出了一种新颖的蛋白质表征方法——将蛋白质一维序列与三维结构相结合形成"结构感知"词 汇表并据此训练出了 蛋白质语言大模型 —— Saprot 。在此基础上,团队进一步推出了 SaprotHub 开源 平台 。 该平台旨在将 Saprot 等一系列先进蛋白质语言模型的能力开放给生命科学领域研究者,它也是 开放蛋白 质模型联盟 (Open Protein Modeling Consortium,OPMC) 为推动全球科研协作、共建开源社区而迈 出的关键第一步。 编辑丨王多鱼 排版丨水成文 如同人类拥有语言,生命世界也有一套由氨基酸序列构成的"分子语言"—— 蛋白质 。近年来,人工智能 (AI) 领域的 蛋白质语言模型 (PLM) 展现出解码这套语言的强大能力,能够精准预测蛋白质的结构与 功能 。 然而,这些尖端模型的训练与使用,往往需要深厚的机器学习专业知识和编程能力,这在 AI 开发者与广大 生物学家之间形成了一道鸿沟。 为了打破这一壁垒, 2025 年 10 月 24 日, 西湖大学 原发杰 团队 在 Nature Biotechnology 期刊 发表 了题为: Democratizing Pr ...

