Workflow
SimpleFold
icon
Search documents
字节Seed发布PXDesign:蛋白设计效率提升十倍,进入实用新阶段
量子位· 2025-10-01 03:03
字节Seed团队 投稿 量子位 | 公众号 QbitAI AI蛋白设计进入新阶段! 最近,字节跳动Seed团队多模态生物分子结构大模型 (Protenix) 项目组提出了一种可扩展的蛋白设计方法,叫做 PXDesign 。 要知道,蛋白设计一直是个成功率很低的任务,即便是DeepMind推出的AlphaProteo,凭借其AlphaFold系列模型,在相同靶点上的成功率 也仅为 9%-33%。 此外,Protenix团队还推出了 公开免费的binder在线设计服务 ,让科学家无需自建复杂流程,就能直接调用这一能力,加速科研探索。 背景与意义 蛋白质是生命活动的基石。2024年诺贝尔化学奖一半授予 David Baker (计算蛋白设计) ,另一半联合授予 Demis Hassabis 与 John Jumper (蛋白结构预测) 。 在实际测试中,PXDesign展现出极高的效率, 24小时内即可生成数百个高质量的候选蛋白 ,生成效率较业界主流方法提升约10倍,并在多 个靶点上实现了 20%–73%的湿实验成功率 ,达到了当前领域的领先水平。 生成:快速高效 这也凸显了科学家关注的挑战: 不仅要"预测结构", ...
苹果掀桌,扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代
3 6 Ke· 2025-09-27 23:59
蛋白质折叠,一直是计算生物学中的一个核心难题,并对药物研发等领域产生着深远影响。 若把蛋白质折叠类比为视觉领域的生成模型,氨基酸序列相当于「提示词」,模型输出则是原子的三维坐标。 受此思维启发,研究人员构建了一个基于标准Transformer模块与自适应层的通用且强大的架构——SimpleFold。 论文地址:https://arxiv.org/abs/2509.18480 SimpleFold和AlphaFold2等经典的蛋白质折叠模型有哪些不同? AlphaFold2、RoseTTAFold2通过融合复杂且高度专业化的架构,如三角更新、成对表示、多序列比对(MSA)。 这些设计往往是将我们对结构生成机制的已有理解「硬编码」到模型中,而不是让模型自己从数据中学习生成方式。 SimpleFold则提出了一种全新思路: 没有三角更新、成对表示,也不需要MSA,而是完全基于通用Transformer和流匹配(flow-matching),能够直接将蛋白质序列映射为完整的三维原子结 构(见图1)。 SimpleFold 首个基于Transformer模块的蛋白折叠模型 流匹配把生成视作一段随时间推进的旅程,用常微分 ...
苹果发布轻量AI模型SimpleFold,大幅降低蛋白质预测计算成本
Huan Qiu Wang Zi Xun· 2025-09-25 02:49
Core Viewpoint - Apple has released a lightweight protein folding prediction AI model called SimpleFold, which utilizes flow matching methods to reduce computational costs while maintaining predictive performance, potentially advancing drug development and new material exploration [1][4]. Group 1: Technology and Innovation - SimpleFold replaces traditional complex modules like multiple sequence alignment with flow matching methods, significantly lowering computational costs and making protein-related research more accessible to various research teams [1][4]. - The flow matching technique, derived from diffusion models, allows for direct generation of protein structures from random noise, bypassing multiple denoising steps, thus enhancing generation speed and reducing computational load [4]. Group 2: Performance Evaluation - Multiple model versions of SimpleFold, ranging from 100 million to 3 billion parameters, were evaluated against the CAMEO22 and CASP14 benchmarks, focusing on generalization, robustness, and atomic-level accuracy [4]. - SimpleFold outperformed similar flow matching models like ESMFold and demonstrated performance comparable to leading protein folding prediction models [4][5]. Group 3: Comparative Performance Metrics - In the CAMEO22 test, SimpleFold achieved approximately 95% of the performance of AlphaFold2 and RoseTTAFold2, while the smaller SimpleFold-100M version exceeded 90% of ESMFold's performance, validating its competitive edge in the protein prediction field [5].