Workflow
Seed Diffusion Preview
icon
Search documents
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
量子位· 2025-08-01 04:23
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 用 扩散模型 写代码,不仅像开了倍速,改起来还特别灵活! 字节Seed最新发布扩散语言模型 Seed Diffusion Preview ,这款模型主要聚焦于代码生成领域,它的特别之处在于采用了离散状态扩散技 术,在推理速度上表现出色。 在H20上,它的代码推理速度能达到 2146tokens/s ,比同类的Mercury和Gemini Diffusion等模型快不少,同时 比同等规模的自回归模型 快5.4倍 ,并且在代码编辑任务中更具优势。 Seed Diffusion Preview以 结构化的代码生成 为实验领域,系统性地验证离散扩散技术路线作为下一代语言模型基础框架的可行性。 下面介绍它的具体技术细节。 核心是两阶段训练学习 自回归模型存在串行解码延迟瓶颈,理论上,扩散模型的并行生成潜力和整体性生成的优势可以解决自回归模型推理速度局限这一痛点。 但理论优势与实际效果还是有差距,离散扩散模型在语言任务中的大规模部署仍面临两大核心瓶颈: 归纳偏置冲突 和 推理效率瓶 颈 。 为解决上述问题,Seed Diffusion Preview采用了四项关键的技 ...
英伟达H20算力芯片被曝存在严重安全问题;乐道沈斐截胡理想广告,讽刺友商暗搓搓请水军;罗马仕进入破产程序?内部员工:9月底定生死
雷峰网· 2025-08-01 00:41
要闻提示 NEWS REMIND 1. 乐道沈斐截胡理想广告,讽刺友商暗搓搓请水军 2.被约谈!英伟达H20算力芯片被曝存在严重安全问题 3.罗马仕进入破产程序?内部员工:9月底定生死,若证书未恢复或将销毁库存 4.字节跳动辟谣人均在职7个月,并称高绩效员工离职率约5% 5.理想i8把8吨重卡车撞到四轮弹起?东风最新回应:已构成严重侵权,贬低品牌形象 6.腾讯入股SM成二股东,网易云音乐怒告:滥用市场支配地位 7.OpenAI 年化营收被曝猛增至 120 亿美元,ChatGPT 周活用户突破 7 亿大关 8.扎克伯格下血本:Meta 计划今年砸 720 亿美元加码 AI 基础设施 为维护中国用户网络安全、数据安全,国家互联网信息办公室于2025年7月31日约谈了英伟达公司,要求英伟达公司就对华销售的H20算力芯片漏洞后门安 全风险问题进行说明并提交相关证明材料。对此,英伟达昨夜深夜回应:"网络安全对我们至关重要。NVIDIA的芯片不存在'后门',并不会让任何人有远程访 问或控制这些芯片的途径。" 值得注意的是,此前,国家安全部官方公众号曾发文提醒大家,要当心自己身边的"隐形窃密通道"。其中就提到,一些境外生产 ...