Workflow
DeepSeek悄悄上线新模型
21世纪经济报道·2025-10-30 10:42

这一成果迅速在产业界引发热烈讨论。 日 前 , DeepSeek 在 人 工 智 能 开 源 社 区 Hugging Face 上 发 布 了 一 个 全 新 的 多 模 态 模 型 DeepSeek-OCR 。 在华为旗下的学术平台"黄大年茶思屋"上,有技术专家甚至指出,该模型的核心构件视觉 encoder的高效解码,为光计算和量子计算在LLM(注:大语言模型)领域的引入提供了明确 的技术路径。 10月29日,图灵量子相关负责人在接受21世纪经济报道记者采访时表示, DeepSeek-OCR技 术能更有效地将光计算高并行性和低功耗优势发挥出来,相信很快便会有光计算芯片结合大 模型的应用出现 。 光学压缩破局 一直以来,上下文的长度是困扰大模型性能的重要瓶颈 。比如,上下文窗口过小,会导致模 型无法一次性阅读用户之前的输入信息(比如文章),影响推理的准确性。 针 对 这 个 痛 点 , 业 内 提 出 了 稀 疏 注 意 力 、 检 索 增 强 生 成 等 多 种 技 术 来 应 对 。 这 一 次 , DeepSeek首次提出"上下文光学压缩"(Contexts Optical Compression)技术 ...