或颠覆文档处理模式,DeepSeek OCR模型再更新
海通国际表示,DeepSeek-OCR代表新一代"压缩存储"思路,通过将文本映射为视觉表征并进行高倍率 压缩,以少量视觉token承载长上下文信息,仅在需使用时按需解码还原,从而实现从"扩大计算基 数"到"减少计算负荷"的根本性转变;据论文及第三方评测数据,DeepSeek-OCR在低于10倍压缩率下可 实现约97%的文本还原精度,能够满足多数信息检索与文档归档类需求;而在20倍高压缩率下精度约为 60%,适用于容错性较高的线索检索场景。 华创证券指出,DeepSeek-OCR在20个A100节点上日处理3300万页数据的吞吐能力,以及对小语种(如 阿拉伯语、僧伽罗语)的良好支持,使其在全球化商业部署中具有显著优势,这种"视觉即压缩"的范式 可能重塑未来大语言模型的输入方式。 据新浪财经1月27日报道,DeepSeek发布全新DeepSeek-OCR2模型,采用创新的DeepEncoderV2方法, 让AI能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。 在基准测试中,新模型达到91.09%的性能,较前代提升3.73%,同时视觉token使用上限降至1120个(前 代为1156个)。这 ...