DeepSeek-OCR技术深度剖析:长文本处理的光学压缩路径与产业应用前瞻
Haitong Securities International·2025-10-23 13:35
wo[Table_Title] Research Report 23 Oct 2025 电子 Technology DeepSeek-OCR 技术深度剖析:长文本处理的光学压缩路径与产业应用前瞻 DeepSeek-OCR: A Technical Deep Dive into the Optical Compression Path for Long-Context Processing and Its Industrial Applications 姚书桥 Barney Yao 吕小潼 Xiaotong Lyu 点评 从"加长窗口"到"先压后解"。当前,长文本处理技术正沿两条差异化路径演进:上一代方案以"扩展上下文窗 口"为核心,如 Gemini 1.5 支持 2M tokens、OpenAI GPT-4.1 提供 1M tokens,并通过 RAG 与稀疏注意力等技术优化 其二次方复杂度带来的计算开销,该路径虽提升了单次输入的上限,但未能改变推理成本随文本长度线性增长的本 质;DeepSeek-OCR 则代表新一代"压缩存储"思路,通过将文本映射为视觉表征并进行高倍率压缩,以少量视觉 token 承载长上 ...