Workflow
Visual Causal Flow
icon
Search documents
DeepSeek发布新模型
财联社· 2026-01-27 06:20
DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图 像的含义动态重排图像的各个部分,更接近人类的视觉编码逻辑。 下载财联社APP获取更多资讯 准确 快速 权威 专业 7x24h电报 头条新闻 VIP资讯 实时盯盘 ...
刚刚,DeepSeek又探索新架构了,开源OCR 2
机器之心· 2026-01-27 06:00
机器之心编辑部 嘿!刚刚,DeepSeek 又更新了! 这次是更新了十月份推出的 DeepSeek-OCR 模型(参见: 太强了!DeepSeek 刚刚开源新模型,用视觉方式压缩一切 )。 当时 DeepSeek-OCR 的出世,引起了大家对视觉压缩的关注与讨论,而这一次,DeepSeek 对视觉编码下手了。 可以说,刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构,实现了视觉编码从「固定扫描」向「语义推理」的范式转变! 当然,和 DeepSeek 几乎每次发布一样,这一次同样也是模型和技术报告齐开源。 这种设计打破了传统模型必须按从左到右、从上到下的栅格顺序处理图像的限制,赋予了编码器根据图像语义动态重排视觉 Token 的能力。通过这种两级级联的 1D 因果推理结构(编码器重排与译码器解析),模型能够更精准地还原复杂文档(如带表格、公式和多栏布局)的自然阅读逻辑。 这就像是为机器装上了「人类的阅读逻辑」,让 AI 不再只是生搬硬套地扫描图像。对比之下,传统的 AI 就像一个死板的复印机,不管页面内容多复杂,都只能 从左上角到右下角按行扫描。 在维持极高数据压缩效率的同 ...