Workflow
DeepSeek OCR2
icon
Search documents
未知机构:CT电子继续看好国产算力国产模型进入密集发布期临近-20260204
未知机构· 2026-02-04 02:00
【CT电子】继续看好国产算力 国产模型进入密集发布期: 临近春节,国产模型进入发布窗口期,近段时间,DeepSeek开源OCR2,Kimi发布并开源K2.5,阿里Qwen3-Max- Thinking,百度文心5.0等重量级模型接连发布。 此外字节计划在2月推出三款全新的 AI 模型,分别为豆包 2.0(新一代旗舰大语言模型)、Seedream5.0(图像生 成模型)以及 SeedDance 2.0( 【CT电子】继续看好国产算力 国产模型进入密集发布期: 大量模型侧更新将加速驱动模型整体商用进度。 国内云厂商AI资本开支持续保持高位: 根据金融时报2025年12月23日报道,字节已初步规划2026年资本开支1600亿元,高于2025年约1500亿元。 此外阿里在2025年云栖大会表示,正在积极推进3年3800亿元的AI基础设施建设计划。 云厂商capex持续投入奠定国产算力需求基础。 模型端迭代加速,推理侧需求有望快速增长: 国产模型快速迭代抢占用户AI交互入口,交互方式也正在被塑造,对应推理侧算力需求有望迎来加速提升。 同时2026年也是推理侧国产超节点上量元年,目前已有大量国产厂商发布新一代超节点方案, ...
未知机构:国盛计算机DeepSeekOCR2模拟人类阅读习惯重排阅读顺序实现O-20260128
未知机构· 2026-01-28 02:00
【国盛计算机】DeepSeek OCR2 :模拟人类阅读习惯重排阅读顺序,实现OCR效果提升 # 传统OCR的痛点是什么? De 【国盛计算机】DeepSeek OCR2 :模拟人类阅读习惯重排阅读顺序,实现OCR效果提升 # 传统OCR的痛点是什么? 现实文档大多存在图文混排,AI容易读错顺序,导致OCR给出的结果较为混乱。 # DeepSeek-OCR2做了什么? 将"阅读顺序/阅读逻辑"的处理,从解码器(LLM)前置到了编码器(Encoder)中。 现实文档大多存在图文混排,AI容易读错顺序,导致OCR给出的结果较为混乱。 # DeepSeek-OCR2做了什么? 将"阅读顺序/阅读逻辑"的处理,从解码器(LLM)前置到了编码器(Encoder)中。 Deepseek创新性提出VisualCausalFlow(视觉因果流),先依据语义将文档重排为符合阅读逻辑的顺序,让编码器 先将 2D 文档内容"按语义重排为 1D 因果流",再交给 LLM 生成,从而让视觉编码器学会了一种更接近"人类阅读 习惯"的机制。 # 效果如何? OmniDocBench v1.5测试综合得分 91.09,相比上一代deepse ...