智谱开源OCR!测完我把手机里的扫描软件都卸了......
量子位·2026-02-11 12:49
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI OCR模型究竟能干什么?干得怎么样? 2025年末2026年年初,科技圈最卷的技术无疑就是——O!C!R! 这不,就在前两天,智谱也下场整活儿了,发布了自家的 「GLM-OCR」 开源模型~ 别看参数就0.9B,在OmniDocBench V1.5榜单上可是一通乱杀。 拳打Gemini-3-Pro!脚踢GPT5.2!(开玩笑 在手写体、代码文档、印章识别、跨单元格等场景的性能表现直通SOTA: | | GLM-OCR | PaddleOCR | Deepseek- | MinerU2.5 | dots.ocr | Gemini-3- | GPT-5.2-20 | | --- | --- | --- | --- | --- | --- | --- | --- | | | | -VL-1.5 | OCR2 | | | Pro | 25-12-11 | | | OCR 专项 | OCR 专项 | OCR 专项 | OCR 专项 | OCR 专项 | 通用大模型 | 通用大模型 | | 文档解析 | | | | | | | | | OmniDocBench v1. ...