Workflow
今日暴论:Deepseek-OCR干翻了所有架构
自动驾驶之心·2025-10-27 00:03

转自差评X.PIN: DeepSeek昨天开源的新模型,有点邪门。 点击下方 卡片 ,关注" 大模型之心Tech "公众号 戳我-> 领取大模型巨卷干货 本文只做学术分享,如有侵权,联系删文 ,欢迎添加小助理微信AIDriver004做进一步咨询 DeepSeek 又整出新东西来了,只用到原本十分之一 token,就能存下几乎一样的文字信息,这压缩比,香农看了都要流泪,冯·诺伊曼看了都要沉默。 更是直接把一堆老外给钓成了翘嘴。 昨天,DeepSeek 发布了新模型 DeepSeek-OCR,OCR 这东西咱们都熟悉,就是把图片里的文字给识别出来。 经常用微信的差友应该知道,微信客户端里的图片,被咱们点开后,是可以直接复制文字的。 没错,这就是一种 OCR 技术的应用。 但是 DeepSeek 这次的 「技能 OCR」则是刚好相反,它可以把大量文字变成一张图片,作为 AI 的"记忆载体"。 是的,用文字来存储信息,已经不够满足它了。 过去的大模型,不管是什么 ChatGPT、Gemini、Llama、Qwen、还是 DeepSeek 过去的自己,在读取数据的用的都是一种方式: 文字,也就是平时常说的 token ...