云知声发布首个工业级文档智能基础大模型
Unisound U1-OCR核心优势在于突破了传统模型"只读文字、不懂排版"的瓶颈,能够像人类专家一 样"看懂"复杂文档。为适应OCR3.0时代对于文档业务级结构化抽取的新要求,Unisound U1-OCR采用 ViT+LLM架构,其中视觉编码器部分采用NaViT架构,实现文档分辨率动态处理,模型参数规模3B量 级,兼顾模型计算效率与文档深层语义信息理解的能力要求。 云知声方面表示,Unisound U1-OCR开启OCR3.0时代,标志着AI从单纯"识字"跃迁至"理解业务逻辑"。 公司将以多模态文档为知识入口,赋予机器自主推理与证据溯源能力,推动AI从感知走向认知。未 来,云知声期待构建能像人类一样阅读、思考并解决复杂问题的通用智能体,让每一份文档都成为通往 AGI的智慧阶梯。 本报讯(记者向炎涛)近日,云知声智能科技股份有限公司(以下简称"云知声")正式推出Unisound U1-OCR 文档智能基础大模型。作为首个工业级文档智能基座,该模型凭借"性能领先、可信可验、开箱即用、 高效部署、强适配"五大核心优势,打破传统文档处理边界,树立起行业新标杆。 据介绍,文档智能是指利用人工智能技术自动阅读和理解 ...