云知声(09678)推出文档智能基础大模型“Unisound U1-OCR” 正式开启OCR 3.0时代
Prediction(MTP)技术,在预测当前Token时,同步考虑未来多个Token的概率分布,大幅提升长文档逻 辑连贯性。配合全任务强化学习策略,增强模型对版式结构的全局预见性并在推理阶段将模型生成效率 提升了80%以上。 业务层面,模型立足于工业级场景需求,打造了精准溯源、业务融合、安全高效部署、超强适配四大核 心能力,真正适配企业真实业务的全场景需求,实现从'读懂'到'执行'的业务落地。 智通财经APP获悉,2月26日,云知声(09678)宣布正式推出文档智能基础大模型"Unisound U1-OCR"。 作为首个工业级文档智能基座,该模型正式开启OCR 3.0时代,在理解版面的基础上,进一步洞察文档 深层语义,实现自动分类与业务级信息抽取,完成了从"字符感知"到"文档认知"的质的飞跃,标志着AI 从单纯"识字"跃迁至"理解业务逻辑"。 Unisound U1-OCR是一款达到国际顶尖水平(SOTA)的文档智能理解模型,在多项权威测试中均获业界 SOTA表现,其核心优势在于突破了传统模型"只读文字、不懂排版"的瓶颈,能够像人类专家一样"看 懂"复杂文档。 为适应 OCR 3.0 时代对于文档业务级结构 ...