Workflow
通算融合
icon
Search documents
百度Qianfan-VL开源,纯国产自研昆仑芯跑出世界一流
Xuan Gu Bao· 2025-09-25 00:14
百度把他们全新的视觉理解模型Qianfan-VL直接开源了。 Qianfan-VL系列一共有三个版本,3B、8B和70B,参数量从小到大,分别对应不同的应用场景。 | 模型名称 | 上下文长度 | 支持思考 | 适用场景 | | --- | --- | --- | --- | | Qianfan-VL-3B | 32k | 不支持 | 端上实时场景、OCR文字识别 | | Qianfan-VL-8B | 32k | 支持 | 服务端通用场景、微调优化场景 | | Qianfan-VL-70B | 32k | 支持 | 离线数据合成、复杂推理计算场景 | 模型从头到尾,都是在百度自己家的芯片昆仑芯P800上训练出来的。 模型的性能和应用 Qianfan-VL是一个多模态大模型,就是那种既能看懂图片又能理解文字的AI。一张复杂的图表,它能分析出里面的数据和趋势。 它最核心的两个本领是OCR(光学字符识别)和教育场景的深度优化。 你拍一张身份证,系统自动把你的姓名、证件号填好,这就是OCR。Qianfan-VL把这项能力做到了全场景覆盖,不管是印刷体、手写字,还是藏 在街边招牌、商品包装袋上的艺术字,甚至是数学卷子 ...