从大模型叙事到“小模型时代”:2025年中国产业AI求解“真落地”
3 6 Ke·2025-09-03 10:19
小模型迅速蹿红背后,并非因为比大模型更先进,而是因为Agent作为AI落地的主要形态,正好需要小模型这种"刚刚好的智能"。 2025年2月,深圳福田区,部署70名"AI数智员工",承担了240个政务场景中的文书起草、政策解读、招商辅助等任务。系统上线后,公文格式修正准确率 超过95%,审核时间缩短90%,民情分拨效率从70%提升至95%。 支撑这70名AI数智员工的,是671B的DeepSeek‑R1。 DeepSeek以专家混合技术,根据任务自动激活部分网络,只运行需要的部分,从而显著降低推理资源占用,说白了就是用更少的算力解决了更复杂的问 题。 严格意义上来说,DeepSeek不算是小模型,但它的出现,让人们开始思考大语言模型的"大"真的有必要吗。 这,成为小模型叙事的起点。后面的几个月里,一些新的变化开始出现。 "2025年初,我们尝试接入云端大模型,性能虽然强,但调用延迟、成本与数据隐私问题都让人头疼。后来改用某大模型厂商4B模型,只用了几小时就部 署成功,响应秒级,隐私上也有保障。"某SaaS厂商负责人说道。 也是在2025年初,某家智能家居创业团队在开发一款可以脱网的语音设备时,曾苦恼于大语言模型 ...