百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
量子位·2025-07-27 09:01
AI的下一个战场,不在云端,而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机,端侧AI已然成为兵家必争之地。 背后的逻辑清晰而坚定:最懂你的AI,必须能安全地访问你的个人数据——邮件、照片、日程,而这一切的前提,就是 将计算留在本地,将 隐私还给用户 。 然而,想让AI在本地流畅运行,远比想象的要难得多。最好的证据,莫过于财力雄厚、软硬一体的苹果,其雄心勃勃的Apple Intelligence计 划也未能如期而至,核心AI功能不得不推迟到明年。 这无疑向整个行业释放了一个清晰的信号: 端侧AI,是一块难啃的硬骨头 。 正当全球科技巨头在端侧AI的道路上艰难探索时,一股产学研深度融合的新兴力量,给出了独有的解决路线。 今天, 上海交通大学IPADS研究所、上海交通大学人工智能学院 联合初创公司 本智激活 (Zenergize AI) ,在HuggingFace开源了 端侧 原生大模型SmallThinker 。 该系列模型采用 为端侧算力、内存、存储特性而原生设计的模型架构,并从零开始预训练 ,具体包含两个尺寸的稀疏模型,分别是 SmallThinker-4B- ...