Workflow
蒸馏技术
icon
Search documents
暗蓝评《雅各布之书》|照亮历史,然后治愈世人
Xin Lang Cai Jing· 2025-06-23 03:42
《雅各布之书》,[波兰]奥尔加·托卡尔丘克著,乌兰、李江颐、李佳译,浙江文艺出版社,2024年11月出版,1038页,168.00元 在发表于1961年的短篇小说《加略人犹大的故事》中,陈映真对人们耳熟能详的《圣经》典故进行了创造性改写。在他笔下,犹大成了一位颇有 远见的革命者(日后陈映真表示,他曾想把犹大写成一个"一个改造者,一个解放的人",只是怕父亲看到难过才作罢,见吴舒洁,《左翼的信仰 之难──读陈映真〈加略人犹大的故事〉》,《中国现代文学》2015年第十二期,31-48页),早在耶稣到来之前便意识到犹太复国主义即便成功也 是枉然,"罗马人的担子,罗马人的轭一旦除去又如何呢?因你们将代替他们成为全以色列人的担子和轭。……你们一心想除去那逼迫你们的,为 的是想夺回权柄好去逼迫自己的百姓吗?"(陈映真:《将军族》,九州出版社,2020年,96页)于是即便等到耶稣果真到来,犹大依然保持着警 惕,哪怕见识了他的魅力也极力克制仰慕之情。而他最终也的确发现了耶稣的"破绽",那便是当耶稣不顾危险进入耶路撒冷,立即受到了以色列 人的热烈欢迎,然而耶稣并未就此"揭竿而起",反而任由圣城在热闹过后复归沉寂。"自从那次荣耀的 ...
Meta、微软掌门人最新对谈:AI浪潮带来软件开发革命
Hu Xiu· 2025-05-07 07:45
4月30日,Meta CEO Mark Zuckerberg 和微软CEO Satya Nadella在LlamaCon 2025 闭幕会议上进行了一场 精彩对话。 本次对话从历史视角切入,将 AI 定位为继客户端服务器、互联网与云之后的又一次重大技术平台革 命,并剖析了其驱动下的效率飞跃与成本优化趋势。对话深入讨论了微软在开源与闭源模型间的战略平 衡、Azure 云平台在赋能开发者构建 AI 应用中的核心作用,以及 AI Agent 在重塑软件开发和知识工作 流程方面的潜力。此外,双方还探讨了 AI 驱动下的未来工具形态、模型蒸馏技术的机遇与挑战等话 题。 以下是本次对话实录,经数字开物团队编译整理。 一、AI浪潮带来新一轮技术平台革命 Mark Zuckerberg:非常荣幸能邀请到 Satya。你引领 Microsoft 这家伟大的科技公司实现了惊人转型, 推动公司向 AI、云等重要领域发展。对于我们所做的开源工作,你一直是我们的朋友和盟友。我非常 珍视我们长期的伙伴关系,也感谢你就 Llama 生态系统及基础设施建设给予的建议。 Satya Nadella:谢谢你,Mark。我的荣幸。我还记得大约 2 ...
两位大模型从业者群友如何评价小米MiMo大模型?
理想TOP2· 2025-04-30 13:04
群友AB均为大模型从业者,其中群友B为重度米粉+小米股票持有者。 群友A: 小米这个大模型看起来是专门刷数学和代码的榜,其他能力会退化,和真实用户需求匹配度不高。 | Benchmark | # Shots | Llama-3.1 | Gemma-2 | Qwen2.5 | MiMo- | | --- | --- | --- | --- | --- | --- | | | | 8B Base | 9B Base | 7B Base | 7B Base | | General | | | | | | | BBH (EM) | 3-shot | 64.2 | 69.4 | 70.4 | 75.2 | | GPQA-Diamond (EM) | 5-shot | 33.3 | 24.2 | 35.4 | 25.8 | | SuperGPQA (EM) | 5-shot | 19.9* | 22.6* | 24.6* | 25.1 | | DROP (F1) | 3-shot | 59.5 | 67.9* | 61.5* | 69.2 | | MMLU (EM) | 5-shot | 65.3 | 71.2 | 74 ...
速递|Pruna AI开源模型压缩"工具箱",已完成种子轮融资650万美元
Z Potentials· 2025-03-21 03:22
图片来源: Pruna AI 欧洲初创公司 Pruna AI 一直在研究 AI 模型的压缩算法,该公司的优化框架将于周四开源。 Pruna AI 在几个月前完成了 650 万美元的种子轮融资。参与此次初创公司投资的包括 EQT Ventures 、 Daphni 、 Motier Ventures 以及 Kima Ventures 。 Pruna AI 一直在构建一个框架,该框架将多种效率方法应用于给定的 AI 模型,如缓存、蒸馏等。 "我们还标准化了压缩模型的保存和加载,应用这些压缩 方法的组合,并在压缩后评估你的压缩模型," Pruna AI 联合创始人兼 CTO John Rachwan 告诉 TechCrunch 。 Pruna AI 的框架能够评估模型压缩后,是否存在显著的质量损失,以及所获得的性能提升。 "如果要用一个比喻,我们类似于 Hugging Face 如何标准化 transformers 和 diffusers ——如何调用它们,如何保存、加载它们等。我们正在做同样的事 情,但针对的是效率方法,"他补充道。 大型 AI 实验室已经在使用各种压缩方法。 例如, OpenAI 一直依赖蒸馏技 ...