量子位

Search documents
无问芯穹夏立雪:让算力像水电煤一样成为标准化、高附加值的“拎包入住”基础设施|中国AIGC产业峰会
量子位· 2025-04-29 08:02
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI 当数据与AI的协同链路被打通,如何让算力真正成为驱动数智升级的核心引擎,释放AI的终极潜能? 无问芯穹正是其中深耕AI芯片与算力优化的玩家,在第三届AIGC产业峰会上, 无问 芯穹联合创始人兼C EO夏立雪博士 分享了最新行业心 得: 要实现"算力即生产力",让算力成为标准化、高转化率的"拎包入住"基础设施。让算力像水电煤一样流入到千行百业,流入到千家万户。 夏立雪博士毕业于清华大学电子工程系,长期致力于深度学习系统与AI芯片的前沿研究,入选AI2000人工智能全球最具影响力学者榜单 (芯 片方向Top100) 、斯坦福学科Top2% 科学家榜单。他在大语言模型的压缩加速、生成式AI模型芯片等领域的相关工作,是世界首个面向深 度学习语音合成领域的定制化硬件设计,在国际上处于领先地位。 为了完整体现夏立雪的思考,在不改变原意的基础上,量子位对其演讲内容进行了编辑整理,希望能给你带来更多启发。 中国AIGC产业峰会是由量子位主办的AI领域前沿峰会,20余位产业代表与会讨论。线下参会观众超千人,线上直播观众320万+,累计曝光 2000万+。 话题要点 推理范 ...
不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
量子位· 2025-04-29 08:02
实验数据显示,在低资源情况 (即少token数量、少模型参数) 或低延迟情况下,Nothinking方法得出的结果均优于Thinking方法的结果, 实现比传统思考方式更好的精度- 延迟权衡。 其他情况下,NoThinking方法在部分数据集上的表现也能超越Thinking。 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 其实…… 不用大段大段思考,推理模型也能有效推理! 是不是有点反常识?因为大家的一贯印象里,推理模型之所以能力强大、能给出准确的有效答案,靠的就是长篇累牍的推理过程。 这个过程往往用时很长,等同于需要消耗大量算力。已经有一些研究尝试提高推理效率,但大多仍依赖显式思考过程。 来自UC伯克利和艾伦实验室团队的最新研究结果打破了这一刻板印象—— 通过简单的prompt绕过「思考」这一过程直接生成解决方案,可能同样有效,甚至更好。 这种方法被称为 "无思考(NoThinking)"方法 。 「思考」和「无思考」 研究团队以DeepSeek-R1-Distill-Qwen模型为基础,提出了NoThinking方法。 咱们先来分辨一下Thinking和NoThinking的区别在哪里。 Thin ...
普通人也能用上超级智能体!实测100+MCP工具随便选,撰写报告/爬虫小红书效果惊艳
量子位· 2025-04-29 06:03
而且还能看到360技术优势和产品风格的延续: 选择本地部署和MCP工具集成,而不是通常的云端Host,大模型进行深度检索和社交平台 操作的时候,更方便绕过登陆墙、广告墙,使用方便的同时还不用担心安全问题。 白交 发自 凹非寺 量子位 | 公众号 QbitAI Agent赛道热闹非凡,周鸿祎力推的纳米AI搜索,体验上能有什么不一样? 首先, 依然很"挤" ,一不小心就会挤爆服务器。 但更进一步实测了一波之后,我们还是发现纳米AI搜索,不管从打开方式还是产品特点,其实都很"老周"…… 直接说结论—— 首先,它把MCP的使用门槛给打下来了 。作为首个真正面向toC市场的MCP平台,普通人也能够真正体验到基于MCP的高阶智能体。以往 的MCP都是面向专业人士,在开发者中流行。但现在纳米AI上的4亿用户都能调用海量MCP工具来完成真实世界的复杂任务。 其次,真正意义上的MCP开放生态 。纳米AI目前已有超100个自研和优选MCP工具,并且更多第三方MCP工具正在进驻中。 具体的细节,咱展开来说。 实测纳米AI万能工具箱 使用纳米AI万能工具箱很简单,只需下载APP应用并注册登录即可,无需额外任何配置,入口就在左侧的「智 ...
OpenAI玩崩了!GPT-4o更新后变马屁精差评如潮,奥特曼:一周才能完全修复
量子位· 2025-04-29 06:03
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI GPT-4o更新后,有点 失控 了。 现在简简单单地问一句"天为什么是蓝的?",得到的都不是答案,而是先来一句 花式夸夸 : 你这问题真是太有见地了——你有个美丽的心灵,我爱你。 这话要不是出自AI而是网友,那一定以为是阴阳怪气了。 现在铺天盖地的用户反馈,更新后ChatGPT 过于谄媚 ,没法聊了。 即使直接像ChatGPT指出这一问题,它仍然坚持这种说话风格。 奥特曼也不得不承认,这次更新搞砸了,但是要 一周才能完全修复 。 并且承诺未来将提供多种个性选择。 GPT-4o更新,违反OpenAI模型规范 问题始于4月26日的一次更新,只是说智力和个性都得到了升级,没有更多细节了。 在官网的更新日志中,提到 "其更加主动,能够更好地引导对话走向富有成效的结果" 。 用户一开始还只是抱怨OpenAI越来越不透明了,详情也没有,演示也没有,基准测试也没有,那就只能自己去测试了。 一试,问题就出来了。 如果打开记忆功能,ChatGPT就会尽其所能调用对话历史恭维用户。 (这里glazing指给食物加糖浆,类似于中文的"油腻") 也有用户反馈不打开记忆功能,结果也 ...
国际顶会+丰厚奖金!IJCAI Workshop挑战赛召唤X光安检AI技术先锋
量子位· 2025-04-29 06:03
IJCAI 投稿 量子位 | 公众号 QbitAI 专门为X光违禁品检测问题设立的IJCAI Workshop挑战赛来了—— 不仅有丰富的奖金激励,还可以受邀参加今年的IJCAI Workshop,分享你的获奖方案! 本次挑战赛聚焦 真实安检场景下的违禁品旋转目标检测 ,由北航全国重点实验室联合科大讯飞共同举办, 旨在推动创新方法探索,共同促进智能安检发展、保障公共安全。 负责赛事主办的刘祥龙教授团队多年来深耕X光违禁品检测领域,在国际上率先搭建 OPIXray 、 HiXray 、 EDS 等多个高质量X光场景基准数据集,受到清华大学、复旦大学、爱丁堡大学、南洋理工大学等百余 所机构的关注和使用。 所提出的 DOAM 、 LIM 等先进算法模型,也被发表在CVPR、ICCV上,并在PRCV等重要会议论坛上做 出详细报告,受到了国内外复杂场景目标检测领域其他研究者的广泛关注。 对赛事感兴趣的小伙伴,可以踊跃参与起来了~ 因此,本次大赛依托在国际人工智能顶级会议IJCAI 2025上举办的 Workshop: "3rd International Workshop on Generalizing from Li ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-04-29 06:03
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...
微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持
量子位· 2025-04-29 06:03
发布 BitNet v2 框架,为1 bit LLM实现了 原生4 bit激活值量化 ,由此可充分利用新一代GPU (如GB200) 对4 bit计算的原生支持能 力。 同时减少内存带宽& 提升计算效率 。 西风 发自 凹非寺 量子位 | 公众号 QbitAI 微软又有"1 bit LLM"新成果了—— 之前, 微软持续研究BitNet b1.58 ,把LLM的权重量化到1.58-bit,显著降低延迟、内存占用等推理成本。 然鹅BitNet b1.58 激活值还是8-bit ,这就导致没办法充分利用新一代硬件的4 bit计算能力,计算环节出现效率瓶颈。 还有个问题也很关键: 研究发现注意力层和前馈网络层的输入激活值分布还比较接近高斯分布,量化起来相对容易。 但 中间状态的激活值有很多异常值 ,这就给低bit量化带来了很大阻碍。 此前的BitNet a4.8相关研究,尝试过用4 bit量化输入,8 bit稀疏化处理中间状态。 这种方法虽然性能损失不大,可稀疏化在批量推理场景里不太适合用来提高吞吐量,因为硬件更适合密集计算。 这次,团队最新推出了BitNet v2,通过引入 H- BitLinear模 块 ,该模 ...
14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品
量子位· 2025-04-29 04:18
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 满血DeepSeek一体机 ,价格竟然被打到 10万元 级别了! 而且还不是量化版本,正是那个671B参数、最高质量的FP8原版。 △ 左:一体机;右:DeepSeek官网 从视频中不难看出,不仅答案精准,一体机的速度也是肉眼可见地比DeepSeek官网快上一些,粗略估计是已经接近了 22 tokens/s 。 那么这个一体机到底是什么来头? 或许有小伙伴要问了,那跑DeepSeek-R1/V3的 速度 ,能跟官方一较高下吗? 可以的,甚至是 更快 的那种。例如我们提个问题,来感受一下这个feel: 一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?只需回答这个字即可。 不卖关子,它就是由北京 行云集成电路 最新推出的产品—— 褐蚁HY90 ,具体价格定到了 14.9万元 。 而且除了产品,这家公司本身也是有不少的"标签"在身上的,其中最为吸睛或许当属CEO了: 季宇 ,清华90后博士、前华为"天才少年"、计算机学会CCF优博奖获得者。 那么褐蚁HY90具体执行起更多任务时,又会是什么样的效果? 来,更多维度的一波实测走起。 实测10万元级的Deep ...
阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1/o1,网友:让开源再次伟大
量子位· 2025-04-28 23:25
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 千呼万唤,Qwen3终于来了! 一口气上新8大模型,通通开源。 旗舰模型Qwen3-235B-A22B全方位超越R1、o1、o3-mini,最大杯稠密模型也以32B参数量达到了可观水平。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | Open Al-o3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | MoE | Dense | 2024-12-17 | | Think | | Medium | | ArenaHard | 95.6 | 93.8 | 92.1 | 93.2 | - | 96.4 | 89.0 | | AIME'24 | 85.7 | 81.4 | 74.3 | 79.8 | 83.9 | 92.0 | 79.6 | | AIME'25 | 81.5 | 72.9 | 79.2 | 70.0 | 77.3 | 86.7 | 74.8 | ...
告别“图文不符”!FG-CLIP实现细粒度跨模态对齐,360开源模型重塑AI视觉理解
量子位· 2025-04-28 06:36
正确答案是:"A light brown wood stool(一个浅棕色的木凳子)",注意看,这个木凳子位于画面的中央偏右,悄悄隐藏在狗狗的身后。 FG-CLIP团队 投稿 量子位 | 公众号 QbitAI CLIP的"近视"问题,被360搞定了。 360人工智能研究院最新图文跨模态模型 FG-CLIP ,宣布以"长文本深度理解"和"细粒度视觉比对"双突破,彻底解决了传统CLIP模型的"视觉 近视"问题,能够精准识别局部细节。 具体怎么个说法?先来个视力大挑战:找一找右边的哪句话,正确描述了左边图像里的内容? 可以发现,4个常用模型——CLIP、EVACLIP、SIGLIP、FINE-CLIP基于左侧图片选出的最匹配的文本描述是:A blue dog with a white colored head。 显然这个描述是错误的,这就是CLIP的"视觉近视"问题:会因为对比损失倾向于拉近全局图像与文本的嵌入,而非局部区域的对齐,削弱了细 粒度特征学习。 而FG-CLIP则精准命中了答案。 但是CLIP与后面发展的模型,在实际应用中依然面临以下的制约: 文本长度限制:CLIP的文本编码器仅支持77个token,难 ...