腾讯研究院AI速递 20250827
一、 英伟达最新推出Jet-Nemotron小模型系列(2B/4B) 1. Jet-Nemotron是英伟达最新推出的小模型系列,由全华人团队打造,提出后神经架构搜索(PostNAS)与新型线性 注意力模块JetBlock; 2. 模型在数学、代码、常识、检索和长上下文等维度表现突出,性能超越Qwen3、Gemma3、Llama3.2等主流开源 全注意力语言模型; 3. 在H100 GPU上推理吞吐量最高提升53.6倍,长上下文场景下的优势特别明显,是英伟达在小模型领域的重要布 局。 https://mp.weixin.qq.com/s/8ZbWGnogg40sHknVBWHH1Q 二、 面壁多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B 生成式AI 1. 面壁小钢炮MiniCPM-V 4.5成为首个具备"高刷"视频理解能力的多模态模型,8B参数量却超越Qwen2.5-VL 72B 模型; 2. 该模型在MotionBench、FavorBench榜单达到同尺寸SOTA,最大可接收6倍视频帧数量,达到96倍视觉压缩 率; 3. 采用3D-Resampler高密度视频压缩、统一OCR和知识推理学 ...