Workflow
英伟达新架构引爆全模态大模型革命,9B模型开源下载即破万
NvidiaNvidia(US:NVDA) 3 6 Ke·2025-11-07 10:48

【导读】OmniVinci是英伟达推出的全模态大模型,能精准解析视频和音频,尤其擅长视觉和听觉信号的时序对齐。它以90亿参数规模,性能超越同级别 甚至更高级别模型,训练数据效率是对手的6倍,大幅降低成本。在视频内容理解、语音转录、机器人导航等场景中,OmniVinci能提供高效支持,展现 出卓越的多模态应用能力。 今年以来,开源大模型战场硝烟弥漫。 各路人马在此全力投入,试图在AI的下一个时代抢占生态位。而一个无法被忽略的趋势是:中国大模型,正在强势统治开源基础模型的「名人堂」。 从DeepSeek在代码与数学推理上的惊人表现,到Qwen(通义千问)家族在多模态和通用能力上的全面开花,它们凭借卓越的性能和快速的迭代,早已成 为全球AI从业者无法绕过的参照物。 就在所有人都以为,这场基础模型开源浪潮将主要由顶尖的互联网巨头和明星创业公司推动时,一个「本该」在旁边「卖水」的巨头,也亲自下场「添 柴」了。 是的,作为AI浪潮最大的受益者——英伟达(NVIDIA)——并没有懈怠自研大模型。 无需更多铺垫,老黄的最新王牌正式登场:最强9B视频音频全模态大模型 OmniVinci,强势开源! 论文链接:https://a ...