多模态处理
Search documents
谷歌Gemini 3.0 Pro模型卡发布,多模态能力大幅领先竞争对手
Hua Er Jie Jian Wen· 2025-11-18 16:02
谷歌新一代大模型Gemini 3.0即将面世,官网首先正式发布了Gemini 3 Pro模型卡,展示这款大语言模型(LLM)在多模态处理、数学推理和长 文本理解等关键领域实现显著突破。 据官方披露的对比测试数据,Gemini 3 Pro在多项基准测试中大幅超越Gemini 2.5 Pro、GPT-5.1和Claude Sonnet 4.5等现有旗舰模型。 模型卡显示,Gemini 3 Pro采用稀疏混合专家架构,支持高达100万token的上下文窗口,并能输出64K token文本内容。该模型在图像理解的逻 辑推理测试中表现突出,在AIME 2025等高难度数学榜单的有代码执行场景下达到满分,显示其工具调用与数学推理的组合能力已达行业顶级 水准。 在专业应用测试中,加拿大劳瑞尔大学历史学教授Mark Humphries的实验表明,该模型在18世纪手写文稿识别方面字符错误率仅为0.56%,相 比前代产品提升50%-70%,达到专家级人类水平。这一突破性表现引发业界对AI推理能力质的飞跃的关注。 此次发布被视为谷歌在AI竞赛中的重要战略转折点。自ChatGPT发布后一度陷入"红色警报"的谷歌,有望通过Gemini ...
OpenAI,最新发布!
第一财经· 2025-04-15 00:06
OpenAI推出了三款GPT-4.1系列模型GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,该系列模型需要 通过API使用。GPT-4.1被视为GPT-4o的全面升级版,具备更强的多模态处理能力、更大的上下文 窗口(全部可处理100万个token),成本降低了26%。 ...