Workflow
谷歌Gemini3和NanoBananaPro亮点解析
Guotou Securities·2025-11-23 12:04

1)强大的推理能力,在部分领域达到博士级推理水平。Gemini 3 在 Humanity's Last Exam(HLE)中获取37.5%的分数(无工具),而GPT-5.1 仅有 26.5%,若加上搜索和编程工具,这一分数进一步提升到 45.8%。 HLE 包含 2500 道多学科题目,覆盖 100 多个专业领域,约 14%的题目 具有图文多模态特征。HLE 是目前最具挑战性且最严谨的 LLM 封闭式 能力测试之一。此外,Gemini 3 在 MathArena Apex 上达到了 23.4% 的水平,而 GPT-5.1 仅有 1.0%的分数。MathArena 团队会使用美国数 学奥数竞赛等题目定期对大模型进行测评,对数学能力是典型代表。 2)输入和输出的多模态,从学习、创造到规划,满足用户多种需求。 Gemini 3 致力于无缝整合多模态的信息,包括文本、图像、视频、 音频和代码等,结合先进的推理、视觉和空间理解能力,领先的多语 言性能和百万级 token 上下文窗口,进一步拓展了多模态推理的边 界。在对屏幕理解的 ScreenSpot-Pro 测试中,取得 72.7%的分数, 而 GPT-5.1 的得分 ...