Gemini 3负责人最新访谈:不做情感陪伴,只做最强生产力工具
此次最具突破性的升级出现在视觉智能领域。Gemini 3 Pro在一项专门针对屏幕理解和UI交互的ScreenSpot-Pro 测试中,取得了72.7%的高分,几乎是 GPT-5.1性能的20倍。这意味着AI Agent能够区分按钮、菜单、文本和上下文,而不仅仅是识别图像中的物体,为AI Agent实现更高级的自动化操作电脑 提供了基础,大幅提升了模型作为数字工作代理的实用性。 | Benchmark | Description | | Gemini 3 Pro | Gemini 2.5 Pro | Claude Sonnet 4.5 | GPT-5.1 | | --- | --- | --- | --- | --- | --- | --- | | Humanity's Last Exam | Academic reasoning | No tools With search and | 37.5% | 21.6% | 13.7% | 26.5% | | | | code execution | 45.8% | - | - | - | | ARC-AGI-2 | Visual reasoning puzzle ...