AI应用产业化的开端:OpenAI十二日发布会深度总结
德邦证券·2024-12-25 06:23
目前,全新桌面版ChatGPT将超越单纯的问答,能够通过与30多种应用协作来辅助提升用户的写作和编程能力。 我们认为,ChatGPT桌面版更新,相当于给Mac装上最强大脑,意味着ChatGPT现在能够代表用户执行更多任务,为用户带来前所未有的便捷体验。 Day12:o3和o3 mini王炸来袭,AGI渐行渐近 ■ AIME:96.7% -- 意味着在数学测试中只错1道题。 资料来源:OpenAI官网,腾讯科技微信公众号,德邦研究所 o3系列模型迈向AGI,基准测试结果惊人。o3在编码、数学以及 ARC-AGI 基准测试等多个基准上超过了 OpenAI 此前的 o1 模型(o1得分25%,o3得分87.5%)。 博士水平的科学问题(GPQA):87.7%——博士生一般得分70%; 资料来源:OpenAI官网,腾讯科技微信公众号,德邦研究所 ■ 在数学能力测试中,o3mini模型在2024年数据集上表现出 色。o3mini低模型的性能与o1mini相当,而o3mini中位数 模型则取得了比o1更好的性能。在处理诸如GPQA等困难数 据集时,o3Mini模型也能展现出一定的优势,实现了接近即 时响应的效果。 23. ...