Gemini 2.5 Pro Preview

Search documents
DeepSeek新版R1模型实际性能如何?第三方评测来了
Nan Fang Du Shi Bao· 2025-06-05 12:26
DeepSeek还指出,相较于旧版 R1,新版模型在复杂推理任务中的表现有了显著提升。例如在衡量数学 推理能力的AIME 2025测试中,新版模型准确率由旧版的 70% 提升至 87.5%。 此前,DeepSeek更新R1模型时提到,新版R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型 在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45%-50%左右,能够有效地提供更为准确、 可靠的结果。 SuperCLUE的测评结果显示,新版R1模型在榜单上超过o3,居于第四位,总分63.55,比旧版R1提升 1.61分。相比之下,o4-mini(high)在被测模型中得分最高,为70.51分;Gemini 2.5 Pro preview 05-06为 66.48分,居第二。 5月29日,DeepSeek(深度求索)时隔四个月发布R1模型的升级版本。中文大模型权威测评机构 SuperCLUE于6月4日发布的结果显示,新版R1模型的总体表现比旧版有所提升,超过OpenAI的o3模 型,但相比于o4-mini(high)、谷歌Gemini 2.5 Pro Preview 05-06等模型仍有一定差距。 此外,R ...
微软发完谷歌发,AI编程这个月“热爆了”
Di Yi Cai Jing· 2025-05-21 09:23
2025年以来,Agent(智能体)成为海内外大厂高频提及的关键词,Agent行业中,AI编程智能体成为重点投入的方向。OpenAI、 微软、谷歌I/O大会都有相关发布。 一位投资人对记者表示,大模型能力的整体提升和AI编程的市场需求明确存在,因此拉动编程领域率先找到PMF(Product- Market Fit,产品与市场契合度)。 除了大厂,Cursor、Windsurf、Poolside 、Magic、Lovable、Bolt.new等创业公司AI编程项目近期也被二级市场密集提及。市场需 求、技术竞争、行业趋势和商业价值等多方面因素,共同推动AI编程率先在大模型时代冲出来。 海内外AI编程新品扎堆 "这一切,才刚刚开始。"微软CEO纳德拉在大会上披露,GitHub已拥有超过1.5亿开发者,GitHub Copilot用户数也突破了1500 万,Visual Studio(微软开发的一款集成开发环境IDE)系列产品用户也超过1500万。 此次,纳德拉宣布GitHub Copilot迈入"智能体时代",不再是一个代码补全工具,而是一个可以独立执行开发任务的"智能编程伙 伴"。开发者可以将完整任务分配给Cop ...
梁文锋倒逼OpenAI重新Open
投中网· 2025-05-13 06:29
以下文章来源于中国企业家杂志 ,作者孙欣 中国企业家杂志 . 讲好企业家故事,弘扬企业家精神 将投中网设为"星标⭐",第一时间收获最新推送 OpenAI正在从技术先锋转变为跟随者。 作者丨 《中国企业家》记者 孙欣 编辑丨 张晓迪 来源丨 中国企业家杂志 DeepSeek爆火不到4个月,山姆·阿尔特曼找回了自己的"理想主义"。 5月6日凌晨2:04分,OpenAI宣布放弃将公司完全转为营利性机构的计划,决定让非营利组织控制公 司。同时,OpenAI取消了对投资者设置的财务回报上限。此外,CEO山姆·阿尔特曼(Sam Altman,以下简称阿尔特曼)还发布了一封全员信,强调未来OpenAI要成为"历史上规模最大、效 果最佳的非营利组织"。 对此,利益最大相关方——微软的态度至关重要。据彭博报道,在OpenAI尝试重组之际,已为其注 资137.5亿美元的微软是投资者中最大的反对者。而这似乎并不能阻挡阿尔特曼的决心,OpenAI方 表示仍继续保持与微软的密切合作。 显然,从公司架构到控制股东,OpenAI都在透露着一个关键信息:回归初心——非营利。 "完全没想过会变成一家公司,计划就是发表研究论文。"阿尔特曼曾回忆 ...
全球AI周报:多个海外AI应用公司财报超预期,阿里提出未来所有业务以AI为驱动
Tianfeng Securities· 2025-05-13 05:45
证券研究报告 2025年05月13日 海外行业报告:行业动态研究 多个海外AI应用公司财报超预期,阿里提出未来所有业务以 AI 为驱动 作者: 分析师 孔蓉 SAC执业证书编号:S1110521020002 分析师 李泽宇 SAC执业证书编号:S1110520110002 分析师 樊程安吉 SAC执业证书编号:S1110524080001 请务必阅读正文之后的信息披露和免责申明 1 全球AI周报 摘要 ◼ 海外科技公司财报AI进展 ◼ 投资建议: 风险提示:宏观经济不及预期;企业盈利不及预期;通胀上行压力。 请务必阅读正文之后的信息披露和免责申明 2 ➢ Palantir:一季度,Palantir表现亮眼,营收达8.84亿美元。AI驱动下,客户指标向好,美国商业总合同价值(TCV)达8.1亿美元,创历史新高,同比+183%,过去 12 个月累计超 20 亿美元;客户数量同比增长39%,环比增长8%,达到769家。前20 大客户的过去12个月平均营收同比增长26%,达到每位客户7,000万美元 。 ➢ AppLovin:一季度,AppLovin营收净利润超预期。Q1收入14.8亿美元,同比增40%,高于预期的1 ...
全球AI周报:多个海外AI应用公司财报超预期,阿里提出未来所有业务以AI为驱动-20250513
Tianfeng Securities· 2025-05-13 05:18
证券研究报告 2025年05月13日 海外行业报告:行业动态研究 多个海外AI应用公司财报超预期,阿里提出未来所有业务以 AI 为驱动 作者: 分析师 孔蓉 SAC执业证书编号:S1110521020002 分析师 李泽宇 SAC执业证书编号:S1110520110002 分析师 樊程安吉 SAC执业证书编号:S1110524080001 风险提示:宏观经济不及预期;企业盈利不及预期;通胀上行压力。 请务必阅读正文之后的信息披露和免责申明 2 ➢ Palantir:一季度,Palantir表现亮眼,营收达8.84亿美元。AI驱动下,客户指标向好,美国商业总合同价值(TCV)达8.1亿美元,创历史新高,同比+183%,过去 12 个月累计超 20 亿美元;客户数量同比增长39%,环比增长8%,达到769家。前20 大客户的过去12个月平均营收同比增长26%,达到每位客户7,000万美元 。 ➢ AppLovin:一季度,AppLovin营收净利润超预期。Q1收入14.8亿美元,同比增40%,高于预期的13.8亿美元。净利润5.76亿美元,去年同期为2.36亿美元,净利润率达39%,AI驱动技术的持续改进,App ...
快讯|联想首位人形机器人“硅基员工”正式亮相;OpenAI被曝削减微软收入分成;谷歌推出Gemini2.5Pro Preview
机器人大讲堂· 2025-05-09 12:53
3、 INBRAIN Neuroelectronics获400万欧元资助 近日,临床阶段神经技术公司INBRAIN Neuroelectronics宣布,获西班牙工业和旅游部"PERTE芯片"计划 400万欧元资助。据了解,INBRAIN Neuroelectronics致力于开发基于石墨烯的脑机接口技术,可实时解 码与调节脑活动。其技术平台能为帕金森病、中风康复等提供精准神经调节方案。公司首席执行官称,此 资助将加速精准神经技术开发,变革神经系统疾病治疗。加泰罗尼亚商业与劳工部长也表示,INBRAIN Neuroelectronics代表前沿创新力量,巩固了相关领域领导地位。目前,INBRAIN的BCI - Tx平台已获FD A突破性医疗器械认证,正与合作伙伴拓展技术应用。 4、 OpenAI被曝削减微软收入分成 1、 谷歌推出 Gemini 2.5 Pro Preview(I/O 版) 近日,谷歌推出旗舰产品 Gemini 2.5 Pro AI 模型的升级版 Gemini 2.5 Pro Preview(I/O 版)。谷歌称该 模型在多项主流基准测试中表现优异。用户可通过 Gemini API 及谷歌的 ...