腾讯研究院AI速递 20250707
腾讯研究院·2025-07-06 14:05
生成式AI 一、 Grok 4逆天跑分泄露,「人类最后考试」豪取45%全场第一 ? 1. Grok 4在「人类最后考试」(HLE)测试中得分高达45%,远超Gemini 2.5 Pro和Claude 4 Opus, 引发 讨论 ; 2. 马斯克表示Grok 4以「第一性原理」构建推理机制,像物理学家那样思考,从基本公理层 面分析问题; 3. Grok 4将强化编码能力, 或 分为Grok 4和Grok 4 Code两个版本,预计在7月4日后随时 发布。 https://mp.weixin.qq.com/s/kuk8MfUW_wbS5RAOdV24ZA 二、 Gemini CLI 重磅更新:将 支持音视频处理,与 多项体验升级 1. Gemini CLI 发 布 更新支持音视频输入功能,显著扩展多模态交互能力 ; 实则 目前仅能 处理文本、图片和PDF文件; 2. 增强Markdown功能,新增表格渲染与文件导入功能,并集成VSCodium和Neovim编辑 器,提升开发体验; 3. 技术栈升级至Ink 6和React 19,添加新主题、隐私管理功能,并优化历史记录压缩算法, 提高性能和稳定性。 四、 开源De ...