Workflow
Shortcut
icon
Search documents
腾讯研究院AI速递 20250707
腾讯研究院· 2025-07-06 14:05
生成式AI 一、 Grok 4逆天跑分泄露,「人类最后考试」豪取45%全场第一 ? 1. Grok 4在「人类最后考试」(HLE)测试中得分高达45%,远超Gemini 2.5 Pro和Claude 4 Opus, 引发 讨论 ; 2. 马斯克表示Grok 4以「第一性原理」构建推理机制,像物理学家那样思考,从基本公理层 面分析问题; 3. Grok 4将强化编码能力, 或 分为Grok 4和Grok 4 Code两个版本,预计在7月4日后随时 发布。 https://mp.weixin.qq.com/s/kuk8MfUW_wbS5RAOdV24ZA 二、 Gemini CLI 重磅更新:将 支持音视频处理,与 多项体验升级 1. Gemini CLI 发 布 更新支持音视频输入功能,显著扩展多模态交互能力 ; 实则 目前仅能 处理文本、图片和PDF文件; 2. 增强Markdown功能,新增表格渲染与文件导入功能,并集成VSCodium和Neovim编辑 器,提升开发体验; 3. 技术栈升级至Ink 6和React 19,添加新主题、隐私管理功能,并优化历史记录压缩算法, 提高性能和稳定性。 四、 开源De ...
10分钟搞定Excel世锦赛难题!首个超越人类Excel Agent,网友:想给它磕一个
机器之心· 2025-07-04 02:36
机器之心报道 编辑:杨文 这个AI让打工人「磕头」致谢。 前段时间,我们报道了 5 款大模型参加了今年山东高考 的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩 溃。要是哪个 AI 能一键分析表格,我当场就能给它磕一个。 现在,终于有 AI 来整顿 Excel 表格了! 这款 AI 工具名为 Shortcut,号称是「第一个超越人类的 Excel Agent」。它能够一次性完成大多数 Excel 知识工作任务,甚至在大约 10 分钟内就解决了 Excel 世界 锦标赛的复杂案例,准确率超过 80%,这比人类快 10 倍。 (冷知识: Excel 世界锦标赛( MEWC )是由金融建模世界杯( FMWC )团队组织、微软官方支持的全球性电子竞技赛事,参赛者需通过 Excel 解决复杂场景化题目, 2024 年决赛以《魔兽世界》为模拟场 景,冠军奖金 5000 美元。) Shortcut 目前处于早期预览阶段,大家可以在 X 上评论以获取邀请码。 Shortcut 具有与 Excel 近乎完美的功能兼容性,可以直接编辑、导入和导出文件,它不仅限于基础 Excel 操 ...
AI生成快捷指令,苹果AI最有用的一集来了,然并卵?
3 6 Ke· 2025-06-06 04:22
彭博社记者 Mark Gurman 在稍早前的一次报道中就披露,苹果计划在 WWDC 2025 上宣布为「快捷指令(Shortcuts)」引入 Apple Intelligence 实现 AI 生成 快捷指令,用户只需用一句自然语言,就能自动生成包含复杂自动化流程的快捷指令。 图/苹果 这意味着,不再需要拖拉模块、配置变量、苦读社区教程,手机可以直接听懂你的「意图」,并转化为系统级的执行链路和快捷指令。 一年一度的 WWDC 大会,即将拉开序幕。 按照苹果的时间表,WWDC 2025 首场主题演讲将于北京时间 6 月 10 日凌晨 1 点开始。根据多方爆料的信息,今年 WWDC 苹果在系统层面的一大重点是 视觉设计大改,从 iOS 到 watchOS 在向 VisionOS 的风格迭代,同时话题当然也离不开 AI。 没错,尽管 Apple Intelligence 去年发布以来跳票不断,至今都没能完整上线,甚至已经被用户集体上诉,但在 AI 这件事,苹果终究还是要继续踏步向前。 相比 AI 智能体完全替代人类操作手机,这或许不够性感,但在今天的技术条件下更容易落地,也可能与智能体相互配合,实现真正的 AI 工 ...
下周的WWDC,苹果AI依旧不会有“惊喜”
硬AI· 2025-06-03 15:26
图 点击 上方 硬AI 关注我们 万众期待的年度开发者大会或未能展示苹果在AI领域的追赶决心,反而还可能凸显其短板。分析指出,苹果核心AI功能 (如新版Siri)持续跳票,其发布内容多为品牌包装,重磅技术仅开放30亿参数小模型给开发者,远逊于竞争对手。 作者 | 龙 玥 编辑 | 硬 AI 这并不是说苹果最近在人工智能方面没有取得进展。在内部,它拥有各种复杂程度的模型。目前,拥有30 亿、70亿、330亿和1500亿个参数的版本正在积极使用中。这个1500亿参数的模型依赖云计算,比苹果的 设备端技术强大得多,能进行更为微妙的推理。 硬·AI 内部基准测试表明,该模型的质量接近近期推出的ChatGPT。但由于担心幻觉以及公司高管之间的理念差 异,该公司暂缓使用该技术来推出自己的聊天机器人。 不过,目前尚无公开发布的计划。 02 在科技巨头们激烈争夺AI领导权的战场上,苹果正陷入一场尴尬的延迟游戏。下周一(6月9日)开幕的苹 果全球开发者大会(WWDC)或将不会扭转这一局面。 据彭博最新报道, 苹果公司内部人士对此次大会AI展示部分已做好"令人失望"的心理准备,外界观察人士 则担忧此次发布会可能会让苹果在AI领域 ...