那些超出想象的AI Agent
3 6 Ke·2025-07-15 11:41
"公元5世纪中期,一位不知名的基督教诗人离世,而这一年恰好是某古代环境重建年表的截止年份。这个科学年表叫什么名字?" 面对如此冷门的问题,恐怕连最资深的学者都会陷入沉思。既不知道诗人姓名,又不清楚年表名称,传统搜索引擎在这里完全失灵,两 个看似毫不相关的信息点就像大海中的两粒沙子,让人无从下手。 尽管最初效果不如人意,智能体的进化速度却很快。如今,在营销、医疗等专业领域,Agent的表现甚至已超过人类水平。 就是这样让人一头雾水的难题,一款名叫WebSailor的智能体却能通过交叉验证快速锁定正确答案:诗人是 Synesius of Cyrene、科学年 表"PAGES 2k"、时间414年。 这不禁让人震惊:什么时候AI已经进化到如此程度? 要知道,就在半年前,Agent还被普遍认为是玩具属性大于工具属性。大部分产品内测名额一票难求,实际表现却频频翻车。 今天,我们一起来扒一扒上半年有哪些智能体,已经超出了我们以往的想象。 10分钟答对一套世锦赛难题 面对世锦赛级别的金融建模题,即便是经验丰富的分析师,往往也需要数小时推演验证。但如果现在告诉你,有人能在10分钟内给出准 确答案,你相信吗? 这样复杂的任务, ...