Workflow
Kimi1.5
icon
Search documents
我让10个大模型又参加了完整版数学高考,第一名居然是它。。。
数字生命卡兹克· 2025-06-09 21:20
昨天,我不是发了几个大模型参加数学高考的测试文章嘛。 没想到热度挺高,大家还挺关注的。 不过,很多评论区的小伙伴也说,根本看不出来区别。 因为缺了对AI难度最高的单选第6题,还有后面那些解答题。 那我想,不如再把模型补上,加上全缺失的智谱Z1、Kimi1.5、文心X1,(不带Claude 4,封号斗罗,我恨他),再做一个,完整的满血版的数学高考, 让大家最直观的,感受一下这些模型的数学能力水平。 让大家看看,满分150分,每个模型到底多少分,哪个模型能拿高考数学状元。 因为要做解答题了,和选则填空不太一样,所以我还是单独定了一下规则,规则如下: 1. 数学大题往往都有两到三个小问,但是每个小问具体的赋分都不太一样,邀请了朋友(高中老师)来估摸一下每个小问的分数,如下,都取后者: 2. 高考大题往往会按照步骤给分,但是主要我也看不懂步骤(勿喷),所以这里我们不妨对大模型严格一点,按照结果是否正确来给分。 3. 每道题任然使用大模型跑3次,根据正确比例给分。 4. 依然所有的文本题,都 使用LaTeX编辑器转成LaTeX文本格式,再扔给大模型进行回答。 5. 带图片的多模态题也加入测试,直接截图进行作答,没有多模 ...
无人再谈AI六小龙
凤凰网财经· 2025-06-02 13:49
以下文章来源于字母榜 ,作者马舒叶 字母榜 . 让未来不止于大 来源|字母榜 作者|马舒叶 编辑|赵晋杰 2025年行将过半,之前还热闹非凡的AI六小龙,几乎从舆论场中消失:再没有人特意提起 这个称号。 DeepSeek的冲击只是一方面。更重要的是,原本被冠以六小龙称号的队伍中,已经有人 明显掉队:零一万物将超大模型交给了阿里训练,明确不再追逐AGI,放弃预训练转向应 用。 "大家都看得很清楚,只有大厂能够烧超大模型。" 李开复在接受《智能涌现》的采 访时这样表示。 百川智能则专注医疗垂类赛道,在字节、阿里、腾讯等大厂争相上新基础模型时,其创始 人王小川曾提出百川智能的底层模型将对标OpenAI,但如今其基础大模型进入了静默期, 不再更新。 剩下的智谱AI、MiniMax、月之暗面和阶跃星辰,也失去了如一条过江龙般,足以挑战乃 至对抗大厂的资本和技术底气。曾经的AI六小龙,已经在新一轮大模型竞赛中滑落成了新 的"AI四小强"。 它们一面成了固守AI创业赛道的最后一道屏障,一面又试图像打不死的小强般,在 DeepSeek掀起的新一轮大模型竞赛中,重新找到自己的定位和出路。 01 部分玩家掉队 从六小龙到四小强的 ...
加码多模态能力,夸克发布全新“AI相机”
Guan Cha Zhe Wang· 2025-04-28 09:29
Core Viewpoint - Quark AI Super Box has launched a new AI camera feature called "Photo Ask Quark," enhancing the search experience through visual understanding and reasoning capabilities [1][12]. Group 1: Product Features - The AI camera can identify locations from photos, assist in travel planning, and provide translations for foreign menus [3]. - It can also remove unwanted objects from images, adjust facial expressions, and generate social media captions [3]. - The camera acts as a life assistant by diagnosing appliance issues and suggesting purchases for damaged items [5]. Group 2: Health Applications - The AI camera can interpret medical reports, generate personalized health plans, and provide medication guidelines [7]. - It can create a tailored weekly meal plan based on health conditions like high uric acid levels [7]. Group 3: Work and Learning Support - The AI camera can enhance productivity by completing contracts from handwritten notes, solving complex calculations from images, and assisting with coding by adding annotations [10]. Group 4: Industry Context - The launch of the AI camera aligns with the growing trend of multimodal capabilities in AI, with competitors like OpenAI and Google also enhancing their models [13].