AutoCoT

Search documents
豆包1.6 “不偏科” ,高考成绩直逼“清北”
2 1 Shi Ji Jing Ji Bao Dao· 2025-06-28 14:29
文科成绩683分,理科648分。 近日,豆包Seed1.6-Thinking模型测试了2025高考全科,交出一份成绩优异的答卷。该测试采用全国新 一卷和山东省自主命题。 豆包多项考试成绩优异,高考成绩直逼"清北" 随着高考的结束,AI大模型也开启了一轮"竞技"。 豆包不"偏科",推理效果和性能更加平衡 细心的网友可能看到,豆包理科成绩怎么比文科差几十分?AI大模型是不是偏科呀? Seed团队表示,首次测试时使用的网络版考卷清晰度较低,各大模型在化学、生物两门非常依赖图像的 考试中丢分较多。该团队在获得更高清版本的高考试题图片后,采用图文交织的方式对化学和生物重新 进行测试,发现豆包模型在这两科上能够提升近30分,理科总成绩可达到676分,验证了全模态推理可 以更大程度激发模型的潜力。 这不但证明了豆包Seed1.6-Thinking模型并不偏科,同时也具备了较好的视觉推理能力。也说明结合文 本和图片进行全模态推理可以更大程度激发模型的潜力,相信这也是未来值得投入的研究方向。 2025年高考测试结果显示,豆包的语文、英语、物理、历史、地理、政治六门学科获最高分,数学成绩 也超过140分;DeepSeek R1获 ...
国产大模型高考出分了:裸分683,选清华还是北大?
量子位· 2025-06-26 06:25
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 这两天啊,各地高考的成绩终于是陆续公布了。 现在,也是时候揭晓全球第一梯队的大模型们的"高考成绩"了—— 我们先来看下整体的情况(该测试由字节跳动Seed团队官方发布): 按照传统文理分科计分方式,Gemini的理科总成绩655分,在所有选手里排名第一。豆包的文科总成绩683分,排名第一,理科总成绩是 648分,排名第二。 再来看下各个 细分科目 的成绩情况: | 模型 | 语文 | 数学 | 英语 默认听力满分 | 物理 | 化学 | 生物 | 地理 | 历史 | 政治 | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 满分 | 150 | 150 | 150 | 100 | 100 | 100 | 100 | 100 | 100 | | Doubao-Seed-1.6-Thinking | 128 | 141 | 144 | 90 | ਦਰ | 76 | ਰੇਖੋ | 92 | 84 | | Gemini-2.5-Pro-0605 | 126 | 140 | 141 | ...