腾讯,大动作!价格为DeepSeek-R1的1/4
与De epSe ek R1等慢思考模型不同,混元Turbo S更强调"秒回、吐字快",并且更善于超长 文本处理。 一 个 有 意 思 的 现 象 是 , 无 论 是 前 几 天 阿 里 发 布 推 理 模 型 QwQ- 3 2B , 还 是 这 次 腾 讯 发 布 混 元 T1, 都选在了国内的深夜时段 。据记者了解, 他们这样做的目的,是因为这些模型都会面 向海外开发者, 这也进一步说明中国大模型已真正走向海外。 据腾讯介绍,混元T1正式版通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理 科难题的专项优化,推理能力得到进一步提升。与此前已上线腾讯元宝的混元T1 - p r e v i ew模 型相比,综合效果也有了明显提升。 在一些常见的基准测试上,比如大语言模型评估增强数据集MMLU-PRO中, 混元T1的评分 仅次于OpenAI- o 1,优于De epSe ek-R1。 在评估逻辑推理能力的DROP F1测试中,混元T1的评分也优于De e pSe e k -R1和Op e nAI- o 1。 不过在数学和代码能力测试中,混元T1的评分都低于De e pSe e k -R1。在中文语言理解能 ...