腾讯混元T1

Search documents
十大推理模型挑战2025年高考数学题:DeepSeek-R1、腾讯混元T1并列第一,马斯克的Grok 3遭遇“滑铁卢”
Mei Ri Jing Ji Xin Wen· 2025-06-10 13:53
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。 《每日经济新闻》记者(以下简称"每经记者")选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯混元T1、OpenAI的o3、谷歌的Gemini 2.5 Pro和xAI的Grok3等十款AI推理大模型进行了测评,以检验当今主流AI推理大模型的数学能力。 测评结果显示,国产大模型DeepSeek-R1与腾讯混元T1以零错误并列榜首。而被马斯克称为"地表最强AI"的Grok 3却遭遇"滑铁卢",排名倒数第三。 本次测评以2025年全国新课标数学I卷(总分150分)作为考题。但每经记者在测试中发现,部分AI推理模型以"重要考试期间"为由拒绝对包含试题的图片进 行识别和解答。 为了让所有参评大模型站在同一起跑线,测评移除了试卷中所有需要分析图形和图表的题目,形成一份有效总分为117分的标准化试卷。 同时,对于谷歌Gemini 2.5 Pro等没有这一限制的推理模型,仍将以150分的完整试卷进行测试,旨在测试推理大模型所能达到的最高水平。 扣分标准上,每经记者在选择题和填空题上都遵循了高考评卷的扣分标准,但对于解答题,本次测评只根据结果计算 ...
深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评
Bei Ke Cai Jing· 2025-06-09 01:24
6月8日下午,2025年高考英语科目考试结束。在今年高考英语北京卷的作文题目中,李华又一次成为"主角"。 与此同时,这场"语言能力大考"也成为AI大模型的试金石——从精准审题到地道表达,从逻辑连贯到文化适配,大语言模型能否作为"李华"完成高考英语作 文题目的独特要求?在各个大模型均已具备"深度思考"模式的当下,"AI考生"能拿到多少分?对此,新京报贝壳财经对国内外主流大语言模型进行了测评。 本次测评选择2025年高考英语北京卷作文题目,测评对象为DeepSeek R1、ChatGPT o3、通义千问Qwen3、腾讯混元T1、讯飞星火X1、百度文心X1六款深度 推理模型产品,并邀请北京市十一学校一分校英语老师韩宪昌、深圳中学英语教师赵文嘉参照往年高考评分标准对上述大模型生成的英语作文打分并作点 评。 本着客观公正和"盲评"原则,韩宪昌老师和赵文嘉老师给出了专业评分。本次参赛的六名大模型"AI考生"得分揭晓后由高到低的排名分别为:讯飞星火 X1、DeepSeek R1、百度文心X1、通义千问Qwen3、ChatGPT o3、腾讯混元T1。 具体来看,2025高考英语北京卷作文题目的要求为: 假设你是红星中学高三学 ...
加大AI投入!腾讯汤道生:加速AI大模型、智能体、知识库和基础设施建设
Xin Lang Ke Ji· 2025-05-21 03:07
新浪科技讯 5月21日上午消息,今日,腾讯云AI产业应用峰会在北京举办。腾讯集团高级执行副总裁、 云与智慧产业事业群CEO汤道生表示,模型深度思考的突破,推动生成式AI的可用性从"量变"发展 到"质变",腾讯持续加大AI投入力度,各项业务全面拥抱AI。同时也以大模型、智能体、知识库和基础 设施"四个加速",打造"好用的AI",助力AI走进千行百业,走近每个人的生活。 今年以来,产业对于大模型API的调用量、算力需求等也快速增长。汤道生认为,生成式AI已经逐步跨 过"可用性"的门槛,未来要从"可用"到"好用";从"一部分人用",到"人人能用",还需要在交互体验、 执行能力、内容准确性、落地成本等方面持续升级。优化模型可以提升性能和交互体验;智能体可以赋 予模型独立执行任务的能力;知识库能帮助减少模型幻觉,更懂企业和用户;基础设施和工程优化可以 降低训推成本、提升响应速度。 模型是AI应用的基础。腾讯混元T1和Turbo S能力持续迭代,在全球权威Chatbot Arena排行中,混元 TurboS已进入全球前8,中国大模型中仅次于DeepSeek。多模态领域,腾讯混元的视觉理解、语音交 互、3D、实时生图等能力 ...
vivo招募芯片、AI大模型顶尖人才,称薪酬上不封顶;雷军官宣小米自研手机芯片;小马智行回应北京亦庄无人驾驶汽车起火丨AI周报
创业邦· 2025-05-17 09:39
以下文章来源于快鲤鱼 ,作者巴里 快鲤鱼 . 为你精选过去一周(5.10-5.16)最值得关注的AI新闻和国内外热门AI投融资事件,帮助大家及时了解全 球AI市场动向。 本周AI热点资讯 国内大事 雷军官宣小米自研手机芯片:玄戒O1,将在5月下旬发布 5月15日晚,小米创办 人,董事长兼CEO 雷军发文:小米自主研发设计的手机SoC芯片,名字叫玄戒 O1,即将在5月下旬发布。(界面新闻) 创业邦旗下AGI矩阵号,寻找海内外创新性的AGI高成长公司,记录AGI商业领袖的成长轨迹。 全球AI产业周报 vivo开启顶尖人才招募计划:涉及芯片、AI大模型等领域,称薪酬上不封顶 vivo近日启动了一项名为"蓝极星计划"的顶尖人才招募项目,涉及岗位包括芯片、AI大模型、XR等核心 技术领域。根据招募信息显示,蓝极星计划的定位为vivo最核心的人才战略方案,面向全球高校顶尖技术 人才。在待遇方面,vivo也给出了匹配顶尖学术背景、顶级工作和学习资源配套等条件,提供专属岗位导 师和技术专家,并承诺薪酬上不封顶。不过,蓝极星计划的门槛也很高,仅向博士生开放。(同花顺财 经) 小马智行回应北京亦庄无人驾驶汽车起火:未发生碰撞,原 ...
科技风向标丨Manus全面开放注册;支付宝上线语音通话功能;孟羽童否认与董明珠“互撕”
2 1 Shi Ji Jing Ji Bao Dao· 2025-05-13 03:11
21世纪经济报道新质生产力研究院综合报道 早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起 看看吧。 【巨头风向标】 Manus开放注册,用户每天可免费执行一项任务。AI智能体平台Manus宣布开放注册,Manus在公告中 表示,Manus向所有人开放,无需等待名单;所有用户每天可免费执行一项任务(300积分),所有用 户一次性获得1000积分奖励。 支付宝新上线语音通话功能。5月12日,支付宝新上线了语音通话功能。用户升级至最新版本支付宝 后,在消息界面与好友聊天框中点击"+",即可找到语音通话入口。若首次使用,页面会提示该功能特 点:账号经支付宝实名认证,安全有保障;通话无变声,确保真实性;支付宝不储存通话内容,保障用 户隐私。 【潮新品】 国内首例侵入式脑机接口系统前瞻性临床试验:受试者已能用意念玩游戏。上海阶梯医疗科技有限公司 的科学家们展示了一段视频,视频中一名受试者通过植入大脑的脑机接口设备玩"马里奥赛车"游戏。受 试者在一次高压电击事故中失去了四肢,今年3月接受手术植入了阶梯医疗开发的脑机接口产品。两根 柔性电极被埋入大脑,采集到的脑电信号以无线 ...
奇瑞高管公开点评吉利新车“烂车一台”,双方回应;恒安回应心相印客服称赔冥币;宁德时代:李平夫妇向复旦捐赠405万股股票丨邦早报
创业邦· 2025-05-13 00:07
完整早报音频,请点击标题下方小耳机收听 美国将(一)修改2025年4月2日第14257号行政令中规定的对中国商品(包括香港特别行政区和澳门特别 行政区商品)加征的从价关税,其中,24%的关税在初始的90天内暂停实施,同时保留按该行政令的规定 对这些商品加征剩余10%的关税;(二)取消根据2025年4月8日第14259号行政令和2025年4月9日第14266 号行政令对这些商品的加征关税。 中国将(一)相应修改税委会公告2025年第4号规定的对美国商品加征的从价关税,其中,24%的关税在 初始的90天内暂停实施,同时保留对这些商品加征剩余10%的关税,并取消根据税委会公告2025年第5号 和第6号对这些商品的加征关税;(二)采取必要措施,暂停或取消自2025年4月2日起针对美国的非关税 反制措施。(新华社) 【奇瑞高管称吉利新车是"烂车",奇瑞:停止涉事干部一切工作】 5月12日下午消息,近日奇瑞汽车营销 公司副总经理姚飞(姚远方)在社交媒体上拉踩吉利新车吉利银河星耀8。有网友关注到,姚飞在抖 音"A9创始人版车主群"中评价吉利银河星耀8时,采用了"烂车"、"二排挤的很"、"音响烂"等形容词,引 发网友以及吉利 ...
饥渴的大厂,面对大模型还需新招
3 6 Ke· 2025-04-30 04:11
昨天晚上,跟朋友聊起大模型。 他说现在各家都"卷"到一个新阶段,模型之间差距已经很小,只能用"遥遥领先"或者"吊打同行"这种词 来形容。 从基准测试和数据来看,很多模型都远超 DeepSeek R1、GPT-4o,但继续往下比的空间已经不大了,真 正的差异更多在使用方式上。 这让我开始思考:大模型竞争,是不是已经进入存量博弈阶段? 1 说到"存量",就绕不开一个字:"卷"。不卷,哪来的存量?那问题来了:这个卷,到底在卷什么? 我觉得,表面看到的就三点:算力成本、数据质量和场景渗透。 以前大模型拼参数多,现在开始拼谁的成本低。 阿里家的 Qwen3,用"混合推理"的技术,简单问题用低算力能快速回答,复杂问题再慢慢思考,这样 部署成本直接降到了 DeepSeek-R1 的 1/3 到 1/4。 腾讯混元 T1,3890 亿参数的模型,通过稀疏激活机制,算力利用率比传统模型提升了 30% 以上。 百度的文心大模型,虽然没公开具体成本,但它的推理速度在工业级场景里比竞品快 20%,也算是有 自己的优势。 字节跳动没直接在公开场合提到过算力优化,但它通过抖音、今日头条的场景化落地,间接降低了通用 大模型的部署压力。 所 ...
DeepSeek,突传大消息!高盛发声!
券商中国· 2025-03-26 01:54
最新进展! 3月25日晚,DeepSeek又有大消息传来。该公司在官方账号上正式宣布V3模型完成小版本升级的消息,并介绍了新 版本DeepSeek-V3-0324模型的提升细节,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。另据海 外专业AI模型评测机构最新排名,新版V3模型现在是得分最高的非推理模型,超过xAI的Grok3和OpenAI的GPT-4.5 (preview)。 值得注意的是,北京时间昨天晚上,人工智能大模型"暗战"不断。当地时间3月25日,美国开放人工智能研究中心 (OpenAI)宣布推出4o图像生成功能,"将迄今最先进的图像生成器集成至GPT-4o"。谷歌也发布Gemini 2.5系列人 工智能推理模型,其首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且整整比GPT-4.5高出40分。 再度引爆:又变强了! 3月25日晚间消息,DeepSeek宣布V3模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、 APP、小程序进入对话界面后,关闭深度思考即可体验。 据悉,DeepSeek-V3-0324 API接口和使用方式保 ...
人形机器人周报(第3期):中鼎战略合作众擎机器人,Figure AI机器人多模态能力升级【国信汽车】
车中旭霞· 2025-02-23 15:12
市场表现: 2025年2月17日-2月21日,我们构建的国信人形机器人指数上涨5.84%,强于沪深300指数4.84pct,强于上证综合指数4.87pct,年初至今上涨36.8%;部分核心公司 中,拓普集团上涨6.45%,三花智控上涨7.44%,银轮股份上涨26.3%,北特科技上涨12.27%,双林股份上涨30.85%,贝斯特上涨21.9%,浙江荣泰上涨18.98%,祥鑫科技上涨 15.99%,双环传动上涨18.22%,斯菱股份上涨24.71%,豪能股份上涨2.99%,精锻科技上涨21.42%,蓝黛科技上涨6.07%,凌云股份上涨16.09%,旭升集团上涨14.04%,肇民 科技上涨13.67%,爱柯迪上涨17.1%,整体来看板块持续表现强势。 行业动态: 行业新闻: 1)Figure AI人形机器人多模态能力升级,能够让人形机器人通过语音命令执行复杂的动作,Helix 能够同时控制35个自由度,涵盖了从单个手指动作到 头部、躯干等多个部分的精细控制;2)"天工" 机器人创纪录:能连续攀爬上百级阶梯、雪地奔跑;3)蚂蚁集团入局具身智能,持续布局加大AI投入;4)DeepSeek加快优必 选人形机器人工业场景规 ...