混元T1

Search documents
互联网云厂商集体发力AI Agent 火山引擎再掀“价格革命”
Zhong Guo Jing Ying Bao· 2025-06-13 05:05
中经记者 李静 北京报道 AI Agent(智能体)无疑是2025年AI领域最火的领域之一,微软、谷歌、OpenAI等国际巨头与百度、 阿里、腾讯等国内厂商均在2025年推出了重磅的AI Agent产品。此外,初创公司Monica发布的首款通用 AI Agent产品Manus在内测阶段就引发了全世界的关注。 顺福资本管理创始人、行行AI董事长李明顺在接受《中国经营报》记者采访时指出,上一轮AI创业潮 中,王小川、李开复等人聚焦大模型底层赛道,项目融资规模动辄数亿元;而当下AI应用层正迎来创 业新风口,其中AI Agent 领域成为最炙手可热的方向。"这波创业潮的显著特征是轻量化——几人到十 几人的小团队,依托大模型能力即可启动 AI 应用项目。"李明顺说。 在AI Agent创业的浪潮中,百度智能云、腾讯云、火山引擎等云计算厂商也敏锐地捕捉到了这个商机, 不约而同地在AI Agent方向布局。 6月11日,火山引擎推出最新的豆包大模型1.6,推出全栈AIAgent开发工具,更是把模型价格进一步拉 低,降低至DeepSeek的1/3。俨然希望以低价争夺更多的市场份额,或也将推动行业竞争更加白热化。 火山引擎再掀 ...
十大推理模型挑战2025年高考数学题:DeepSeek-R1、腾讯混元T1并列第一,马斯克的Grok 3遭遇“滑铁卢”
Mei Ri Jing Ji Xin Wen· 2025-06-10 13:53
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。 《每日经济新闻》记者(以下简称"每经记者")选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯混元T1、OpenAI的o3、谷歌的Gemini 2.5 Pro和xAI的Grok3等十款AI推理大模型进行了测评,以检验当今主流AI推理大模型的数学能力。 测评结果显示,国产大模型DeepSeek-R1与腾讯混元T1以零错误并列榜首。而被马斯克称为"地表最强AI"的Grok 3却遭遇"滑铁卢",排名倒数第三。 本次测评以2025年全国新课标数学I卷(总分150分)作为考题。但每经记者在测试中发现,部分AI推理模型以"重要考试期间"为由拒绝对包含试题的图片进 行识别和解答。 为了让所有参评大模型站在同一起跑线,测评移除了试卷中所有需要分析图形和图表的题目,形成一份有效总分为117分的标准化试卷。 同时,对于谷歌Gemini 2.5 Pro等没有这一限制的推理模型,仍将以150分的完整试卷进行测试,旨在测试推理大模型所能达到的最高水平。 扣分标准上,每经记者在选择题和填空题上都遵循了高考评卷的扣分标准,但对于解答题,本次测评只根据结果计算 ...
我让10个大模型又参加了完整版数学高考,第一名居然是它。。。
数字生命卡兹克· 2025-06-09 21:20
昨天,我不是发了几个大模型参加数学高考的测试文章嘛。 没想到热度挺高,大家还挺关注的。 不过,很多评论区的小伙伴也说,根本看不出来区别。 因为缺了对AI难度最高的单选第6题,还有后面那些解答题。 那我想,不如再把模型补上,加上全缺失的智谱Z1、Kimi1.5、文心X1,(不带Claude 4,封号斗罗,我恨他),再做一个,完整的满血版的数学高考, 让大家最直观的,感受一下这些模型的数学能力水平。 让大家看看,满分150分,每个模型到底多少分,哪个模型能拿高考数学状元。 因为要做解答题了,和选则填空不太一样,所以我还是单独定了一下规则,规则如下: 1. 数学大题往往都有两到三个小问,但是每个小问具体的赋分都不太一样,邀请了朋友(高中老师)来估摸一下每个小问的分数,如下,都取后者: 2. 高考大题往往会按照步骤给分,但是主要我也看不懂步骤(勿喷),所以这里我们不妨对大模型严格一点,按照结果是否正确来给分。 3. 每道题任然使用大模型跑3次,根据正确比例给分。 4. 依然所有的文本题,都 使用LaTeX编辑器转成LaTeX文本格式,再扔给大模型进行回答。 5. 带图片的多模态题也加入测试,直接截图进行作答,没有多模 ...
深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评
Bei Ke Cai Jing· 2025-06-09 01:24
6月8日下午,2025年高考英语科目考试结束。在今年高考英语北京卷的作文题目中,李华又一次成为"主角"。 与此同时,这场"语言能力大考"也成为AI大模型的试金石——从精准审题到地道表达,从逻辑连贯到文化适配,大语言模型能否作为"李华"完成高考英语作 文题目的独特要求?在各个大模型均已具备"深度思考"模式的当下,"AI考生"能拿到多少分?对此,新京报贝壳财经对国内外主流大语言模型进行了测评。 本次测评选择2025年高考英语北京卷作文题目,测评对象为DeepSeek R1、ChatGPT o3、通义千问Qwen3、腾讯混元T1、讯飞星火X1、百度文心X1六款深度 推理模型产品,并邀请北京市十一学校一分校英语老师韩宪昌、深圳中学英语教师赵文嘉参照往年高考评分标准对上述大模型生成的英语作文打分并作点 评。 本着客观公正和"盲评"原则,韩宪昌老师和赵文嘉老师给出了专业评分。本次参赛的六名大模型"AI考生"得分揭晓后由高到低的排名分别为:讯飞星火 X1、DeepSeek R1、百度文心X1、通义千问Qwen3、ChatGPT o3、腾讯混元T1。 具体来看,2025高考英语北京卷作文题目的要求为: 假设你是红星中学高三学 ...
腾讯亮相首届国际通用人工智能大会
Huan Qiu Wang Zi Xun· 2025-05-26 12:08
来源:光明网 5月24日-25日,由北京通用人工智能学会主办的首届国际通用人工智能大会(TongAI)在北京召开。作 为我国首个聚焦通用人工智能(AGI)的国际学术盛会,大会汇聚来自哈佛大学、新加坡管理大学、北 京大学、清华大学等国内外一流高校专家学者以及腾讯等领军企业技术领袖共襄盛举,通过深度思想碰 撞与交流构建原创性技术路线,推动国际学术界携手突破认知边界、共塑技术范式。 腾讯首席科学家、Robotics X实验室主任张正友在大会主论坛作主题报告。腾讯杰出科学家胡瀚在"多模 态交互学习"专题会议中对腾讯混元多模态大模型进行了详细介绍。 胡瀚提到,腾讯在大模型上的技术迭代正不断提速。腾讯混元模型矩阵全面升级,旗舰快思考模型混元 TurboS、深度思考模型混元T1双双迭代。基于TurboS基座,腾讯新推出视觉深度推理模型T1-Vision和 端到端语音通话模型混元Voice。混元图像2.0、混元3D v2.5及混元游戏视觉生成等一系列多模态模型也 同步"上新"。 语言模型跻身全球前八,技术能力持续提升 在疯狂卷技术的全球大模型角逐中,腾讯混元正小步快跑、快速迭代,技术能力持续提升。 在全球公认的权威大语言模型 ...
腾讯AI元宝:微信生态下的“明日之星”还是“昙花一现”?
Sou Hu Cai Jing· 2025-05-23 04:24
在经历了几个月的激烈竞争后,腾讯的AI产品元宝逐渐从梦幻般的开局回归现实。在这场大模型榜单 的争夺战中,截至5月20日,苹果应用商店免费App下载榜上,豆包稳坐榜首,DeepSeek紧随其后位列 第六,而元宝已跌至第43名。 腾讯最新一季的财报中,对元宝的提及并不多,其重心依然放在游戏和微信生态的升级上。在财报后的 电话会议中,当被问及元宝与微信的进一步协同计划时,马化腾坦言:"坦率地说,现在还处于非常早 期的阶段。"管理层对这一话题的回避,或许暗示了元宝还不足以扛起腾讯AI的大旗。 一位AI行业的创业者阿灿向媒体透露,AI工具的核心在于模型与应用的配合,但腾讯的混元和元宝在 这方面似乎并不理想。"元宝接入微信时,我曾寄予厚望,但用过几次后,其指令遵循能力之差让我难 以置信这是腾讯的产品,"他表示,"很多功能更像是复制别人的,像是为了完成KPI的产物。" 一位用户也表达了类似的困惑,尽管手机上一直装着元宝,但它的存在感并不强,"好像有没有都行"。 在2023年的腾讯股东大会上,马化腾强调,互联网企业在AI领域已有不少积累,腾讯也在潜心研发, 但并不急于过早展示半成品。"关键是要把底层算法、算力和数据扎扎实实做 ...
腾讯混元上新:多模态和智能体,两手都要抓 | 最前线
3 6 Ke· 2025-05-22 08:01
作者 | 邓咏仪 2025年初,混元TurboS正式发布,采用大规模混合Mamba-MoE模型,其在效果与性能上已展现出显著优势。而这一最新突破,则得益于预训练阶段的tokens 增训,以及后训练阶段引入长短思维链融合技术,使得TurboS理科推理提升超10%,代码能力提升24%,竞赛数学成绩大幅提升了39%。 编辑 | 苏建勋 腾讯大模型的战略落地上正不断提速。 "AI持续落地,每个企业正在成为AI公司,每个人也将成为AI加持的'超级个体'。"5月21日,腾讯云AI产业应用峰会上,腾讯集团高级执行副总裁、云与智 慧产业事业群CEO汤道生表示。 5 月 21 日,腾讯混元迎来了一次全面升级,其中包括旗舰快思考模型混元TurboS、深度思考模型混元T1都发布了新的迭代版本。 基于TurboS基座,腾讯新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。在腾讯AI产业应用峰会上,混元图像2.0、混元3D v2.5及混元游 戏视觉生成等一系列多模态模型,也同步上新。 汤道生 来源:腾讯 腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,在全球公认的权威大语言模型评测平台Chatbo ...
脑机接口,新突破!百度一季度收入324.52亿元;关于苹果,微信支付确认→
新华网财经· 2025-05-22 00:38
宏观消息 1、深圳市5月21日召开人工智能与机器人发展大会,揭牌全国首个人工智能领域政府直属机构——深 圳市龙岗区人工智能(机器人)署,并集中发布《龙岗区加快创建"AI龙岗"三年行动计划(2025— 2027年)》、《龙岗区具身智能机器人友好示范城区三年行动方案(2025—2027年)》等一系列政策 举措。 今日导读 1. 近日,浙大二院联合浙江大学南湖脑机交叉研究院、脑机智能全国重点实验室、生物医学 工程与仪器科学学院成功完成国内首例"闭环脊髓神经接口"植入手术。这标志着国内脊髓神 经接口及神经功能重塑领域取得重大技术突破。 2. 百度2025年第一季度营收324.52亿元,同比增3%,上年同期315.13亿元;调整后营业利 润53.3亿元,预估48.9亿元。调整后EBITDA为72亿元人民币(9.93亿美元),调整后 EBITDA利润率为22%。 3.多位网友发帖称,苹果Apple Store线下零售店支持微信支付,记者从微信支付方面确认了 这一消息。公开资料显示,2018年2月7日起,Apple Store线下零售店已经支持支付宝,而 线上App Store开始支持支付宝的时间可以追溯至2016年。 2 ...
腾讯首次完整披露大模型战略,各业务全面拥抱AI
2 1 Shi Ji Jing Ji Bao Dao· 2025-05-21 06:40
Core Insights - Tencent has fully disclosed its large model strategy, showcasing a comprehensive upgrade of its large model matrix products at the 2025 Tencent Cloud AI Industry Application Summit [1] - The company emphasizes that every enterprise will become an AI company and every individual will be an AI-empowered "super individual" as AI continues to be integrated into various sectors [1] - Tencent plans to increase its investment in AI, focusing on large model innovation, intelligent application, knowledge base development, and infrastructure upgrades to create "user-friendly AI" [1] Group 1 - Tencent's large model matrix includes self-developed models, AI cloud infrastructure, intelligent development tools, knowledge bases, and scenario-based applications [1] - The demand for large model APIs and computing power has rapidly increased, indicating a growing industry reliance on generative AI [1] - The transition from "usable" to "user-friendly" AI requires improvements in interaction experience, execution capability, content accuracy, and implementation costs [1] Group 2 - Tencent has intensified its investment in deep thinking model routes, with the launch of the mixed Yuan T1 model and its continuous iteration since early this year [2] - New models such as the mixed Yuan T1 Vision for visual deep reasoning and the mixed Yuan Voice for end-to-end voice calls have been introduced, with plans for real-time video call AI experiences [2] - The mixed Yuan model has achieved full-modal open-source capabilities, with future releases planned for multi-size mixed reasoning models ranging from 0.5B to 32B dense models [2]
腾讯智能体开发平台发布,科创人工智能ETF华夏(589010)涨0.29%翻红
Mei Ri Jing Ji Xin Wen· 2025-05-21 05:52
Group 1 - The A-share market experienced a rebound in the sci-tech artificial intelligence sector, with the Huaxia Sci-tech AI ETF (589010) rising by 0.29% as of 13:35 [1] - Among the holdings, Zhongyou Technology led the gains with an increase of 17.89%, followed by Lingyun Light at 5.72% and Fudan Microelectronics at 5.3%. Conversely, Youfang Technology saw a decline of 2.79%, leading the losses [1] - Tencent Cloud launched an intelligent development platform on May 21, integrating DeepSeek-R1, V3 models, and online search capabilities, with plans to release a world model and open-source various hybrid inference models [1] Group 2 - Huatai Securities believes that the sci-tech industry still holds certain allocation value, citing the current weak stabilization of the inventory cycle and ongoing capacity clearance, with monetary policy remaining loose [2] - The firm notes that with the US-China reaching a phased tariff agreement, global investor risk appetite is recovering, which may enhance market focus on the tech sector [2] - In the medium to long term, industries such as AI, robotics, and intelligent driving are expected to gradually release performance, supported by new policies on mergers and acquisitions [2]