混元Turbo S

Search documents
AI展望:NewScaling,NewParadigm,NewTAM
HTSC· 2025-06-10 01:43
证券研究报告 科技 AI 展望:New Scaling,New Paradigm,New TAM 华泰研究 2025 年 6 月 10 日│中国内地 中期策略 全球 AI 展望:New Scaling,New Paradigm,New TAM 展望全球 AI 发展趋势,1)模型端新架构正逐步探索,预训练 Scaling Law 有望呈现新起点;2)算力端训练与推理共同推动算力需求持续上行,有望 开启新 TAM,同时算力硬件设计进入新范式;3)应用端商业模式变革带来 新范式,Agent 在细分领域率先落地带来新 TAM。持续看好 AI 产业投资主 线,看好全球 AI 应用进入业绩收获期。 模型:预训练 Scaling Law 有望开启新起点 回顾近三个季度以来的大模型迭代情况,强化学习(RL)带来的后训练 test-time compute 依然是大模型的主流迭代方向。经典 transformer 架构下 模型参数规模或已达到了瓶颈,人类现有公开数据已接近被使用完。但值得 注意的是科技巨头在预训练阶段仍在继续尝试,以腾讯混元 Turbo S 与 Gemini Diffusion 为代表的大模型开始尝试在架构上进 ...
加大AI投入!腾讯汤道生:加速AI大模型、智能体、知识库和基础设施建设
Xin Lang Ke Ji· 2025-05-21 03:07
Core Insights - Tencent is significantly increasing its investment in AI, aiming to enhance the usability of generative AI from "quantitative change" to "qualitative change" [1] - The company is focusing on four key areas: large models, intelligent agents, knowledge bases, and infrastructure to create "user-friendly AI" [1][3] Group 1: AI Model Development - The demand for large model APIs and computing power has rapidly increased this year, indicating a shift in generative AI towards broader usability [3] - Tencent's mixed model T1 and Turbo S have been continuously iterated, with Turbo S ranking in the top 8 globally in the Chatbot Arena, second only to DeepSeek among Chinese models [3] - The company emphasizes that models must not only think but also execute tasks, with intelligent agents expanding the value boundaries of AI [3][4] Group 2: Knowledge Management - Tencent has launched the Tencent Lexiang Enterprise AI Knowledge Base to manage knowledge effectively, addressing issues of validity, update frequency, and access permissions [4] - The company is also enhancing personal knowledge base capabilities through its IMA platform, aiming to create a more personalized AI workspace [4] Group 3: Cost Optimization and Infrastructure - The shift in AI application from training-driven to inference-dominated has made cost optimization for large-scale inference a core competitive advantage for cloud providers [4] - Tencent Cloud's AI infrastructure is optimizing response speed, latency, and cost-effectiveness in inference scenarios through collaboration between IaaS and tool layers [4]
财通证券:1Q2025计算机板块业绩企稳 行业投资迎来很好加仓窗口
智通财经网· 2025-05-12 03:26
Group 1 - The computer industry is experiencing a fundamental upward turning point in Q1 2025, driven by new technologies like DeepSeek's large model and increasing AI orders in specific sectors [1] - In Q1 2025, the Shenwan computer industry reported a 15.9% year-on-year increase in operating revenue and a staggering 671.5% increase in net profit attributable to shareholders [1] - The gross margin decreased by 3.4 percentage points year-on-year, while the net margin increased by 0.6 percentage points, attributed to project-based delivery and the impact of traditional orders from the previous year [1] Group 2 - The domestic AI large model sector is thriving, characterized by a "hundred schools of thought" phenomenon, with DeepSeek emerging as a leading player through algorithmic innovation [2] - Tencent's Mix Yuan Turbo S has effectively reduced training and inference costs through innovative architecture, while MiniMax has expanded linear attention mechanisms to commercial model levels [2] - Alibaba's open-source model Qwen3 has achieved performance breakthroughs with relatively low hardware resource consumption through a "mixed reasoning" approach [2] Group 3 - The AI computing power and application sectors are showing strong growth, particularly in smart driving and industrial intelligence, with domestic AI chips and server power experiencing upward trends [3] - The integration of AI productivity tools with large models is accelerating, reshaping office workflows and enhancing enterprise resilience through AI Agents [3] - The domestic low-altitude economy is experiencing accelerated development driven by policy support, significantly improving industry sentiment [3]
腾讯研究院AI速递 20250429
腾讯研究院· 2025-04-28 15:48
1. 第三方团队TNG成功将DeepSeek V3-0324和R1模型融合,创建出DeepSeek-R1T- Chimera,兼具R1能力与V3速度; 1. 多位OpenAI前高管选择创业进军AI领域,如Ilya Sutskever创立SSI、Mira Murati成立 Thinking Machines Lab等,获得大额融资; 2. 创业方向多元化,涵盖安全AI研究、教育科技、搜索引擎、机器人等领域,显示AI应用场 景广泛; 一、 DeepSeek R2等太久?第三方基 于 新 版 V 3 推 出 融合 模型 3. 这些创业公司估值普遍较高,如Anthropic达615亿美元,xAI估值1130亿美元,投资者对 AI前景乐观。 2. 新模型在"7米甘蔗过2米门"问题上展现出深度思考能力,虽用时101秒但推理过程更严 谨; 3. 模型融合成为新趋势,除TNG外,KIMI和Sakana AI等团队也在探索不同的融合方法。 生成式AI https://mp.weixin.qq.com/s/pBN5me3_AYN5JT3Id3Oe9A 二、 离职OpenAI的大牛们,竟然创立了这么多公司, 企业盘点 https: ...
腾讯在 AI 拐点到来前的 700 天
晚点LatePost· 2025-03-24 10:58
新节奏、不赛马、好运气。 文 丨 高洪浩 编辑 丨 黄俊杰 DeepSeek 今年春节火遍中国之后,腾讯是第一个全线产品尽数接入的巨头,从微信、QQ 到腾讯自己 的 AI 助手元宝和才上线几个月的工作台产品 ima。这被认为是腾讯 AI 投入爆发的开始。 但据我们了解,改变比这早几个月。从去年下半年起,微信便探索起了 AI 相关的能力。DeepSeek 出来 以前,腾讯高层也已着手,将分散在各事业群里的工具产品打包起来,统一管理。 2023 年初,ChatGPT 问世几个月后的一次管理层战略会上,腾讯技术与工程事业群总裁卢山以 ChatGPT 举例,认为 OpenAI 从推出 GPT 模型开始,"花了三年时间才真正产品化,而腾讯的大模型肯 定会很多坑要踩,所以不会着急。" 一位在场人士转述他的话。腾讯的 AI 助手产品元宝在 2024 年 5 月 底才发布,比豆包、Kimi 晚了近一年。 当阿里与字节在大模型、软件和硬件上全面出击时,一位腾讯人士记得,腾讯董事局主席兼 CEO 马化 腾跟一些 AI 团队说,"要好好与外部合作,不要想着什么都自己做"。2024 年,字节在为豆包大举投 放、成为英伟达重要客户时, ...
腾讯,大动作!价格为DeepSeek-R1的1/4
21世纪经济报道· 2025-03-22 11:41
与De epSe ek R1等慢思考模型不同,混元Turbo S更强调"秒回、吐字快",并且更善于超长 文本处理。 一 个 有 意 思 的 现 象 是 , 无 论 是 前 几 天 阿 里 发 布 推 理 模 型 QwQ- 3 2B , 还 是 这 次 腾 讯 发 布 混 元 T1, 都选在了国内的深夜时段 。据记者了解, 他们这样做的目的,是因为这些模型都会面 向海外开发者, 这也进一步说明中国大模型已真正走向海外。 据腾讯介绍,混元T1正式版通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理 科难题的专项优化,推理能力得到进一步提升。与此前已上线腾讯元宝的混元T1 - p r e v i ew模 型相比,综合效果也有了明显提升。 在一些常见的基准测试上,比如大语言模型评估增强数据集MMLU-PRO中, 混元T1的评分 仅次于OpenAI- o 1,优于De epSe ek-R1。 在评估逻辑推理能力的DROP F1测试中,混元T1的评分也优于De e pSe e k -R1和Op e nAI- o 1。 不过在数学和代码能力测试中,混元T1的评分都低于De e pSe e k -R1。在中文语言理解能 ...
宇树科技下轮估值或突破200亿,40%认购者来自海外;小米、小鹏、蔚来等宣布切入“人形机器人”;苹果智能4月支持中文丨AI周报
创业邦· 2025-03-02 02:25
以下文章来源于快鲤鱼 ,作者巴里 快鲤鱼 . 创业邦旗下AGI矩阵号,寻找海内外创新性的AGI高成长公司,记录AGI商业领袖的成长轨迹。 全球AI产业周报 为你精选过去一周(2.22-2.28)最值得关注的AI新闻和 国内外热门AI投融资事件 ,帮助大家及时 了解全球AI市场动向。 本周AI热点资讯 国内大事 纵目科技创始人唐锐回应"跑路"传闻 唐锐表示,确实在和联席CEO商议之后在春节之前离开国内,并且暂未回国。目前其工作主要在于两 个方面:一是和国内股东以及股东组成的应急小组共同解决国内业务重整过程中的问题。二是尽可能 维持海外的蚕丛业务,并寻求海外蚕丛业务的潜在投资人,并且在合适的时间将海外蚕丛业务的投资 人和国内的重整过程进行并轨处理。(中国企业家) 上海一明星AI公司倒下,员工遭停薪,澜码创始人周健回应:正寻求被并购 2月24日消息,国内企业级AI Agent(智能体)公司上海澜码科技有限公司(以下简称"澜码科技") 近期对数十名员工直接解除劳动合同,停薪资、停社保已经超过三个月(去年10月起)。同时,"澜 码科技"公众号自去年10月28日至今处于停更状态。对此,澜码科技创始人、CEO周健23日回应 ...
轧空?
Datayes· 2025-02-27 12:30
A股复盘 | 雪王与小米 / 2025.02.27 今天小米巨震,哈哈哈,上午涨4%,最高58.7港元,忽然掉头直下,最高跌8%,最低51.4 港元。 看了财联社一个分析(自己懒得查),近一个月以来,港股小米集团净买入席位最高的是汇 丰银行、其次则是花旗银行,期间两家合计净买入超2亿股,主导买盘力量。 而以港股通为首的内资则是减持居多,沪港通、深港通近一月累计卖出小米集团约5250万 股。这也意味着在小米股价高歌猛进的背后,外资更有可能是本轮行情的主要推手。 截至今日,港股空头对小米集团仍有高达3.49亿股的未平仓股数,以近一个月的均价测算, 存量沽空金额超百亿港元,并且还在被小米不断走高的股价逼空。 这个是不是叫轧空? | 维度 | 轧空 (Short Squeeze) | 通空 (Bear Squeeze) | | --- | --- | --- | | 触发条 | 空头头寸过度集中,股价超预期上涨 | 市场流动性枯竭,多头持续拉抬价格 | | 件 | | | | 主导力 | 被动型:空头止损引发连锁反应 | 主动型:机构多头蓄意制造价格压力 | | 물 | | | | 价格渡 | 短期副烈反弹(如Gam ...