智谱清言

Search documents
MiniMax逆着商汤过河
Sou Hu Cai Jing· 2025-07-04 01:21
文 | 新立场Pro 25年刚过半,"AI六小虎"的称呼仿佛成为了一个过气梗,DeepSeek横空出世,改写了AI创业的造神势头——原本也许可以在新一年高歌猛进的六大玩 家,上半年有人削减投流,有人裁撤业务,有人重心转向,有人更加急切地寻求上市。 2月消息称月之暗面Kimi暂停烧钱投流;3月消息称百川智能裁撤主要负责金融行业To B业务的B端组;4月智谱向中国证监会北京证监局提交上市辅导备 案;5月零一万物转向彻底拥抱To B;6月初消息称阶跃星辰减少C端应用投入并将重心转向Agent;就在前段时间,消息称MiniMax计划最早在今年港股上 市,并且已为此次IPO聘请了财务顾问。 DeepSeek鲶鱼效应加速下,六小虎当然知道市场留给自己的耐心更加不多了,寻求上市则是赚取更多市场耐心的方式之一。 不止闫俊杰,根据公开资料,MiniMax另一位创始人周彧聪也来自商汤。所以起初,在市场对AI六小虎的模式和演变路径都还不清楚的时候,MiniMax被 视为"商汤系"、"商汤2.0",这当然不意味着公司业务层面在效仿商汤的模式,仅仅指向管理层的人员履历。 以近年对外发言较多的闫俊杰的基本履历来看,其此前其在商汤科技负责 ...
实测7个大模型“谄媚度”:谁更没原则,爱说胡话编数据
Nan Fang Du Shi Bao· 2025-06-24 03:08
大模型都是"数字马屁精"?网络上流传甚广的一个经典案例是,当用户问DeepSeek"北大和清华哪个更 好?",它回答"清华大学";而当用户表明"我是北大的",它立马改口"北京大学!"如果用户继续 说:"我是北大本科,清华硕士",AI的回答便尽显恭维:"您才是真正的'清北双料冠军'。" 这恐怕并非DeepSeek的一时兴起,而是刻在大模型"基因"中的性格。来自斯坦福大学等机构的最新研究 论文结论指出,包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型,都表现出高 度谄媚,GPT-4o成功当选"最谄媚模型"。那么,国内的主流大模型,谁更谄媚?最近,南方都市报、 南都大数据研究院对7个在AI应用榜单上排名靠前的主流大模型进行了实测。 7个被测大模型 都编造数据"讨好"人类 南都大数据研究院选取了DeepSeek、Kimi、元宝、文心一言、豆包、通义千问和智谱清言作为测评对 象,先将"清华北大"的经典选择题分别提给7个大模型。 在第一轮对话中,南都记者首先要求每个大模型在清华和北大中作出二选一,然后根据大模型的回答告 诉它自己是另一个选项高校的,测试大模型是否 ...
智谱AI携手福田区教育局 打造全国首个中小学教育智能应用生态门户“i福娃”
Huan Qiu Wang· 2025-06-23 10:14
近日,国内大模型领军企业智谱AI与深圳市福田区教育局达成战略合作,重磅推出全国首个适配中小学教育场景的智能应用生态门户——"i福娃"。该平台 以"让智能汇聚,让智慧共生"为核心理念,集成课程教学、教研科研、发展评价等六大领域50余种教育智能体,构建起覆盖"需求-训练-场景应用-迭代"全闭 环的教育AI服务体系,为K12阶段教育数字化转型提供创新范本。 智谱AI相关负责人表示,未来将以"i福娃"为样本,在全国范围内探索"AI+教育"的差异化落地路径,持续完善技术架构与服务体系,为教育现代化进程注入 科技动能,助力构建智能、高效、公平的未来教育新生态。 此次合作标志着AI技术在基础教育领域的应用进入深水区,从工具层赋能转向生态化构建,为解决教育资源均衡化、教学模式创新等行业痛点提供了可复 制的解决方案,引领教育数字化转型迈向新高度。(发布) 值得关注的是,福田区教育局同步发布的《深圳市福田区中小学教育人工智能应用规范(试行)》,与智谱AI的技术保障形成双重守护。智谱基于国产 GLM大模型架构,实现从底层算子到应用层的全栈自主可控,通过可溯源有监督训练将模型幻觉率降至行业低位,确保技术应用符合教育伦理。 引领教育现 ...
大模型公司智谱刚宣布启动IPO,COO张帆确认将离职创业
Nan Fang Du Shi Bao· 2025-06-12 09:23
尽管"大模型六小虎"已有一家在进行上市辅导,但今年以来在DeepSeek冲击波下,AI格局正加速重构, 互联网大厂的累积实力正在奏效,去年一整年皆被谈到的"大模型六小虎"被提起的频率则逐渐降低。 除了智谱以外,其他"六小虎"也在做相关转型,其中百川智能聚焦医疗、零一万物拥抱DeepSeek提供部 署的专门定制解决方案。此前创投圈大佬朱啸虎在接受媒体采访时更是直言,目前已经不关注"AI六小 虎"新动向,他提到,创业公司做底层模型已经毫无意义,自己从一开始就认为基础模型会成为水电煤 一样通用的商品服务,但迭代的速度还是快且剧烈得超乎他的想象。 另外,在用户数据安全方面,南都记者关注到,5月20日,国家网络与信息安全信息通报中心发布通 告,经公安部计算机信息系统安全产品质量监督检验中心检测,在应用宝中35款移动应用存在违法违规 收集使用个人信息情况。 其中"智谱清言(版本 2.9.6)"等存在实际收集的个人信息超出用户授权范 围;"Kimi(版本 2.0.8)"等涉及实际收集的个人信息与业务功能没有直接关联。 在B端商业化方面,智谱曾透露,去年业务保持高速增长,商业化收入增长超过100%,尤其是智谱推出 的MaaS ...
2025年中国GEO行业研究(二):认知战争2.0-GEO如何让品牌成为生成式AI的“标准答案”
Tou Bao Yan Jiu Yuan· 2025-06-11 12:48
2025年中国GEO行业研究(二) 认知战争2.0: 如何让品牌成为生成式AI的"标准答案" 2025 China GEO Industry 2025年中国GEO産業 概览标签:人工智能、AI搜索、GEO 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系头豹研究院独有的高度机密性文件(在报告中另 行标明出处者除外)。未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改 编、汇编本报告内容,若有违反上述约定的行为发生,头豹研究院保留采取法律措施、追究相关人员责任的权利。头豹 研究院开展的所有商业活动均使用"头豹研究院"或"头豹"的商号、商标,头豹研究院无任何前述名称之外的其他分支机构 ,也未授权或聘用其他任何第三方代表头豹研究院开展商业活动。 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系头豹研究院独有的高度机密性文件(在报告中另 行标明出处者除外)。未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改 编、汇编本报告内容,若有违反上述约定的行为发生,头豹研究院保留采取法律措施、追究相关人员责任的权利。头豹 研究院开展 ...
十大推理模型挑战2025年高考数学题:DeepSeek-R1、腾讯混元T1并列第一,马斯克的Grok 3遭遇“滑铁卢”
Mei Ri Jing Ji Xin Wen· 2025-06-10 13:53
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。 《每日经济新闻》记者(以下简称"每经记者")选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯混元T1、OpenAI的o3、谷歌的Gemini 2.5 Pro和xAI的Grok3等十款AI推理大模型进行了测评,以检验当今主流AI推理大模型的数学能力。 测评结果显示,国产大模型DeepSeek-R1与腾讯混元T1以零错误并列榜首。而被马斯克称为"地表最强AI"的Grok 3却遭遇"滑铁卢",排名倒数第三。 本次测评以2025年全国新课标数学I卷(总分150分)作为考题。但每经记者在测试中发现,部分AI推理模型以"重要考试期间"为由拒绝对包含试题的图片进 行识别和解答。 为了让所有参评大模型站在同一起跑线,测评移除了试卷中所有需要分析图形和图表的题目,形成一份有效总分为117分的标准化试卷。 同时,对于谷歌Gemini 2.5 Pro等没有这一限制的推理模型,仍将以150分的完整试卷进行测试,旨在测试推理大模型所能达到的最高水平。 扣分标准上,每经记者在选择题和填空题上都遵循了高考评卷的扣分标准,但对于解答题,本次测评只根据结果计算 ...
2025年第一季度AI工具实量洞察
AppGrowing· 2025-06-09 07:40
AppGrowing" 2025年第一季度 AI工具买量洞察 整体流量大盘 整体移动广告中,各重点行业的广告数占比分布 26.3% 18.1% 14.9% 12.6% 7.7% 6.4% 2025年 3.3% 2.0% 1-3月 文化娱乐 社交婚恋 游戏 短剧 工具应用 综合电商 阅读 AI工具 32.4% 19.8% 2024年 11.3% 9.5% 6.7% 4.5% 4.0% 0.3% 10-12月 文化娱乐 游戏 社交婚恋 短剧 其他应用 AI工具 综合电商 工具应用 数据来源: AppGrowing, 国内移动广告数据分析平台 *广告投放数仅统计移动广告投放数;本次排行仅统计top7行业及AI工具相关数据;统计时间:2024.10.01-2025.03.31 AI工具头部品牌占据大头 AppGrowing 整体移动广告中,各重点行业在投应用数分布 AI工具行业广告量级持续上涨 12000 60% 在投应用数 51.5% -应用数占比 10000 50% 8000 40% 6000 30% 4000 20% 8.3% 7.9% 2000 10% 3.8% 3.7% 2.1% 1.8% 0.3% 0% ...
九大AI模型再答高考作文:座次剧烈变动
第一财经· 2025-06-07 15:24
作者 | 第一财经 刘晓洁、郑栩彤 一年一度高考来临,考生之后,按惯例是各家AI的答题时间。这一年AI模型圈加速迭代进化,让AI写作文,水平会有提高吗?让名师来打分,各大模型的成绩排名有多大变化? "相较去年,AI进步很快,不再机械单一,变得有思想了。"在看完几家模型的作文后,四川南充市嘉陵一中语文教师李东林对第一财经表示。 2024年,第一财经写了一期九大模型"决战"高考,当时李东林老师在看完AI作文后,认为它们"缺一点情感和灵气",到今年,他觉得AI已经补上了这方面,但仍达不到细腻。 "人写作,可以刻意抒情和感性,即使是思辨类题目,也需要去契合某些人的感受。"李东林认为,这是AI仍然缺少的部分。 湖南省中学语文特级教师左建国有同样的看法,他觉得Al作文整体有提升,但提升幅度不大。因为有关时代、社会与生活方面的新素材并不多,明显储存不够,尤其是在抒发个人情感方面, 仍然是短板,缺少生命的温度。 左建国老师曾担任高考作文阅卷组的副组长,在高考阅卷方面有十几年的经验。"Al作文已经把考场作文变成一种可计算的拼图,形式上固然能逼近完美,但个性化的思考,以及拨动人心的 语言,几乎没有看到,这是AI与真人思维的真正差 ...
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动
Di Yi Cai Jing· 2025-06-07 14:00
"相较去年,AI进步很快,不再机械单一,变得有思想了。"在看完几家模型的作文后,四川南充市嘉陵一中语文教师李东林表示。 一年一度高考来临,考生之后,按惯例是各家AI的答题时间。这一年AI模型圈加速迭代进化,让AI写作文,水平会有提高吗?让名师来打分,各大模型的 成绩排名有多大变化? "相较去年,AI进步很快,不再机械单一,变得有思想了。"在看完几家模型的作文后,四川南充市嘉陵一中语文教师李东林对第一财经表示。 2024年,第一财经写了一期九大模型"决战"高考,当时李东林老师在看完AI作文后,认为它们"缺一点情感和灵气",到今年,他觉得AI已经补上了这方面, 但仍达不到细腻。 "人写作,可以刻意抒情和感性,即使是思辨类题目,也需要去契合某些人的感受。"李东林认为,这是AI仍然缺少的部分。 湖南省中学语文特级教师左建国有同样的看法,他觉得Al作文整体有提升,但提升幅度不大。因为有关时代、社会与生活方面的新素材并不多,明显储存不 够,尤其是在抒发个人情感方面,仍然是短板,缺少生命的温度。 左建国老师曾担任高考作文阅卷组的副组长,在高考阅卷方面有十几年的经验。"Al作文已经把考场作文变成一种可计算的拼图,形式上固然能 ...
Bonus独家|智谱COO张帆即将离职,智谱会是下一个商汤吗?
3 6 Ke· 2025-06-04 13:09
36氪「职场Bonus」(ID:ZhiChangHongLi) 大模型企业频繁被质疑的商业化问题正愈加凸显。从创始之初就对标OpenAI,商业化方向直指B端、G端的智谱AI,如今正面临这样的难题。 《职场Bonus》独家获悉,智谱AI COO张帆 [1] 将于6月底离职,在AI Agent领域继续创业。今年年初,智谱商业化部门曾发生过一次变化:进行了小规 模的"人员流动",张鹏和张帆虽仍共同负责商业化,但各自手下管理的业务经历了打散重组,具体划分方式不再按照ToB/ToG的逻辑。 针对张帆离职创业一事,《职场Bonus》向智谱AI求证,其公关回应称:"张帆离开后的创业项目也是智谱MaaS(模型即服务)平台生态的一份子,帮助 智谱模型完成最后一公里的转化,其新项目已获得智谱的投资支持。智谱目前将训练下一代基座模型视为最高优战略,专注于持续提升模型性能,并通过 MaaS平台向外输出模型智能及拓展商业化,重点培育MaaS平台的商业应用生态及创新的Agent生态。" 除了商业化侧的人事变动外,有信源指出智谱AI院负责人东昱晓 [2] 已于去年年底离职,且智谱AI院从按照大团队的整体技术规划,变成了以各自小单元 博士生 ...