大模型竞争

Search documents
饥渴的大厂,面对大模型还需新招
3 6 Ke· 2025-04-30 04:11
昨天晚上,跟朋友聊起大模型。 他说现在各家都"卷"到一个新阶段,模型之间差距已经很小,只能用"遥遥领先"或者"吊打同行"这种词 来形容。 从基准测试和数据来看,很多模型都远超 DeepSeek R1、GPT-4o,但继续往下比的空间已经不大了,真 正的差异更多在使用方式上。 这让我开始思考:大模型竞争,是不是已经进入存量博弈阶段? 1 说到"存量",就绕不开一个字:"卷"。不卷,哪来的存量?那问题来了:这个卷,到底在卷什么? 我觉得,表面看到的就三点:算力成本、数据质量和场景渗透。 以前大模型拼参数多,现在开始拼谁的成本低。 阿里家的 Qwen3,用"混合推理"的技术,简单问题用低算力能快速回答,复杂问题再慢慢思考,这样 部署成本直接降到了 DeepSeek-R1 的 1/3 到 1/4。 腾讯混元 T1,3890 亿参数的模型,通过稀疏激活机制,算力利用率比传统模型提升了 30% 以上。 百度的文心大模型,虽然没公开具体成本,但它的推理速度在工业级场景里比竞品快 20%,也算是有 自己的优势。 字节跳动没直接在公开场合提到过算力优化,但它通过抖音、今日头条的场景化落地,间接降低了通用 大模型的部署压力。 所 ...
当接入DeepSeek成标配,文小言的杀手锏是什么?
雷峰网· 2025-03-25 12:36
" 文小言开放了,也更强了。 " 作者丨李希 大模型的竞争,终于来到了第三个赛段。 2023年,基础模型混战。 这一年,百度率先发布文心大模型3.5,厂商们疯狂内卷基础大模型技术; 2024年:应用为王, ToB市场掀起"骨折式"价格战,ToC领域则上演"撒币式"买量大战,市场热度堪比 盛夏蝉鸣; 2025年:黑马入场,竞争逻辑生变。 Deepseek以颠覆者姿态杀入赛场。如何应对冲击,似 乎成为了今天大模型竞争的主题。 技术实力虽惊艳,Deepseek却面临着"甜蜜的烦恼"——一家150人规模的公司,如何承接单日2000万活 跃用户的洪流? Deepseek"杀死"大模型竞争了吗?显然没有。 直到今天,无论是百度的文小言,还是字节的豆包、阿里的通义千问、腾讯的元宝,仍然还有不少用户留 在平台上。 那么,究竟谁能真正定义大模型终局? 01 打不过or真开放? Deepseek出现之后,无数大模型厂商的高层们都在开会,会上只聊一个事:面对Deepseek,我们怎么竞 争? 但不久,大家就都先后想明白了一件事情:合作是标配,不如真开放。 2025年的大模型赛道,还没能出现一个具有"绝对统治力"的产品。文小言、豆包 ...