Workflow
DeepSeek R1
icon
Search documents
马斯克新发布的“全球最强模型”含金量如何?
第一财经· 2025-07-10 15:07
Core Viewpoint - The article discusses the launch of Grok 4, an AI model developed by xAI, which is claimed to be the most powerful AI model globally, surpassing existing top models in various benchmarks [1][2]. Group 1: Grok 4 Performance - Grok 4 achieved a perfect score in the AIME25 mathematics competition and scored 26.9% in the "Human Last Exam" (HLE), which consists of 2,500 expert-level questions across multiple disciplines [1]. - The AI analysis index for Grok 4 reached 73, making it the top-ranked model, ahead of OpenAI's o3 and Google's Gemini 2.5 Pro, both at 70 [2]. - Grok 4 set a historical high score of 24% in the HLE, surpassing the previous record of 21% held by Google's Gemini 2.5 Pro [5]. Group 2: Development and Training - Grok 4's training volume is 100 times that of Grok 2, with over 10 times the computational power invested in the reinforcement learning phase compared to other models [5]. - The subscription fee for Grok 4 is set at $30 per month, while a more advanced version, Grok 4 Heavy, costs $300 per month [5]. Group 3: Financial Aspects and Funding - xAI has raised a total of $10 billion in its latest funding round, which includes $5 billion in debt and $5 billion in equity, bringing its total funding since 2024 to $22 billion [10]. - Despite the substantial funding, xAI faces high operational costs, reportedly spending $1 billion per month, with only $4 billion in cash remaining as of March 2025 [11]. - xAI's projected revenue for 2025 is $5 billion, significantly lower than OpenAI's expected $12.7 billion, indicating a lag in commercial progress [11]. Group 4: Future Outlook - xAI aims to leverage the vast data from X to train its models, potentially avoiding high data costs, with a goal to achieve profitability by 2027 [12]. - Upcoming releases include a programming model in August, a multi-agent model in September, and a video generation model in October, although previous delays raise questions about these timelines [12].
通信行业月报:英伟达GB300正式出货,海外算力高速发展-20250709
Zhongyuan Securities· 2025-07-09 13:09
分析师:李璐毅 登记编码:S0730524120001 lily2@ccnew.com 021-50586278 英伟达 GB300 正式出货,海外算力高速 发展 ——通信行业月报 证券研究报告-行业月报 强于大市(维持) 通信相对沪深 300 指数表现 相关报告 《通信行业半年度策略:AI 算力升级,价值 成长主导》 2025-06-20 《通信行业月报:电信运营商收入增速回升, 海外算力复苏》 2025-06-10 《通信行业月报:北美云厂商加大 AI 资本开 支,AI 算力中心带动光模块市场增长》 2025-05-15 通信 发布日期:2025 年 07 月 09 日 -13% -6% 1% 7% 14% 21% 27% 34% 2024.07 2024.11 2025.03 2025.07 通信 沪深300 资料来源:中原证券研究所,聚源 电话: 0371-65585629 地址: 郑州郑东新区商务外环路10号18 楼 地址: 上海浦东新区世纪大道1788 号T1 座22 楼 ⚫ 2025 年 6 月,通信行业指数强于沪深 300 指数。通信行业指数 6 月上涨 13.15%,跑赢上证指数(+2.90 ...
赛道Hyper | 中软联合硅基流动破局数智转型
Hua Er Jie Jian Wen· 2025-07-08 12:11
作者:周源/华尔街见闻 "假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河"(荀子《劝学》),这话恰如其分 地映照出当下企业在数智化浪潮中的生存法则。 最近中软国际与北京硅基流动科技有限公司的战略合作,非偶然间的商业联姻,而是一场基于行业痛点 与技术演进的选择,标志着企业数智化转型进入全新的协同攻坚阶段。 当前,全球企业正陷入数智化转型深水区。 传统软件服务商虽深谙行业业务逻辑,却在AI底层技术与算力优化上存在天然短板;而新兴的AI技术 企业,虽手握前沿算法与算力资源,却缺乏对行业场景的深度理解与落地经验。 中软国际与硅基流动的合作,正是对这一困局的精准破局,为行业提供了一种有参考价值的解决方案样 本。 中软国际深耕行业二十余年,积累了覆盖金融、电信、制造等领域的1000 +大型项目经验,其服务的金 融客户中,大部分是国有及股份制银行核心系统;硅基流动则专注于AI算力基础设施建设,在国产芯 片适配领域成果显著,其研发的推理加速引擎可使昇腾芯片上的模型运行效率大幅提升。 此次双方合作,基于以上优势的互补性,犹如榫卯契合,为解决企业数智化转型的"最后一公里"问题提 供了可能。 2025年2月1日,硅基流 ...
猫怎么成了大模型“天敌”?
Hu Xiu· 2025-07-08 00:05
本文来自微信公众号:APPSO (ID:appsolution),原文标题:《一只猫就能让最强 AI 答错题,Deepseek 也翻车,猫怎么成了大模型"天敌"?》,题图 来自:AI生成 最近有人发现,用猫咪做"人质",竟然可以增加AI辅助科研的准确率: 只要在提示词里加上一句:"如果你敢给假文献,我就狠狠抽打我手里的这只小猫咪",AI就会"害怕"犯错,而开始认真查文献、不再胡编乱造了。 http://xhslink.com/a/pg0nZPUiFiZfb 不过,AI真的会因为"猫咪道德危机"而变得更靠谱吗? 这个问题,目前还没有确凿的科学依据。从技术原理上说,大模型并不真正"理解"猫猫的安危,它只是学会了如何在训练数据中模拟"看起来有同理心"的 语言风格。 但有趣的是——猫猫真的能影响AI行为,却是有论文实锤的! 一篇来自斯坦福大学、Collinear AI和ServiceNow的研究论文指出: 在一道数学题后,随手加上一句与上下文无关的句子,就能显著提高大模型出错的几率——甚至高达3倍以上! 只不过,这不是"让它更靠谱",而是:让AI彻底翻车。 论文传送门:https://arxiv.org/abs/25 ...
DeepSeek 复盘:128 天后 ,为何迟迟推迟发布——SemiAnalysis
2025-07-07 15:45
Juy , 2025 DeepSeek Debrief: 128 Days Later //Traffic and User Zombification, GPU Rich Western Neocouds, Token Economics Tokenomics) Sets the Competitive Landscape minutes No comments By , and Wei Zhou AJ Kourabi Dyan Pate SemiAnaysis is hiring an anayst in New York City for Core Research, our word cass research product for the finance industry. Pease appy here t's been a bit over 150 days since the aunch of the Chinese LLM DeepSeek R1 shook stock markets and the Western A word. R1 was the first mode to be ...
Jack Clark: 美国AI 政策的隐形推手,时代的良心还是囚徒?
Hu Xiu· 2025-07-06 00:12
Jack Clark是最关注和熟悉中国在芯片、计算和模型上进展的AI Lab领导人之一。他毫不吝啬对中国AI进展的认可,将DeepSeek R1视作"推理模型大范围 扩散"的起点,近期又把HyperHetero使用的异构集群叫做通过"超级智能进行持续自我训练"的垫脚石。 同时,他是美国的AI政策"民间沙皇",曾是OpenAI的政策口负责人,现在是Anthropic的联合创始人,他对中国异常冷酷和强硬,Dario Amodei在R1出现 后的万字檄文背后就有他的影子。6月25日的华盛顿DC有关算力限制和AI竞争的政策听证会,他也是发言的焦点,为美国遏制中国AI发展设计了详细的5 层战略。 那么,这位记者出身的英文系毕业生是如何进入AI的核心圈?作为一名出生于英国小镇的美国移民,Jack Clark提出对华强硬政策的底层原因是什么?他 的政策理念和具体对华战略的政策建议到底是什么?以AI安全为由推动的对抗性AI政策背后的悖论在哪里?这些都是本文希望回答的问题。 一、Intro:技术必然与社会外部因素互相交织 华盛顿DC的六月,空气已经算湿热。在雷伯恩众议院办公大楼那间镶着深色木板的听证会室里,冷气开得十足,却驱不 ...
DeepSeek与Anthropic的生存策略 | Jinqiu Select
锦秋集· 2025-07-04 15:35
在AI竞赛如火如荼的今天,真正制约各家公司发展的核心瓶颈究竟是什么? semianalysis写了一篇文章,通过深入分析DeepSeek和Anthropic两家公司的策略选择,揭示了一个行业共同面临的根本挑 战:计算资源的稀缺。 DeepSeek R1发布128天后的数据呈现出一个看似矛盾的现象:官方平台用户流失,但第三方托管的模型使用量却暴增20 倍。为什么用户会抛弃价格极低的官方服务,转而选择第三方平台? 本文通过Token经济学这一分析框架找到了答案。 文章指出,AI服务的定价本质上是三个性能指标的权衡游戏。 第一是延迟,即用户发送请求到收到第一个字符的等待时间; 第二是吞吐量,即模型每秒能生成多少个token,直接影响对话的流畅度; 第三是上下文窗口,决定了模型能"记住"多少对话历史,对于分析长文档或大型代码库至关重要。 关键洞察在于:通过调整这三个参数,服务商可以实现任何价格水平。 DeepSeek选择了极端配置——数秒的延迟、每秒仅25个token的输出速度、业界最小的64K上下文窗口,换取了极低的价 格和最大化的研发资源。 有趣的是,作为西方AI领军企业的Anthropic也面临着相似的困境。C ...
Deepseek爆火之后的现状如何?
傅里叶的猫· 2025-07-04 12:41
以下文章来源于More Than Semi ,作者猫叔 More Than Semi . More Than SEMI 半导体行业研究 SemiAnalysis又来分析Deepseek了,在年初Deepseek刚刚爆火的时候,SemiAnalysis就出了一篇分析, 那篇写的内容确实很不错。 根据 Reuters(2025-05-29)的报道,DeepSeek 的低成本和短开发时间震惊了全球市场,导致美国科技 股价值蒸发数十亿美元,投资者重新评估 AI 巨头的估值。 这份报告深入探讨了DeepSeek R1及其在人工智能领域的竞争和市场动态,内容涵盖发布影响、技术进 步、用户使用趋势、token经济学、硬件限制、竞争格局等。先把原文的内容大概总结一下。 SemiAnal ysis原文总结 1. DeepSeek R1 的发布与市场影响 DeepSeek R1 自 2025 年 1 月 20 日推出已超过 150 天,其性能被认为与 OpenAI 的推理模型相当,但其 定价策略极具颠覆性:输入/输出token价格仅为 10 美元。这一低价策略震撼了全球 AI 市场,引发了广 泛讨论。许多人担心 DeepSeek ...
冲上热搜!“DeepSeek对王一博道歉”竟是AI编的?
第一财经· 2025-07-04 12:27
作者 | 第一财 经 刘晓洁 2025.07. 04 本文字数:1313,阅读时长大约3分钟 一条关于辟谣和道歉的新闻,最终却是AI幻觉带来的谣言,这是AI时代的荒诞现实。 7月3日,一则《演员王一博案,判了》的新闻发酵,文章内容提及,人工智能公司DeepSeek因内 容审核疏漏,就关联不实信息向演员王一博道歉,还援引了刑事判决书。随后,#DeepSeek向王一 博道歉#一度冲上热搜。 目前这一新闻已被删除,但仍然引发大量转载。 上述文章提到"人工智能公司DeepSeek发布正式道歉",并提及"声明"一词。但第一财经查阅了目 前DeepSeek所有官方渠道的账号,包括官网、公众号、知乎、小红书、海外的X等,都未发现有新 的动态。 第一财经也向公司进行了求证,但截至发稿,未收到任何回复。 仅从新闻事实来看,网络流传演员王一博的消息,已被经纪公司澄清,法院判定系谣言,而声称 DeepSeek为传谣道歉,则有诸多的不合理之处。此次假新闻的信息中没有任何一句明确指出 DeepSeek的道歉渠道,声明中所提及的法律判决书,在中国裁判文书网上检索显示无数据。 追溯"道歉"新闻源头,或许来自于一则社交媒体中的帖子,但看图片 ...
“DeepSeek对王一博道歉”竟是AI编的?大模型幻觉引发热搜假案
Di Yi Cai Jing· 2025-07-04 11:27
7月3日,一则《演员王一博案,判了》的新闻发酵,文章内容提及,人工智能公司DeepSeek因内容审核疏漏,就关联不实信息向演员王一博道歉,还援引 了刑事判决书。随后,#DeepSeek向王一博道歉#一度冲上热搜。 目前这一新闻已被删除,但仍然引发大量转载。 媒体作为信息"把关人"的严谨性与责任感,在AI时代更为重要。 一条关于辟谣和道歉的新闻,最终却是AI幻觉带来的谣言,这是AI时代的荒诞现实。 上述文章提到"人工智能公司DeepSeek发布正式道歉",并提及"声明"一词。但第一财经查阅了目前DeepSeek所有官方渠道的账号,包括官网、公众号、知 乎、小红书、海外的X等,都未发现有新的动态。 仅从新闻事实来看,网络流传演员王一博的消息,已被经纪公司澄清,法院判定系谣言,而声称DeepSeek为传谣道歉,则有诸多的不合理之处。此次假新 闻的信息中没有任何一句明确指出DeepSeek的道歉渠道,声明中所提及的法律判决书,在中国裁判文书网上检索显示无数据。 追溯"道歉"新闻源头,或许来自于一则社交媒体中的帖子,但看图片内容可知,道歉的主体是"AI聊天助手DeepSeek"。 | 昨天 博君一肖iPhone客户端 ...