通用人工智能

Search documents
DeepSeek首次披露:理论成本利润率545%!
证券时报· 2025-03-01 08:38
3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘 密。 最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2美元/小 时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天, 成本利润率为545%。 最大程度优化推理系统,理论成本利润率高达545% 据文章介绍,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为了实现这两个目标,DeepSeek使用了 大规模跨节点专家并行(Expert Parallelism / EP)的方法,并通过一系列技术策略,最大程度地优化了大模型推理系统, 实现了惊人的性能和效率。 DeepSeek开源周收官,DeepSeek以最后一弹,再次在AI江湖激起了层层涟漪。 具体而言,在更大的吞吐的方面,大规模跨节点专家并行能够使得batch size(批尺寸)大大增加,从而提高GPU矩阵乘 法的效率,提高吞吐。 batch size在深度学习中 ...
DeepSeek宣布:活动正式收官
21世纪经济报道· 2025-02-28 08:46
2月2 8日,国内AI明星企业深度求索(De e pSe e k)为期五天的"开源周"活动正式收官。 "开源周"都发布了什么? 自2月2 4日启动以来,De e pSe e k "开源周"发布的五个项目涵盖了从计算、通信到存储的各个 方面。 2 月 2 4 日 : 首 个 开 源 的 代 码 库 为 F l a s h M L A , 这 是 针 对 H o p p e r G P U 优 化 的 高 效 M L A 解码内核,针对可变长度序列作了优化,目前已投入生产。 2 月 2 5 日 : 宣 布 将 D e e pEP 向 公 众 开 放 。 D e e pEP 是 用 于 M oE ( 混 合 专 家 ) 模 型 训 练 和 推 理 的 EP ( Ex p e rt P a r a l l e l ism , 专 家 并 行 ) 通 信 库 , 可 以 实 现 高 效 且 优 化 的 全 对 全 通信,支持包括F P 8在内的低精度运算,适配现代高性能计算需求。 2月2 6日:宣布开源D e e p G E M M。D e e p G E M M 是一个专为简洁高效的 F P 8 通用矩阵 乘 法 ( ...
英伟达股价,暴跌
半导体行业观察· 2025-02-28 03:08
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容 来自半导体行业观察综合 ,谢谢。 华尔街对 Nvidia持悲观看法。 周四,投资者发布季度预测,导致该股下跌逾 8%,给过去三个月中受到市场质疑的"七巨头"股票带 来更大压力。 该股收盘下跌至 120.15 美元,而该集团的其他成员如微软以及亚马逊也由于英伟达的盈利未能激发 出 2023 年和 2024 年人工智能涨势标志性的那种涨幅,该股也以疲软收盘。 可以肯定的是,Nvidia 第一季度的营收预测好于市场预期,首席执行官黄仁勋也指出,公司新款 Blackwell 芯片的需求"惊人"。但增长正在放缓。Nvidia 预计营收增幅约为 65%,远低于投资者过 去一年习惯的三位数增幅,同时该公司还预计毛利率将降至 71%,为至少一年以来的最低水平。 Nvidia 被视为 AI 支出健康状况的晴雨表,两年的繁荣使其估值超过 3 万亿美元。投资者希望其业 绩能够重启在 2024 年底"七巨头"股票达到峰值后陷入低迷的反弹。 最近几周,中国初创公司 DeepSeek 的低成本人工智能模型引发了投资者对大型科技公司为人工智 能基础设施投入的数十亿美元的怀疑,许多股票仍 ...
中国AI最大门派
投资界· 2025-02-27 07:06
以下文章来源于数字力场 ,作者佘宗明 数字力场 . 从Kimi到DeepSeek,从清华到浙大。 作者 | 佘宗明 运营 | 李玩 来源 | 数字力场 (ID: shuzilichang) 这两天,TMT圈有两则消息备受关注: 一是马斯克打响了「对DeepSeek反击战」——他掌舵的xAI,推出了Grok 3大模型。 20万卡集群训练、超DeepSeek-R1和GPT4o登顶竞技场(lmarena.ai)榜单、马斯克称其为「地表最聪明AI」、因回答「9.11比 9.9大」而翻车……在马斯克热搜圣体加持下,Grok 3成功制造出了一堆话题,包括#全球华人决战AI之巅#。 从Grok 3发布会图片可以看到,坐镇C位的正是两位华人科学家,其中之一就是xAI联合创始人、95后吴宇怀。 ▲Grok 3发布会上,两位华人坐镇C位,左三为吴宇怀。 由此深扒可知,xAI的12名创始成员中,华人占了4席,除了吴宇怀以外,还有本科毕业于清华大学的前谷歌科学家戴子航、本科毕业 于浙江大学的前DeepMind科学家张国栋和哈佛数学天才杨格。 二是「杭州六小龙」之一群核科技启动IPO,冲击「全球空间智能第一股」。 抵抗熵增,打捞有趣。 ...
DeepSeek突然宣布:最高降价75%!
21世纪经济报道· 2025-02-26 12:08
作 者丨董静怡 杨万林 编 辑丨包芳鸣 刘巷 尹华禄 黎雨桐 2月2 6日,De e pSe e k在其API开放平台发布错峰优惠活动通知。 根据通知,北京时间每日0 0 : 3 0—0 8 : 3 0为错峰时段,API调用价格大幅下调,其中De e pSe e k - V3降至原价的5 0%,De e pSe e k -R1降至2 5%。De e pSe e k鼓励用户在该时段调用,享受更经 济更流畅的服务体验。 | 充值余额 | 赠送余额 查看有效期 | | --- | --- | | ¥0.00 CNY | ¥10.00 cny | 据了解,De e pSe e k模型价格以"百万t o k e n s "为单位。t o k e n是模型用来表示自然语言文本的 的最小单位,可以是一个词、一个数字或一个标点符号等,De e pSe e k根据模型输入和输出的 总t o k e n数进行计量计费。 据证券时报报道,记者查询价格细节发现,De e pSe e k主要有两款主力模型De e pSe e k - c h a t (基础大模型,对应V3)和De e pSe e k -r e a s o n e r( ...
刷新中的阿里:当它不再被认为只是一家电商公司
晚点LatePost· 2025-02-21 15:30
阿里向 "科技 + 零售" 公司转型。 2 月 20 日阿里巴巴发布 2024 年四季报,远超预期的业绩、单日涨超 10% 和一个月内涨近 50% 的股价, 让很多长期关注阿里的人感叹:"这还是阿里吗?" CEO 吴泳铭也不再像过去那样低调,在电话会中回答第一个提问时,就抛出了四个 "最",阿里巴巴集团 是 "最重要 AI 玩家""亚洲最大""规模最大""to C 最多应用场景"。分析师的提问几乎全部围绕 "AI",而此 前的 10 年,电商才是他们最关心的话题。 除了电话会,财报的数据中最值得在意的是,阿里本季度的资本开支 —— 318 亿元,环比增长 80%。吴 泳铭还强调,阿里将加大投入三大 AI 领域,未来三年将是云建设最集中的三年,在云和 AI 的基础设施投 入预计将超越过去十年的总和。这给了资本市场非常大的想象空间,提振了全球投资者对中国科技行业的 投资信心。 过去一年半,是阿里 "重新创业" 的一年半,也是阿里坚定 AI 投入的一年半,这家公司试图向市场提供一 个他们真正认可的新增长故事。 从吴泳铭 2023 年 9 月出任阿里 CEO 后不久提出的 "用户为先,AI 驱动" 战略,到当年互联网 ...
阿里预计未来资本开支超过去十年总和;瑞幸利润微增,迎接成本挑战;游戏和广告让B站连续两个季度盈利丨百亿美元公司动向
晚点LatePost· 2025-02-21 15:30
未来三年,阿里资本开支将超过过去十年总和。 今晚的阿里 2025 第三财季业绩会上,阿里集团 CEO 吴泳铭表示,AI 是几十年一遇的机会。阿里 的 AI 战略第一目标是 AGI (通用人工智能)的实现,可能远远超过现在可见的任何一个应用场 景。 他说,从实现 AGI 的商业价值来看,标准定义是能够完成 80% 以上的人类能力。全球 GDP 的 50% 支出是劳动工资支出,包括脑力劳动和体力劳动。如果实现 AGI ,人工智能相关产业大概率 将会是全球最大的产业,有可能影响或者替代现在 50% 左右的 GDP 构成。 管理层判断,阿里是亚洲市场具备几个关键要素的重要 AI 玩家,有亚洲最大、全球第四的云服务 和先进的自研 AI 模型,在 to c 生态上有最多应用场景。未来三年,阿里在云和 AI 的基础设施投 入预计将超越过去十年的总和(约 3800 亿元),要猛攻 AI 基础大模型和原生应用,死守技术领 先地位,以及用 AI 彻底改造电商等老业务,挖出用户新价值。 受 AI 相关利好推动,年初至今阿里股价已上涨近 49%,今日财报发布后,阿里盘前涨超 10% 至 138.2 港元。 9.9 价格战下,瑞幸咖啡 ...
晚点独家丨字节全员会:重提“务实的浪漫”,要做能发明新技术的科技公司
晚点LatePost· 2025-02-14 11:13
进入过渡期,找回旧状态。 文丨孙海宁 高洪浩 编辑丨黄俊杰 高洪浩 2 月 13 日上午,字节跳动举办了新一期的 All Hands 全员会,字节 CEO 梁汝波、CFO 高准、人力资源负 责人华巍、电商业务负责人康泽宇、AI 业务负责人朱文佳、TikTok CEO 周受资与全体员工交流,并回应 了部分提前收集的员工提问。 2024 年的全员会上,梁汝波将新一年的关键词定为了 "危机感"。今年,他不再提危机,而是重提 "务实的 浪漫"。 "务实的浪漫" 是字节创始人张一鸣在 2019 年公司周年庆上提出的。当时,他以此反驳外界评价他本人 "过于理性"、认为字节跳动是 "AB 测试公司" 和 "App 工厂"。"我觉得我们是一个非常浪漫的公司......只 不过我们是务实的浪漫。" 张一鸣觉得浪漫是面向未来、拥抱不确定性、保持可能性;务实是大力出奇 迹、刨根问底、抓住本质;而务实的浪漫就是 "把想象变成现实,face reality and change it(面对现实并改 变它)"。 字节正处于新旧业务过渡期。拥有超 7 亿日活用户的抖音依旧稳健,但用户、广告收入、电商销售额的增长 均不可避免地开始放缓;另一 ...
杭州,开始第一波抢人了
投资界· 2025-02-11 07:38
何以杭州? 作者 I 周佳丽 报道 I 投资界PEdaily 这是今年杭州最热闹一幕。 宇树科技登上春晚舞台,De e pSe e k引爆全球,现在他们正大量招兵买马,开启杭州今年第一波抢人——最高薪酬将达到百万元级别, De e pSe e k更是开出诱人条件,连实习生都能月入过万。 至此,杭州告别"电商之都"的标签,取而代之的是"六小龙"生长崛起,这也引发不少省级地方发出"为什么是杭州?"的灵魂拷问。 新年开启,杭州继续发力——今年杭州经济政策市级财政资金将从去年的490亿元,增加到502亿元,专门统筹1 5%的产业政策资金, 集中投向优质新质生产力,加大对通用人工智能、人形机器人等未来产业支持, 希望培育更多类似于De epSe ek、宇树科技这样的创 新企业 。 何以杭州?答案似乎渐渐浮现。 从宇树到DeepSeek,开启招聘 宇树科技,杭州最火独角兽之一,在今年央视蛇年春节联欢晚会上以机器人扭秧歌的创意融合舞蹈而引爆互联网。但在创投圈,宇树 科技和身后90后掌门人王兴兴早已是熟面孔。2 016年,王兴兴来到杭州创立宇树科技,迅速开启融资之路,身后聚集着一支豪华的投 资人队伍。 无独有偶,De e p ...
DeepSeek 刷新全球 AI 格局;50 美元模型蒸馏术;美国公司们宣布 8000 亿美元算力投资丨AI 月报
晚点LatePost· 2025-02-10 09:50
DeepSeek 在 1 月 20 日上线 R1 模型后,凭借高性能(比肩 OpenAI o1)、低使用成本(API 价格是 o1 的 1/30)、开源模型权重 等,迅速接管 OpenAI 等公司主导的大模型叙事。 DeepSeek 怎么刷新全球大模型格局 李飞飞在内的团队如何低成本 "蒸馏" 出特定领域追赶 o1 的模型 到去年底,OpenAI 年化收入超 60 亿美元 OpenAI 的星门计划:投 5000 亿美元建算力 26 家获得超过 5000 万美元融资的 AI 公司,中国有 2 家 大模型公司的爬虫遭 "下毒" 抵抗 这之前,因为 OpenAI 展示能力超强的 o3 模型,不少 OpenAI 和硅谷的研究者正在讨论 AGI (通用人工智能)即将到来。R1 发 布后,行业焦点变成 DeepSeek,一些媒体用 "DeepShock" 形容它带来的冲击。 市值大跌的英伟达、台积电,现在已经开始反弹 2025 年 1 月的全球 AI 大事记。 文丨贺乾明 编辑丨程曼祺 2025 年 1 月的 AI 月报,你会看到: 以下是我们第 3 期 AI 月报,欢迎大家在留言区补充我们没有提到的重要进展。 格局丨D ...