大语言模型

Search documents
在欧洲,没人提DeepSeek
36氪· 2025-03-06 10:31
以下文章来源于极客公园 ,作者靖宇 极客公园 . 各家公司的想法和打法差异也很大。 小米在MWC的展馆中SU7 Ultra是绝对的主角|图片来源:极 客公园 用极客视角,追踪你最不可错过的科技圈。欢迎同步关注极客公园视频号 同样打着AI旗号, 文 | 靖宇 来源| 极客公园(ID:geekpark) 封面来源 | IC photo 「某某公司租的机器狗,都累没电趴窝了。」 在世界移动通信大会MWC2025的群里,有人爆料了这个多少有一点喜感的画面。当地时间3月3日,MWC2025在巴塞罗那正式开幕。联想、华为、小 米、谷歌、三星、LG以及众多全球通信巨头公司,在CES之后,再次在伊比利亚半岛向大家展示自己的技术实力。 租来的「机器狗」可能是大公司将参展观众拉进自己展台的利器,但AI,才是各家公司用来展示的真正噱头。 大公司没赶上DeepSeek 「MWC越来越没有『通信』味儿,参展公司关注更多的是人们能用这些技术做什么。」联想集团智能设备业务商用事业部高级副总裁&总经理Steve Long,如此评价正在逐渐变化的移动通信大会。或者换句话说,MWC正在并且可能越来越像每年1月份举行的消费电子盛会CES。 小米展 ...
超越DeepSeek!刚刚,腾讯元宝登顶下载榜
21世纪经济报道· 2025-03-03 15:14
Core Viewpoint - Tencent Yuanbao has rapidly ascended to the top of the free app download rankings in China, indicating strong user growth and engagement in the AIGC application sector [1][3]. Group 1: User Growth and Market Position - As of March 3, Tencent Yuanbao ranked first in the free app download chart, surpassing DeepSeek and positioning itself as the fastest-growing AIGC app [1][3]. - On February 22, Tencent Yuanbao experienced a significant jump of over 100 places in the download rankings, indicating a surge in user interest [3]. Group 2: Product Features and Innovations - Tencent Yuanbao launched a desktop version on March 1, supporting both Windows and macOS, which enhances user experience by allowing image reading and intelligent dialogue [5]. - The desktop version integrates advanced capabilities, enabling users to analyze images and documents, thereby improving reading efficiency [5][6]. - Future updates for the desktop version will include features like word search and translation, as well as screenshot inquiries [7]. Group 3: Integration with DeepSeek - Tencent Yuanbao has integrated multiple models, including DeepSeek-R1 and DeepSeek-V3, enhancing its ability to understand images and documents [15]. - The integration of DeepSeek's capabilities with Tencent's multi-modal understanding technology allows for a more comprehensive analysis of images beyond simple text recognition [14][13]. - This innovation reflects a shift from merely utilizing existing model capabilities to creating differentiated value through product innovation [16]. Group 4: Strategic Adjustments and Industry Trends - Tencent has proactively embraced the trend of integrating DeepSeek across its product lines, demonstrating agility in its strategic adjustments [18]. - The company has incorporated DeepSeek into various products, including WeChat, Tencent Documents, and QQ Music, expanding its application across its extensive user base [19][20]. - The integration of DeepSeek into Tencent's financial services and enterprise communication tools enhances the professionalism and timeliness of these services [21][22]. Group 5: Competitive Landscape - Tencent's extensive C-end user base and diverse product matrix position it well to accelerate the practical application of large models in various scenarios [24]. - The industry anticipates that Tencent's innovations will lead to new AI application experiences beyond traditional Q&A formats, leveraging its vast user engagement [24].
英伟达电话会全记录,黄仁勋都说了什么?
华尔街见闻· 2025-02-27 11:09
Core Viewpoint - Nvidia's CEO Jensen Huang expressed excitement about the potential demand for AI inference, which is expected to far exceed current large language models (LLMs), potentially requiring millions of times more computing power [1][5]. Group 1: AI Inference and Demand - The demand for inference will significantly increase, especially for long-thought inference AI models, which may require several orders of magnitude more computing power than pre-training [5]. - Nvidia's Blackwell architecture is designed for inference AI, improving inference performance by 25 times compared to Hopper while reducing costs by 20 times [6][34]. - The DeepSeek-R1 inference model has generated global enthusiasm and is an outstanding innovation, being open-sourced as a world-class inference AI model [1]. Group 2: Financial Performance and Projections - Nvidia reported record revenue of $39.3 billion for the fourth quarter, a 12% quarter-over-quarter increase and a 78% year-over-year increase, exceeding expectations [32]. - The data center revenue for fiscal year 2025 is projected to be $115.2 billion, doubling from the previous fiscal year [32]. - Nvidia's CFO Colette Kress expects profit margins to improve once Blackwell production increases, with margins projected to be in the mid-70% range by the end of 2025 [2][11]. Group 3: Product Development and Supply Chain - The supply chain issues related to the Blackwell series chips have been fully resolved, allowing for the next training and subsequent product development to proceed without hindrance [1]. - Blackwell Ultra is planned for release in the second half of 2025, featuring improvements in networking, memory, and processors [16][60]. - Nvidia's production involves 350 factories and 1.5 million components, achieving $11 billion in revenue last quarter [8][53]. Group 4: Market Dynamics and Growth Areas - The global demand for AI technology remains strong, with the Chinese market's revenue remaining stable [20][68]. - Emerging fields such as enterprise AI, agent AI, and physical AI are expected to drive long-term demand growth [14][24]. - Nvidia's full-stack AI solutions will support enterprises throughout the entire AI workflow, from pre-training to inference [25]. Group 5: Infrastructure and Future Outlook - The current AI infrastructure is still utilizing various Nvidia products, with a gradual update expected as AI technology evolves [26][27]. - Nvidia's CUDA platform ensures compatibility across different generations of GPUs, facilitating a flexible update process [28]. - The company anticipates significant growth in data center and gaming businesses in the first quarter, driven by strong demand for Blackwell [44].
这些AI公司,倒在黎明前夜
创业邦· 2025-02-27 10:15
以下文章来源于进击波财经 ,作者进击波研究院 进击波财经 . 沈帅波和他的研究团队给你带来全产业,全品类,最新的商业经济视角。倡导犀利,冷静,专业而又具 少年感的财经内容 来 源丨进击波财经(ID:jinbubo) 作者丨关珊月 编辑丨郑晶敏 图源丨Midjourney 我相信大家都能感觉到,现在已经是AI爆发的时代。大厂和创业公司每天都有大量关于AI的新动向,我 们追赶的速度永远跟不上市场更新的速度。整个市场紧张且兴奋。 这股浪潮下,大家关注的对象往往在明星公司身上。然而回首望去,AI已经发展了几十年,很多公司没 有等到黎明的到来,但并不意味着它们的存在没有意义。 根据钛媒体AGI统计,从2022年11月ChatGPT发布到2024年7月,国内已经有8万家AI相关公司消失。很多 初创企业直到服务器停机的前夜仍在追问:我们究竟是被泡沫吞噬,还是为未来殉道? 此刻站在算力洪流奔涌的岸边,那些消逝的代码与理想在数据湖底闪烁微光。当所有媒体都在跟进AI行 业新动向的时候,我想用一篇文章缅怀那些倒在黎明前夜的AI公司。它们曾经是上一轮AI浪潮里的明 星,又在AI黎明前走向倒闭、卖身、创始人跑路的悲怆结局。 当世界为D ...
月之暗面 MoBA 核心作者自述:一个 “新晋大模型训练师” 的三入思过崖
晚点LatePost· 2025-02-20 14:21
"从开源论文、开源代码出发,现在已经进化到开源思维链了嘛!" 文丨Andrew Lu 注释丨贺乾明 程曼祺 2 月 18 日,Kimi 和 DeepSeek 同一天发布新进展,分别是 MoBA 和 NSA,二者都是对 "注意力机 制"(Attention Mechanism)的改进。 今天,MoBA 的一位主要研发同学 Andrew Lu 在知乎发帖,自述研发过程的三次踩坑,他称为 "三入思过 崖"。他在知乎的签名是"新晋 LLM 训练师"。 这条回答下的一个评论是:"从开源论文、开源代码出发,现在已经进化到开源思维链了嘛。" 注意力机制之所以重要,是因为它是当前大语言模型(LLM)的核心机制。回到 2017 年 6 月那篇开启 LLM 革命的 Transformer 八子论文,标题就是:Attention Is All You Need(注意力就是你所需要的一 切),该论文被引用次数至今已达 15.3 万。 注意力机制能让 AI 模型像人类一样,知道在处理信息时该 "重点关注" 什么、"忽略" 什么,抓住信息中最 关键的部分。 在大模型的训练阶段和使用(推理)阶段,注意力机制都会发挥作用。它的大致工作原理是 ...
GenAI 内存解决方案第 5 部分:DeepSeek 在芯片领域的高光时刻
Counterpoint Research· 2025-02-19 09:46
DeepSeek 的大语言模型(LLM)因其在性能上接近 ChatGPT ,但成本却大幅降低而受到关注。市 场的即时反应褒贬不一。虽然数据训练成本,比如数据标注和归类等方面的成本可能没有体现出 来,而这部分成本由政府支持,但 DeepSeek 在训练效率和低成本方面的优势依然十分明显。 DeepSeek 能否助力中国芯片制造? 中国的存储芯片或已具备成本竞争力 : 假设中国政府对构成总成本很大一部分的固定成本提供支持 ,那么与同行相比,中国已能实现有竞争力的成本。例如,2024 年第一季度 DRAM (动态随机存 取存储器)每 Gb ( 千兆字节 )的价格为 $0.34 ,此时高价的 HBM (高带宽存储器)对平均售价 的影响较小。而韩国 DRAM 的总成本大约为售价的 67% ,约为 $0.23 ,在不计固定成本的情况 下,中国的成本可能低至 $0.20 。(不过,中国的固定成本远高于韩国。) 高效的软件为低端硬件打开市场: 中国的策略是通过规模优势弥补与竞争对手在性能上的差距。华 为最新的 GPU —— Ascend 920 支持 HBM2 和 HBM2e ,而这些对于行业同行来说已是两年前的标 准,并未 ...
李彦宏:创新的本质是成本下降与生产力提升,百度将持续投入AI基础设施
IPO早知道· 2025-02-13 14:48
对芯片、数据中心和云基础设施持续投入,以打造更好、更智能的下一代模型。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,在2月11日阿联酋迪拜举办的World Governments Summit 2025峰会上,百 度创始人李彦宏与阿联酋AI部长奥马尔·苏丹·奥拉马(Omar Sultan AI Olama)对谈时表示,尽管 技术进步、成本降低,但仍需持续投入AI基础设施,以确保处于技术创新的最前沿。"我们仍需对芯 片、数据中心和云基础设施持续投入,以打造更好、更智能的下一代模型。" "今天,创新速度比以往都快得多。摩尔定律中,每18个月,性能就会翻倍 , 价格减半;如今,大 模型推理成本每年能降低90%以上。"李彦宏表示,回顾过去几百年历史,创新的本质是成本下降与 生产力提升,在AI、IT乃至更多领域,大多数创新都与降低成本有关,如成本降低一定比例,生产力 也能 同比例 提高。 同时,他谈及自动驾驶的落地应用,表示"技术进步非常快",目前,自动驾驶比人开车安全10倍, Robotaxi可以大大降低交通事故死亡率。在中国的复杂路况下,萝卜快跑的实际 ...
互联网平台涉税新规草案公布;ChatGPT早期奠基者全部离开;耐克营收全线下滑,打算重新聚焦“运动”丨百亿美元公司动向
晚点LatePost· 2024-12-20 15:54
美国三位共和党议员希望马斯克当众议院议长。 美国国会周二公布临时拨款法案,为联邦政府提供运营资金到明年 3 月。这项法案遭到埃隆·马斯 克(Elon Musk)反对,他在社交媒体上发布 20 多条帖子批评,比如不应该为国会议员加薪等。如 果这项方案在当地时间周五(20 日)没有通过,美国政府部门得不到资金支持,就会停摆。 同时有三位共和党议员在社交媒体上建议马斯克担任众议院议长,"众议院议长不必是国会议员"。 此前特朗普提议马斯克担任美国政府效率部门(DOGE)联合主席,但该部门主要负责提案。如果 马斯克成为众议院议长,他将拥有实权。众议院议长也是美国总统第二顺位继承人,但马斯克不是 美国原生公民,无法担任总统。 ChatGPT 早期奠基者全部离开 OpenAI。 据媒体报道,OpenAI 早期员工阿列克·拉德福德(Alec Radford)从 OpenAI 离职。他参与过 GPT-1 到 GPT-4o 的研发,在 2016 年加入 OpenAI,是最早把 Google 提出的 Transformer 架构用到大规模 语言训练的研究者之一,也是确立了当前大语言模型的训练模式的人之一。"只有阿列克·拉德福德 离 ...
起底 OpenAI 核心班底,600 多人和他们塑造的 AI 格局
晚点LatePost· 2024-12-04 14:52
编辑丨黄俊杰 "理想国" 的分裂,新 OpenAI 如何取代旧 OpenAI。 文丨 贺乾明 黄帧昕 数据分析、制图丨黄帧昕 OpenAI 希望用激进增长解决盈利问题。据 The Information,OpenAI 预计到 2026 年,用 400 亿美元的支出换来 260 亿美元的营收——相当于百度营收的近 1.4 倍;到 2029 年,用 1000 亿美元的支出实现盈利。 虚线为 OpenAl 公布的 未来预估收入 250 Google 拼多多 字节跳动 OpenAl Meta 0 2 0 6 4 8 以盈利公司成立时间为起点 收入(亿美元) 500 OpenAl 250 空节跳动 Google 拼多多 Meta 0 2 6 0 8 备注:OpenAl 成立年份以 2019年组建营利实体开始计算,2022 年发布 ChatGPT; Google 成立于 1998年,2000年推出第一个广告产品 AdWords; Meta (Facebook)、 字节跳动和拼多多成立和商业化产品上线为同一年,分别为 2004 年、2012 年。 收入规模比较未剔除通货膨胀因素的影响。 迄今诞生的所有互联网产品,只有两个能 ...
对话宇树科技王兴兴,造出 9.9 万元人形机器人的 90 后偏才
晚点LatePost· 2024-05-15 14:45
"24 小时一直思考一个问题,我不信问题解决不了。" 文丨贺乾明 编辑丨程曼祺 2023 年 8 月,宇树科技发布用半年时间做出的人形机器人 H1,没有很精致的外形,双手就像哆啦 A 梦那样是两个圆疙瘩,套着一件黑衣服就亮相了,不能后空翻,但走路很稳,人用力踹上去不会 倒,结合 9 万美元的价格,H1 吸引了大量目光。 时任 OpenAI 研究科学家、特斯拉前 AI 总监安德烈·卡帕蒂(Andrej Karpathy)在社交媒体上说, 他想买一两个,或者一些;还建议不要再踹机器人了。 宇树科技创始人兼 CEO 王兴兴显然没听进去。今年 5 月 13 日,宇树发布新款人形机器人 G1,同 步放出的演示视频中,王兴兴不仅踹了它,还戴上拳击手套发动正面攻击。在他看来,这是检验一 款人形机器人运动能力和稳定性的最直观办法,很多公司都不敢这么做。 上图是宇树在 2023 年 8 月发布的人形机器人 H1,下图是今年 5 月发布的 G1。图片来自宇树科技。 与第一代产品相比,8 个月后登场的新机器人能力提升明显:身体和双腿能旋转近 360°,还可以 "缓慢" 地完成鲤鱼打挺,手部也从圆疙瘩变成了有三根指头的灵巧手,能舞棍 ...