大语言模型(LLM)

Search documents
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 12:01
曲凯: 今天我们请来了国内强化学习 (RL) 领域的专家吴翼,吴翼目前是清华大学交叉信息研究院助理教授,他曾经在 OpenAI 工作过,算是国内最早研究强化学 习的人之一,我们今天就争取一起把 RL 这个话题给大家聊透。 首先吴翼能不能简单解释一下,到底什么是 RL? 因此,RL 其实更通用一些,它的逻辑和我们在真实生活中解决问题的逻辑非常接近。比如我要去美国出差,只要最后能顺利往返,中间怎么去机场、选什么航 司、具体坐哪个航班都是开放的。 但 RL 很不一样。 RL 最早是用来打游戏的,而游戏的特点和分类问题有两大区别。 第一,游戏过程中有非常多的动作和决策。比如我们玩一个打乒乓球的游戏,发球、接球、回球,每一个动作都是非标的,而且不同的选择会直接影响最终的结 果。 第二,赢得一场游戏的方式可能有上万种,并没有唯一的标准答案。 所以 RL 是一套用于解决多步决策问题的算法框架。它要解决的问题没有标准答案,每一步的具体决策也不受约束,但当完成所有决策后,会有一个反馈机制来评 判它最终做得好还是不好。 吴翼: RL 是机器学习这个大概念下一类比较特殊的问题。 传统机器学习的本质是记住大量标注过正确答案的数据对。 ...
杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
AI科技大本营· 2025-03-21 06:35
责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 黄教主的演讲 感觉才没过几天,今年的 GTC 英伟达大会也即将迎来尾声了。 而今年比尔·达利则是对话"AI 教父" 杨立昆 (Yann LeCun),很有前后呼应的感觉。 但 GTC 并不只有黄仁勋和杨立昆,还有许多精彩的演讲与对话,比方说: ………… 接下来的一段时间, CSDN AI 科技大本营 将会在「 GTC 2025 大师谈 」栏目持续更新这些精华内容的全文整理,尽情期待。 比尔·达利 自己就在采访杨立昆之后进行了一场 演讲 ,系统性地讲解了英伟达 2024 一整年的四大项目进展,内容干货很多; OpenAI o1 作者 诺姆·布朗 (Noam Brown)和英伟达的 AI 科学家来了一场 对话 ,他认为现在 AI 圈最需要来一场革命的,就是这些五花八 门的 基准测试 (Benchmark),而且改这个东西还不需要花太多算力资源; 2018 年诺贝尔化学奖得主 弗朗西斯·阿诺德 (Frances Arnold)围绕 AI for Sciense 还有蛋白质工程进行了一场相当硬核的 圆桌对话 ; UC 伯克利教授 彼得·阿比尔 (P ...
GenAI 的存储解决方案 第 7 部分:解决方案梳理
Counterpoint Research· 2025-03-18 09:14
对于 GenAI 的解决方案而言,诸如带宽和容量之类的优势固然重要,但功耗、占用面积和价格等成 本因素也需要加以考量。由于存储器是一种依赖于中央处理器(CPU)的被动组件,其配置会根据 处理器而做出改变。在这方面, ARM 近期的战略调整以及基于 MoE 的大语言模型(LLM)可能出 现的变化,都可能会导致未来架构和解决方案发生改变。 Haylee Xu / 市场专员 电话: +86 15959754429 邮箱:haylee.xu@counterpointresearch.com 数据来源:Source: Counterpoint Research 点击阅读原文下载完整版 PDF 报告 Rick Cui / 客户服务总监 电话: +86 13801127537 邮箱:rick@counterpointresearch.com 媒体采访 业务咨询 ...
彭博数据洞察 | 透过AI看新闻,投资信号抓得准
彭博Bloomberg· 2025-03-14 03:08
以数据聚焦重点,重点永不失焦!欢迎阅读 "彭博数据洞察" 月报,基于超过8000个彭博企业 数据集,为您提供有关市场热点问题、最新趋势的深度分析与洞见。您可点击文末 "阅读原文" 链接,联系我们预约有关数据服务的演示。 扫描二维码 立即订阅 彭博数据洞察月报 本期聚焦: AI驱动的新闻摘要功能 助力提炼洞见与信号 利用AI从新闻标题中提炼信号 实时新闻资讯作为市场动向的重要推手,已成为量化投资者构建投资策略的关键情报来源。 彭博旗舰产品"新闻标题与正文"为此提供全面支持,覆盖全球上万个主题领域,遍及所有地 区及主流企业,并配有丰富的标签体系,可标注话题、证券代码及人物信息。 拥有完备的标签系统后,结构化的新闻资讯仍需进一步解读,以消除信息冗余。以一个案例 说明:2 0 2 4年7月3日,美国Ke y st o n e输油管道突发关停事件,首条新闻发布数分钟后原油 价格即大幅上涨(见图1)。要精准追踪此类事件,需锁定具有相同主题代码的关联新闻。 图1:原油期货(CLJ4)在Keystone输油管道关停后的走势 数据来源:彭博 基于彭博新闻数据,用户可运用大语言模型(LLM)对相关标题进行自然语言处理(NLP) ...
DeepSeek对英伟达长期股价的潜在影响
CHIEF SECURITIES· 2025-03-12 06:38
2025/02/11 中国宏观经济研究员 杨曦 010-66555831 xi_yang@chiefgroup.com.hk DeepSeek 对英伟达长期股价的潜在影响 1 月 27 日,DeepSeek 在中国区和美国区的苹果 App Store 免费榜上同时登顶,成为下载量第 一的应用程序。与此同时,美国科技股市场却遭遇了大幅下跌,费城半导体指数(SOX)下跌了 9.2%,创下自 2020 年 3 月以来的最大单日跌幅。其中,英伟达股价下跌了近 17%,市值蒸发了近 6000 亿美元,成为美股历史上最大规模的单日市值缩水之一。甚至 WTI 原油价格也在盘中一度下 跌了 3%。一些交易员认为,如果大模型的训练和推理不再需要大量算力,数据中心的电力需求也 会随之减少,进而减少对石油发电的依赖。 这场科技股的大幅波动,主要归因于 DeepSeek 在训练和推理成本上的显著优势。 | 模型(1) | 上下文长度 | 最大思维链长度(2) | 最大输出长度(3) | 百万tokens | 百万tokens | 百万tokens | | --- | --- | --- | --- | --- | --- | --- ...