Nvidia(NVDA)
Search documents
不用额外缓存!英伟达开源大模型记忆压缩方案,128K上下文提速2.7倍
量子位· 2026-01-14 04:42
这项技术与前几天大火的DeepSeek条件记忆模块有所不同。 DeepSeek的Engram模块依赖的是"按需查表"的静态学习路径,而英伟达走的是动态学习的路子,关键在于 上下文压缩 。 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 提高大模型记忆这块儿,美国大模型开源王者——英伟达也出招了。 联合Astera研究所、斯坦福大学、UC伯克利、加州大学圣地亚哥分校等机构推出了 TTT-E2E 方法。 在128K超长文本上处理速度比全注意力模型快2.7倍,处理2M上下文时提速达35倍,性能还不打折。 通过实时学习将关键内容压缩到自身权重中,让模型在测试阶段依然保持学习状态。 这样既避免了额外缓存的负担,又能精准捕捉长文本中的核心逻辑。 把每个训练序列都模拟成测试序列,先在 内循环 中对其进行测试时训练,再在 外循环 中优化模型的初始参数,确保初始状态就能快速适配 测试时的学习需求,实现了训练与测试的端到端对齐优化。 为了平衡效率与稳定性,TTT-E2E还设计了三项关键优化。 一是采用「迷你批处理+滑动窗口」的组合策略。将测试时的训练数据分成多个迷你批,配合8K大小的滑动窗口注意力,既解决了单token梯 ...
国际银价首次站上90美元,市值突破5万亿美元,超英伟达成全球第二大资产!黄金32万亿美元市值位居榜首!
Mei Ri Jing Ji Xin Wen· 2026-01-14 04:38
国际银价首次站上90美元,市值突破5万亿美元,超英伟达成全球第二大资产!黄金32万亿美元市值位居榜首!还能涨吗? 每经编辑|杜宇 1月14日,国际白银现货价格首次突破每盎司90美元,再创历史新高。今年以来,白银价格已上涨25%。 图片来源:每经媒资库 截至1月14日发稿,现货白银报89.70美元/盎司,涨3.21%。 沪银涨超7%。 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 值得注意的是,受银价提振,白银总市值首次站上5万亿美元大关,已超越英伟达成为全球第二大资产。根据市值数据平台CompaniesMarketCap的数据,目 前白银市值为5.039万亿美元;黄金以32.162万亿美元的市值位居榜首,芯片巨头英伟达以4.523万亿美元的市值滑落至第三。前十名榜单如下: 截至发稿,现货黄金报4623.36美元/盎司。 | Rank + | Name | | � Market Cap | ﺟ Price | � Today . | Price (30 days) | | --- | --- | --- | --- | --- | --- | --- | | 1 | | Gold G ...
超越英伟达!白银总市值突破5万亿美元大关,成全球第二大资产
Jin Rong Jie· 2026-01-14 04:30
1月14日,现货白银强势拉升,盘中一度涨3.55%,首次站上90美元关口。白银价格不断走高之下,白 银总市值也首次突破5万亿美元大关,超越英伟达成为全球第二大资产。 期货频道更多独家策划、专家专栏,免费查阅>> 责任编辑:栎树 据市值数据平台CompaniesMarketCap的数据,目前白银市值为5.039万亿美元;黄金以32.162万亿美元的 市值位居榜首,芯片巨头英伟达以4.523万亿美元的市值滑落至第三。 ...
CES大会Rubin完整发布,科技巨头芯片模型持续迭代
Ping An Securities· 2026-01-14 04:11
Investment Rating - The industry investment rating is "Outperform the Market" (maintained) [1][50]. Core Insights - The demand for AI infrastructure is expected to continue increasing due to the rapid growth in the size and token consumption of AI models. Major tech companies like NVIDIA are continuously empowering AI model and application development through product iterations, thus benefiting from the AI industry boom [3][48]. - The report highlights the launch of NVIDIA's Rubin platform, which features six new chips designed for AI supercomputers, significantly reducing inference costs and enhancing performance [4][30]. - AMD introduced the Helios rack, aimed at meeting the Yotta-level AI computing demands, showcasing a substantial increase in performance and efficiency [40][41]. Summary by Sections NVIDIA Developments - NVIDIA unveiled the complete Rubin platform at CES 2026, which includes six new chips that work in extreme synergy to lower inference costs significantly. The token cost for inference can be reduced to one-tenth of the previous Blackwell platform [2][4]. - The Rubin platform features innovations such as the NVIDIA Vera CPU and Rubin GPU, which enhance training time and reduce costs for large-scale AI models [4][16]. - NVIDIA also launched the Alpamayo series of open-source AI models for autonomous driving, which includes a model with 10 billion parameters designed for the assisted driving research community [30][31]. AMD Developments - AMD's Helios rack is designed to meet the increasing demand for AI computing, featuring a core computing tray powered by four new AMD hardware components, providing 2.9 exaflops of AI computing power [41][42]. - The MI455X GPU, part of the Helios platform, boasts a performance increase of 10 times compared to its predecessor, with 320 billion transistors and advanced cooling technology [43][44]. - AMD plans to release the next-generation MI500 product in 2027, which is expected to achieve a 1000-fold increase in AI performance over four years [46][47]. Investment Recommendations - The report recommends focusing on AI themes for investment opportunities, highlighting companies in AI algorithms and applications, AI computing, and autonomous driving sectors [3][48]. - Specific strong buy recommendations include companies like 恒生电子, 中科创达, and 盛视科技, while also suggesting to monitor other firms in the AI space [3][48].
白银首次站上90美元!市值突破5万亿美元超越英伟达
2 1 Shi Ji Jing Ji Bao Dao· 2026-01-14 04:07
1月14日周三,现货白银开盘强势拉升,盘中一度涨3.55%,首次站上90美元关口,再创历史新高。 (文章来源:21世纪经济报道) 花旗预测,在基础情景下的0-3个月黄金目标价现为每盎司5000美元,白银目标价为每盎司100美元。若 按此计算,白银价格或仍有超10%的涨幅。 受银价提振,白银总市值首次站上5万亿美元大关,已超越英伟达成为全球第二大资产。 根据市值数据平台CompaniesMarketCap的数据,目前白银市值为5.039万亿美元;黄金以32.162万亿美元 的市值位居榜首,芯片巨头英伟达以4.523万亿美元的市值滑落至第三。 ...
光通信板块集体回暖 英伟达Rubin平台完整版发布 机构看好Scaleup CPO大规模产业化
Zhi Tong Cai Jing· 2026-01-14 04:06
山西证券发布研报称,Rubin Ultra有望成为Scaleup CPO大规模产业化的重要里程碑,预计2027/28的 Trainium4、TPUv8等也有望成为CPO/NPO重要推动者。CPO的重要投资环节在于shufflebox&多段光纤 布线带来的高密插芯和大量光纤、采用先进封装的OE、大量定制的FAU等。 光通信板块集体回暖,截至发稿,华虹半导体(01347)涨5.69%,报94.8港元;京信通信(02342)涨 5.44%,报2.52港元;鸿腾精密(06088)涨5.66%,报4.67港元;汇聚科技(01729)涨2.11%,报14.99港元。 消息面上,CES2026英伟达发布Rubin架构。作为英伟达数据中心硬件路线图的关键里程碑,Rubin平台 并非单一GPU产品,而是整合了CPU、GPU、DPU、NIC、NVLink互联及以太网交换的全栈解决方 案。其核心目标是大幅提升AI性能与能效:单GPU的AI推理性能较前代提升5倍,训练性能提升3.5倍。 ...
港股异动 | 光通信板块集体回暖 英伟达Rubin平台完整版发布 机构看好Scaleup CPO大规模产业化
智通财经网· 2026-01-14 04:03
Group 1 - The optical communication sector is experiencing a collective rebound, with notable stock price increases for companies such as Huahong Semiconductor (up 5.69% to HKD 94.8), Jingxin Communication (up 5.44% to HKD 2.52), Hongteng Precision (up 5.66% to HKD 4.67), and Huiju Technology (up 2.11% to HKD 14.99) [1][1][1] Group 2 - At CES 2026, NVIDIA announced the Rubin architecture, which is a significant milestone in its data center hardware roadmap, integrating CPU, GPU, DPU, NIC, NVLink interconnect, and Ethernet switching into a comprehensive solution [1][1] - The primary goal of the Rubin platform is to significantly enhance AI performance and energy efficiency, with single GPU AI inference performance improving by 5 times and training performance by 3.5 times compared to previous generations [1][1] - Shanxi Securities released a report indicating that Rubin Ultra is expected to become a crucial milestone for the large-scale industrialization of Scaleup CPO, with Trainium4 and TPUv8 anticipated to be important drivers for CPO/NPO in 2027/28 [1][1] - Key investment aspects of CPO include high-density plug cores and extensive fiber optics resulting from shufflebox and multi-segment fiber wiring, advanced packaging of OE, and a large number of customized FAUs [1][1]
10亿美元联手英伟达!AI医疗风口再起,产业链核心标的梳理
Jin Rong Jie· 2026-01-14 03:41
摩根大通医疗健康大会在旧金山正式召开,大会首日,英伟达与礼来宣布,将在五年内斥资10亿美元在 旧金山湾区建立一个新的联合研究实验室,以加速AI药物研发进程。双方将汇集各自在人工智能技术 与药物研发领域的资源,探索人工智能和加速计算在药物发现流程中的应用,推动新药开发效率提升。 此前OpenAI推出ChatGPT Health,支持用户将医疗记录和健康应用安全连接至AI聊天机器人,结合用户 健康信息提供相关服务,覆盖健康咨询、数据解读等多个场景。国内蚂蚁集团推出的AI健康助手"蚂蚁 阿福"也获得了大量用户关注,链接多家医院与真人医生,实现健康咨询到就医服务的衔接。 中信证券研报提出,2026年AI医疗的支付方更加明确且支付力更强,AI医疗商业化确定性有所提升, 将加速重构医药市场,可关注AI制药、基层AI医疗应用等相关方向。爱建证券指出,AI医疗在政策、 技术、产品和应用场景方面保持快速发展,未来应用场景将从三级医院下沉到基层终端和用户个人, AI医疗落地进程将持续推进。国金证券提到,摩根大通医疗健康峰会作为全球医疗投资的风向标,多 家中国企业已发布现场演讲计划,会议有望提振创新药行业BD预期,改善行业整体情绪 ...
?AI推理狂潮席卷全球 “英伟达挑战者”Cerebras来势汹汹! 估值狂飙170%至220亿美元
Zhi Tong Cai Jing· 2026-01-14 03:27
该公司的最新估值较9月的投资轮大幅上升,当时Cerebras Systems 的估值仅仅约为81亿美元。在那之后 不久,英伟达与AI芯片初创公司,同时也是Cerebras Systems竞争对手之一的Groq签署了一项重要许可 协议,并收购了该AI芯片公司的大部分芯片设计人才,这也大举提振了投资者们对于人工智能芯片领 域的看涨热情。 英伟达前不久与AI芯片初创公司Groq达成的200亿美元非独家授权合作协议,将其AI推理技术授权给英 伟达,并且在交易完成后Groq创始人及核心研发团队将加入英伟达,可谓共同凸显出随着"全球AI推理 大浪潮"全面来袭,叠加谷歌TPU AI算力集群带来的越来越大竞争压力,英伟达力争通过"多架构AI算 力+巩固CUDA生态+引进更多AI芯片设计人才"来维持其在AI芯片领域高达90%市场份额的绝对主导 权,并且英伟达欲以Groq+以色列AI初创公司AI21 Labs连下关键两子锁住AI全栈话语权。 (原标题:?AI推理狂潮席卷全球 "英伟达挑战者"Cerebras来势汹汹! 估值狂飙170%至220亿美元) 智通财经APP获悉,有媒体援引知情人士透露的消息报道称,"AI芯片超级霸主"英 ...
深度共创 绝影与英伟达推进AGI开发
Zhong Guo Jing Ji Wang· 2026-01-14 03:26
双方基于NVIDIA TensorRT Edge-LLM,以端到端的高效解决方案,推动车载AI技术规模化商业落地。 TensorRT Edge-LLM是一款全新的开源C++框架,专为LLM和VLM推理而设计,旨在满足日益增长的高 性能边缘端推理需求。 "SenseAuto的成果展示了NVIDIA的边缘AI和LLM软件栈如何能够在大规模的真实汽车应用场景中落 地。"NVIDIA汽车业务副总裁Rishi Dhall表示。"通过利用NVIDIA DRIVE平台以及TensorRT和面向边缘 的LLM能力,SenseAuto正在推动智能座舱和自动驾驶体验的发展,使多模态AI更接近可量产部署。此 次合作彰显了我们汽车生态的实力,即将前沿AI转化为实用的车载创新。" 自动驾驶领域,绝影通过集成视觉语言模型(VLM)支持和优化推理能力的TensorRT Edge-LLM,显著提 升了系统对复杂交通场景的认知与决策能力。通过部署简化的工具链,模型可快速适配NVIDIA DRIVE AGX Orin和Thor等主流车载计算平台。 CES2026期间,绝影与英伟达以Drive AGX高算力平台为基石,在算子开发、模型量化等核心技 ...