推理

Search documents
英伟达CEO黄仁勋:AI推理需求激增,特朗普取消AI扩散制度是利好
news flash· 2025-05-28 22:29
英伟达CEO黄仁勋在最近的演讲中提出了四个意外发现:一是AI推理需求的增长超过了计算能力的提 升;二是特朗普总统取消了拜登政府的AI扩散制度,这被认为对美国有利;三是企业级AI领域, Agentic AI表现出色,甚至超过通用AI;四是行业AI方面,全球各地积极投资本土制造和AI应用,新工 厂普遍采用AI技术。(新浪财经) ...
英伟达CEO黄仁勋列举出四大意外:1、推理AI已经创造更多的计算需求。2、(美国总统特朗普)取消(前总统拜登任期内出台的)AI扩散制度的决定是极好的。特朗普希望美国获胜。3、在企业级AI,Agentic AI正在发挥作用。它甚至比通用AI更好。4、对于行业AI,诸多地区热衷于本土制造并到处修建工厂。所有的新工厂都在使用AI。
news flash· 2025-05-28 22:07
英伟达CEO黄仁勋列举出四大意外: 1、推理AI已经创造更多的计算需求。 2、(美国总统特朗普)取消(前总统拜登任期内出台的)AI扩散制度的决定是极好的。特朗普希望美 国获胜。 3、在企业级AI,Agentic AI正在发挥作用。它甚至比通用AI更好。 4、对于行业AI,诸多地区热衷于本土制造并到处修建工厂。所有的新工厂都在使用AI。 ...
英伟达CEO黄仁勋谈及Deepseek,称:推理模型要求更大的算力(支持),这正驱动推理需求。
news flash· 2025-05-28 21:41
英伟达CEO黄仁勋谈及Deepseek,称:推理模型要求更大的算力(支持),这正驱动推理需求。 ...
MedBench最新榜单出炉!深兰科技医疗大模型综合测评第一
Zheng Quan Ri Bao· 2025-05-28 14:14
MedBench是中文医疗大模型第一权威评测平台,由上海人工智能实验室与上海市数字医学创新中心联 合国内多家医疗机构和科研单位设立,该平台汇聚了顶级医疗机构的专家经验和知识储备,已为全球超 过387个模型提供评测。 深兰科技DeepBlue-MR-v1医学推理大模型是由深兰科技自主研发的医学推理大模型,擅长临床医学问 诊、辅助医学诊断和制定诊疗方案等任务,通过对医学教科书、诊疗指南、专家论文、病案病历、医学 推理、医学术语以及心理咨询等海量数据的清洗、构建和医学专家团队标注,运用自研训练体系,实现 了人类医学推理能力对齐的基于Transformer架构的稠密大语言模型。DeepBlue-MR-v1医学推理大模型 在海量高质量的医学数据上进行预训练,构建医学推理语义空间,通过训练监督微调、医学推理指令增 强和多阶段自适应强化学习算法实现医学推理能力迭代提高。 5月27日,国内权威医疗大模型评测平台MedBench发布最新评测榜单。深兰科技DeepBlue-MR-v1医疗 大模型不仅以复杂医学推理评测第一的成绩持续霸榜,而且在多个综合评测中以94.2的高分荣膺桂冠。 榜单显示,参与本次评测的大模型有腾讯优图天衍医 ...
英伟达(NVDA.US)绩前大摩坚定唱多:更关注推理需求爆发 下半年增长路径已打开
智通财经网· 2025-05-28 08:59
Core Viewpoint - Nvidia is set to release its Q1 FY2026 earnings report, with analysts expecting revenue of $43.3 billion, up from $26 billion year-over-year, and adjusted EPS of $0.88 compared to $0.61 a year ago [1] Group 1: Earnings Expectations - Analysts predict Nvidia's Q1 FY2026 revenue to be $43.3 billion, significantly higher than the previous year's $26 billion [1] - Adjusted EPS is expected to be $0.88, an increase from $0.61 year-over-year [1] Group 2: Impact of H20 Sales Ban - Morgan Stanley notes that the H20 chip sales ban to China will have a significant impact, estimating a revenue loss of approximately $1 billion for Q1 FY2026 and $5 billion for Q2 FY2026 [1][2] - The firm believes that Nvidia lacks a complete substitute for the H20 product and that the likelihood of a quick resolution to the sales ban is low [2] Group 3: Production and Supply Chain Insights - Morgan Stanley has observed improvements in the production issues related to the GB200 rack, with approximately 1,500 units delivered in April, indicating a potential increase in supply [2][3] - The current monthly delivery rate for GB200 racks is at an annualized level of 18,000 units, suggesting that previous pessimistic forecasts regarding production capacity may be overly negative [3] Group 4: Market Demand and Future Growth - There is a strong demand for inference capabilities, with large-scale customers reporting demand exceeding expectations, which is a critical long-term variable for Nvidia [3][4] - Morgan Stanley maintains a positive outlook for Nvidia's growth in the second half of the year, emphasizing that if the company can communicate confidence in supply improvements and demand growth during the earnings call, the stock is likely to perform well [4]
AI算力需求涌向模型推理,国产芯片站上竞技台了
Di Yi Cai Jing· 2025-05-28 07:22
Core Insights - The Chinese data center accelerator card market is experiencing a significant shift, with domestic computing power expected to exceed 40% in the first half of 2024, up from approximately 30% last year [1][2] - NVIDIA's CEO highlighted the ongoing AI investment trend, indicating that the demand for AI computing power is evolving, particularly with the rise of inference chips [1][8] - The introduction of DeepSeek has led to a notable increase in the demand for inference chips, which are expected to constitute over 57.6% of the market by 2024 [8][11] Market Dynamics - The construction of data centers is accelerating, with a projected 97.3% year-on-year growth in China's accelerated computing server market in 2024 [4] - The number of successful bids for intelligent computing centers in China has increased significantly, indicating a robust demand for computing resources [4] - Universities and enterprises are increasingly seeking computing power, with many opting for cloud solutions or purchasing their own computing cards [5][6] Technological Shifts - The demand for inference capabilities is reshaping the chip composition in the market, allowing domestic chips to gain traction as they are suitable for inference tasks [11][12] - The performance requirements for inference chips are lower, enabling a broader range of domestic chips to compete effectively against NVIDIA [10][11] - Companies like Tencent are adapting to the changing landscape by increasing their focus on inference needs, indicating a shift in AI application strategies [9][13] Competitive Landscape - NVIDIA's market share in China's data center accelerator card market has decreased from 95% to around 65.2%, while domestic chip manufacturers are gaining ground [11][13] - The introduction of export controls on NVIDIA's chips has prompted the company to consider launching a new AI chip tailored for the Chinese market [13] - Domestic AI chip manufacturers, such as Cambricon, are beginning to report profitability, reflecting a positive trend in the domestic chip market [12]
大模型玩不好数独?!Transformer作者初创公司公布排行榜:o3 Mini High“变异数独”正确率仅2.9%
量子位· 2025-05-28 04:22
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 大模型做数独,总体正确率只有15%??? 继出场自带十篇完整学术论文的 史上首个"AI科学家" 之后,Transformer作者Llion Jones又带着他的创业公司Sakana AI来搞事情了。 这次,Sakana AI公布了一个AI模型 解决数独问题能力的排行榜 。 问题集是该公司推出的 全新基准Sudoku-Bench ,包含了 从简单的4x4到复杂的9x9现代数独 问题,旨在考验大模型 创造性推理能力 。 榜单显示,大模型不仅总体正确率只有 15% ,在9×9的现代数独中,即使是高性能模型 o3 Mini High ,正确率也只有2.9%。 | 3 | oluvuu-pollull lesauci kvalu | | --- | --- | | Model | Puzzles Solved | | O3 Mini High | 14.0% | | Gemini 2.5 Pro | 11.0% | | Qwen 3 235B A22B | 8.0% | | Qwen 3 30B A3B | 7.0% | | Grok 3 Mini | 6.0% | ...
港科大Apple新研究:Tokens使用量减少,模型推理还更强了
量子位· 2025-05-28 04:22
Laser团队 投稿 量子位 | 公众号 QbitAI 1+1等于几? 这一研究也在引起了讨论: 现在的大推理模型(LRMs)已经展现出了非凡的推理能力。但是面对这样最简单的数学问题,现有的LRMs仍需要花费1400+的tokens来思 考。 那么有办法让LRMs在推理思考时更快更强吗? 来自港科大、港城、滑铁卢大学和Apple的研究人员,最近提出了 Laser系列新方法 ,实现了更好的模型效率和准确率平衡,做到了两者的 共同显著提升。 经过Laser和它的进阶方法Laser-D、Laser-DE训练后的模型,相较于训练前模型或者其他方法训练的模型,在准确率(Accuracy)和 Tokens使用效率(Efficiency)上,同时取得了显著的提升。 例如在知名复杂数学推理基准AIME24上,Laser-D和Laser-DE方法能够让模型在减少Tokens使用量 63% 的情况下,还继续提升 6.1 的性 能。 同时,研究人员还发现,经过训练的模型的思考过程里,冗余的"self-reflection"的比例大大降低,呈现出了一种更加健康的思考模式。 那么,Laser是如何让大模型推理又快又好的呢? 三大创新实 ...
大摩前瞻英伟达财报:H20影响被忽视,但爆炸性的推理需求增长才是关键
Hua Er Jie Jian Wen· 2025-05-28 03:26
据追风交易台消息,摩根士丹利5月27日发布研报称,尽管"H20销售限制"带来短期财务压力,可能导致英伟达约50亿美元的收入损失,但市场可能低估 了AI推理需求爆发式增长的长期潜力,叠加Blackwell架构供应改善,英伟达下半年业绩或迎来加速拐点。该行维持对英伟达"增持"评级,仍将其列为半导 体行业首选股。 H20政策短期冲击:库存减记与收入缺口 美国H20出口政策的变化对英伟达的收入造成重大冲击。 市场正在聚焦英伟达即将于周三美股盘后公布的第一季度财报,这家市值3.2万亿美元的公司被视为人工智能需求的风向标。 大摩预计,英伟达4月季度(当前季度)营收422亿美元,低于官方指引的430亿美元;7月季度营收435亿美元,考虑了40-50亿美元的H20相关收入减少。 根据大摩测算,H20方面的影响将导致英伟达第二季度(2025年7月)收入面临约10%的环比下行风险,这一影响尚未被市场共识充分定价。与此同时, 这并迫使公司宣布了半导体行业历史上规模最大的55亿美元库存减记。 大摩分析师估计,这将导致英伟达4月季度减少约10亿美元收入,7月季度减少约50亿美元收入。 尽管公司正紧急游说美国政府放宽限制,并计划推出无H ...
4万多名作者挤破头,CVPR 2025官方揭秘三大爆款主题, 你卷对方向了吗?
机器之心· 2025-05-28 03:02
机器之心报道 机器之心编辑部 当今计算机视觉领域最热门的三个方向。 当今计算机视觉领域最热门的话题有哪些? 「自 2020 年 NeRF 论文首次发表以来,利用深度网络进行 3D 重建已成为趋势。如今高斯泼溅(Gaussian splatting)技术进一步推动了这一发展,」CVPR 2025 程序联合主席、美国俄勒冈州立大学副教授 Fuxin Li 分享道,「本质上,计算机视觉与图形学正在融合。神经渲染研究的兴起,显著推动了 3D 相关论文数量的 增长。」 图像与视频合成 随着研究的不断发展,学界现在能够通过视频和图像形式更精确地呈现环境信息。对该领域的探索已成为 CVPR 2025 论文的焦点,图像和视频合成成为今年大会上最大的类别之一。 「今年商业聊天机器人的一大趋势是它们已经实现了多模态化;它们现在不仅能分析和生成文本,还能分 析和生成图像,有时还能生成视频,」Isola 解释道。「即将出现的能力是生成完整的交互式世界。CVPR 刚刚,CVPR 官方给出了最新统计,他们根据论文提交情况,总结出三大方向: 这份统计是基于全球 4 万多名作者 13008 份投稿结果产生的。相比往年,今年的投稿数量增长了 ...