Workflow
推理
icon
Search documents
Q2财报公布在即 宏观不确定性冲击下高通(QCOM.US)会作何指引?
Zhi Tong Cai Jing· 2025-04-28 07:30
高通(QCOM.US)将于美东时间4月30日(周三)美股盘后公布截至3月的第二财季业绩。华尔街分析师预 测,高通Q2营收将同比增长13.3%至106.4亿美元,调整后的每股收益将同比增长15.6%至2.82美元。 当然,必须提及一个巨大的不确定性。在特朗普政府反复无常的关税政策的影响下,整个电子产品供应 链可能在未来几个季度遭受重击,这意味着身处其中的高通同样可能遭受打击。 投资者可能关注关税对高通带来的影响,因此会密切关注高通对未来业绩给出的指引。瑞银上周就曾表 示,高通可能会公布与预期相符的第二财季业绩,但鉴于该公司面临的不确定性,其业绩指引可能会较 为疲弱。瑞银分析师在一份报告中表示:"我们预计,高通的业绩将与预期一致,但鉴于关税和宏观不 利因素将影响全球智能手机需求,我们预计该公司对截至6月的第三财季的指引将低于典型的季节性水 平,即环比下降低个位数百分比(市场预期为环比下降2%)。" 分析师补充称:"总的来说,我们仍然对高通持观望态度,因为在手机业务下滑的情况下,高通的边缘 业务在很长一段时间内仍难以对冲其损失。同时,考虑到高通约66%的营收来自中国,手机业务还面临 关税相关不确定性的影响。" 按业 ...
过去四周,AI推理爆了,GPU在燃烧,英伟达依旧供不应求
Hua Er Jie Jian Wen· 2025-04-27 10:38
Group 1 - Investor sentiment has deteriorated due to macroeconomic and supply chain risks, but demand for NVIDIA's GPUs has surged due to the significant need for inference chips driven by large language models (LLMs) [1] - Token generation has increased over five times since the beginning of the year, creating immense pressure on the ecosystem and driving a surge in investment to handle these workloads [1] - AI companies are experiencing explosive user growth, with many forced to compete for GPU resources to meet the massive demand for inference software [1] Group 2 - Morgan Stanley has lowered its target price for NVIDIA to $160 from $162, reflecting overall valuation declines in the peer group rather than changes in the company's fundamentals [2] - Despite strong demand, supply constraints for NVIDIA's Blackwell chips, particularly the GB200/300 models, are limiting the ability to meet the explosive growth in demand [2][4] - Morgan Stanley has raised its revenue forecast for fiscal year 2026 by 10.7% and adjusted earnings per share up by 11.9%, indicating that these figures may still be conservative [5]
内存压缩技术新突破,提高AI推理效率!
半导体芯闻· 2025-04-25 10:19
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容编译自 eetimes ,谢谢。 ZeroPoint Technologies 和 Rebellions 旨在开发一种 AI 加速器,以降低 AI 推理的成本和功耗。 据称,ZeroPoint Technologies 的内存优化技术能够快速压缩数据、增加数据中心的内存容量并提 高每瓦的 AI 推理性能。 2025年4月,瑞典内存优化知识产权(IP)供应商ZeroPoint Technologies(以下简称ZeroPoint) 宣布与Rebellions建立战略合作伙伴关系,共同开发用于AI推理的下一代内存优化AI加速器。该 公司计划在 2026 年发布一款新产品,并声称"有望实现前所未有的代币/秒/瓦特性能水平"。 作为合作的一部分,两家公司将使用 ZeroPoint 的内存压缩、压缩和内存管理技术来增加基本模 型推理工作流程的内存带宽和容量。 ZeroPoint 首席执行官 Klas Moreau 声称其基于硬件的内存 优化引擎比现有的软件压缩方法快 1,000 倍。 ZeroPoint 的内存压缩 IP 价值主张 首先,压缩和解压缩。其次,压缩生成的 ...
卓驭科技接入通义大模型,联合打造端到端世界模型
阿里云· 2025-04-24 09:13
24日 ,行业一流的智能驾驶供应商及服务商卓驭科技宣布接入通义大模型,并基于阿里云打造端到 端世界模型。此外,其大数据等核心业务系统已接入阿里云。 图|卓驭科技总经理沈劭劼(右)、 阿里云智能集团副总裁、AI汽车行业线总经理李强 卓驭的端到端世界模型区别于传统端到端模型, 引入了强化学习和思维链推理技术 ,不仅将城市领 航辅助的安全性提升一个层级,也支持千人千面驾驶风格、自然语言交互控制驾驶行为、复杂场景慢 推理的智能化体验。 由于卓驭大模型训练采用预训练+后训练结合的方式,以"天"为单位的迭代速度对云端算力提出了较 高的需求。 / END / Related reading 相关阅读 对此, 卓驭基于阿里云PAI平台打造了多种GPU融合的算力资源池 。通过存储资源共享,其数据流 动、数据管理等成本显著降低,相比单GPU集群算力, 卓驭模型训练效率提升50%以上 。 同时,阿里云PAI平台的Serverless能力简化了集群的运维难度, 保障训练全链路可观测,帮助卓驭 将GPU利用率提升至95%以上 。 目前,卓驭的大数据系统、智能制造等核心业务已全面搬上阿里云。其中,在研发领域 卓驭已接入 通义灵码、通义千 ...
倒计时 6 天!致全球 GPU Kernel 极客:AMD 的 10 万美金“战书”请查收!
AI科技大本营· 2025-04-24 09:09
-I CSDN I- 2025.06.08 100.000美金 共赴硅谷巅峰之战! 注册报名二维码 致全球GPU kernel极客的一封战书: 亲爱的GPU kernel极客们, 是时候展现真正的实力了!我们诚挚邀请您参加由AMD发起并全程赞助的AMD 2025推理优化挑战赛!这是一个面向全球GPU kernel开发者的盛大赛事,AMD 倾力打造,邀您以代码为刃,挑战Al推理性能极限! 战,你能 斩获 什么? CSDN 智算极速争锋 AM D 2025 推理优化挑 2025.04.15 AMDA × FHE × 6 together we advance 破局时刻表 出名户站 2025 / 15 年日期期货 · 无需本地GPU! 云端算力平台,公平竞技,专注底层算子优化 ( low-level kernel ) 即可参赛! ● 单人亮剑或组队出征(≤3人),无国籍限制。 · 通过AMD官方验证后, 绑定GitHub ID解锁参赛权限。 ● 挑战优化三重DeepSeek算子:FP8 GEMM,MLA with Rope,Fused MoE。 ● 每两周一组,开放PyTorch参考实现及理论最大值性能等辅助开发的 ...
腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
AI前线· 2025-04-23 07:28
在人工智能快速演进的浪潮下,大模型正加速重构各行业的技术底座,而 推理性能优化 正成为应对算力挑战、内存瓶颈与通信压力的关键突破口。 当前,大模型推理性能优化主要围绕 模型优化、推理加速与工程优化 在即将于 5 月 23 日 -24 日举办的 AICon 全球人工智能开发与应用大会·上海站 中,我们特别策划了《大模型推理性能优化策略》专题论坛,由阿里云公共云大模型技术服务负责人 王德山 担任专题出品人,现已确认多位业内实践者参与分享。以下为嘉宾阵容及即将带来的精彩议题简介~ 向乾彪 – 腾讯推理架构师 向乾彪在 GPU 推理加速拥有丰富经验。他的技术专长覆盖高性能异构计算及深度性能优化,并在实 践中不断突破前沿技术瓶颈。目前,向乾彪带领团队负责混元大语言模型的推理加速框架 【AngelHCF】 三大方向展开:通过模型量化、剪枝与蒸馏等手段降低计算复杂度、提升推理效率,例如 DeepSeek-R1-Distill-Qwen-32B 采用蒸馏策略,在保持高性能的同时显著压缩资源开销;依托 SGLang、vLLM 等高效推理引擎提升生成速度与系统吞吐能力;同时结合实际业务场景,合理规划 并发策略、优化 GPU 配置 ...
特赞科技创始人范凌:如何让AI像一群“小黄人”一样默默耕耘?
混沌学园· 2025-04-22 11:31
" AI 其实不是真的在创造,而是把人的创造能力更低成本地复制。" "谁能成功地让人类和工具(特别是 AI )实现高效协作,谁就能拥有源源不断的商业机会。" "内容的真正控制者,并非创作者,而是平台,它们决定了内容的生产、传播以及是否上架。" 今天上午,特赞科技创始人范凌博士在混沌的直播课上这样讲到。 范凌博士的课程实际上也回答了大模型爆火之后的几大争议: AI 会不会取代人的工作? AI 生成的低质内容会不会有损高端品牌形象? 来自 AI 的信息和数据是否可靠? 品牌增长应不应该用 AI 做矩阵号? …… 以下内容根据部分课程内容整理: 授课老师 | 范凌 特赞科技创始人 &CEO 我们在最卷的行业里 AIGC 我是全职创业者,也是全职教师。我的父母都是艺术家,而我自己则是理工科出身。所以我有一颗艺术的 心,有一个工程的脑。如何将心与脑的距离拉近?早在经营公司之前,我就每天都在思考这件事儿,它像 是我的一个人生使命。 创业前,我在美国伯克利大学教授人机交互。那时,人机交互与人工智能似乎是对立的两种思想。人工智 能的目标是创造一台可以取代人类的机器,而人机交互则认为人 + 机器可以完成人类和机器都做不了的事 ...
前百度AI大牛亲述:押注十年,踩坑无数后,签下200家三甲医院
创业邦· 2025-04-21 02:45
"一个人能做什么事,很大程度取决于他手里的资源。" 作者丨刘杨楠 编辑丨巴里 图源丨文心一言 踩了无数坑之后,张超深知:"一件事能不能做成,时机很重要。" 在"AI医生"这个最火热的新趋势里,他延续着一名技术创业者对技术路径的敏锐嗅觉,押注"端到端+场 景"深度结合的技术路线。同时,他也用更多精力钻研商业模式,试图在传统的医疗服务模式之外,给公 司探索更多商业想象。 押宝"端到端" 2020年,左医科技第一次尝试把Transformer用在医患对话上,开发了一款智能问诊程序,内部称之为"AI Doctor(AI医生)"。 无论是早些年的信息化,还是今天的大模型,技术改变世界的宏大叙事里,医疗或许都是最难啃的"硬骨 头"。 数据壁垒高筑、场景复杂多变、容错率趋近于零......但因其内含的巨大商业价值和社会价值,多年来都吸 引着无数创业者奔赴其中。 2016年创办左医科技的张超,便是其中之一。张超毕业于电子科技大学,曾经担任百度NLP知识挖掘方 向的负责人、知识图谱专家,也曾任新国大的研究助理。 左医科技是一家知识图谱和医疗大模型协同驱动的医疗科技公司,其客户已经覆盖全国200多家三甲医 院,其中40%是top ...
AI动态跟踪系列(六):OpenAIo3、豆包新品首发,关注原生Agent与多模态推理
Ping An Securities· 2025-04-17 13:10
Investment Rating - The industry investment rating is "Outperform the Market" [1][38]. Core Insights - OpenAI's latest models, o3 and o4-mini, introduce significant advancements in image reasoning and agent capabilities, enhancing the AI programming ecosystem [3][4]. - The competition in the global large model field remains intense, with a strong emphasis on native agent capabilities and multimodal reasoning [34]. - The domestic AI computing power market is expected to see increased acceptance and market share for Chinese AI computing solutions due to ongoing global trade tensions [34]. Summary by Sections OpenAI's New Models - OpenAI released o3 and o4-mini, which are touted as the most intelligent models to date, featuring breakthroughs in image reasoning and agent capabilities [3][4]. - The o3 model has set new state-of-the-art benchmarks in coding, mathematics, and visual perception tasks, outperforming its predecessor o1 by 20% in error rates on complex tasks [5][7]. - The o4-mini model is optimized for fast and cost-effective reasoning, excelling in non-STEM tasks and data science [5]. Doubao 1.5 Model - Doubao 1.5 has reached or is close to the top tier globally in reasoning tasks across mathematics, coding, and science, with enhanced visual understanding capabilities [17][21]. - The Doubao APP, based on the Doubao 1.5 model, can perform "thinking while searching," providing detailed recommendations based on user needs [24][27]. - Doubao's daily token usage has surged to over 12.7 trillion, indicating significant growth and market penetration [18]. Investment Recommendations - The report suggests focusing on AI applications in enterprise services, programming, and office automation, as well as on domestic AI computing power companies [34]. - Recommended stocks in AI applications include companies like Fanwei Network and Kingdee International, while AI computing power recommendations include companies like Haiguang Information and Inspur Information [34].
OpenAI深夜上线o3满血版和o4 mini - 依旧领先。
数字生命卡兹克· 2025-04-16 20:34
晚上1点,OpenAI的直播如约而至。 其实在预告的时候,几乎已经等于明示了。 这块大概解释一下,别看底下模型那么多,乱七八糟,各种变体。 但是从最早的o1到如今的o3和o4‑mini,核心差别就在于模型规模、推理能力和插件工具的接入。 没有废话,今天发布的就是o3和o4-mini。 但是奥特曼这个老骗子,之前明明说o3不打算单独发布要融到GPT-5里面一起发,结果今天又发了。。。 ChatGPT Plus、Pro和Team用户从今天开始将在模型选择器中看到o3、o4-mini和o4-mini-high,取代o1、o3-mini和o3-mini-high。 我的已经变了,但是我最想要的o3 pro,还要几周才能提供,就很可惜,现在o1 pro被折叠到了更多模型里。 说实话纯粹的模型参数的进步,其实已经没啥可说的了,这次最让我觉得最大的进步点,是两个: 1. 满血版的o3终于可以使用工具了。 2. o3和o4-mini 是o系列中最新的视觉推理模型,第一次能够在思维链中思考图像了。 照例,我一个一个来说,尽可能给大家一个,非常全面完整的总结。 一.o3和o4-mini性能 其实没有特别多的意思,就跟现在数码圈一 ...