推理服务器

Search documents
红帽:AI的未来是开放的,开源方案可加快释放生成式AI潜能
Huan Qiu Wang· 2025-06-30 01:23
【环球网科技报道 记者 林迪】"混合云已成为企业运营的普遍选择,它在成本、便捷性、安全性方面具备显著优势。而 AI 的发展更是日新月异,生成式 AI 已深刻影响我们的生活与企业运营。"近日,红帽全球副总裁兼大中华区总裁曹衡康对记者表示,红帽致力于以开源模式推动 AI 发展,成为开源 AI 领域的 重要驱动力量。 近期,2025 年红帽全球峰会发布了众多前沿技术以及产品更新,旨在助力企业更好地应对当下数字化转型浪潮中的诸多挑战,为企业未来的发展注入强劲 动力。近期,红帽相关负责人对此进行了深入分享与解读。 红帽在此次峰会还重点推出 OpenShift 虚拟化服务升级版。该服务可在多云环境下运行,支持 AWS、Azure、Google Cloud 等主流云平台。自推出以来, OpenShift 虚拟化客户增长迅猛,不到两年客户数量增长 3 倍,生产中的集群数量翻倍,管理的虚拟机数量也实现 3 倍增长。其凭借卓越性能与广泛兼容 性,助力企业灵活构建虚拟化环境,满足多样业务需求。 值得关注的是,红帽 AI 推理服务器的发布旨在为 AI 发展注入新活力。该服务器基于热门的 vLLM 架构打造,聚焦于提升推理效率与性能。 ...
对话红帽全球副总裁曹衡康:AI成本下降了 芯片的量一定会起来
Mei Ri Jing Ji Xin Wen· 2025-06-14 09:02
基于这一背景,红帽在2025年推出了推理服务器。根据红帽方面介绍,使用推理服务器的最大优势就是 降低企业的算力成本。不过,该公司高管也在采访中多次强调,红帽不做硬件,只做软件。 随着未来算力成本的降低,行业对芯片算力卡的需求是否会有变化?曹衡康告诉《每日经济新闻》记 者,在他看来,目前AI的应用还不够多。"毕竟用AI成本太高。假设今天(原本)有1000家企业用 (AI),成本降低了会是1万家、10万家、100万家企业用。GPU(图形处理器)的量一定会起来的。 现在我们的做法就是让门槛更低。"曹衡康称。 封面图片来源:视觉中国-VCG211322973159 每经记者|杨卉 每经编辑|魏官红 DeepSeek爆火后,算力成本终会降低成了行业共识。但选择哪一路径,是数据中心、一体机还是推理 服务器,业内尚未有统一的定论和参考模式。6月13日,在"2025红帽媒体Open讲"线下交流会上,红帽 全球副总裁兼大中华区总裁曹衡康告诉《每日经济新闻》记者,在红帽看来,今年是AI(人工智能) 的推理元年。AI进入了推理后,意味着所有的AI应用将正式开始上线运行,并且为企业带来业务收入 以及内部成本控制等实际效益。 红帽大中 ...
鲲鹏昇腾开发者大会2025:华鲲振宇AI全栈能力构建AI开发新范式
Sou Hu Cai Jing· 2025-05-29 11:44
大会期间,华为正式发布多样化算力集群软件开源社区 openFuyao,华为、华鲲振宇、某国有大行、中国移动、联通数科、博云科技等六家单位作为筹备 委员会成员出席发布仪式。华鲲振宇副总裁赵彦钧入选筹备委员会成员,AI 开发部部长徐洋入选技术委员会,深度参与社区长期发展与技术路线规划。 5月23日,以 "心怀挚爱,共绽光芒" 为主题的鲲鹏昇腾开发者大会 2025 在北京中关村国际创新中心成功举办。华鲲振宇作为鲲鹏&昇腾生态唯一战略级 伙伴,向开发者全景呈现AI全栈解决方案,携手华为、伙伴及开发者共推国产化算力自主创新、共建多样化算力集群软件生态。 自研元启AI开发平台开放体验 在展区内,华鲲振宇独立展台开放AI全栈解决方案体验,开发者现场深度体验自研元启AI开发赋能平台,通过零代码构建智能体、自动化生成知识图 谱、图形化流程编排等功能,开发者可以直观感受像搭积木一样搭建个人/企业智能体,有效解决AI应用开发门槛高的痛点,助力企业让大模型真正运行 起来。 作为鲲鹏唯一战略级整机合作伙伴,华鲲振宇算力创新产品——"卡多多"AT9508 G3推理服务器受邀亮相鲲鹏展区,基于鲲鹏创新架构,支持生态内最高 规格的10卡双宽 ...
联想集团ISG业务连续两季度盈利 Q4营收同比增长63%
Ge Long Hui· 2025-05-22 05:37
IDC预计2025年全球基础设施市场将增长18%,达到2650亿美元,其中,AI服务器2025年市场规模将达 到1472亿美元,2024年-2027年复合年增长率将达到18%。这意味着,随着生成式AI和多模态模型的加 速落地,企业级AI基础设施投入将持续释放,相关算力、存储解决方案需求同步扩张,为基础设施方 案厂商带来广阔的发展空间。 5月22日,联想集团(HKSE:992)公布截至2025年3月31日的2024/25财年第四季度及全年业绩。全年营 收达到4985亿元人民币,实现同比21.5%的强劲增长,创历史第二高位,盈利提升更快,同比增长 36%。第四季度,ISG实现营收299.6亿人民币,同比增长63%,并连续第二个季度实现盈利。其中,中 国市场营收同比增长113%,海神液冷解决方案收入同比大增244%。 报告期内,联想发布新一代ThinkSystem V4服务器、ThinkEdge SE100 入门级AI推理服务器,提供多样 化解决方案;第六代Neptune海神液冷技术的推出,带来40%的能源效率提升;存储产品方面,迎来史 上规模最大的存储产品组合更新,并重磅发布 21 款存储产品及全新的数据存储解决 ...
氪星晚报|谷歌CEO:Gemini AI应用月活用户已超4亿;马来西亚将为芯片制造行业提供激励措施;中石油等在锦州成立车用能源销售新公司
3 6 Ke· 2025-05-21 10:42
大公司: 阿联酋政府与空客签署谅解备忘录,以推动本地航空制造能力建设 当地时间5月20日,阿联酋工业与先进技术部同空客公签署谅解备忘录,旨在推动本地航空制造能力提 升。备忘录确立了双方在航空工业领域建立长期合作的框架,旨在推动阿联酋国家工业的可持续增长, 发展本地供应链体系,并促进本地企业融入空中客车的全球价值链。(界面) 小鹏汽车:预计二季度交付量10.2万-10.8万辆,同比增237.7-257.5% 36氪获悉,小鹏汽车发布2025年第一季度财报。财报显示,该季度净亏损6.60亿元,上年同期净亏损 13.7亿元,市场预期净亏损13.86亿元;交付量94008台,同比增长330.8%。预计第二季度营收175亿 元-187亿元,同比增长约115.7%-130.5%;交付量10.2万-10.8万辆,同比增237.7-257.5%。截至发稿,小 鹏汽车美股盘前涨超6%。 华是科技:实控人之一、董事、总经理叶建标留置时间延长三个月 36氪获悉,华是科技公告,公司于2025年2月21日披露了实际控制人之一、董事、总经理叶建标被桐庐 县监察委员会实施留置及立案调查的事项。2025年5月20日,公司接到叶建标家属告知, ...
5.21犀牛财经晚报:金饰价格再次破千元 阿里大文娱更名“虎鲸文娱”
Xi Niu Cai Jing· 2025-05-21 10:27
华泰苏州恒泰租赁住房REIT今日在上交所上市 5月21日,华泰苏州恒泰租赁住房REIT(508085)在上交所举行上市仪式。华泰苏州恒泰租赁住房REIT 基金份额5亿份,发售价格2.73元/份,募集资金总额13.67亿元。华泰苏州恒泰租赁住房REIT原始权益人 为苏州工业园区公租房管理有限公司,基金管理人和专项计划管理人为华泰证券(上海)资产管理有限 公司。(上交所发布) 机构:2025年第一季新能源车销量突破400万辆 年增39% 根据TrendForce集邦咨询最新统计,2025年第一季全球纯电动车(BEV)、插电混合式电动车 (PHEV)和氢燃料电池车等新能源车合计销量达402万辆,年增39%,新能源车占第一季全球汽车销售 比例为18.4%。(智通财经) 一箭六星!力箭一号遥七运载火箭发射成功 北京时间2025年5月21日12时5分,力箭一号遥七运载火箭在东风商业航天创新试验区发射升空,将搭载 的泰景三号4星、泰景四号02A星、星睿十一号卫星、星迹源一号卫星、立方108 1星、西光壹号2星共6 颗卫星顺利送入预定轨道,飞行试验任务获得圆满成功。此次任务是力箭一号运载火箭的第7次飞行。 (央视新闻) 人形 ...
红帽公司宣布推出红帽AI推理服务器
news flash· 2025-05-21 09:36
开源解决方案提供商红帽公司近日宣布推出红帽AI推理服务器(Red Hat AI Inference Server),这是在混 合云中普及生成式AI(gen AI)的重要一步。作为红帽AI中的新产品,该企业级推理服务器源自强大的 vLLM社区项目,并通过红帽对Neural Magic技术的集成进一步增强,可以提供更高的速度、加速器效 率和成本效益,助力实现红帽"在任意云环境中的任意AI加速器上运行任意生成式AI模型"的愿景。(36 氪) ...
朗科科技(300042) - 2025年4月30日投资者关系活动记录表
2025-04-30 13:50
股票代码:300042 股票简称:朗科科技 深圳市朗科科技股份有限公司 投资者关系活动记录表 编号:2025-001 投资者关系活 动类别 □特定对象调研 □分析师会议 □媒体采访 √业绩说明会 □新闻发布会 □路演活动 □现场参观 □其他 (请文字说明其他活动内容) 参与单位名称 及人员姓名 线上参与公司 2024 年度网上业绩说明会的投资者 时间 2025 年 4 月 30 日(周三)下午 15:00~16:00 地点 全景网"投资者关系互动平台"(https://ir.p5w.net) 上市公司接待 人员姓名 董事长、总经理(代) 吕志荣先生 董事、常务副总经理 徐立松先生 董事、副总经理、财务负责人、董事会秘书(代) 张宝林先 生 副总经理 胡席林先生 独立董事 罗绍德先生 独立董事 雷群安先生 独立董事 钟刚强先生 投资者关系活 动主要内容介 绍 投资者提出的问题及公司回复情况 公司就投资者在本次说明会中提出的问题进行了回复: 1、韶关国资对公司的定位是什么?真的愿意助力公司参 与韶关枢纽建设么?这么长时间没有一项落地的 朗科科技作为韶关市算力产投平台的定位,已经在推进相 关工作,项目落地需要多方达 ...
4月30日十大人气股:机器人板块占据榜单六席
Zheng Quan Zhi Xing· 2025-04-30 08:20
4月30日沪深两市涨跌不一,成交量有所放大。板块方面人形机器人、自动化设备涨幅居前,保险、银 行跌幅居前。人气股方面南方精工(002553)收于涨停,步步高(002251)、红宝丽(002165)跌幅居 前。值得注意的是,十大人气股中机器人相关概念股占据其中六席。下面是今日十大人气股排名的详细 情况。 | 4.30沪深两市 十大人气股排名 | | | | | | | --- | --- | --- | --- | --- | --- | | 个股人气排名 股票代码 | | 证券简称 | 收盘份 | 涨跌幅 (%) | 人气值 | | 1 | 002261 | 拓维信息 | 33.3 | 4.13 | 771.21万 | | 2 | 002165 | 红宝丽 | 12.44 | -2.05 | 585.27万 | | 3 | 002251 | 步步高 | 6.2 | -10.01 | 487.50万 | | 4 | 600580 | 卧龙电驱 | 25.72 | 6.86 | 436.26万 | | 5 | 601177 | 机内削进 | 20.09 | 3.03 | 351.40万 | | 6 | 00255 ...
高盛大幅调低全球AI训练服务器出货量,全线下调相应供应链股价预期
硬AI· 2025-03-25 12:41
点击 上方 硬AI 关注我们 硬·AI 作者 |鲍亦龙 编辑 | 硬 AI 高盛下调AI服务器出货量预测,行业增长面临放缓。 3月24日,高盛分析师团队下调了机架级AI服务器(Rack-level AI Server)销量预测, 2025年及2026年预 计出货量分别从3.1万台和6.6万台下调至1.9万台和5.7万台(以144-GPU等效计算) 。 这一调整主要源 于产品过渡期影响以及供需的不确定性。 高盛认为虽然2025年第二季度对中国台湾ODM/散热供应链来说将是强劲的季度,但高盛对全年出货量持 更为保守的态度,并预计 产品转型期可能在2025年第三季度再次对出货量造成影响 。 因此高盛相应 下调了中国台湾ODM和散热供应链相关公司 (广达、鸿海、FII、纬创、艾维克、双鸿)的 目标价,降幅在7%-21%之间 , 并将广达电脑评级从"买入"下调至"中性"。 此外,高盛认为对投资者而 言,ASIC AI服务器相关企业表现普遍优于GPU AI服务器供应商,这一趋势可能将持续。 高盛认为产品过渡期影响、供需不确定性以及生产复杂性挑战等因素,将导致市场增长面临放缓,将2025年和2026年机 架级AI服务器出货 ...