Transformer

Search documents
Hammond Power Solutions Announces Second Quarter 2025 Financial Results Conference Call and Webcast Notification
Globenewswire· 2025-07-10 14:00
GUELPH, Ontario, July 10, 2025 (GLOBE NEWSWIRE) -- Hammond Power Solutions Inc. (“HPS” or the “Company”) (TSX: HPS.A) today announced that it will release its financial results for the Second Quarter ended June 28, 2025, on Thursday, July 24, 2025, after markets close. Following the release of its financial results, HPS will hold a conference call and webcast on Friday, July 25, 2025, at 9:00 a.m. Eastern Time. This call can be accessed by registration through participant links: Date/Time: July 25, 2025/ 9 ...
美国变形金刚,要涨价了
财联社· 2025-07-10 02:20
在 美 国 总 统 特 朗 普 " 关 税 大 棒 " 的 重 压 下 , 生 产 大 富 翁 ( Monopoly ) 、 变 形 金 刚 (Transformers)的全球玩具巨头孩之宝(Hasbro)警告称,今年晚些时候,美国玩具价格 可能会上涨,尤其是更高关税未来如果生效的话。 孩之宝首席执行官Chris Cocks指出,"关税已经存在了一段时间了。我们着眼于长远,所以 我们的总体反应是:保持灵活,但不要反应过度"。 孩之宝成立于1923年,生产著名的玩具和游戏,包括培乐多彩泥、变形金刚、糖果乐园和龙 与地下城。 尽管孩之宝尚未因关税问题涨价,但Cocks预计, 该公司产品的整体涨价即将到 来,很可能就在秋季。 Cocks还反驳了美国商务部长霍华德·卢特尼克(Howard Lutnick)等官员的说法,即外国承 担了关税成本。他指出,实际过程是,一个企业和另一个企业合作,都要吸收成本。 "外国供应商的利润率很低,约为2%至3%,因此他们负担不起10%的关税。 最终,孩之宝 将为进口其产品支付更多的费用。 "他补充说。 不过,Cocks还补充称,孩之宝在应对新关税压力方面比玩具行业的许多公司更有优势。其 ...
Mamba一作预告新架构!长文论述Transformer≠最终解法
量子位· 2025-07-09 04:57
一水 发自 凹非寺 量子位 | 公众号 QbitAI Mamba一作最新大发长文! 主题只有一个,即探讨两种主流序列模型—— 状态空间模型(SSMs)和Transformer模型的权衡之术 。 简单介绍下,Mamba就是一种典型的SSMs,它建立在更现代的适用于深度学习的结构化SSM基础上,与经典架构RNN有相似之处。 在最受关注的语言任务上,Mamba-3B超越同等规模的Transformer,与两倍大的Transformer匹敌,因此 被视为Transformer架构的有力挑 战者 。 现在,Mamba一作将自己去年的几场演讲整合成一篇科普长文,向大众分享了如下观点: 而且他还提前剧透, 几天后将发布"架构领域的下一个重大进展" 。 虽然还不知道具体内容,但他目前扔出来的消息已经足够大家抓耳挠腮一段时间了。 因为他提到了一个重要观点—— 注意力机制的缺点实际上并不是它的二次复杂度 。 要知道之前大家都认为,ChatGPT等大模型之所以处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 而现在,这样的共识或许即将被推翻~ 不过好消息是, 即将推出的新架构能够和Transf ...
基于能量的Transformer横空出世!全面超越主流模型35%
量子位· 2025-07-08 07:30
时令 发自 凹非寺 量子位 | 公众号 QbitAI AI无需监督就能学习思考? 弗吉尼亚大学团队最新提出 EBT(Energy-Based Transformers)架构 ,通过全新能量机制,首次实现在跨模态以及数据、参数、计算量 和模型深度等多个维度全面超越Transformer++(基于Llama 2的Transformer优化版本)的模型。 在离散(文本)和连续(视觉)模态下,EBT在数据量、批次大小、参数量、计算量和模型深度等方面比Transformer++提升了约35%。 EBT是基于EBM(Energy-Based Models)原理发展而来的具体模型架构。 这让模型具备了像人类一样"想清楚再回答"的能力。 在推理过程中,EBT在测试时也比Transformer++提高了29%。 那么,这种模拟人类思考模式的新架构EBT,到底是如何实现的呢? EBT方法:基于能量的Transformer EBT通过 能量最小化过程 模拟思考:从随机预测开始,通过梯度下降反复优化,直到能量收敛,从而动态决定"思考步数"。 它通过学习一个 能量函数 ,为每一种输入配置分配一个标量值。 能量越低,表示输入变量之间的兼 ...
Meta新注意力机制突破Transformer上限,还用上了OpenAI的开源技术
量子位· 2025-07-07 09:35
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI Meta挖走OpenAI大批员工后,又用OpenAI的技术搞出新突破。 这是什么杀人又诛心 (doge) ? 新架构名为 2-Simplicial Transformer ,重点是通过修改标准注意力,让Transformer能更高效地利用训练数据,以突破当前大模型发展的 数据瓶颈。 而核心方法,就是基于OpenAI提出的Triton,将标准点积注意力推广到三线性函数。 实验结果显示,在同等参数量和数据量下,相较于传统Transformer,新架构在数学、编程、推理等任务上均有更好的表现。 并且,2-Simplicial Transformer的缩放指数高于传统Transformer——这意味着 随着参数增加,新架构加持下的模型性能提升更快,更适用 于有限数据的场景 。 三元线性注意力 传统Transformer的核心机制是点积注意力,其计算复杂度较低,但对复杂任务 (如逻辑推理、数学运算等) 表达能力有限。 针对于此,Meta的这项研究,重点放在将点积注意力从二元线性操作扩展到三元线性操作。 简单来说,就是在计算注意力时引入第三个向量,来增加模型对复杂模式 ...
双碳研究丨中国AI赋能能源革命:从智能预测到储能革新,引领全球绿色转型
Sou Hu Cai Jing· 2025-07-03 14:21
中国AI赋能能源革命: 从智能预测到储能革新,引领全球绿色转型 【Oilprice 网 6月30日报道】 中国正大规模将人工智能融入能源领域,以提升整体效率、保障国家能源安全。 随着风能和太阳能等可变可再生能源快速扩张,人工智能广泛应用于更精准地预测能源供需。 人工智能还通过改进电池设计、安全性能和管理策略,显著提升能源存储水平。 中国正加速将人工智能深度融入能源体系,以提升能源效率并筑牢国家能源安全防线。从能源存储管理到更精准地预测能源供需,大语言模型能推动能源 系统整体更智能化、精细化,减少能源浪费。 早在2020年,国有天然气巨头中国燃气控股有限公司就已利用人工智能来更精准地预测天然气需求中复杂且动态的变化。这些由AI模型能够综合历史数 据和实时信息,运算速度远超人工。 然而,随着中国电网中可再生能源占比不断上升,预测问题变得更加棘手,也更为关键。中国在可再生能源部署方面领先全球。仅在5 月,中国电网新增 太阳能和风能发电量就与波兰整国的电力产能相当。随着中国不断打破自身的可再生能源纪录,其电网对可变能源的依赖度大幅增加,因此也更受天气变 化影响。因此,实现精准能源预测对国家能源安全至关重要。 为此,中 ...
GE Vernova's Electrification Arm Powers Solid Growth Ahead
ZACKS· 2025-07-01 13:15
Key Takeaways GEV's Electrification segment posts strong, consistent revenue growth. Siemens Energy and Eaton also benefit from the rising energy generation. GEV trades at a 165% premium to the industry, with a mixed earnings outlook. While headlines often focus more on GE Vernova Inc.’s (GEV) wind and gas turbine businesses, the company’s Electrification segment has always played the role of a key growth engine. In a world racing toward clean energy, the focus lies on modernizing outdated grids and enabl ...
摩根大通:东盟电网:是幻想还是现实?中国电力设备企业的机遇
摩根· 2025-07-01 00:40
J P M O R G A N Asia Pacific Equity Research 27 June 2025 This material is neither intended to be distributed to Mainland China investors nor to provide securities investment consultancy services within the territory of Mainland China. This material or any portion hereof may not be reprinted, sold or redistributed without the written consent of J.P. Morgan. ASEAN Power Grid Myth or reality? TNB is a standout winner; opportunity for CH power equipment players The ASEAN Summit in Kuala Lumpur in late-May has ...
「走出新手村」十次 CV 论文会议投稿的经验总结
自动驾驶之心· 2025-06-30 12:33
作者 | hzwer 黄哲威 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/627032371 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 以下内容后续更新在:https://github.com/hzwer/WritingAIPaper 导语 2021年来,笔者在多次论文被拒稿期间,开始研究和反思顶会论文生产到投稿的全流程,并全程参与了十 几篇论文的审稿。近一年笔者有三篇论文录用 (笔者主页),总共投了 5+4+1=10 次,其中感悟颇多。本文希 望结合经历回顾,为新手提供一个指南,提高论文的质量和命中率。本文深度参考了计算机科学家 Simon Jones 的 《How to write a great research paper》和北京大学施柏鑫老师的《从审稿人视角,谈谈怎么写一篇 CVPR论文》。 本文有 pdf 版本,全文 5k 字,求点赞求收藏( 论文生产发表流程 为了方便读者理解,先科普一下一般的深度学 ...
摩根大通:电力设备及中国公用事业_全球市场反馈与投资者持仓情况
摩根· 2025-06-30 01:02
Asia Power Equipment & China Utilities Global marketing feedback and investors' positioning We received divergent investor views on the Asia power equipment/China utilities space during our recent global marketing (US, EU). While investors are generally bullish on the sector amid continued strength in power equipment demand and receding trade concerns, some investors were surprised by the recent rally in Korean names (~30% in 1M on average, vs KOSPI +20%) and they think their valuations are no longer cheap. ...