训练

Search documents
GPT-4o图像生成的「核燃料」找到了!万字长文拆解潜在变量,网友:原来AI在另一个维度作画
机器之心· 2025-05-06 04:11
Sander Dielman 自 2015 年加入 DeepMind 以来,参与了包括 WaveNet、AlphaGo、Imagen 3 和 Veo 在内的多个项目,涵盖深度学习、生成模型及表征学习 (Representation Learning)。 在这篇文章中,他将潜在变量比喻为「数据的精髓」—— 通过压缩复杂信息实现图像、语音等生成。他还深入对比变分自编码器(VAEs)、生成对抗网络 (GANs)和扩散模型,展示了潜在变量如何支持这些模型生成逼真内容。 选自 Sander Dieleman博客 机器之心编译 编辑:刘欣 上个月, GPT-4o 的图像生成功能爆火,掀起了以吉卜力风为代表的广泛讨论,生成式 AI 的热潮再次席卷网络。 而在这股浪潮背后,潜在空间(Latent Space)作为生成模型的核心驱动力,点燃了图像与视频创作的无限想象。 知名研究者 Andrej Karpathy 最近转发了一篇来自 Google DeepMind 研究科学家 Sander Dielman 的博客文章,探讨了生成模型(如图像、音频和视频生成模型)如 何通过利用潜在空间来提高生成效率和质量。 博客链接:https: ...
AI Agent:模型迭代方向?
2025-05-06 02:28
AI Agent:模型迭代方向?20250503 摘要 • AI 商业化进展缓慢,To B 端尤为明显,微软 Copilot 未达预期,OpenAI 产品仍以 chatbot 为主,未进入 agent 阶段。Agent 准确率受限于大模 型能力,工程化手段成为完善产品的重要途径。 • Deepseek Prover V2 版本为解决 agent 产品化问题提供新思路,其核 心作者已公开相关信息,并在 GitHub 上提供论文,为提升 agent 执行复 杂任务的准确率提供了新的方向。 • OpenAI 和 Anthropic 在 autonomous AI system 研究方面均有进展, Anthropic 在技术积累上更超前,其 ComputeUse 系统运行时间早于 OpenAI 相应产品至少一个季度,在 agent 产品化和模型能力方面 Anthropic 或更具优势。 • 大型科技公司通过技术研发和工程化手段推动大模型发展, Deepseek、OpenAI 和 Anthropic 专注于技术研发,其他公司则采用工 程化手段完善产品,共同促进下一代 AI 产品的发展。 • Chatbot 和 Agen ...
AI Agent:算力需求空间?
2025-05-06 02:28
• Agent 与 Chatbot 不同,Agent 任务复杂度高,交互量大,所需 TOKEN 量远高于 Chatbot,对存储和内存要求更高,影响因素包括任务复杂度、 多模态处理、用户量等。 • 优化模型访问和推理方法包括使用低精度计算、模型蒸馏,以及硬件优化 如 KV 缓存优化,Salesforce 等公司 Agent 产品通常采用百亿参数规模模 型。 展。 综上所述,AI Agent 对算力的需求不仅包括新应用开发,还包括大量老 业务改造,这部分需求容易被忽略但实际非常重要。 如何拆解训练与推理环节中的具体算力需求? AI Agent:算力需求空间?20250505 摘要 • AI 应用逐渐渗透,算力推理需求快速增长,大厂改造现有业务而非开发全 新 APP,导致被忽略的算力需求非常重要,微软、谷歌等公司推理需求占 比可能达 60%-70%。 • 训练环节市场预期悲观,但实际情况可能更好,预训练边际效应减缓,后 训练增速不明显,细分领域仍有增长潜力,需关注 AI Agent 等潜在领域 价值。 • 算力产业链边际走弱,英伟达股价未创新高,市场对整体算力需求预期悲 观,但 AI 应用领域表现强劲,如 Pal ...
法治在线丨燃爆全场的特警总冠军,来自中国!揭秘备战细节→
Yang Shi Xin Wen· 2025-05-05 07:35
阿联酋特警挑战赛,被誉为"特警挑战赛的世界杯",创办于2019年,每年举办一次,吸引各国和地区的特警队伍前来参赛,相互学习交流先进战术、战法。 2024年2月,中国首次派出代表队参加阿联酋特警挑战赛,当时,入警刚满两年的刘朋就是其中的一员。 阿联酋特警挑战赛,被誉为"特警挑战赛的世界杯",今年2月,在第六届阿联酋特警挑战赛上,中国浙江特警参赛队以绝对的优势问鼎总冠军,创造了历 史。这些中国特警总冠军队员是怎样炼成的? 战术拉满 燃爆全场 问鼎总冠军创造历史 杭州市公安局特警支队民警 刘朋:准备上台领奖的时候,身后也是自发地传来我们华人华侨、国内的朋友们,他们唱起了国歌,还有就唱起了《歌唱祖 国》。那个时候,我们作为中国人、作为中国警察的骄傲也是达到了顶峰。 刘朋,中国浙江特警参赛队的队长,获得阿联酋特警挑战赛总冠军的那一刻,他兑现了自己一年前的承诺。过去的一年,他和队友们经历了常人难以想象的 高强度训练,也经历了伤病,但他们始终没有放弃,为的就是要向全世界证明中国特警的实力。 杭州市公安局特警支队民警 刘朋:我们出国比赛之后就不仅仅是代表我们自己个人了,我们代表了我们中国警察、中国特警的形象。 首次来到国际舞 ...
中国空军首次!“文明之鹰-2025”中埃空军联合训练结束
news flash· 2025-05-05 02:26
当地时间5月4日上午,为期18天的中埃"文明之鹰-2025"空军联合训练在埃及空军某基地闭幕。此次联 训是中国空军首次出动体系力量赴非洲开展联合训练,进驻后短时间内即完成装备展开、理论授课、任 务规划、指控协同等准备工作,顺利实现首飞,体现了中国空军远程投送、敏捷部署和体系作战能力。 (央视新闻) ...
谁拥有最多的AI芯片?
半导体行业观察· 2025-05-04 01:27
如果您希望可以时常见面,欢迎标星收藏哦~ 人工智能的进步依赖于指数级增长的人工智能超级计算机。自2010年以来,用于训练最著名人工 智能模型的计算量每年增长4.1倍,从而实现了先进聊天机器人、图像生成和蛋白质结构预测等突 破。这种训练计算量的增长主要依赖于更大规模的人工智能超级计算机,这些计算机现在包含超 过10万个AI芯片,硬件成本达数十亿美元,并且消耗相当于一个中等城市用电量的电力。 我们通过系统地收集2019年至2025年的公开数据,汇编了一个包含全球500多台人工智能超级计 算机的数据集。我们将人工智能超级计算机定义为使用AI芯片的系统,该系统在其首次投入运营 时达到了领先人工智能超级计算机至少1%的计算性能。通过将总性能与公开的AI芯片生产和销 售估算进行比较,我们估计我们的数据集涵盖了现有AI超级计算机总容量的10-20%。 领先人工智能超级计算机的计算性能每9个月翻一番,这得益于更多和更好的AI芯片的部署(图 1)。两个关键因素推动了这一增长:芯片数量每年增加1.6倍,以及每个芯片的性能每年提高1.6 倍。虽然在2019年拥有超过1万个芯片的系统很少见,但到2024年,各公司部署的人工智能超级 ...
巴基斯坦军方:巴基斯坦进行450公里射程的Abdali导弹训练发射。
news flash· 2025-05-03 08:00
巴基斯坦军方:巴基斯坦进行450公里射程的Abdali导弹训练发射。 ...
CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍
机器之心· 2025-04-30 04:23
李武军教授为通讯作者,硕士生林昊(已毕业 ,现工作于阿里巴巴)、吴轲、李杰为共同第一作者,博士生李俊为参与作者。 训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。 大模型的训练往往采用多机多卡的分布式训练,大模型的分布式训练挑战巨大,即使硬件足够,不熟悉分布式训练的人大概率(实验中验证有 64%-87% 的概率)会因为超参数设置(模型怎么切分和排布、数据怎么切分和排布等)不合理而无法成功运行训练过程。 此外,不熟悉分布式训练的人在碰到大模型训练慢时容易只想到增加 GPU 硬件等 横向拓展(scale-out)方法,而忽略了分布式训练算法的 纵向拓展(scale- up)作用。 论文被 CVPR 2025 录用为 Oral(所有投稿论文的 0.7%,所有录用论文的 3.3%)。 方法简介 实际上,分布式训练算法会极大地影响硬件的算力利用率。高效能分布式训练算法具有高算力利用率。用同样的硬件算力训练同一个模型,高效能分布式训 练算法会比低效能分布式训练算法速度快,最高可能会快数倍甚至数十倍以上。 也就是说,训练同一个模型,高效能分布式训练算法会比低效能分布式训练算法成本低,最高可能会节省数倍甚至数十 ...
技术驱动与绿色转型双轮并进,润泽科技一季报稳健增长
Zheng Quan Shi Bao Wang· 2025-04-29 04:08
Core Insights - The company reported a revenue of 1.198 billion yuan and a net profit of 430 million yuan for Q1 2025, indicating healthy financial metrics [1] - As a leading provider of intelligent computing infrastructure in China, the company is leveraging technological innovation and green development to build a future-oriented computing foundation [1] - The company has established seven AIDC intelligent computing clusters across key economic regions, with all delivered and upcoming computing centers having secured production orders, expected to be operational by 2025 [1] Technological Developments - The company is deepening the commercialization of liquid cooling technology, having delivered the industry's first fully liquid-cooled green computing center in 2023 [1] - The Power Usage Effectiveness (PUE) of the liquid-cooled computing centers has been reduced to approximately 1.15, showcasing significant energy efficiency [1] - The company is enhancing energy-saving renovations in existing computing centers and has achieved industry-leading PUE levels in its Langfang park, supporting AI model training with reliable and efficient computing infrastructure [1] Green Development Strategy - The company is actively promoting a "low-carbon green" process for its computing centers, with its A-7 and A-18 centers recognized as national green data centers due to their excellent energy-saving performance [2] - In 2024, the company completed a total of 800 million kilowatt-hours in green electricity transactions, emphasizing its commitment to energy-saving technology research and green transformation [2] Strategic Expansion - The company's strategic layout in Hainan Free Trade Port aligns with national policies, as the State Council approved the establishment of cross-border e-commerce comprehensive pilot zones in Hainan and other cities [3] - The company is constructing an intelligent computing infrastructure cluster in Danzhou, Hainan, with a planned capacity of approximately 30,000 cabinets, aimed at enhancing cross-border operations [3] - This initiative supports the digital economy development directive outlined in the Hainan Free Trade Port construction plan and lays the groundwork for the company to expand into overseas markets [3]
第73集团军某旅海上实弹射击训练火力全开
news flash· 2025-04-28 23:35
近日,第73集团军某旅在海上开展了超低空突防、海上着舰、海上实弹射击等课目训练。该旅海上训练 的频次、时长及课目难度、强度都有大幅增加。近年来,他们还加大了与海军部队联训联演的力度,围 绕海上着舰、舰机协同攻击等海上课目展开专攻精练,加速了飞行航迹由近岸向远海的延伸。(央视军 事) ...