端到端生成建模 - filings, earnings calls, financial reports, news

端到端生成建模

Search documents

机器之心· 2025-06-26 00:30

机器之心报道机器之心编辑部恭喜谷歌。刚刚，有网友爆料，自己在公司收到了「欢迎何恺明加入」的邮件，何恺明疑似加入谷歌。在搜索何恺明个人主页后，我们可以确认，他确实加入了谷歌，不过是以兼职的形式，职位是谷歌 DeepMind 杰出科学家 (Distinguished Scientist)。个人主页：https://people.csail.mit.edu/kaiming/ 关于何恺明在谷歌的具体研究方向，目前还搜不到详细信息。不过，我们可以根据他最近发表的研究推测一下。前段时间，他所在的团队发布了一篇题为「Mean Flows for One-step Generative Modeling」的论文（参见《何恺明团队又发新作： MeanFlow 单步图像生成 SOTA，提升达 50% 》）。在最近的 CVPR workshop 上，他也重点介绍了这一论文所代表的方向。在分享中，他指出，在 AlexNet 之前，逐层训练更为流行，如深度信念网络（DBN）和去噪自编码器（DAE）。但 AlexNet 之后，识别模型普遍实现了端到端训练，大大简化了模型设计和训练的复杂性。不过，有趣的是，今天的生成 ...

何恺明CVPR最新讲座PPT上线：走向端到端生成建模

机器之心· 2025-06-19 09:30

机器之心报道编辑：张倩生成模型会重现识别模型的历史吗？今年的 CVPR 已经在美国田纳西州纳什维尔顺利闭幕。除了交流论文、互加好友，很多参会者还参加了个非常有意思的项目 —— 追星。这个「星」自然是学术明星。从前方发来的实况来看，MIT 副教授何恺明可能是人气最高的那一个。他的讲座全场爆满，还有很多同学晒出了与恺明大神的合影。其实，这次现身 CVPR 会场的何恺明有着多重身份，包括但不限于最佳论文奖委员会成员、「Visual Generative Modeling: What's After Diffusion?」workshop 演讲嘉宾等。这个 workshop 聚焦的主题是扩散模型之后的视觉生成建模演进方向。近年来，扩散模型迅速超越了先前的方法，成为视觉生成建模中的主导方法，广泛应用于图像、视频、3D 物体等的生成。然而，这些模型也存在一些显著的局限性，例如生成速度较慢、生成过程中人类干预有限，以及在模拟复杂分布（如长视频）时面临挑战。这个 workshop 旨在探索视觉生成建模中能够超越扩散模型的方法，何恺明在活动中做了主题为「Towards End-to-End Generat ...