Diffusion Model - filings, earnings calls, financial reports, news

Diffusion Transformer

从科研到落地，从端到端到VLA！一个近4000人的智驾社区，大家在这里报团取暖~

EasyCache

HunyuanVideo

Wan2.1

自动驾驶之心· 2025-07-11 11:23

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线这几天刚和团队小伙伴沟通完后期工作建设，探讨究竟要做一个什么样的自动驾驶社区？其中一个答案比较符合我们的思路，那就是一个能够凝聚行业人群、遇到问题能够快速响应、影响到整个行业的地方。我们目标是未来3年内打造一个万人聚集的智能驾驶&具身智能社区，这里也非常欢迎优秀的同学加入我们（目前已经有华为天才少年、自驾领域研究前沿的多为大佬加入）。我们和多家业内公司搭建了学术 + 产品+ 招聘完整的桥梁和链路，同时内部在教研板块也基本形成了闭环（课程 + 硬件+问答）。社区里面既能看到最新的行业技术动态、技术分享，也有非常多的技术讨论、入门问答，以及必不可少的行业动态及求职分享。具身智能这么火，要不要考虑转行？自动驾驶技术的未来发展趋势如何？大模型如何预自动驾驶 &具身智能结合？这些都是我们持续关注的星球核心目录如下：自动驾驶视频课程及硬件、代码实战链接：https://t.zsxq.com/9GkD5 0 内部会员独享福利视频教程（免费）：涵盖超千元的自动驾驶技术论文解读 1 自动驾驶之心原创直播课程： ...

Large Vision-Language Models

Large Vision-Language Models

Diffusion Models

World Models

Autos

2025秋招开始了，这一段时间有些迷茫。。。

自动驾驶之心· 2025-07-08 07:53

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线 2025年的秋招已经开始了，不少双非的同学都很迷茫。。。目前在实验室做的工作有些落伍，现在无论是自动驾驶还是具身智能公司都需要实力比较强、背景比较好的同学。以下是知识星球内部一位双非同学的提问，非常具有代表性：各位大佬们好，我目前是一个双非的研究生，研究方向是多传感器融合定位的，然后学过python、深度学习、ros等等，但都学的不是很精，现在想多学一点为以后找工作用，感觉算法岗我的学历可能不太行，请问各位大佬们我应该往哪个方向学比较好呢？学些什么知识呢？星主回答：你的技术栈都比较偏机器人一些，SLAM和ROS这块都可以尝试一下和机器人/具身智能打交道。这块需求也比较大，可以做一些优化、集成类工作~ 另一方面，我们了解到大一些的公司各家的hc都不是很多，要求基本上都是端到端、大模型、VLA、强化学习、3DGS这些比较前沿的方向。如果你做的是这块，是有机会的，很多tire 1的公司或者主机厂也正在follow前沿的技术，大概是从无图往端到端转，差不多技术栈推迟1-2代。像LV融合、无图、 ...

World Model

Autos (Autonomous Driving)

World Model

Autos (Autonomous Driving)

双非研究生，今年找工作有些迷茫。。。

自动驾驶之心· 2025-06-30 05:51

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线不少双非的同学都很迷茫。。。实验室参与的工作有些落伍，现在无论是自动驾驶还是具身智能公司都需要实力比较强、背景比较好的同学。同时呢，现在也有很多机器人的公司处于快速发展的阶段，很多初创公司都融了比较可观的钱，未来几年问题不大，而且培养是全方面的。工作肯定是会苦一些，但技术栈这块确实实打实的可以学习到很多，也建议你看看，像深圳、杭州我们最近也都线下拜访了很多机器人公司，具身智能毋庸置疑是最前沿的方向了，但确实传统的机器人仍然是产品的主线。加油~ 最后欢迎大家加入知识星球，硬核资料在星球置顶：加入后可以获取自动驾驶视频课程、硬件及代码学习资料。业内最全的全栈学习路线图，独家业内招聘信息分享~ 我们目标是未来3年内打造一个万人聚集的智能驾驶& 具身智能社区，这里也非常欢迎优秀的同学加入我们（目前已经有华为天才少年、自驾领域研究前沿的多为大佬加入）。我们和多家业内公司搭建了学术 + 产品+ 招聘完整的桥梁和链路，同时内部在教研板块也基本形成了闭环（课程 + 硬件+问答）。社区里面既能看到最新 ...

World Model

Autos

100+自动驾驶数据集，这5个你总得知道吧？

自动驾驶之心· 2025-06-22 01:35

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线自动驾驶技术日渐火热，各类开发者数据集层出不穷。"自动驾驶之心"已整理收录了100多个优质自动驾驶数据集，为初学者和工程师提供了丰富素材。本文仅选取其中5个数据集进行介绍，覆盖了从感知（目标检测、分割）到视觉里程计等多种任务场景。无论你是入门新手还是科研工程师，这5个数据集都值得关注，更多资源欢迎加入社群获取完整资料！不过，本文介绍的只是"自动驾驶之心"社群中海量资源的一小部分。想要获取全部100+数据集的详细信息，以及与志同道合的业内同仁实时交流，请加入"自动驾驶之心"知识星球并加入社群！ 1. KITTI 数据集 KITTI 数据集是自动驾驶领域最经典、使用最广泛的基准数据集之一。它通过在卡尔斯鲁厄街道环境中搭载高精度传感器（如双目彩色/灰度相机、Velodyne 3D 激光雷达、GPS/IMU 等）采集数据。数据集中包含了立体视觉、光流、视觉里程计、3D 目标检测和跟踪等多种感知任务的标注（如图像序列和 3D 物体轨迹）。丰富的城市、高速和乡村场景让 KITTI 成为评测车载视觉算法性能 ...

数据减少超千倍，500 美金就可训练一流视频模型，港城、华为Pusa来了

机器之心· 2025-06-19 02:28

FVDM & Pusa 一作：刘耀芳目前在香港城市大学攻读博士学位，导师为著名数学家 Prof. Raymond Chan (陈汉夫) 及 Prof. MOREL Jean-Michel。他也曾在腾讯 AI Lab 实习，主导 / 参与 EvalCrafter , VideoCrafter 等工作，其研究兴趣包括扩散模型，视频生成等；项目主管：刘睿，香港中文大学 MMLab 博士，华为香港研究所小艺团队技术负责人。论文标题：Redefining Temporal Modeling in Video Diffusion: The Vectorized Timestep Approach FVDM 论文：https://arxiv.org/abs/2410.03160 Pusa 主页 / 代码库: https://github.com/Yaofang-Liu/Pusa-VidGen 具体而言，Pusa 通过对预训练模型如 Wan-T2V 14B 进行非破坏性微调，仅需 500 美金训练成本即可达到比 Wan 官方 I2V（至少 O(100k) 美金的训练成本）更好的效果，成本降低超 200 倍，数据更是减 ...

Video Generation

挑战 next token prediction，Diffusion LLM 够格吗？

Pusa

FVDM

机器之心· 2025-06-08 02:11

机器之心PRO · 会员通讯 Week 23 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. 挑战 next token prediction，Diffusion LLM 够格吗？低成本下的高性能模型，是悖论还是可能？为什么 Gemini Diffusion 是「被忽视的重大突破」？dLLM 有何底气冲击自回归模型？Diffusion 也可被视作无损数据压缩器？dLLM 还有哪些潜在优势？兑现 dLLM 的潜力还需解决什么问题？ ... 2. AI 推理成本暴跌，「互联网女皇」 Mary Meeker 从中看到了什么？ Mary Meeker 为何强调 AI 发展速度远超互联网时代？AI 模型训练成本与推理成本「剪刀差」将如何重塑行业竞争格局？企业该如何平衡算力投入与商业化回报？中国开源模型崛起对全球供应链有何潜在影响？人机协作时代如何平衡劳动力结构转型与技能重塑？ ... 本期完整版通讯含 2 项专题解读 + 27 项 AI & Robotics 赛道要事速递，其中技术方面 11 项，国内方面 4 项，国外方面 12 项。本期通讯总计 29595 字， ...

Self-Regressive Model

Gemini Diffusion

Diffusion LLM

Self-Regressive Model