VLA - filings, earnings calls, financial reports, news

VLA

Search documents

36氪· 2025-05-23 13:58

车企的AI辅助驾驶人才饥渴症。 " 在2024年、2025年初，理想辅助驾驶团队每一个核心人员基本上都会接到20 个以上的猎头电话。"今年5月7日，理想汽车CEO李想在AI Talk中说道。但高端人才的争抢，往往伴随着竞业风险与法律纠纷。据36氪汽车了解，理想汽车今年起诉一名跳槽至同城企业的员工，起诉金额高达千万元级别，最终双方选择私下和解，员工向理想赔偿了一年工资的金额款项。类似的竞业协议诉讼并不少。据36氪了解，理想还起诉了南方一家头部新能源车企员工，双方达成和解后，后者协助员工赔付了超百万元。针对上述信息，理想表示不予置评。竞业、诉讼，已成为当下车企辅助驾驶、AI团队的常用手段，以此防止、延缓技术外溢，同时抑制对手发展。当下，新能源汽车行业产品力趋向同质化，辅助驾驶是为数不多、具备特色与差异化的技术招牌。文｜李安琪编辑｜李勤来源｜ 36氪汽车（ID：EV36Kr）封面来源｜ Unsplash 入职新公司第一天，张杨（化名）被要求"吐露"上家公司的辅助驾驶算法与代码。因没有积极配合，张杨没在新公司待多久就离开了。张杨的前东家是理想汽车，近年因迅速落地辅助驾驶而被行业关注，成 ...

深圳上新“机器人管家”！智平方发布新一代通用智能机器人

Shen Zhen Shang Bao· 2025-05-23 07:42

4月17日，具身智能机器人企业智平方在深圳正式发布新一代通用智能机器人AlphaBot 2（爱宝2），并宣布全面升级"AGI终端"战略。此次战略升级涵盖核心具身大模型技术升级、产品迭代、自有产线建设及商业化目标。智平方创始人兼CEO郭彦东在发布会上透露最新计划：智平方自有产线建设正式启动，2028年将实现万台场景应用，到2030年为南山区产值贡献一个百分点。作为全球首款搭载具身大模型Alpha Brain的通用智能机器人，AlphaBot 2通过视觉、语言与动作的端到端协同，突破传统机器人单任务训练的局限，在复杂工业与公共服务场景中展现出强大的泛化能力与适应性。新技术：搭载全域全身VLA大模型智平方认为，通用智能机器人跟之前的机器人有一个关键的区别在于通用具身大模型的驱动。智平方作为国内最早提出并系统性研发端到端VLA（Vision- Language-Action）技术范式的企业，是具身大模型的提出者、践行者、引领者，打造了国产自主可控的具身大模型AI2R Brain。AI2R Brain在泛化任务成功率及端侧运行速度等方面全球领先。本次发布会，智平方宣布原有具身大模型品牌AI2R Bra ...

晚点Auto· 2025-05-22 07:16

从弥补产品短板，到布局长线竞争。文丨魏冰编辑丨龚方毅尽管去年车机端理想同学的战略优先级下降，但管理层对理想同学的整体规划是使其功能更强大、应用更灵活。现在，理想汽车的 AI 战略落地，主要看两个产品："理想同学" 怎么变，以及智能辅助驾驶怎么跑。理想汽车每年举办两次闭门战略会，讨论公司未来的战略方向与落地节奏。去年 10 月，理想在北京雁栖湖凯宾斯基酒店举行秋季战略会，董事长李想、高管及各业务负责人共百余人参会。美团创始人、理想汽车董事王兴也参与了此次会议。会后理想调整了 AI 相关业务的优先级，如将车机端理想同学从最高优先级（ IP0 ）降至最低（IP2），并再次强调智能辅助驾驶（当时内部仍称 "智能驾驶"）业务的战略地位。手机端理想同学的开发并未受影响。根据一位接近理想人士的转述，王兴也在会上提出对理想同学的看法，大意是大模型与车机端理想同学的结合，并不能真正发挥人工智能的潜力。战略会结束的两个月后，理想汽车连续三天推出 "2024 理想 AI Talk"，近半年没有公开露面的李想现身，系统分享了他 ...

Robot猎场备忘录· 2025-05-20 05:01

温馨提示：点击下方图片，查看运营团队2025年最新原创报告（共210页）说明：欢迎约稿、刊例合作、行业人士交流，行业交流记得先加入 "机器人头条"知识星球，后添加（微信号：lietou100w ）微信；若有侵权、改稿请联系编辑运营（微信：li_sir_2020）；正文：近日，南方科大助理教授周博宇在自己知乎账号" 周指导BoyuZhou "梳理了关于具身智能的若干思考，诸多观点跟小编不谋而合，特转载分享给大家：首先要肯定的是，具身智能确实为机器人领域注入了新的研究活力，有望突破机器人的性能上限。具身领域涌现出众多令人钦佩的青年学者，这里就不一一respect了。鉴于具身智能与机器人学存在天然的关联，本文拟立足个人研究视角，以开放的态度分享来自机器人学科背景的观察与思考。同时我也希望读者能保持开放的态度进行讨论，尤其反对瞎带节奏，挑起Robotics与具身派别之争。讨论的意义是如何促进科学发展，不是分出高低贵贱。一、学科无需"称王"，科学本应共生有观点认为，传统机器人学有相当一部分的研究重点在于"特别"的机器人或者"特别"的任务，这类"特殊任务研究"对科学虽然有用 ...

TransDiffuser: 理想VLA diffusion出轨迹的架构

理想TOP2· 2025-05-18 13:08

Diffusion(扩散模型)是一种生成数据的模型，除了Diffusion外，还有其他生成模型，比如GAN(生成对抗网络)、VAE(变分自编码器)等。不同的生成模型在核心思想与生成数据的方法上有区别。 Diffusion的核心思想是通过加噪声(Forward Process)和去噪(Reverse Process)的过程来学习数据的分布。可以想象成一种逆向拼图: 先把一张完整的图片或其他数据打乱成一片模糊，再通过学习如何一步步还原它。去噪的过程是训练一个神经网络，让它去预测每一步的噪声，然后去除噪声，生成目标数据。贾鹏25年3月英伟达GTC上关于理想VLA diffusion出轨迹的表述 VLM是由端到端+VLM两个模型组成的，VLM的两个快慢系统都是输出的轨迹。VLA是一个模型具备快慢思考能力。读者不用被里面的名词吓着，本文经过认真思考，并结合预期的大多数读者的知识储备，做了不少专门解释，逻辑链很清晰，多读几遍能有收获的。本文结构:先解释什么是Diffusion，再分享贾鹏25年3月英伟达GTC上关于理想VLA diffusion出轨迹的表述，最后分享TransDiffuser的架构细节 ...

Zhong Guo Qi Che Bao Wang· 2025-05-18 02:39

5月15日，在吉利汽车控股2025年一季度业绩发布会暨"一个吉利"战略整合计划说明会上，吉利宣布了"回归一个吉利"后的管理层调整：李东辉将出任吉利控股集团副董事长；安聪慧将出任吉利控股集团CEO，合并完成前，安聪慧仍担任极氪科技集团CEO；桂生悦仍担任吉利汽车控股有限公司行政总裁（CEO）及执行董事；淦家阅将出任合并后的吉利汽车集团CEO，吉利汽车集团将下设吉利银河事业群和极氪科技事业群。淦家阅仍担任吉利汽车控股有限公司(0175.HK)执行董事；另外，为培养年轻复合型高级管理人才，戴庆已于2025年3月29日被任命为吉利控股集团轮值总裁，向吉利控股集团CEO汇报工作。至此，"一个吉利"在人、财、法三个方面实现了统一。桂生悦在会上表示，面对激烈的市场竞争和日益复杂的经济环境，吉利汽车只有改变过去品牌小而散、散而乱的形象，进行深度整合，把公司的资源凝聚成一个拳头，才有可能在激烈的竞争中获得胜利。对于这一点，吉利控股集团董事长李书福和全体管理层已经看得很清楚，广大股东们也已经看得很清楚了。在吉利汽车控股有限公司（以下简称"吉利汽车"）关于领克和极氪整合的股东大会上，99.99%的股东投了赞成票，充 ...

智元灵犀机器人“会点拳脚功夫”了，近期将开启首轮预售

Nan Fang Du Shi Bao· 2025-05-16 08:12

当前，人形机器人行动普遍噪音偏大，灵犀X2升级了噪音控制技能，视频中轻柔步态下的灵犀X2走路声音和按压圆珠笔的声音形成了鲜明比较，静音行走，不再"震楼"。不仅腿脚更灵便了，灵犀X2还学会了一系列"拳脚功夫"。智元灵犀X2由彭志辉（稚晖君）于今年3月11日在其B站账号首发，凭借其运动、交互和作业能力引发关注。据了解，经历了两个月的研发迭代，基于硅光动语大模型，灵犀X2全面升级了主动交互能力。比如，面对走近的稚晖君，灵犀X2主动打招呼，并向大家展示了完整的推理思考过程——在面对向他挥手的稚晖君时，灵犀X2先是发现"他的眼镜反光让我有点看不清表情"、随后又基于"要保持交流"的思考，催促自己"快想个话题"，并开始主动交互："你这穿搭真舒服，白色T恤就像干净的画布，蓝色裤子就是那稳重的笔触，我最喜欢和看起来很聪明的人类一起探索科技了！" 灵犀X2还能识别物品。在视频中，面对稚晖君随手拿起的PowerFlow关节件，灵犀X2也展示了信息识别到语音介绍的完整推理过程。目前，灵犀X2已具备了纯视觉自主感知规划能力，依靠头部搭载的 RGB和RGBD摄像头等视觉传感器获取环境信息，能通过算法实现环境感知、决策与 ...

机器人系列报告之二十七：控制器提供具身智能基座，数据飞轮驱动模型迭代

Shenwan Hongyuan Securities· 2025-05-15 15:20

行业及产业机械设备 2025 年 05 月 15 日控制器提供具身智能基座，数据飞行业研究 / 行业深度证券分析师王珂 A0230521120002 wangke@swsresearch.com 戴文杰 A0230522100006 daiwj@swsresearch.com 刘洋 A0230513050006 liuyang2@swsresearch.com 胡书捷 A0230524070007 husj@swsresearch.com 联系人胡书捷 (8621)23297818× husj@swsresearch.com 本期投资提示：本研究报告仅通过邮件提供给中庚基金使用。1 请务必仔细阅读正文之后的各项信息披露与声明证券研究报告轮驱动模型迭代看好 ——机器人系列报告之二十七 ⚫ 目前人形机器人的硬件成熟度高于软件，而软件是人形机器人走向商业化的关键，但研究相对空白。本文主要分析：1）算法：机器人的主要算法，包括运控算法和大模型等；2）数据：主要来源和采集方式，目前所处阶段；3）控制系统：机器人"大脑"的软硬件构成，如何为具身智能提供底层支撑。 ...

郭彦东“详解”具身智能：将AGI的能力真正赋予物理世界的机器人

经济观察报· 2025-05-15 13:57

郭彦东预测通用机器人的"iPhone时刻"将在5至7年后到来。这一预测和百万台产能目标，是基于清醒的行业洞察，还是在资本与舆论裹挟下的理想化宣言？作者：郑晨烨封图：图虫创意 "到2033年，拓展至百万台规模，覆盖工业、物流、家庭服务等多元化场景。"近日，智平方（深圳）科技有限公司（下称 " 智平方 " ）创始人兼 CEO 郭彦东，在公司新一代通用智能机器人 AlphaBot 2的发布会上掷出了这句豪言。对于一家成立刚满两年的初创企业而言，在商业化前景尚未十分明朗的具身智能赛道，立下如此具体的目标，实属罕见。从履历上看，郭彦东曾是微软美国总部核心AI团队成员，任职期间主导开发了多款 AI 前沿技术和产品，其中Custom Vision服务是全球范围内首次将"预训练模型+场景微调"商业化的实践尝试，为 AI技术的大规模应用打开了新思路。他还在小鹏汽车和OPPO担任过首席科学家和研发高管，这名技术和产业"老兵"，选择在人工智能大模型爆发的节点时刻切入机器人赛道，其核心思考逻辑是"将AGI（通用人工智能）从数字世界拓展到物理世界" ...

具身智能

通用人工智能（AGI）

全域全身VLA（视觉 - 语言 - 行动）模型

全域全身VLA（视觉 - 语言 - 行动）模型

Zhong Guo Zhi Liang Xin Wen Wang· 2025-05-15 07:56

在自动驾驶领域，技术的演进如同一场接力赛，从早期的基于规则的系统，到端到端模型，再到视觉语言模型（VLM），如今已经发展到视觉语言行动模型（VLA）阶段。每一步的跨越，都不仅仅是技术的迭代，"人工智能"实质性应用的范例。什么是VLA？ VLA（Vision-Language-Action Model）是视觉-语言-行为大模型，它融合了视觉、语言和行动三种能力，将其统一在一个模型里，只输入到机器就可执行动作的端到端映射，从而赋予模型强大的3D空间理解、逻辑推理和行为生成能力，让自动驾驶能够感知、思考和适应环境。 VLA模型由多个关键模块组成，包括视觉编码器、语言编码器、跨模态融合模块和动作生成模块。视觉编码器负责从图像或视频中提取高层次视觉特征，语言编码器则处理自然语言输入，跨模态融合模块将视觉和语言特征进行整合，而动作生成模块则根据融合后的信息生成车辆的控制指令。 VLA的核心特性包括多模态感知与决策、全局上下文理解和系统透明性。它能够基于视觉和语言信息进行实时感知，并通过"思维链"技术构建类人逻辑，推理复杂场景下的最优驾驶决策。此外，VLA能够理解长达数十秒的全局路况信息，这对于施工工区、潮汐车道 ...