Workflow
语言
icon
Search documents
哈啰Robotaxi自研车型首次曝光,北汽极狐T1小型SUV新车亮相,8月下旬开启预售丨汽车交通日报
创业邦· 2025-07-24 10:07
1.【智己官宣"超级增程"技术,具备800V快充+66kWh大电池】智己汽车官宣"超级增程"技术,聚 焦电池容量、续航里程和快充能力三大核心突破。新技术将搭载宁德时代66kWh超大电池,纯电续航 超过450km(CLTC),远高于当前主流增程车型的200-300km水平;同时集成800V高压快充平 台,提升补能效率,支持"一周一充"日常通勤。智己表示,该技术将于8月1日正式发布。(钛度车 库) 2.【哈啰Robotaxi自研车型首次曝光】Robotaxi首款自研车型在上海临港某园区开启测试。从曝光 的图片和视频来看,首款测试车辆为SUV车型,并配备激光雷达。哈啰相关负责人表示,哈啰的目标 是在两年内实现Robotaxi业务规模化,未来还会逐步向国际市场迈进。(钛度车库) 3.【特斯拉欧洲销量连续六个月下滑】7月24日,欧洲汽车制造商协会发布数据显示,特斯拉6月在欧 洲地区新车注册量为34,781辆,去年同期为45,087辆,同比下滑22.9%,这是特斯拉在欧洲销量连 续第六个月下滑。(界面新闻) 4.【北汽极狐T1小型SUV新车亮相:ARC-FLOW概念设计语言、贯穿式前大灯,8月下旬开启预 售】 北汽极狐T ...
NVIDIA最新!ThinkAct:复杂的具身任务中实现少样本适应、长时程规划
具身智能之心· 2025-07-24 09:53
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Chi-Pin Huang等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 写在前面&出发点 VLA推理任务要求智能体解读多模态指令、执行长时程规划,并在动态环境中自适应地行动。现有方法通 常以端到端的方式训练VLA模型,直接将输入映射到动作,而不进行显式推理,这限制了它们在多步骤规 划或适应复杂任务变化方面的能力。 这里提出了ThinkAct:一个双系统框架,通过强化视觉潜在规划将高层推理与低层动作执行连接起来。 ThinkAct训练多模态大型语言模型(MLLM)生成具身推理planning,该planning由基于目标完成度和轨迹 一致性的动作对齐视觉奖励引导。 这些推理planning被压缩为视觉planning潜变量,为下游动作模型提供条件,以实现目标环境中的稳健动作 执行。在具身推理和机器人操作基准测试上的大量实验表明,ThinkAct能够在复杂的具身AI任务中实现少 样本 ...
vivo自研蓝河操作系统内核开源!Rust开发新机遇来了
量子位· 2025-07-24 07:28
而且更加 轻量化 ,对硬件资源 要求低 ;兼顾 通用性 , 支持ARM、RISC-V架构 。 vivo最新宣布, 开源自研蓝河操作系统内核 。 它完全由Rust语言编写,从根本上解决了传统C语言在内存安全、维护成本上的长期难点。 这不仅是国产操作系统的一次突破——在Linux等内核以外另辟蹊径;也是对国产操作系统的一次创新——使用新兴的Rust编程语言,构建内 存安全的操作系统内核。 为了更进一步推动Rust生态发展, 第三届vivo蓝河操作系统创新赛 也即将启动,面向行业及高校,为广大开发者们提供学习交流平台,并给 予丰厚的奖励;同时,vivo也将持续与行业伙伴一起,共同推动Rust语言在中国的推广和普及。 vivo这一波,一石多鸟啊。 明敏 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 芜湖~在AI重塑智能终端这个关键时刻, 首个适用于嵌入式和移动设备的开源Rust内核 ,来了! 而这次vivo开源了蓝河操作系统重中之重的部分——蓝河内核。它是行业首个适用于嵌入式和移动设备的开源Rust内核,兼具安全、轻量和通 用三大优势。 —— 智慧, 指的是蓝河操作系统架构设计深度融合蓝心智能,支持多种AI ...
亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式
量子位· 2025-07-24 07:28
Core Viewpoint - The article discusses the advancements in embodied intelligence, particularly focusing on the development of the Being-H0 model, which utilizes human hand movement data to enhance robot action capabilities and address the data scarcity issue in visual-language-action (VLA) models [1][30]. Group 1: Data Scarcity and Solutions - The lack of real-world data is hindering the development of VLA models, with existing data falling short by three orders of magnitude compared to the required scale of over one hundred million training samples [2]. - The research team from Peking University and BeingBeyond proposed a solution by creating a large-scale dataset from human operation videos, achieving a dataset size in the hundreds of millions [3][17]. Group 2: Being-H0 Model and Innovations - Being-H0 is the first large-scale pre-trained VLA model based on human video hand data, utilizing a novel "physical instruction tuning" framework to map human hand movements to robot action spaces [5][10]. - The model is built on the premise that human hand movements serve as the most complete execution template for various robotic end-effectors, allowing robots to benefit from human motion knowledge [6][10]. Group 3: Training Framework - The physical instruction tuning framework consists of three key components: pre-training from millions of human operation videos, physical space alignment to eliminate data source heterogeneity, and post-training for effective skill transfer to real robots [12][13][14]. - The framework addresses the challenges of data heterogeneity between 2D multimodal data and 3D robot action spaces, enhancing the model's ability to learn and generate actions [12]. Group 4: UniHand Dataset - The UniHand dataset, comprising over 150 million human hand gesture action samples, was systematically constructed to meet the training data needs of the physical instruction tuning framework [20][21]. - Even with just 2.5 million samples from this dataset, the model demonstrated significant performance improvements in gesture action prediction and real robot tasks [21]. Group 5: Experimental Validation - Comprehensive real robot experiments validated the effectiveness of the Being-H0 model, showing it outperformed both its base model InternVL3 and NVIDIA's GR00T N1.5 model in various tasks [22][24]. - The experiments confirmed that the data construction strategy significantly enhances the model's ability to learn human action knowledge from video data, leading to improved task success rates [24]. Group 6: Future Directions - The BeingBeyond team is focused on advancing core technologies in embodied intelligence, dexterous manipulation, and full-body motion control, aiming to integrate robots into everyday life [30].
AI的未来,或许就藏在我们大脑的进化密码之中 | 红杉Library
红杉汇· 2025-07-24 06:29
为什么人类大脑毫不费力就能完成的认知成就,AI到现在都无法复制?"AI之父"杰弗里·辛顿曾说,"我一直坚 信,实现人工智能的唯一途径是以类似于人类大脑的方式进行计算。"那么是不是当我们了解大脑,AI就能突破 现有的局限,真正拥有像人类一样的认知能力? 我们的大脑蕴藏着待解的进化密码,而AI的未来或许正系于此。于是麦克斯·班尼特在他的新书《智能简史》 中,通过独创性框架,将庞杂的人类进化史凝练为"五次突破",架起神经科学与AI的桥梁,讲述大脑的进化史 诗,并揭示这一历程如何塑造下一代AI革新。同时,他结合了AI科学的前沿进展,指出当前AI系统在哪些领域 已比肩或超越人脑,又在何处仍显不足。 本文摘选自《智能简史》,为科学作家万维钢为本书所做的序言,有删节。荐读之。 《智能简史》 [ 美 ] 麦 克 斯 · 班尼特 译者:林桥津 出版时间:2 0 2 5年6月 出版社:中译出版社 你现在待在洞穴里,外面视线可及的范围内有个猎物,你很想出击。 爬行动物面对这种局面都是感觉不错就出手,万一中间遇到什么事儿就临时见招拆招,但我们的哺乳动物 祖先不会如此。它的"超能力"是想象和短期计划。 等会儿我冲刺,猎物会往哪个方向跑 ...
线下活动邀请|探索外汇、固收及贵金属领域量化交易新机遇
Refinitiv路孚特· 2025-07-24 05:12
Core Insights - The article emphasizes the capabilities of Tick History, a cloud-based historical real-time pricing data service that provides access to over 45PB of standardized data from more than 500 trading venues and third-party quote providers [3][4]. Group 1: Tick History Overview - Tick History encompasses over 1 billion tools and has historical data spanning 25 years, amounting to over 87 trillion transactions, enabling users to explore vast market opportunities [2]. - The service offers a consistent data experience across all exchanges, with options to view data in standardized or raw formats [3]. Group 2: Core Solutions - Tick History - Data Packet Capture (PCAP) is a cloud-based repository exceeding 20PB of high-quality global market data, allowing direct access to data center-level information [4]. - The Tick History query feature, supported by Google® BigQuery, enables users to access and analyze massive datasets within minutes [5]. Group 3: Analytical Tools - Tick History Workbench provides standard tools and a Springboard to focus on analyzing market microstructure, trading strategies, or execution quality [6]. - MarketPsych offers a suite of AI-based natural language processing (NLP) solutions, delivering data feeds and predictive insights from real-time, multilingual news, social media, and financial documents [8]. Group 4: Key Services - The service digitizes data from major countries, commodities, currencies, cryptocurrencies, stock sectors, and both public and private companies into machine-readable values and signals [9]. - An emotional framework is established to measure sentiments from extensive news and social media content, including optimism, anger, urgency, and financial language [10]. Group 5: Applications - The solutions are designed to create and enhance trading strategies and predict volatility [11].
维也纳免费约饭!ACL 2025期间这场晚宴不容错过!
机器之心· 2025-07-24 04:08
在这一背景下,作为自然语言处理领域最具影响力的顶级会议之一,ACL 2025 如期而至,成为全球研究者 和技术从业者分享最新成果、探讨未来趋势的重要舞台。 Meetup 日程 活动时间: 奥地利维也纳时间 7 月 30 日 16:00-20:30 活动地点: 维也纳奥地利中心周边 活动规模: 250 人 如果您对业内热点话题感兴趣,想学习前沿新式技术和了解行业变化趋势。我们设置了青年学者 Talk、顶 尖人才 SHOW 和晚宴交流等环节,期待更多青年才俊现场共同探讨前沿技术与应用落地等关键问题,碰撞 转眼之间,时间已来到 7 月,AI 领域依旧保持着快速发展的趋势。 新的研究不断被推出,尤其是在视频生成、自主智能体等方向,多项成果相继刷新 SOTA,引发广泛关注。 想必很多从业者将前往现场参会,除了密集高强度的会议日程之外,不妨也为自己预留一些时间,参与一 场更轻松、更自由的线下交流活动「云帆・ACL 2025 AI Talent Meetup」。 这是一次聚焦前沿技术与人才对话的特别聚会,由机器之心与上海人工智能实验室、东方菁汇、 黄大年茶 思屋科技网站、蚂蚁技术研究院、全球高校人工智能学术联盟共同发起,诚 ...
ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗?
机器之心· 2025-07-24 04:08
大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探 索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力,尤其是数学推理和代码生成。 然而,当前针对 LLM 推理能力的研究主要集中于 被动推理(Passive Reaso ning , PR) ,即在提供完整信息的前提下让模型进行推理。相比之下,对信息不完备 场景下模型推理能力的研究明显不足。 这类场景在实际应用中十分常见,例如侦探需要通过询问和走访获取破案线索,医生需要通过问诊收集诊断依据。我们将这类需要主动获取信息的推理称为 主动 推理(Active Reasoning, AR) 。 目前关于 AR 的方法和基准研究较少,探索不足,制约了 LLM 在复杂现实场景中的应用。如图 1 所示,被动推理是直接从给定的充分信息中求解,而主动推理则 需要从不完整的信息出发,通过多轮交互来获取关键线索,最终得出结论。可以说,被动推理的核心是找到答案,而主动推理的核心是提出正确的问题。 图 1 被动推理(左)与主动 ...
五倍推理加速,激发自回归潜能,苹果新工作让LLM预测未来
机器之心· 2025-07-24 04:08
近年来,语言模型的显著进展主要得益于大规模文本数据的可获得性以及自回归训练方法的有效性。 在这种自回归的训练框架中,每一个 token 都作为其前文上下文的预测目标。 这一方法无需显式标注,使得自回归模型在训练阶段具有明显优势,因而成为主流范式。 机器之心报道 机器之心编辑部 然而,在推理阶段, 自回归生成本 质上是顺 序执行的 ,计算开销大,因为每一步解码都需要完整地运行一次模型。相比之下,人类在表达时常常会先 在句子层 面组织 思路 ,再逐词输出。 那么在大模型推理阶段,能否让大模型摆脱单个 token 顺序预测的瓶颈,也和人类的逻辑一样,从更大层面考虑输出内容呢? 假如能够打破自回归模型的顺序执行本质,就产生了如网友所说的 「具有时间跳跃能力的 LLM」 。 受到启发,苹果的研究人员为此展开思考,借助类似策略,开发了一个框架,使预训练的自回归大型语言模型能够执行 多 token 预测 ,在保持生成质量的同时, 为代码和数学任务提供 高达 5.35 倍的推理加速 ,以及为一般任务提供 约 2.5 倍的推理加速 。 AI 工程师 Jackson Atkins 认为这是一项具有开创性的工作,「最令人兴奋的是这 ...
中银晨会聚焦-20250724
证券研究报告——晨会聚焦 2025 年 7 月 24 日 | 7 月金股组合 | | | --- | --- | | 股票代码 | 股票名称 | | 002244.SZ | 滨江集团 | | 002352.SZ | 顺丰控股 | | 1519.HK | 极兔速递-W | | 002648.SZ | 卫星化学 | | 688019.SH | 安集科技 | | 688680.SH | 海优新材 | | 603011.SH | 合锻智能 | | 600054.SH | 黄山旅游 | | 300476.SZ | 胜宏科技 | | 688519.SH | 南亚新材 | 中银晨会聚焦-20250724 ■重点关注 【策略研究】策略点评*王君 徐亚。人形机器人低位再起。2025 年 7 月 7 日-2025 年 7 月 18 日。 【金融工程】主动权益基金 2025 年二季度配置分析*郭策 李腾。仓位监控: 截止到 2025Q2,主动权益基金仓位中位数为 90.63%,与上一季度相比有所 提升,自 2020 年以来持续围绕在 90%仓位震荡,目前处于历史高位。 【电子】AI 算力产业链更新报告*苏凌瑶。进入 2025 年, ...