数据集

Search documents
从本体到数据,从VLA到VLN!一个近2000人的具身社区,大家在这里抱团取暖
具身智能之心· 2025-07-11 09:47
马上团队三周年了,一直想找点拿得出手的成果向大家汇报下,第三年想来就是具身这件事情有点 起色了。这两月,我们正在努力将这个社区推向2000人规模。 当第一个同学向我们指出具身智能社区构建的时候,那时候许多方向还不是很明确,后续陆续见证 了ACT、RDT-1/RDT-2、CogACT、OpenVLA、π0、π0.5等工作的推出。着实感慨,具身发展的太快 了。早期自驾是算力和数据跟不上算法,而具身更像是数据跟不上算法和本体。 目前许多有学术需求和求职需求的同学都陆续加入到我们,旨在抱团取暖。内部为大家梳理了近 30+技术路线,无论你是要找benchmark、还是要找综述和学习入门路线,都能极大缩短检索时间。 星球还为大家邀请了数十个具身领域嘉宾,都是活跃在一线产业界和工业界的大佬(经常出现的顶 会和各类访谈中哦)。欢迎随时提问,他们将会为大家答疑解惑。 除此之外,我们还准备了很多圆桌论坛、直播,从本体、数据到算法,各类各样,逐步为大家分享 具身行业究竟在发生什么?还有哪些问题! 技术之外,我们还和多家具身公司建立了岗位内推机制,欢迎大家随时艾特我们。第一时间将您的 简历送到心仪公司的手上。 如果您正在从事具身领域 ...
南京一“瞪羚企业”36款数据产品在江苏数交所挂牌
Sou Hu Cai Jing· 2025-07-09 13:49
在应用场景方面,产业集群企业数据集产品主要服务于政府产业分析、产业招商培育、产业金融服务以 及供应链上下游客户挖掘优化等场景,客户群体包括政府相关部门、金融机构、产业园区及企业。企业 分析报告产品则主要面向金融机构、政府相关部门、产业园区、企业财税服务机构等对企服务和管理机 构,以及企业自身。它适用于金融业务风控、政策匹配申报、企业经营自检、企业外部资信尽职调查等 多重场景,提供个性化的"千企千面"式经营评价、指标分析、风险预警及融资决策支持。 扬子晚报/紫牛新闻记者 万承源 校对 王丽丽 近日,南京"瞪羚企业"数族科技(南京)股份有限公司自主研发的36款数据产品在江苏省数据交易所正 式挂牌亮相。此次挂牌涵盖产业集群分析与企业经营评价两大核心领域,为政府产业治理、金融服务风 控等场景提供精准、高效的数据支撑。 数族科技成立于2016年,总部位于南京江北新区研创园,是国家高新技术企业。作为国家税务总局备案 的电子发票第三方服务商,公司自主研发并持续运营的智能发票管理平台"臻票云"已实现全国、全行 业、全场景覆盖,八年来持续服务了近400万家纳税经营主体。 据介绍,本次在江苏数交所首发挂牌的产品包括两大类共36款 ...
稚晖君,即将成为科创板上市公司高管?
Sou Hu Cai Jing· 2025-07-09 13:28
Group 1: Investment Trends in Embodied Intelligence - The investment frenzy in the embodied intelligence sector has reached a boiling point, with four companies announcing new funding rounds totaling nearly 2.6 billion RMB, with individual amounts exceeding 1 billion RMB [1] - In the first five months of 2025, there were 114 investment events in China's embodied intelligence sector, with total financing exceeding 23 billion RMB, surpassing the total for the entire previous year [1] Group 2: Strategic Acquisition by Zhiyuan Robotics - Zhiyuan Robotics announced a strategic acquisition of over 63% controlling stake in Upwind New Materials for approximately 2.1 billion RMB, causing a significant market reaction [2][4] - The acquisition was structured in two steps: an agreement to acquire 29.99% of shares and a partial tender offer to increase ownership to 66.99% [5][6] Group 3: Implications of the Acquisition - The acquisition allows Zhiyuan Robotics to bypass traditional IPO routes, simplifying the approval process and providing a direct channel to public capital markets [6][15] - This move offers early investors an exit strategy, enhancing their confidence in Zhiyuan's future prospects [16] - The acquisition paves the way for future industry integration and operational flexibility, allowing Zhiyuan to leverage its position for further growth [17] Group 4: Company Background and Leadership - Zhiyuan Robotics is led by co-founder and CTO Peng Zhihui, known for his innovative projects, while Deng Taihua, a former Huawei executive, plays a crucial role in the company's strategic direction [8][12] - The company has rapidly developed a range of robotic products and platforms, showcasing its ambition to become a foundational technology provider in the robotics sector [12][14] Group 5: Market Dynamics and Future Outlook - The robotics industry is transitioning from a focus on physical capabilities to the integration of advanced AI models, with Zhiyuan's GO-1 model positioned as a key player in this shift [14] - The current market demands practical applications of robotics in real-world environments, making Zhiyuan's acquisition a strategic move to accelerate its maturity and commercial viability [14][19]
90后辍学生16个月收入翻20倍的秘密|AI原生100
虎嗅APP· 2025-07-08 09:24
以下文章来源于AGI接口 ,作者陈伊凡 AGI接口 . AI卷起的财富风暴。 出品|虎嗅科技组 作者|陈伊凡、孙晓晨 编辑|苗正卿 头图|《硅谷》剧照 "AI 原生 100" 是虎嗅科技组推出针对 AI 原生创新栏目,这是本系列的第「 03 」篇文章。 当同行还在卷模型参数时,两个辍学生把50个开源AI模型"塞"进了一个画布——点几下鼠标、随手 涂鸦,40毫秒内图像跃然眼前。 Krea,一家AI设计公司,在成立16个月后,年经常性收入(ARR)冲 到800万美元,收入翻了20 倍,用户超2000万,成为入选硅谷最大加速器YC的项目中 "ARR增速最快的公司之一"。同时,Krea 也入选了硅谷顶尖风投机构A16Z GenAI 100的榜单,该榜单收录了当下最有价值的100个AI应用。 资本市场也给了Krea更高的想象空间。根据公开资料,虎嗅测算了Krea的PS值,PS值通俗而言就是 投资者愿意为每1元销售收入支付多少钱。PS值高意味着高市场预期。根据Krea的800万美元年收入 和5亿美元的估值,其PS值为62.5倍,Midjourney的估值为100亿美元,2024年年收入为3亿美元,估 值为33.3倍。 虎 ...
第四次数据标注产业供需对接会暨央企走进国家数据标注基地活动在保定成功举行
Huan Qiu Wang· 2025-07-07 08:06
6月28日,在国家数据局数字科技和基础设施建设司的指导下,由河北省数据和政务服务局、保定市人 民政府、中国信息协会主办的"第四次数据标注产业供需对接会暨央企走进国家数据标注基地"活动在河 北保定成功举行。此次活动以"数聚生态 标注未来"为主题,汇聚了大湾区中央企业数字化协同创新联 盟、中央建筑企业数字化转型协同创新平台、中央企业BIM软件创新联合体,以及来自全国16个省市级 数据管理部门和275家数据标注相关企业,其中央企46家,其他企业229家,共计600余人参会,共同探 讨数据标注产业的高质量发展路径。 在主论坛环节,中国电子信息产业集团首席科学家蒋国飞以《高质量数据集建设路径与实践》为题发表 演讲。他指出,数据已成为人工智能发展的核心驱动力,当前行业急需突破样本数据规模和质量瓶颈。 高质量数据集正在从"劳动密集型"向"知识密集型"转型,需要借助自动化工具、智能标注、人机协同平 台以及数据合成和质量评测等关键技术。他还介绍了中国电子数据产业集团在交通、建筑、农业等多个 领域的成功落地案例,以及"中数天璇"图文数据集在垂直领域AI开发中的支撑能力。 保定市市委书记党晓龙会前与嘉宾进行座谈交流。市委副书记、市 ...
RoboTwin系列新作:开源大规模域随机化双臂操作数据合成器与评测基准集
机器之心· 2025-07-07 07:50
RoboTwin 系列工作曾中稿 CVPR 2025 Highlight、ECCV 2024 MAAS Workshop Best Paper,并作为第十九届"挑战杯人工智能 + 挑战赛"官方赛 题、RoboTwin 双臂协作竞赛赛题 @CVPR 2025 MEIS Workshop、张江人形机器人创新创业大赛赛题,Github 上斩获 1.2k Stars。 本文一作:陈天行,TianxingChen.github.io,2025 级香港大学 MMLab 博士生,师从罗平教授。在学术顶会以一作 / 共一发表多篇论文,获得 ECCV 协同具身智 能研讨会 Best Paper,CVPR Highlight 等。获得 CCF 优秀大学生等多项荣誉以及 20 余项国家级竞赛奖项。担任 CVPR 2025 RoboTwin 双臂协作竞赛组织者。发 起《具身智能技术指南》项目,已破 6k Github Stars。Lumina 具身智能社区联合创始人。 最近,上海交通大学 ScaleLab 与香港大学 MMLab@HKU 领衔发布 RoboTwin 系列新作 RoboTwin 2.0 以及基于 RoboTwin 仿真 ...
腾讯研究院AI速递 20250707
腾讯研究院· 2025-07-06 14:05
生成式AI 一、 Grok 4逆天跑分泄露,「人类最后考试」豪取45%全场第一 ? 1. Grok 4在「人类最后考试」(HLE)测试中得分高达45%,远超Gemini 2.5 Pro和Claude 4 Opus, 引发 讨论 ; 2. 马斯克表示Grok 4以「第一性原理」构建推理机制,像物理学家那样思考,从基本公理层 面分析问题; 3. Grok 4将强化编码能力, 或 分为Grok 4和Grok 4 Code两个版本,预计在7月4日后随时 发布。 https://mp.weixin.qq.com/s/kuk8MfUW_wbS5RAOdV24ZA 二、 Gemini CLI 重磅更新:将 支持音视频处理,与 多项体验升级 1. Gemini CLI 发 布 更新支持音视频输入功能,显著扩展多模态交互能力 ; 实则 目前仅能 处理文本、图片和PDF文件; 2. 增强Markdown功能,新增表格渲染与文件导入功能,并集成VSCodium和Neovim编辑 器,提升开发体验; 3. 技术栈升级至Ink 6和React 19,添加新主题、隐私管理功能,并优化历史记录压缩算法, 提高性能和稳定性。 四、 开源De ...
本来决定去具身,现在有点犹豫了。。。
自动驾驶之心· 2025-07-05 09:12
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 具身智能无疑是这两年最的方向。从几年前的沉寂到去年的疯狂,再到25上半年开始逐渐冷静。大家慢慢回 过神来,具身机器人还远远未到生产力的阶段。 以下是 知识星球 内部一位双非同学的提问,非常有代表性: 各位大佬们好,我目前是一个双非的研究生,我的研究方向是多传感器融合定位的,然后学过python,深 度学习,ros,但都学的不是很精,现在想多学一点为以后找工作用,感觉算法岗我的学历可能不太行,请 问各位大佬们我应该往哪个方向学比较好呢?具身智能感觉也还不太成熟,不确定这波热度能到什么时 候?请问各位大佬后面应该学些什么知识呢? 星主回答:你的技术栈都比较偏机器人一些,SLAM和ROS这块都可以尝试一下和机器人/具身智能打交道。这 块需求也比较大,可以做一些优化、集成类工作~ 另一方面,我们了解到大一些的公司各家的hc都不是很高,要求基本上都是端到端、大模型、VLA、强化学 习、3DGS这些比较前沿的方向。如果你做的是这块,是有机会的,很多tire 1的公司或者主机厂也正在follow前 沿的技术,大概是从无图往 ...
750城市+5000小时第一人称视频,上海AI Lab开源面向世界探索高质量视频数据集
量子位· 2025-07-05 04:03
Sekai团队 投稿 量子位 | 公众号 QbitAI LeCun、李飞飞力挺的世界模型,想要实现,高质量数据是关键,也是难点。 现在,国内研究机构就从数据基石的角度出发,拿出了还原真实动态世界的新进展: 上海人工智能实验室、北京理工大学、上海创智学院、东京大学等机构 聚焦世界生成的第一步——世界探索 ,联合推出一个 持续迭代的高 质量视频数据集项目——Sekai (日语意为"世界") ,服务于交互式视频生成、视觉导航、视频理解等任务,旨在利用图像、文本或视频构 建一个动态且真实的世界,可供用户不受限制进行交互探索。 它汇聚了 来自全球101个国家和地区、750多座城市的超过5000小时第一人称行走与无人机视角真实世界或游戏视频, 配有精细化的标签, 涵盖文本描述、地点、天气、时间、人群密度、场景类型与相机轨迹等重要信息。总的来说,具有视频质量高、视频时间长、视角多样、地域 丰富及多维度标签等特点。 团队还利用Sekai部分数据,训练了一个初步的交互式视频世界探索模型—— Yume (日语意为"梦")。Yume在输入图片的基础上,通过 交 互式键鼠操作 (移动、视角转动)自回归形式地控制生成视频。 构建Sek ...
数据要素发展论坛在京举办,数智北京创新中心落户通州
Xin Jing Bao· 2025-07-04 13:57
北京市数据流通利用增值协作网络建设成果也在论坛上发布,其融合数场、可信数据空间、区块链、隐 私保护计算等技术,初步具备数据主体灵活接入、数据供需全网检索、数据协同安全计算、数据流通全 域可控、数据利用全程可溯等能力,已接入各领域数据源5000多个。论坛还邀请北京、上海、成都、杭 州、大连、深圳、郑州七城市签署了《推动国家数据基础设施试点建设合作协议》,发布了京津冀区域 协同数据标准化行动,举行了北京市数据标准化技术委员会工作组授牌仪式等精彩活动。 在人工智能创新应用方面,论坛聚焦AI大模型等领域高质量数据集需求,创新发布《人工智能高质量 数据集供给图谱》《人工智能高质量数据集建设指南》《北京市行业高质量数据集典型案例》等成果, 组织多地数据标注基地及相关企业共同启动"数据标注产业伙伴计划",推动构建覆盖研发、生产、流 通、应用的高质量数据集开发利用体系。 新京报讯(记者田杰雄)7月4日,2025全球数字经济大会数据要素发展论坛在国家会议中心举办。本届 论坛主题为"以改革创新加速数据价值释放", 论坛通过探索数据"供、流、用、安"等发展趋势,促进 数据要素市场高质量发展,取得丰硕成果。"数智北京创新中心"的共建 ...