Workflow
人机交互
icon
Search documents
具身数采方案一览!遥操作和动捕的方式、难点和挑战(2w字干货分享)
具身智能之心· 2025-07-09 14:38
继具身本体未定论专场讨论后,几位嘉宾意犹未尽,决定再来一场圆桌,聚焦具身智能的"方向盘"--遥操作。 遥操作本身并非新概念,甚至在一二十年前效果就非常好了。那这一次,遥操作再次走进大家视野,是带来或准备带来哪些升级呢? 同时,希望本次圆桌,会给正在或准备进行遥操作相关学习和研究的同学,带来有关遥操作一些高屋建瓴的认知,同时为他们今后的学习研究之路带来一些 启发。 本期我们会深入聊到:遥操作是什么、各式各样的遥操作体验分享、遥操存在的意义只是为了采数据吗、动捕有什么难点、aloha的划时代意义、遥操终局 畅想、如果机器人有操作系统等。大家一起来体验这场火花四溅又若有所思的圆桌吧! 完整视频已经上传到国内首个具身智能全栈技术社区: 具身智能之心知识星球 内部,感兴趣的同学欢迎加入交流。 圆桌嘉宾:赵仲夏 格灵深瞳算法总监 北京大学和智源研究院访问-学者(小红书id:夏染) 圆桌嘉宾:智元机器人遥操负责人-王文灏 圆桌嘉宾:清华大学自动化系副教授,灵御智能首席科学家-莫一林(知乎ID:莫一林) 圆桌主持人:知乎大V,沃尔沃哲晰软件(Zenseact)深度学习负责人-刘斯坦 圆桌主持人:具身智能之心 -Gloria ...
开发者遭ChatGPT“赶鸭子上架”!AI编造假功能,结果吸引大量用户,不得不开发出来了
量子位· 2025-07-08 03:31
西风 发自 凹非寺 量子位 | 公众号 QbitAI 笑不活了,ChatGPT闯大祸! AI幻觉随意编造一个产品的新功能,误导用户大量涌入,最后 开发者不得不把这 个虚构的功能真 的做了出来 。 受害者是一个 乐谱扫描网站 ,最近莫名收到大量用户上传的ASCII吉他谱截图,这些截图还都是来自ChatGPT的。 网站开发者懵了: WTF?我们 压根不支持扫描ASCII吉他谱 啊??? 直到这位开发者自己亲自用ChatGPT倒腾了一番才发现,好你小汁,原来如此~ ChatGPT生成ASCII吉他谱之后,会自动推荐大伙儿到他们的网站收听或是进一步创作。 然鹅,该网站平时扫描的都是传统标准五线谱,根本不支持ASCII吉他谱这种小众格式…… 更更笑不活的是,大量用户尝试该功能,把开发者架在那儿了,不支持该功能难免会让满怀期待赶来用户感到失望,显得网站很差劲。 于是乎,这位开发者被迫,加急赶工把这个功能给造了出来。 被ChatGPT"赶鸭子上架"造新功能 这个能扫描乐谱的网站名叫 S oundsli ce ,其中的乐谱扫描仪功能能将图片照片中的 音乐数字化 ,这样你就能收听、编辑和练习。 这位网站开发者表示,他们一直在持 ...
Science Advances发表!南洋理工大学推出头发丝薄度传感器FMEIS,让机器秒懂肌肉「微表情」
机器人大讲堂· 2025-07-06 05:23
肌肉力量作为复杂信号,其 收缩或拉伸 有时并不伴随宏观肢体运动,也因此难以被 传统传感器所感知 。 随着人机界面( HMI)在家庭机器人、康复外骨骼以及远程医疗等领域的不断拓展和广泛应用, 市场对于能 够与人体生理实现无缝集成的传感界面的需求日益增长且愈发迫切。目前,现有的各类肌肉力量监测工具均存 在一定局限性: 肌电图无法对被动肌肉收缩状态进行测量;光学和超声波技术由于采用刚性换能器,在监测 过程中容易产生运动伪影;强粘性肌肉传感器在持久粘附性以及移除后重新应用的稳定性方面面临挑战 ;磁 法测量需手术植入磁铁,有感染风险 …… 在此背景下,如何让机器精准 "读懂"人体信号,切实、准确地捕捉和解读人体肌肉活动及其输出力,依是实 现人机自然交互过程中亟待解决的关键难题。 ▍提出 FMEIS , 实现人机交互新突破 据探索前沿科技边界,传递前沿科技成果的 X-robot投稿, 来自 新加坡南洋理工大学 的 王一凡教授团队 面对肌肉力量监测难题,在新加坡科技研究局、南洋助理教授基金等项目的支持下进行了深入研究,并于近期 开发出一款柔性多通道肌肉电阻抗传感器( FMEIS)。 图 1:柔性多通道肌肉电阻抗传感器 ( ...
3巨头押注下一个十亿级入口:当小米、字节、华为盯上 AI 眼镜,争的不是硬件是交互主权
Xi Niu Cai Jing· 2025-06-30 06:51
作者:Colin "这不是普通的智能眼镜,而是面向下一个时代的个人智能设备,是随身的AI入口。"伴随着雷军的声音落下,1999元的起售价出现在大屏幕上,现场爆发出 热烈掌声。 这款仅重40克的眼镜在发布后半小时内,小米商城官方渠道便宣告售罄。而在京东自营平台,首日销量即突破7000台。小米的入局,标志着全球科技巨头围 绕"下一代计算平台"的争夺战正式进入白热化阶段。 小米AI眼镜,雷军的"随身AI入口"战略 在小米"人车家全生态"的宏大版图中,AI眼镜被赋予了特殊使命——成为连接人与数字世界的轻量化入口。 在硬件配置上,这款产品搭载高通骁龙AR1芯片与索尼IMX681传感器组成的1200万像素摄像头,采用开放式耳机设计并针对亚洲人脸型优化。 重量和续航,则是小米重点突破的技术瓶颈。通过创新的双芯片架构(高通AR1+恒玄2700),小米AI眼镜实现了8.6小时续航能力,显著超越Meta Ray-Ban 的4小时续航。40克的整机重量也比Meta产品轻2克,实现"全天无感佩戴"的设计目标。 "软件定义硬件"的理念贯穿产品始终。小米自研的"超级小爱"AI助手提供三大核心能力:全局多模态交互(能听能看)、全局执行(跨 ...
拿了近 6000 万美金的 AI 语音产品在 VC 圈火了,Mercor 最新估值 100 亿美金
投资实习所· 2025-06-27 05:35
AI 应用领域创业公司的崛起速度,正在越来越快,几乎每个领域都有火箭般式增长的产品,无论是估值还 是收入。 AI 编程领域 不用说了,最近的 Replit,其收入在推出 Agent 后,直接在 6 个月内将 ARR 从 1000 万美金 飙升到了 1 亿美金 。 而在 Meta 对 Scale AI 的巨额投资后,数据标注以及与此相关的 AI 招聘平台 大大受益《 Agent 专属浏览 器 Bb 又拿了 4000 万美金,Meta 投资 Scale 让 AI 招聘平台疯涨 》。 4 个月前,刚完成由 Felicis 领投 1 亿 B 轮估值涨到 20 亿美金的 Mercor《 100 万到 1 亿美金收入,AI 招 聘平台 Mercor 只用了 11 个月 》,最新消息称, 已经有投资人给 Mercor 出了 100 亿美金的估值,但是 被 Mercor 创始人 Brendan 拒绝了 。 Brendan 给出的理由是,因为公司一直盈利,融资太分散他们的注意力了。Meta 对 Scale AI 的投资后, Mercor 加大了数据标注这块的业务,OpenAI 最近表示,Mercor 现在可以在几天之内快速构建 ...
蔚来申请一种人机交互方法相关专利,对同一种手势事件进行功能复用
Jin Rong Jie· 2025-06-20 12:24
金融界2025年6月20日消息,国家知识产权局信息显示,蔚来汽车科技(安徽)有限公司申请一项名 为"人机交互方法、系统、触控模组、控制器、车辆及介质"的专利,公开号CN120179141A,申请日期 为2023年12月。 作者:情报员 天眼查资料显示,蔚来汽车科技(安徽)有限公司,成立于2020年,位于合肥市,是一家以从事研究和 试验发展为主的企业。企业注册资本1800000万人民币。通过天眼查大数据分析,蔚来汽车科技(安 徽)有限公司共对外投资了4家企业,参与招投标项目19次,财产线索方面有商标信息2332条,专利信 息3037条,此外企业还拥有行政许可27个。 本文源自:金融界 专利摘要显示,本申请涉及车辆控制技术领域,具体提供一种人机交互方法、系统、触控模组、控制 器、车辆及介质,旨在解决提高交互体验感的问题。本申请提供的方法包括触控模组接收座舱域控制器 发送的与信息呈现设备关联的应用场景,该应用场景为与信息呈现设备关联的且当前活跃的应用程序对 应的应用场景;触控模组在应用场景下识别用户在触控模组中触控区的手势事件,将手势事件发送至座 舱域控制器,以便座舱域控制器获取在应用场景下,与手势事件匹配的控制操 ...
Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到?
量子位· 2025-06-13 05:07
好家伙,机器人进厂打工原视频流出,整整60分钟,完全未剪辑。 前几天Figure 02晒1分钟物流分拣视频,网友们完全没看够啊。 于是Figure创始人立马 60分钟 进厂打工vlog (未删减版) 奉上。 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 可灵活处理更多类型包裹,更接近人类水平的硬件运动,仔细看机器人在工作时,还会实时查看新数据来观察学习。 可以很轻松地从一堆非结构化的杂乱对象中抽出包裹,并在推走一个包裹的同时,伸手去取另外一个包裹。 要知道,3个月前它还是这样的: 短时间内整体性能飞速提升,到底发生了什么? 刚刚官方同步释出的完整技术解读文档来答疑解惑了。 受益于高质量演示数据集的扩展,以及对Figure自研的Helix神经网络的 视觉电机策略 (visuo-motor policy) 进行架构改进,机器人在高 速工作负载下的稳定性得以长足发展。 另外通过启动状态感知和力感应,在不牺牲效率的情况下还全面增强了机器人的稳健性和适应性。 更多详细技术细节如下。 数据扩展 将前后两次视频对比,物流任务明显扩展至更多形态的包裹,除了标准的硬纸盒,现在还可以处理聚乙烯袋、信封和其它 可折叠、皱缩 ...
拿下数亿订单,大型央国企是其客户,深圳人形交互机器人公司融资数千万|早起看早期
36氪· 2025-06-11 23:48
以下文章来源于硬氪 ,作者黄楠 硬氪 . 专注全球化、硬科技报道。36kr旗下官方账号。 其通用和仿人机器人系列已开始小规模交付。 文 | 黄楠 编辑 | 袁斯来 来源| 硬氪(ID:south_36kr) 封面来源 | 企业供图 硬氪获悉,数字华夏(深圳)科技有限公司(以下简称「数字华夏」)近日完成数千万元天使+轮融资,本轮由同创伟业独家投 资,资金将用于加大技术研发投入和产品优化迭代、并进一步提高生产和交付速度。此前「数字华夏」在去年完成了天使轮融 资,背后资方包括智元机器人等。华君资本担任长期财务顾问。 「数字华夏」成立于2024年3月12日,聚焦AGI机器人规模商用,基于巨号®具身智能交互平台为核心,构建了一套具身智能交互 系统。其核心机器人产品共有三个系列,分别是仿人机器人 「 夏澜 」 、通用人形机器人 「 夏起 」 和IP系列机器人 「 星行侠 」 。 夏澜®仿人机器人(图源/数字华夏) 同时,随着传感器技术的进步、精密的机械设计和先进的控制算法,让这些机器人能够精准感知周围环境信息,比如视觉传感器 可敏锐识别物体形状、颜色及位置,力觉与触觉传感器则能帮助其感知与外界接触时的力度与触感,加上对自 ...
深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键
Z Potentials· 2025-06-09 03:34
图片来源: Stripe Z highlights ElevenLabs 是一家 2022 年由前谷歌机器学习工程师 Piotr Dabkowski 与前 Palantir 部署策略师 Mati Staniszewski 共同创立的软件公司,专注运用深度学习 开发自然逼真的语音合成软件。 ElevenLabs 发展迅猛, 2025 年 1 月完成 1.8 亿美元 C 轮融资,估值达 33 亿美元。其推出的语音转文本模型 Scribe v1 支 持 99 种语言,准确性领先。 Stripe 总裁 John Collison 与哥哥 Patrick Collison 于 2010 年创立支付领域知名的 Stripe 公司,致力于解决支付难题,在其领 导下 Stripe 估值颇高,成为支付行业重要力量 。本次访谈首发于 2025 年 5 月 30 日 Stripe 频道。 John : 效果真的很惊艳,有太多内容可以聊了。谢谢你今天来参加节目。 Mati : 谢谢你的邀请,很高兴来聊聊。 John : 我们有太多内容可以聊了,但不如从最开始说起。你在 2022 年创办了 ElevenLabs ,也就是在 ChatG ...
【深圳特区报】数字华夏创始人兼CEO沈健:用“有温度”的机器人开启人机交互新时代|创新创业深圳人
Sou Hu Cai Jing· 2025-06-02 23:40
"夏澜,我心情不好,给我讲个笑话吧!""夏澜,请告诉我2X+3Y=18,当X=3时,这道方程怎么 解?"……经过一系列互动测试,人形机器人"夏澜"对答如流,还现场编笑话逗笑众人,让沈健连声 称"出乎意料地好!"。 吧世界上唯一没有中断的文明继续传承下去" 双速办"平台让民声有应企事 走基层 看作风 子之以但推进作风建议 许其亮同志逝世 温度"的机器 人利.交口新时1 键而不舍落实中央八项规定精神 端午假期深圳旅游市场旺丁又旺财 接待游客同比增长20.3%,旅游总收入同比增长21. 近日,在深圳粤海街道工勘大厦里,数字华夏创始人兼CEO沈健正与团队调试一台名为"夏澜"的仿人机 器人。这位深耕计算机行业18年的"老兵",如今将全部热情倾注于人形机器人赛道。"机器人是硅基生 命,未来会和碳基人类一样无所不能。但现在,它们更像三四岁孩子,我们要做的就是帮助它们尽快成 长落地。"沈健说。 从计算机行业"老兵"到机器人追风者 2006年,沈健本科毕业后从江苏来到深圳,先后入职两家计算机企业,在第二家企业一干就是17年。他 从一名基层销售人员一路做到公司CEO,亲历这家企业从1亿元到百亿元营收龙头企业的华丽蜕变。 掌管百亿 ...