Workflow
VGM)
icon
Search documents
大模型时代,通用视觉模型将何去何从?
机器之心· 2025-07-02 00:54
正因如此,在这个多模态模型席卷科研与工业的新时代,回顾并总结纯视觉范式下的通用视觉模型研究 仍然是一件十分有意义的事情。 清华大学自动化系鲁继文团队 最近发表于 IJCV 的综述论文系统梳理 了该方向的研究进展,涵盖输入统一方法、任务通用策略、模型框架设计、模型评测应用等内容,希望 能为未来视觉模型的发展提供参考与启发。 然而,随着大语言模型 LLM 的迅猛发展,研究热点已经悄然发生转移。如今,多模态大模型兴起,视 觉被看作是语言模型众多输入模态中的一种,视觉模态数据被离散化为 Token,与文本一起被统一建 模,视觉的「独立性」正在被重新定义。 在这种趋势下,传统意义上以视觉任务为核心、以视觉范式为驱动的通用视觉模型研究,似乎正在逐渐 被边缘化。然而,我们认为视觉领域仍应保有自己的特色和研究重点。与语言数据相比,视觉数据具有 结构化强、空间信息丰富等天然优势,但也存在视觉模态间差异大、难替代的挑战。例如:如何统一处 理 2D 图像、3D 点云和视频流等异质输入?如何设计统一的输出表示来同时支持像素级分割和目标检 测等不同任务?这些问题在当前的多模态范式中并未被充分解决。 论文标题: Vision Gener ...
半年完成5亿元融资,阿里、蔚来、联想等投了人形机器人|早起看早期
36氪· 2025-03-13 00:01
以下文章来源于硬氪 ,作者黄楠 硬氪 . 专注全球化、硬科技报道。36kr旗下官方账号。 面向创新者与集成商,逐际动力提供人形机器人本体软硬件系统和具身Agent开发工具链。 文 | 黄楠 编辑 | 袁斯来 来源| 硬氪(ID:south_36kr) 封面来源 | 企业供图 硬氪获悉,具身智能机器人公司"逐际动力"近期完成A+轮融资,半年累计完成5亿元A轮系列融资,在产业和财务方面均获得头部机构的战略支持,多家老 股东持续跟投,战略产业投资人包括阿里巴巴集团、招商局创投、尚颀资本、蔚来资本、联想创投、彼岸时代、纳爱斯集团,知名财务投资人有高捷资本、 绿洲资本、明势创投、峰瑞资本、南山战新投。 " 逐际动力 " 成立于2022年,围绕三大核心具身智能技术,即本体硬件的设计制造、基于强化学习的小脑全身运动控制和具身大脑模型的训练策略,聚焦全 尺寸通用人形机器人,并衍生了双足机器人等产品。 多形态双足机器人TRON 1(图源/逐际动力) 以全自研核心的软硬件技术、结合人形基础模型, " 逐际动力 " 基于其通用移动操作平台与具身智能软件工具,面向各领域的企业客户、集成商与个人开发 者,提供人形机器人本体软硬件系统和 ...
逐际动力张巍:人形机器人不进工厂,具身不堆真机数据丨具身智能对话#10
晚点LatePost· 2025-02-19 12:23
以下文章来源于晚点Auto ,作者晚点团队 文丨李梓楠 编辑丨程曼祺 这是《晚点 LatePost》 「具身智能对话」系列的第 10 篇。该系列将持续访谈智能机器人和自动驾驶产业链头部公司。往期文章见合集#具身智能对话。 2022 年 10 月的 AI Day ,马斯克站在浑身裸露着线束的 Optimus 原型机边上说,人形机器人产业会是人类历史上规模最大的制造业。 在 Optimus 亮相前的 5 个月,逐际动力成立于中国深圳。这之前,逐际创始人张巍在美国待了 16 年,他在普渡大学电气与计算机工程系获得博士学位,后在 加州伯克利担任博士后研究员,于 2017 年成为美国俄亥俄州立大学终身教授。 一般在美国拿到终身教职的人,不会轻易离开,而张巍则在不久后回国,他说原因很简单,"不想在国外待一辈子"。 晚点Auto . 从制造到创造,从不可能到可能。《晚点LatePost》旗下汽车品牌。 逐际动力创始人 张巍 "如果堆数据、堆算力就能领先,这里没有创业公司什么事了。" 从教授到创业者的转型,在张巍眼中也自然而简单:那时他意识到,机器人未来可能只有 10% 的进步会来源于原始学术创新,剩下的 90% 都要靠工程 ...