Workflow
视觉
icon
Search documents
当代艺术家:贾蔼力
Jing Ji Guan Cha Bao· 2025-07-06 09:04
(原标题:当代艺术家:贾蔼力) 蓝山 布面油画 210×270cm 2010年 贾蔼力的艺术基因深植于东北黑土地上的铁锈与尘埃。 少年时期目睹父母在经济转轨中下岗的困境,那些废弃厂房中静默的机器,成为他创作中挥之不去的意 象。沈阳鲁迅美术学院的学习经历赋予他扎实的绘画功底,而2007年北上黑石桥的"北漂"生涯,更让他 亲历社会边缘群体的生存挣扎。 这种双重体验熔铸成他独有的视觉语言——荒凉与不安在画布上共生。 在站台中国首个个展"疯景"中,戴防毒面具的人物在钢筋丛林中游荡,如同被时代放逐的幽灵。 面具隔绝了有毒的空气,却隔绝不了精神困境:画面中刚健而爆炸性的笔触如闪电撕裂空间,空置的病 床、悬垂的木椅、扭曲的钢筋,共同构筑了一个承载集体焦虑的视觉档案。正如策展人孙宁所言:"贾 蔼力关注的是现代人精神的匮乏,当社会被物欲笼罩时,我们忽视了内心最重要的精神性"。 贾蔼力的画布是一个象征符号激烈碰撞的战场。 疯景1号 布面油画 2009年 苍白的不只是你(三联作) 2007年 综合媒材 防毒面具作为最具辨识度的符号,在《疯景1号》《苍白的不只是你》等作品中反复出现。 旱冰场的喧嚣中,少年贾蔼力偶然抬眼,瞥见停工厂房 ...
从25年顶会论文方向看后期研究热点是怎么样的?
自动驾驶之心· 2025-07-06 08:44
如果您有任何科研辅导需求,欢迎联系我们! 自驾方向: 大模型、VLA、端到端自动驾驶、3DGS、BEV感知、目标跟踪、毫米波雷达视觉融合、激光视觉融合、 多传感器标定、多传感器融合、车道线检测、在线地图、轨迹预测、世界模型、3D目标检测、Occupancy、高性能计 算、NeRF、语义分割、决策规划等。 具身方向: VLA、视觉语言导航、端到端、强化学习、Diffusion Policy、sim2real、具身交互、抓取点预测与位姿估 计、机器人决策规划、运动规划、3DGS、SLAM、触觉感知、双足/四足机器人、遥控操作、零样本学习等; 3D视觉 相关: 点云处理、3DGS、SLAM等; 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 今年的CVPR和ICCV工作陆续放出,从今年的2大顶会来看热点研究方向,主要集中在四个部分:通用cv、自动驾驶 相关、具身相关、3D视觉相关。下面是4个领域中细分的子方向。 计算机视觉与图像:diffusion、图像质量评估、半监督学习、零样本、开放世界检测等; 自动驾驶相关,集中在端到端、闭环仿真3DGS、多模态大模型、扩 ...
人形机器人“视觉”攻克战
机器人大讲堂· 2025-07-06 05:23
近日,2025RoBoLeague中国机器人足球联赛(以下简称"机超")在北京亦庄打响。 作为国内首个机器人足球3V3 AI赛,同时也是2025世界人形机器人运动会首场测试赛, 此次"机超"最大 的 亮点是参赛机 器人无需遥控器控制,完全依靠AI策略自主运行 。 人形机器人能够不依赖遥控器控制而自主运行,这离不开 视觉传感器 的辅助。 视觉传感器是人形机器人 进行环境感知、实现自主决策与交互 的关键技术之一。在视觉系统的帮助下,人形 机器人得以感知环境并进行建构、识别目标并进行追踪,进而与物体进行交互。 作为人形机器人的核心零部件之一,视觉传感器中的 3D视觉传感器 与人形机器人最为适配,是人形机器人主 流视觉解决方案。它主要包括 激光雷达、多目立体视觉、结构光和飞行时间法(ToF) 等技术路线。在这些 技术的融合与支持下,人形机器人仿佛拥有了"眼睛"。 本文盘点了部分涉及人形机器人视觉技术的企业。 ▍奥比中光 奥比中光成立于2013年,主营业务是3D视觉感知产品的设计、研发、生产和销售,主要产品包括3D视觉传感 器、消费级应用设备和工业级应用设备。 自成立以来,奥比中光凭借出色的产品研发能力、百万级的产品量 ...
本来决定去具身,现在有点犹豫了。。。
自动驾驶之心· 2025-07-05 09:12
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 具身智能无疑是这两年最的方向。从几年前的沉寂到去年的疯狂,再到25上半年开始逐渐冷静。大家慢慢回 过神来,具身机器人还远远未到生产力的阶段。 以下是 知识星球 内部一位双非同学的提问,非常有代表性: 各位大佬们好,我目前是一个双非的研究生,我的研究方向是多传感器融合定位的,然后学过python,深 度学习,ros,但都学的不是很精,现在想多学一点为以后找工作用,感觉算法岗我的学历可能不太行,请 问各位大佬们我应该往哪个方向学比较好呢?具身智能感觉也还不太成熟,不确定这波热度能到什么时 候?请问各位大佬后面应该学些什么知识呢? 星主回答:你的技术栈都比较偏机器人一些,SLAM和ROS这块都可以尝试一下和机器人/具身智能打交道。这 块需求也比较大,可以做一些优化、集成类工作~ 另一方面,我们了解到大一些的公司各家的hc都不是很高,要求基本上都是端到端、大模型、VLA、强化学 习、3DGS这些比较前沿的方向。如果你做的是这块,是有机会的,很多tire 1的公司或者主机厂也正在follow前 沿的技术,大概是从无图往 ...
“3D视觉第一股”奥比中光董事长黄源浩:机器人视觉将超越人眼,未来还有很长的路要走 | 走进上市公司·高见2025
Mei Ri Jing Ji Xin Wen· 2025-07-04 10:56
Core Insights - The article discusses the advancements and future potential of 3D visual perception technology, particularly in the context of robotics and AI, as articulated by Huang Yuanhao, the CEO of Orbbec Technology [2][4][18]. Group 1: Company Overview - Orbbec Technology, founded by Huang Yuanhao in 2013, focuses on developing 3D visual perception technology, which is considered to have disruptive potential in various industries [4][6]. - The company went public in July 2022, becoming the first stock focused on 3D vision technology in the Science and Technology Innovation Board [4]. - As of 2024, Orbbec has 322 R&D personnel, accounting for approximately 47% of its workforce, with R&D investment reaching 204 million yuan, representing 36% of its revenue [6]. Group 2: Market Potential and Growth - The global 3D visual perception market is projected to grow rapidly, with estimates reaching $17.2 billion by 2028 and $15 billion by 2025 [18][20]. - Orbbec has accumulated over 6,000 clients globally in the past three years and aims to exceed 10,000 clients in the next 3 to 5 years [17]. Group 3: Financial Performance - Orbbec's net profit loss has been narrowing, from 615 million yuan in 2020 to 62.91 million yuan in 2024 [8]. - For the first five months of 2025, the company anticipates a cumulative revenue of approximately 363 million yuan, a year-on-year increase of about 117.18%, with a projected net profit of around 55 million yuan [17]. Group 4: Technological Advancements - 3D visual perception technology is evolving from industrial applications to consumer-level products, with Orbbec being one of the few companies with a comprehensive layout across six major technology routes [4][6]. - The technology enables various applications, including biometric recognition, 3D scanning, and industrial measurement, enhancing the capabilities of AI algorithms [7][8]. Group 5: Future Outlook - Huang predicts that the growth of robotics will accelerate significantly once key performance thresholds are crossed, similar to the electric vehicle market [23]. - The future of robotic vision is expected to be highly integrated, focusing on compact, low-power, high-performance visual systems [23][24].
ArtGS:3DGS实现关节目标精准操控,仿真/实物双验证性能SOTA!
具身智能之心· 2025-07-04 09:48
扫描下方 卡片 ,关注" 具身智能 之心 "知识星球 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 一、研究背景与出发点 关节目标操作是机器人领域的关键挑战,核心难点在于复杂的运动学约束和现有方法有限的物理推理能 力。传统方法中,端到端强化学习或模仿学习需要大量试错或演示数据,却常因缺乏物理知识(尤其是关 节运动学)导致动作违反约束,最终失败;而3D视觉方法(如GAMMA、RPMArt)虽能构建关节模型,但 点云固有的稀疏性和无序性,以及时间一致性不足,仍带来诸多挑战。 为此,提出ArtGS框架——通过扩展3D高斯溅射(3DGS),整合视觉-物理建模,实现关节目标的理解与交 互。其核心是利用动态、可微分的3DGS渲染,优化关节骨骼参数,保证物理一致性运动约束,提升操作策 略性能。 | cost; | -sint;cosß; | sinθ;sinß; | a;cosθ; | | --- | --- | --- | --- | | sinθ; | cost;cosB ...
传统导航和具身目标导航到底有啥区别?
具身智能之心· 2025-07-04 09:48
点击下方 卡片 ,关注" 具身智能 之心 "公众号 说到机器人导航,技术路线已经逐渐从早期传统的建图定位导航,到后期基于大模型方案的导航演变。而 基于大模型方案的导航又分为视觉语言导航和目标导航! 策略网络的学习过去集中在如何从标注的数据集中提取模式,数据增⼴在其中起到了关键作用。如今, LLM拥有了强大的先验知识,如何从中蒸馏有效的规划信息,成为了近期研究的热点。 再来看看目标导航 VLN更进⼀步,是目标导航任务(Object Navigation),目标导航要求智能体在陌生的三维环境中,仅凭目 标描述(如坐标、图片、自然语言)等,即可自主完成环境探索与路径规划。 如果说一句话说明这两个任务的区别,视觉语言导航是""听懂指令走对路",目标导航是""看懂世界自己找 路"。 视觉语言导航是什么? 视觉语言导航本质上是个指令跟随的任务。任务囊括了三个方面,理解语⾔指令、感知周围环境,规划运 动策略。一般来说,VLN机器人系统主要由视觉语言编码器,环境历史信息表征,以及动作策略三个模块 构成。 机器人从环境中获取语⾔指令和每⼀步的视觉观测,首先需要同时视觉语⾔编码器从中压缩出有效信息。 采用怎样的编码器,视觉和语言 ...
港大强化学习驱动连续环境具身导航方法:VLN-R1
具身智能之心· 2025-07-04 09:48
作者丨 视觉语言导航 编辑丨 视觉语言导航 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有 你想要的。 主要贡献 研究背景 作者:Zhangyang Qi , Zhixiong Zhang , Yizhou Yu , Jiaqi Wang , Hengshuang Zhao 单位: 香港大学, 上海AI实验室 论文标题:VLN-R1: Vision-Language Navigation via Reinforcement Fine-Tuning 论文链接:https://arxiv.org/abs/2506.17221 项目主页:https://vlnr1.github.io/ 代码链接:https://github.com/Qi-Zhangyang/GPT4Scene-and-VLN-R1 提出VLN-R1框架 :利用大型视觉语言模型(LVLM)处理第一视角视频流,从而实现连续环境中的视觉语 言导航。与以往基于离散导航图的方法不同,VLN-R1能够生成连续的 ...
以玩促学?游戏代码驱动数据合成,提升多模态大模型通用推理
机器之心· 2025-07-04 08:59
如果告诉你, AI 在推箱子等游戏场景上训练,能让它在几何推理与图表推理上表现更好,你会相信 吗? 复旦 NLP 实验室联合字节跳动智能服务团队的最新研究给出了一个令人意外的发现: 游戏不仅是娱乐 工具,更是训练 AI 推理能力的宝贵资源。 Code2Logic: Game-Code-Driven Data Synthesis for Enhancing VLMs General Reasoning 论文链接: https://arxiv.org/abs/2505.13886 代码仓库: https://github.com/tongjingqi/Code2Logic 标题: 数据和模型: https://huggingface.co/Code2Logic 引言 高质量多模态推理数据的极度稀缺,制约了视觉语言模型( VLMs )复杂推理能力的提升。那么,有 没有一种低成本又可靠的方法来大规模生成这些数据呢? 复旦与字节的研究团队创新性地提出了一个巧妙的思路: 利用游戏代码自动合成视觉推理数据。 | A | ਟ | E | ч | 0 | - | | --- | --- | --- | --- | --- | ...
天准科技(688003)每日收评(07-04)
He Xun Cai Jing· 2025-07-04 08:40
天准科技688003 时间: 2025年7月4日星期五 42.27分综合得分 偏弱 趋势方向 主力成本分析 43.60 5日主力成本 45.73 元 20日主力成本 元 当日主力成本 44.88 元 47.15 元 60日主力成本 周期内涨跌停 过去一年内该股 涨停 1次 次 北向资金数据 持股量31.83万股 占流通比0.16% 昨日净买入0.17万股 昨日增仓比0.001% 5日增仓比0.02% 20日增仓比-0.033% 跌停 0 技术面分析 45.90 短期压力位 44.44 短期支撑位 47.80 中期压力位 43.62 中期支撑位 股价跌破短期支撑位,短线观望为宜; 股价跌破中期支撑位,中期主力资金做多意愿不强,以观望为 宜 K线形态 ★平顶★ 温和的反转 资金流数据 2025年07月04日的资金流向数据方面 主力资金净流出1009.56万元 占总成交额-8% 超大单净流出881.71万元 大单净流出127.86万元 散户资金净流入85.95万 关联行业/概念板块 通用设备 -1.46%、机器视觉 -1.03%、边缘计算 -0.61%、人工智能 -0.48%等 财务数据 最近的财报数据显示,该股于 ...