Workflow
视觉
icon
Search documents
ICCV 2025放榜!录取率24%,夏威夷门票你抢到了吗?
机器之心· 2025-06-26 06:10
机器之心报道 编辑:+0 ICCV 2025 将于 10 月 19 日至 25 日在美国夏威夷举行。刚刚,ICCV 官方向投稿者发送了今年论文 接收结果的通知。 数据显示,今年大会共收到了 11239 份有效投稿,所有投稿均已进入审稿流程。程序委员会推荐录用 2699 篇论文,最终录用率为 24%。 对比前几届数据,2025 年的投稿量几乎接近 2019 年的三倍,这反映了计算机视觉领域的快速扩张和 学术研究的日益活跃。 尽管投稿数量大幅增加,ICCV 的录用率在过去几年中保持了相对稳定,基本维持在 25% - 26% 的 区间内。 继 CVPR 2025 之后,ICCV 2025 会议也实施了一项旨在强化问责制与诚信的新政策。程序委员会主 席团识别出了 25 名极不负责任的审稿人,并因此对与他们相关的 29 篇论文进行了直接拒稿处理。 这些被拒的论文中,有 12 篇若无此关联本应被录用,但这也引发了争议。 ICCV 2023 投稿 8260 篇,录用 2160 篇,录用率约为 26.15%。 ICCV 2021 投稿 6152 篇,录用 1612 篇,录用率为 26.20%。 ICCV 2019 投稿 43 ...
让机器人“看”世界:最好时代与最硬骨头
南方财经记者雷若馨深圳报道 "我们是在最好的时代攀最高的山峰,在最前沿的行业啃最硬的骨头。"奥比中光创始人、董事长兼CEO 黄源浩对南方财经记者表示。 6月25日,南方财经记者跟随"活力中国调研行"采访团来到位于深圳市南山区的奥比科技大厦。这里 是"3D视觉第一股"奥比中光(688322.SH)的总部。 公开资料显示,奥比中光成立于2013年,并于2022年7月在科创板上市。基于自研芯片和全栈式系统技 术,奥比中光为机器人、3D扫描、生物识别等行业客户及全球开发者提供高性能的3D视觉传感器及机 器人与AI视觉方案。 黄源浩把现在称为"最好的时代"。 他表示,很多人说人工智能出来了,大家都变"卷"了,机会似乎变少了。但我个人认为这才是最好的时 代。"从农业时代到工业时代、互联网时代、人工智能时代,只有这个时代,机器人会帮我们所有的 活,这是奇迹来到的时代。" "机器人的视觉能力将来一定会比人类要好得多,它能收集到比人类更多的视觉信息,决策判断能力会 越来越强。"黄源浩相信。 据奥比中光董事、CFO 陈彬介绍,目前奥比中光的业绩正呈现出高速增长的趋势。2024年,奥比中光 的营收实现了56%的增长,今年1~5月份 ...
MIT终身教授何恺明,入职谷歌了
量子位· 2025-06-26 02:11
目前这一消息已在个人主页同步更新: 一水 发自 凹非寺 量子位 | 公众号 QbitAI AI大牛何恺明最新动向来了! 才刚拿下MIT终身教职没多久,这转眼又 加盟谷歌DeepMind任杰出科学家 。 也是在最近,MIT官网发布公告称: 今年MIT工程学院一共有11位教职人员获得终身教职,而何恺明也在名单中。 要知道他去年3月才正式在MIT开讲,这中间几乎只隔了一年左右时间。 回到这次加盟谷歌,从介绍里可以看到,确切来说他应该算是 兼职(part-time) 。 虽然他本人没有透露更多信息,但某书上已经有自称谷歌员工的网友提前剧透了一波: 他即将加入的是DeepMind 基础研究组 ,直属领导的title是L8——离DeepMind老大哈萨比斯还隔着三个老板的距离。 那么问题来了,已经拥有MIT终身教职的何恺明,为啥又选择和谷歌联手呢? 一扒才知道,原来二者早已多次展开研究合作—— 何恺明其人 先简单回顾一下何恺明的履历。 众所周知,何恺明算是CV领域 (计算机视觉) 的传奇人物。 他本科就读于清华大学物理系,博士师从汤晓鸥,毕业于香港中文大学。 | TITLE | CITED BY | YEAR | | - ...
天准科技(688003)每日收评(06-25)
He Xun Cai Jing· 2025-06-25 09:15
Group 1 - The stock of Tianzhun Technology (688003) has a comprehensive score of 42.17, indicating a weak performance [1] - The main cost analysis shows that the current main cost is 45.97 yuan, with a 5-day main cost of 45.20 yuan, a 20-day main cost of 47.37 yuan, and a 60-day main cost of 47.80 yuan [1][2] - In the past year, the stock has experienced one limit-up and no limit-down [1] Group 2 - The short-term pressure level is at 47.11 yuan, while the short-term support level is at 43.62 yuan [2] - The financial data indicates a loss per share of -0.168 yuan and an operating profit of -0.43 billion yuan, with a sales gross margin of 30.439% [2][3] - The stock has seen a net inflow of main funds amounting to 246.23 million yuan, which is 2% of the total transaction amount [2][3] Group 3 - The stock is associated with industries such as general equipment (0.96%), machine vision (1.62%), edge computing (1.59%), and artificial intelligence (1.57%) [2][3] - The net inflow from retail investors is 282.17 million yuan, while there is a net outflow of large orders amounting to 365.32 million yuan [2][3]
虹软科技(688088)每日收评(06-25)
He Xun Cai Jing· 2025-06-25 09:10
虹软科技688088 时间: 2025年6月25日星期三 56.97分综合得分 较强 趋势方向 主力成本分析 47.83 元 当日主力成本 45.57 元 5日主力成本 44.69 元 20日主力成本 1次 跌停 1 次 北向资金数据 44.07 元 60日主力成本 周期内涨跌停 过去一年内该股 涨停 持股量343.85万股 占流通比0.85% 昨日净买入-0.77万股 昨日增仓比-0.002% 5日增仓比0.101% 20日增仓比0.081% 技术面分析 46.65 短期压力位 44.00 短期支撑位 46.65 中期压力位 42.45 中期支撑位 主力资金净流入3368.74万元 占总成交额11% 超大单净流入1720.26万元 大单净流入1648.48万元 散户资金净流入166.81万 关联行业/概念板块 互联网服务 2.22%、机器视觉 1.62%、生物识别 1.87%、边缘计算 1.59%等 股价突破短期压力位,短线有望走强; 股价突破中期压力位,中线有望走强 K线形态 暂无特殊形态 资金流数据 2025年06月25日的资金流向数据方面 (以上内容为自选股写手差分机完成,仅作为用户看盘参考,不能作为 ...
人形机器人首次打通视觉感知与运动断层,UC伯克利华人博士让宇树G1现场演示
量子位· 2025-06-25 05:00
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 不用提前熟悉环境,一声令下,就能让宇树机器人坐在椅子上、桌子上、箱子上! 还能直接解锁 "跨过箱子"、"敲门" 等任务~ 这是来自UC伯克利、卡内基梅隆大学等团队的最新研究成果 LeVERB框架 —— 基于 模拟数据训练 实现 零样本部署 ,让人形机器人通过感知新环境,理解语言指令就能直接完成全身动作。 传统人形机器人要么 "能看懂指令却动不了"(缺乏全身控制能力),要么 "只能机械执行动作却读不懂环境"(依赖人工预设动作库)。 LeVERB首次打通了 视觉 语义理解 与 物理运动 两者之间的断层,让机器人能像人类一样从"想"到"做",自动感知环境,直接遵循指令完成 动作。 上面展示的"坐下"动作就是通过 " 相机感知环境+'坐在[椅子/盒子/桌子]上'指令" 完成的: 团队还推出了配套基准: LeVERB-Bench 。 这是首个面向人形机器人WBC(全身控制)的 "仿真到真实" 视觉-语言闭环基准,包含10类超150个任务。 团队将该框架部署在 宇树G1机器人 上进行基准测试,结果显示: 在简单视觉导航任务中 零样本成功率达80% ,整体任务成功率 5 ...
机器人视觉语言导航进入R1时代!港大联合上海AI Lab提出全新具身智能框架
量子位· 2025-06-25 00:33
VLN-R1团队 投稿 量子位 | 公众号 QbitAI 你对着家里的机器人说:"去厨房,看看冰箱里还有没有牛奶。" 它不仅准确走到了厨房,还在移动过程中避开了椅子,转身打开冰箱,并回答你:"还有半瓶。" 这不是遥远的科幻,而是视觉语言导航技术的下一站。 由香港大学与上海AI Lab联合提出的 VLN-R1 ,具备将自然语言指令直接转化为第一人称视角下的连续导 航动作的能力,无需依赖离散地图,能在复杂环境中灵活感知、决策与行动,实现类人级别的具身智能导 航。 在VLN-CE基准测试中,VLN-R1展现出了很强性能,仅用Qwen2-VL-2B模型(20亿参数),通过RFT训练 后就超越了7B模型的SFT结果。 更具挑战性的长距离导航中,VLN-R1实现了"跨域迁移"——在R2R上预训练后,仅用1万RxR样本进行 RFT,性能就超过了使用完整RxR数据训练的模型,彰显出极强的数据效率。 VLN-R1:让LVLM采用类Deepseek-R1范式成为具身导航会思考的"大脑" 视觉语言导航(VLN)是具身人工智能领域的核心挑战之一。其核心要求是:让智能体能够基于自然语言指 令(如"走到客厅的沙发旁"),在现实环境中自主 ...
【私募调研记录】远望角投资调研奥比中光
Zheng Quan Zhi Xing· 2025-06-25 00:10
机构简介: 根据市场公开信息及6月24日披露的机构调研信息,知名私募远望角投资近期对1家上市公司进行了调 研,相关名单如下: 1)奥比中光 (远望角投资参与公司现场参观&券商策略会&路演活动&电话会议) 调研纪要:奥比中光在机器人领域提供全技术路线3D视觉传感器和整体解决方案,应用于商用服务、 养老康复、家庭护理、物流配送、农业智能化等场景。公司与消费级3D打印龙头创想三维合作开发消 费级3D打印机和高精度手持3D扫描仪,并与佩极眼镜合作推出3D打印定制眼镜。公司为天工机器人提 供Gemini330系列深度相机,新品Gemini435Le应用于智能物流、机器人等工业自动化领域。3D视觉传 感器提升机器人智能化水平,应用于空间扫描、骨架/手势追踪、定位导航、三维重建等功能。 深圳市远望角投资管理企业(有限合伙)成立于2014年12月30日,由两位原公募基金经理、一位原上市 公司高级管理人员组成核心骨干,从业年限均在10年以上。公司投研团队经验丰富,成立以来以优秀的 风控和稳健的收益受到专业投资机构认可,入选多家券商、银行、FOF等机构白名单。我们立意于做一 家追求远见,长期靠谱的资产管理公司。公司已通过中国证券 ...
新股探寻(影石创新、思看科技、汉朔科技、泰禾股份)
2025-06-24 15:30
新股探寻(影石创新、思看科技、汉朔科技、泰禾股 份)20250624 摘要 影石创新全景相机全球领先,市占率达 67.2%,线上线下销售均衡,线 下与苹果深度绑定。2023 年全球手持智能影像设备市场规模达 364.7 亿人民币,年增速 14.3%,全景相机市场 50.3 亿人民币,未来全景与 运动相机融合及新兴领域应用将扩大市场。 思康科技是工业级 3D 激光扫描仪龙头,国内市场占有率第一,全球第 二,与比亚迪、宝马等合作。2022-2024 年营收分别为 2.1 亿、2.7 亿、 3.3 亿元,年均增速 20%-30%,归母净利润分别为 0.8 亿、1.1 亿、 1.2 亿元,毛利率和净利润率较高,一季度收入和净利润增长均超 20%。 汉朔科技是全球第三大电子价签供应商,国内市占率约 12%,产品覆盖 50 多国,服务超 400 家客户。预计 2028 年全球电子价签市场规模达 350 亿元人民币。欧美市场渗透率高,受益于人工成本上升、通货膨胀 及商店竞争,公司与泡泡玛特合作提升市场关注度。 汉朔科技 2022-2024 年营收从 28 亿增至 44.9 亿元,年均增速超 20%,归母净利润分别为 2.1 ...
AI Lab最新InternSpatia:VLM空间推理数据集,显著提升模型能力
具身智能之心· 2025-06-24 14:09
背景与动机 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 当前视觉语言模型(VLMs)在空间推理任务(如物体位置/大小比较、多视角关系理解)中存在显著不 足。现有数据集存在三大局限: 点击下方 卡片 ,关注" 具身智能 之心 "公众号 核心贡献 作者丨 Nianchen Deng等 1. InternSpatial数据集 编辑丨具身智能之心 规模与结构 : 指令多样性 :支持19种指令格式(Table 1对比) 1. 场景单一性 :数据源集中于室内/室外场景(如SpatialVLM、OSD),缺乏驾驶、具身导航等多样化环 境; 2. 指令格式受限 :仅支持自然语言或区域掩码(如SpatialQA仅用文本,OSD依赖掩码),难以覆盖真实 应用中的多样化查询形式; 3. 多视角监督缺失 :现有数据聚焦单图推理(占比超90%),缺乏跨视角时空关系建模能力。 视觉格式 :原始图/带边界框图/掩码图/编号物体图(Figure 2示例) 1200万QA对(950万单视图 + ...