视觉

Search documents
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
量子位· 2025-06-07 05:02
ReasonMap团队 投稿 量子位 | 公众号 QbitAI 近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突破性进展。 然而,一个关键问题仍然值得追问: 多模态大模型(MLLMs),真的能"看懂图"了吗? 特别是在面对结构复杂、细节密集的图像时,它们是否具备细粒度视觉理解与空间推理能力,比如挑战一下高清 地铁图 这种。 为此,来自西湖大学、新加坡国立大学、浙江大学、华中科技大学的团队提出了一个全新的评测基准 ReasonMap 。 看得出来北京、杭州的地铁图难倒了一大片模型。 这是首个聚焦于 高分辨率交通图(主要为地铁图)的多模态推理评测基准,专为评估大模型在理解图像中细粒度的结构化空间信息 方面的 能力而设计。 结果发现,当前主流开源的多模态模型在ReasonMap上面临明显性能瓶颈,尤其在 跨线路路径规划 上常出现视觉混淆或站点遗漏。 而经强化学习后训练的闭源推理模型(如 GPT-o3)在多个维度上 显著优于 现有开源模型,但与人类水平相比仍存在明显差距。 在面对不同国家地区的地铁图中,四个代表性 MLLM(Qwen2.5-VL-72B-I(蓝色)、 I ...
iOS 26 CarPlay迎来大升级:透明界面+婴儿哭声识别,驾驶体验“听”得见
Huan Qiu Wang· 2025-06-07 03:45
继识别车外警笛、喇叭声后,iOS 26的CarPlay声音识别功能将新增"婴儿哭声检测"。通过手机麦克风实时监测车内环境,一旦识别到婴儿哭声,系统将自动 推送提醒至中控屏,并联动Apple Music播放安抚音乐。这一功能被业内视为苹果布局"家庭驾驶场景"的关键一步,或推动更多车企在车载系统中集成生物 声学识别技术。 此外,苹果宣布将CarPlay Ultra(高端定制版)覆盖范围从阿斯顿·马丁等超豪华品牌,扩展至现代、起亚等主流车企。该版本支持深度接管车辆仪表盘、空 调等核心功能,甚至允许用户通过CarPlay自定义驾驶模式,实现"手机即车机"的生态闭环。 据悉,苹果将于6月10日召开WWDC25全球开发者大会,届时iOS 26的完整功能列表将正式公布。据知情人士透露,此次CarPlay升级或与苹果"视觉大一 统"战略深度绑定,未来所有苹果设备(iPhone、iPad、Vision Pro)的界面设计语言将进一步统一。(青山) 【环球网科技综合报道】6月7日消息,外媒9to5mac独家披露,苹果公司将在即将发布的iOS 26系统中为CarPlay功能带来重大升级,除同步最新"透明元 素"界面设计外,新增两项 ...
复旦大学发表最新Science论文:有望让盲人重获光明,还能解锁红外夜视超能力
生物世界· 2025-06-07 01:40
撰文丨王聪 编辑丨王多鱼 排版丨水成文 在自然界中,有一些动物 (例如蛇类) ,通过感知红外辐射和可见光光谱来更准确地评估周围环境。而我们人类的眼睛缺乏对红外光谱响应的光感受器,只能感 受可见光 ( 光谱范围为380-780nm) , 波长更长、能量更低的红外光无法触发人类的视觉信号。 对于患有严重眼疾 (例如黄斑变性) 的患者而言,理论上来说,红外视觉有助于在弱光和黑暗环境中看清物体,开发出能够利用更广泛光谱 (包括红外光) 的 技术可能会给这些患者带来显著益处。 2025 年 6 月 5 日 ,复旦大学 集成电路与微纳电子创新学院 周鹏 / 王水源 团队、复旦大学 脑科学研究院 张嘉漪 / 颜彪 团队及 中国科学院上海技术物理研究 所 胡伟达 团队合作,在国际顶尖学术期刊 Science 上发表了题为: Tellurium nanowire retinal nanoprosthesis improves vision in models of blindness 的研 究论文。 该研究开发出了 全球首款 光谱覆盖范围极广 (470-1550nm,从可见光延伸至近红外二区) 的 视觉假体 , 无需依赖任何外 ...
易思维科创板IPO:董事长郭寅控股56%,天津大学博士、曾留校任教
Sou Hu Cai Jing· 2025-06-06 12:41
Core Viewpoint - Yisiwei (Hangzhou) Technology Co., Ltd. has been accepted for an IPO on the Sci-Tech Innovation Board, marking it as the first Sci-Tech Innovation Board IPO accepted in June and the fourth this year by the Shanghai Stock Exchange [2] Group 1: Company Overview - Yisiwei specializes in the research, production, and sales of machine vision equipment for automotive manufacturing, providing solutions for various processes in vehicle and component manufacturing [2] - The company holds the largest market share in its field in China and is recognized as a key "little giant" enterprise, breaking the long-standing foreign monopoly and accelerating the digital transformation of domestic automotive manufacturing [2] - Yisiwei is also expanding its business into rail transit maintenance and aviation sectors, continuously exploring new application scenarios [2] Group 2: Financial Performance - Projected revenues for Yisiwei from 2022 to 2024 are 223 million yuan, 355 million yuan, and 392 million yuan respectively [2] - The net profit attributable to the parent company for the same period is expected to be 6.4 million yuan, 61 million yuan, and 85 million yuan respectively [2] - Key financial indicators for the company show total assets of 7035.58 million yuan and net profit of 843.32 million yuan for the year ending December 2024 [3]
《Science》刊文!复旦科学家通过脑机接口,使失明动物恢复视觉功能
机器人圈· 2025-06-06 10:10
6月6日,中国科学家在《科学》(Science)杂志上线的最新研究成果显示,借助脑机接口等技术,新一代视觉假 体不仅使失明动物恢复可见光视力,还可扩展其视觉功能,这为失明患者复明提供了新可能。 团队合影(从左至右:王水源、胡伟达、张嘉漪、周鹏) 温丛健 摄 上述科研成果由复旦大学集成电路与微纳电子创新学院周鹏/王水源团队、脑科学研究院张嘉漪/颜彪团队联合中 国科学院上海技术物理研究所胡伟达团队合作完成 ,相关成果以 《碲纳米线视网膜假体增强失明视觉》 (" Tellirium Nanowire Retinal Nanoprosthesis Improves Vision in Models of Blindness ")为题发表于 《科学》 ( Science ) 杂志。 研究显示,该团队开发出全球首款光谱覆盖范围极广(470-1550nm,从可见光延伸至近红外二区)的视觉假 体, 该假体无需依赖任何外部设备,即可使失明动物模型恢复可见光视觉能力,还能赋予动物感知红外光 ,甚至 识别红外图案的"超视觉"功能,也就是在黑暗中也能看见事物。 该科研团队在接受澎湃新闻记者采访时表示,通常而言的"可见光",指人类视网 ...
两轮数亿元融资!谁在撬动千亿视光智造?
思宇MedTech· 2025-06-06 09:56
2025年7月17日,第二届全球医疗科技大会 2025年9月4-5日,第三届全球手术机器人大会 思宇年度活动回顾: 首届全球眼科大会 | 首届全球骨科大会 | 首届全球心血管大会 即将召开: 2025年6月12日,首届全球医美科技大会 目前 公司已拿下国内超60%头部隐形眼镜厂商订单 ,其Insvis智能检测系统也将业务延伸至医药包装、医疗耗材等领 域。 # AI视觉重构隐形眼镜产线逻辑 相比其他工业品,隐形眼镜的智能化挑战 不仅在于产能扩大,更在于"看得见"的难度 。镜片材质透明、结构精细,且 绝大多数产品需长期浸泡于液体中,任何微小瑕疵都可能被液体折射掩盖。再加上90%以上的镜片需印刷复杂图案,传 统机器视觉检测早已难以胜任。而平方和科技的做法是, 把图像采集系统、光学建模与深度学习算法整合为一个自进 化的系统 ,使"检测"不仅止于筛选,更能反向推动产线的工艺改进。 当AI视觉技术深入传统视光制造业,智能制造从"自动化"迈向"智能化",一场围绕透明材质检测与产线优化的产业升级 悄然展开。 近日, 平方和(北京)科技有限公司 (简称"平方和科技")宣布 完成 近 亿元B+轮融资 ,本轮由 北京市先进制造和智 ...
兰剑智能(688557)每日收评(06-06)
He Xun Cai Jing· 2025-06-06 09:48
Group 1 - The stock of Lanjian Intelligent (688557) has a comprehensive score of 60.85, indicating a strong performance [1] - The main cost analysis shows the following prices: 29.40 CNY for the day's main cost, 29.91 CNY for the 5-day main cost, 28.17 CNY for the 20-day main cost, and 24.63 CNY for the 60-day main cost [1] - There have been no instances of the stock hitting the upper or lower limits in the past year [1] Group 2 - The short-term pressure level is at 31.44 CNY, while the short-term support level is at 29.30 CNY [2] - The mid-term pressure level is at 32.90 CNY, and the mid-term support level is at 23.16 CNY [2] - Current short-term and mid-term trends are unclear, awaiting direction from main capital [2] Group 3 - On June 6, 2025, the net outflow of main capital was 482.75 thousand CNY, accounting for 4% of the total transaction amount [2] - There was a net inflow of 789.90 thousand CNY from super large orders, while large orders saw a net outflow of 1,272.65 thousand CNY [2] - Retail investors experienced a net outflow of 157.84 thousand CNY [2] Group 4 - Related industry sectors showed slight declines: General Equipment at -0.52%, Machine Vision at -0.45%, Digital Twin at -0.05%, and Artificial Intelligence at -0.32% [2]
天准科技(688003)每日收评(06-06)
He Xun Cai Jing· 2025-06-06 09:08
天准科技688003 时间: 2025年6月6日星期五 48.41分综合得分 偏弱 趋势方向 主力成本分析 47.80 元 当日主力成本 48.50 元 5日主力成本 48.86 元 20日主力成本 50.35 元 60日主力成本 周期内涨跌停 过去一年内该股 涨停 1次 跌停 0 次 短期支撑位 54.44 中期压力位 45.45 中期支撑位 北向资金数据 | 持股量31.83万股 | 占流通比0.16% | | --- | --- | | 昨日净买入0.17万股 | 昨日增仓比0.001% | | 5日增仓比0.02% | 20日增仓比-0.033% | 技术面分析 52.72 短期压力位 48.18 股价跌破短期支撑位,短线观望为宜; 目前中期趋势不慎明朗,静待主力资金选择方向 K线形态 暂无特殊形态 资金流数据 2025年06月06日的资金流向数据方面 | 主力资金净流出3691.00万元 | | --- | | 占总成交额-18% | | 超大单净流出1846.29万元 | | 大单净流出1844.71万元 | | 散户资金净流出72.88万 | 关联行业/概念板块 通用设备 -0.52%、机器视觉 ...
36氪精选:辅助驾驶人才争夺战:一把手下场挖人VS法务连续起诉
日经中文网· 2025-06-06 07:55
编者荐语: 日经中文网与36氪展开内容交换合作,精选36氪的精彩独家财经、科技、企业资讯,与读者分享。 以下文章来源于36氪Pro ,作者李安琪 李勤 36氪Pro . 36氪旗下官方账号。深度、前瞻,为1%的人捕捉商业先机。 车企的AI辅助驾驶人才饥渴症。 文 | 李安琪 编辑 | 李勤 封面来源 | 日经中文网 入职新公司第一天,张杨(化名)被要求"吐露"上家公司的辅助驾驶算法与代码。因没有积极配合,张杨没在新公司待多久就离 开了。 张杨的前东家是理想汽车,近年因迅速落地辅助驾驶而被行业关注,成为同行重点"探秘"的对象。 辅助驾驶的技术演化在持续喷发。从传统的基于规则的方案转向"端到端"模型路线后,车企的人才画像需求发生了极大变化,中 国车企像互联网大厂与AI公司一样渴求AI人才。 行业竞争激烈而持续。车企内部,团队赛马、立军令状、集体封闭式开发、"做不出来就换人"等,已经成为辅助驾驶部门的常 态。在高压的交付压力下,挖角高端人才、解密头部公司的技术,成为企业的一些"水下动作"。 尤其今年以来,辅助驾驶第一梯队公司的人才遭到了哄抢。有猎头人士告诉36氪,在端到端、AI大模型这波浪潮中,华为、理 想、Mom ...
易思维报考上市:国投基金清仓退出,郭寅“套现”超6500万元
Sou Hu Cai Jing· 2025-06-06 06:45
Core Viewpoint - Easy Vision (Hangzhou) Technology Co., Ltd. has submitted its prospectus for an IPO on the Shanghai Stock Exchange's Sci-Tech Innovation Board, aiming to raise 1.214 billion yuan for projects related to machine vision product industrialization, R&D center, and working capital [1][3]. Company Overview - Easy Vision focuses on the R&D, production, and sales of machine vision equipment for the automotive manufacturing sector, providing solutions for various manufacturing processes. The company is also expanding into rail transit maintenance and aviation sectors [3]. - As of the end of 2024, Easy Vision's products are utilized by major automotive brands including FAW-Volkswagen, SAIC Volkswagen, and BYD, among others [3]. Shareholder Structure - The controlling shareholder of Easy Vision is Yisi Siyuan Technology Co., Ltd., which holds 35.08% of the shares. The actual controller, Guo Yin, holds 12.27% directly and controls a total of 56.13% of the company through various entities [4][6]. - Guo Yin has a background in precision instruments and has been the executive director and general manager since the company's establishment [6]. Financial Performance - Easy Vision's revenue for 2022, 2023, and 2024 was approximately 223 million yuan, 354 million yuan, and 392 million yuan, respectively, with a significant revenue growth rate of 58.98% in 2023, which dropped to 10.58% in 2024 [10]. - The company's net profit for the same years was approximately 5.39 million yuan, 57.75 million yuan, and 84.33 million yuan, showing a remarkable compound annual growth rate of 295.66% [10]. Financial Metrics - Key financial metrics as of December 31 for 2022, 2023, and 2024 include total assets of 546.83 million yuan, 650.57 million yuan, and 703.56 million yuan, respectively. The net profit attributable to the parent company was 6.4 million yuan, 61.04 million yuan, and 85.46 million yuan [11]. - The company's gross margin was relatively high, with rates of 62.69%, 64.69%, and 65.49% for the respective years, outperforming the average gross margin of comparable companies [12][13]. Market Position - Easy Vision's main revenue source is the automotive manufacturing sector, contributing approximately 93.25% to 96.68% of its total revenue from 2022 to 2024 [10]. - The company is actively exploring new markets and applications, including rail transit maintenance and international expansion [10].