计算机视觉

Search documents
单应计算加速数十倍、计算量减少95%!基于几何的SKS和ACA矩阵分解被提出
机器之心· 2025-06-19 03:50
本文由东华大学蔡棽副教授、上海交通大学严骏驰教授和中国科学院自动化所申抒含研究员共同指导并撰写,四名学生作者为东华大学视觉与几何感知实验室的 吴展豪、郭凌希、王佳纯、张斯禹。 一、论文简介 东华大学、上海交通大学、中科院自动化所的研究团队最新提出:两种基于几何的单应矩阵分解,极大地减少了四点求解单应的计算量(相比目前通用的求解稀 疏线性方程组方法减少 95% 以上),可在二维码扫描等典型视觉应用中显著减少计算消耗,并有望应用于其他射影几何、计算机视觉和图形学问题中。 论文已被 IEEE T-PAMI 期刊接收。 论文标题: Fast and Interpretable 2D Homography Decomposition: Similarity-Kernel-Similarity and Affine-Core-Affine Transformations 论文主页链接(含论文、代码、视频介绍、奖金激励):http://www.cscvlab.com/research/SKS-Homography 二、问题介绍 平面单应,又称为二维射影变换,可表示为 3×3 的 8 自由度矩阵 (在相差一个尺度因子下)。源 ...
刚刚,CVPR 2025奖项出炉:牛津&Meta博士生王建元获最佳论文,谢赛宁摘年轻研究者奖
机器之心· 2025-06-13 15:45
机器之心报道 机器之心编辑部 刚刚,在美国田纳西州纳什维尔举办的 CVPR 2025 公布了最佳论文等奖项。 今年共有 14 篇论文入围最佳论文评选,最终 5 篇论文摘得奖项 ,包括 1 篇最佳论文 、 4 篇最佳论文荣誉提名 。此外,大会还颁发了 1 篇最佳学生论文 、 1 篇最 佳学生论文荣誉提名 。 根据会方统计,今年大会共收到 4 万多名作者提交的 13008 份论文。相比去年(11532),今年的投稿数量增长了 13%,最终有 2872 篇论文被接收,整体接收率 约为 22.1%。在接收论文中,Oral 的数量是 96(3.3%),Highlights 的数量是 387(13.7%)。 计算机视觉技术的火热给大会审稿带来了空前的压力。本届投稿作者数量、论文评审者和领域主席(AC)数量均创下新高。 今年前来现场参会的学者也超过 9000 人,他们来自 70 余个国家和地区。 CVPR 官方公布了各个细分领域的论文接收情况,如下图所示。可以看到,图像与视频生成领域今年度的论文接收数量最多,而接收率最高的领域则是基于多视角 和传感器的 3D 以及基于单图像的 3D。 此次,最佳论文奖委员会成员中有 AI ...
“AI掉队者联盟”谋求改命
创业邦· 2025-06-13 03:30
以下文章来源于巨潮WAVE ,作者小卢鱼 现在的AI应用就像韩国偶像团体一样新人辈出——脸还没被认熟就推出了新的版本,然后就是噼里啪 啦一顿造势,结果总是会有作品、实力配不上流量的感觉。 来源丨巨潮商业评论(ID: tide-biz ) 作者丨 小卢鱼 编辑丨 杨旭然 图源丨Midjourney 而那些十年前出道的AI前辈们,则是大部分都面临着技术路线风险、转型困难、金主不再力捧的问 题,落下了一个或者几个梯队。 这两类企业可以有一个共同的名字:AI掉队者联盟。 以曾经行业头部企业商汤为例,2021年赴港上市的时候,贵为全球估值最高的AI独角兽企业,但从 2022年开始股价就一直深度下跌。目前,其市值与最高点相比已蒸发3000亿港元以上。 其创始团队的退场更是令人唏嘘,科研实力过硬、被称为人脸识别技术开拓者的汤晓鸥先生在2023 年猝然离世,联合创始人徐冰也在今年端午节前官宣辞去执行董事及董事会秘书的职务,获任AI芯片 业务负责人。 商汤在公告中强调,此次职务调整是公司整体人才部署与业务聚焦的一部分,某种程度上也可以理解 为,AI 1.0时代的核心技术并不能用于引领2.0时代。 巨潮WAVE . 融入时代巨潮 ...
微美全息上涨5.13%,报2.46美元/股,总市值2415.92万美元
Jin Rong Jie· 2025-06-11 13:50
6月11日,微美全息(WIMI)开盘上涨5.13%,截至21:34,报2.46美元/股,成交10.36万美元,总市值 2415.92万美元。 财务数据显示,截至2024年12月31日,微美全息收入总额5.42亿人民币,同比减少7.42%;归母净利润 7164.15万人民币,同比增长117.01%。 资料显示,微美全息公司是一家在开曼群岛注册成立的境外控股母公司,主要通过其境内实体子公司北 京微美云息软件有限公司进行运营。 WIMI微美全息在广告、娱乐、教育、5G通讯等全息应用领域取得重大突破与跨越式发展,旨在全息3D 计算机视觉采集、AI合成、传输、呈现、应用的各个环节的深度研发与市场应用,并致力于构建拓展性 强、开放性的服务平台,搭建全息技术应用和全息计算机视觉呈现之间的桥梁,实现全息计算机视觉在不 同场景中的应用呈现,推广行业的跨越式发展。以实现WIMI微美全息的愿景"成为中国全息生态的缔造 者"。 本文源自:金融界 作者:行情君 WiMi微美全息专注于计算机视觉全息云服务,为中国规模、覆盖产业链、业绩等方面较优秀的全息云产 业综合实体之一,目标成为有潜力、有国际影响力的全息云平台。 WIMI微美全息覆盖 ...
速递|Buildots完成4500万美元D轮融资,用AI模型+计算机视觉破解建筑业“信息脱节”难题
Z Potentials· 2025-05-30 03:23
图片来源: Buildots 在建筑行业中,管理人员很容易与现场实际情况脱节。他们需要同时处理多项任务,包括掌握成本动 态、与所有利益相关方沟通,以及评估与承包商账单和绩效等方面相关的风险。 Buildots 希望通过人工智能和计算机视觉技术彻底改变这一现状。 这家芝加哥初创公司由 Roy Danon 、 Aviv Leibovici 和 Yakir Sudry 于 2018 年联合创立,其平台通 过处理管理人员安全帽上 360 度摄像头拍摄的图像来追踪施工进度。 Buildots 在由 Qumra Capital 领投的 D 轮融资中筹集了 4500 万美元,OG Venture Partners、TLV Partners、Poalim Equity、Future Energy Ventures 和 Viola Growth 跟投。此次融资使该公司总融资额 达到 1.66 亿美元。 该系统不仅具备监测功能,还能进行预测。团队可以通过 AI 聊天机器人查询项目状态,并使用预测 工具获取可能延误风险或进度问题的预警,避免这些问题演变成代价高昂的麻烦。 我们正在招募新一期的实习生 我们正在寻找有创造力的00后创业 ...
4万多名作者挤破头,CVPR 2025官方揭秘三大爆款主题, 你卷对方向了吗?
机器之心· 2025-05-28 03:02
机器之心报道 机器之心编辑部 当今计算机视觉领域最热门的三个方向。 当今计算机视觉领域最热门的话题有哪些? 「自 2020 年 NeRF 论文首次发表以来,利用深度网络进行 3D 重建已成为趋势。如今高斯泼溅(Gaussian splatting)技术进一步推动了这一发展,」CVPR 2025 程序联合主席、美国俄勒冈州立大学副教授 Fuxin Li 分享道,「本质上,计算机视觉与图形学正在融合。神经渲染研究的兴起,显著推动了 3D 相关论文数量的 增长。」 图像与视频合成 随着研究的不断发展,学界现在能够通过视频和图像形式更精确地呈现环境信息。对该领域的探索已成为 CVPR 2025 论文的焦点,图像和视频合成成为今年大会上最大的类别之一。 「今年商业聊天机器人的一大趋势是它们已经实现了多模态化;它们现在不仅能分析和生成文本,还能分 析和生成图像,有时还能生成视频,」Isola 解释道。「即将出现的能力是生成完整的交互式世界。CVPR 刚刚,CVPR 官方给出了最新统计,他们根据论文提交情况,总结出三大方向: 这份统计是基于全球 4 万多名作者 13008 份投稿结果产生的。相比往年,今年的投稿数量增长了 ...
小红书高级副总裁汤维维: 从“文字转换”到“文化解码”的跨越
Shen Zhen Shang Bao· 2025-05-27 20:29
【深圳商报讯】(记者袁静娴刘欣怡)2025年1月,大量海外网友涌入小红书,他们"交猫税"、互相介 绍宠物、帮做英语作业,海外网友开始学习讲中文,中国网友教海外网友做中餐……一场特别的国际文 化交流在小红书发生。 与此同时,不同国家的文字和语言,成了双方交流的最大障碍。"能不能图文翻译一下?""这是哪个国 家的文字?"面对用户一个又一个的疑问与需求,小红书如何接住这一场突如其来的"泼天富贵"?背后 发生了哪些故事? 首先是依托多模态AI模型,融合了自然语言处理(NLP)、光学字符识别(OCR)与计算机视觉 (CV),让系统不仅能翻译文字,还能"看懂"表情包里的谐音梗。其次是动态学习机制。用户对译文 的编辑行为将持续反哺模型训练,尤其在文化敏感内容(如宗教符号、历史典故)的理解上实现渐进式 优化。最后,从"直接翻译"到"文化适配"。 "跨语言的能力也是最基础的能力,就像'水电煤',我们通过技术+人文的驱动,构建了一个沟通无国界 的社交内容平台。"汤维维感慨道:"小红书的实践证明,当技术深植人文之心,边界终将化为桥梁。" (文章来源:深圳商报) 5月27日,在文化和科技融合发展论坛上,小红书高级副总裁汤维维复盘了这 ...
《科学智能白皮书2025》发布,中国引领AI应用型创新领域
Di Yi Cai Jing· 2025-05-26 13:27
至 2024 年,中国的 AI 相关论文引用量占全球总量的 40.2%,实现了对美国(占比42.9%)的快速追 赶。 5月26日,上海科学智能研究院联合复旦大学、施普林格·自然(Springer Nature) 旗下的自然科研智讯 (Nature Research Intelligence)全球发布《科学智能白皮书2025》(下称"报告")。 物总量快速增长,科学智能异军突起,2020年后加速成长,有力推动了人工智能研究整体的井喷态势。 全球人工智能期刊论文数量在过去十年间激增近三倍——从30.89万篇增至95.45万篇,年均增长率为 14%。人工智能核心领域(如算法、机器学习)占比从44%降至38%;科学智能占比相应提升了6个百分 点,且其年均增长率从2020前的10%,提升至2020后的19%。尤其是在工程科学和生命科学领域,其年 均增长率分别从2020年前的9%和15%,提升至2020年后的16%和29%。 国别研究显示,2015年至2024年间,全球人工智能出版物排名前五的国家/地区的格局发生了转变。中 国增长势头尤为显著,AI出版物总量从2015年的6.01万篇上升至2024年的30.04万篇,占全 ...
易普森科技取得基于计算机视觉技术的机器人控制方法及系统专利
Sou Hu Cai Jing· 2025-05-16 03:50
易普森生物科技(深圳)有限公司,成立于2017年,位于深圳市,是一家以从事批发业为主的企业。企 业注册资本1000万人民币。通过天眼查大数据分析,易普森生物科技(深圳)有限公司共对外投资了1 家企业,参与招投标项目73次,专利信息47条,此外企业还拥有行政许可42个。 来源:金融界 天眼查资料显示,深圳易普森科技股份有限公司,成立于2011年,位于深圳市,是一家以从事专业技术 服务业为主的企业。企业注册资本6148.9058万人民币。通过天眼查大数据分析,深圳易普森科技股份 有限公司共对外投资了7家企业,参与招投标项目127次,财产线索方面有商标信息16条,专利信息70 条,此外企业还拥有行政许可17个。 易普森智慧健康科技(深圳)有限公司,成立于2017年,位于深圳市,是一家以从事软件和信息技术服 务业为主的企业。企业注册资本3000万人民币。通过天眼查大数据分析,易普森智慧健康科技(深圳) 有限公司共对外投资了1家企业,参与招投标项目126次,财产线索方面有商标信息4条,专利信息134 条,此外企业还拥有行政许可20个。 金融界2025年5月16日消息,国家知识产权局信息显示,深圳易普森科技股份有限公司、 ...
长春光机所光电突触器件研究取得新进展
Huan Qiu Wang Zi Xun· 2025-05-10 09:18
来源:中国新闻网 中新网长春5月10日电 (记者 郭佳)记者10日从中国科学院长春光学精密机械与物理研究所(下称"长春光 机所")获悉,该所科研人员开发出一种紫外光电突触器件和一种光电突触晶体管,这两项成果分别为先 进人工视觉系统和神经形态计算视觉的发展提供了新的技术路径。 紫外光电突触器件由长春光机所特种发光科学与技术全国重点实验室黎大兵、孙晓娟研究员领导的研究 团队成功开发。他们通过巧妙的器件设计,利用AlScN的铁电极化特性和GaN的优异光电性能,基于异 质结处空穴的俘获与解俘获机制成功构建了一种新型的紫外光电突触器件。 该器件不仅具备出色的非易失性存储特性,还能够模拟生物视觉系统中的突触功能,进行多阻态调节, 如长时程增强(LTP)、对脉冲增强(PPF)以及学习-遗忘-再学习过程。 光电突触晶体管由该所李绍娟、黎大兵领导的研究团队完成,通过气体吸附辅助的持久光电导策略,实 现从紫外到近红外的宽谱高光电转换效率和长时数据保留能力。 该器件在紫外到近红外波段展现出优异的光电探测性能;通过气体吸附辅助的持久光电导策略,器件在 375nm-1310nm宽谱范围内展现出长时数据保留能力,双脉冲易化(PPF)指数 ...