计算机视觉

Search documents
自驾搞科研别蛮干!用对套路弯道超车~
自动驾驶之心· 2025-07-11 01:14
读研想少走弯路、快速出成果?靠自己瞎摸索费时间费精力还没结果,找个厉害的榜样"抄作业",才是最 直接的办法。 导师介绍 毕业于知名计算机名校。曾在多家公司担任算法研究员,并进行计算机视觉,高效模型压缩算法,多模态 大语言模型的研究,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理。 博士期间研究方向聚焦为计算机视觉,高效的深度学习训练和推理方法,大语言模型轻量化与高效微调技 术。 这套路看着"功利",但真能让你在科研路上跑快点,别人还在绕小道,你已经上了高速。 厉害的榜样通常 来说,就是那些论文专利一大堆的导师学长学姐,但苦于和这些榜样搭不上话, 现在如何让入场甩开同 行,别人摸路你超车? 自动驾驶之心联合业内知名LLM/MLLM方向学者推出了1v6指导小班课。从模型理论到代码实践, 业内大 牛手把手带走科研全流程,帮助大家形成自己的知识体系, 掌握LLM/MLLM论文的算法设计及创新思路。 扫码免费咨询 【科研成果】 在国际顶级会议CVPR,ICCV, EMNLP等发表十余篇论文, 并担任CVPR,ICCV,ECCV,ICML,ICLR, NeurIPS 等重要会议和期刊的审稿人。多项发明专利,已经指 ...
从25年顶会论文方向看后期研究热点是怎么样的?
自动驾驶之心· 2025-07-06 08:44
如果您有任何科研辅导需求,欢迎联系我们! 自驾方向: 大模型、VLA、端到端自动驾驶、3DGS、BEV感知、目标跟踪、毫米波雷达视觉融合、激光视觉融合、 多传感器标定、多传感器融合、车道线检测、在线地图、轨迹预测、世界模型、3D目标检测、Occupancy、高性能计 算、NeRF、语义分割、决策规划等。 具身方向: VLA、视觉语言导航、端到端、强化学习、Diffusion Policy、sim2real、具身交互、抓取点预测与位姿估 计、机器人决策规划、运动规划、3DGS、SLAM、触觉感知、双足/四足机器人、遥控操作、零样本学习等; 3D视觉 相关: 点云处理、3DGS、SLAM等; 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 今年的CVPR和ICCV工作陆续放出,从今年的2大顶会来看热点研究方向,主要集中在四个部分:通用cv、自动驾驶 相关、具身相关、3D视觉相关。下面是4个领域中细分的子方向。 计算机视觉与图像:diffusion、图像质量评估、半监督学习、零样本、开放世界检测等; 自动驾驶相关,集中在端到端、闭环仿真3DGS、多模态大模型、扩 ...
中美AI差距有多大,AI竞争焦点在哪?《全球人工智能科研态势报告》全球首发
Tai Mei Ti A P P· 2025-07-03 10:36
Core Insights - The report titled "Global AI Research Landscape Report (2015-2024)" analyzes the evolution of AI research over the past decade, highlighting the competitive landscape between China and the United States in AI talent and publication output [2][7]. Group 1: AI Research Trends - The report identifies four distinct phases in AI research: initial phase (2015-2016), rapid development phase (2017-2019), maturity peak phase (2020-2023), and adjustment phase (2024) [4][5]. - The number of AI papers published globally increased significantly, with a peak of 17,074 papers in 2023, representing nearly a fourfold increase from 2015 [5][6]. - The year 2024 is expected to see a decline in publication volume to 14,786 papers, indicating a shift towards more specialized and application-oriented research [6]. Group 2: Talent Distribution - China has emerged as the second-largest hub for AI talent, with a total of 52,000 researchers by 2024, growing at a compound annual growth rate of 28.7% since 2015 [8]. - The United States leads with over 63,000 AI researchers, with significant contributions from institutions like Stanford and MIT, as well as tech giants like Google and Microsoft [8][9]. - Chinese institutions such as the Chinese Academy of Sciences, Tsinghua University, and Peking University are leading in terms of publication output and talent concentration [7][9]. Group 3: Institutional and Corporate Performance - The Chinese Academy of Sciences published 4,639 top-tier papers, while Tsinghua University and Peking University followed closely, showcasing China's institutional strength in AI research [7][9]. - In contrast, U.S. companies like Google, Microsoft, and Meta have a significantly higher average publication output compared to their Chinese counterparts, reflecting a disparity in research investment and output capabilities [9][10]. - The top three U.S. companies published 5,896 papers, which is 1.8 times the output of the top three Chinese companies [9][10]. Group 4: Gender Disparity in AI Talent - The report highlights a significant gender imbalance in AI research, with women making up only 9.3% of AI talent in China compared to 20.1% in the U.S. [12][13]. - Chinese institutions like Tsinghua University and Peking University have low female representation in AI, at 7.88% and 9.18% respectively, compared to 25%-30% in top U.S. institutions [12][13]. Group 5: Future Trends in AI Research - The report indicates that "deep learning" has been the dominant focus in AI research over the past decade, but its growth rate is expected to slow down, suggesting a need for new approaches [14][15]. - Emerging technologies such as "Transformers" are gaining traction, particularly in natural language processing and multimodal AI, indicating a shift in research focus [15]. - The integration of traditional AI fields with deep learning techniques is becoming more prevalent, reflecting a trend towards collaborative and interdisciplinary research [15].
大会发布 | 世界人工智能大会青年菁英交流会学术研究成果征集通知
3 6 Ke· 2025-07-03 02:53
Group 1 - The event aims to promote academic exchange and innovation collaboration among global youth AI researchers, responding to the theme of the World Artificial Intelligence Conference [3] - The initiative seeks to provide a high-standard academic exchange platform for young scholars and technology developers, facilitating the collision of academic ideas and the transformation and dissemination of research results [3] Group 2 - The call for submissions focuses on cutting-edge explorations in the field of artificial intelligence, covering areas such as large models, generative AI, computer vision, reinforcement learning, AI ethics, and interdisciplinary applications [4][5][6][7][8] - Submissions can take the form of academic posters or preprint papers, with specific guidelines for each format, including visual presentation requirements and structural expectations for research papers [8][9] Group 3 - Selected works will be showcased at the World Artificial Intelligence Conference, with opportunities for authors to present their findings and engage with industry leaders [10] - Authors may apply for direct recommendations to top international journals, including Nature Machine Intelligence, with expedited review processes for recommended papers [10][14] Group 4 - Submission materials must include a title, author information, and either a poster design file or a full preprint paper, along with a brief research highlight summary [11] - The submission deadline is July 10, 2025, with notifications of review results by July 15, 2025, and the conference scheduled for July 27, 2025, in Shanghai [12]
实验室10篇论文被ICCV 2025录用
自动驾驶之心· 2025-07-02 13:54
作者 | IPIU智能感知与图像理解 点击下方 卡片 ,关注" 3D视觉之心 "公众号 第一时间获取 3D视觉干货 >> 点击进入→ 具身智能之心 技术交流群 论文作者: 何佩,李玲玲,焦李成,尚荣华,刘芳,王爽,刘旭,马文萍 作者单位: 西安电子科技大学 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 近 日 , 第 20 届 ICCV 国 际 计 算 机 视 觉 大 会 (The 20th IEEE/CVF International Conference on Computer Vision (ICCV 2025))公布了论文接收结果, 实验室共有10篇论 文被ICCV 2025录用 ,第一作者分别是何佩博士(导师:焦李成教授),吴兆阳博士生 (导师:刘芳教授),缑雪健硕士生(导师:刘芳教授),王鑫硕士生(导师:缑水平教 授),闵聿宽博士生(导师:邓成教授),朱宜航博士生(导师:邓成教授),慕晨宇硕 士生(导师:邓成教授,杨二昆副教授),石光辉博士生(导师:梁雪峰教授),杜瑞琦 博士生(导师:唐旭教授)及冯明涛副教授。论文简要介绍如下: ...
极智嘉 全栈技术筑壁垒掘金仓储自动化黄金赛道
Sou Hu Cai Jing· 2025-07-02 09:30
中国上市公司网/文 北京极智嘉科技股份有限公司(以下简称"极智嘉")今起招股,至7月4日结束,并计划于2025年7月9日正 式在港交所主板挂牌上市。极智嘉本次计划发行140,353,000股H股。其中,香港公开发售14,035,400H 股,国际发售126,317,600股H股。以每股16.80港元的发行价计算,极智嘉将通过本次IPO募集23.58亿港 元。 值得一提的是,极智嘉在本次IPO发行中共引入4名基石投资者、累计认购9130万美元(约7.167亿港元) ——其中,雄安机器人认购4130万美元,Arc Avenue认购2500万美元,保诚旗下Eastspring Investments 认购1500万美元,纵腾集团持有的亿格认购1000万美元。成立于2015年的极智嘉(Geek+)提供一系列 AMR仓储机器人解决方案,旨在赋能仓储履约和工业搬运场景,在大幅提高供应链效率的同时减少对 人工的依赖。 核心技术:软硬件协同创新构筑壁垒 极智嘉通过自主研发构建了覆盖硬件、软件、算法的全栈技术体系,形成显著的技术护城河。 导航与定位技术 极智嘉率先在全球AMR解决方案市场中引入激光视觉融合SLAM技术,该技术融 ...
重磅直播!清华&博世开源SOTA性能纯血VLA:Impromptu-VLA告别双系统~
自动驾驶之心· 2025-07-01 12:58
论文链接:https://arxiv.org/abs/2505.23757v1 对于想入门的同学,建议扎实深度学习和计算机视觉基础,逐步了解自动驾驶各模块。多阅读前沿论文,并通过 开源项目动手实践,熟悉数据处理和模型训练流程。希望能为大家带来启发,期待与大家交流。 数据集pipeline: >>直播和内容获取转到 → 自动驾驶之心知识星球 项目主页:https://github.com/ahydchh/Impromptu-VLA 当前自动驾驶系统在城市和高速公路等结构化环境中取得了显著进展,但面对乡村小路、临时施工区、非标准交 通规则以及恶劣路况等"非结构化场景"时,其鲁棒性和安全性仍面临严峻挑战。现有大规模自动驾驶数据集主要 侧重于常规交通状况 ,导致在这些复杂多变的非结构化环境中缺乏专门的、大规模且精细标注的数据。为了弥 补这一关键空白,清华AIR联合博世中央研究院 提出并构建了 Impromptu VLA 框架,旨在提供一个开放权重和 开放数据的驾驶视觉-语言-动作模型。Impromptu VLA 是一个完全端到端、无中间感知表征的"纯血VLA"系统, 其从驾驶视频片段中直接提取多模态特征,并生成自然语 ...
暑假打打比赛!PRCV 2025空间智能与具身智能视觉感知挑战赛正式启动~
自动驾驶之心· 2025-06-30 12:51
空间智能与具身智能视觉感知挑战赛 竞赛目的与意义 视觉感知是实现空间智能与具身智能的关键支撑技术,近年来在自动驾驶、智慧城市、机器人等场景中展现出 广泛应用前景。特别是强化学习等技术在智能体感知与决策中的深度融合,正在成为推动该领域突破的重要力 量。 • 推动高效、高质量的空间智能和具身智能技术的研究。 • 探索强化学习、计算机视觉、图形学等前沿方法的创新。 • 促进神经渲染、场景优化和机器人抓取等方向的应用。 竞赛组织方 组织者 :彭君然、陈磊、唐彦嵩、刘健、许修为、尹航、孙浩文、卫浩宇、刘旭阳、赵鑫 指导专家 :张兆翔、鲁继文、殷绪成 组织单位 :北京科技大学、清华大学、中国科学院自动化研究所、北京九章云极科技有限公司、塞弗卓盈 (上海)科技有限公司 赞助商及技术支持单位 :北京九章云极科技有限公司 媒体支持单位 :塞弗卓盈(上海)科技有限公司 联系电话 :13051937326 联系邮箱 : prcvcompetition@126.com 微信交流群 :报名邮件回复确定 参赛者要求 : 按自愿报名的原则,参赛团队和成员的组成可以为: 报名方式 以个人或团队方式均可通过邮件方式报名参赛,每个参赛队伍人员不 ...
ICCV 2025放榜!录取率24%,夏威夷门票你抢到了吗?
机器之心· 2025-06-26 06:10
机器之心报道 编辑:+0 ICCV 2025 将于 10 月 19 日至 25 日在美国夏威夷举行。刚刚,ICCV 官方向投稿者发送了今年论文 接收结果的通知。 数据显示,今年大会共收到了 11239 份有效投稿,所有投稿均已进入审稿流程。程序委员会推荐录用 2699 篇论文,最终录用率为 24%。 对比前几届数据,2025 年的投稿量几乎接近 2019 年的三倍,这反映了计算机视觉领域的快速扩张和 学术研究的日益活跃。 尽管投稿数量大幅增加,ICCV 的录用率在过去几年中保持了相对稳定,基本维持在 25% - 26% 的 区间内。 继 CVPR 2025 之后,ICCV 2025 会议也实施了一项旨在强化问责制与诚信的新政策。程序委员会主 席团识别出了 25 名极不负责任的审稿人,并因此对与他们相关的 29 篇论文进行了直接拒稿处理。 这些被拒的论文中,有 12 篇若无此关联本应被录用,但这也引发了争议。 ICCV 2023 投稿 8260 篇,录用 2160 篇,录用率约为 26.15%。 ICCV 2021 投稿 6152 篇,录用 1612 篇,录用率为 26.20%。 ICCV 2019 投稿 43 ...
MIT终身教授何恺明,入职谷歌了
量子位· 2025-06-26 02:11
目前这一消息已在个人主页同步更新: 一水 发自 凹非寺 量子位 | 公众号 QbitAI AI大牛何恺明最新动向来了! 才刚拿下MIT终身教职没多久,这转眼又 加盟谷歌DeepMind任杰出科学家 。 也是在最近,MIT官网发布公告称: 今年MIT工程学院一共有11位教职人员获得终身教职,而何恺明也在名单中。 要知道他去年3月才正式在MIT开讲,这中间几乎只隔了一年左右时间。 回到这次加盟谷歌,从介绍里可以看到,确切来说他应该算是 兼职(part-time) 。 虽然他本人没有透露更多信息,但某书上已经有自称谷歌员工的网友提前剧透了一波: 他即将加入的是DeepMind 基础研究组 ,直属领导的title是L8——离DeepMind老大哈萨比斯还隔着三个老板的距离。 那么问题来了,已经拥有MIT终身教职的何恺明,为啥又选择和谷歌联手呢? 一扒才知道,原来二者早已多次展开研究合作—— 何恺明其人 先简单回顾一下何恺明的履历。 众所周知,何恺明算是CV领域 (计算机视觉) 的传奇人物。 他本科就读于清华大学物理系,博士师从汤晓鸥,毕业于香港中文大学。 | TITLE | CITED BY | YEAR | | - ...