Workflow
编码率正则化
icon
Search documents
港大马毅团队等开源新作:用编码率正则化重构视觉自监督学习范式,“少即是多”
量子位· 2025-03-08 03:35
SimDINO团队 投稿 (当然了,DINO模型本身就是四年前Meta AI团队提出的) SimDINO 和 SimDINOv2 ,通过编码率正则化简化DINO和DINOv2模型训练流程得到的两个最新模型。 在目前视觉预训练领域,DINO和DINOv2是最强视觉模型梯队选手,也是目前最常用的方法。在多模态大模 型火热的当下,DINOv2也经常被用作VLM中的视觉编码器提供视觉特征。 此外,图灵奖得主、Meta首席AI科学家杨立昆团队近期关于世界模型的工作,也基于DINOv2而来。 但DINO系列目前仍然需要基于非常复杂的工程方法来实现。 而 SimDINO通过去除DINO中复杂的后处理步骤等,解决了DINO系列的训练难题 。 更令人惊喜的是,简化后的模型不仅训练更容易,性能反而更强。 或许这就是"简单即是美"的设计理念在深度学习中的重要价值? (手动狗头) 量子位 | 公众号 QbitAI 最新开源的视觉预训练方法,马毅团队、微软研究院、UC伯克利等联合出品! 马毅表示: 我们不是在修补DINO,而是在重新发现视觉表示学习的本质规律。 核心方法:化繁为简 自监督学习 (Self-Supervised Lear ...