Workflow
数据增强
icon
Search documents
超低标注需求,实现医学图像分割,UCSD提出三阶段框架GenSeg
3 6 Ke· 2025-08-12 03:24
GenSeg用AI生成高质量医学图像及对应分割标注,在仅有几十张样本时也能训练出媲美传统深度模型的分割系统,显著降低医 生手工标注负担。 医学图像语义分割是现代医疗中的关键环节,广泛应用于疾病诊断、治疗规划、手术辅助等任务中。从皮肤病变到眼底病灶、从肿瘤边界 到器官结构,精准的像素级分割结果对于临床医生具有极高价值。 随着深度学习的发展,医学图像语义分割的准确性显著提升,但一个普遍的核心难题依然存在——对大量高质量标注数据的依赖。 在医疗领域中,标注一个分割样本意味着:专业人员需逐像素勾画病灶区域;每张图像的标注常耗时数十分钟甚至更久;而且数据受限于 隐私保护等合规限制。 这使得我们在许多真实临床场景中,面临超低数据的困境:数据少,难以训练出性能可靠的模型;而没有数据,则深度学习寸步难行。 尽管已有一些尝试(如数据增强、半监督学习),但它们仍存在关键局限:数据增强和分割模型训练分离,生成的样本无法很好的提升分 割模型的性能;半监督方法依赖海量未标注图像,而这些在医疗领域仍存难以获得。 针对上述问题,加州大学圣地亚哥分校的研究团队提出了GenSeg,一种用于训练语义分割模型的三阶段框架,该框架中数据增强模型的优 ...
ERMV框架:针对操作任务的数据增强,显著提升VLA模型跨场景成功率
具身智能之心· 2025-07-28 13:19
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Chang Nie等 编辑丨具身智能之心 数学表达: 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 研究背景 机器人模仿学习高度依赖4D多视图序列图像(包含多视角、时间维度的图像),但高质量数据收集成本 高、数量稀缺,严重限制了视觉-语言-动作(VLA)等具身智能策略的泛化与应用。数据增强是缓解数据 稀缺的有效手段,但目前缺乏针对操作任务的4D多视图序列图像编辑方法。 现有方法存在明显的局限:传统数据增强方法(如CACTI、ROSIE)仅针对单张静态图像编辑,无法满足 VLA模型对时空连续4D数据的需求;多视图编辑方法依赖固定相机位置,难以处理机器人操作中动态变化 的多相机系统;视频生成模型因密集时空注意力机制,受限于计算成本,工作窗口小,且难以处理长序列 中的误差累积。 核心挑战与解决方案 ERMV(Editing Robotic Multi-View 4D data)是一种新型数据增强框架,基于单帧 ...