大型数据集可纠正AI在视觉任务中的偏见
Ke Ji Ri Bao·2025-11-09 01:11
据最新一期《自然》发表的研究,科学家建立了超过一万张人类图像的数据库,以评估并纠正人工 智能(AI)模型在视觉领域存在的偏见。这一"公平的以人类为中心的图像基准"(FHIBE)由索尼AI开 发,采用符合伦理手段获取、基于用户同意的数据集,可精确评估以人为中心的计算机视觉任务,从而 识别、纠正偏见和刻板印象。团队认为,这是迈向更可信AI的重要一步。 团队将FHIBE和27个现有以人类为中心的计算机视觉应用数据集做了比较,发现FHIBE数据集在多 样性与AI评估的可靠同意方面标准更高。它还有效减少了偏见,包含的参与者自我申报标注信息超过 其他数据集,还包括了相当比例通常代表性不足的人群。该数据集可用于评估现有的AI模型在计算机 视觉任务中的表现,能揭示更多此前无法了解的偏见。 不过,团队也承认,目前创建数据集的过程充满挑战且成本十分高昂。 【总编辑圈点】 本报近期推出了多篇关于AI易出现偏差与其尚不可靠的相关报道。本文的这项研究,则是一次对 AI伦理建设具有标杆意义的实践。它最核心的价值在于,将"公平"这一抽象原则,转化为一套可操作、 可验证的技术标准与工作流程。AI的偏见已经是行业顽疾,但现在可能有了一把标准量 ...