告别“黑箱竞技”,首个面向信贷场景的多模态评测基准发布
Guo Ji Jin Rong Bao·2026-01-16 08:52

奇富科技多模态负责人杨叶辉介绍,FCMBench-V1.0构建了与真实银行审核流程高度一致的评测框架,涵盖18类 核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含4043张合规图像和8446个测试样本,问题覆盖信贷 审核全链条。 现阶段,信贷行业呈现出投入大、选型盲和验证难的困境,大量资源被消耗在解决相同的基础问题上。为了解决 行业的普遍性问题,奇富科技联合复旦大学与华南理工大学研究人员近日共同发布首个面向信贷场景的多模态评测基 准FCMBench-V1.0。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业 务、服务于业务的实用性评测体系。 近年来,人工智能(AI)大模型如风暴般席卷了信贷领域。当信贷AI从演示验证走向深度应用时,却遭遇一系列 痛点问题。最突出的表现是大模型对专业场景的失焦,大模型往往更注重通用的能力,无法从数百页银行流水中识别 出隐性负债、可疑的关联方交易,缺乏对信贷场景的适配性。 数据的合规问题在信贷行业也很棘手,风控模型因其训练数据涉及用户隐私、企业商业机密,无法被共享。此 外,在真实生产环境中还是会遇到许多突发和个性化的问题。例如,客户上传 ...