Workflow
豆蔻妇科大模型
icon
Search documents
豆蔻妇科大模型再突破:钉钉行业训练平台+精标数据SFT ,准确率从 77.1%上升至 90.2%
Tai Mei Ti A P P· 2025-07-10 07:49
文 | 王强宇 在医疗 AI 领域,通用大语言模型虽凭借海量互联网数据训练具备广泛知识覆盖面,但在需高度专业判 断的临床场景中表现欠佳。当医生询问疾病鉴别诊断时,通用模型可能给出不准确甚至错误建议,这在 严肃的医疗决策中不可接受。 大家都知道监督微调(SFT)技术是解决上述难题性价比较比较高的方案之一,但SFT也需要具体一定 的条件:如高质的数据集,同时由于医疗数据的特殊性和复杂性,模型调优的过程可能非常耗时且难以 预测。同时SFT是一个迭代优化的过程,需要不断地对模型进行训练、评测和优化。 豆蔻妇科大模型的模型调优经历了两个关键优化阶段: 以下是豆蔻妇科大模型从第一个版本的准确率77.1%,通过进一步的SFT后,准确率达到90.2%我们团队 的一些方法和心得,供大家参考,欢迎留言讨论。 一、训练数据集的科学筛选(数据集构建与质量控制) 在对优质训练数据集的筛选过程中,我们实施了三个关键步骤: 第一是系统化数据清理,通过建立严格的质量控制标准,重点关注推理与结果的一致性检查,筛选出 answer与ground truth不一致的样本,特别是那些思考过程和输出结果不一致的情况,这类数据被视为低 质量数据。同时进 ...
钉钉上跑出的第一个行业专属大模型落地:准确率超 90% 的妇科专业大模型
AI前线· 2025-07-10 07:41
作者 | 褚杏娟 近日,钉钉企业专属 AI 平台上成功训练出了首个高准确度、高实用性的专业领域大模型——由壹生 检康 (杭州) 生命科技有限公司研发的"豆蔻妇科大模型",其在专业测试中准确率达 90.2%。 钉钉方面表示,妇科大模型的落地,意味着钉钉生态已经从 SaaS 生态、服务商生态、咨询生态、 交付生态,拓展到 AI 创业者。 与专业医生诊断吻合度达 90.2% 当前,各行各业都在努力将大模型与自身业务场景深度融合,打造行业或专业大模型,实现运营管理 的降本增效。 壹生检康是一家深耕女性精准检测及健康服务的生命科技公司,创业团队大多来自知名互联网企业、 妇产科医疗机构、生物医药公司。基于技术趋势和行业判断,王强宇团队认为,通过训练妇科专业大 模型打造 AI 医生,将有效缓解专业妇科医生、医疗服务不足的难题,对医美机构和女性用户都会带 来巨大的行业和社会价值。 专业性强的"妇科 AI 医生"并不是采用通用大模型就能简单训练出来。启动豆蔻妇科大模型研发以 来,壹生检康团队以开源大模型为基础,通过行业数据训练,第一个版本将模型诊断准确率做到 77.1% 左右。"77.1% 的准确率虽达到行业基础标准,但对于直 ...
四个理工男“硬刚”妇科诊断推理大模型,更小参数量实现更高准确率
Tai Mei Ti A P P· 2025-04-29 02:22
通用大模型就像医学院培养的医学生,通过医学书籍、期刊和病例库的"预训练",掌握了解剖学、病理 学、医学伦理、流行病学、公共卫生学等医学基础学科,开始掌握了如内、外、妇科等疾病的基础诊疗 规范,具备广泛的医学认知能力,但缺乏临床实战经验。 真正要成为一个专家,还需要经过长年累月,多达上万例门诊、手术等临床实践经验,还包含一直有经 验更丰富的医生不断地进行纠正,还有做科研项目、不断地学习最深指南和研究发表论文,最终形成如 在普通妇科、妇科内分泌、妇科肿瘤、生殖医学等细分领域有着专家级诊疗能力的主任医生。 壹生检康是一家专注于女性精准健康检测的科技生命公司,已在女性健康领域深耕3年多,积累了丰富 的行业经验和庞大用户群体。然而,随着业务的发展,公司也面临着如何更好地服务用户的难题,我们 也尝试用通用大模型来解决问题,但事实发现,通用大模型确实会存在很多"幻觉",回答的问题看着挺 专业,但还是会有很多不够准确的地方,很多特定的场景甚至无法控制通用大模型的自由发挥。 开源DeepSeek的出现为行业和个人用户带来了对大模型概念更深层次的理解,随着更多"Aha- moment"的复现,更为垂直大模型低成本的技术实现提供了 ...