AI健康应用爆发,大模型“看病”是否靠谱?我们进行了实测
Bei Ke Cai Jing·2026-01-23 12:29

岁末年初,AI健康赛道进入密集爆发期。 以去年12月中旬蚂蚁集团升级发布AI健康应用"蚂蚁阿福",并一度冲入苹果应用商店排行榜前二为标志,此后1个月时间里,百度升级发布文心健康管家, OpenAI推出ChatGPT Health功能,京东健康发布循证医学AI产品"知医",百川智能也在沉寂许久后高调亮相,发布新一代开源医疗增强大语言模型Baichuan- M3……大厂和独角兽企业们纷纷向这一垂类领域吹响"冲锋号",掀起了一股AI医疗热潮。 风口之下,使用大模型"看病"是否靠谱?新京报贝壳财经记者测试了7款AI健康应用解读体检报告的能力,发现这几款应用的解读均较为谨慎,主要不同点 出现在是否需要就医,以及后续追问上。不过,AI也并非"万无一失",有个别应用把评估甲状腺功能的核心指标 TSH(促甲状腺激素)解读成了HCG(人 绒毛膜促性腺激素), 甚至建议用户排查"是否怀孕"。 面对行业热潮,监管层陆续发声。2025年12月30日,北京市的"AI+医疗健康"新政为行业划出了明确的边界。1月7日,国家网信办《人工智能拟人化互动服 务管理暂行办法(征求意见稿)》也为AI医疗的高速发展设定"交通规则"和"安全护栏"。 A ...

AI健康应用爆发,大模型“看病”是否靠谱?我们进行了实测 - Reportify