零样本迁移能力
Search documents
微软发布医疗时序基座模型:基于4540亿数据预训练,解决不规则采样难题
量子位· 2026-01-24 05:19
MIRA团队 投稿 量子位 | 公众号 QbitAI 在大模型 (LLM) 与计算机视觉 (CV) 争相重塑医疗行业的今天,我们似乎已经拥有了无所不能的数字助手: 它们能够像放射科医生 一样精准解读CT影像,也能像内科医生一样撰写病历摘要。 但医疗AI世界中,仍有一块关键拼图缺失——那就是理解 "生命动态演变" 的能力。 △ 图1.不同模态的医疗数据 正如图1所示,如果将患者的生命历程比作一部电影,现有的AI往往只能捕捉到零散的帧画: 影像(Image)是"快照" :定格的仅仅是某一瞬间的解剖结构; 文 本 (Text) 是 "叙述" :往往只是对既往病情的主观回顾; 唯有 时间序列 (Time Series) ,才忠实记录了生命体征的连续轨迹。 然而,读懂这条"曲线"远比处理静态图像复杂。为此,微软亚洲研究院推出了专为医疗时序数据设计的通用基座模型——MIRA。 该模型基于4540亿个医疗数据点进行大规模预训练,通过两大核心技术突破了传统模型对规则采样的依赖,旨在解决真实世界医疗数据"不 规则、异构性"的难题。 实验表明,MIRA在关键预测任务上的表现超越了现有SOTA模型,并展现出卓越的零样本 (Zero ...