医疗AI
Search documents
蚂蚁再把医疗AI卷出新高度!蚂蚁·安诊儿医疗大模型开源即SOTA
量子位· 2026-01-09 06:05
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 就在医疗AI赛道激战正酣时,一个搅局者低调入场了。 依旧是蚂蚁,依旧 「SOTA」 ! 它就是蚂蚁集团联合浙江省卫生健康信息中心、浙江省安诊儿医学人工智能科技有限公司开源的医疗大模型—— 蚂蚁·安诊⼉ (AntAngelMed)。 一经发布就登顶多项医疗基准测试榜单。 不讲什么噱头,也丝毫不喧嚣,它用数据和排名说话: 在OpenAI发布的HealthBench评测中强势霸榜开源模型第一,超越Baichuan-M2和gpt-oss-120B。 并横扫MedAIBench、MedBench等权威医疗榜单。 它也是迄今为止 参数规模 最大 的开源医疗模型 ,足足有100B。 应用门槛相当低,即使是在中小型医疗机构,AntAngelMed也足以支撑起实时多轮交互和规模化部署,是真正能够落地跑起来的模型。 它为行业示范出一条清晰明确的路径——通过 "专、精、稳" 三位一体,构建通用智能+医疗专长的全栈能力闭环。 环顾全球,AI医疗正在成为一场关乎全人类健康的数字化变革。 李飞飞团队发布的斯坦福《2025 AI Index Report》中明确指出,AI已经从实验室正 ...
中国银河证券:医改持续推进 医保月度收支增速回正
智通财经网· 2026-01-07 01:33
智通财经APP获悉,中国银河证券发布研报称,看好2026年医药行业投资机会,近期震荡调整后估值已 回落至相对低位,有望在2026年重启升势,投资思路上寻找医药硬科技和细分赛道α,推荐关注创新药 (BIC和FIC管线龙头)、创新器械(影像、高值耗材、消费器械等)、医疗AI方向,关注医药消费复 苏及独立第三方ICL。 中国银河证券主要观点如下: 继续深化推进医改,优化集采及医改政策 12月中央经济工作会议如期召开,通稿中医药相关内容:"优化药品集中采购,深化医保支付方式改 革。实施康复护理扩容提升工程,加强对困难群体的关爱帮扶。"其中相关投资机会理解可以从以下三 个方面解读。 集采规则优化,国产替代提速 集采提质扩面进入后半程,价格机制与质量监管并重。药品方面,国家集采累计覆盖435个品种,第十 一批聚焦55种临床成熟药物,通过按品牌报量、低价声明、合理性解释和生产质量双重抽检等制度创 新,实现稳临床、保质量、防围标、反内卷,保证中选产品的临床可及性和标准的一致性。整体来看, 随着集采规则持续优化、价格机制更趋合理、质量与供应保障监管均衡重视,国产龙头企业依靠合规和 创新能力,有望实现份额提升及结构性增长。 医改 ...
Cell子刊:龙尔平/万沛星团队发布大模型“圆桌会议”框架,大幅提升医疗AI推理能力
生物世界· 2026-01-06 05:05
Core Viewpoint - The article discusses the rapid development of medical AI, particularly focusing on the limitations of single models and the introduction of the "Model Confrontation and Collaboration" (MCC) framework to enhance medical reasoning and decision-making in AI systems [3][4]. Group 1: MCC Framework - The MCC framework aims to transition medical AI from "single-point intelligence" to "collaborative reasoning" by creating a dynamic, debate-based model that enhances reliability, interpretability, and collaboration [4]. - It establishes a "shared context workspace" where different language models can generate answers and key arguments in parallel, ensuring that all models have visibility into the complete dialogue history during debates [8]. Group 2: Core Process of MCC - The MCC process consists of three main steps: 1. **Independent Reasoning**: Multiple models generate answers and key arguments simultaneously, with a gate system activating debates only when discrepancies arise [9]. 2. **Debate as Action**: Models engage in multi-round messaging, performing actions like questioning, providing evidence, rebutting, and reflecting on their reasoning chains to enhance accuracy [10]. 3. **Consensus Optimization**: After each round, a consensus is determined, and if no agreement is reached within three rounds, a majority vote is used as the fallback output strategy [10]. Group 3: Performance Metrics - The MCC framework has demonstrated strong performance on various medical benchmarks, achieving an average accuracy of 92.6% on MedQA and maintaining over 90% accuracy across multiple subjects in MMLU [13]. - It also shows robust performance in more challenging assessments, such as achieving approximately 40% accuracy on MedXpertQA and effectively managing uncertainty in MetaMedQA [14]. Group 4: Long-form Question Answering - In long-form question-answering tasks, the MCC framework outperformed other models in key dimensions, with improvements of 8-12 percentage points in critical areas such as reasoning correctness and bias control [16]. - The framework achieved a comprehensive score of 92.1 on HealthBench, indicating its robustness and safety in complex clinical scenarios [16]. Group 5: Interactive Diagnostic Conversations - The MCC framework was tested in simulated diagnostic conversations, capturing over 80% of key patient information points and demonstrating higher relevance in questioning compared to single models [19]. - In diagnostic conclusions, the MCC framework achieved an 80% accuracy rate in preferred diagnoses, showcasing its ability to enhance diagnostic reasoning through collaborative questioning [19]. Group 6: Implications and Future Directions - The study indicates that multi-model confrontation and collaboration can enhance medical reasoning capabilities without additional task training or external knowledge bases, improving the quality and stability of outputs in complex scenarios [22]. - The MCC framework is not intended to replace physicians but to provide multi-faceted arguments and traceable debate logs to assist clinical personnel in reducing diagnostic errors and enhancing decision transparency [22].
京东健康(06618):4Q25前瞻:强劲的收入增速延续
HTSC· 2026-01-06 03:36
2026 年 1 月 06 日│中国香港 互联网 证券研究报告 港股通 京东健康 (6618 HK) 4Q25 前瞻:强劲的收入增速延续 我们预计 4Q25 京东健康有望延续强劲的收入同比增速和利润释放,主要得 益于医药品类线上渗透率的持续提升以及京东健康长期深耕供应链带来的 竞争优势。此外,流感的季节性错位亦或为 4Q25 的收入增长提供短期支持。 我们持续看好公司作为线上医疗电商龙头公司,在推动上游医疗品类供给实 现线上化率提升的过程中强化自身的渠道价值及提升用户钱包份额,这有望 助力其展现稳健的收入复合增速与利润率改善的良好趋势。展望后续,建议 关注:1)医疗新品的供给迭代节奏及其与京东健康线上首发的合作进展;2) 如减肥药等产品进入医保名单后的量价变化趋势;3)AI 医疗应用的渗透率 提升趋势,及对医疗电商需求的潜在拉动;4)京东健康 O2O 业务扩张节 奏,及 B2C 业务医保支付接入进程等。维持"买入"评级。 预计 4Q25 收入与利润有望延续强劲增长 我们预计 4Q25 公司总收入同比增长 22.7%至 202.6 亿元。分品类看,我们 预计药品延续相对强劲表现,GMV 同比增长超 30%,而营 ...
中金:维持京东健康跑赢行业评级 目标价71.4港元
Zhi Tong Cai Jing· 2026-01-06 01:42
中金发布研报称,考虑到原研品类放量趋势依旧且流感品种需求强劲,上调京东健康(06618)25年及26 年收入预测2%至725亿元及817亿元,同时考虑毛利率改善趋势及潜在利息收入波动的综合影响,该行 分别上调25年及26年non-IFRS净利润4%及1%至65亿元及64亿元。首次引入27年收入预测912亿元及non- IFRS净利润预测68亿元。考虑到近期板块表现略有波动,基于SOTP维持目标价71.4港币不变(23%上行 空间),维持跑赢行业评级。 中金主要观点如下: 原研品类放量叠加流感防控需求,持续驱动收入端强劲表现 预计利润端整体稳健,但需关注利息收入的潜在波动影响 公司1-3Q25分别实现non-IFRS净利率10.6%、9.7%、11.1%,同比均呈现不同程度提升,该行认为主要 因药企及保健品企业在广告营销预算上的投入加大,带动毛利率水平持续改善,同时公司年内费用端投 入(如医疗AI、线下药房+即时零售等全渠道体系布局)相对可控,因而持续驱动利润端表现亮眼。虽然 4Q25为常规投入旺季,但该行预计全年维度下公司经营利润率水平亦有望呈现稳中向好态势,体现公 司业务的强劲竞争力。另一方面,考虑到公司在 ...
中金:维持京东健康(06618)跑赢行业评级 目标价71.4港元
智通财经网· 2026-01-06 01:37
原研品类放量叠加流感防控需求,持续驱动收入端强劲表现 2025年内逐季来看,该行观察到公司收入端表现强劲,1-3Q25单季度均实现25%左右的同比增速。根据 3Q25末披露公告,公司在3Q25期间与礼来、信达生物、拜耳中国等药企签署战略合作协议,不断强化 新药全网首发的业务特色。考虑到年内原研药品类持续放量的趋势依旧,叠加4Q25以来冬季流感防控 需求渐起,该行判断4Q25公司亦有望实现收入端强劲表现,该行预计公司2025年全年收入同比增速有 望接近25%。 预计利润端整体稳健,但需关注利息收入的潜在波动影响 智通财经APP获悉,中金发布研报称,考虑到原研品类放量趋势依旧且流感品种需求强劲,上调京东健 康(06618)25年及26年收入预测2%至725亿元及817亿元,同时考虑毛利率改善趋势及潜在利息收入波动 的综合影响,该行分别上调25年及26年non-IFRS净利润4%及1%至65亿元及64亿元。首次引入27年收入 预测912亿元及non-IFRS净利润预测68亿元。考虑到近期板块表现略有波动,基于SOTP维持目标价71.4 港币不变(23%上行空间),维持跑赢行业评级。 公司1-3Q25分别实现non- ...
决定赛道的并非“爆款”
Shen Zhen Shang Bao· 2026-01-01 21:52
但需要看到的是,订单出现,并不等同于商业模式完全成熟。当前阶段,医疗AI最清晰的付费方仍然 是政府与公立医疗体系,其核心逻辑是公共投入与能力建设,而非市场化回报。这也决定了,真正跑通 的不是"爆款产品模式",而是"基础设施模式"。 同时,在C端与市场化层面,医疗AI仍处于"慢变量"阶段。无论是面向用户的健康管理智能体,还是面 向医生的辅助决策工具,其商业价值更多体现在降低系统成本、提升服务效率,而非直接创造新增收 入。 深圳商报首席记者 袁静娴 如果说前两年医疗AI更多停留在"验证价值"的阶段,那么2025年底,一个新的变化开始显现——真正 的"买单方"出现了,而且出手不凡。 据公开报道,过去一个月内,科大讯飞、支付宝、百度先后中标上亿元级别的政府医疗项目。三笔订 单,指向的并非单一医院或具体应用,而是医疗AI的底层平台与基础能力建设。 这一变化意味着,医疗AI的商业化,正在从"医院试点买单"走向"体系级采购"。 上亿订单的出现,更像是医疗AI商业化的"第一道闸门"被打开"。当AI从"平台建设期"进入"深度使用 期",其能否在真实医疗场景中持续创造可衡量的价值,才是决定这一赛道最终格局的关键。 ...
AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品
量子位· 2025-12-29 06:37
允中 发自 凹非寺 量子位 | 公众号 QbitAI 蚂蚁健康 与北京大学人民医院 王俊 院士团队历时6个多月,联合十余位胸外科医生共同打磨,发布了 全球首个大模型专病循证能 力的评测框架 —— GAPS (Grounding, Adequacy, Perturbation, Safety) ,及其配套评测集 GAPS-NSCLC-preview。 旨在解决现有医疗AI评测局限于考试式问答、缺乏临床深度、完整性、鲁棒性与安全性综合评估的问题。 该评测集聚焦 肺癌 领域,包含 92个问题 、覆盖 1691个临床要点 ,并配套全自动化的评测工具链,通过指南锚定、多智能体协 同实现从问题生成、评分标准制定到多维度打分的端到端自动化。 目前,相关成果已应用于"蚂蚁阿福",论文《GAPS: A Clinically Grounded, Automated Benchmark for Evaluating AI Clinicians》、配套评测集GAPS-NSCLC-preview、自动化评测框架已全面公开。 这项研究客观评价了大模型的临床能力:当前主流医疗大模型虽已具备"医学百科全书"般的知识广度,但在临床实践中仍处于 ...
我们走访全国百强三甲医院,发现40%都选了同一家AI公司
量子位· 2025-12-23 03:01
近一年来,这类场景在全国多地多家医院反复出现。 原本用于诊疗判断的时间,被大量消耗在纠偏、解释和风险提示上。诊室节奏被打乱不说,医患双方沟通成本还大大上升了。 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 来猜一下,AI时代,医生最哭笑不得的是什么? 越来越多的患者在进诊室前,已经习惯先用各类通用型Chatbot查询症状。 进诊室的时候,不少会带着AI给的诊断和方案和医生来场"激情对 线" 。 AI都说了,我得的不是这种病! 这里还是再跟所有人强调再强调: 医疗是严肃场景,而通用型大模型并不是围绕医疗体系设计的,在回答医疗相关问题时,胡说八道 (也就是幻觉率) 的概率甚至能高达 40%。 别说 自己不能用通用大模型来给自己看病下诊断了,就连医院和医生,在选用垂直领域的医疗AI时,都会极其谨慎 。 从行业视角来看,这样高的门槛,的确给医疗AI带来了清晰的竞争焦点。 真正能在医院站稳脚跟的医疗AI公司,必须靠长期场景积累、工程化交付能力,以及可复盘的落地效果。 以此为标尺,我们走访多地多家医院,搜集整理出医院真实部署的一组数据。 其中,在全国百强三甲医院中,约40%选择了同一家医疗AI公司—— 云知声 。 ...
云知声(09678)发布医疗领域专家大模型“山海?知医大模型5.0”版本
Zhi Tong Cai Jing· 2025-12-22 04:27
2025年12月,在上海人工智能研究院打造的国内权威中文医疗大模型评测体系MedBench 4.0中,公司在 医疗智能体、大语言模型和多模态大模型中分别取得94.6分、65.7分、 59.6分的优异成绩,一举包揽了 医疗大模型全部三项技术範式第一,用实力打造行业标杆。而在国家人工智能应用中试基地(医疗)?浙 江发布的《MedAIBench测评榜(优秀国产医疗大模型)》中,公司医疗大模型凭借扎实的技术积累荣耀 登榜,彰显AI医疗垂域硬核实力。 智通财经APP讯,云知声(09678)发布公告,近日,公司发布医疗领域专家大模型"山海?知医大模型 5.0"版本("医疗大模型"),构建"医学文本大模型+医学多模态大模型"双核心产品体系,全面覆盖文本处 理、智能体协同、多模态感知等核心能力,整合医学知识问答、临床任务规划、影像解析等多元功能, 形成当前业界能力维度最丰富的医疗AI技术支撑体系之一。医疗大模型能够深度模拟临床思维进行复 杂推理,实现精准鉴别诊断与循证决策。公司依托海量优质医疗数据与专属知识库训练,在医学知识问 答、信息抽取等核心任务中达到业界顶尖水平;通过持续课程学习、知识图谱增强及循证对齐训练,最 大限度 ...