混合架构

Search documents
AI+医疗:从蚂蚁 AQ 看产业发展
2025-06-30 01:02
AI+医疗:从蚂蚁 AQ 看产业发展 20260629 摘要 蚂蚁集团推出独立 AI 健康应用"AQ",源于支付宝平台在医疗支付和数 字化赋能的积累,以及 AI 健康管家小程序超过 7,000 万的用户基础, 旨在抓住健康赛道的巨大潜力。 "AQ"整合了全国超 5,000 家医院、近百万医生及 200 多位三甲专家资 源,以 AI 为主导、专家为辅,提供在线问诊,旨在缓解医疗资源不均和 看病难问题。AI 在诊前可高效整理病历信息,缩短问诊时间,提升就诊 效率。 医疗 AI 商业化主要体现在医生辅助和高效信息助手,尤其在诊前信息整 理和常见病辅助诊断方面。对于专科病和复杂病,AI 提供评估方案辅助 医生决策,但最终诊断仍由医生决定。 医院对数据安全和隐私保护高度敏感,倾向于私有化部署 AI 服务,导致 对集成 GPU 的 DeepSeeker 一体机需求旺盛,订单金额从几十万到几 千万不等,成为产业商业化收入的重要来源。 医疗 AI 领域倾向于通用大模型与垂类大模型混合架构,以适应细分专业 化医疗需求。关键在于结合特定数据特征、专业医生和专家的数据标注 经验,提升 AI 诊疗质量。 Q&A 蚂蚁集团近期推出的独 ...
专家访谈汇总:小马智行与文远知行高管“互撕”?
阿尔法工场研究院· 2025-06-24 10:14
4、 《 停火+降息+自动驾驶利好不断,科技股再成为领涨主角》 摘 要 ■ 伊朗与以色列达成停火协议,这一转变为市场带来了明显的情绪好转,尤其是能源、航运、黄金等 避险资产遭遇抛售,资金纷纷流入股市,推动了A股的上涨。 ■ 美联储新任监管副主席鲍曼在讲话中表示,如果通胀保持可控,支持在下次会议时降低利率,进一 步推动流动性。 ■ 特斯拉在美国推出了自动驾驶出租车(Robotaxi)服务,尽管首批仅部署了10辆车,但这一历史性 里程碑标志着自动驾驶出租车的商业化开启。 ■ 特斯拉在加速技术落地,特别是在自动驾驶出租车、入门级车型和人形机器人等领域的创新,将为 供应链中的相关公司带来更多市场机会。 ■ 联创电子是特斯拉自动驾驶项目的核心受益标的,专注于车载镜头领域,预计2025年将成为特斯拉 镜头的第一供应商,未来几年预计将实现大幅收入增长。 ■ 作为特斯拉在中国的最大合作伙伴,拓普集团提供底盘系统、减震器、内饰功能件等多种零部件, 并且为特斯拉的机器人项目提供配套产品。 ■ 旭升股份持续在电池系统、传动系统等方面为特斯拉提供关键零部件,预计未来依然是特斯拉供应 链的重要成员。 ■ 三花智控为特斯拉提供电池和电机 ...
大模型专题:大模型架构创新研究报告
Sou Hu Cai Jing· 2025-06-06 11:38
今天分享的是:大模型专题:大模型架构创新研究报告 报告共计:30页 《大模型专题:大模型架构创新研究报告》聚焦大模型架构创新,分析Transformer架构的局限性及行业探索路径。报告指出,随着模型规模扩大, Transformer的二次计算复杂度(O(n²))导致算力消耗激增,长序列处理效率瓶颈凸显,端侧部署受限,行业对其路径依赖引发创新需求,当前主要从 Transformer架构改进和非Transformer架构探索两条路线突破。 Transformer架构改进围绕Attention机制、FFN层及归一化层展开:稀疏注意力、动态注意力等优化计算效率,MoE混合专家分解FFN层提升稀疏连接效率, LongRoPE等技术改进位置编码增强长序列建模。非Transformer架构则包括新型RNN(如RWKV、Mamba)、新型CNN(如Hyena Hierarchy)及其他创新架 构(如RetNet、LFM),其中RWKV通过广义Delta Rule优化状态演化,Mamba利用状态空间模型提升训练效率,RetNet结合状态空间与多头注意力实现并 行计算。 技术发展呈现混合架构趋势,线性Transformer与非T ...
Z Research|我们距离Agent的DeepSeek时刻还有多远(AI Agent 系列二)
Z Potentials· 2025-06-06 02:44
Z Highlight : (一) AI Agent 中的白马非马 我们 拆解 AI Agent 的运作流程,包括感知层、决策层和执行层。接着引入 " 白马非马 " 之问,通过 AI Agent 九宫格分析市场中不同公司所谓的 Agent 类 型,指出需辨别真正有潜力的公司与概念炒作者。同时对比了 OpenAI 的 " 纯粹 Agent" 路线与 LangChain 的 " 混合架构 " 路线,阐述两者在系统设计、开 发门槛、可靠性挑战及适用场景上的差异。 (二) 从技术栈初探 AI Agent 进化方向 LLM 层面, 当前 SOTA 模型已将工具调用能力内化, 我们分析 了 Agentic 能力内化的必然性, 下一世代的 LLM 将 自主获取经验成为新燃料。 我们 还 分析了 OpenAI 的 o4-mini 和 Anthropic 的 Claude 4 在 Agentic 能力设计思路上的差异,分别代表 " 隐形智能 " 和 " 可编程智能 " 两种路线,指出未来 Agent 竞争是 " 体验普惠 " 与 " 深度可靠 " 的角力,混合架构可能成为下一阶段共性选择。 工程整合对模型能力的贡献开始增加,如 ...