Workflow
MemVerse
icon
Search documents
给Agent装上“海马体”!上海AILab开源MemVerse,定义多模态记忆新范式
量子位· 2025-12-16 11:52
MemVerse团队 投稿 量子位 | 公众号 QbitAI 一页纯文本的记忆是看不清世界的。 人与世界的交互天然是多模态的。一张产品设计图、一段用户操作录屏、一次包含语音和演示的线上会议,这些由图像、声音、视频构成的高 维业务信息,正成为驱动AI智能体创造价值的关键来源。 当前绝大多数"长期记忆"系统在架构上仍设计为纯文本的记忆库。但智能体的"记忆"不应该是扁平的文本日志,而是一个能够记录并关联 " 在 何时、看到了何物、讨论了何事 " 的多维体验图谱。这种 跨模态、跨时间 的记忆关联与融合能力,是智能体从被动工具进化为 智能助手 的 关键要素。 为了攻克这一挑战,上海人工智能实验室正式开源 MemVerse —首个面向智能体的通用多模态记忆框架。它突破性地将图像、音频、视频等 多模态信息与文本对齐到统一的语义空间进行记忆,并首创 "双通路"架构与"记忆蒸馏" 技术,让智能体首次拥有了可成长、可内化、秒级响 应的终身记忆能力。 从"文本堆叠"到"模态融通":MemVerse实现多模态记忆的范式跃迁 它从人类认知的经典记忆模型中汲取灵感,旨在构建一个包含中央协调器、双通路记忆与参数化蒸馏的完整闭环,实现从"被 ...