AAAI 2026 Oral | 告别注意力与热传导!北大清华提出WaveFormer,首创波动方程建模视觉
机器之心·2026-01-21 00:32
"全局交互" 几乎等同于 self-attention:每个 token 都能和所有 token 对话,效果强,但代价也直观 —— 复杂度随 token 数平方增长,分辨率一高就吃不消。现有方 法大多从 "相似度匹配" 出发(attention),或从 "扩散 / 传导" 出发(热方程类方法)。但热方程本质上是一个强低通滤波器:随着传播时间增加,高频细节(边 缘、纹理)会迅速消失,导致特征过平滑。 我们是否能找到一种既能实现全局交互,又能精准保留高频细节的物理建模方式? 来自 北京大学 和清华大学 的研究团队 给出了答案: 波动方程(Wave Equation) :把特征图当作空间信号,让语义在网络深度对应的 "传播时间" 里,遵循欠阻 尼波动方程演化。这样一来,低频的全局结构与高频的边缘纹理不再是 "此消彼长" 的牺牲关系,而可以在可控的波动传播中共同存在。在 AAAI 2026 Oral 论文 《WaveFormer: Frequency-Time Decoupled Vision Modeling with Wave Equation》中,研究者首次将视觉特征图视为在波动传播时间下演化的空间信号,受欠阻 ...