矩阵向量乘
Search documents
仅需一个混频器的无线射频机器学习推理,登上Science Advances!
机器之心· 2026-01-16 00:42
本文作者包括来自杜克大学的高智辉、陈廷钧教授和 MIT 的 Dirk Englund 教授团队。 高智辉,杜克大学电子与计算机工程系博士生。本科毕业于复旦大 学电子工程系。研究兴趣于下一代网络系统,包括信息物理系统、机器学习加速等。 模型-数据的分解式计算 机器学习部署在边端设备的时候,模型总是存储在云端服务器上(5G 基站),而模型输入输出总是在边端设备上(例如用照相机拍摄照片然后识别其中的 目标)。在这种场景下,传统有以下两种方案完成机器学习的推理: 方案一:上传模型输入到云端。 这种方案需要每个用户分别把自己的模型输入上传到云端,然后在云端完成推理,最后把模型输出下载到各个用户。 这种方案需要消耗大量的带宽资源,尤其是在大用户规模的情形下;其次,这种上传用户模型输出的方案会涉及用户隐私泄露的问题。 方案二:广播模型下载到边端。 这种方案要求是云端服务器把模型广播给所有的用户,每个用户各自存储模型,并且在边缘端进行计算。 这种方案极大挑战了边缘用户的算力,并且在模型存储的过程中还有边端存储读写的开销。 在我们的工作里,我们提出了第三种分离式计算(disaggregated computing)的方案: 广 ...