Workflow
三个月、零基础手搓一块TPU,能推理能训练,还是开源的
机器之心·2025-08-24 04:02

机器之心报道 编辑:泽南 最近,大模型技术的发展,让人们再次重视起 AI 专用芯片。 对于计算任务负载来说,越是专用,效率就越高,谷歌的 TPU 就是其中的一个典型例子。它自 2015 年开始在谷歌数据中心部署后,已经发展到了第 7 代。目前的 最新产品不仅使用了最先进的制程工艺打造,也在架构上充分考虑了对于机器学习推理任务的优化。TPU 的出现,促进了 Gemini 等大模型技术的进展。 这种芯片为何性能如此强大?或许最直接的了解方法就是尝试复刻它。近日,来自加拿大西安大略大学的工程师 Surya Sure 等人宣布已经利用暑假时间构建出了 TinyTPU:一种开源的 ML 推理、训练芯片 。 项目 GitHub 地址:https://github.com/tiny-tpu-v2/tiny-tpu 有趣的是,他们并非芯片设计专业的学生,打造 TPU 是从理解多层感知机(MLP)这样的神经网络基本概念开始的。为此,他们还手工计算了网络推理和训练所 需的数学运算。 让我们看看他是如何做到的。 手搓 TPU 的原因 我们都没有真正的硬件设计专业经验,这在某种程度上使得 TPU 更具吸引力,因为我们无法准确估计它的 ...