曾为英特尔、AMD和特斯拉工作的芯片设计师Jim Keller正试图通过设计比英伟达更高效的芯片来降低人工智能应用的价格,以希望能够抢占英伟达的部分市场份额。
Keller现为美国AI芯片设计初创公司Tenstorrent首席执行官,他表示:“英伟达在很多市场上都未能做到很好的服务。”
Keller表示,随着人工智能应用扩展到智能手机、电动汽车和云服务,越来越多的公司正在寻找更节省成本的解决方案,并补充,“很多小公司不愿意花20000美元”购买英伟达的高端图形处理器。
Keller在芯片设计圈以AMD Zen系列首席设计师而闻名,许多人认为,AMD在2010年代后期努力跟上英特尔的步伐后,Zen系列为AMD的东山再起提供了支持;同时他也是开发特斯拉自动驾驶软件Autopilot芯片组的领军人物。
日本人工智能独角兽公司Preferred Networks芯片设计主管Junichiro Makino表示:“Keller简直就是一个传奇人物。”
Tenstorrent成立于2016 年,正准备在今年年底推出其第二代多用途AI芯片。该公司表示,在某些领域,其能源和处理效率比英伟达的AI GPU更好。据Tenstorrent称,其Galaxy系统比英伟达DGX(一种流行的AI服务器)效率高三倍,价格节省33%。
Keller表示,该公司不使用高带宽内存(HBM),这是一种流行的先进内存芯片,能够快速传输大量数据。HBM是生成式AI芯片的重要组成部分,在英伟达产品中发挥了重要作用。
然而,HBM也是导致AI芯片能耗巨大、价格昂贵的罪魁祸首之一。
“HBM客户也在为成本和设计时间而苦恼,”Keller指出,并补充了不使用该技术的决定。
在典型的AI芯片组中,每次执行一个过程时,GPU都会将数据发送到内存,这需要HBM的高速数据传输能力。然而,Tenstorrent对其芯片进行了专门设计,以大幅减少此类传输。
Keller表示,通过这种新方法,公司芯片设计可在人工智能开发的某些领域取代GPU和HBM。
该公司还在设计“尽可能节省成本”的产品,该领域的许多其他公司也在寻找更好的内存解决方案,不过,要颠覆“庞大”的现有HBM行业还需要数年时间。
Keller预测,不止会有一家公司取代英伟达,而是会有更多的新公司出现,以填补英伟达尚未涉足的各种人工智能市场。
Tentorrent芯片的关键特性在于其一百多个核心中每个都配有小型CPU,即“大脑中的微型大脑”。
通常,单个芯片核心只有一个小型计算器和内存,并且只负责解决单个给定任务。然而,Tenstorrent的核心将能够自行“思考”,决定先处理哪些数据,或者是否放弃某些不必要的任务,从而提高整体效率。
该公司表示,由于每个核心都相对独立,因此可以通过堆叠更多或更少的核心来适应更广泛的应用。例如,少量核心就足以用于智能手机或可穿戴设备,而100个核心可以组合起来用于人工智能数据中心。
这种灵活性非常重要,因为关于人工智能如何开发以及其用途的问题仍有待商榷。
Keller表示,无法预测人工智能的最佳应用是什么。“我现在无法判断芯片会变得更大还是更小。所以我们的策略是打造一种适合各种产品的技术。”