近年来,诸如 TPU、MPU、DPU 等的“X”PU 们似乎层出不穷,市场经常会对这些新创造出的名词感到困惑:为什么会出现这么 多的单元?作为我们 FPGA 五问五答系列报告二,在这篇报告中,我们进一步回答投资人最常问的问题之一:FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?
我们认为,这个问题不是简单回答他们的区别就可以解决的,因此我们单拎出来解答。 我们认为,众多“X”PU 出现的原因,本质上是由于 CPU 的算力到达瓶颈了,背后是通用计算时代的终结。从发明以来, CPU 算力的提升主要依靠两大法宝:一是提高时钟频率,二是增加处理器内核数,但这些方法到现在也遇到瓶颈了,人们开 始放弃使用一个超强的 CPU 完成所有事情,而是对某些重复的场景,卸载到专用的加速器,以达到新一阶段的降低功耗,提 升性能的目的,这就是“XPU”等加速器兴起的原因。
同时,自 2010 年 AI 兴起,AI 模型的训练所需的算力是爆发式的增长, 且“加&乘”的本质使得算力要求愈发偏向高并行而不是高串行,因此 CPU 越来越难以胜任高算力的场景,通用计算时代终结, 数据中心走向加速器时代。未来 10 年,在数据中心高性能计算及 AI 训练中,CPU 这一“主角”的重要性下降,而以往的“配 角们”,即 GPU、FPGA、TPU、DPU 等的加速器的重要性在上升。
FPGA 相比 CPU 的巨大优势在于确定性的低时延,这是架构差异造成的。CPU 的利用率越高,处理时延便越大,而 FPGA 无论利用率大小,其处理时延是稳定的。在汽车和工业这些需要确定低时延的场景,FPGA 具有非常大的优势。此外,FPGA 相比 CPU,具有更高的灵活性。 FPGA 相比 GPU 的优势在于更低的功耗和时延。GPU 无法很好地利用片上内存,需要频繁读取片外的 DRAM,因此功耗非 常高。FPGA 可以灵活运用片上存储,因此功耗远低于 GPU。FPGA“无批次(Batch-less)“的架构,使其在 AI 推理中相比 GPU 具有非常强的时延优势。
此外,GPU 的接口单一,而 FPGA 在接口灵活性上具有无可比拟的优势,特别适合工业场景。 为什么 FPGA 是战略芯片?我们认为,未来科技发展有两个领域处于战略地位:一是 AI,二是太空。AI 代表人类更高级别的 生产力工具,而太空是可供人类开发探索的广阔而未知领域。FPGA 凭借其架构带来的时延和功耗优势,在 AI 推理中具有非 常大的优势。同样,FPGA 独特的优势使其在航空航天领域有非常广泛的应用。
目前,我们看到太空活动发生新变化,背后是太空不断增长的算力需求。变化 1:地球观测、探火活动在增加;变化 2:寻求 扩大 AI 在太空的应用,以及宽带卫星通信的快速增长,提高了算力要求;变化 3:航天级器件的代际差在缩小,处理能力越 来越接近目前最高水平。当今全球地缘政治紧张的背景下,各国自有卫星星座需求激增,太空活动进入新活跃期。 FPGA 在航天领域为什么更具有优势?主要有两点原因:1)FPGA 可以降低项目的时间和金钱成本。航空航天存在着小批量 多品种的应用,本质是一个长尾的市场,能够适配的 ASSP 较少,而如果专门设计一颗 ASIC 成本则会非常高,时间也会变 得非常长,由此造成的时间成本不是线性的。FPGA“万能”的特点,可以节省 ASIC 的 NRE 成本,设计周期也大幅缩短,避免 重复的可靠性认证,加快项目进展;2) FPGA 动态可重构的特点可以降低在轨错误。太空项目本质是风险厌恶的,一旦发 生错误,可能导致数亿美元甚至生命的损失。航天级的 FPGA 可以通过定期刷新回读、动态重构的方式,避免或者减轻宇宙 射线对自身造成的破坏,是其它器件所无法做到的。