ARM Cortex-X2、A710/A510发布

是ARM每年更新架构的时候了。

昨天晚间消息,ARM推出了新的移动架构,即超核Cortex-X2、大核Cortex-A710和小核Cortex-A510,取代了现有的X1、A78和A55。

最后,使用多年的A55核心也更新了。同时,三种CPU架构均基于Armv9兼容设计,其中X2只支持AArch64 64位指令,性能更上一层楼。

我们先来看看Cortex-X2。官方表示,当构建在相同的节点和相同的频率环境下时,X2实现了比X1核心快16%的速度。同时,优化了X2的峰值性能,机器学习性能提高了一倍。

在前端,分支预测与预取单元解耦,预取单元可以在内核之前运行,从而减少预测误差,提高分支预测的准确性,提高大指令负载的性能。

在内核上,流水线长度从11个指令周期减少到10个,调度阶段从2个周期减少到1个。无序执行窗口最多增加30%,244项增加到最多288项。

在后端,负载存储窗口和结构增加了33%,可以提高内存级别的并行性,一级缓存的d-TLB也增加了20%,此外,数据预取能力也得到了增强。

综上所述,ARM宣称X2最高单线程性能比英特尔i5-1135G7高出40%。

然后同样基于ARMv9 64位指令集的A710和A510在架构上与X2通信,这样就可以集成到同一个SoC中。

不过需要注意的是,X2和A510都是64位,不再兼容32位,A710是应客户要求专门设计的,继续支持OL0 AArch32。

A710还以更高的精度改进了分支预测,L1指令缓存中的TLB数已从32增加到48,但宏-OP缓存仍为1.5K(X2 3K)。

宏-OP缓存和分支单元的宽度从6个减少到了5个,这主要得益于功耗和能效的优化,也是X系列和A系列的重要区别。

因此,Cortex-A710的速度只比A78快10%(在相同的节点和频率下),但能量效率却提高了30%,机器学习速度也提高了一倍。

最后,A510是最重要的升级,比三年前的A55提升了35-62%,功耗降低了20%,机器学习能力提升了3倍。根据ARM的说法,A510在性能上接近之前的a核。

也就是说,未来采用A510 SoC的中低端机型,性能提升会相当可观。

(0)
上一篇 2022年3月27日
下一篇 2022年3月27日

相关推荐