Arm宣布了其首个可同时运行实时和高级操作系统的64位Cortex-R82内核。新型Cortex-R82的性能是其前代产品的两倍,主要针对需要高达1 TB DRAM的超高端SSD,全闪存阵列以及新兴的存储处理应用。
存储需要更高的计算性能
现代SSD需要相当重要的计算性能才能解码来自新型内存(例如3D QLC NAND)的信号。存储处理应用程序(例如具有计算功能的SSD)才刚刚起步,但有望在数据中心和边缘服务器中变得非常有用。
预计这两种类型的存储设备以及许多其他功能将比今天拥有更高的计算性能,但不会以显着更高的功耗为代价。
根据Arm的说法,当今85%的HDD和SSD控制器基于其内核。大量现代SSD控制器使用Arm的相当成熟的Cortex-R5或Cortex-R8内核,而支持存储处理的SSD依赖于ASIC或FPGA,这些ASIC或FPGA使用Arm的Cortex-A53内核并不是最初为SSD设计的,通常也不是。最理想的存储选择。
Arm的Cortex-R82是公司的第一个基于Armv8-R架构的64位R系列处理器内核,可以配备执行裸机和RTOS的内存保护单元(MPU)以及内存管理单元(MMU)执行高级操作系统。此外,该内核还支持用于机器学习(ML)和浮点计算的可选Neon加速器,这对于具有计算功能的存储应用程序特别有用。此外,Cortex-R82内核具有40位存储器寻址功能,可寻址高达1 TB的DRAM,从而可以构建具有大量内存的存储处理应用程序以及具有4 GB以上内存的客户端SSD。 DRAM。
Cortex-R82内核的设计运行频率超过1.80 GHz(使用5 nm工艺技术制造并使用标准性能单元库实现时),并且具有用于实时应用的所有低延迟部分,包括紧密耦合存储器( TCM),缓存和低延迟端口。同时,该内核可以同时运行Linux和RTOS,这为控制器开发人员提供了很大的灵活性。
就可扩展性而言,Arm说,Cortex-R82可以用于具有多达八个内核的集群中。同时,该公司提供了“典型”四核群集的示例,这些示例可能会给出一个想法,以期对未来的SSD控制器有何期待。
性能提升
与前几年推出的Arm Cortex-R8相比,Arm Cortex-R82的主要功能之一是其更高的性能,目前已用于SSD控制器。据Arm称,在实际应用中,Cortex-R82通常比Cortex-R8快1.74倍至2.25倍。此外,据说新内核在SPECint2006和SPECfp2006中分别比Cortex-A55快21%和23%。
至于效率,根据Arm的内部初步估算,ARM的Cortex-R82每mW可提供30 DMIPS以上。
与针对存储市场的其他解决方案相比,Cortex-R82的更高性能将使SSD控制器的开发人员能够使用更复杂的ECC算法,这对实际驱动器有两个关键意义。首先,更先进的ECC技术使SSD总体上更可靠。其次,先进的ECC为使用新型NAND存储器打开了大门,这可以提高驱动器容量并降低每TB成本。
一个芯片,多个设备
Arm的Cortex-R82能够同时运行计算和实时存储工作负载的能力使SSD控制器的开发人员仅使用一个控制器SoC就可以针对传统和存储计算应用程序。这将在某种程度上降低其掩模设置成本,而这些成本在前沿工艺中往往很高。此外,这将使构建的控制器能够在不同的时间运行不同的工作负载。
对于客户端存储而言,这种方法可能不是最理想的,但是对于针对数据中心和边缘服务器的控制器而言,减少SKU的数量可能是有意义的。
可用于许可
Arm的Cortex-R82内核现在可以通过许可以及一套技术和工具来实现许可。Arm还在开发Cortex-R82的TSMC 7FF POP实施方案,以使控制器制造商只需将现成的内核投入其设计即可。
SSD控制器的开发人员很少使用诸如TSMC N7的尖端制造技术。同时,甚至Arm本身也描述了使用5 nm制造工艺实现的基于四核Cortex-R82的集群。
也许,随着存储设备性能要求的提高,Arm期望SSD和HDD控制器的设计者可以切换到具有Cortex-R82内核的更高级节点。