鲲鹏920处理器是华为在2019年发布的数据中心高性能处理器。鲲鹏920处理器兼容ARM架构多核处理器,采用7nm工艺制造,主频可达2.6GHz,支持8通道DDR4、PCIe 4.0和100G RoCE网络。
鲲鹏920处理器特性:
l 多核架构
1、CPU芯片2个CPU Die,每个CPU Die包括最多32个核心、4个DDR4内存控制器
2、1个IO Die,提供PCIe接口、以太网络接口、存储控制器、片间缓存一致接口
l 片间互联
华为Cache一致性总线(HCCS),为内核、设备、集群提供系统内存的一致访问。片间带宽最高可达480Gbps,实现最多4个鲲鹏920处理器互联。
l 安全可信
安全启动,支持硬件可信根逐级验证,建立系统信任链,实现系统可信。TrustZone可信执行环境遵循GP API规范,提供基于硬件隔离的可信执行环境。支持摘要算法SM3、对称加密算法SM4/AES、安全散列算法SHA-2和非对称加密算法RSA。
l 高性能
鲲鹏920处理器通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,大幅提高了处理器单核性能。单核SPECint_speed_base2006@GCC 7.3.0 -O2性能达到10.8/GHz。
同时,鲲鹏920采用自研Mesh互联Fabric,单芯片集成最多64个自研CPU核心,典型主频2.6GHz。业界标准Benchmark SPECint_rate_base2006@GCC 7.3.0 -O2评分超过930,超越业界主流CPU,将性能纪录提升了25%。业界基于ARM架构最高性能处理器。
l 海量吞吐
鲲鹏920处理器在设计之初就开展了芯片封装、单板PCB联合优化设计,攻克芯片超大封装的可靠性以及单板可靠性难题。成功将DDR4的通道数从当前主流的6个通道提升到8通道,DDR4的典型主频也从2666MHz提升至2933MHz,内存带宽高出主流芯片60%,保证了鲲鹏920超强算力的高效输出。同时,鲲鹏920处理器还率先集成PCIe 4.0、CCIX等高速接口,单槽位接口速率为业界主流速率的两倍,使得鲲鹏920可以更高效地和外设或其他异构计算单元通信,有效提升存储及各类加速器的性能。集成2个100G RoCE端口,网络带宽从主流的25GE提升到100GE,速率提升4倍。
l 多合一SOC
鲲鹏920采用7nm制程工艺,它不仅是一颗通用CPU,还同时集成了南桥、网络控制器、SAS存储控制器三种芯片,做到集成度业界第一,单颗芯片实现4颗芯片的功能,可以释放出更多槽位扩展更多功能,大幅提高系统的集成度,也给客户的TCO带来收益。
l 高能效
鲲鹏920处理器在创造计算性能纪录的同时,功耗比性能标杆处理器更低,能效比超过主流处理器30%。