2019年,英特尔将发布围绕新架构打造的Core和Xeon芯片:这些芯片将加入一系列新指令,加速加密、压缩等一些热门工作负载,公司的压缩性能较之前的产品提升了75%%。
自2015年以来,英特尔酷睿和至强品牌的主流处理器均基于Skylake架构。英特尔的初衷是在14 nm制造工艺中发布Skylake,然后在10 nm制造工艺中采用Cannon Lake。Cannon Lake会增加一些新功能(比如包含更多的AVX指令),但和Skylake大致相同。
然而,在促进其10纳米制造工艺的有效运行方面的延迟迫使英特尔坚持使用14纳米的时间比预期的要长。因此,该公司沿用了Skylake(消费者系统中最多四个内核)和Kaby lake(现代视频编解码器具有更高的时钟速度和更高的硬件加速)、Coffee Lake(最多八个内核)和威士忌Lake(改进的集成芯片组)。在这些变化中,核心的Skylake架构没有变化,这意味着尽管它们的时钟速度不同,但每个周期(IPC)中的指令数量基本相同。
看着10纳米阳光的一面
相比之下,英特尔称Sunny Cove为基于该公司10纳米工艺的增强型微架构。虽然仍然来自Skylake,但它已经得到了改进,以更低的延迟并行执行更多的指令,并且一些缓冲区和缓存已经被扩大。一级数据缓存比Skylake大50%%,解码微操作缓存和二级缓存(具体位置取决于市场定位)。如果Skylake有两个保留站,它通过八个端口发送指令,每个周期最多四个指令,Sunny Cove有四个保留站和十个端口,每个周期最多五个指令。执行单位也略有重组。Sunny Cove有两个额外的单元,可以处理LEA指令(一个非常通用的x86指令,可以执行各种算术运算和计算内存地址),另一个单元用于向量洗牌。这应该为无序机器提供更多选项,以便它们可以安排指令来提取更大的并行性。
Skylake每个周期可以执行两次加载和一次存储,Sunny Cove会将其增加到两次加载和两次存储。重排序缓冲区更大,可以在运行中启用更多的乱序指令,加载和存储缓冲区也更大,从而实现更多的运行中内存操作。
就像奇怪的坎农湖处理器一样,10纳米制造,数量有限。Sunny Cove包括对AVX-512指令的支持。AVX-512涵盖了许多不同的扩展和功能;有些是通用向量算法,有些是专门用于神经网络等工作负载。此外,Sunny Cove将包括新的指令,以加快加密和数据压缩工作负载-这些新指令负责75%的性能提升。
内存容量
自从AMD在2003年将x86-64 64位扩展引入x86后,Sunny Cove也对x64虚拟内存支持进行了第一次重大改变。虽然这些系统中使用的虚拟内存地址需要64位来存储,但它们实际上只包含48条有用的信息。使用位0至47,其中前16位、48至63以及位47的所有副本。这将虚拟地址空间限制为256TB。这些虚拟地址使用具有四个级别的页表结构映射到物理地址,并且物理存储器地址被限制为48位。这意味着这些系统可以支持高达256TB的物理内存。
自2003年以来,英特尔和AMD都有这些限制。不再:Sunny Cove将虚拟地址扩展到57个有意义的位(前7位全部是0或全部是1,复制位是56),物理内存地址最多为52位。要处理这个问题,需要使用页表中的第五级。新限制支持128PB的虚拟地址空间和4PB的物理内存。
Skylake的各种迭代为我们提供了更高的时钟速度和更多的内核。然而,他们没有做的是提高单线程代码的IPC。自2015年以来,Sunny Cove将首次实现这一目标,使每个工作负载更快,而不仅仅是那些可以扩展到更多线程的工作负载。
2019年下半年,英特尔推出核心品牌Sunny Cove CPU。2020年,稍后将推出带有重新设计的缓存、新的安全功能和新的晶体管优化的Sunny Cove。2021年,公司将发布Golden Cove,它也有更多的安全功能,但也有望提升单线程性能、更好的机器学习性能,以及更好的网络和5G性能。
阳光湾也来到了至强。这里的路线图非常简单——英特尔没有提供任何日期——但我们将在2019年初看到Cascade Lake,带来一些新的AVX-512神经网络指令和多达48个内核。接下来是库珀湖,它将包括对bfloat16数据的支持——一种简化的神经网络浮点格式。接下来是Sunny Cove的至强封面:冰湖。“下一代”处理器将从那里开始。