单路到双路 十款Nehalem服务器横评
更新:2013/5/26 点击数:1832
一年前,Intel英特尔在服务器领域发布了叫做Nehalem-EP的处理器。它在Penryn的基础上进行微架构的改进,实际上,它架构上的变化是更大的。从原有的架构变成了现在的直联架构。Nehalem架构也成为了其之后处理器系列的基础架构。
Tick-Tock:Merom跟着Penryn,然后Nehalem后面是Westmere,后面是Sandy Bridge,再往后是Ivy Bridge,再之后是Haswell
新的处理器总是会比旧的处理器更强或者更省电,Nehalem的情况比较特别,它的性能提升太大了。我们搜罗了前一年内失眠上存在的多款基于Nehalem系列处理器的服务器,这样我们可以看到,Nehalem在性能上,在市场上具有一个什么样的表现。
相对于上一代45nm Harptertown处理器,Nehalem-EP(Gainestown)在架构方面具有了翻天覆地的变化,原有的需要经过北桥MCH芯片才能进行的内存操作现在在CPU内部就可以直接进行,此外,CPU与CPU之间现在也有了直接的通道:
Nehalem:直联架构
Nehalem-EP Xeon X5570
包括Nehalem-EP在内的Nehalem架构,其内存存取带宽和延迟同时得到了提升,在内存密集型的应用上,效果将会非常明显。
Nehalem微架构
总结起来,Nehalem-EP/Gainestown比Penryn/Harperton具备的主要优势有三点:
IMC:CISC的x86架构对缓存/内存带宽极度渴求,集成内存控制器让处理器避开了访问内存需要通过FSB总线的限制,并将带宽提升到三通道DDR3 1333(8核心Nehalem-EX支持四通道DDR3)每处理器,极大提升了Nehalem处理器的内存带宽,对服务器应用提升巨大。
QPI:新的点对点总线带宽更高,并且让处理器之间可以直接连接,避免了共享的FSB总线在处理器核心过多时的效率急剧下降,更适合扩展到大规模并行系统。同样处理器数量下,QPI点对点形成的ccNUMA拓扑比共享FSB的星型总线具有更高的效率。
虽然SMT有不少处理器采用,AMD的Bulldozer也有所采用(和Intel的不太一样)
HTT:超线程技术在打游戏的时候或许看不出有作用,不过在企业级别应用上效果明显。特别适合吞吐量型的计算。