intel NehalemEP处理器首发深度评测 第六部分.docx
- 文档编号:15491615
- 上传时间:2023-07-05
- 格式:DOCX
- 页数:20
- 大小:1.10MB
intel NehalemEP处理器首发深度评测 第六部分.docx
《intel NehalemEP处理器首发深度评测 第六部分.docx》由会员分享,可在线阅读,更多相关《intel NehalemEP处理器首发深度评测 第六部分.docx(20页珍藏版)》请在冰点文库上搜索。
intelNehalemEP处理器首发深度评测第六部分
BenchmarkFactory4.6
我们在被测服务器上安装了MicrosoftSQL2005SP1,按照测试要求建立了数据库。
BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。
我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。
由于时间紧迫,在测试X5570的同时,我们也对另一台E5540Nehalem-EP进行了数据库测试
SQL2005数据库性能测试
数据库测试是一个综合性的测试,在较少客户端的时候,其性能依赖于处理器以及内存系统,在较多客户端的时候,则开始依赖于磁盘子系统。
在这个测试里面,Nehalem-EP的三个优势都得以完全发挥,最终成绩非常惊人:
在频率更低的情况下,平均TPS(每秒交易数)要高114%(90557.2对40397.217),提升超过了一倍以上。
峰值TPS是96264.5。
Nehalem真是理想的数据库平台。
为了体现出超线程对系统性能的影响,我们特地在另一台Nehalem-EP平台上作了打开/关闭超线程的测试。
SiSoftwareSandraProBusiness2009
测试对象
Nehalem-EP
双路IntelGainestown
XeonE5540
2.53GHz
DawningNehalem-EP
双路IntelGainestown
XeonE5540
2.53GHz
无超线程
ProcessorArithmeticBenchmark
处理器架构测试
DhrystoneALU
129014MIPS
130767MIPS
DhrystoneALUvsSPEED
51.05MIPS/MHz
51.75MIPS/MHz
WhetstoneiSSE3
111000MFLOPS
68158MFLOPS
DhrystoneiSSE3vsSPEED
43.93MFLOPS/MHz
26.97MFLOPS/MHz
ProcessorMulti-MediaBenchmark
处理器多媒体测试
Multi-MediaIntx16iSSE4.1
269.08MPixel/s
228.02MPixel/s
Multi-MediaIntx16iSSE4.1vsSPEED
106.48kPixels/s/MHz
90.23kPixels/s/MHz
Multi-MediaFloatx8iSSE2
206.19MPixel/s
172.03MPixel/s
Multi-MediaFloatx8iSSE2vsSPEED
81.60kPixels/s/MHz
68.08kPixels/s/MHz
Multi-MediaDoublex4iSSE2
113.93MPixel/s
89.72MPixel/s
Multi-MediaDoublex4iSSE2vsSPEED
45.09kPixels/s/MHz
35.50kPixels/s/MHz
Multi-CoreEfficiencyBenchmark
Inter-CoreBandwidth
63.30GB/s
25.88GB/s
Inter-CoreBandwidthvsSPEED
25.65MB/s/MHz
10.49MB/s/MHz
Inter-CoreLatency
(越小越好)
22ns
58ns
Inter-CoreLatency?
vsSPEED
(越小越好)
0.01ns/MHz
0.02ns/MHz
MemoryBandwidthBenchmark
内存带宽测试
IntBuff'diSSE2MemoryBandwidth
9.02GB/s
32.59GB/s
FloatBuff'diSSE2MemoryBandwidth
8.90GB/s
32.56GB/s
MemoryLatencyBenchmark
内存延迟测试
Memory(RandomAccess)Latency
(越小越好)
96ns
92ns
SpeedFactor
(越小越好)
59.40
57.90
InternalDataCache
4clocks
4clocks
L2On-boardCache
10clocks
10clocks
L3On-boardCache
52clocks
51clocks
CacheandMemoryBenchmark
缓存及内存测试
Cache/MemoryBandwidth
122.06GB/s
120.64GB/s
Cache/MemoryBandwidthvsSPEED
49.46MB/s/MHz
48.89MB/s/MHz
SpeedFactor
(越小越好)
22.80
23.10
InternalDataCache
398.74GB/s
401.21GB/s
L2On-boardCache
368.03GB/s
362.61GB/s
.NETArithmeticBenchmark
.NET架构测试
Dhrystone.NET
29299MIPS
28774MIPS
Dhrystone.NETvsSPEED
11.59MIPS/MHz
11.39MIPS/MHz
Whetstone.NET
69736MFLOPS
44516MFLOPS
Whetstone.NETvsSPEED
27.60MFLOPS/MHz
17.62MFLOPS/MHz
.NETMulti-MediaBenchmark
.NET多媒体测试
Multi-MediaIntx1.NET
53.25MPixel/s
46.38MPixel/s
Multi-MediaIntx1.NETvsSPEED
21.07kPixels/s/MHz
18.35kPixels/s/MHz
Multi-MediaFloatx1.NET
23.09MPixel/s
13.30MPixel/s
Multi-MediaFloatx1.NETvsSPEED
9.14kPixels/s/MHz
5.26kPixels/s/MHz
Multi-MediaDoublex1.NET
45.02MPixel/s
24.73MPixel/s
Multi-MediaDoublex1.NETvsSPEED
17.81kPixels/s/MHz
9.79kPixels/s/MHz
SiSoftwareSandra对比,用蓝色标出了性能特出的项目
只有极少数的项目中,关闭超线程获得了更好的测试成绩。
Nehalem-EP的超线程比起Pentium4时代有了不少的改进,你不应该将其关闭。
withSMTvs.withoutSMT
withSMTvs.withoutSMT
withSMTvs.withoutSMT
ScienceMarkMembench
厂商
Intel
Dawning
产品型号
Nehalem-EP
Intel Gainestown
XeonE55402.53GHz
Nehalem-EP
Intel Gainestown
XeonE55402.53GHz
无超线程
内存技术参数
2GBR-ECCDDR3-1066SDRAMx12
2GBR-ECCDDR3-1066SDRAMx12
L1带宽(MB/s)
47705.89
47572.00
L2带宽(MB/s)
19499.26
19353.08
内存带宽(MB/s)
8620.40
8623.25
L1CacheLatency(ns)
32BytesStride
2cycles
0.79ns
2cycles
0.79ns
L1AlgorithmBandwidth(MB/s)
Compiler
41485.23
42272.23
REPMOVSD
43346.81
43279.73
ALURegCopy
11990.39
12024.42
MMXRegCopy
47705.89
23374.45
SSEPAlign
46105.34
47567.95
SSE2PAlign
48167.88
47572.00
L2CacheLatency(ns)
4BytesStride
3cycles
1.19ns
3cycles
1.19ns
16BytesStride
3cycles
1.19ns
3cycles
1.19ns
64BytesStride
9cycles
3.56ns
9cycles
3.56ns
256BytesStride
8cycles
3.17ns
8cycles
3.17ns
512BytesStride
8cycles
3.17ns
7cycles
2.77ns
L2AlgorithmBandwidth(MB/s)
Compiler
18042.06
12053.96
REPMOVSD
19499.26
19353.08
ALURegCopy
8766.52
8691.59
MMXRegCopy
13988.43
13947.73
SSEPAlign
18664.20
18458.88
SSE2PAlign
18664.20
18287.87
MemoryLatency(ns)
4BytesStride
3cycles
1.19
3cycles
1.19
16BytesStride
5cycles
1.98
5cycles
1.98
64BytesStride
23cycles
9.10
23cycles
9.10
256BytesStride
105cycles
41.55
105cycles
41.55
512BytesStride
118cycles
46.70
118cycles
46.70
MemoryAlgorithmBandwidth(MB/s)
Compiler
8013.28
7990.45
REPMOVSD
8620.40
8623.25
ALURegCopy
7066.53
7014.69
MMXRegCopy
8098.63
8082.58
MMXReg3dNow
-
-
MMXRegSSE
7288.34
7373.09
SSEPAlign
7121.20
7133.16
SSEPAlignSSE
8001.72
7999.09
SSE2PAlign
7123.08
7140.24
SSE2PAlignSSE
7985.25
8000.34
MMXBlock4kb
6499.16
6505.21
MMXBlock16kb
6873.16
6907.44
SSEBlock4kb
6582.42
6573.33
SSEBlock16kb
4681.34
6917.23
关闭超线程之后,L1和内存性能着微弱的提升,但是L2性能下降比较明显,这表明Nehalem的L2Cache可以充分满足处理器的需要,你不需要关闭超线程以获得极微弱的L1/内存性能提升。
CineBenchR10
处理器
双路IntelGainestown
XeonE5540
双路IntelGainestown
XeonE5540
无超线程
显卡
-
-
CPUBenchmark
Rendering(1CPU)
3640CB-CPU
4014CB-CPU
Rendering(xCPU)
24275CB-CPU
23279CB-CPU
MultiprocessorSpeedup
6.67x
5.80x
OpenGLBenchmark
OpenGLStandard
188CB-GFX
205CB-GFX
IntelNehalem-EP/GainestownXeonE5540测试成绩对比
没有超线程,单处理器渲染性能上升了10.3%,不过,多处理器渲染性能下降了4.10%。
在一般情况下,你仍然没有必要关闭超线程。
IO读
IO写
读吞吐量
写吞吐量
这台Nehalem-EP测试平台的磁盘子系统是一个软阵列,因此性能和处理器子系统和内存子系统相关,关闭超线程会具有一些提升。
withSMTvswithouSMT
关闭超线程成绩略微高一些,总体影响不大。
withSMTvswithoutSMT
关闭SMT之后,数据库性能立降,降幅达40.4%——你不应该关闭SMT。
IntelNehalem-EP/GainestownXeonE5540SPECCPU2006整数运算性能:
withSMTvswithoutSMT
关闭超线程之后,Nehalem-EP平台的测试成绩下降了12.4%,非常明显。
超线程对大部分测试项目都有着正面的提升作用,除了一个项目:
456.hmmer基因序列搜索(关闭后提升4.05%)、不算太明显,因此可以认为,在整数运算中,超线程可以很明显地提升处理器效能,你最好打开超线程技术。
IntelNehalem-EP/GainestownXeonE5540SPECCPU2006浮点运算性能:
withSMTvswithoutSMT
关闭超线程之后,性能下降了7.3%,大部分测试成绩都下降了,少数项目在关闭超线程之后性能不降反升,这几个项目是:
450.soplex线形编程、优化(关闭后提升9.35%)、459.GemsFDTD计算电磁学(关闭后提升19.1%)、470.lbm流体力学(关闭后提升5.77%)、481.wrf天气预报(关闭后提升43.5%)共4项,481.wrf天气预报影响非常巨大,进行相关工作的用户在配置Nehalem-EP平台的时候可要好好掂量一下。
其他的浮点运算用户一般都不必关闭超线程。
我们利用UNI-TUT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:
连接电源但不开机状态
P2:
系统启动完毕,5分钟内无动作,但不休眠
P3:
系统启动完毕,处理器满载、磁盘以最大吞吐量工作
功耗:
IntelNehalem-EP平台与AMDShanghai、DELLPE2900III平台
配置上,Nehalem-EP官方评测样机具有24GB的内存,不过是DDR3,HarpertownXeon则只有16GB,不过是大发热量的FBDDDR2。
HarpertownXeon平台的硬盘要多一个,并且Nehalem-EP平台是7200RPM的桌面SATA硬盘。
此外,Nehalem-EP平台的机架式设计配置了7个暴力散热风扇,总体来看其功耗应该更高一些。
上表仅作参考:
Nehalem-EP在闲置时功耗要比基准平台低不少,Nehalem的长沟道晶体管、PowerControlUnit、PowerGate确实发挥了作用。
在满负荷情况下,Nehalem-EP平台也仍然比基准平台更省电——同时性能更高。
参考的AMDShanghai平台功耗要高一些。
凭借着崭新的直联架构——集成内存控制器和双QPI总线,再配合超线程技术,Nehalem-EP的性能比起其上一代有了一个大的飞跃,同频率下处理器密集型和内存密集型运算的性能提升达到了一倍以上。
Nehalem-EP:
XeonX5570,主频2.93GHz,QPI频率3.2GHz
配合Nehalem-EP使用的IntelTylersburg-EP芯片
由于处理器指令集架构的缘故,x86处理器非常依赖于缓存/内存性能,使用集成内存控制器之后,Nehalem-EP消除了FSB总线引起的内存瓶颈,通过每处理器三通道DDR3,提供了高带宽、低延迟的子系统,极大地提升了性能。
同样,高带宽的QPI总线也更有利于多处理器协同工作,虽然在双路系统中表现并不明显,不过,可以预先,在4路及4路以上市场以及非常多PCIExpressIO设备的情况下,QPI总线可以发挥巨大的作用。
超线程技术也是Nehalem处理器的要点之一,虽然不是所有的应用中都有正面效果,然而总体来看,超线程技术对SPECCPU2006的成绩提升为14.2%(整数)和7.87%(浮点),在应用测试当,如SQL数据库性能测试中,超线程的存在让性能提升了67.8%,这是一个巨大的数字。
这表明数据库应用可以将Nehalem-EP的超线程技术发挥到极致。
IntelNehalem-EP官方评测样机,配置了双路XeonX5570处理器和24GBDDR3内存
比起同频率HartertownXeon,Nehalem-EP的性能提升在一倍以上,目前在双路x86服务器领域,Nehalem-EP可以说是毫无敌手。
Nehalem-EP处理器:
独孤求败
系列文章:
IntelNehalem-EP处理器首发深度评测
(1)
IntelNehalem-EP处理器首发深度评测
(2)
IntelNehalem-EP处理器首发深度评测(3)
IntelNehalem-EP处理器首发深度评测(4)
IntelNehalem-EP处理器首发深度评测(5)
>>>>这篇文章来自[教育资源库]收集与整理,感谢原作者。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- intel NehalemEP处理器首发深度评测 第六部分 NehalemEP 处理器 首发 深度 评测 第六 部分
![提示](https://static.bingdoc.com/images/bang_tan.gif)