Why IBM H/E & Blade! IBM Technical Sales 최동준 2011.03.16
Why! IBM H/E 서버를사용해야되나요? 2
전체 System x 포트폴리오 최대 8 소켓 /3TB 메모리확장최고의성능및 RAS 기능 DB/ 가상화업무에최적화 HPC 환경에최적화됨고집적컴퓨팅이가능한상면및비용최소화설계 Scale up / SMP computing x3100 x3755 M3 소규모 Office 에서배치가편리하며강력한컴퓨팅파워를제공함. x3200 M3 x3950 X5 2 nodes x3400 M3/ x3500 M3 x3850 X5 1node X3250 M3 x3650 M3 x3550 M3 Cluster 1350 우수한 2 소켓성능제공일반적인업무에최적화높은가용성수준제공 x3620m3 idataplex dx360 M3 상면효율및전력고효율인프라통합에효과적관리모듈을통한통합관리 BladeCenter S, E, H, T, HT HS22 / HS22V / HX5 Scale out / distributed computing 3
H/E 서버의안정성 IBM System x3850x5 서버는무정지서비스지향을위하여단일시스템으로서다음과같은 IBM 만의기술이포함되어있습니다. 주요부품이중화 X86 서버를구성하는주요부품은장애에대비하여이중화되어있음 CPU, Memory, Disk, Power, Cooling-Fan, NIC, HBA 등 IBM ex5 아키텍쳐를통한가용성 대한장애를최소화하기위하여, 최고의성능을발휘할수있는록주요부품에대하여이중화를지원합니다. 이는시스템장애에대비한대책으로서비스무정지를지향하는시스템전략을구축합니다. MCA (Machine Check Architecture : CRC check & failover on ), Chipkill, Memory ProteXion, Memory Scrubing, Hot-swap type HDD / Power / Cooling-Fan 등 사전장애예측기능및통보 : PFA ( Pre Failure Analysis ) 운영시스템에대한 ServerProven IBM System x 서버에다양한운영체제 (NOS) 를해당업체와 Test 하여안정적인 H/W+S/W 운영을 Proven 하는프로그램 4
H/E 서버의안정성 주요부품의가용성 IBM System x3850x5 서버는시스템장애에대비하여, 단일서버가용성확보를위한 IBM 의 ex5 아키텍쳐가적용된시스템입니다. 구분장애유형솔루션기능설명 CPU 시스템의 error 로인한운영체제의 halt Nehalem-EX 에포함된 MCA 아키텍쳐 시스템에러를조절하여, 운영체제에시스템 halt 를방지하도록하는기능으로 Nehalem-EX 에새로추가되었음 Memory Single-bit 에러 : 장애대처불가능으로인한시스템다운 Multi-bit 에러 : 장애대처불가능으로인한시스템다운 Memory Scrubbing 및 Dynamic Memory Deallocation Memory chip spare 를통한 DEC (Double Bit Error Detection) Memory Scrubbing : 메인메모리내의 1-bit error 를 H/W 적으로 Correction DMR : single bit 에러가지속적으로발생하면, memory 의해당영역을 isolate 시키는방법 칩스페어를사용하여, 다중비트오류가발견되는경우, SDRAM 칩을우회 / 교체 Chipkill 및 Memory ProteXion PCI 어텝터 운영중 I/O 손상으로인한시스템정지및재가동필요 Adapter 이중화 이중화및로드벨런싱을위하여, NIC 및 HBA 를이중화제공 Disk 손상 Disk 손상으로인한 O/S 및 App 손상및시스템다운 Hot-plug Disk Drive Mirrored 내장디스크로운영중관리자에의해삽입 / 제거가능 FAN 손상 Cooling FAN 장애발생시, 온도상승에의한시스템다운 Hot-swap Cooling Fan N+1 아키텍처 운영중추가, 교체가능 여분의해당장치보유 여분의 FAN 이자동속도증가로항온기능수행 5 Power 손상 전원장애발생시시스템다운 Hot-swap Power supply N+1 아키텍처 운영중추가, 교체가능 여분의해당장치보유
H/E 서버의안정성 주요부품의 PFA IBM System x3850x5 서버는장애사전예측기능인 IBM PFA 기능이포함되어있으며, 이기능은주요부품들에대하여약 60 여시간전에장애발생가능여부를알려주고있음. IBM 만이가장많은부품에대한 PFA 기능을구현하고있음. 6
H/E 서버의확장성 FlexNode 를통한지속적인서비스운영 고객사시나리오 Case 1 하나의보드에 8 소켓이장착된서버의경우단일 CPU 혹은보드장애가전체시스템의서비스중단으로이어짐 3 IBM x3850 X5 의경우 FlexNode 기능을사용하여하나의모듈에서장애가발생하여도연동된다른모듈을통하여지속적인서비스를수행할수있음. 장애발생시서비스중단 8 소켓서버 동일스펙 HA 구성 서비스인력긴급투입 x3850 X5 4U 4Socket X x3850 X5 4U 4Socket x3850x5 8 소켓 FlexNode x3850 X5 4U 4Socket x3850x5 4 소켓 지속적인서비스운영 2 장애발생에대처하기위해고비용으로동일스펙 HA 를구성하거나서비스인력을긴급투입해야함. 7
H/E 서버의확장성 -MAX5 모듈을통한최적의메모리구성 안정성이최우선되어야하는 DB서버특성상메모리이중화를고려할경우, 추가서버증설이나메모리모듈교체없이 MAX5 ( 메모리확장모듈 ) 장착만으로도필요한메모리를비용효율적으로증설할수있습니다. 고객사시나리오 Case 1 메모리 512GB 필요 To-Be Mirroring 구성시 1,024GB 필요 3 현구성에서, 메모리증설요건발생시용량대비고가인 16GB 로메모리교체또는, 별도의서버를증설해야함. 2 가격대용량최적화된 8GB 모듈로구성시 128 개 DIMM Slot 을차지하며 x3850 X5 DIMM Slot 을모두차지함. DIMM 1 DIMM 3 DIMM 8 DIMM 6 4 IBM x3850 X5 의경우는별도의메모리확장모듈인 MAX5 장착을통해저비용으로메모리증설요건에유연하게대처할수있음. DIMM 2 DIMM 4 DIMM 7 DIMM 5 Memory Buffer 1 Memory Buffer 2 SMI Lane 1 SMI Lane 2 x3850 X5 4U x3850 X5 4U DIMM 1 DIMM 3 DIMM 8 DIMM 6 x3850 X5 4U Memory Drawer 1U Memory Drawer 1U x3850 X5 4U EXA DIMM 2 DIMM 4 DIMM 7 DIMM 5 Memory Buffer 1 Memory Buffer 2 SMI Lane 1 SMI Lane 2 x3850 X5 (128 DIMM) 8 소켓 +MAX5 구성시최대 192 DIMM 지원 8
x3850 X5 (8 소켓 Block Diagram) 아래와같이 IBM x3850 X5 4 소켓서버 2 대를 8 소켓으로확장할수있으며, 서버간의연결은 를통해구성되도록합니다. 8 소켓서버 Boxboro NHM-EX 프로세서 #1 NHM-EX 프로세서 #4 Boxboro 4 3 2 1 + 4소켓 4소켓 NHM-EX 프로세서 #2 NHM-EX 프로세서 #3 1 2 3 4 * 1 2 3 4는 를통해연결됩니다. Boxboro NHM-EX 프로세서 #2 NHM-EX 프로세서 #3 Boxboro [ 참고 ] =QuickPath interconnects 는프로세서간또는프로세서와 Boxboro간통신을위해사용되는연결통로입니다. 프로세서간대역폭은 6.4GT/s 즉, 12.8GB/s를지원합니다. Boxboro 는 PCI 와같은 IO 를제어하는칩셋입니다. 9 NHM-EX 프로세서 #1 NHM-EX 프로세서 #4
성능 - x3850 X5 공인 tpmc 성능비교 27% better! 소켓 x3850 X5 DL580G7 비고 4 2,308,099 1,807,347 tpmc 공인성능수치 10
Why! IBM Blade 서버를사용해야되나요? 11
인프라가 통합된 블레이드 환경 블레이드를 통한 가상화 환경 12
0 15 16 17 18 19 0 15 16 17 18 19 통합블레이드환경에서이중화가중요한이유 블레이드서버당최소 4 개이상의가상서버를운영 블레이드서버는샤시에장착되므로샤시자체의가용성이중요 샤시내의부품장애가블레이드서버장애로이어지지않도록연계부분의가용성중요 상위미드플레인 하위미드플레인 [ 블레이드서버 ] [ 샤시 ] [ 미드플레인 ] ( 블레이드서버가샤시에장착되는곳 ) 13
0 15 16 17 18 19 0 15 16 17 18 19 블레이드샤시및블레이드서버가용성확보대상 통합서버로운영되는블레이드서버는외장스토리지및네트워크통신은샤시를통해연결되므로서버가용성 향상을위해서는샤시, 블레이드서버뿐만아니라 샤시 블레이드서버 간상호운용시가용성이중요함 1 1 2 3 2 4 블레이드서버의주요이중화컴퍼넌트 1. NIC 카드 2. HBA 카드 샤시의주요이중화컴퍼넌트 1. 이더넷스위치 2. 전원공급장치 3. SAN 스위치 4. 관리모듈 14
안정성이확보된완벽한 N+N 이중화구성 통합블레이드샤시는인프라를위한핵심부품들이모여있으므로그무엇보다도중요하며안정성을위해이중화는필수조건입니다. 전원모듈 #3 전원모듈 #1 전원공급장치의이중화 이더넷 #1 Blower #1 0 15 16 17 S A N 18 #1 19 관리모듈 #1 다수의블레이드서버가한샤시에서인프라스트럭쳐서비스 ( 전력, 네트워크등 ) 에의존하기때문에 Single Point Of Failure 가없어야하며, 모두완벽한 N+N 의이중화전력도메인을제공해야합니다. 이더넷 #2 Blower #2 전원모듈 #4 전원모듈 #2 0 15 16 17 S A N 18 #2 19 관리모듈 #2 이더넷 /SAN/ 관리모듈의이중화 다수의블레이드서버가한샤시에서지속적인서비스를유지하기위해서는이더넷및 SAN 스위치의이중화구성이가능하여야되며, 샤시의전체적인관리를지속적으로유지하기위하여관리모듈의이중화는구성되어야합니다. 15
NIC 4 포트및 HBA 4 포트의안정성확보구성 블레이드서버의 NIC 및 HBA 카드는물리적인카드의이중화를통한가용성을제공합니다. 샤시 이중화 NIC 2 포트 NIC 2 포트 Ethernet SW#1 Ethernet SW#2 LAN 이중화 HBA 2 포트 HBA 2 포트 SAN SW#1 SAN SW#2 SAN HBA 카드의이중화방안 1. 물리적 NIC 카드및 HBA 카드의이중화구성 2. 이더넷스위치및 SAN 스위치의이중화구성 16
미드플레인의안정성확보구성 블레이드샤시는미드플레인의이중화지원을통해블레이드서버및주요구성품의생존성을극대화시킵니다. I/O 컨넥터 #1 전원컨넥터 #1 상위미드플레인 이중화 이중화 I/O 컨넥터 #2 하위미드플레인 전원컨넥터 #2 [ 블래이드서버연결구조 ] [ 미드플레인이중화내부구조 ] 17 블레이드서버는이중화된미드플레인연결을통해임의의미드플레인장애시에도 중단없는업무가지속적으로수행됩니다.
18