가상인프라에서운영중인중요한서 비스의최대가용성유지방안 Technical white paper 1
가상화인프라에서의 HA/DR 의도전과제 현재까지 99.99% 이상의고가용성이요구되는 mission/business critical한애플리케이션들은물리적환경의서버에서운영이되어왔으며, 업무의연속성을보장받기위하여 HA 및 DR 환경을구성하여왔습니다. 과거의물리적환경에서만거의구성되다시피한이러한중요한애플리케이션들이 Vmware와같은가상화기술의비약적인발전으로이제물리적서버환경에서가상화된서버의환경으로옮겨지고있습니다. 가상화환경이제공해주는이점은여러가지가있겠지만눈여겨볼만한대목은역시비용절감과아주쉽게 HA&DR 환경을꾸밀수있다는점입니다. 특히 Vmware의경우, vsphere standard edition 이상의제품에 HA기능을번들로제공하기때문에가상화된애플리케이션서버에대한고가용환경을쉽게추가비용없이구성할수있습니다. 추가비용없이아주쉽게고가용환경을구성할수있다는사실은매우매력적이긴하지만여전히 mission/business critical한애플리케이션에대하여 Vmware HA 및 FT가충분한 HA와 DR의기능을제공해줄수있는지에대해서는다시한번고민해볼필요가있습니다. VMware 환경에서의현재 HA/DR 솔루션 Vmware HA Vmware 상에서우선가장먼저고려될수있는 HA 솔루션은바로의심의여지없이 Vmware HA 일것입 니다. Vmware HA 를우선적으로생각해볼수있는가장큰이유는다음의장점때문입니다. Vmware HA의장점들 : 쉬운구성과조작 : HA 구성을위해서 VM마다일일이소프트웨어를설치할필요없이 vcenter의 UI를이용하여매우쉽게구성이가능합니다. 매우대중적 : VM내부의애플리케이션들과의호환성에대한검증필요없이곧바로구성과적용이가능하며, 별도의추가소프트웨어라이선스비용이필요없습니다. 위와같은장점들로인해서 Vmware HA 는확실히가상화환경에서대중적으로많이사용되고있는고 가용솔루션임에는틀림이없습니다. 그러나다음의사항들에대한추가적인솔루션은여전히고민이 됩니다. SAN 환경이불필요한곳 : Vmware HA 구성을위해서는 SAN Storage 환경이반드시필요합니다. 그러나여전히 SAN Storage 가필요하지않는환경에서도고가용솔루션이필요한곳은많습니 2
다. SAN Storage 장애에대한대책 : Vmware HA 구성시 VM들은 SAN Storage에저장되고 HA pool 의호스트들은그 Storage를서로공유합니다. 호스트장애시에는분명 VMware HA를이용하여대기호스트로자동 failover가가능하지만, SAN Storage관련장애시에는서비스다운타임은피할수없습니다. VM 내부에대한가용성관리 : 가상화환경에서 Host가과거의데이터센터를대체한다고본다면 VM은과거의물리적서버환경이라고볼수있습니다. 즉 Host는 VM들이서비스를제공할수있는물리적인프라를제공해주는격이되고실제응용프로그램의구동과중요한데이터의제공은전적으로 VM이맡아서수행하고있습니다. 그렇다면 VM 자체가문제가발생하거나내부의 O.S, 응용프로그램, 데이터저장소, 네트워크환경등에장애가발생하였을때어떻게대처해야되는지에대한고민을하지않을수없습니다. 아쉽게도 VMware HA로는이러한유형의장애에대하여해결책을찾기힘들고좀더높은수준의가용성확보를위해서는 3 rd party 솔루션을고려하지않을수없습니다. Vmware FT Vmware FT는 Vmware HA의기능을연장하여두대의물리적 Host간 VM이미지를실시간으로대기호스트로전송하여운영호스트가장애가발생하더라도다운타임없이서비스의연속성을보장해줍니다. 그러나 Vmware FT 또한 Vmware HA와마찬가지로 SAN Storage의장애, VM 자체및내부의여러장애에대한해결책의견지에서본다면좀더높은수준의가용성확보를위해서는 3 rd party 솔루션을고려하지않을수없습니다. Figure 1. Host failover using VMware HA 3
추가적인 3 rd party HA/DR 솔루션가상화된애플리케이션서버에대하여좀더가용성의수준을높이기위해서생각해볼수있는가장쉬운방법은과거물리적서버환경에서적용했던 MSCS와같은 HA 소프트웨어나 VM내부에서응용프로그램에대해서감시할수있는 3 rd party 소프트웨어를추가로구성하는것입니다. 3 rd party HA 및 DR 솔루션추가시장점들 : VM 자체에대한 redundancy 제공 O.S crash, 응용프로그램, 데이터저장소, 네트워크등의장애대비 VM 단위의 HA&DR 정책설정 그러나이러한 3 rd party 솔루션의경우는대부분물리적서버환경을위해서디자인되어여전히설치 와운영에많은시간이소요되고 HA/DR 구성과관리가어렵습니다. 3 rd party HA 및 DR 솔루션추가시단점들 : VM마다일일이설치와구성을해야함 HA 관리를위해별도의관리콘솔과전문지식을가진엔지니어필요 전반적으로설치, 구성, 관리가어려우며많은시간이소요됨 가상인프라환경에서향상된 HA/DR 의요구사항증대 위에언급하였듯이 VMware 가상화환경에서 mission/business critical한애플리케이션의 HA/DR의향상을위해서는직접적으로서비스를제공하는 VM 단위로가용성에대한관리가필요합니다. 한대의물리적서버에서여러대의가상서버를운영하는현실을볼때 HA/DR의구성과관리가쉬워야할것입니다. Vmware는 vsphere 4.1을출시하면서 3 rd party 소프트웨어가 VM들에대한가용성을관리하고 Vmware의 vcenter와통합하여관리할수있도록 application programming interface(api) 를발표하였습니다. 기존의 VMware의고가용성과 vcenter의관리기능을그대로사용하면서 VM 및 VM 내부에서운영되고있는여러가지자원들의정상상태를감시하고장애발생시이를자동복구혹은 Failover를통해서서비스연속성을보장할수있다면사용자는매우쉽게가상화환경에서 mission/business critical한애플리케이션에대한신뢰성을높일수있을것입니다. 맨텍의 MCCS 소개 맨텍의 MCCS 는 Vmware 환경에서 mission/business critical 한애플리케이션의 HA/DR 을향상시켜주는 4
솔루션입니다. 가상화환경에서 MCCS 는다음의향상된 HA/DR 환경을제공해줍니다. MCCS의주요기능및장점 : 개별 VM 및내부응용프로그램과자원들에대한장애감시와자동복구 VM 자체에대한이중화구성지원 실시간데이터복제를통한 VM 내부의데이터이중화지원 Wizard를통한자동화된 HA/DR 구성 vcenter와의관리콘솔통합을통한쉬운관리 MCCS 의아키텍처 MCCS 는 100% 소프트웨어로구성되어있으며, 고가용구성을위해서기존 VMware 환경을고치거나추 가적인하드웨어가거의필요없습니다. MCCS 는다음과같은주요콤포넌트로구성됩니다. Cider Virtual Manager (CVM) CVM은 VMware의 vcenter와통합된 plug-in 방식의관리콘솔입니다. CVM을통해서기존의단일로운영되던 VM에대해서쉽게 HA/DR을구성할수있으며, 개별 VM 및내부의응용프로그램과자원들에대한정상상태를직관적으로관리할수있습니다. Guest component Guest component는 VM 내부의응용프로그램과자원들에대한정상상태를감시하고실시간으로데이터콤포넌트를복제하기위한 agent입니다. 사용자들은 guest component를일일이 VM마다설치하거나구성할필요가없으며, vcenter에서 HA/DR을구성할 VM을선택하면자동으로 VM에푸싱이되며, 이후 standby VM의생성과 HA/DR 환경구성이자동으로이루어집니다. Figure 2. MCCS components and configuration diagram 5
Application-awareness MCCS는 VM내부에서운영되고있는응용프로그램과연관된자원들을감시, 시작, 종료, Failover 등을할수있는 agent가포함되어있습니다. 이러한 agent의역할은 MS-SQL DB서비스와같은 missioncritical 애플리케이션의프로세스와그와연관된서비스자원을자동으로인지하고각자원들간의의존성관계를자동으로생성해줍니다. 예를들어 MS-SQL DB의경우정상적인서비스제공을위하여최소한 MS-SQL server, MS-SQL agent와같은 Windows Service, IP Address, NIC, 데이터베이스가저장될 virtual store 등의자원들이필요합니다. 이러한자원중단하나라도장애가발생하면 DB서비스는중지가될것이며, DB서비스를시작, 중지, 복구및 Failover를위해서는각자원들이시작및종료되는순서가있습니다. MCCS의 agent는 MS-SQL DB의서비스에필요한자원을자동으로찾아내고각자원들간의의존성을자동으로구성하며, 궁극적으로각자원들에대한장애를자동으로인지하여자동으로복구및 Failover를지원합니다. Figure 3. Application awareness and auto discovery 자동화된 VM 이중화 No human labor for clustering 물리적시스템환경이든가상화환경이든두대의서버간서비스레벨의 HA/DR을구성하기위해서는많은시간과 HA/DR 관련된지식이필요합니다. MCCS의자동화된구성 Wizard를통해서단수십분의시간으로 VM에대해서 HA/DR을매우쉽게구성할수있습니다. MCCS 가제공하는자동화된 features: Guest component 자동푸싱 6
Application agent를통해응용프로그램서비스자원과복제할볼륨의자동발견응용프로그램서비스를위한주요자원들간의의존성자동생성대기 VM 자동생성운영 VM과대기 VM간자동 Clustering 응용프로그램장애의자동감시와복구및 Failover 원래 VM 기동시자동화된데이터역복제 Figure 4. MCCS 구성마법사 비용효율적인재해복구구성지원 Mission/business critical한애플리케이션은물리적환경에서도그랬듯이가상화환경에서도재해복구는고려해야할항목중하나입니다. 일반적으로생각해볼수있는솔루션이스토리지기반의복제, SRM에서제공하는 Host based replication(hba), Guest.S 기반의 3 rd party 복제솔루션등일것입니다. 각스토리지제조사에서제공하는스토리지기반의복제솔루션은 VM들이저장된볼륨들을호스트의자원을사용하지않고스토리지간복제를처리하기때문에관리와성능면에서는확실히장점이될수있습니다. 하지만동일한일정수준이상의스토리지모델이필요하고높은대역폭의복제전용선등의많은비용이소모된다는점, 개별 VM단위의설정을할수없다는점, 재해복구를위해서수작업필요하다는점등의단점들이있습니다. VMware 의 SRM 이새로운버전을발표하면서 HBA 기능을추가하여별도의외장스토리지기반이없더 7
라도 VM Host간 VM 이미지들을복제할수있게되었습니다. HBA가확실히비용효율적인면에서는충분히고려해볼만한재해복구솔루션일수있습니다. 하지만 HBA가제공할수있는최소한의 Recovery Point of Object (RPO) 가 15분인것을감안한다면, mission/business critical한애플리케이션이요구하는실시간복제의요구 (RPO 0) 를충족하기에는여전히부족한면이있습니다. 맨텍의 MCCS 는 HA 기능이외실시간복제기능을제공하여 mission/business critical 한애플리케이션의 데이터를실시간백업을통해 RPO 0 의요건을충족시켜주며, HA 기능과의긴밀한연동을통해재해발 생시백업 Host 에서자동화된서비스복구가가능합니다. MCCS가제공하는재해복구 features: Application agent를통해복제할볼륨의자동발견및복제 set 설정 실시간복제및자동화된 Failover를통해 RPO 0, RTO>min. 요건충족 변경된데이터블록만복제하여 Host 자원사용율이거의없으며낮은대역폭으로도복제가능 백업 Host로자동화된 Failover 지원 원래 VM 기동시자동화된데이터역복제지원 Figure 5. 자동화된 HA/DR 구축 8
vcenter와통합된가용성관리 MCCS는 VM들에대한 HA/DR의구성과관리를위해서별도의관리콘솔을운영하지않고모든관리가기존에운영하던 vcenter에서이루어집니다. Vmware관리자는별도로 vcenter에서추가로생성된 MCCS 탭을통하여쉽게 HA/DR을몇번을클릭으로구성할수있으며, 각 VM 및내부의응용프로그램과자원들의상태를모니터링할수있습니다. Figure 6. vcenter 와통합된가용성관리콘솔 결론 Mission/business critical한애플리케이션이가상화인프라로통합이되면서 HA/DR에대한솔루션관심도는더높아지게되었습니다. 그리고대부분의 IT관리자들은기존물리적환경에서이루어졌던서비스레벨의높은수준의 HA/DR을가상화환경에서도지원되기를원하고있습니다. 거기에더하여매우쉬운수준의구성과관리의용이성또한요구되고있습니다. 맨텍의 MCCS는매우쉬운구성과관리의용이성과서비스레벨의높은수준의 HA/DR요건을충족할수있는업계유일한솔루션입니다. 9