클라우드통합형스토리지 - 소개및의의
목차 개요... 3 CiS 아키텍처... 3 엔터프라이즈급스토리지플랫폼... 4 엔터프라이즈계층 2 SAN 스토리지... 4 작업기반의스토리지계층화및데이터순위지정... 5 데이터축소및씬프로비저닝... 6 통합형클라우드데이터관리... 6 클라우드스냅숏... 7 클라우드데이터축소... 6 클라우드스토리지 WAN 최적화... 6 계층으로서의클라우드... 6 클라우드씬프로비저닝... 7 클라우드클론... 7 클라우드씬복원... 8 위치독립적복구...10 전체조망...10 요약...10
개요 이백서에서는 CiS, 즉클라우드통합형스토리지라는새로운종류의스토리지기술을소개합니다. CiS 는 iscsi SAN, 스냅숏, 백업, 중복제거, 압축등여러가지스토리지기술을클라우드서비스공급자가제공하는스토리지서비스와결합한것입니다. CiS 아키텍처에는조직의 IT 부서에서탐낼만한새롭고뛰어난관리기능이있습니다. 아래의그림 1 에 CiS 의기본적인토폴로지가나와있습니다. 그림 1: 기본적인 CiS 토폴로지 CiS 아키텍처 CiS 제품은다음과같은세가지기본구성요소를바탕으로합니다 ( 그림 2 참조 ). SAN 스토리지클라우드데이터관리엔터프라이즈급스토리지플랫폼 그림 2: CiS 의구성요소
엔터프라이즈급스토리지플랫폼 엔터프라이즈급고가용성스토리지란듀얼컨트롤러, 보조배터리지원메모리, 다중포트, RAID 등을갖추고모든구성요소를이중으로보호하여어느한지점에서문제가발생해도안전하게보호되는스토리지입니다. 또한핫스왑기능을지원하는구성요소와작업중단없이업그레이드할수있는소프트웨어를특징으로하여시스템가동을중단하지않은채하드웨어와소프트웨어를업그레이드할수있습니다. Microsoft Windows Server 2008 과 VMware 의운영체제및플랫폼인증은오늘날의엔터프라이즈스토리지플랫폼을구성하는필수요소중하나입니다. 게다가 StorSimple 은 Windows Azure 같은클라우드스토리지공급자에의해충분한테스트를거쳐이미널리배포되었습니다. 응용프로그램일치스냅숏이 CiS 시스템에통합되어있으며, 응용프로그램의스토리지 API 를사용하여작업을일시적으로정지하고특정시점의데이터를가져와버전을정리할수있습니다. 즉, 데이터를오류없이신속정확하게복원할수있으며, 관리자가데이터불일치문제를해결하느라쓸데없이시간을낭비하지않아도됩니다. 엔터프라이즈계층 2 SAN 스토리지 CiS 에서서버에연결하는데는업계표준 iscsi SAN 프로토콜이사용됩니다. iscsi 는손쉽게구성하여 Microsoft 및 VMware 서버에모두사용할수있으며, 대부분의스토리지관리자가잘알고있는기술입니다. CiS 는전자메일, 파일공유, Microsoft SharePoint, 콘텐츠관리시스템, VM( 가상컴퓨터 ) 확산, 구조화되지않은대규모데이터리포지토리등을포함하여엔터프라이즈계층 2 응용프로그램을위한기본스토리지로사용하는데그본래목적이있습니다. OLTP( 온라인트랜잭션프로세싱 ) 같이대기시간에민감한응용프로그램에는적합하지않습니다. 계층 2 데이터를구체적으로이해하려면그림 3 에나와있는것과같은수명주기곡선을따라가보는것이좋습니다. 이그림을보면데이터가생성된직후며칠동안데이터액세스건수가매우많다가그이후에는차츰줄어드는것을알수있습니다.
그림 3: 데이터수명주기 ( 출처 : Oracle Corporation) 작업기반의스토리지계층화및데이터순위지정 CiS 시스템에는서로다른세가지유형의스토리지가사용됩니다. 성능중심의플래시 SSD, 용량위주의 SAS 디스크드라이브, 클라우드스토리지가바로그것입니다. 데이터는상대적인작업수준과사용자가선택한정책에따라한유형의스토리지에서다른유형의스토리지로이동합니다. 작업량이더많아진데이터는더빠른유형의스토리지로이동하고, 작업량이줄어든데이터는용량이더큰유형의스토리지로이동합니다. 이시스템에는네개의논리적계층이있습니다. 그중두계층은 SSD 수준에속하고, 나머지계층은각각 SAS 수준과클라우드스토리지수준에속합니다. 아래의표 1 에는이러한네가지계층이정리되어있습니다. 계층이름스토리지유형데이터작업축소기술적용 네이티브 SSD 새로생성, 작업량많음없음 핫 SSD 기존, 작업량많음중복제거 웜 SAS ' 핫 ' 과 ' 쿨 ' 의중간완젂축소 쿨클라우드작업량적음완젂축소 표 1: StorSimple CiS 시스템의논리적계층 표 1 의셋째열인 " 데이터작업 " 은각계층의상대적인작업수준을나타냅니다. 네이티브계층과핫계층은데이터작업이가장활발하게이루어진다는공통점이있지만, 네이티브계층의데이터는최근에 CiS 시스템에추가된반면핫계층의데이터는시스템에추가된지가비교적오래되었다는점에서차이가있습니다. 쿨계층에서는데이터작업이가장드물게이루어지며, 웜계층의데이터는작업량이많지도적지도않습니다. 데이터순위지정은데이터의작업수준과데이터가생성된후경과한시간및데이터를어느계층에저장할지결정하는데적용할수있는정책을모두고려하여자동으로처리됩니다.
데이터축소및씬프로비저닝 표 1 의넷째열인 " 축소기술적용 " 은각계층에사용되는데이터축소기술의유형을나타냅니다. 네이티브계층에는아무런축소기술이사용되지않는반면, 핫계층에는중복제거 (dedupe) 기술이, 웜계층과쿨계층에는데이터압축과중복제거가함께이루어지는완전축소기술이사용됩니다. 네이티브계층에서웜계층으로이동하는데이터는먼저중복제거과정을거친다음압축됩니다. 중복제거란중복된데이터를식별하고불필요한사본을제거하여시스템에저장되는데이터의양을줄이는작업을말합니다. 중복제거는가상서버환경에서특히효과적입니다. 압축은반복되는일련의데이터값을식별하고이를길이가짧게인코딩된다른값으로대체하여시스템에저장되는데이터의양을줄이는기술입니다. CiS 시스템에사용되는또다른용량보존기술로씬프로비저닝이있습니다. 이는스토리지용량을미리예약하지않고필요한용량을그때그때할당하는방식입니다. CiS 시스템의모든스토리지에는씬프로비저닝이적용됩니다. 클라우드데이터관리 CiS 는아카이브및백업스토리지를비롯하여사용자가각자익숙한방식으로클라우드스토리지를사용할수있도록매우다양한데이터관리도구를갖추고있습니다. CiS 시스템의데이터관리도구대부분은그기능이자동으로처리되므로관리자의업무부담을줄이는데효과적입니다. 클라우드스냅숏은클라우드의쿨계층에저장된데이터에대한특정시점의복사본입니다. 모든클라우드스냅숏은스토리지사용량을최소화할수있도록완전축소 ( 중복제거및압축 ) 됩니다. 클라우드데이터축소및클라우드스토리지 WAN 최적화는 CiS 시스템에서클라우드에 데이터를전송및저장할때데이터를미리완전축소한상태로만드는것을의미합니다. 그결과클라우드스토리지비용을절감할수있을뿐만아니라클라우드에데이터를저장하는데관련된 WAN 대역폭과트랜잭션비용도줄일수있습니다. CaaT( 계층으로서의클라우드 ) 는클라우드스토리지를 CiS 시스템의쿨계층으로사용하도록 자동으로설정하는기능입니다. 순위가가장낮게매겨진데이터는클라우드의쿨계층으로이동합니다. 해당데이터는사용자가다시액세스하여웜계층으로승격되기전까지쿨계층에남습니다.
클라우드씬프로비저닝은 CiS 시스템에서사용하는클라우드스토리지에적용되는 씬프로비저닝입니다. 클라우드씬프로비저닝이란클라우드용량을미리예약하지않고클라우드스토리지가필요할때이를자동으로할당하는방식입니다. 따라서 CiS 고객은필요이상으로많은스토리지비용을지불하지않아도됩니다. 볼륨수준클라우드매핑은 CiS 시스템에서 CiS 시스템의스토리지볼륨과하나이상의 클라우드의위치를서로매핑하는것입니다. 각볼륨에서는동일한클라우드서비스또는서로다른클라우드서비스에쿨계층을둘수있습니다. 각 CiS 시스템에는시스템의상태를설명하고 스냅숏생성시점의볼륨콘텐츠에대한이미지를제공하는메타데이터맵이보존됩니다. 일반적으로이맵은저장된데이터크기의 0.1% 정도를차지합니다. CiS 시스템에서클라우드에전송및저장하는모든데이터에는보안을위해 AES-256 암호화가 적용됩니다. 데이터무결성을보장하기위해서는클라우드에전송및저장되는모든데이터에 SHA-256 해싱이적용됩니다. 클라우드클론은마지막스냅숏이생성된시점을기준으로볼륨의모든현재데이터를포함하는 일종의가상전체백업입니다. 이러한클론은재해복구시나리오에사용할목적으로쿨계층에저장되지만, 클라우드스냅숏과는다른별도의리포지토리를차지하며, 볼륨의클라우드스냅숏과동일한클라우드서비스또는다른클라우드서비스내에존재할수있습니다. 그림 4 에서는클라우드클론이클라우드스냅숏과는다른리포지토리에위치하지만, 클라우드서비스는클라우드스냅숏과같을수도다를수도있다는점을보여줍니다.
그림 4: 클라우드스냅숏클라우드클론의위치 씬복원은클라우드에서 CiS 시스템으로데이터를다운로드하는재해복구프로세스입니다. 제일 먼저메타데이터맵이다운로드되고나면응용프로그램과사용자가해당작업집합에액세스하여다운로드를시작할수있습니다. 다운로드된데이터는순위가지정된후적절한계층에배치됩니다. 그림 5 에는이와같은씬복원프로세스가나와있습니다. 그림 5: 씬복원프로세스
씬복원은 RTO( 복구시간목표 ) 가매우짧은것이일반적입니다. 메타데이터맵이다운로드된후시스템에서데이터액세스를시작할수있기때문입니다. 씬복원에서는작업집합에속하지않은쿨데이터를복원하지않습니다. 아래의그림 6 에는서로다른세가지백업시나리오의 RTO 를비교한결과가나와있습니다. 맨위의빨간색선은가상테이프에사용되는클라우드스토리지를나타냅니다. 이방식의문제점은 WAN 을통해모든데이터를복원해야하므로네트워크성능이매우높아야한다는데있습니다. 중간의검은색선은오프사이트시설에저장되는기존의전통적인테이프방식을나타냅니다. 이방식의관건은오프사이트저장소로부터필요한모든테이프를찾아가져오는데걸리는시간입니다. 맨아래의녹색선은 CiS 클라우드스냅숏또는클론을나타냅니다. 이방식을사용하면 응용프로그램과사용자가상대적으로적은양의데이터를다운로드한후해당데이터에액세스할수있습니다. 그림 6: 클라우드기반의가상테이프, 기존의젂통적인테이프및 CiS 의 RTO 비교
위치독립적복구는적절한인터넷연결환경만갖추고있으면어느곳에서든 씬복원을수행할수있음을의미합니다. 이와달리기존의재해복구작업에는이를특정복구사이트에서만실행해야한다는제약이있습니다. 위치에구애되지않으므로복구프로세스를수행할수있는경로를더많이준비해둘수있으며, 기존의전통적인복제솔루션과달리많은자본을투자할필요가없습니다. 여러곳의데이터센터를이용하는고객은그중어느한곳에서실행되는 CiS 시스템을사용하여다른임의의사이트를재해로부터복구할수있습니다. 마찬가지로, CiS 시스템하나를다른시스템에대한예비용으로지정하여 DR 솔루션을비용대비효율성이매우뛰어난방식으로구현할수있습니다. 젂체조망 아래의그림 8 에서는 CiS 시스템과그세가지기반인엔터프라이즈 SAN 스토리지, 클라우드데이터관리및고가용성엔터프라이즈급플랫폼의여러가지요소를모두종합적으로보여줍니다. 그림 8: 클라우드통합형엔터프라이즈스토리지젂체조망 요약 CiS 는고가용성플랫폼을기반으로 SAN 스토리지와클라우드데이터관리를통합한새로운유형의스토리지시스템입니다. CiS 는엔터프라이즈계층 2 응용프로그램의요구사항을충족할수있도록개발되었습니다. 이러한응용프로그램은 SAN 성능을필요로하는작업집합이비교적많지않은반면, 액세스할일이있다하더라도그빈도가높지않아유휴상태로쿨계층에배치된데이터의양이상대적으로많은것이특징입니다. CiS 시스템은기존의전통적인스토리지환경에서많은시간을들여수행해야했던작업을자동화한여러가지스토리지관리기능을갖추고있습니다. CiS 시스템을사용하면백업및 DR 같은데이터보호프로세스를간소화할수있으므로그와관련된비용과시간을크게절약할수있습니다.