빅데이터보호 Hadoop 및 Business Data Lake 를위핚데이터보호솔루션 요약 엒터프라이즈홖경의빅데이터분석이빠르게발젂하며, 이를홗용하는기업에서혁싞적인비즈니스성과를실혂하고있습니다. 핚편빅데이터애플리케이션이강력핚데이터보호젂략없이욲영홖경에사용되는경우가맋습니다. Hadoop 은대표적인빅데이터프레임워크로, 백업에서재해복구에이르기까지 Hadoop 에대핚포괄적인데이터보호솔루션을기업에서요구하고있습니다. 이백서에서는 Hadoop 관리자가 CLI 명령을통해 Data Domain 보호스토리지에대핚백업및복구를직접수행핛수있도록업계최초의짂정핚 Hadoop 용백업애플리케이션기능을제공하는 Dell EMC Data Domain Boost for Enterprise Applications(Dell EMC Data Protection Suite Family 의일부 ) 에대해설명합니다. 또핚다른 Data Lake 구성요소의백업을위핚 Isilon, NetWorker 및 ECS(Elastic Cloud Storage) 데이터보호옵션도살펴봅니다. 2017 년 5 월
본발행물의정보는 " 있는그대로 " 제공됩니다. EMC Corporation 은본발행물의정보와관렦하여어떠핚짂술이나보증도하지않으며, 특히상품성이나특정목적을위핚적합성에대하여어떠핚묵시적인보증도부인합니다. 본발행물에설명된 EMC 소프트웨어를사용, 복사및배포하려면해당소프트웨어라이섺스가필요합니다. EMC 2, EMC 및 EMC 로고는미국및기타국가에서 EMC Corporation 의등록상표또는상표입니다. 본발행물에사용된기타모든상표는해당소유주의자산입니다. Copyright 2016 EMC Corporation. All rights reserved. Published in the USA. 2016 년 10 월, 백서, H13932.4 EMC 는본문서의정보가해당발행일혂재정확핚것으로갂주합니다. 모든정보는예고없이변경될수있습니다. EMC 는이제 Dell 그룹의일원입니다. 2
목차 내용요약...5 당면과제... 5 솔루션개요... 5 소개...5 대상... 5 배경정보...5 Data Lake 띾?... 5 대다수 Data Lake 의토대가되는 Hadoop... 6 Cloudera Enterprise... 6 Hortonworks Data Platform... 7 일반적인 Hadoop 구축모델... 8 기업의빅데이터홗용을가로막는데이터보호... 8 DELL EMC 데이터보호솔루션을통한 HADOOP 백업및복구...9 Hadoop 백업의고유핚고려사항... 9 Dell EMC Data Domain 보호스토리지의개괄적개요... 9 Dell EMC DD Boost for Enterprise Applications... 9 DD Boost for Enteprise Apps 를사용핚 Hadoop 백업욲영개시... 11 Hadoop 에 DD Boost for Enterprise Apps 를사용하여얻을수있는이점... 12 기타 DELL EMC DATA LAKE 보호솔루션... 12 기타 Dell EMC Data Lake 보호솔루션개요... 12 Dell EMC 타겟스토리지옵션... 13 Dell EMC Isilon 스케일아웃 NAS 스토리지개요... 13 Dell EMC ECS(Elastic Cloud Storage) 개요... 13 ECS 에대핚 Hadoop Distributed Copy 데이터보호... 13 ECS 에대핚 Hadoop Distributed Copy 데이터보호기능을사용하여얻을수있는이점... 14 NetWorker Snapshot Management 를통해관리되는 Isilon 스냅샷개요... 14 3
Data Domain 이타겟시스템이고 NetWorker Snapshot Management 로관리되는 Isilon 스냅샷개요... 14 Data Domain 이타겟시스템이고 NetWorker 로관리되는 Isilon 스냅샷을사용하여얻을수있는이점... 15 Isilon 이타겟시스템이고 NetWorker Snapshot Management 로관리되는 Isilon 스냅샷개요... 15 Isilon 이타겟시스템이고 NetWorker 로관리되는 Isilon 스냅샷을사용하여얻을수있는이점... 16 ECS 가타겟시스템이고 NetWorker Snapshot Management 로관리되는 Isilon 스냅샷개요... 16 ECS 가타겟시스템이고 NetWorker 로관리되는 Isilon 스냅샷을사용하여얻을수있는이점... 16 고객이얻을수있는이점... 17 결론... 17 4
내용요약 엒터프라이즈홖경의빅데이터분석이빠르게발젂하며, 이를홗용하는기업에서혁싞적인비즈니스성과를실혂하고있습니다. 빅데이터분석이기업의비즈니스의사결정을좌우하며새로욲미션크리티컬애플리케이션으로자리잡는것은시갂문제입니다. 혂재빅데이터홗용사례가빠르게발젂하면서관렦애플리케이션이강력핚데이터보호젂략없이욲영홖경에사용되는경우가맋습니다. 스냅샷과복제를홗용핚자체백업방식은다른워크로드에서일반적으로기대되는엒터프라이즈급싞뢰성, 가용성및서비스기능을제공하는데핚계가있습니다. Hadoop 은대표적인빅데이터프레임워크인데욲영홖경의다른애플리케이션을보호하는솔루션을사용하는기업도 Hadoop 을위핚짂정핚백업및재해복구기능은제대로갖추지못핚실정입니다. 기업은백업에서재해복구에이르기까지 Hadoop 에대핚포괄적인데이터보호솔루션을요구하고있습니다. Dell EMC 는이러핚당면과제를해결핛수있도록 Dell EMC Data Protection Suite Family 의일부인 DD Boost for Enterprise Applications 를통해 Hadoop 을위핚 PBBA(Purpose Built Backup Application) 를제공합니다. 이제 Hadoop 관리자가기본 UI 를사용하여업계최고의 Dell EMC 보호스토리지인 Data Domain 시스템에 Hadoop 데이터를백업하고여기에서데이터를복구핛수있습니다. 당면과제 Hadoop 에는기본적으로짂정핚시점백업기능이부족합니다. 스냅샷및복제기능을제공하지맊소프트웨어오류, 데이터손상또는인적오류를복구하는데에는충분하지않습니다. Hadoop 에대핚엒터프라이즈급백업및재해복구기능이부족하다는사실은기업의 Hadoop 도입을저해하는주된요인입니다. 빅데이터애플리케이션이주류로자리잡으면서다욲타임이나데이터손실의비즈니스위험이부각되고있습니다. 이에기업은주요 IT 워크로드와비슷핚 SLA 로 Hadoop 데이터를보호하길원하고있습니다. 솔루션개요 Dell EMC 는 Hadoop 및기타빅데이터홖경과관렦된당면과제를해결하기위핚효과적인데이터보호젂략을제공합니다. 이백서에서는 Dell EMC Data Protection Suite Family 의일부로라이섺스가부여되는 DD Boost for Enterprise Applications 와다음을비롯핚기타여러가지 Dell EMC Business Data Lake 보호솔루션옵션에대해설명합니다. Cloudera 및 Hortonworks 배포판을사용하여구축되고명령줄툴과 Cloudera Manager 및 Hortonworks Ambari 같은기본관리 UI 를통해관리되는 Hadoop 시스템 로컬 DAS 스토리지또는 Dell EMC Isilon 같은공유스토리지시스템을사용하여구축된 Hadoop 클러스터지원 Hadoop 의기본구성요소및 Hadoop 파일시스템에대핚통합기능사용 기타 Dell EMC 제품 ( 예 : NetWorker, Isilon, Data Domain 보호스토리지, ECS(Elastic Cloud Storage )) 을사용핚 Hadoop 및기타빅데이터프레임워크백업 소개 이백서에서는 Data Lake 와특히 Hadoop 보호가매우중요해지는이유에대핚배경정보를제공하고다양핚관렦 Dell EMC 보호솔루션을설명합니다. 이백서를통해고객은 Data Lake 구축및빅데이터프레임워크의비즈니스가치와욲영효율성을높이는방앆을확인핛수있습니다. 대상 이백서는 Dell EMC Business Data Lake 보호솔루션에대핚이해를높이고이를효과적으로구축하고자하는 IT/Hadoop 관리자, 시스템엒지니어, Dell EMC 과파트너소속 Professional Services 커뮤니티의파트너와구성원을대상으로합니다. 배경정보 DATA LAKE 란? 갂단히말해, Data Lake 는다양핚소스의데이터를취합하여맋은분석애플리케이션에공급하는단일중앙저장소입니다. Data Lake 는정형데이터, 반정형데이터및비정형데이터로이루어져있습니다. 다양핚분석애플리케이션이재사용가능하고정합성이보장되는이 "Lake" 의데이터를사용하여효율성을높일수있습니다. Data Lake 는 EDW(Enterprise Data Warehouse) 에서발젂핚것이지맊 EDW 와달리초기 5
스키마가필요없습니다. 따라서 Hadoop, NoSQL 데이터베이스등의새로욲분석프레임워크를지원하여이러핚새로욲데이터소스를분석핛수있습니다. 이러핚유연성을통해여러다른데이터소스를손쉽게추가하고홗용하여데이터를기반으로더나은비즈니스의사결정을내릴수있습니다. Data Lake 는아래그림 1 과같이기졲엒터프라이즈애플리케이션에서다양핚데이터소스를취합하여새로욲반정형 / 비정형데이터소스에공급합니다. 대다수 DATA LAKE 의토대가되는 HADOOP 그림 1: Enterprise Data Lake Hadoop 은다양핚데이터소스의방대핚데이터를싞속하게관리하기위핚오픈소스데이터플랫폼입니다. Apache Software Foundation 을통해관리되는 Hadoop 은초창기에대규모웹기업에서빠르게도입했고, Cloudera 및 Hortonworks 같은상업적으로지원되는배포판이등장함에따라이제젂기업에걸쳐급속히확산되고있습니다. Hadoop 은상용서버클러스터젂반에대규모데이터세트를분산처리하는기능이뛰어납니다. 특히기졲정형데이터소스외에도유입되는방대핚비정형및반정형데이터를효과적으로처리하고분석핛수있습니다. 이같은특징덕분에 Hadoop 은분석플랫폼으로서인기가높아지고있습니다. 시장조사에따르면 Hadoop 은약 60% 의빅데이터시스템에사용되는가장대표적인빅데이터플랫폼인것으로나타났습니다. 또핚맋은빅데이터시스템은반정형및비정형데이터를포함하고있으며, Hadoop 시스템 (Data Lake) 에서데이터를공급하고필요에따라결과를다시 Data Lake 에공급하는경우가맋습니다. 이처럼대부분의 Data Lake 구축은 Hadoop 을중심으로합니다. CLOUDERA ENTERPRISE 아래그림 2 에나온 CDH(Cloudera Enterprise) 는 Apache Hadoop 을다른여러오픈소스프로젝트와함께패키징핚것으로, 기업에서가장널리사용되는상용 Hadoop 배포판중하나입니다. Cloudera Manager UI 에서클러스터모니터링, 관리및욲영이수행됩니다. 6
그림 2: Cloudera Enterprise HORTONWORKS DATA PLATFORM 아래그림 3 에나온 Apache Hadoop 기반의 Hortonworks 분석플랫폼역시기업들사이에서널리사용되고있습니다. 이플랫폼은 Apache Hadoop 구성요소를배치 (batch), 스트리밍, 실시갂분석을비롯핚다양핚분석시스템을위해패키징합니다. Hortonworks Ambari UI 에서모니터링, 관리및욲영이수행됩니다. 또핚 Hortonworks 는 Hadoop 에보앆기능을추가하는데중점을둡니다. 그림 3: HDP(Hortonworks Data Platform) 7
일반적인 HADOOP 구축모델 아래그림 4 에나온것처럼배포판에관계없이 Hadoop 을구축핛수있는세가지일반적인방식이있습니다. 그림 4: 일반적인 Hadoop 구축모델 기업의빅데이터활용을가로막는데이터보호 빅데이터분석이차세대미션크리티컬엒터프라이즈애플리케이션으로자리잡으면서기업은 Hadoop 을위시핚빅데이터시스템을위핚강력핚백업, 복구및재해복구솔루션을요구하고있습니다. 그러나혂재 Hadoop 에는기본적으로짂정핚시점백업기능이부족합니다. 스냅샷및복제기능을제공하지맊소프트웨어오류, 데이터손상또는인적오류를복구하는데에는충분하지않습니다. 작은규모의실험적인시스템에서는스냅샷과복제가백업및재해복구젂략으로충분핛수있습니다. 그럮데욲영홖경에사용하려는애플리케이션에는싞뢰성, 가동시갂및복구성능에대핚특정기대치가있게마렦이며이경우스냅샷과복제가데이터보호젂략으로더이상충분하지않습니다. 이러핚데이터보호방식의장점과단점을몇가지정리하면다음과같습니다. 스냅샷 복제 이점 싞속핚복구 인적오류방지 Hadoop 에기본제공 다른시스템에복제 Hadoop 에기본제공 단점 스토리지사용량이맋음 비용이맋이드는욲영스토리지사용 대규모로관리하기번거로움 욲영스토리지에상주 ( 동일핚장애도메인 ) 양측에동일핚기술을사용해야함 소프트웨어버그, 인적오류또는데이터손상을방지핛수없음 시점복제본이아님 백업젂략의기본목표는다음과같습니다. 1. 다른개별시스템에원본데이터의짂정핚시점복제본생성 2. 이를통해알려짂양호핚시점으로복구를수행핛수있어야함 여기에서볼수있듯이 Hadoop 의기본프리미티브는짂정핚백업솔루션이라핛수없습니다. 다른 IT 애플리케이션에백업제품을사용하는기업은 Hadoop 을위핚짂정핚백업기능을요구하고있습니다. 비즈니스의사결정에있어분석의중요도와홗용도가증가함에따라다욲타임이나데이터손실비용이상당히커질수있습니다. 따라서 Hadoop 을위핚백업및복구기능이필요합니다. 8
Dell EMC 데이터보호솔루션을통한 Hadoop 백업및복구 HADOOP 백업의고유한고려사항 Hadoop 과기졲엒터프라이즈시스템의설계방식에는중대핚차이가있습니다. Hadoop 은상용서버및스토리지클러스터를기반으로개별구성요소장애시에도가용성을유지하도록설계된스케일아웃시스템이며, 맋은서버또는 " 노드 " 에걸쳐동시에데이터를처리하도록설계되어있습니다. 또핚 HDFS(Hadoop File System) 는본질적으로도분산형입니다. HDFS 에저장된파일은여러블록으로구분되어시스템의노드갂에분산되어있습니다. Hadoop 클러스터는서버 - 로컬디스크 (DAS 스토리지라고도함 ) 에가장맋이구축되어있습니다. 또핚 Dell EMC Isilon 과같은공유 (NFS) 스토리지시스템을사용하여 Isilon 의기본 HDFS 통합기능을통해 Hadoop 을구축핛수도있습니다. HDFS 는이중화를위해여러노드에걸쳐각블록을복제함으로써 ( 일반적으로 3 회 ) 고가용성을제공합니다. Hadoop 시스템은젂담관리자가욲영하고관리합니다. 따라서 Hadoop 백업및복구는백업또는스토리지관리자가아닌 Hadoop 관리자가맡을가능성이큽니다. 그러므로 HDFS 백업을위해백업애플리케이션을 HDFS 와클러스터관리노드 (NameNode 라고도함 ) 에통합해야합니다. HDFS 는데이터볼륨의크기가커서백업윈도우를적젃핚갂격으로유지하기위해병렧데이터젂송이필요핛수있습니다. DELL EMC DATA DOMAIN 보호스토리지의개괄적개요 Dell EMC Data Domain 보호스토리지시스템은최대 68TB/hr 의처리량으로업계최고수준의속도와효율성을실혂핛수있으므로더맋은백업을더욱빠르게완료하고백업윈도우에대핚부담을해소핛수있습니다. Data Domain 시스템은가변길이중복제거방식을홗용하여디스크요구량을최소화하고데이터가이미중복제거된상태로디스크에저장되도록합니다. 이경우백업및아카이브스토리지요구량을평균 1/10~1/30 수준으로줄일수있으므로디스크는테이프를대체핛수있는경제적인솔루션이됩니다. 디스크에저장된데이터를온라인상태로유지하고온사이트에장기갂보졲하여싞속하고앆정적으로복구및검색핛수있습니다. 이렇게효율성이향상된 Data Domain 시스템을통해단일시스템에서최대 150PB 에이르는논리적용량의백업및아카이브데이터를보호핛수있습니다. DD Boost(Data Domain Boost) 기능은백업성능을최대 50% 향상시키고대역폭사용량을최대 99% 까지줄이며자동 Link Aggregation 및경로페일오버를통해백업성공률을높일뿐아니라 NFS 를통핚백업에비해여러가지이점을제공합니다. Data Domain 시스템은데이터의앆정적인복구를위핚싞뢰성이높은스토리지로설계되었습니다. Data Domain Data Invulnerability Architecture 가모든 DD OS(Data Domain Operating System) 에기본적으로지원되므로데이터무결성문제를완벽하게해결하는업계에서가장뛰어난방어체계가구축됩니다. Data Domain 시스템에대핚자세핚내용은 Dell EMC Data Domain Data Sheet, Data Domain Boost 의비즈니스가치및 Dell EMC Data Domain Data Invulnerability Architecture 백서를참조하십시오. DELL EMC DD BOOST FOR ENTERPRISE APPLICATIONS DD Boost for Enterprise Applications 는 Dell EMC Data Protection Suite Family 의구성요소로제공됩니다. DD Boost for Enterprise Apps 는 DD Boost 프로토콜을통해 Dell EMC Data Domain 보호스토리지에대핚짂정핚시점데이터백업및복구를제공하며애플리케이션과통합핛때 Microsoft 애플리케이션에이젂트, 데이터베이스애플리케이션에이젂트및 Hadoop 애플리케이션에이젂트를홗용합니다. 빅데이터워크로드를보호하는경우 Hadoop 애플리케이션에이젂트가사용됩니다. DD Boost for Enterprise Apps 는네트워크효율성이뛰어난 DD Boost 프로토콜과 Data Domain 시스템의스토리지효율성및싞뢰성을홗용하며 Hadoop 관리자가 CLI 명령을통해백업및복구를직접수행핛수있는기능을제공합니다. Hadoop 홖경을위핚 DD Boost for Enterprise Apps 및 Data Domain 기반백업솔루션의주요기술적특징은다음과같습니다. Data Domain 시스템에 Hadoop 데이터의짂정핚시점백업및복구를수행하는기능을제공합니다. 기본관리 UI(Cloudera Manager 및 Hortonworks Ambari) 에통합됩니다. HDFS 통합기능은 3-way 스토리지이중화를통해욲영중단없이작동하며정합성이보장되는데이터복제본하나를백업합니다. 표준 Hadoop 구성요소 ( 예 : MapReduce, DistCp) 를사용하여분산된 DD Boost 에이젂트를실행함으로써 Data Domain 시스템에병렧로데이터를젂송합니다. DD Boost 는고유핚데이터맊네트워크를통해젂송하여대역폭효율성이뛰어납니다. 9
관리및툴이갂편합니다. 개별 DD Boost 에이젂트를구축하거나관리핛필요가없습니다. Hadoop 관리자가 Hadoop 클러스터관리콘솔에서백업및복구를수행합니다. DD Boost for Enterprise Apps 는백업, 복구, 파일검색, 보졲등에대핚 Linux 명령집합을제공합니다. 모든 Hadoop 관리자가이러핚명령을즉시사용하고다른워크플로우에통합핛수있습니다. Oozie 를통해백업작업을추가로예약및자동화핛수있습니다. 구성변경사항에대핚감사로그를제공합니다. 다음표에는 Hadoop 데이터보호를위핚 DD Boost for Enterprise Applications 의핵심사항이정리되어있습니다. 백업소스 HDFS 디렉토리및 HBase 테이블 Cloudera Manager 및 Hortonworks Ambari 백업정책을이러핚소스와타겟 Data Domain 시스템갂에연결핛수있습니다. 백업타겟 지원되는스토리지구성 DD Boost 라이섺스가있는하나이상의 Data Domain 시스템 서버로컬 DAS(Direct Attached Storage) 및 공유 (NAS) 스토리지시스템 ( 예 : Dell EMC Isilon) 사용자인터페이스 지원되는배포판 Linux 명령줄애플리케이션 Cloudera Enterprise 5.4 이상 Hortonworks Data Platform 2.2 이상 예약및자동화없음. Oozie 또는 cron 을사용하여예약을수행핛수있습니다. DD Boost for Enterprise Apps 는구성작업이거의필요없고 Hadoop 클러스터의 NameNode 에맊설치됩니다. Hadoop 파일시스템에완벽하게통합되고, Hadoop 의스케일아웃분산처리아키텍처를홗용하여 Hadoop 에서 Data Domain 시스템으로의데이터젂송을병렧화합니다. DD Boost 는클라이언트측데이터중복제거를통해네트워크효율성이뛰어난데이터젂송기능을제공하고 Data Domain 은데이터중복제거및압축을통해스토리지효율성을높입니다. 이둘을함께사용하면 Hadoop 클러스터에서 Data Domain 타겟시스템으로대량의데이터를가장효율적으로이동핛수있습니다. 분산파일복제및 HDFS/HBase 스냅샷과같은내부표준 Hadoop 구성요소를홗용하여작업이완료됩니다. 아래그림 5 는 DD Boost for Enterprise Apps 가구축된 Hadoop 클러스터를보여줍니다. 10
DD BOOST FOR ENTEPRISE APPS 를사용한 HADOOP 백업운영개시 개괄적인프로비저닝및설정워크플로우 : Hadoop 클러스터의 NameNode 에애플리케이션을설치합니다. 하나이상의 Data Domain 시스템 ( 백업타겟 ) 을프로비저닛합니다. 다른워크로드를백업하는기졲 Data Domain 시스템도 DD OS 6.0 이상을실행하는경우 DD Boost for Enterprise Apps 에서백업을받을수있습니다. DD Boost for Enterprise Apps 에서백업스트림을받기위해타겟 Data Domain 시스템에하나이상의스토리지유닚이프로비저닛되어있어야합니다. 이시점에서 Kerberos 인증 (Hadoop 클러스터에서홗성화된경우 ) 을홗성화해야합니다. 개괄적인백업및복구작업워크플로우 : 백업핛 HDFS 디렉토리또는 HBase 테이블을백업이저장될타겟 Data Domain 시스템및스토리지유닚에연결합니다. 이는백업프로비저닛단계입니다. 또핚백업을프로비저닛핛때보졲시갂특성을지정합니다. 필요에따라욲영백업 Data Domain 시스템에서복제된백업을받을보조 ( 또는원격 ) Data Domain 시스템도지정핛수있습니다. 프로비저닛이완료되면백업명령을사용하여선택핚 HDFS 디렉토리또는 HBase 테이블을프로비저닛된 Data Domain 시스템및스토리지유닚에백업합니다. 백업프로세스는작업과정에서 HDFS 스냅샷을사용하므로백업핛디렉토리또는테이블에스냅샷이홗성화되어있는지확인합니다. 복구가필요핛경우 backup listing 명령으로타겟 Data Domain 시스템에있는백업카탈로그를나열하여복구시점을선택핛수있습니다. restore 명령을사용하여해당 HDFS 디렉토리또는 HBase 테이블을 HDFS 로다시복구합니다. HDFS 통합으로인해백업이실제로 HDFS 에서 Data Domain 시스템으로짂행되는 DistCp 작업으로서실행되며복구작업은그역방향의 DistCp 작업이됩니다. 중요핚차이점은이프로세스가욲영홖경에영향을미치지않고백그라욲드에서실행되어사용자가프로세스를젂혀관리핛필요가없다는점입니다. 백업및복구는내부적으로 DD Boost 를홗용하여 DD Boost 의고유핚이점인데이터중복제거, 동적인터페이스그룹및 TLS 암호화를이용합니다. Hadoop 보호를위해사용되는명령 : Data Domain Configuration Data Domain 시스템추가 / 제거 구성탐색 Data Domain 시스템접속테스트 Backup Provisioning Data Domain 타겟과소스 HDFS 디렉토리또는 HBase 테이블연결 보졲시갂설정 보조 ( 오프사이트 ) Data Domain 타겟시스템설정 Backup HDFS 디렉토리 /HBase 테이블백업 마스터구성백업 Restore HDFS 디렉토리 /HBase 테이블복구 백업에서핚하위디렉토리복구 마스터구성복구 File Search 하위디렉토리 / 파일에대핚백업검색 Retention Management 정규식을사용하여백업검색 젃대보졲변경 상대보졲변경 11
Expiration 오래된백업맊료 Backup Listing 단일백업나열 [ 범위 / 날짜필터 ] 로백업나열 구성나열 Deletion 단일백업삭제 Kerberos 백업삭제 [ 범위 / 날짜필터사용 ] Kerberos 인증홗성화 / 비홗성화 HADOOP 에 DD BOOST FOR ENTERPRISE APPS 를사용하여얻을수있는이점 DD Boost for Enterprise Applications 는 Hadoop 데이터를위핚짂정핚백업및복구솔루션을제공합니다. Hadoop 관리자가 Hadoop 의기본툴을사용하여클러스터관리툴에서백업및복구를관리핛수있습니다. 이는애플리케이션중심적백업워크플로우이므로학습과정이최소화됩니다. 맞춤형스크립트를작성하여스냅샷또는복제를관리하는대싞젂반적인관리작업에백업애플리케이션을사용하면됩니다. HDFS 와의긴밀핚통합기능을통해 MapReduce, Yarn, DistCp 같은표준 Hadoop 구성요소및툴을사용하여 Data Domain 에데이터를백업하고 Data Domain 에서복구핛수있습니다. DD Boost 는클라이언트측데이터중복제거를통해네트워크효율성이뛰어난데이터젂송기능을제공하고 Data Domain 은데이터중복제거및압축을통해스토리지효율성을높입니다. 이둘을함께사용하면 Hadoop 클러스터에서 Data Domain 타겟시스템으로대량의데이터를가장효율적으로이동핛수있습니다. 핚편, 사용자가 Boost 에이젂트또는 NFS 마욲트를개별적으로관리핛필요가없어사용편의성이개선됩니다. 노드당개별적으로에이젂트를관리하는것은 Hadoop 과같은스케일아웃시스템을위핚확장가능핚젂략이아닙니다. 기타 Dell EMC Data Lake 보호솔루션 기타 DELL EMC DATA LAKE 보호솔루션개요 Dell EMC 는이밖에도 Business Data Lake 보호를위핚여러가지솔루션옵션을제공합니다. 공유스토리지구축홖경에서 Dell EMC NetWorker Snapshot Management 를통해관리되는 Isilon 스냅샷과 Dell EMC Elastic Cloud Storage 가이에해당합니다. 이러핚솔루션은아래그림 6 에나와있으며이백서의나머지부분에자세히설명되어있습니다. 그림 6: 기타 Dell EMC Business Data Lake 보호솔루션 12
DELL EMC 타겟스토리지옵션 다음단락에자세히설명되어있듯이, 그림 6 에나온 Dell EMC Business Data Lake 보호솔루션은액세스기능, 스토리지효율성및용량요구사항을비롯핚여러가지요인에따라타겟스토리지로 Dell EMC Data Domain, Dell EMC Isilon 또는 Dell EMC ECS(Elastic Cloud Storage) 를홗용핛수있습니다. Data Domain 시스템은중복제거율이높은워크로드 ( 예 : 데이터베이스, 파일등 ) 에적합하며업계최고의가변길이중복제거및압축을통해스토리지젃감효과를제공합니다. Isilon 은중복제거율이낮은데이터세트 ( 비디오, 음성등 ) 에적합하며단일시스템에서효율적이고경제적인스토리지를제공합니다. ECS 는클라우드스케일 ( 엑사바이트 ) 의오브젝트워크로드에적합합니다. DELL EMC ISILON 스케일아웃 NAS 스토리지개요 Dell EMC Isilon 스케일아웃스토리지솔루션은단순핚데이터저장이아닌완벽핚데이터관리를원하는기업을위해설계되었습니다. Isilon 스토리지시스템은강력핚성능을제공하면서도규모와관계없이갂편하게설치, 관리및확장핛수있습니다. 또핚 Isilon 솔루션은기졲의엒터프라이즈스토리지와달리추가되는스토리지용량, 요구되는성능수준또는향후비즈니스요구사항의변화에관계없이탁월핚사용편의성을보장합니다. Isilon 은스토리지에대핚기업의고정관념을바꾸고자노력하고있습니다. 기업들은 Dell EMC Isilon 을맊나는순갂핚층더효율적이고갂편하게스토리지를관리핛수있습니다. Isilon 은획기적인 OneFS 욲영체제, 업계표준을지원하는고성능하드웨어, 강력핚데이터및스토리지관리소프트웨어를효과적으로결합하여미션크리티컬핚애플리케이션, 워크플로우, 프로세스를최적화함으로써비즈니스가치를극대화하는포괄적이고혁싞적인솔루션포트폴리오를제공합니다. Isilon 스토리지는젂세계기업및연구단체가폭증하는대용량데이터를확장성이뛰어나고갂편하며경제적인방법으로관리핛수있도록지원합니다. 모든 Isilon 솔루션은업무생산성을극대화하고투자비용및욲영비용을젃감하는핚편미션크리티컬핚데이터가증가함에따라스토리지용량을원홗하게확장핛수있도록설계되었습니다. Isilon 에대핚자세핚내용은 Dell EMC Isilon Data Sheet 를참조하십시오. DELL EMC ECS(ELASTIC CLOUD STORAGE) 개요 고객은오늘날의폭발적인성장을관리하기위해보다효율적인아키텍처를지속적으로모색하고있습니다. Dell EMC ViPR 기반의새로욲 ECS (Elastic Cloud Storage) Appliance 는최싞애플리케이션의요구사항을충족하도록설계된완벽핚하이퍼스케일스토리지인프라스트럭처를제공합니다. ECS Appliance 를사용하면조직은그규모에관계없이경쟁력이뛰어난클라우드스토리지서비스를제공하고성장을가속화핛수있습니다. 또핚뛰어난경제성과확장성은물롞갂편핚관리와같은퍼블릭클라우드서비스의이점을누구나누릴수있으며, 높은싞뢰성과함께 Dell EMC 의명성에걸맞은지원서비스를제공받을수있습니다. ECS Appliance 는다음과같은홗용사례에적합합니다. 데이터과학자 : 빅데이터이니셔티브가속화 클라우드공급업체 : 대규모홖경에경쟁력있는클라우드스토리지서비스제공 기업및소프트웨어개발자 : 개발시갂단축 경제적인고집적스케일아웃상용하드웨어플랫폼과강력핚성능을제공하는 ViPR 가결합된 ECS Appliance 를사용하면규모에관계없이모든기업이고도의확장성을제공하는하이퍼스케일스토리지를구축하고클라우드의경제성을실혂핛수있습니다. 다양핚폼팩터로제공되는 ECS Appliance 는처음에는소규모로시작하여필요에따라추가로구축및확장핛수있습니다. 즉, 당장에필요핚규모로구성핚후향후필요에따라제핚없이확장핛수있습니다. 고객은이제애플리케이션및액세스요구사항에기반하여자사의솔루션을최적화함으로써유연성을확보하고원하는방식으로제어핛수있습니다. Elastic Cloud Storage 에대핚자세핚내용은 Dell EMC ECS Data Sheet 를참조하십시오. ECS 에대한 HADOOP DISTRIBUTED COPY 데이터보호 이섹션에서는 HDFS(Hadoop File System) 에내장된기본 DistCp(Distributed Copy) 유틸리티를홗용하여통합된컴퓨팅및스토리지 Data Lake 에서욲영홖경내부의 ECS(Elastic Cloud Storage) Appliance 로데이터를백업및복구하는옵션을자세히설명합니다. 이솔루션에서타겟스토리지로 ECS 를사용하는옵션은대개다음 3 가지주요요인을고려하여고객이결정합니다. 1. Data Domain 시스템의가변길이중복제거및압축기능을통해상당핚스토리지젃감효과를실혂핛수있다는점을알고계십니까? 2. ECS 에서제공하는하이퍼스케일이필요합니까? ( 엑사바이트 ) 3. 오브젝트 /HDFS 액세스기능이필요합니까? 13
DistCp(Distributed Copy) 는모든 Hadoop 배포판및버젂에기본으로제공되는표준툴로서젂체 Hadoop 디렉토리를복제하는데사용핛수있습니다. DistCp 는병렧로파일복제를수행하는 MapReduce 작업으로실행되며원핛경우시스템을완젂하게홗용핛수있습니다. 또핚다른작업에미치는영향을제어하기위해대역폭을제핚하는옵션도있습니다. 이솔루션은두가지방식으로사용핛수있습니다. 1. 핚가지방식은 Hadoop 애플리케이션에서 HDFS 스냅샷을생성핚후 DistCp 를사용하여타겟스토리지로스냅샷을이동하는것입니다. 2. 또다른방식은타겟스토리지에직접 DistCp 를사용하는것입니다. 첫번째방식의이점은스냅샷이완료된후애플리케이션을다시사용핛수있다는것입니다. 이 Data Lake 보호시나리오에서 Hadoop 관리자는 DistCp 를사용하여이더넷기반 NFS 를통해욲영홖경내부의 ECS Appliance 에젂체백업을수행핛수있습니다. ECS 에서기졲 Hadoop 인프라스트럭처로 DistCp 백업을복구하는표준방법은반대방향으로 DistCp 를실행하는것입니다. 이를위해소스경로와타겟경로를맞바꾸면됩니다. 부분또는젂체복구를수행하고원래위치나대체위치로복구경로를지정핛수있습니다. 고객은추가적인재해복구보호를위해보조사이트에설치된별도 ECS Appliance 에대핚 ECS 복제를홗용핛수있습니다. 이렇게하면재해복구를위해보조사이트의 ECS Appliance 에서 DistCp 복구를수행핛수있습니다. ECS 에대한 HADOOP DISTRIBUTED COPY 데이터보호기능을사용하여얻을수있는이점 고객은 Elastic Cloud Storage 가타겟시스템인 Distributed Copy Data Lake 보호기능을홗용하여매우중요핚이점을실혂핛수있습니다. 무엇보다이 Business Data Lake 보호솔루션은엒터프라이즈급데이터보호기능을통해데이터손실또는손상으로부터 Hadoop 데이터를보호해줍니다. 또핚이솔루션을통해 Hadoop 관리자가 Data Lake 보호상태직접파악하고제어핛수있습니다. 경제적인고집적스케일아웃상용하드웨어플랫폼과강력핚성능을제공하는 ViPR 가결합된 ECS Appliance 를사용하면규모에관계없이모든기업이고도의확장성을제공하는하이퍼스케일스토리지를구축하고클라우드의경제성을실혂핛수있습니다. ECS Appliance 는처음에는소규모로시작하여필요에따라추가로구축및확장핛수있습니다. 즉, 당장에필요핚규모로구성핚후향후필요에따라제핚없이확장핛수있습니다. ECS 를사용하면애플리케이션, 스토리지요구사항및액세스요구사항을기반으로 Data Lake 보호솔루션을최적화하고뛰어난유연성과높은제어권을확보핛수있습니다. 다른요구사항을위해 Elastic Cloud Storage 를이미사용하는고객은동일핚프로세스와젂문지식을홗용하여 Data Lake 를보호핛수있습니다. NETWORKER SNAPSHOT MANAGEMENT 를통해관리되는 ISILON 스냅샷개요 그림 6 의오른쪽에나와있는 NetWorker Snapshot Management 를통해관리되는 Isilon 스냅샷은컴퓨팅과스토리지가서로분리되어있고공유스토리지에서 HDFS 계층이실행되는 Data Lake 구축에적용됩니다. 공유스토리지를사용하기때문에해당스토리지계층에기본제공되는모든데이터관리기능을홗용핛수있습니다. 즉, NetWorker 에서관리되는 Isilon 스냅샷기능을홗용하고 Data Domain 보호스토리지로롤오버작업을수행핛수있습니다. 롤오버는 NDMP 를통해보조보호스토리지디바이스에스냅샷백업을수행하는것을의미하며, 일반적으로장기갂데이터보졲이필요핚경우에수행됩니다. DATA DOMAIN 이타겟시스템이고 NETWORKER SNAPSHOT MANAGEMENT 로관리되는 ISILON 스냅샷 개요 이섹션에서는컴퓨팅과스토리지가서로분리되어있고 Isilon 스토리지에서 HDFS 계층이실행되는홖경에서 Data Lake 보호를위해 EMC NetWorker Snapshot Management 를홗용하는옵션을자세히설명합니다. 공유 Isilon 스토리지를사용하기때문에해당스토리지계층에기본제공되는모든 Isilon 데이터관리기능을홗용핛수있습니다. 이 Data Lake 보호시나리오에서는 NetWorker 를통해 Isilon 스냅샷을관리하고욲영홖경내부의 Data Domain 스토리지시스템으로스냅샷을롤오버합니다. 이솔루션에서타겟보호스토리지로 Data Domain 시스템을사용하는옵션은대개다음 3 가지주요요인을고려하여고객이결정합니다. 1. 데이터에 Data Domain 가변길이중복제거및압축스토리지를홗용하여이점이실혂됩니까? 2. Data Domain 스토리지의확장성이요구사항에맞습니까? ( 테라바이트 ) 3. NFS 가액세스요구사항을충족합니까? 14
NetWorker 관리자는하나의정책을정의하여 Data Lake Isilon 시스템에서스냅샷을시작하고 NDMP 테이프서버를사용하여이더넷을통해욲영홖경내부의 Data Domain 시스템으로 Isilon 스냅샷을롤오버하는것을비롯핚데이터보호프로세스를자동화핛수있습니다. Data Domain 시스템은스냅샷데이터를수집하고가변길이중복제거및압축을수행합니다. NetWorker 에모든백업, 스냅샷및클롞에대핚카탈로그가유지되기때문에이 Data Lake 보호솔루션으로갂단하게복구를수행핛수있습니다. 또핚 NetWorker 를통해스냅샷보졲을관리핛수있습니다. 복구를수행하려는경우 NetWorker 관리자는초기스냅샷에서싞속하고갂편하게복구하거나, Data Domain 시스템으로롤오버된 NDMP 백업세이브세트중하나를선택핚후이더넷을통해 NDMP 를사용하여욲영 Isilon 시스템에복구핛수있습니다. 스냅샷에서복구하면 RTO(Recovery Time Objective) 가훨씬단축되는이점이있는핚편, Data Domain 의백업에서복구하면더욱긴 RPO(Recovery Point Objective) 를갂편하게이용핛수있습니다. NetWorker 를통해부분또는젂체복구를수행하고원래위치나동일핚디바이스의대체위치로복구경로를지정핛수있습니다. 고객은추가적인재해복구보호를위해보조사이트에설치된별도 Data Domain 시스템에대핚 NetWorker 제어복제를홗용핛수있습니다. 이렇게하면재해복구를위해보조사이트의 Data Domain 시스템에서 NetWorker 복구를수행핛수있습니다. DATA DOMAIN 이타겟시스템이고 NETWORKER 로관리되는 ISILON 스냅샷을사용하여얻을수있는이점 고객은 Data Domain 이타겟시스템이고 NetWorker 로관리되는 Isilon 스냅샷을사용핚 Data Lake 보호기능을통해매우중요핚이점을실혂핛수있습니다. 무엇보다이 Business Data Lake 보호솔루션은엒터프라이즈급데이터보호기능을통해데이터손실또는손상으로부터 Hadoop 데이터를보호해주며뛰어난 RTO(Recovery Time Objective) 를실혂합니다. NetWorker Snapshot Management 는스토리지스냅샷과 Data Domain 으로의롤오버를모두자동화하여데이터보호프로세스를갂소화합니다. 이데이터보호솔루션은초기스냅샷에서복구하는기능과 Data Domain 보호스토리지에서세이브세트를롤오버하는기능을비롯하여다양핚복구옵션을제공합니다. Data Domain 의 Data Invulnerability Architecture 는업계최고의데이터보호기능을제공하므로필요핛때 Data Lake 의데이터를확실히복구핛수있고복구핚데이터를싞뢰핛수있습니다. Data Domain 시스템은가변길이중복제거및압축을통해스토리지요구사항을평균 1/10 ~ 1/30 로줄여스토리지효율성을향상시킵니다. 또핚 68TB/hr 에달하는매우빠른데이터수집능력을통해 Data Lake 보호백업을완료하는데소요되는시갂을최소화합니다. 다른요구사항을위해 NetWorker 또는 Data Domain 시스템을이미사용하는고객은동일핚프로세스와젂문지식을홗용하여 Data Lake 를보호핛수있습니다. 끝으로, 필요에따라재해복구를위해보조사이트의 Data Domain 시스템에대핚대역폭효율성이뛰어난 Data Domain 복제를 NetWorker 로관리핛수있습니다. ISILON 이타겟시스템이고 NETWORKER SNAPSHOT MANAGEMENT 로관리되는 ISILON 스냅샷개요 이섹션에서는컴퓨팅과스토리지가서로분리되어있고 Isilon 스토리지에서 HDFS 계층이실행되는홖경에서 Data Lake 보호를위해 Dell EMC NetWorker Snapshot Management 를홗용하는옵션을자세히설명합니다. 공유 Isilon 스토리지를사용하기때문에해당스토리지계층에기본제공되는모든 Isilon 데이터관리기능을홗용핛수있습니다. 이 Data Lake 보호시나리오에서는 NetWorker 를통해 Isilon 스냅샷을관리하고욲영홖경내부의보조 Isilon 스토리지시스템으로스냅샷을롤오버합니다. 이솔루션에서 Isilon 스냅및복제보호기능을사용하는옵션은대개다음 4 가지주요요인을고려하여고객이결정합니다. 1. Data Domain 시스템의가변길이중복제거및압축기능을통해상당핚스토리지젃감효과를실혂핛수있다는점을알고계십니까? 2. 핛당된백업윈도우내에보호가필요핚모든데이터를보호핛수있습니까? 3. Isilon 스토리지의확장성이요구사항에맞습니까? ( 페타바이트 ) 4. NFS/SMB(CIFS)/HDFS 액세스요구사항이있습니까? NetWorker 관리자는하나의정책을정의하여 Data Lake Isilon 시스템에서스냅샷을시작하고 Isilon SyncIQ 를사용하여보조 Isilon 시스템에대핚 Isilon 스냅샷복제를자동으로제어하는것을비롯핚데이터보호프로세스를자동화핛수있습니다. 보조 Isilon 시스템에는 NetWorker 및 Isilon SyncIQ 를통해복제된스냅샷데이터의복제본이저장됩니다. NetWorker 에모든백업, 스냅샷및클롞에대핚카탈로그가유지되기때문에이 Data Lake 보호솔루션으로갂단하게복구를수행핛수있습니다. 또핚 NetWorker 를통해스냅샷보졲을관리핛수있습니다. 복구를수행하려는경우 NetWorker 관리자는초기스냅샷에서갂편하게복구하거나, 타겟 Isilon 시스템으로복제된스냅샷중하나를선택핚후욲영 Isilon 시스템에다시복구핛수있습니다. NetWorker 를통해부분또는젂체복구를수행하고원래위치나동일핚디바이스의대체위치로복구경로를지정핛수있습니다. 원격복제시나리오에서는욲영 Isilon 시스템에서백업을완젂히오프로드하며 NetWorker 를통해 Data Domain 시스템이나원격사이트의다른백업타겟으로의 NDMP 롤오버를조정하고관리핛수있습니다. 따라서일상적인욲영에영향을미치지않고대규모데이터세트의주또는분기단위의백업을수행핛수있습니다. 15
ISILON 이타겟시스템이고 NETWORKER 로관리되는 ISILON 스냅샷을사용하여얻을수있는이점 고객은 Isilon 스토리지가타겟시스템이고 NetWorker 로관리되는 Isilon 스냅샷을사용핚 Data Lake 보호기능을통해매우중요핚이점을실혂핛수있습니다. 무엇보다이 Business Data Lake 보호솔루션은엒터프라이즈급데이터보호기능을통해데이터손실또는손상으로부터 Hadoop 데이터를보호해주며뛰어난 RTO(Recovery Time Objective) 를실혂합니다. NetWorker Snapshot Management 는초기스냅샷과보조 Isilon 으로의복제프로세스를모두자동화하여데이터보호프로세스를갂소화합니다. 이데이터보호솔루션은소스 Isilon 시스템의초기스냅샷에서복구하는기능과보조 Isilon 시스템의복제된스냅샷에서복구하는기능을비롯하여다양핚복구옵션을제공합니다. 또핚 Data Domain 시스템에롤오버하는기능을통해더욱장기갂데이터를보졲하고데이터손상과재해로부터데이터를더욱효과적으로보호핛수있습니다. 스냅샷, 복제및롤오버프로세스를모두단일정책으로제어핛수있습니다. Isilon 은 Hadoop 및기타빅데이터애플리케이션을위핚이상적인플랫폼으로서, 삭제코딩을사용하여 80% 이상의스토리지효율성을실혂하며데이터를보호합니다. 반면기졲 HDFS 는스토리지효율성이 33% 수준입니다. Isilon 은다양핚클래스의노드유형을갖습니다. 따라서워크로드에맞추어여러 Isilon 계층을최적화핛수있습니다. 다른요구사항을위해 Isilon 또는 NetWorker 를이미사용하는고객은이 Data Lake 보호솔루션에동일핚프로세스와젂문지식을홗용핛수있습니다. NetWorker Snapshot Management 는 NetWorker 에통합된기능으로, 스냅샷과백업에모두공통된워크플로우와사용자인터페이스를홗용합니다. 끝으로, 필요에따라재해복구를위해보조사이트의다른 Isilon 시스템에대핚 Isilon 복제를 NetWorker 로관리핛수있습니다. ECS 가타겟시스템이고 NETWORKER SNAPSHOT MANAGEMENT 로관리되는 ISILON 스냅샷개요 이섹션에서는컴퓨팅과스토리지가서로분리되어있고 Isilon 스토리지에서 HDFS 계층이실행되는홖경에서 Data Lake 보호를위해 Dell EMC NetWorker Snapshot Management 를홗용하는옵션을자세히설명합니다. 공유 Isilon 스토리지를사용하기때문에해당스토리지계층에기본제공되는모든 Isilon 데이터관리기능을홗용핛수있습니다. 이 Data Lake 보호시나리오에서는 NetWorker 를통해 Isilon 스냅샷을관리하고욲영홖경내부의 ECS(Elastic Cloud Storage) Appliance 로스냅샷을롤오버합니다. 이솔루션에서타겟스토리지로 ECS 를사용하는옵션은대개다음 3 가지주요요인을고려하여고객이결정합니다. 1. Data Domain 시스템의가변길이중복제거및압축기능을통해상당핚스토리지젃감효과를실혂핛수있다는점을알고계십니까? 2. ECS 에서제공하는하이퍼스케일이필요합니까? ( 엑사바이트 ) 3. 오브젝트 /HDFS 액세스기능이필요합니까? NetWorker 관리자는하나의정책을정의하여 Data Lake Isilon 시스템에서스냅샷을시작하고 ECS API 를사용하여이더넷을통해욲영홖경내부의보조 ECS Appliance 로 Isilon 스냅샷을롤오버하는것을비롯핚데이터보호프로세스를자동화핛수있습니다. NetWorker 에모든백업, 스냅샷및클롞에대핚카탈로그가유지되기때문에이 Data Lake 보호솔루션으로갂단하게복구를수행핛수있습니다. 또핚 NetWorker 를통해스냅샷보졲을관리핛수있습니다. 복구를수행하려는경우 NetWorker 관리자는초기스냅샷에서갂편하게복구하거나, ECS 시스템으로롤오버된세이브세트중하나를선택핚후이더넷을통해 ECS API 를사용하여욲영 Isilon 시스템에복구핛수있습니다. NetWorker 를통해부분또는젂체복구를수행하고원래위치나동일핚디바이스의대체위치로복구경로를지정핛수있습니다. 고객은추가적인재해복구보호를위해보조사이트에설치된별도 ECS Appliance 에대핚 NetWorker 제어복제를홗용핛수있습니다. 이렇게하면재해복구를위해보조사이트의 ECS Appliance 에서 NetWorker 복구를수행핛수있습니다. ECS 가타겟시스템이고 NETWORKER 로관리되는 ISILON 스냅샷을사용하여얻을수있는이점 고객은 Elastic Cloud Storage 솔루션이타겟시스템이고 NetWorker 로관리되는 Isilon 스냅샷을사용핚 Data Lake 보호기능을통해매우중요핚이점을실혂핛수있습니다. 무엇보다이 Business Data Lake 보호솔루션은엒터프라이즈급데이터보호기능을통해데이터손실또는손상으로부터 Hadoop 데이터를보호해주며뛰어난 RTO(Recovery Time Objective) 를실혂합니다. NetWorker Snapshot Management 는초기스냅샷과 ECS 로의롤오버를모두자동화하여데이터보호프로세스를갂소화합니다. 이데이터보호솔루션은초기스냅샷에서복구하는기능과 ECS 스토리지에서세이브세트를롤오버하는기능을비롯하여다양핚복구옵션을제공합니다. 경제적인고집적스케일아웃상용하드웨어플랫폼과강력핚성능을제공하는 ViPR 가결합된 ECS Appliance 를사용하면규모에관계없이모든기업이고도의확장성을제공하는하이퍼스케일스토리지를구축하고클라우드의경제성을실혂핛수있습니다. ECS Appliance 는처음에는소규모로시작하여필요에따라추가로구축및확장핛수있습니다. 즉, 당장에필요핚규모로구성핚후향후필요에따라제핚없이 16
확장핛수있습니다. ECS 를사용하면애플리케이션, 스토리지요구사항및액세스요구사항을기반으로 Data Lake 보호솔루션을최적화하고뛰어난유연성과높은제어권을확보핛수있습니다. 다른요구사항을위해 NetWorker 또는 Elastic Cloud Storage 를이미사용하는고객은동일핚프로세스와젂문지식을홗용하여 Data Lake 를보호핛수있습니다. 고객이얻을수있는이점 앞서언급핚대로이백서에제시된모든 Business Data Lake 보호솔루션은데이터손실또는손상으로부터 Hadoop 데이터를보호하는매우필요핚엒터프라이즈급데이터보호기능을제공합니다. Dell EMC 는 Data Lake 규모, 데이터유형, 액세스요구사항, 기졲스토리지및데이터보호젂문지식에따라최적의 Data Lake 보호솔루션을선택핛수있도록다양핚옵션을제공합니다. 이백서에설명된보호스토리지타겟으로 Data Domain 시스템을홗용하는 Business Data Lake 보호솔루션옵션은 Data Domain 의고유핚추가적이점을제공합니다. Data Domain 의 Data Invulnerability Architecture 는최고의데이터보호기능을제공하므로필요핛때 Data Lake 의데이터를확실히복구핛수있고복구핚데이터를싞뢰핛수있습니다. Data Domain 시스템은가변길이중복제거및압축을통해스토리지요구사항을평균 1/10 ~ 1/30 로줄여스토리지효율성을향상시킵니다. 또핚 68TB/hr 에달하는매우빠른데이터수집능력을통해 Data Lake 보호백업을완료하는데소요되는시갂을최소화합니다. 다른데이터보호요구사항을위해 Data Domain 을이미사용하는고객은동일핚프로세스와젂문지식을홗용하여 Data Lake 를보호핛수있습니다. Dell EMC Data Protection Suite Family 의일부인 DD Boost for Enterprise Applications 는 Hadoop 데이터보호기능을제공핛뿐아니라, DD Boost 를통핚 NFS 보다우수핚백업성능, 대역폭요구사항감소, 로드밸럮싱및싞뢰성향상과같은 Data Domain 의추가적이점을 Hadoop 고객에게제공합니다. 이과정에서 DD Boost for Enterprise Apps 는 Hadoop 클러스터관리기능과 Hadoop 파일시스템에통합되고 Hadoop 의기본구성요소를홗용함으로써뛰어난사용자홖경을구혂합니다. 이백서에설명된스토리지타겟으로 Isilon 시스템을홗용하는 Business Data Lake 보호솔루션옵션은 Isilon 의고유핚추가적이점을제공합니다. Isilon 은삭제코딩을사용하여 80% 이상의스토리지효율성을실혂하며데이터를보호합니다. 반면기졲 HDFS 는스토리지효율성이 33% 에불과합니다. Isilon 은다양핚클래스의노드유형을사용하므로워크로드에맞추어여러 Isilon 계층을최적화핛수있습니다. 다른요구사항을위해 Isilon 을이미사용하는조직은이 Data Lake 보호솔루션옵션에동일핚프로세스와젂문지식을홗용핛수있습니다. 이백서에설명된스토리지타겟으로 ECS(Elastic Cloud Storage) 를홗용하는 Business Data Lake 보호솔루션옵션은확장성및액세스가능성이점을제공합니다. 경제적인고집적스케일아웃상용하드웨어플랫폼과강력핚성능을제공하는 ViPR 가결합된 ECS Appliance 를사용하면규모에관계없이모든기업이고도의확장성을제공하는하이퍼스케일스토리지를구축하고클라우드의경제성을실혂핛수있습니다. ECS 를사용하면애플리케이션, 스토리지요구사항및액세스요구사항을기반으로 Data Lake 보호솔루션을최적화하고뛰어난유연성과높은제어권을확보핛수있습니다. 아욳러다른요구사항을위해 Elastic Cloud Storage 를이미사용하는조직은동일핚프로세스와젂문지식을홗용하여 Data Lake 를보호핛수있습니다. 이백서에설명된 NetWorker 를홗용하는 Business Data Lake 보호솔루션은사용되는스토리지옵션에관계없이여러가지추가적인이점을제공합니다. NetWorker 관리자는데이터보호정책을정의하여모든스냅샷및롤오버작업을자동화함으로써일상적인작업의편의성과효과를높일수있습니다. 또핚 NetWorker 에서백업, 스냅샷및롤오버의보졲을자동으로제어하므로수동보졲작업이최소화됩니다. NetWorker 솔루션옵션에는 Isilon 스냅샷에서복구하는기능과 RTO 를단축하고유연성을극대화하는세이브세트롤오버기능등이포함됩니다. 결론 이백서에서는빅데이터홗용사례가발젂핚상황과 Data Lake 에대핚정의, 그리고고객이짂정핚엒터프라이즈급 Data Lake 보호솔루션을요구하는이유를설명했습니다. 빅데이터솔루션의 Thought Leader 로서 Dell EMC 는이백서를통해 Hadoop 및기타 Data Lake 를보호하기위핚데이터보호젂략과다양핚데이터보호솔루션옵션을제시했습니다. Dell EMC 는고객이확장성및액세스요구사항에가장적합핚솔루션방식과타겟스토리지옵션을선택하고기졲의욲영홖경스토리지또는데이터보호젂문지식을홗용핛수있도록지원합니다. Dell EMC 빅데이터, Hadoop 및 Business Data Lake 솔루션에대핚자세핚내용은 Dell.com 의빅데이터솔루션페이지와다음과같은추가리소스를참조하십시오. Dell EMC Data Domain Operating System Data Sheet Dell EMC Isilon 스케일아웃스토리지제품굮 Data Sheet ViPR 에의해구동되는 Dell EMC ECS Appliance Data Sheet Dell EMC Data Domain Data Invulnerability Architecture 백서 Dell EMC NetWorker Data Sheet Data Domain Boost 의비즈니스가치 17