Sep 2018 사례로알아보는컨테이너기반딥러닝구축방안 HPE Pointnext
Agenda 디지털변혁에따른산업동향 딥러닝을위한플랫폼 고객적용사례 트랜스포메이션을위한다음단계 2
디지털변혁에따른산업동향
Digital Transformation 은 4 차산업으로의진화과정모든산업은이전보다더복잡하고빠른변화에적응해야하는도전에직면하고있음 Much More Complex Industry 1.0 증기기관기계생산설비 Industry 2.0 전기에너지대량생산 Digital Transformation Industry 3.0 전자공학정보기술 (IT) 생산자동화 Industry 4.0 18c 말 20c 초 1970 년대초 today 물리 + 가상인공지능 (AI) 로봇기술생명과학 Much Faster 4 차산업은인공지능, 로봇기술, 생명과학이주도하는차세대산업환경 물리환경과가상환경이정보통신기술 (ICT) 를통해유기적으로연계됨 이전보다더욱빠르고복잡한변화가진행되고있고, 산업의경계가무너지고있음 4
Digital Transformation 은비즈니스혁신의핵심전략신규비즈니스모델, 제품및서비스개발을위해클라우드, 빅데이터등디지털역량을적극활용 Digital Transformation: Better Customer Experience New Business Models 고객과시장의외부에코시스템에서일어나고있는 거대한변화에적응하거나이를주도하기위하여 새로운비즈니스모델, 제품및서비스를창출하는데 클라우드, 모빌리티, 빅데이터등의디지털역량을 효과적으로활용할수있도록하는지속적인과정 The continuous process by which enterprises adapt to or drive disruptive changes in their customers and markets (external ecosystem) by leveraging digital competencies to create new business models, products, and services (source: IDC) Digital Business Platform Cloud Mobility Big Data Social Higher Operational Excellency 5
데이터분석과이해는 Digital Transformation 을가속보다개선되고강화된데이터분석역량을통해라이프스타일과비즈니스방식을혁신적으로변화 고객경험증대제품및서비스개선비즈니스프로세스최적화 모바일을통한개인화되고실시간으로이루어지는통찰력 복잡하고다양한데이터들에대한관계이해 산업현장및비즈니스데이터를이용한미래예측 6
딥러닝은혁신과차별화를이루기위하여빠르게확산중대량의데이터에대한이해및통찰력을바탕으로다양한산업에서 use case 를만들어내고있음 글로벌 IT 리더들이딥러닝에대한발전점화및촉진은물론서비스로도제공 딥러닝에대한산업별 use case 개발을통해혁신을이루고있으며지속확산 Image Video Data Speech Text Sensor Security 헬스캐어 : 암진단을위한조직분류 석유가스 : 정유시설에대한이상및침입탐지 농업 : 데이터분석을통한작업질병감지 제조 : 물류창고에서음성으로부품피킹 미디어 : 영화리뷰에대한감성분석 운송 : 사고예방을위한정비시기예측 금융 : 사기감지등을통한위험완화 7
Deep Learning 도결국서비스형태로제공필요딥러닝등데이터분석기술을이용한서비스를개발하고활용하는역량이요구되고있음 Telecom Healthcare Industrial Service Building & Construction 딥러닝은다양한데이터를이해하고해석하는데이터처리및분석기술임 데이터분석결과는어플리케이션을통해비즈니스목적에맞게사용할수있어야함 Mfg & Distribution Deep Learning Data Aerospace 어플리케이션서비스를보다빨리출시하고자원효율적으로운영할수있어야함 Financial Education Entertainment & Media 개발자들이인프라환경이나개발환경보다는서비스개발자체에집중할수있어야함 개발된서비스는필요에따라다양한인프라환경에서즉시실행가능해야함 8
DX 에따른어플리케이션개발패러다임변화오픈소스솔루션활용이커지고지속적인개발및운영이중요해지며보다유연한인프라로전환 오픈소스, 마이크로서비스 Innovative Digital Agile Development, CI/CD & DevOps 디지털트랜스포메이션 Sprint Sprint Sprint Dev Ops Agile 소프트웨어정의인프라 Flexible 9
어플리케이션아키텍처의변화변화에보다민첩하고유연하게대응할수있는서비스아키텍처필요 10
딥러닝플랫폼 Container, GPU, DL Frameworks
컨테이너란무엇인가? 어플리케이션을위한경량화되고 (light-weight) 독립된 (isolated) 구동환경 Physical Environment Container Environment Hypervisor Environment APP APP User Space APP User Space APP User Space APP APP OS APP OS Kernel Kernel VM VM OS Hardware OS Hardware Hypervisor Hardware 컨테이너는사용자공간들을격리시키고사용자프로세스별로독립된 OS 자원을제공함으로써자원효율을개선하며, 기존가상화를위한하이퍼바이저대비적은자원을소비함 컨테이너환경은가상화환경처럼런타임을위해 OS 전체가필요하지않기때문에가상화대비보다경량화된어플리케이션운영환경이며, 이로인해보다빨리배포되고재기동될수있음 12
Millions 컨테이너와 Hypervisor 간성능비교 Hypervisor 와 guest OS 로인한 overhead 가없어보다빠른기동이가능하고네트워크성능은유사하나보다적은자원을점유함 Start up time (s) Packet per Seconds Memory Footprint (MB) 25 20 21.45 35 30 Host Container KVM 140 120 100 125 15 10 5 1.34 25 20 15 10 5 80 60 40 20 17 0 Container KVM 0 Direct Fwd L2 Fwd L3 Fwd 0 Container KVM 256MB 16 배빠른 start up Guest OS 구동불필요 베어메탈, 컨테이너, KVM 의세환경모두유사한성능제공 KVM 256MB 대비약 15% 수준의메모리점유 Source: Container and Kernel-Based Virtual Machine (KVM) Virtualization for Network Function Virtualization (NFV), Intel White Paper 13
컨테이너도입동향컨테이너기술은이미다양한어플리케이션의운영환경에적용되어보안, 성능등의효익을실현 중요또는핵심어플리케이션들의운영환경에컨테이너적용 신규는물론기존어플리케이션이전을통해컨테이너적용 컨테이너를통해보안, 운영성, 가용성, 성능, 확장성등이개선 전반적으로적용 제한적으로적용 12 개월내에적용계획 계획없음 모름 0% 20% 40% 60% 80% 100% Are any of your "tier 1" mission- or business-critical applications running in containers today? 기존어플리케이션 신규어플리케이션 0% 10% 20% 30% 40% 50% 60% What percentage of your containerized applications are existing applications migrated to a container (from a VM or bare metal) versus a new application that started in a container from day 1? 보안강화 관리및운영개선 가용성향상 성능향상 확장성개선 개발자생산성향상 개발속도증대 단종 OS 에서 App 이전 Cloud-native App 개발 이동성 0% 10% 20% 30% 40% What are the top benefits your organization realized from containers? Source: The Rise of the Enterprise Container Platform, IDC 2018 14
컨테이너효익신속한개발환경제공, 표준화, 이식성및자원운영효율성등에걸쳐효익을제공하고있음 15
Container Orchestration 상호연계되는다수의컨테이너를체계적으로관리하여서비스가적절하게동작하도록관리 Key Features Docker Enterprise (Swarm) Mesosphere DC/OS (Marathon) kubernetes Container Grouping X O O Container Scale out O O O Container Autoscaling #1 O O Re-deploy failed container O O O HTTP load balancer #2 O O Communication two containers between hosts O O O Monitoring resources on hosts O O O Managing resources allocation on hosts O O O Web UI O O O GPU Scheduling X O #3 The latest information might be updated. #1 Need to customize with a third party monitoring tool #2 Need to use external load balancer such as HAProxy or Third party HW load balancer #3 Experimental support 16
GPU 가속을통한데이터처리병목해결 CPU 대비대량의코어로병렬처리하는 GPU 가대량데이터처리와고성능 compute 을지원 수천개의코어를가진 GPU 는범용의 CPU 가하나의작업을최대한빨리처리하는것에비해병렬적으로유사작업들을반복처리하는데효율적이기때문에대량의데이터를필요로하는 compute 집중적인워크로드에보다적합 CPU 기반디바이스당 8 ~ 32 개코어대비 GPU 는디바이스당 4,000 개이상의코어제공 전체데이터스캔을위해서는병렬처리가이상적 대량데이터처리문제를해결하기위해 HPC 에서 GPU 사용증가 GPU 가속이고성능의 compute 을지원 17
GPU 의데이터처리성능은계속증가데이터증가속도보다더빠르게 GPU 성능이증가하고있고연산능력과메모리 B/W 는 CPU 압도 18
딥러닝서비스도컨테이너환경에서구현가능고가의고성능 GPU 서버를 Data Scientist 와개발자에게탄력적으로제공하고효율적으로관리 Generic containers GPU-allocated containers Mesosphere DC/OS 1 2 1 Caffe TensorFlow CUDA Toolkit 딥러닝을위한 GPU 서버와기존 CPU 만설치된서버를통합관리 딥러닝서비스에따라 GPU 자원에대한동적인배치 컨테이너의서비스격리와경량화로인한성능향상등의효익실현 CPU-only servers GPU-enabled servers CUDA Driver GPU Host OS 고가의 GPU 서버자원을보다비용효율적으로활용극대화 패키징된서비스는 on premise 환경은물론 public cloud 에서도실행가능 19
고객적용사례
고객사례 #1: GPU 컨테이너기반 Deep Learning 컨테이너를통해다양한분석 needs 를지원하는것과동시에자원의효율적활용지원 Cloud Portal 사용자관리 포탈사용자관리 LDAP 연계 Role 기반권한관리 서비스관리 카탈로그관리 컨테이너수명주기관리 컨테이너서비스내역및이력관리 서비스신청관리 컨테이너서비스카탈로그조회 컨테이너서비스사용신청 서비스접근관리 Workflow 관리 결재절차관리 신청승인 / 반려 / 수정승인 자원관리 시스템정보관리 전체클러스터자원모니터링 컨테이너운영현황모니터링 코드관리 시스템사양및메타정보관리 기준정보및공통코드관리 Repository (container images) Monitoring Mesosphere DCOS CPU Servers GPU Servers Master TensorFlow PYTORCH Grafana DCOS Universe (App Store) R Studio container Spark container TensorFlow container PYTORCH container R Spark Prometheus CAdvisor Container Orchestrator Router Zeppelin container Jupyter container Zeppelin DNS DCOS Private Agent Docker Engine DCOS Private Agent Docker Engine Docker Engine CUDA 9 21
효율적인 Deep Learning 개발환경제공 사용자가빠르게 Deep Learning/ 빅데이터코드개발을착수할수있는개발환경제공 다양하고복잡한 Data Scientist 개발환경을수초내에제공 사용자 GPU 용이미지 CPU 용이미지 22
Container 기반 Deep Learning 플랫폼기술아키텍처다양한 Deep Learning 을위한 GPU 자원및 framework 들의 on-demand 지원 X 1 X 3 Bootstrap Master DCOS Master DCOS CLI tool Mesosphere Installer Docker Engine NTP RHEL 7.4 4vCore, 8GB RAM, 100GB HDD 가상화환경 DCOS Universe Mesos Mater Process Mesos DNS DCOS Marathon Admin Router Docker Engine NTP RHEL 7.4 8vCore, 32GB RAM, 150GB HDD X 1 Local Repository Nexus (Apt-get repo, Yum repo, Docker repo, Maven repo) 2vCore, 4GB RAM, 200GB HDD Docker Engine Host RHEL 7.4 CPU servers (workload, service) X 1 Cloud Portal server Cloud Portal Web App. Apache HTTP Server Tomcat 9 JDK 1.8 (JVM) MariaDB RHEL 7.4 6vCore, 16GB RAM, 200GB HDD VSphere DL380 Gen9 X 2 CPU Workload DCOS Private agent Docker Engine NTP RHEL 7.4 X 1 Monitor server Grafana Prometheus CAdvisor Docker Engine Netdata RHEL 7.4 6vCore, 16GB RAM, 200GB HDD GPU servers (workload) X 5 DCOS Private Agent Containers with Tensorflow/Pytorch /JupyterR/Rstudio DCOS Private agent Docker Engine NTP CUDA 9 NVIDIA Driver RHEL 7.4 Hosts Apollo 6500 with P100 x8 DL380 Gen9 GPU P100 x2 23
고객사례 #2: Firmware 개발플랫폼의컨테이너전환 SK Hynix 는컨테이너기반으로플랫폼전환으로보다혁신적인개발플랫폼확보 As-Is Architecture To-Be Architecture Custom Server (Test Management) N nodes (Dell) VM nodes Custom Server (Test Management) Container nodes Smallsized VM Smallsized VM Smallsized VM Custom Agent Custom Agent Custom Agent Largesized VM Custom Agent Smallsized VM Smallsized VM Smallsized VM Custom Agent Custom Agent Custom Agent Largesized VM Custom Agent Public Agent Linux Agent Master #2 Master #3 Custom Agent Custom Agent Largesized Container Smallsized Container Smallsized VM Custom Agent Smallsized VM Custom Agent Bootstrap Master #1 Custom Agent Smallsized Container VMWare vsphere VMWare vsphere VMWare vsphere VMWare vsphere VMWare vsphere Windows Server 2016 Vmware 기반환경 (VM only) 기존테스트관리시스템의코드변경없이 Hybrid 환경 (VM + Container) 으로전환 레거시서버는 Mesosphere 클러스터로마이그레이션 24
Docker for Windows 기술아키텍처 Firmware 테스트를위한 Windows Container 를기존 Legacy 환경에통합 Test Server Test Server Perforce Python Windows 7 CNM (Container Network Model) 기반 Transparent 네트워크통신 Inside of Docker for Windows Docker Firmware Test2 Firmware Test1 Test Agent Perforce Python Windows Coreserver x1 x3 Bootstrap Master Pubic Agent Mesosphere Installer Docker Engine NTP RHEL 7.3 4Core, 16GB RAM, 100GB HDD Zookeeper Mesos Mater Process Mesos DNS DCOS Marathon Admin Router Docker Engine NTP RHEL 7.3 8Core, 32GB RAM, 210GB HDD Mesos Containerizer Docker Engine NTP RHEL 7.3 8Core, 16GB RAM, 160GB HDD Private Linux Agent Mesos Containerizer Docker Engine NTP RHEL 7.3 8Core, 16GB RAM, 160GB HDD Docker for Windows Windows Agent Docker for Windows Docker for Windows Mesos Agent Mesos Containerizer + Mesos Library GIT Gnu Patch MS Build CMake Visual Studio Community 2017 Docker Engine Hyper-V NTP Windows Server 2016 Docker for Windows DL360 32Core, 640GB RAM, 600GB HDD x 6, 480GB SSD x 2, 10G NIC x 2 25
컨테이너기반개발환경을통해 Do More With Less 을실현함 테스트용량증대 x4 자원효율개선 기존가상화기반소프트웨어테스트환경을보다자원효율적인환경으로개선 테스트성능향상 X3 개발생산성향상 고성능의환경을제공하여보다많은프로젝트를지원하고테스트 lead time 단축 운영비용절감 30% Less $ $ 비용효율화 기존가상화환경대비보다개선된환경을보다적은비용으로운영 26
고객사례 #3: 컨테이너기반하이브리드데이터센터실현 Autodesk 는 DC/OS 를이용하여자원효율개선은물론개발효율향상과비용절감달성 자원효율개선데이터센터인프라자원활용도를극대화하면서보다비용효율적인운영필요 데이터센터추상화하이브리드데이터센터전략에따라, 인프라추상화와함께서비스가보다유연하게배포되고다양한인프라에서실행될수있는플랫폼필요 개발효율증대컨테이너기반인프라환경에서 CI/CD 프로세스를표준화함으로써보다신속한업데이트배포와서비스개발을위한개발자경험단순화필요 운영비용 57% 절감 새로운서비스배포에다운타임없이 40 초소요 서비스 100% uptime 유지 27
트랜스포메이션을위한다음단계
어플리케이션과서비스를위한새로운플랫폼보다효율적이고안정적인플랫폼을통하여어플리케이션과서비스개발및운영환경고도화 비즈니스와 IT 를보다개선할수있는기회가있습니다 웹서비스, 빅데이터분석, Deep Learning 등을위한다양한개발및운영환경의신속한제공 보다비용효율적으로어플리케이션과서비스들의운영안정성및성능개선 환경변화에보다민첩한비즈니스및 IT 대응을위한 CI/CD 와 DevOps 전환촉진 Container as a Service (CaaS) for Application and Services 29
HPE Workload Modernization Services Consulting Services Overview Readiness & Roadmap Architecture & Design Integration Services Run Services 어플리케이션진단, 클라우드전환전략및실행계획수립 어플리케이션전환을위한아키텍처및상세구축계획수립 어플리케이션전환및관련시스템과의통합구축 혁신의지속과안정적어플리케이션운영지원 30
Thank you