Cloudera Toolkit (Dark) 2018

Similar documents
Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

PowerPoint 프레젠테이션

How To Use This Deck

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>

PowerPoint 프레젠테이션

레드햇과 오픈스택 Feb, 2014 Kim Yong Ki Solution Architect Red Hat Korea RED HAT ENTERPRISE LINUX OPENSTACK PLATFORM 2014

Intro to Servlet, EJB, JSP, WS

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

슬라이드 1

서현수

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

vm-웨어-01장

gcp

PowerPoint Presentation

PowerPoint 프레젠테이션

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

PowerPoint Presentation

PowerPoint Presentation

OUR INSIGHT. YOUR FUTURE. Disclaimer Presentation ( ),. Presentation,..,,,,, (E).,,., Presentation,., Representative.( ). ( ).

[Brochure] KOR_TunA

PowerPoint Presentation

PowerPoint 프레젠테이션

1 전통 소프트웨어 가. ERP 시장 ERP 업계, 클라우드 기반 서비스로 새로운 활력 모색 - SAP-LGCNS : SAP HANA 클라우드(SAP HEC)를 통해 국내 사례 확보 및 아태 지역 진 출 추진 - 영림원 : 아시아 클라우드 ERP 시장 공략 추진 - 더

PowerPoint 프레젠테이션

[Brochure] KOR_LENA WAS_

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론


Portal_9iAS.ppt [읽기 전용]

ecorp-프로젝트제안서작성실무(양식3)

PCServerMgmt7

Windows Live Hotmail Custom Domains Korea

istay

PowerPoint Presentation

PowerPoint Presentation

Tech Trends 클라우드 버스팅의 현주소와 과제 아직 완벽한 클라우드 버스팅을 위해 가야 할 길이 멀지만, 하이브리드 클라우드는 충분한 이점을 가져다 준다. Robert L. Scheier Networkworld 매끄러운 클라우드 버스팅(Cloud Bursting


김기남_ATDC2016_160620_[키노트].key

슬라이드 1

Red Hat Solution 및 Cloud Aug 26, 2011 Won Young Choi Solution Architect 1

aws

<BCBCBBF3C0BB20B9D9B2D9B4C220C5ACB6F3BFECB5E520C4C4C7BBC6C3C0C720B9CCB7A128BCF6C1A4295F687770>


쿠폰형_상품소개서

IBMDW성공사례원고

슬라이드 1

PowerPoint 프레젠테이션

PowerPoint Presentation

Azure Stack – What’s Next in Microsoft Cloud

Microsoft Word - 조병호

Service-Oriented Architecture Copyright Tmax Soft 2005

Multi Channel Analysis. Multi Channel Analytics :!! - (Ad network ) Report! -! -!. Valuepotion Multi Channel Analytics! (1) Install! (2) 3 (4 ~ 6 Page

Microsoft PowerPoint - chap01-C언어개요.pptx

목순 차서 v KM의 현황 v Web2.0 의 개념 v Web2.0의 도입 사례 v Web2.0의 KM 적용방안 v 고려사항 1/29

Microsoft Word - s.doc

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named)

HTML5* Web Development to the next level HTML5 ~= HTML + CSS + JS API

TTA Journal No.157_서체변경.indd

Cloudera Toolkit (Dark) 2018

I What is Syrup Store? 1. Syrup Store 2. Syrup Store Component 3.

<353020B9DAC3E1BDC42DC5ACB6F3BFECB5E520C4C4C7BBC6C3BFA1BCADC0C720BAB8BEC820B0EDB7C1BBE7C7D7BFA120B0FCC7D120BFACB1B82E687770>

PowerPoint 프레젠테이션

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

RUCK2015_Gruter_public

PowerPoint Presentation

빅데이터_DAY key

The Self-Managing Database : Automatic Health Monitoring and Alerting

Data Industry White Paper

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

Microsoft PowerPoint - 권장 사양

SANsymphony-V

세션 3 (오이식).ppt

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

슬라이드 1

DE1-SoC Board


IT & Future Strategy 보고서 는 21세기 한국사회의 주요 패러다임 변화를 분석하고 이를 토대로 미래 초연결 사회의 주요 이슈를 전망, IT를 통한 해결 방안을 모색하기 위해 한국정보화진흥원 (NIA) 에서 기획, 발간하는 보고서입니 다. NIA 의 승인

PowerPoint 프레젠테이션

Cloud Friendly System Architecture

Model Investor MANDO Portal Site People Customer BIS Supplier C R M PLM ERP MES HRIS S C M KMS Web -Based

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

github_introduction.key

J2EE & Web Services iSeminar

PowerPoint 프레젠테이션

IBM Cloud Private 온프레미스장점과클라우드장점을모두살린신개념클라우드 - 퍼블릭클라우드의파워를방화벽내기업데이터센터로확장 - 컨테이너, 마이크로서비스아키텍처, 오픈소스기반으로클라우드네이티브앱개발및기존앱현대화 - 완벽한하이브리드환경지원 (Private Cloud

Sun Java System Messaging Server 63 64

비디오 / 그래픽 아답터 네트워크 만약에 ArcGolbe를 사용하는 경우, 추가적인 디스크 공간 필요. ArcGlobe는 캐시파일을 생성하여 사용 24 비트 그래픽 가속기 Oepn GL 2.0 이상을 지원하는 비디오카드 최소 64 MB 이고 256 MB 이상을 메모리


untitled

Click to edit Master text styles Second level Third level Agenda Fourth level 클라우드서비스살펴보기 - 클라우드서비스현황 - 클라우드서비스운영자동화의필요성 시스코클라우드관리솔루션 - Cisco Cloud St

±èÇö¿í Ãâ·Â

RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1

슬라이드 1

Samsung SDS Enterprise Cloud Networking CDN Load Balancer WAN

PowerPoint Presentation

API STORE 키발급및 API 사용가이드 Document Information 문서명 : API STORE 언어별 Client 사용가이드작성자 : 작성일 : 업무영역 : 버전 : 1 st Draft. 서브시스템 : 문서번호 : 단계 : Docum


歯이시홍).PDF

항목

2018_ifkakao_cloud_andrew_final

Transcription:

BUILD BIG DATA ANALYSIS CONTAINERS FOR DATA SCIENTISTS 굿모닝아이텍 / 김도은이사

END-TO-END ENTERPRISE GRADE SOLUTIONS FOR IOT Sensors, Actuators, Data Sources Edge Processing & Analytics Data Integration, Routing, Device Command/Control Advanced Analytics & Machine Learning Application Development, Deployment, Integration CONNECTED THINGS IoT GATEWAYS IoT INTEGRATION HUB ENTERPRISE APPLICATIONS Telemetry Data Telemetry Data Application Data Enterprise Data Hub 2

AGENDA 1. BACKGROUND AND OBJECTIVES 2. 시스템환경구성 3. DATA SCIENTIST 컨테이너환경구축 4. CONTAINER BENEFIT 5. WRAP UP 3

BACKGROUND & OBJECTIVES 4

BACKGROUND & OBJECTIVES 데이터분석가 다양한 Language, 라이브러리, 툴, 버전 요구리소스 (CPU, GPU, MEM) 사양다양 협업 운영팀 분석가별다양한환경에대한셋업 리소스효율적운영 Control, Monitoring CONTAINER APPLICATION LIFECYCLE MANAGEMENT CONTAINER ORCHESTRATION AND MANAGEMENT (KUBERNETES) Business Agility 확보 효율적인리소스활용, 운영용이성충족 5

시스템환경구성 6

시스템구성도 (H/W, S/W) Master 1ea Node 2ea Infra 1ea DNS/NFS 1ea PaaS 솔루션 Red Hat Openshift - 엔터프라이즈환경컨테이너어플리케이션플랫폼 API/Authentication Data Store Scheduler Management Replication Application Node Router Metrics EFK DNS Server Registry Server NFS Server RHEL VM RHEL VM RHEL VM RHEL VM PV Cloud Forms Data Analytics Applications Rstudio : 통계컴퓨팅, 그래픽스언어인 R 개발환경 Jupyter/Tensorflow : 딥러닝 / 머신러닝엔진및환경 Jupyterhub : Jupyter 환경다중사용자관리 Hypervisor Registry Private Git Service (GOGS) 운영관리 Red Hat Cloudforms - 통합운영관리모니터링시스템 7

DATA SCIENTIST 컨테이너환경구축 8

데이터분석컨테이너 LIFECYCLE 빅데이터 (Raw Data) 데이터가공 데이터분석 분석모델 HIVE Rstudio Jupyter Notebook/ Tensor Flow Data Model GIT 데이터분석가 빅데이터분석 데이터분석시스템사용요청 승인 Self service 데이터분석및가공 데이터분석시스템회수요청 시스템운영자 통보 데이터분석시스템변경관리 컨테이너자동배포 승인 데이터분석시스템회수 9

DOCKER, CONTAINER 컨테이너 = 프로세스를격리하여가상환경처럼사용 역사 2013 PyCon, 솔로몬하익스, The future of Linux Containers 발표 (https://www.youtube.com/watch?v=ww9cah9nsls) 정의 컨테이너기반의오픈소스가상화플랫폼 컨테이너 라는표준화된유닛으로소프트웨어를패키징. 컨테이너 에는라이브러리, 시스템도구, 코드, 런타임등소프트웨어를실행하는데필요한모든것이포함됨 애플리케이션을신속하게구축, 테스트및배포할수있는소프트웨어플랫폼 10

DOCKER HISTORY 2008 년솔로몬하익스 (Solomon Hykes) dotcloud 설립 ( 언어중립적인 PaaS 제공 ) 2013 년 PyCon 컨퍼런스, The future of Linux Containers 발표 3 월도커오픈소스화 회사명을도커로변경 9 월 Red Hat 이파트너로참여, OpenShift 적용 당시 PaaS 업체들은지원언어가제한적 (Heroku = Ruby, Google = Java, Python) 6 개월만에 Github 에서 6,700+ 스타기록. 직원외 175 명의 Contributor 참여 2014 년 6 월도커 1.0 발표 Spotify, Baidu 에서는운영계에적용하여사용 Dockerhub 출시 : 컨테이너공용저장소 Amazon EC2 Docker container 서비스런칭 2014 년 12 월 Docker Swarm 발표 ( 도커콘 EU 에서 ) 2015 년 6 월솔로몬하익스 ( 도커 ) 와알렉스폴비 (Alex Polvi, 코어 OS) 는 Open Container Initiative 조직 Docker Inc. 1100 억투자유치 2016 년마이크로소프트윈도우서버도커지원 컨테이너포맷과런타임의표준정의협의체 25,600 + GitHub 스타, 1,100 Contributors 2017 년소프트웨어다운로드수 130 억 + LinkedIn profile 에 docker 160% 증가 11

도커는왜이렇게집중관심을받게되었나? 소프트웨어시스템의다양성 모놀리틱환경에서운영되는 LAMP (Linux, Apahce, MySQL, PHP) 시대는끝 NoSQL, 메시지큐, REST API, 다양한프로그래밍언어들 다양한하드웨어환경에서운영 개발자랩탑, 사내클라우드, 퍼블릭클라우드 다른하드웨어, 다른버전의라이브러리, 다른운영체제 표준화된컨테이너가상품운송을단순화한것처럼도커컨테이너는소프트웨어응용소프트웨어이동을단순화시켜준다 개발자는응용프로그램개발에만집중하고, 환경간의차이와종속성은걱정하지않으면서테스트환경과운영환경에코드를배포 시스템운영자는컨테이너를운영하는주요이슈에만집중 ( 자원할당, 컨테이너시작과종료, 서버간의마이그레이션등 ) 12

서비스카탈로그생성 Catalog Container 생성을보다쉽게하기위한오브젝트의집합 (Deployment Config, Build Config, Service, Route, Parameter, Environment 등 ) 생성과정 1. Docker image pull or Docker image build from Dockerfile (#docker build ) 2. Pull/build 된 image 를 local registry 에 push 하기위한 tag 추가 (#docker tag ) 3. Tag 된 image 를 local registry 에 Push (#docker push ) 4. Template 파일 (yaml file) 을통한 openshift template 생성 (#oc create ) 13

OPENSHIFT SERVICE CATALOG OpenShift Template Broker OPENSHIFT OpenShift Templates OpenShift Automation Broker ANSIBLE Ansible Playbook Bundles AWS Service Broker AWS AWS Services OPENSHIFT SERVICE CATALOG Other Service Brokers OTHER COMPATIBLE SERVICES Other Services A multi-vendor project to standardize how services are consumed on cloudnative platforms across service providers 14

PERSISTENT VOLUME CLAIM 생성 Rstudio, Tensorflow, JupyterHub 에서사용하는 Persistent volume claim 설정 15

PERSISTENT VOLUME CLAIM 할당 Container Mount Point PVC Rstudio /home/rstudio/pv-rs pv-rs(rw) Tensorflow /notebooks/pv-rs /notebooks/pv-tf pv-rs(ro) pv-tf(rw) JupyterHub /home/admin/work /home/cabin/work /home/ekhan/work pv-jupyterhub(rw) 16

DATA SCIENTIST 컨테이너생성 요구사항 분석툴 ( 버전, 모듈, 라이브러리등 ) CPU / GPU MEMORY, 개인 or 팀 컨테이너생성 OpenShift Web Console 에서서비스카탈로그를이용하여생성 1 2 3 4 17

DATA SCIENTIST 사용환경 18

컨테이너환경운영관리 컨테이너운영관리 운영효율성 서비스모니터링 보안및컴플라이언스 운영비용관리 19

컨테이너환경운영관리 Operational Management 실시간검색 관계시각화 모니터링및경고 취약점검사 보안준수 워크플로및정책 자동화 미터링 / 과금 20

운영효율성 컨테이너인프라통합실시간모니터링 다양한인프라구성요소간시각화 다양한인프라 HW/SW 통합관리 제어정책및 UI 확장을통한자동화기능 21

서비스모니터링 리소스모니터링및추세에의한사전장애요소제거 성능임계치및이벤트에대한경고 최적의컨테이너크기또는권장사항 이미지와컨테이너관계추적 22

보안및컴플라이언스 정책을준수하지않는노드검색 컨테이너출처보고 이미지와컨테이너간구성추적 OpenSCAP 을사용하여컨테이너이미지스캔 23

운영비용관리 인프라비용모델정의 플랫폼요금스케쥴링 프로젝트단위과금체계 사용자별리소스사용량 24

CONTAINER BENEFIT 25

CONTAINER BENEFIT Time: package install 필요없고 docker container 실행하여바로사용 Reproducibility: Python script와결과물을 docker 이미지로빌드하여공유 Flexibility: docker 이미지를실행할수있는모든소프트웨어상에서실행가능 Isolation: dependency 관계의라이브러리, 모듈등을컨테이너로격리하여다른툴, 라이브러리와충돌차단 Manageability: 컨테이너실행상태, 리소스사용현황등관리모니터링 자율성 : 데이터분석가 ( 팀 ) 이업무를자율적으로실행할수있음 Security: 컨테이너기반분석환경의결과물, 산출물에대한정보보호 ( 유출차단 ) 26

WRAP UP 27

WRAP UP Data scientist 개발환경컨테이너화 GPU, CPU 리소스효율적운영 사용자관리 BUILD to PUBLISH 자동화 28

THANK YOU