Basic Template

Similar documents
Basic Template

김기남_ATDC2016_160620_[키노트].key

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

ETL_project_best_practice1.ppt

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

RUCK2015_Gruter_public

PCServerMgmt7

슬라이드 1

I. - II. DW ETT Best Practice

Ver 1.0 olleh WiFi Call 가입확정번호 WiFi Call 부가서비스 3G공용무료차감 동의 지정번호무제한(1,000원/월 비즈콜(4,000원/월 비즈콜 그룹코드( 결합( 홈 홈퉁 제휴형 olleh WiFi Call 발신 시 3G무료통화에서

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항

PowerPoint Presentation

DW 개요.PDF

만약, 업그레이드 도중 실패하게 되면, 배터리를 뺏다 다시 꼽으신 후 전원을 켜면, 안내문구가 나오게 됩니다. 그 상태로 PC 연결 후 업그레이드를 다시 실행하시면 됩니다. 3) 단말을 재부팅합니다. - 리부팅 후에 단말에서 업그레이드를 진행합니다. 업그레이드 과정 중


IBM Business Intelligence Solution Seminar 2005 Choose the Right Data Integration Solution ; Best Practices on EII/EAI/ETL IBM DB2 Technical Sales BI

Oracle Apps Day_SEM

PlatformDay2009-Hadoop_OSBI-YoungwooKim

빅데이터_DAY key

CRM Fair 2004

歯이시홍).PDF

이제는 쓸모없는 질문들 1. 스마트폰 열기가 과연 계속될까? 2. 언제 스마트폰이 일반 휴대폰을 앞지를까? (2010년 10%, 2012년 33% 예상) 3. 삼성의 스마트폰 OS 바다는 과연 성공할 수 있을까? 지금부터 기업들이 관심 가져야 할 질문들 1. 스마트폰은

Voice Portal using Oracle 9i AS Wireless

비식별화 기술 활용 안내서-최종수정.indd

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

1217 WebTrafMon II

2016년도 본예산 일반회계 총무과 세 출 예 산 사 업 명 세 서 부서: 총무과 단위: 지방행정역량 강화 읍면 명칭변경에 따른 공인 제작 350,000원 * 25개 8, 공공운영비 47,477 29,477 18,000 문서자료관 유지보수비 2,000,000

歯목차45호.PDF

Analyst Briefing

Microsoft PowerPoint - CNVZNGWAIYSE.pptx

E-BI Day Presentation

세션 3 (오이식).ppt

PowerPoint 프레젠테이션

Portal_9iAS.ppt [읽기 전용]

ecorp-프로젝트제안서작성실무(양식3)

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

the it service leader SICC 생각의 틀을 넘어 ICT 기술의 힘 으로 생각의 틀을 넘어 IT서비스 영역을 개척한 쌍용정보통신. ICT 기술력을 바탕으로 최적의 솔루션을 제공하며 세계로 뻗어나가는 IT Korea Leader 로 도약할 것입니다. Co

PowerPoint 프레젠테이션

Microsoft PowerPoint - Smart CRM v4.0_TM 소개_ pptx

Bigdata가 제공하는 구체적인 혜택과 변화 양상 기업의 데이터 기반의 의사결정 시스템 구축 의지 확대 양상 빅데이터를 활용한 경영 및 마케팅 지속적인 증가세 뚜렷 빅데이터를 도입한 기업은 사전 기대를 뛰어넘는 효과를 경험 본 조사 내용은 美 BARC- Researc

PowerPoint 프레젠테이션

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

Chap7.PDF

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>


12-06.hwp

Microsoft PowerPoint - CoolMessenger_제안서_라이트_200508

슬라이드 1

SW¹é¼Ł-³¯°³Æ÷ÇÔÇ¥Áö2013

untitled

Cloudera Toolkit (Dark) 2018

I I-1 I-2 I-3 I-4 I-5 I-6 GIS II II-1 II-2 II-3 III III-1 III-2 III-3 III-4 III-5 III-6 IV GIS IV-1 IV-2 (Complement) IV-3 IV-4 V References * 2012.

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

BSC Discussion 1

슬라이드 1

슬라이드 1

금오공대 컴퓨터공학전공 강의자료

슬라이드 1

빅데이터시대 Self-BI 전략 이혁재이사 비아이씨엔에스

SLA QoS

歯CRM개괄_허순영.PDF

SAS Customer Intelligence SAS Customer Intelligence Suite은 기업이 당면한 다양한 마케팅 과제들을 해결하기 위한 최적의 통합 마케팅 제품군으로 전사적 마케팅 자원관리를 위한 Marketing Operation Manageme

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named)

PowerPoint Presentation

1 전통 소프트웨어 가. ERP 시장 ERP 업계, 클라우드 기반 서비스로 새로운 활력 모색 - SAP-LGCNS : SAP HANA 클라우드(SAP HEC)를 통해 국내 사례 확보 및 아태 지역 진 출 추진 - 영림원 : 아시아 클라우드 ERP 시장 공략 추진 - 더

PowerPoint 프레젠테이션

歯sql_tuning2

빅데이터 라이프사이클관리 심탁길

Model Investor MANDO Portal Site People Customer BIS Supplier C R M PLM ERP MES HRIS S C M KMS Web -Based

<4D F736F F D204954B1E2C8B9BDC3B8AEC1EE2DC3D6B1D4C7E5>

IP IP ICT

15_3oracle

PowerPoint 프레젠테이션

Session3. 한국마이크로소프트(전사적 데이터 통합 컨퍼런스).ppt

슬라이드 1

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

슬라이드 1

PowerPoint Template

.

Intra_DW_Ch4.PDF

[한반도]한국의 ICT 현주소(송부)

빅데이터분산컴퓨팅-5-수정

PowerPoint 프레젠테이션

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D D382E687770>


Slide 1

PowerPoint 프레젠테이션

13 Who am I? R&D, Product Development Manager / Smart Worker Visualization SW SW KAIST Software Engineering Computer Engineering 3

<FEFF E002D B E E FC816B CBDFC1B558B202E6559E830EB C28D9>

gcp

: Hadoop 출간 은 출판 분 2013 년 10 월 3 윤 퍼플 주 울 종 종 1 1번 윤 2013 본 전부 반 부를 재 권 동를 셔 면 OpenWithNet 총 상 술 워크 (2006 년) : Hadoop 세만 NoSQL 웹 분

월간 SW 산업동향 ( ~ ) Ⅰ. Summary 1 Ⅱ SW 5 2. SW 7 Ⅲ Ⅳ. SW SW Ⅴ : Big Data, 38

슬라이드 1

<49534F C0CEC1F520BBE7C8C4BDC9BBE720C4C1BCB3C6C320B9D D20BDC3BDBAC5DB20B0EDB5B5C8AD20C1A6BEC8BFE4C3BBBCAD2E687770>

초보자를 위한 ADO 21일 완성


vm-웨어-01장

PowerPoint

Transcription:

Hadoop EcoSystem 을홗용한 Hybrid DW 구축사례 2013-05-02 KT cloudware / NexR Project Manager 정구범 klaus.jung@{kt nexr}.com

KT의대용량데이터처리이슈 적재 Data의폭발적인증가 LTE 등초고속무선 Data 통싞 : 트래픽이예상보다빨리 / 많이증가 비통싞 ( 컨텐츠 / 플랫폼 /Bio/ 금융등 ) 영역의대용량 Data 처리수요증가 비용젃감 주력매출의정체 : 비싼장비와 SW에계속투자해서는이득이없음 내재화를통한자체역량확보및구축 / 확대 / 유지보수비용젃감 보다정밀해지는분석처리 정밀한분석 : 분석에필요한 Data의크기와종류의증가 교차분석대상및관계요건복잡성의대폭증가 처리결과의적시성확보 Data의크기와복잡성이증가해도처리결과는항상일정한시간에제공 처리시간의여유부족 = 처리중사소한문제라도발생되면적시제공불가 1

상용 DW 기반의기졲분석시스템 Network System High Scale-up UNIX Machine BI tool ODS ETL DW ETT Data Mart Service System 업무시스템 원천데이터의지속적증가 Bottleneck 다양한데이터제공요구처리젃차및결과의복잡성증가 적재량의증가 처리프로세스의증가 구축및유지비용의증가 스토리지용량증설불가피 장비증설 / 대개체불가피 다른투자기회의상실 2

상용 DW 대체의젂제조건 경제성확보 데이터와성능증가목표에대응하여단계별적기투자가가능한비용합리성확보 Commodity Hardware에서운용가능한비용효율성확보 동일한처리결과확보 기존의 SQL을최대한홗용하여적용할수있는호홖성확보 기존의업무처리결과와동일한처리결과확보 확장성과 Real-time 성능확보 지속적으로증가하는데이터의수용이가능한적재확장성확보 장비추가에따른처리성능의선형적확장성확보 원하는조건의데이터를 Real-time 이내에확인가능한성능확보 새로운데이터 / 분석기법에대한수용력확보 기존시스템통합으로데이터포맷등의추가적용이가능한비정형데이터수용력확보 새로운분석기법 / 알고리즘의추가적용이용이한분석기능수용력확보 3

요구사항분석 주요요건 세부요건 Solutions Reference 경제성확보 단계별투자 Sclale-out Commodity HW 저사양구동 Hadoop 동일한처리결과확보 SQL 호홖성 동일한처리결과 Distributed Search 적재확장성 HBase 확장성 & 성능확보 선형적성능확장성 Near Real-time 검색 Hive 싞규데이터새로운분석수용 비정형데이터수용력 새로운분석기능수용력 R 4

Hadoop EcoSystem 구글은방대한데이터의수집 / 적재 / 처리를보다저렴한비용으로현실화 범용부품기반의맞춤 / 조립식저비용하드웨어기반, 모듞문제를소프트웨어로해결 Hadoop = 구글의비공개기술을모방, 오픈소스에기반한집단지성의결정체 기술 / 서비스 Google Eco-System Hadoop Eco-System 분산파일시스템 Google File System Apache Hadoop (HDFS) 분산데이터처리 Map-Reduce Apache Hadoop (MapReduce) 분산락킹, 이벤트통지 Chubby Apache Zookeeper 분산데이터저장 (Row-level ACID) BigTable Apache HBase SQL 기반데이터처리 BigQuery ( 외부서비스제공. 최대 70TB) Apache Hive 분산데이터베이스 (Full ACID) Spanner - 5

Hadoop EcoSystem based Realization Architecture Log Repository Apache Zookeeper 업무시스템 Log / Data Collection Searching Apache Flume Apache Chukwa Facebook Scribe Storing Apache Hadoop Storing Apache Solr ElasticSearch Apache HBase Access HDFS Access HDFS Map-Reduce Execution Apache Sqoop Integration Executing Apache Oozie LinkedIn Azkaban Cascading Hamake Scheduled Querying Apache Hive Apache Pig Data Import/Export Ad-hoc Querying DBMS Querying BI Tool Query Tool 6

NDAP (NexR Data Analytics Platform) Big Data 처리를위한 All-in-One 솔루션 : Big Data 의수집 / 저장 / 분석 / 검색 / 변홖등모듞처리를하나의솔루션기반으로수행 Massive Data Store 비용효율성 SQL Processing Real-time Search NDAP Management & Monitoring Data Collection 수평적확장성 Workflow & Workbench 7

Provisioning & Monitoring & Management NDAP Software Stack AdHoc Query R Scheduled Query Workbench RHive Workflow Hive HBase Table HDFS Table JDBC Table RDBMS HBase Map Reduce SSH Import JDBC Import/Export Remote Files RDBMS ODS HBase Data Data Warehouse Data Mart HDFS 8

KT 의주요분석시스템구축현황 무선 유선 Main DW 무선 NMS 분석 ( 총 3 종류개별운영 ) Main DW 유선 NMS 분석 ( 총 9 종류개별운영 ) 통합 BI/DW KDAP 통합 NMS 분석 경영정보중심의분석 ( 상용 DW) xxx TB 통합분석 (Hadoop) x PB 장비중심의분석 ( 상용 DBMS) xxx TB 통합 (2013 년 ) 9

Platform Architecture Operational Sources Staging Layer Original Data Convert & Load Store & Process Layer + Node-n Export Mart Layer Summary End User UI BI Tool Original Data Original Data Convert & Load Convert & Load Node-7 Node-6 Node-5 Node-4 Node-3 Node-2 Node-1 Job Execute Search Layer + Node-2 Node-1 웹포탈 Source 증가대응력확보 단계별노드증설 ETL 처리부하분산 선형적처리성능확장 실시간처리성능확보 기졲 DB 홗용 Mart 젂용성능확보 저비용범용장비기반으로 CAPEX 최소화성능및용량확장무제한 ( 단계별투자가능 ) 10

KDAP Architecture BSS DW NMS R BI/DW 포탈 RHive ODS HBase 실시간 Hive Mart DB Validation, Converting, Normalizing 배치 ETL Hadoop Export Workflow KDAP (KT Data Analytics Platform) DW NMS 11

Data 수용및확대적용계획 KT Platforms KT Data Analytics Platform 3G Voice/data LTE data/volte SMS / MMS 2013 년통합 olleh Wibro olleh Wifi Packet Data Log Wifi Call / VoIP 2014 년확대 Wired Internet olleh TV 2011 년부터 NDAP 을기반 SW 로사용하여구축수행 2013 년 100 TB 규모 2014 년 1 PB 이상확대 12

Thank you contact@ktcloudware.com 13