위세아이텍_iOLAP_

Similar documents
CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

Cloud Friendly System Architecture

Cover Story 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 ORACLE KOREA MAGAZINE Spring 개요빅데이터를처리하는기술의가장중심기술은아파치하둡기술일것이다. 하둡기술은데이터를취득하고이를구조화시키고분석을하는일련의과정에

PowerPoint 프레젠테이션


Basic Template

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named)

PowerPoint 프레젠테이션

Intra_DW_Ch4.PDF

김기남_ATDC2016_160620_[키노트].key

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이

DBMS & SQL Server Installation Database Laboratory

빅데이터시대 Self-BI 전략 이혁재이사 비아이씨엔에스

문서의 제목 나눔고딕B, 54pt

RUCK2015_Gruter_public

DW 개요.PDF

Slide 1

빅데이터분산컴퓨팅-5-수정

Microsoft Word - th1_Big Data 시대의 기술_ _조성우

CRM Fair 2004

.

PowerPoint Template

Beyond Relational SQL Server, Windows Server 에디션비교 씨앤토트 SW 기술팀장세원

PlatformDay2009-Hadoop_OSBI-YoungwooKim

PowerPoint Presentation

빅데이터_DAY key

들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

U.Tu System Application DW Service AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

ETL_project_best_practice1.ppt

<49534F C0CEC1F520BBE7C8C4BDC9BBE720C4C1BCB3C6C320B9D D20BDC3BDBAC5DB20B0EDB5B5C8AD20C1A6BEC8BFE4C3BBBCAD2E687770>

슬라이드 1

통신회사에서가장중요한데이터자원이라고하면뭐니뭐니해도고객들의통화기록이라할수있다. 이를 Call Detail Record(CDR) 라고하며, 고객들이유선전화나휴대폰을사용하여통화할때마다통화위치, 통화대상, 통화시간등이로그데이터로기록된다. 매통화마다기록되므로 1일발생량은수억건에

슬라이드 1

슬라이드 1

슬라이드 1

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

[Brochure] KOR_TunA

Cloudera Toolkit (Dark) 2018

Windows 8에서 BioStar 1 설치하기

[Brochure] KOR_LENA WAS_

歯목차45호.PDF

Bigdata가 제공하는 구체적인 혜택과 변화 양상 기업의 데이터 기반의 의사결정 시스템 구축 의지 확대 양상 빅데이터를 활용한 경영 및 마케팅 지속적인 증가세 뚜렷 빅데이터를 도입한 기업은 사전 기대를 뛰어넘는 효과를 경험 본 조사 내용은 美 BARC- Researc

놀이동산미아찾기시스템

Spring Boot/JDBC JdbcTemplate/CRUD 예제

쉽게 풀어쓴 C 프로그래밊

PowerPoint 프레젠테이션

오픈데크넷서밋_Spark Overview _SK주식회사 이상훈

FileMaker 15 ODBC 및 JDBC 설명서

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>


PowerPoint 프레젠테이션

aws

Microsoft PowerPoint - S4_통계분석시스템.ppt

Microsoft PowerPoint - 3주차.pptx

항목

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

진정한토종벤처를꿈꾸는기업 저희시큐레이어는최근사회적화두로부각되고있는빅데이터를기반으로한통합로그수집 / 분석및통합보안관제분야에순수국산기술적자립으로외산과당당히겨루는소프트웨어를만들자는이념의전문소프트웨어기업입니다. 이러한이념을달성하기위한치열한열정과노력으로주요시장에서긍정적으로 평가

: Hadoop 출간 은 출판 분 2013 년 10 월 3 윤 퍼플 주 울 종 종 1 1번 윤 2013 본 전부 반 부를 재 권 동를 셔 면 OpenWithNet 총 상 술 워크 (2006 년) : Hadoop 세만 NoSQL 웹 분

FileMaker ODBC 및 JDBC 가이드


Ç¥Áö

슬라이드 1

5 주차 -mongodb 설치잠깐! CAP 이론 NoSQL이나온이유와 MongoDB NoSQL의데이터저장구조에따른세가지분류 RDBMS와 NoSQL특성비교 RDBMS와 NoSQL의사용시기 MongoDB 소개및특징 MongoDB와 RDBMS와의공통 MongoDB CRUD

슬라이드 1

Microsoft PowerPoint - CNVZNGWAIYSE.pptx

PowerPoint 프레젠테이션

Windows 10 General Announcement v1.0-KO

IBMDW성공사례원고

2017 1

Samsung SDS Enterprise Cloud Networking CDN Load Balancer WAN

PowerPoint 프레젠테이션

<4D F736F F D20BBE7BABB202D20C3D6BDC54954B5BFC7E2>

PowerPoint Presentation

Portal_9iAS.ppt [읽기 전용]

1 전통 소프트웨어 가. 국내 데이터베이스 서비스 시장, 매출 규모에 따른 양극화 현상 심화 국내 데이터베이스 시장은 지속적으로 성장세를 보이고 있으나 비중이 가장 높은 데이터베이스 서 비스 시장에서 매출 규모에 따른 빈익빈 부익부 현상이 심화되는 추세 - 국내 DB사

PowerPoint Presentation

_LG히다찌 브로슈어

REDIS 이해와 활용

SAS FORUM KOREA 2018_Cloudera_발표

백봉현, 하일규, 안병철 Bong-Hyun Back, Ilkyu Ha, ByoungChul Ahn 1. 서론 최근들어소셜네트워크활성화로 에서발생하는대량의데이터 로부터정보를추출하여이를정치 경제 개인서비 스 연애등다양한분야에활용하고자하는노력이 계속되고있다 상의데이터를빠르게

PowerPoint 프레젠테이션

第 1 節 組 織 11 第 1 章 檢 察 의 組 織 人 事 制 度 등 第 1 項 大 檢 察 廳 第 1 節 組 대검찰청은 대법원에 대응하여 수도인 서울에 위치 한다(검찰청법 제2조,제3조,대검찰청의 위치와 각급 검찰청의명칭및위치에관한규정 제2조). 대검찰청에 검찰총장,대

Hallym Communication Policy Research Center 15 빅데이터기술은대용량의데이터를다룰때, 여러과정을거치게되는데, 데이터수집및데이터전처리, 저장, 분석, 활용 ( 시각화 ) 까지의과정을 거치게되며각과정별로핵심기술이존재한다. 빅데이터기술은대용

<4D F736F F F696E74202D20B5A5C0CCC5CDBAA3C0CCBDBA5F3130C1D6C2F75F32C2F7BDC32E >

SAMSUNG SDS Cloud Database EPAS PostgreSQL Microsoft SQL Server MariaDB MySQL ScyllaDB MongoDB

Altibase Starting User's Manual

SW

1 SW

PowerPoint 프레젠테이션

제목을 입력하십시오

슬라이드 1

빅데이터 라이프사이클관리 심탁길

Slide 1

고객 지향적인 IT 투자와 운영이 요구되는 시대! 2014년 현재 유통, 서비스 업계의 정보화 화두는 BYOD 수용과 고객의 마음을 읽는 분석 입니다. Market Overview _ Cross Industry 의 정보화 동향 유통과 서비스 업계의 IT 환경은 발 빠르

Transcription:

빅데이터관리와분석을위한 플랫폼융합활용사례 BI Forum

분석시스템구축 Review(1/2) 1

분석시스템구축 Review(2/2) 분석속도가느리다면? 정보요구사항이변하거나 추가된다면? 데이터량이너무많다면? 2

과거의빅데이터저장 데이터량이너무많다 그러나 RDBMS 에서관리하는것은 막대한비용소요 지금까지의처리방안 1. 데이터간에우선순위부여 신용카드데이터 > 상품데이터 > 웹로그데이터 수집하지않거나 ( 버리거나 ) 상세수준으로저장하지않는다 2. 데이터시점에우선순위부여 최근 3 년치만 RDBMS 에나머지는테이프에 3. 데이터접근수준차등화 집계데이터만전사공유, 세부데이터는각부서별로보관 3

최근의빅데이터저장 RDBMS 를벗어나서비용부담없고확장성있는방식을찾자! 데이터저장방향 그냥모든데이터를 ( 있는그대로 ) 저장하자 원래형태그대로상세수준그대로저장 문서, 동영상과같은비정형데이터도그대로저장 가장현실적인대안은? Hadoop Hadoop은무료이고필요한머신과 SW는저렴 검증된성능 - 하둡의최대이용자인야후는 5만개의노드로구성된하둡네트워크를배치하여사용중 4

Hadoop Review - Hadoop Framework HDFS: 하둡분산형파일시스템 HCatalog: 하둡데이터용테이블및스토리지관리서비스 Pig: 맵리듀스용프로그래밍및데이터플로우인터페이스 Hive: SQL과유사한언어인 HiveQL을이용해하둡데이터쿼리를생성하는솔루션 (DW) 출처 : Brian Proffitt, ITWorld 5

Hadoop Framework - HDFS RDBMS 를벗어나서비용부담없고확장성있는방식을찾자! HDFS? 하둡네크워크에연결된아무기기에나데이터를밀어넣는분산형파일시스템 (Brian Proffitt) 다수의노드로이루어진하둡시스템에데이터가자동적으로중복되게만듦. 따라서하나의노드에서고장이발생하거나느려지더라도여전히그데이터에접근할수있다 Cloudera 의제시스펙 중간수준의프로세서, 4~32 GB의메모리 각노드에대한 1 GbE 네트워크연결및 10 GbE의탑-오브-랙 (Topof-Rack) 스위치 하둡이네트워크를포화상태로만들지못하도록하는전용스위칭인프라 장비당 4~12개의드라이브및비 RAID 방식 6

Hadoop Framework 다양성의인식 하둡은오픈소스 구성요소는모두가변적이며 core 라도다른 SW 로대체가능하다 120여종의 NoSQL 제품 Column Family DB: Hbase, Cassandra Document DB: MongoDB, CouchDB Key/Value DB: Scalaris, Membase Graph DB: Neo4J, Dynomite 아마존의 EC2(Elastic Compute Cloud) 는 S3 채용 DataStax의 brisk는하둡배포판에서 Cassandra FS로대체 7

Hadoop 재검토 시스템도입책임자로서질문 하둡기술자를확보할수있는가? 하둡요소기술은다양하고계속변화하는데우리 IT 담당자들이 계속따라갈수있을까? ( 중저가라고는하지만 ) 서버를도대체몇대나구매해야하는가? 기존 RDBMS의기능과성능을대체가능한가? 정말저렴한가? ( 서버면적, 전기료, 인건비, ) 8

최근의동향 Hadoop 도입동향 IDC, 대형포털, 클라우드서비스제공기업에서는 Hadoop을적용 일반기업에서는도입사례적으며, 특히금융권에서는찾아보기어려움 Hadoop을전면적으로도입하기보다는보완적으로도입 업계동향 5~30 테라수준 & 빠른속도의 Appliance 확장성높은 RDBMS ( 티베로의 TMC, 100 테라이상 ) 9

빅데이터저장사례 사례 1 국내 Global 가전업체 전세계 Smart TV의프로그램 ( 앱, 비디오 ) 이용데이터수집 ( 서버로그, 서비스로그 ) 전세계기기별데이터의통합 사례 2 국내 Global 게임서비스업체 국내서버외에유럽, 미주서버에서게임서비스 게임이용통합분석을위한데이터취합 상기사례는현재프로젝트진행중인내용이며, 진행에따라내용이변경될수있음 10

국내 Global 가전업체사례 (1/2) Global Public Cloud Global Public Cloud 로그생성및저장 Mart OLAP Cube OLAP Mart Reporting 내부시스템 매출, 서비스 ODS DW 메타정보 11

국내 Global 가전업체사례 (2/2) Why Global Public Cloud? 데이터증가에대한유연한대처 데이터이중백업 ( 다른대륙에위치한 IDC 에백업 ) 보안위험성낮음 ( 특히 DDoS) 플랫폼변경에유연 (Hadoop 적용, 고성능업그레이드등 ) 12

국내 Global 게임서비스업체사례 (1/3) 지역별게임서비스데이터 ( 국내, 유럽, 미주 ) Global Public Cloud In-Memory Global Public Cloud SaaS BI DB DM Cube OLAP Log Cloud Storage EIS DBMS DW /DM Cube Social Analytics HDFS HIVE DW SNS Mart 13

국내 Global 게임서비스업체사례 (2/3) Why Global Public Cloud? Cloud 없이는국내서버로의데이터취합부터어려움 저렴한비용 Why Cloud BI? 유연한라이선스 저렴한비용 특정제품 (Tool) 에종속적이지않음 14

국내 Global 게임서비스업체사례 (3/3) 서버구매방식과비교하여 Cloud 는얼마나저렴한가? 직접비용 국내데이터규모, 5 년기준 실서버구매 (DW 용서버와 Storage, DBMS/OS 포함 ) 와비교 Public Cloud 비용은서버구매대비 40% 이하 기타비용 실서버구매시추가 SW( 보안, 백업등 ) 구매필요 서버설치관련비용 ( 임대면적, 네트웍공사, 전기료 ) 인건비 ( 서버관리자 ), 데이터저장량이예상보다늘어날경우, Cloud에서는아주적은비용으로바로대처가능 15

기존 BI 환경과 Hadoop 의융합 (1/2) 기존 RDB 플랫폼을유지하면서 Hadoop 을도입하고자할경우 기존 RDBMS 에서하둡으로데이터를옮기려면? 클라우데라의 Sqoop(SQL-to-Hadoop) 툴이대표적 JDBC 인터페이스를통해 RDBMS의데이터를불러올수있게함 Sqoop을이용해 RDBMS 데이터를곧바로 Hive DW로불러올수도있음 쿼리분석을하려면? Hive 하이브쿼리언어 (Hive QL) 를이용해쿼리수행하고분석 주의사항 : 하둡은배치처리시스템이기때문에하이브쿼리시상당한지연이발생할수있음 16

기존 BI 환경과 Hadoop 의융합 (2/2) Hadoop 데이터저장 (HDFS) ODS (Hbase/MySQL) DW(DM) (Hive) Source Sqoop HQL Map/Reduce DW(DM) ( 기존 RDBMS) SQL BI Tool 17

Hadoop DW 기반기존 BI 활용사례 Cloud Local System( 기존 BI System) HADOOP Name node JAVA Web Service ROLAP Report Data node HIVE HIVE SERVER ODBC 또는 JDBC Hive Table 의 Meta 정보 Meta DB (MySQL) Hive는외래키가없어서기존 BI Tool 에서직접연결시분석안됨 테이블정보입력, 가상의기본키와외래키지정필요 18

과거의빅데이터분석 분석속도가느리다 사용자분석속도 & 데이터적재속도모두빠른처리요구 but 속도를개선하기보다는분석범위를조정하여처리 지금까지의처리방안 집계수준조정 일단위에서주단위로, 주단위에서월단위로집계수준상향 분석주제를세분화 상세분석은특정영역에한정 리포트의배치생성 리포트를조회하는시점에서데이터를분석하는것이아니라미 리리포트를생성해놓음 분석이아니라조회용도로 BI 활용 (OLAP 을 Report 로사용 ) 19

최근의빅데이터분석속도향상방법 구분 Appliance In-Memory 특징 장비 +DBMS+OS+Storage 일체화 ( 전부또는일부 ) 서버또는클라이언트의메모리에데이터를업로드한후분석 비용매우높음높음 분석 DW 구성 매우빠른쿼리조회 (10 년간제품별평균매출금액조회 ) DW + Mart + (Cube) 구성구성요소는모두물리적으로구축 매우빠른분석 ( 최근가입한백만고객에대해채널별캠페인유형별성과분석 ) DW(Mart) 만물리적으로메모리에업로드 Mart(Cube) 는논리적으로구성 * 규모가작은경우는 Raw 데이터를메모리에업로드하고분석모델을모두논리적으로구성 20

인메모리플랫폼상의 BI(1/2) Server BI In-Memory(Server) OLAP Storage DM 압축 Cube (Model) 데이터시각화 DBMS DW /DM Cube Client In-Memory(Client) HDFS HIVE DW 압축 DM Cube (Model) 21

인메모리플랫폼상의 BI(2/2) 인메모리경향 서버인메모리, 클라이언트인메모리구분은 DBMS 와 BI Tool 에 좌우되는경향 대부분의시각화 Tool 은인메모리를전제로함 인메모리적용고려사항 여러차원으로상세분석하는경우필요 정책적인결정 인메모리분석대상영역결정 빠른분석, 상세분석이필요한데 이터영역만한정할것인지 메모리업로드정책결정 메모리상주또는필요시업로드여부 22

과거의요구사항변경대처 분석요건의변경 & 추가 반영하기에는너무큰작업. 적정 선에서타협 지금까지의처리방안 분석모델변경이미미한경우 IT 담당자 ( 유지보수담당자 ) 가작업 작업량은적어도데이터의재적재에많은시간이걸릴수있음 사용자화면 ( 리포트 ) 상의오류와이의수정작업이상당할수있음 분석모델변경이필요 & 추가사항이있는경우 요구사항정리 > 모델링 > 데이터추출 / 적재전체작업수행 리포트위주의분석시스템인경우리포트재개발까지도감안 2 차개발, 고도화등의사업화 23

빅데이터분석변경대처 변경이잦은영역을인메모리로분석 인메모리 해당영역의 Raw 데이터를메모리에업로드 자주변경되는 ( 논리적 ) 데이터모델만수정적용 재적재 ( 업로드 ) 없이바로수정분석 가상의데이터통합구조를이용하여필요시쿼리를생성하여 데이터허브 결과제공 사용자 : 쿼리디자인 관리 : 데이터소스와추출에대한메타정보관리 허브 : 사용자쿼리조건을실행가능한 SQL로변환 / 실행 메모리, 디스크최적화, 병렬서버등의기술기반 24

데이터허브와인메모리융합사례 쿼리디자인 (Client) 결과 데이터소스 데이터허브 쿼리생성 / 실행 File File 추출 가공 전송 DM Model 메타관리 In-Memory 25

BI 포럼의빅데이터플랫폼접근방향 26

BI 포럼 2010년부터활동하고있는전문중소 SW 포럼으로지식경제부, 정보통신산업진흥원, 한국소프트웨어산업협회에서후원 27