PowerPoint 프레젠테이션

Similar documents
ETL_project_best_practice1.ppt


DW 개요.PDF

IBM Business Intelligence Solution Seminar 2005 Choose the Right Data Integration Solution ; Best Practices on EII/EAI/ETL IBM DB2 Technical Sales BI

Backup Exec

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>

I. - II. DW ETT Best Practice

<4D F736F F F696E74202D20BDC7BDC3B0A320B5A5C0CCC5CD20C5EBC7D520B1E2BCFA20BCD2B0B F31>

Simplify your Job Automatic Storage Management DB TSC

Portal_9iAS.ppt [읽기 전용]

Oracle Database 10g: Self-Managing Database DB TSC

PCServerMgmt7

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

<49534F C0CEC1F520BBE7C8C4BDC9BBE720C4C1BCB3C6C320B9D D20BDC3BDBAC5DB20B0EDB5B5C8AD20C1A6BEC8BFE4C3BBBCAD2E687770>

CRM Fair 2004

김기남_ATDC2016_160620_[키노트].key

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례


Analyst Briefing

Intra_DW_Ch4.PDF

Microsoft PowerPoint - Smart CRM v4.0_TM 소개_ pptx

untitled

Session3. 한국마이크로소프트(전사적 데이터 통합 컨퍼런스).ppt

Microsoft Word - 조병호

PowerPoint 프레젠테이션

리뉴얼 xtremI 최종 softcopy

E-BI Day Presentation

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

IPAK 윤리강령 나는 _ 한국IT전문가협회 회원으로서 긍지와 보람을 느끼며 정보시스템 활용하 자. 나는 _동료, 단체 및 국가 나아가 인류사회에 대하여 철저한 책임 의식을 가진 다. 나는 _ 활용자에 대하여 그 편익을 증진시키는데 최선을 다한다. 나는 _ 동료에 대해

J2EE & Web Services iSeminar

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

15_3oracle

untitled

untitled

Model Investor MANDO Portal Site People Customer BIS Supplier C R M PLM ERP MES HRIS S C M KMS Web -Based

The Self-Managing Database : Automatic Health Monitoring and Alerting

고객 지향적인 IT 투자와 운영이 요구되는 시대! 2014년 현재 유통, 서비스 업계의 정보화 화두는 BYOD 수용과 고객의 마음을 읽는 분석 입니다. Market Overview _ Cross Industry 의 정보화 동향 유통과 서비스 업계의 IT 환경은 발 빠르

IBMDW성공사례원고

vm-웨어-01장

untitled

1217 WebTrafMon II

비식별화 기술 활용 안내서-최종수정.indd

Oracle Apps Day_SEM

기타자료.PDF

Chap7.PDF

ORANGE FOR ORACLE V4.0 INSTALLATION GUIDE (Online Upgrade) ORANGE CONFIGURATION ADMIN O

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

당사의 명칭은 "주식회사 다우기술"로 표기하며 영문으로는 "Daou Tech Inc." 로 표기합니다. 또한, 약식으로는 "(주)다우기술"로 표기합니다. 나. 설립일자 및 존속기간 당사는 1986년 1월 9일 설립되었으며, 1997년 8월 27일 유가증권시장에 상장되

빅데이터시대 Self-BI 전략 이혁재이사 비아이씨엔에스

Service-Oriented Architecture Copyright Tmax Soft 2005

PowerPoint

PowerPoint 프레젠테이션

목 차 Ⅰ. 일반사항 1 Ⅱ. 특기사항 3 Ⅲ. 물품내역 및 세부규격 8 Ⅳ. 주의사항

Oracle9i Real Application Clusters

PowerPoint Presentation

solution map_....

RUCK2015_Gruter_public

[Brochure] KOR_TunA

오늘날의 기업들은 24시간 365일 멈추지 않고 돌아간다. 그리고 이러한 기업들을 위해서 업무와 관련 된 중요한 문서들은 언제 어디서라도 항상 접근하여 활용이 가능해야 한다. 끊임없이 변화하는 기업들 의 경쟁 속에서 기업내의 중요 문서의 효율적인 관리와 활용 방안은 이

Master presentation template three line maximum — First Lastname Job Title

2017 1

세션 2-2(허태경).ppt

untitled

untitled

1

歯CRM개괄_허순영.PDF

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D D382E687770>

dbms_snu.PDF

초보자를 위한 ADO 21일 완성

<4D F736F F F696E74202D2033B9F8C2B05F44796E616D F E6720B1B8C7F6C0BB20C0A7C7D120B8AEBEF3C5B8C0D320B5A5C0CCC5CDC5EBC7D55FC3D6C1BE5FB9E8BBF3B1D52E707074>

초보자를 위한 분산 캐시 활용 전략

목 차

untitled

미래 서비스를 위한 스마트 클라우드 모델 수동적으로 웹에 접속을 해야만 요구에 맞는 서비스를 받을 수 있었다. 수동적인 아닌 사용자의 상황에 필요한 정보를 지능적으로 파악 하여 그에 맞는 적합한 서비스 를 제공할 수 새로운 연구 개발이 요구 되고 있다. 이를 위하여,

Ç¥Áö

리포트_03.PDF

DE1-SoC Board

スライド タイトルなし

ecorp-프로젝트제안서작성실무(양식3)

Intro to Servlet, EJB, JSP, WS

歯목차45호.PDF

PowerPoint 프레젠테이션

서현수

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

소만사 소개

MS-SQL SERVER 대비 기능

슬라이드 1

APOGEE Insight_KR_Base_3P11

Microsoft PowerPoint - 3.공영DBM_최동욱_본부장-중소기업의_실용주의_CRM

MySQL-Ch05

슬라이드 1

< FC8A8C6E4C0CCC1F620B0B3B9DF20BAB8BEC8B0A1C0CCB5E5C3D6C1BE28C0FAC0DBB1C7BBE8C1A6292E687770>

국민 대표들과 전시장을 둘러보며 IT에 대한 깊은 관심을 표명했 다. 개막쇼인 테이프커팅은 IT 뉴웨이브 게이트 오픈식 으로 대체해 화려한 볼거리를 제공했다. 노 대통령과 진대제 정통부 장관, 고현진 한국소프트웨어진흥 원장 등 행사 주최측과 국민대표들이 전시장 입구에

Microsoft PowerPoint - SVPSVI for LGNSYS_ ppt

Basic Template

USER GUIDE

PowerPoint 프레젠테이션

본문서는 초급자들을 대상으로 최대한 쉽게 작성하였습니다. 본문서에서는 설치방법만 기술했으며 자세한 설정방법은 검색을 통하시기 바랍니다. 1. 설치개요 워드프레스는 블로그 형태의 홈페이지를 빠르게 만들수 있게 해 주는 프로그램입니다. 다양한 기능을 하는 플러그인과 디자인

No Slide Title

들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와

Transcription:

DMExpress 소개자료

누구나쉽게사용 (Ease of Use) 1. 회사소개 2. DMExpress 개요 3. DMExpress 소개 - 개발방식 - 핵심기능 4. DMExpress 적용분야 - SQL Migration - DI Acceleration - Batch Solution - Big Data Solution 5. 레퍼런스 2

About Syncsort Multinational Software Company 1968 년설립, 북미, 유럽및아시아지역에서영업 50 년이상성능혁신 25 개이상의특허출원및발급 투자자 : DATA SERVICES FINANCE Large Global Customer Base 기업및전세계의정부에대한데이터통합및데이터보호솔루션선두업체 68 개국에서 15,000 개이상제공 Fortune 100 기업 95% 이상, Dow Jones 상장사 80% 이상 Syncsort Data Integration Offerings 빅데이터의통합, 최적화및마이그레이션을위한고성능, 특수용도의데이터통합솔루션 DMExpress 제품군 z/os 및 SAS 메인프레임환경을위한 MFX 고성능정렬솔루션 INSURANCE & HEALTHCARE PUBLIC SECTOR TELECOMMUNICATIONS RETAIL 3

About 한국비지네스써비스 회사명 : 한국비지네스써비스 설립년도 : 1973년 5월본사 : 서울시서초구반포본동직원 : 50 명국내최초의 SW 전문판매지원회사 - 1992 년최초로국내 SyncSort Solution 공급지원 - 풍부한경험과기술축적 - 30 여개이상의 SyncSort 고객사 4

DMExpress Overview DMExpress 는데이터통합을스마트하게지원하는솔루션입니다. (DMExpress is Smarter Data Integration!) 더작은시스템자원을가지고다양한데이터를초고속으로수집하고처리하여업무전반의작업을지원하며 성능을개선할수있습니다. Smarter Data Integration - Free Up Your Database! Smarter Data Transformations for 10x Faster Performance Smarter Optimizer No Tuning Required, Simply Faster! 5

DMExpress Overview ( 예시 ) ( 데이터추출 ) ( 데이터가공 ) ( 데이터저장 ) 6

DMExpress 데이터처리방식 Flat Files RDBMS Tables / files Fixed / variable Flat Files Flat Files RDBMS Flat Files Flat Files Flat Files RDBMS Tables / files Fixed / variable Flat RDBMS Files Flat Files RDBMS RDBMS Tables / files Fixed / variable Flat RDBMS Files RDBMS Flat Files 7

DMExpress Overview 5분안에설치간단한관리템플릿중심개발튜닝불필요 2 일교육으로누구나사용 8

DMExpress 구성 GUI SAM File TGT DBMS 윈도우 PC 에서 GUI 로개발후테스트할수있으며 PC 의자원을사용하여작업도가능. 서버에서직접실행가능하며전문스케줄러 SW 와연동도가능. GUI 방식과 Sciprt 방식모두지원원하는방식으로편리하게개발가능. ADM SRC SAM File 9

고성능 ETL 구현을위한완전히통합된아키텍처 Install in Minutes. Deploy in Weeks. Never Tune Again. Shared File-based Metadata Repository Impact Analysis Task Editor Job Editor User Interface Data Lineage Metadata Interchange Appliances Global Search High Performance Connectivity Real Time SDK DMExpress Server Engine High Performance Transformations Cloud Hadoop High Performance Functions Automatic Continuous Optimization Files / XML Mainframe Template-driven Design Small Footprint ETL Engine Self-tuning Optimizer Native, Direct I/O Access 10

Connect All Data Sources. Deploy Everywhere. Clients DMExpress Workstations Windows based GUI Server Flat File Based Metadata Repository Check-in Check-out DMExpress Server Engine 3 rd Party Version Control Tool Sources & Targets Appliances Cloud Hadoop Mainframe Files / XML Real Time Relational DB2 Informix MySQL Oracle SQL Server Sybase Teradata Native ODBC DataDirect Real Time MQ SOAP Other / ERP Files / XML FTP / SFTP Mainframe Hadoop / HDFS SAP Appliances Greenplum Netezza Vertica Cloud SOAP Salesforce.com 11

DMExpress 지원환경 Source/Target Packages Connect Amazon Redshift Amazon S3 Apache Avro Apache Parquet DB2/ UDB Green plum JDBC My SQL Netezza NoSQL Databases ODBC Version Current version on AWS Current version on AWS 1.7.6 1.6 9.7 and higher 4.2 and higher 3.0 compliant 5.1.73 7.0.3 and higher Hive Hive Server 2 Other Level 3 NoSQL compliant Databases Connect Oracle Qlik SQL Server Sybase ASE IBM Sybase IQ Teradata Vertica Salesforc Websphere e.com MQ SAP Hadoop (HDFS) Tableau Version 10g 이상 QlikView data exchange files 2008 and 15.0 and higher higher 15.0 and higher TD14 6.0 and higher 7.0.1.3 and higher 23.0, 24.0 and 25.0 ECC 6.0 and higher Apache 2.x TDE API Accelerators Product ACUCOBOL-GT Micro Focus COBOL Micro Focus Server DB2 Load Version 6.2 and higher Server Express 2 and higher Net Express 4 and higher 6 and higher 9 UNIX System sort 12

수백번검증된특허받은알고리즘의효과 데이터 Sort 는 ETL 의모든측면에영향 Syncsort 는 1968 년이후고성능 Sort 분야의시장선도자! Sort 6 개특허 + 3 개특허진행중 Join 3 개특허 + 3 개특허진행중 Aggregate 3 개특허 + 3 개특허진행중 Copy Direct, block level read I/O 80% of ETL 13

ETL World 세계신기록 1 시간에 5.65 Terabytes 처리 DMExpress v4.8 이 5.4TB 의 raw TPC-H data 를추출, 변환, 정제와로드 (Vertica Analytic Database) -> 57 분 21 초 51 Server : HP Blade System c7000 x86 OS : RedHat Linux DSS Labs 에의해독립적으로검증 1.0TB 처리시간 : 10 분 37 초 [ 신기록 ] - DMExpress, Vertica, HP 5.4TB 데이터처리시간 : 57 분 21.51 초 [ 종전기록 ] Microsoft, Unisys 1.0TB 데이터처리시간 : 25 분 20.00 초 14

DMExpress 기능 기능 기능상세설명 기능 기능상세설명 SORT 레코드정렬기능으로다중 Sort 키적용가능 시스템 Sort 대비 5~10 배의 Sort 성능지원 사용자가정의한 Sort Order 방식지원 Conversion File Level, Record Level, Field Level 데이터변환 필드 type 이나 size 를변경하여출력가능 COPY Sort 작업없이필요한레코드나필드추출기능 Aggregate 동일키별최대, 최소, 평균값을구하는기능 MERGE 2 개이상의파일을한개의파일로병합하는기능 Numbering 레코드에순차적으로 Numbering 하는기능 JOIN 파일을 Join 하여 Left, Right, Inner, Outer Join 기능 서로다른파일을비교할수있으며 CDC 기능도구현 고성능연산 Aggregate 기능을고성능으로처리 REFORMAT Source 파일에서필요한필드만선택하여추출가능 레코드레이아웃변경및추가된신규필드추가 사칙연산 동일레코드의필드간사칙연산을할수있는기능 FILTER 데이터파티션과레코드선택추출 조건에따른데이터추출기능으로다중 output 지원 Date/Time 연산 일자, 시간데이터에대한 +, - 를할수있는기능 SUMMARIZE 중복데이터제거및마스터성데이터추출기능 Sort 키별합산 (Group by) 기능 BLANK 제거 Blank 레코드를일괄적으로제거하는기능 15

개발방식 : DMExpress GUI ( 간단한화면구성 ) 16

DMExpress GUI 17

DMExpress 기능 : Partition 18

개발방식 : DMExpress Script 19

DMExpress 기능 : JOIN Doe,Jane,65 Black St.,07677 Smith,John,12 Apple St.,10917 Central Valley, NY,10917 Woodcliff Lake,NJ,07677 DMExpress Doe,Jane,65 Black St.,Woodcliff Lake,NJ,07677 Smith,John,12 Apple St.,Central Valley, NY,10917 20

DMExpress 기능 : 복합기능을한번에 All in One Pass! Sorted, filtered, reformatted, aggregated and partitioned. 200005 CHK 83.73 200002 SAV 834.23 200001 MFUND 23.89 200011 CHK 62.92 200014 MFUND 5.92 200010 CHK 35.98 200012 MFUND 3.98 DMExpress CHK,182.63 SAV,834.23 21

적용사례 : 전사배치업무 적용분야. 대용량데이터가공처리업무. 업무시간 Open 전에데이터를처리하기위한야간배치업무에서사용 적용방식. 업무별배치요건을 DMExpress Script 로개발후스케줄러를이용하여수행. 업무별 DB 에서조건별로 SAM File 로 unload 후 Sort, Merge, Join, Filter, Reformat 작업. Target Table 에적재하기전데이터 Conversion 작업병행 Source DB Target DB (Sort) DB SAM File Output DB DB SAM File (Join) Output DB SAM File Output 결과조회 (Conversion, Reformat) 22

적용사례 : 통합 DB 정제작업 적용분야 - 외부기관별대용량파일데이터와 DB 간데이터처리업무 - 데이터정제와적재를자동화와월배치작업시간단축 적용방식 - 파일 to 파일 : DMExpress 에서파일을읽어서원하는형태로정제후파일로저장 - 파일 to DB : DMExpress 를이용해서파일의데이터를 DB 로적재하며적재하기전데이터변환진행 - DB to DB : DB 간의데이터이동을쉽게 GUI 방식으로지원하며고속으로데이터전송 RAW STA DW DM 기관별파일 (Data 정제및기간별분류 ) 누적파일 (Data 적재 ) [ 분석결과조회 ] 분포도 기관별 [DW 적재 / 확장 ] DB (Data 전송 ) DB DB DB ODS (Data 변환및적재 ) (Data 집계 / 분석을위한연산작업 ) 23

적용사례 : N 생명 ( 계리시스템 ) 적용분야. 계리시스템에필요한데이터추출, 가공, 적재업무 누구나쉽게사용 (Ease of Use). 다른시스템에존재하는데이터를주기적으로계리시스템으로이동하는배치업무에서사용 적용방식. 업무요건에맞게 DMExpress Application 을개발후스케줄러를이용하여수행. 타시스템 DB 의데이터를 SAM File 로 unload 후계리시스템 DB 에 load 하는작업. 대량의데이터를쉽고빠르게추출, 적재하는업무에적용사용중 관련시스템 DB 계리시스템 DB (Sort) (Load) DB (Unload) SAM File Output DB DB SAM File (Join) Output (Load) DB SAM File (Unload) (Conversion, Reformat, Load) 24

적용분야 SQL Migration DI Acceleration Batch Solution Big Data Solution 25

적용분야 SQL Migration DI Acceleration Batch Solution Big Data Solution DMExpress 실행시간 3 시간 54 분 ( 0.16 Days) SQL 실행시간 80 시간 ( 3 Days 8Hours) SQL 대비 DMExpress 성능 20 배이상향상 (76 시간이상절감 ) 작업시간단축으로인한서비스개선 ( 주말작업으로가능 ) Offloading 에의한파일시스템사용 (DB 자원사용절감 ) Temp Table 사용량감소 (DB 스토리지절감 ) 26

적용분야 SQL Migration DI Acceleration Batch Solution Big Data Solution 상위 20% jobs 에주목 - 장시간의작업들 - 대부분복잡함 - 대부분자원집약적 - 대부분불안정 / 오류가자주발생 27

적용분야 SQL Migration DI Acceleration Batch Solution Big Data Solution 데이터처리작업의병목현상제거 : 50% 이상절감가능 현재의 H/W 자원을적게사용 : 메모리사용량 50% 절감, CPU 사용량 60% 절감 GUI 개발환경제공 : 1 주일안에적용가능하며핸드코딩대비 75% 정도의개발생산성 28

적용분야 데이터 SQL 통합 DI 문제의 Batch 80% Big 가Data Migration Acceleration Solution Solution 데이터처리병목현상에서비롯되었습니다. DI Tools Focus: 80% Features 20% Performance DI Challenges: 20% Features 80% Performance 데이터처리작업의병목현상제거 : 50% 이상절감가능 현재의 H/W 자원을적게사용 : 메모리사용량 50% 절감, CPU 사용량 60% 절감 GUI 개발환경제공 : 1 주일안에적용가능하며핸드코딩대비 75% 정도의개발생산성 29

적용분야 Customer DI Platform Key Information Industry Business Challenge Solution Benefit Impact IBM DataStage 금융서비스 대출자산시스템에대한 SLA 준수불이행으로대출발생이지연됨 M/F 데이터를변환및가공후 DataStage 로 Load 정확한시간에 CDC 대출발생프로세스관련 SLA 충족 4시간작업을 1시간미만으로속도개선 CDC작업 2시간 - CDC 미만으로2 시간속도개선미만 - 4 시간 1 시간미만 Informatica 의료 VIP 고객유지 정확한시간에 CDC 고객이탈방지 월작업에서일작업으로 DW 개선 DW : 월작업 -> 일작업 Informatica 금융서비스 새로운예측분석서비스의지연으로인한매출감소 (SLAs : 5 일 ) informatica 의느린 Join 과 Aggregation 작업대체 Informatica 를위해 Pre- Sort 작업 예정대로새로운서비스개시 Met production SLAs. 주단위에서 5시간으로프로세스개선 주단위 -> 5 시간 Informatica 금융서비스 데이터생성이 36 시간이상걸리는 ODS 에기반하여의사결정이지연됨 CDC 작업 매일밤 22 억건의업데이트가일어나는데이터저장소 SLA에충족 100명의주요업무사용자에게적시에정보제공 적시에정보제공 Microsoft SSIS 게임웹분석작업 1-2 일지연됨 수백라인의 SQL 의대체작업. SLA에충족 2-3일작업을 5시간으로단축 사용자응답시간개선 2~3 일 -> 5 시간 Informatica 통신 어플리케이션최신화작업중데이터변환의병목현상으로인한신규고객서비스가중지됨 다중 DMExpress 작업을 Informatica 환경에접목 데이터변환시간 192hr에서 8hr로단축 7일동안중지되었던신규고객 provisioning 해결 192 시간 -> 8 시간 Informatica 금융서비스 데이터프로세싱불능으로인한서비스모델및대리점판매에장애발생 Informatica 환경에 Sort 와 Merge 작업 각대리점의고객위주의맞춤형홍보에요구되었던대리점별 SLA 충족맞춤홍보가능 Informatica 금융서비스 18M 에서 100M 레코드로데이터폭증으로인한일일거래감시레포트지연 87% 속도개선되는 Join 작업진행 SLA 충족 데이터사이즈에대한목표된성장준수 데이터사이즈증가대처 30

적용분야 SQL Migration DI Acceleration Batch Solution Big Data Solution Source DB Target DB (Sort) DB SAM File Output DB DB SAM File (Join) Output DB SAM File Output 결과조회 (Conversion, Reformat) 31

적용분야 SQL Migration DI Acceleration Batch Solution Big Data Solution 32

적용분야 SQL Migration DI Acceleration Batch Solution Big Data Solution Hadoop Connectivity Hadoop ETL Hadoop Sort 33

적용분야 SQL Migration DI Acceleration Batch Solution Big Data Solution 34

After Before 적용분야 Data Sources ETL Data Warehouse Business Intelligence ETL ELT Analytic Qu ery & Repor ting Data Sources ETL Data Warehouse Business Intelligence DMX-h ETL Analytic Query & Reporting 35

감사합니다. 개발은단순하게처리시간은짧게 36