<Insert Picture Here> BI Workshop for Partitioning Customer - OLAP, Data Mining & BI Suite EE Yong Han Kim Business Intelligence Analytics
Agenda 기업 IT 현황과발전방향 Oracle의가치제안 Oracle OLAP Oracle Data Mining Oracle Business Intelligence Solutions Standard Edition Enterprise Edition 결론 데모 <Insert Picture Here>
기업 IT 현황과발전방향
기업 IT 현황과과제 현황 트랜잭션처리시스템 단위업무지원을위한데이터베이스구축 생산 / 영업 / 재무 / 인사관리시스템 데이터웨어하우스 / 데이터마트 데이터분석, 통계및리포트를위한데이터베이스구축 Oracle Partition option 사용 과제 좀더가속화된기업활동을위한환경의필요성 축적된기업데이터의활용및가치극대화 과학적의사결정을위한지식으로의발전
실시간기업환경 an enterprise that competes by using up-to-date information to progressively remove delays to the management and execution of its critical business processes - Gartner, Definition of Real Time Enterprise Real Time Enterprise 기업환경의변화속도에대응하는기업경쟁력강화를위한새로운전략의필요성 관리와중요업무프로세스의실행간의지연최소화가가장중요한요소 ( Remove delays ) 가장최신 ( Up-to-date ) 정보를제공하고활용하는경쟁력있는기업 Real Time Enterprise 를위한추세 업무프로세스혁신 - Process Innovation, 6 sigma IT 측면 DW 의확장, SEM(CPM, BSC)
데이터활용방향 데이터 (Data) 단순한사실들에대한나열 트랜잭션에서발생하는데이터 The Decision Support Value Chain 정보 (Information) 사실과이들간의관계를기반으로얻어진것 예 ) 전년대비실적증가율 Decision Action 지식 (Knowledge) 데이터간의과학적연관정보 정보들의평가과정을통한기업실행전략 의사결정 (Decision) 지식에근거한과학적인전략적의사결정 Data Knowledge Information Results
Oracle 의가치제안
Oracle 고급분석전략 더많이알라! 자신의데이터를활용하여새로운숨겨진유형을발견 그결과를업무를위한통찰력으로발전 더많은일을하라! 추출을자동화하고, Mining 에서얻어진통찰력을배포하는애플리케이션을생성 단순도구가아닌기업 BI 애플리케이션으로발전 비용을적게사용하라! Oracle 10g DBMS Enterprise Edition 의옵션을사용하여비용감소 새로운서버, 소프트웨어, 지원기술 / 자원을제거
오라클의가치제안 기존 IT 투자비용의활용 데이터 -> 정보 : Oracle OLAP 정보 -> 지식 : Oracle Data Mining 새로운정보활용패러다임의적용 광범위한계층의정보활용 이기종데이터관리환경의폭넓은지원 데이터의가치활용극대화 : Oracle BI Suite EE 정보활용의극대화를위한솔루션및로드맵제공 시스템의복잡성감소 단일플랫폼을통한유기적연계환경의지원
단일통합플랫폼으로서의 DBMS Query & Reporting Oracle BI Solution BI Beans Oracle Reports Oracle 10g DBMS Data Warehousing ETL PRODUCT TIME REGION Drill for Detail OLAP Option Spreadsheet Add-In OLAP Statistics Access & Assemble Data Oracle Warehouse Builder Data Integrator Data Mining Mine for New Insights Oracle Data Mining Option Spreadsheet Add-In Statistics Text Mining
Oracle OLAP
Oracle OLAP 10g RDBMS 에서수행하기어려운분석계산기능을수행하는 Oracle DBMS 의통합된기능 데이터관리를관계형테이블이아닌다차원객체로관리 장점 단일 RDBMS-MDDS 프로세스지원 단일데이터저장장소 ( 테이블스페이스 ) 단일메타데이터리퍼지토리 단일관리툴 (OEM) 단일보안모델 (Oracle DBMS 의보안 ) OLAP API 와 SQL 인터페이스제공
다차원객체데이터간의논리적인관계를정의 Time DAY_ID MONTH_NAME QUARTER_NAME YEAR_NAME ALL_YEARS Time All Years Category Total Category Organization Parent/Child Field_Org ORG_ID ORG_DESC PARENT 1 * 1 * Expense_Fraud_View DAY_ID ORG_ID ITEM_ID EXPENSE_AMOUNT PREDICTION PROBABILITY PREDICTED_FRAUD_COST Year Quarter Month Category Item Day * 1 Category ITEM_ID ITEM_NAME CATEGORY_NAME TOTAL_CATEGORY 장점 최종사용자분석을간단하게 질의요청에대한명세 계산정의 집계와계산의용이성 질의성능향상 차원값의인덱스를통해 KPI를직접접근 예 ) 2 X 2 배열
다차원 OLAP 의성능측정사례 DBI 성능측정 Ad-hoc 질의성능측정 600 500 469 500 480 400 400 Minutes 300 200 Minutes 300 200 100 100 0 Materialized Views (partially aggregated*) 9 OLAP (fully aggregated**) 0 Without OLAP 20 With OLAP
Oracle OLAP 10g 의아키텍쳐 Oracle Database Oracle Call Interface JDBC Relational Technology SQL Engine Object Technology OLAP_TABLE OLAP Technology Multidimensional Engine Relational Cubes Multidimensional Cubes 관계형데이터기반 다차원데이터기반
Oracle OLAP 10g 의접근방법 OLAP API Application Generic SQL Application OLAP aware SQL Application OLAP API OCI or JDBC OCI or JDBC Select from View/table SQL Generator Select from View/table RDBMS View Select from view Table Function Select from OLAP_TABLE DBMS_AW.EXECUTE DBMS_AW.INTERP DBMS_AW.INTERPCLOB Relational Multidimensional
분석작업공간을통한다차원객체생성 분석작업공간을 이용한다차원객체의 정의및데이터적재 BLOB 데이터타입에 저장되는다차원 DB
SQL 을통한접근예 create or replace view sales_view as select * from table(olap_table('production.sales DURATION query', 'SALES_TYPE_TABLE', '', 'DIMENSION time_id FROM time DIMENSION channel_id FROM channel DIMENSION product_id FROM product DIMENSION customer_id FROM customer MEASURE sales FROM sales MEASURE quantity FROM quantity MEASURE cost from cost MEASURE custmeas_1 from custmeas_1 MEASURE custmeas_2 from custmeas_2 MEASURE custmeas_3 from custmeas_3' )) where sales is not null;
GUI 환경 다양한사용자접근환경의지원 Oracle BI Solutions Oracle BI EE Cognos Business Objects Other Third Parties BI Beans Applications Relational Views Excel Oracle Database 10g BI SE - Discoverer Amt Growth Expense Amount Amt YTD Amt Share BI EE
Oracle Data Mining
Data Mining 정의 데이터마이닝이란? 데이터내의패턴과관계를찾아내고, 이지식을이용하여새로운데이터를분류하는프로세스 데이터마이닝프로세스 모집단에대한모델을생성하고, 이를새로운데이터에적용하여결과를예측하는일련의과정 데이터마이닝의예 고객이탈 (Churn) 보험사기 (Fraud) 교차판매 (Cross Selling) 신용위험 (Credit Risk)
분석의영역 질의및리포팅 OLAP 데이터마이닝 상세및요약데이터의추출 요약, 경향및예측 숨겨진패턴과통찰 (Insights) 의지식발견 지난 3 년간뮤추얼펀드를구매한사람은? 뮤추얼펀드구매자의수입분포는어떤가? 다음 6 개월내에뮤추얼펀드를구매할고객은? 데이터정보지식
Data Mining 예 ) 분류기법 사례레코드 기록데이터 애트리뷰트 Name Income Age....... Jones 30,000 30 Smith 55,000 67 Lee 25,000 23 Rogers 50,000 44 X 1 X 2... Xm Y 예측애트리뷰트추가애트리뷰트 제품을살것인가? 1 =Yes, 0 =No 1 1 0 0 목표애트리뷰트 함수관계 : 모델 Y = F(X 2,, X m ) 새로운데이터 예측 1 0 1 0 확률.85.74.93.65
Data Mining 프로세스 프로세스 문제의정의 역할 업무전문가 적합한데이터의확인 DBA/ 데이터분석가 데이터준비 DBA/ 데이터분석가 모델생성과테스트 데이터분석가 모델배포 IT 개발자 모델적용 최종사용자
Oracle Data Mining Oracle Mining 플랫폼 PL/SQL API Java API Oracle Data Miner (GUI) 예측분석을위한 Spreadsheet Add-In
Oracle Data Mining 기법 Attribute Importance 목표속성에가장영향을미치는속성의발견 고비용과관련된요인 Classification 과 Prediction 고객행위예측 캠페인에반응할고객 고객프로파일의개발 A1 A2 A3 A4 A5 A6 A7 Married >$50K Gender Income <=$50K Age M F >35 <=35 Status Gender HH Size Single F M >4 Buy = 0 Buy = 1 Buy = 0 Buy = 1 Buy = 0 <=4 Buy = 1 Regression 수치값의예측 구매금액또는비용의예측
Oracle Data Mining 기법 Clustering 그룹화할수있는집단의발견 시장세분화 비정상유형으로부터정상유형의구별 Association Rules 장바구니에서연관항목들의발견 상품조합에대한제안 Feature Extraction 대량의집합으로부터대표적인새로운속성으로의축소 F1 F2 F3 F4
Oracle Data Mining 기법 Anomaly Detection One-Class SVM Models 사기, 계약불이행 Outlier 발견 네트워크침입발견 병원의급증 희귀이벤트, 신종유형 X2 X1 Problem: 희귀또는비정상적인경우의발견 X2
Oracle Data Miner Data Miner Oracle Data Mining 모델을생성하고, 평가하고, 적용하기위한 GUI 툴 마법사기반 Mining 활동의안내지원 애플리케이션개발환경 운영애플리케이션을위한 SQL과 Java Code의생성 Data Mining의통찰력을다른 BI 툴과애플리케이션에통합
예측분석을위한 Spreadsheet Add-In Excel 사용자가 Oracle 또는 Excel 데이터를간단하게분석할수있게하는기능지원 사용자는테이블 / 뷰또는 Excel 의데이터를지정하여목표속성을선택하여예측분석을수행
Oracle Business Intelligence Solutions
Standard Edition 개요 Oracle Discoverer 비정형과리포트를위한기존 BI 솔루션 최종사용자를위한쉬운인터페이스 유연한배치와확장성 직관적관리환경제공 OLTP DW OLAP
Standard Edition 특장점 동일한사용자인터페이스를통한사용의편이성과학습용이성 Discoverer Plus Discoverer Viewer Portlet 을이용 Portal Page 를구성한예
Enterprise Edition 개요 분석을위한비정형질의와대시보드, Alert 및고급리포팅기능을제공하는통합 BI Solutions 대화형대시보드 Reporting & Publishing 비정형질의분석 선행감지와경고 모바일분석환경 MS Office Plug-in 단순한비즈니스모델과추상화계층 Oracle BI Server Intelligent 캐시서비스 다차원계산과통합엔진 Intelligent 요청생성과최적화된데이터접근서비스 데이터웨어하우스데이터마트 SAP, Oracle PeopleSoft, Siebel, Custom Apps Files Excel XML Business Process
메타데이터리퍼지토리 Presentation Layer Business Model Layer Physical Layer DB2 Supply Chain DM Teradata OLAP Oracle Back Office Fin. XML Data Source SQL Server Acxiom Siebel Operational
Oracle Interactive Dashboard 개인 Alert 특정또는모든분석사이의컨텍스트를결정하는프롬프트 Time-Series 트랜드분석 손쉬운요청변경과인쇄, Refresh 또는다양한파일포맷으로다운로드 데이터값들간의범위에따라최저또는최고를쉽게인지하도록하는 Alternative 데이터시각화
Oracle Answers - 비정형질의 사용자의요청레이아웃구성 요청의결과 다양한분석주제의구현
Oracle Delivers - Sense & Reponse KPI 에대한조건부여후이벤트감지후통보 스케쥴링과 ibot 이란지능형 Agent
BI Publiser - 고급리포팅 다양한사용자요구사항을위한웹리포팅 Invoices Checks Labels Reports DestinationsXML / EFT / EDI
SE vs. EE Standard Edition Business Layer 와 Presentation Layer 가공존 메타데이터 EUL 에존재하는차원과 Fact 의모델정의 Enterprise Edition Business Layer 와 Presentation Layer 의구분 Business Layer 에서다차원논리객체의정의 차원과차원의계층구조및 Logical Key 정의 Fact 항목의차원레벨에대한정의 SE -> EE 로의 Migration 차원 : Logical Key 에대한정의필요 Fact : 차원레벨에기반한 Fact 의경우차원레벨정의필요
결론
Oracle 의제품전략 통합된 Business Intelligence 데이터베이스 데이터베이스에 BI 를위한 OLAP 과 Data Mining 이통합 통합된 Business Intelligence 툴 최상의차세대 BI 기술플랫폼을지원하는개발환경의지원 통합된 Analytic Applications 기업전반에걸친산업특화된분석과경영성과관리를위한애플리케이션 확장가능하고개방형통합기반기술환경의지원
기업의목표 - Insight Driven Enterprise Customers CxO Process Workers Managers Sales Teams Partners Suppliers Information-Driven Oracle Fusion Applications Corporate Performance Management BI Applications Industry Specific Supply Chain Human Capital Finance Sales Service Marketing Enterprise Information Model Oracle Fusion Middleware Enterprise Applications Oracle Databases Other Databases Syndicated Data Other Operational & Analytic Sources
데모