신한은행빅데이터센터설립그리고 12 명

Similar documents
김기남_ATDC2016_160620_[키노트].key

PowerPoint 프레젠테이션

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

PowerPoint 프레젠테이션

methods.hwp


슬라이드 1

ㅇ ㅇ

빅데이터_DAY key

consulting

Ä¡¿ì³»ÁöÃÖÁ¾

기타자료.PDF

ETL_project_best_practice1.ppt

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

PowerPoint Presentation

170918_hjk_datayanolja_v1.0.1.

aws

슬라이드 1

Orcad Capture 9.x

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

U.Tu System Application DW Service AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형


PowerPoint 프레젠테이션

2014밝고고운동요부르기-수정3

2005프로그램표지


untitled

COVER.HWP

이슈분석 2000 Vol.1

가볍게읽는-내지-1-2

kbs_thesis.hwp


한눈에-아세안 내지-1

텀블러514

e-spider_제품표준제안서_160516


gcp

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석


untitled

......V16.

(, sta*s*cal disclosure control) - (Risk) and (U*lity) (Synthe*c Data) 4. 5.

Data Industry White Paper

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

OR MS와 응용-03장

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

Microsoft Word - 조병호

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

PowerPoint 프레젠테이션

2 전개과정 지도계획 주기 주제 활동 방법 및 내용 성취수준 주제발현 브레인스토밍 유목화 1 한식 알아보기 요리법 연구하고, 학고역할분담 조리 계획하기 생명과 음식 영화감상하기 생명과 음식 토론하기 한식 식사예절 알아보기 6 음식 주제발현, 브레인스토밍, 유

DW 개요.PDF

전립선암발생률추정과관련요인분석 : The Korean Cancer Prevention Study-II (KCPS-II)

(A4)2급-A형_ hwp

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

BSC Discussion 1

[한반도]한국의 ICT 현주소(송부)

PowerPoint 프레젠테이션

목 차 Ⅰ. 조사개요 1 1. 조사배경및목적 1 2. 조사내용및방법 2 3. 조사기간 2 4. 조사자 2 5. 기대효과 2 Ⅱ. P2P 대출일반현황 3 1. P2P 대출의개념 3 2. P2P 대출의성장배경 7 3. P2P 대출의장점과위험 8 4. P2P 대출산업최근동향

PowerPoint 프레젠테이션

PCServerMgmt7

I I-1 I-2 I-3 I-4 I-5 I-6 GIS II II-1 II-2 II-3 III III-1 III-2 III-3 III-4 III-5 III-6 IV GIS IV-1 IV-2 (Complement) IV-3 IV-4 V References * 2012.

슬라이드 1

15_3oracle

서현수

3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : /45

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

? Search Search Search Search Long-Tail Long-Tail Long-Tail Long-Tail Media Media Media Media Web2.0 Web2.0 Web2.0 Web2.0 Communication Advertisement

Ch 1 머신러닝 개요.pptx

Probability Overview Naive Bayes Classifier Director of TEAMLAB Sungchul Choi

CMS-내지(서진이)

<4D F736F F D20302EC0CEC6AEB7CE2BC1BEB8F1B8AEBDBAC6AE2BBCBAB0FA BCBAB0FABEF7B5A5C0CCC6AEBFCFB7E1292E646F6378>

BIS Solvency (RBC) Solvency. Solvency,. Solvency.

목차 생활용품오염물질방출시험및방출특성연구 (IV) - 전기 전자제품방출오염물질권고기준 ( 안 ) 도출 - ⅰ ⅱ ⅲ Abstract ⅳ 환경기반연구부생활환경연구과 Ⅰ,,,,,, 2010 Ⅱ i

2017 1

I What is Syrup Store? 1. Syrup Store 2. Syrup Store Component 3.

Office 365, FastTrack 4 FastTrack. Tony Striefel FastTrack FastTrack

확률 및 분포

C O N T E N T S 목 차 요약 / 3 Ⅰ. 브라질소비시장동향및특성 경제현황 2. 소비시장의특성 Ⅱ. 브라질소비시장히트상품분석 최근히트상품 년소비시장, 이런상품을주목하라! Ⅲ. 우리기업의 4P 진출전략

슬라이드 1

PowerPoint 프레젠테이션

ORANGE FOR ORACLE V4.0 INSTALLATION GUIDE (Online Upgrade) ORANGE CONFIGURATION ADMIN O

슬라이드 1

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

[로플랫]표준상품소개서_(1.042)

歯두산3.PDF

¾Ö´º¾ó¸®Æ÷Æ®(2010)1.ps

i4uNETWORKS_CompanyBrief_ key

Microsoft PowerPoint - 3.공영DBM_최동욱_본부장-중소기업의_실용주의_CRM

(001~006)개념RPM3-2(부속)

03 ¸ñÂ÷

£05ä·Ð

( )실험계획법-머리말 ok

News Letter(6월).hwp

PowerPoint 프레젠테이션

슬라이드 1

Microsoft PowerPoint - 6.CRM_Consulting.ppt

Service-Oriented Architecture Copyright Tmax Soft 2005

Transcription:

SAS FORUM 빅데이터경영혁신사례신한은행빅데이터센터윤근혁팀장

16.04.28 신한은행빅데이터센터설립그리고 12 명

빅데이터센터조직도 빅데이터센터 ( 총 33 명 ) 본부장 BD 사업팀 (7 명 ) BD 솔루션팀 (18 명 ) BD 플랫폼팀 (7 명 ) 전략수립 / 협업 신기술도입 / 활용 플랫폼 / 솔루션구축및관리 제휴 / 신사업 분석 / 모형개발 데이터거버넌스수립및관리 시장트렌드분석및보고 분석가양성

단계별빅데이터사업추진전략 Phase Ⅲ(2018 年 ~) Phase Ⅰ(2016 年 ~) 빅데이터플랫폼 TEXT 기반구축 Phase Ⅱ(2017 年 ~) 알고리즘기반수익모델개발 은행권최초 빅데이터정보화 사업추진 비정형데이터분석플랫폼구축 (VOC 3.0) 빅데이터기반의사결정체계구축 ( 시각화분석플랫폼 ) AI 코어플랫폼구축 Customer journey 분석솔루션도입 알고리즘기반 Peer Group 상담지원시스템개발 WM 고자산고객가망 / 이탈모형개발 최적상품추천모델 Core Data 개방및가치증대 금융권최초데이터유통생태계선도 주도적 Big Data Alliance 구축

X ML Scientist 최소 17~20 단계이상 데이터담당자 보안담당자 서버담당자 Y

MACHINE LEARNING SCIENTIST AI CORE PLATFORM PLATFORM MANAGER WORK SPACE 2 WORK SPACE 3 OPERATNG SYSTEM LIBRARY 학습 WORKER CLUSTER 플랫폼 관리 사용자승인 / 권한관리 WORKSPACE 승인 / 관리 배포승인 / 관리 WORKSPACE DEVELOP ENVIRONMENT EXPERIMENT EXPERIMENT 추가 / 패치 머신러닝라이브러리추가 / 업데이트 알고리즘, IDE 추가 / 업데이트 ALGORITHM / PARAMETER PLATFORM MANAGER DATA REPOSITORY INTERNAL INFRASTRUCTURE 모니터링 시스템모니터링 사용자동작등로그모니터링 DATA / PRE-PROCESSING EXPERIMENT MODEL SHINHAN BANK SERVICE 운영 WORKER CLUSTER 챗봇 (NLP CHATBOT) MODEL 이상징후감지시스템 (FDS) RELEASE IMG INTERFACE 고객신용평가시스템 (CSS)

Phase Ⅰ 빅데이터플랫폼기반구축 _1) AI CORE PLATFORM 효율적리소스관리환경구축 지속적인업그레이드및확장을위한표준화프로세스구축 ML Scientist 데이터담당자보안담당자 서버담당자 특정업체에서제공한머신러닝라이브러리와알고리즘에 최소 17~20 단계이상 따른서비스확장및자체디지털역량강화에어려움. ML Scientist Platform Manager 최대 7 단계 TensorFlow, H2O, scikit-learn, Keras 등오픈소스기반으로 연구목적에적합한환경을개발자스스로선택가능.

고객명 : 신한쏠직업 : 대기업취미 : 여행가기거래현황 : 입출금통장만보유, 환전거래많음 2017.12 활동고객? 2018.04 이탈고객

Phase Ⅰ 빅데이터플랫폼기반구축 _Customer Journey 분석솔루션도입 도입성과 인지탐색신규거래 환율조회 여행적금신규완료 투자상품 3 회검색 펀드가입 유입 1 고객이해기반개인화마케팅지원 2 마케팅효율성, 효과성제고 3 빅데이터분석생산성향상 여행적금권유 ONLY 입출금 + 환율조회는이탈고객주요패턴 모바일쪽지접촉디지털상품검색후이탈확률높아모바일쪽지로상담 이탈

단계별빅데이터사업추진전략 Phase Ⅱ(2017 年 ~) 알고리즘기반수익모델개발 알고리즘기반 Peer Group 상담지원시스템개발 WM 고자산고객가망 / 이탈모형개발 최적상품추천모델

Data 1.0 Data 2.0 Data 3.0 Data 4.0 2005 2007 2009-2010 2015-2016 2016~ CRP CRP 모델고객가치기반세분화 CRP 기반고객관리체계 JUMP 프로그램 New CRP FCV( 통합고객가치 ) 모델고객 Segment ( 채널, 상품등 ) 상품가입예측모델 CRM 역량강화 EBCM / L2S 최적상품추천통합고객관리 CRM 업그레이드옴니채널마케팅맞춤상품추천캠페인시스템업그레이드 Big Data Peer Group 상담지원시스템 WM 추정 / 이탈모형 CRP : Customer Rediscovery Program( 고객재발견 )

저만그런가요??

Phase Ⅱ 알고리즘기반수익모델개발 _1) Peer Group 상담지원시스템 flow 정보입력 나와같은사람들의평균생활 보유자산비교 나의금융생활점수 베스트상품정보

1 970 만 Peer Group 통계값산출 2 Peer 內고객의금융점수산출 3 개인화상품추천 1 만명 Data 970 만 Segment 값추정 설문 (1 만명 ) 산출 Logic Similarity- Hierarchy Logic 개발 / 적용 : GLM 기반 Factor 별영향도산출및수치화 Peer 값 (970 만 ) 1 실 Data 값이없는 Peer 의유사 Peer 찾기 Peer 를구성하는 10 개 Factor 1) 의영향도를산출하여값이있는가장유사한 Peer 선정 2 유사 Peer 값기반 Peer 통계값산출 GLM(General Linear Model) 기반 10 개 Factor 별영향도를수치화 (Scaling ratio) 후 Peer Group 통계값산출 * Peer 값 = 유사 Peer 값 Scaling ratio 고객금융점수산출을위해 970 만 Peer Group 별자산, 저축, 소비분포추정 / 점수화 [Peer Group A 의금융자산별고객분포 ] 고객수 통계적추정산출값 실제값 금융자산 금액 MIN 고객위치 MAX 1 Peer 內통계값별고객분포추정 Peer Group 內고객수준 Peer 內고객수준을파악하기위해선 Peer 구성원의분포및 Max/Min 값이필요 결합확률밀도함수 (multivariate - Log-normal distribution) 를사용하여전체분포를추정함 2 구성원분포도기반고객점수화점수 = [Min~ 고객위치 ] 면적 100 [MIN ~ Max] 면적 Peer Group Segment 기준을당행고객정보에적용하여고객세분화 ( 당행미수집정보항목제외, 2200 개세분화 ) 1 최근 3 개월 Peer Group 별상품신규수비중을산출하여타 Peer 대비가입비중이가장높은상품,, 순위도출 2 상대적상품선호도순위 절대적상품선호도순위 최근 3 개월간 Peer Group 구성고객이가장많이가입한상품,, 순위도출 3 최종상품추천 Logic Peer Group 별상대적 / 절대적선호상품조합 1 상대적선호 순위상품 2 절대적선호 순위상품 3 상대적선호 순위상품 1) 성, 연령, 거주지, 직업, 소득수준, 결혼여부, 자녀수, 주거형태, 주거소유형태, 맞벌이여부

Phase Ⅱ 알고리즘기반수익모델개발 _2) WM 추정 / 이탈모형 Modeling 타겟정확도 (AR) 유효변수선택 단변량분석 Classing 상관관계분석 고자산고객구분변별력이높은 Factor 선택 (P-value 0.05 이하 ) (T-test, Logistic Regression, 카이제곱검정수행 ) Score 의안정성증대및특정 Factor 값에유연한대처를위해 Factor 값범주화수행후변별력이높은 Factor 선택 (WOE, IV, AR, KS, ROC 기준 ) 각정보영역별항목간상관계수가높은그룹중변별력수준기준대표 Factor 만선별 (Rounding) 누적고자산비율 100% 80% 60% 40% 75.6% 신모델 47.0% 기존모델 Random Mode 모델링 Modeling 등급화 Logistic Regression 을사용하여각 Factor 에대한영향도산출 산출계수값을각변수구간에할당,Score Card 생성 고자산가능성이높은소수의고객을조기에관리하기위함으로, 모형등급체계는고자산소수고객을선별하는방향으로등급부여 20% 0% 28.6% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 전체누적고객수비율

Phase Ⅱ 알고리즘기반수익모델개발 _2) WM 추정 / 이탈모형 Modeling 타겟정확도 (AR) 단변량분석 100% 신모델 유효변수선택 모델링 Classing 상관관계분석 통계모형 Machine Learning 타겟정의 활용 Cut off 산정 모형결합 영업점 / MIDAS 80% 60% 40% 20% 0% 75.6% 예측모형기존모델 47.0% 85% Random Mode 추출 28.6% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 전체누적고객수비율

단계별빅데이터사업추진전략 Phase Ⅲ(2018 年 ~) 은행권최초빅데이터정보화사업추진 Core Data 개방및가치증대 금융권최초데이터유통생태계선도 주도적 Big Data Alliance 구축

C O R E C.A.S.H

Phase Ⅱ 알고리즘기반수익모델개발 _1) C.A.S.H Re-define data 를통해 C.A.S.H. 로재정의한 Core Data 가 Big Data 를만나 Recipe 1) 가되다 Customer Asset Store 2,473만 254조 900 店 + 지리정보 학군정보 상권정보 서울시, 소득편內급여지도 급여편차높은지역양극화해소정책필요 급여금액낮은지역低소득복지정책의주요모니터링지역 History of money 3 억건 업무지구등 1) Recipe : Regional Cash Insights for Person, 지도를통해바라본개인금융생활

Phase Ⅱ 알고리즘기반수익모델개발 _2) 데이터이노베이션센터 : 외부분석가들이다양한관점으로은행데이터를분석, 새로운데이터가치를창출하는물리적공간및가상공간 [ 구성도 ] 데이터및분석환경제공 AWS CLOUD 보유데이터 분석 Tool (BI, M/L) 스타트업연구기관분석가 사업기회발굴연구결과공유

SAS FORUM 창조성은새로운것을생각해내는능력이며혁신은새로운것을하는능력이다. Theodore Levitt-