IBM Cloud Private Experiences 시작하기전에 https://youtu.be/skducsvjeom에서환영비디오를볼수있습니다. IBM Cloud Private Experiences를문제없이사용하려면, 아래의웹브라우저중하나를설치해야합니다. Firefox Version 54 이상 Chrome Version 59.03 이상시작하려면, https://www.ibm.com/cloud/garage/cloud-private-experiences/icpd으로이동하여가입하거나로그인합니다. 로그인한후에는 Get my magic environment를클릭합니다. 관심있는경로에서 Let s Go를클릭합니다. Welcome 이메일을찾아서엽니다. 사용자이름과비밀번호가포함되어있습니다. 이메일에있는사용자이름 / 비밀번호를사용하여웹클라이언트에로그인합니다. 1
스토리 여러분이대형다국적은행에서일하며모기지신청처리업무를담당하고있다고가정합시다. 모기지신청을승인하는일은수작업으로진행되며많은자원이소요됩니다. 이과정에는고객의수입, 신용카드부채, 주택판매가격, 대출금액등다양한변수를조사하는작업이포함됩니다. 이모두가대출의위험도를결정하는데활용됩니다. 여러분은특정고객이채무를변제하지않을가능성을정확하기예측할수있는머신러닝모델을구축하여이프로세스를자동화해야합니다. 고객이웹또는모바일앱에서모기지신청을하면이모델이실시간으로호출될것입니다. 이모델을사용하면수작업없이몇초만에모기지신청서를분석하고승인여부를결정할수있습니다. 이를통해상당한비용을절감할수있으며, 무엇보다도신청결과를즉시알수있으므로고객서비스개선효과도얻을수있습니다. 과정 수집어디에서든쉽고빠르게데이터에액세스할수있도록기존데이터베이스에연결합니다. 구성데이터를신뢰할수있는데이터로바꿉니다. 자동화된검색기능을사용해데이터를 가져오고분석하고분류합니다. 데이터가일관성을유지하도록비즈니스용어를정의합니다. 규칙및정책을적용하여규정에맞는데이터를생성합니다. 유용한데이터가되도록 데이터를변환합니다. 그러나가장중요한것은데이터를엔터프라이즈데이터카탈로그에 게시하여사용자가쉽게검색할수있도록하는것입니다. 분석고객의모기지상환여부를예측하는머신러닝모델을구축, 배치및게시합니다. 이제각단계별학습을통해, 온라인모기지신청서를수집하고머신러닝모델을호출하여 실시간으로의사결정을내릴수있는최신웹또는모바일애플리케이션을구축, 배치및 관리하는방법을알아보겠습니다. 2
수집 학습목표 : 한곳에서데이터를수집하는방법 5~7분학습내용이단계에서는통합커넥터를사용하여은행의데이터소스중하나에연결합니다. 연결한후에는데이터를손쉽게검색하고분석해야할데이터를선택할수있습니다. 1. 분석을위한프로젝트생성일반적으로는데이터가개인정보및보안에관한모든은행규정을확실히준수할수있도록이미엔터프라이즈카탈로그에있는데이터를사용합니다. 하지만이과정에서는원격데이터소스에서분석프로젝트에데이터를추가하기가얼마나쉬운지보여드리겠습니다. 시작하려면은행의데이터소스중하나에연결을설정하십시오. 1. 메뉴에서 Collect > My Data를클릭합니다. 2. add data set 을클릭합니다. 3
3. Create a new analytics project 를선택합니다. 4. 프로젝트이름으로 data-analysis_<myusername> 을입력합니다. 5. Create 를클릭합니다. 6. Remote Data Set 을클릭합니다. 4
7. add data source 를클릭합니다. 8. 해당하는필드에아래정보를입력하여은행의 IBM DB2 웨어하우스데이터베이스에 연결합니다. Data source name: data-analysis-connection <myusername>. Data source type: Db2 JDBC URL: jdbc:db2://icpd-demo-ibm-db2oltpdev.default.svc.cluster.local:50000/mortgage Username: db2inst1 Password: password 5
9. 분석할데이터를지정할수있도록 Add remote data set 를클릭합니다. 10. 해당하는필드에아래정보를입력하여프로젝트에데이터를추가합니다. Remote data set name: MORTGAGE_JOIN Schema: db2inst1 Table: MORTGAGE_JOIN Create 를클릭합니다. 프로젝트를생성하고데이터를추가했습니다. 6
2. 카탈로그에서데이터검색엔터프라이즈데이터카탈로그를사용하면데이터가어디에있든사용자가신뢰할수있는관련데이터를찾을수있습니다. 데이터거버넌스팀은데이터를분석에사용할수있도록모든데이터소스에연결하고자산을카탈로그에게시해야합니다. 고객데이터가카탈로그에있는지확인하려면, 1. 메뉴에서 Organize > Data catalog를클릭합니다. 2. Database Tables 를클릭합니다. 7
3. 아래테이블이목록에있는지확인합니다. MORTGAGE_CUSTOMER MORTGAGE_DEFAULT MORTGAGE_PROPERTY 카탈로그에서데이터를찾았습니다. 모든데이터를손쉽게이용할수있습니다. 이과정을완료하여다음을수행했습니다. 데이터소스에연결 데이터를위한단일진입점생성 엔터프라이즈데이터카탈로그에서관련데이터식별 8
구성 학습주제 : 쉽게찾을수있도록데이터를구성하는방법 5~7분학습내용이단계에서는데이터를정리, 병합및변환하여머신러닝을위해데이터를준비합니다. 또한, 관련규정을준수하도록데이터에대한비즈니스정책및규칙을설정합니다. 이프로세스를완료하면신뢰할수있는데이터를확보하게됩니다. 1. 카탈로그에서데이터검색원하는데이터가이미엔터프라이즈데이터카탈로그에있는것이가장좋습니다. 시작하려면, 1. Search 아이콘을클릭하여검색창을엽니다. 2. 검색창에 Mortgage 라고입력하고 Enter 를누릅니다. 9
3. 다음테이블이결과에포함됩니다. MORTGAGE_CUSTOMER MORTGAGE_PROPERTY MORTGAGE_DEFAULT 카탈로그에서데이터를찾았습니다. 10
2. 데이터에대한정책및규칙설정가장좋은데이터는신뢰할수있는데이터입니다. 데이터의출처와데이터가정보보안, 개인정보보호또는규제준수와같은문제를다루는정책및규칙세트를준수한다는것을알면데이터에대한확신을가질수있습니다. 고객정보를다루므로, 데이터를비공개로유지하고특정사용자만이에액세스할수있도록해야합니다. 관계그래프또는세부정보페이지에서자산에적용된정책및규칙을확인할수있습니다. 시작하려면, 1. 검색결과에서 MORTGAGE_CUSTOMER를선택합니다. 2. Details 를클릭합니다. 11
3. Details 페이지에서이미몇가지규칙이적용되어있음을확인할수있습니다. 더이상필요하지않을경우데이터삭제 적절한승인없이는데이터가공유되지않음 데이터에정책과규칙을설정했습니다. 12
3. 분석을위한데이터준비데이터를사용하여머신러닝모델을구축하려면먼저데이터를변환하고정리해야가장정확한결과를얻을수있습니다. 정리를통해중복, 부정확, 불완전또는부적절한형식의데이터를제거합니다. 이예제에서는 3개의테이블을하나의테이블로조인하여데이터를변환합니다. 시작하려면, 1. Organize > Transform data를클릭합니다. 2. 사용자를위해 Mortgage_datatransform 이라고하는데이터변환워크플로우를생성해 두었습니다. 원한다면, 변환워크플로우를열어카탈로그의테이블 3 개를 MORTGAGE_JOIN 이라는하나의테이블로조인하는것을확인할수도있습니다. 13
3. 변환된데이터가어떤형태인지살펴보겠습니다. Search 아이콘을클릭하여검색 창을엽니다. 4. 검색창에 MORTGAGE_JOIN 이라고입력하고 Enter 를누릅니다. 5. Preview 를클릭합니다. 6. 아래사용자이름 / 비밀번호로데이터베이스를인증합니다. User name: db2inst1 Password: password 14
7. Continue 를클릭합니다. 8. 데이터탐색을완료하면, Close 를클릭합니다. 분석을위한데이터를준비했습니다. 찾기쉽도록데이터를구성했습니다. 이과정을완료하여다음을수행했습니다. 조직및규제요구사항준수 유용하도록데이터변환 15
분석 학습목표 : 데이터분석및모델구축 5~7분학습내용이단계에서는검색및변환된데이터를사용하여예측모델을구축합니다. 노트북을사용하여신속하게모델을구축하고교육합니다. 사용할데이터는 Mortgage입니다. 시작하기전에 https://www.ibm.com/cloud/garage/cloud-private-experiences/icpd/ 에서 Analyze and Build 모듈에있는 Prerequisite files 를다운로드하십시오. Let s go 를클릭하여과정을시작하십시오. 16
1. 분석프로젝트생성프로젝트는분석을수행해야하는자산의모음입니다. 시작하려면, 1. 메뉴에서 Projects를클릭합니다. 2. New Project 를클릭합니다. 3. 프로젝트의이름을 data-analysis_<myusername>2 라고지정합니다. 17
4. OK 를클릭합니다. 5. Create 를클릭합니다 ( 프로젝트생성에몇분정도걸릴수있음 ). 분석프로젝트를생성했습니다. 18
2. 프로젝트에데이터추가다운로드한 Prerequisite 파일을기억하십니까? 이 CSV 파일을프로젝트에추가하여분석시해당데이터를사용할수있도록하겠습니다. 시작하려면, 1. Assets를클릭합니다. 2. Data Sets 를클릭합니다. 3. add data set 을클릭합니다. 19
4. Select from your local file system 을클릭합니다. 5. 워크스테이션에서다음파일을업로드합니다. Mortgage_Customer.csv Mortgage_Default.csv Mortgage_Property.csv 프로젝트에데이터를추가했습니다. 20
3. 프로젝트에노트북추가이제필요한데이터를확보했으니머신러닝모델구축을시작할수있습니다. 시작하려면, 1. + 아이콘을클릭하고 Create notebook을선택합니다. 2. From File 을선택합니다. 21
3. browse 를클릭하고워크스테이션에서노트북 (MortgageDefault- BuildSave.jupyter.ipynb) 을업로드합니다. 4. Create 를클릭합니다 ( 노트북을생성및시작하는데몇초정도걸릴수있음 ). 프로젝트에노트북을추가했습니다. 22
4. 모델구축및교육이노트북은고객의모기지상환여부를예측하는머신러닝모델을생성합니다. 코드를더잘이해할수있도록진행하기전에노트북을살펴보시기바랍니다. 시작하려면, 1. Cell > Run All을클릭하여모델을교육합니다. 2. 모델이구축및저장되었는지확인하기위해프로젝트이름을클릭합니다. 3. Predict Mortgage Default LOS 모델이표시되는지확인합니다. 모델을교육하고저장했습니다. 23
5. 모델테스트모델을테스트할준비가되었습니다. 시작하려면, 1. action 메뉴를열고 Test를클릭합니다. 2. Input 섹션으로스크롤하여 Submit 을클릭합니다. 값을조정하여다양한입력값이결과에어떤영향을미치는지확인할수있습니다. 24
모델을테스트했습니다. 데이터를분석하고강력한모델을구축했습니다. 이과정을완료하여다음을수행했습니다. 분석프로젝트생성 노트북을실행하여모델을생성하고이를모델리포지토리에저장 모델테스트 25