솔리드웨어프로젝트현황 데이터자동전처리 Machine Learning 기법적용 예측모델산출 CSS, 보험 Underwriting, Marketing, CRM 자동차보험고객손해액예측솔루션개발 개인대출고객연체율예측솔루션개발 Machine Learning 기반대안적 U/W 모형개발 소매중금리신용평가모형개발 AS 신용평가모형고도화프로젝트 기업을위한실질적가치창출용 인공지능솔루션
핵심기술 : Machine Learning 가장발전된빅데이터분석기술
컴퓨터과학및인공지능의하위분야로서, 데이터를통한알고리즘트레이닝에기초하며, 복잡하고정교한예측함수를도출하여 추정하고자하는미래의값들을구합니다.
Machine Learning 은다양한 IT 기업에서 활용된바있으며, 수많은실적을통해 이미성능이검증된기술입니다. Machine Learning 성공사례 광고업, 검색엔진, 스팸탐지, 음성인식, 광고업, 검색엔진, Kinect, 광고업, 상품추천, 상품인식, 광고업, 뉴스피드, 친구추천, 얼굴인식,
최근 Machine Learning 이부각되는이유는? 1. 고성능컴퓨터의보편화 2. 보다향상된알고리즘 3. 증가된데이터의양 현재존재하는모든데이터의 90% 를지난 2 년간생산했을정도로우리는수많은데이터를생산하고있다 " - Petter Bae Brandtzæ g, SINTEF ICT
Computer Vision 분야내 Machine Learning 연혁 1980s 정렬법 2000s 가변형모델 모델기반 통합 데이터기반 1970s 수공모델 1990s 격자모델 2010s 융합네트워크
Computer Vision 연구원이사용하는데이터의양은? 2004 Caltech 101 10K 이미지사용 2005-2010 Pascal VOC 2K 30K 물체사용 2010-2015 Image Net 10M 15M 이미지사용 Image source: http://www.vision.caltech.edu/ Image source: http://doi.ieeecomputersociety.org/ http://www.image-net.org/
데이터의양이답이다 고성능알고리즘도데이터가부족하면무의미함 딥러닝과같은기술을적용하려면어마어마한양의데이터가요구됨 데이터의양이증가할수록예측모델은더욱복잡해지는동시에과적합 (Overfitting) 문제를극복하며예측력이향상됨 Image source - Smartdatacollective.com
데이터의양만큼중요한알고리즘의역할 해결하고자하는문제와회사목적의특징에맞춘알고리즘필요 A B C 딥러닝 신경망 로지스틱회귀분석 Deep learning K-Nearest neighbors Support vector machines Boosting Artificial neural networks Bayesian networks Sparse dictionary learning Regression forest
머신러닝일반방법론 사람이수행하는통계기법이아닌자동화된 Machine-Driven 분석기법을통해전략최적화및운영효율성극대화 문제인식 데이터가공 문제인식 데이터가공 평가및결과관찰 모델 Launch Human-Driven Supported by Machines 데이터탐색 변형및선택 평가및결과관찰 모델 Launch Machine-Driven Supervised by Humans 데이터탐색 변형및선택 모델검증 모델개발 모델검증 모델개발 통계기반분석프로세스의모든단계사용자인풋필요 사람의직관및배경지식이분석방법및결과판단기준의척도로오판단가능성존재 기법특성상제한된양의데이터활용 Machine Learning 알고리즘을통한분석프로세스의자동화로효율적이고더정교한데이터분석이가능함 사람의개입이최소화되어오판단가능성최소화 기법특성상모든데이터활용가능
Machine Learning for Everyone : How to internalize the tech
DAVinCI LABS DAVinCI LABS 는 머신러닝또는컴퓨터공학을전공하지않은비전문사용자도그가치를충분히누릴수있도록설계된세계유일의 Machine Learning 인공지능데이터분석솔루션 실제로다양한기업프로젝트수행을통해축적된솔리드웨어팀노하우가그대로담겨져있는기업형실용기능을제공, 비즈니스실무진의편의성을최대화 데이터의가공부터리포트까지, end-to-end 의 seamless 한생태계를구축 기존빅데이터 /Machine Learning 의한계를극복한최적의예측솔루션 과적합등의예측오류최소화 설명력저하 (black box) 를막기위한풍부한시각화및리포팅 다양한데이터분할기능 3. 자동화된스마트데이터전처리지원 ( 결측값 / 중복값 / 극단값 / 변수타입등 ) 4. 알고리즘자동최적화를통한예측력향상및과적합방지 5. 분석전과정에걸친뛰어난시각화 6. 다양한분석결과를비교, 출력할수있는리포팅시스템 알고리즘파라미터최적화 1. 편리한분석환경 자체고안된직관적 UI/UX 지원 2. 실무사용자의니즈반영 자동화된데이터전처리 비즈니스룰적용 ( 클러스터생성 ) 등다양한기능 도출된예측함수의추출 / 통합지원을통한활용성강화 모델평가및성과측정 클러스터생성
DAVinCI LABS 분석프로세스별모듈 ILLUSTRATION 전처리모듈 분석모듈시각화모듈리포팅모듈 자동전처리기능 자동적으로최적알고리즘선택 직관적인시각화를통한분석결과표기 다양한알고리즘적용결과간비교분석 데이터를자동으로머신러닝적용가능데이터로변환 각종결측값 / 극단값및중복값등에 robust 한스마트데이터전처리제공 변수타입자동설정 최적변수변환지원 중요항목자동분석및 feature engineering 수행을통한과적합최소화 인공지능기반의알고리즘파라미터세팅최적화 알고리즘들의선형조합으로예측력극대화 최적군집 / 클러스터자동생성기능 시계열 /random 등다양한데이터분할기능제공 알고리즘간조합가능 분석프로세스전반에걸친각파트별시각화 변수및군집분포도 EDA 를통한정교한모델설계지원 정확도 / 재현율및기대수익등다양한모델평가시각화지원 리포팅을통한데이터및프로젝트관련다양한모델링비교분석기능 최종결과물을유저가원하는형태로 export 지원 C/JAVA/Lib/ 수식등다양한형태로예측함수추출가능
프로젝트수행및적용 Process 고도화예측모형생성 Project( 알고리즘최적화및시스템개발기간 1 개월 ) : 솔리드웨어의 ML Scientist 가 DAVinCI Core 를활용, 고객사의프로젝트목적에맞는 Customized Prediction Model( 커스텀예측모형 ) 을개발하여고객사데이터환경과의통합수행 고객사 DB (BIG DATA) 금융, 소비재, 소매, 무역등다양한분야의과거데이터활용 DAVinCI Core (DAVinCI LABS 분석엔진 ) Data Scientist (Solidware) DAVinCI Core 가탑재된솔리드웨어서버를활용, 솔리드웨어데이터사이언티스트의고객사 DB 분석수행 고객사의프로젝트목적에최적화된예측모형생성 머신러닝알고리즘기반커스터마이징된전처리기능등고객사환경에특화된맞춤형솔루션구축 Project 종료이후운용 (DAVinCI LABS Integration) : 머신러닝사이언티스트의노하우가담긴 Customized DAVinCI LABS 를통해기존의신용평가모델사용과더불어다양한예측분석에활용가능 ID : Solidware Name : Stephen Sex : Male Age :?? 신규데이터유입 (NEW DATA) 신규데이터발생 / 투입시 DAVinCI LABS 가데이터의변동을자동적으로반영하여예측모형 Update 실시 DAVinCI Studio (DAVinCI LABS 시각화엔진 ) 현업실무자 (Client) 솔리드웨어머신러닝사이언티스트의노하우및사고흐름을 DAVinCI LABS 를통해고객사현업부서에내재화, 분석솔루션의범용적활용기반마련 타겟마케팅조기경보투자운용 DAVinCI LABS 를활용, 지속가능한예측분석가능 고객사의환경및니즈에맞춰통합된 DAVinCI LABS 를활용, 신용평가외의예측 ( 타겟마케팅, 이탈감지등 ) 모형을자체적으로생성가능
유지보수방안및지원체계 예측모형업데이트작업필요시자체적으로 DAVinCI LABS 를통해유지보수작업가능 모형업데이트작업필요요건사항 : 1. 신규변수추가 2. 기존변수특성퇴색 3. 데이터양추가 4. 고객군 Trend 변화 5. 고객사내부정책변경 6. DAVinCI LABS 내부기능 (Module) 추가 일정시점이후상기모형업데이트작업필요요건사항발생시 변경사항반영된신용평가모형도출 기존모형 신규모형 DAVinCI LABS 를통한유지보수관련장점 1. 자체적인유지보수를통해수행인력관련비용대폭절감 ( 필요시 On-Demand 서포트제공가능 ) 2. 고객사와제안사간의불필요한커뮤니케이션을배제하여업데이트작업일정최소화 3. 즉각적인모형업데이트를통한사업프로세스지체요소제거
Case I 상세기능별 Use Case Example 신용평가 (Credit Scoring) 개요신규금융상품셀링을위한타겟고객신용도평가지표산출 Credit Scoring 업종 부서 목적 각종금융사 심사팀 / 리스크관리팀 산출지표를통한채무불이행고객예측및대응 Case II 타겟마케팅 (Target Marketing) Target Marketing 개요업종부서목적 고객의라이프스타일 / 스테이지등패턴분석을통한유효타겟집단산출각종서비스업마케팅 / 홍보팀타겟고객집단특성도출을통한소구포인트파악과매출 drive 전략수립 Case II 고객이탈예측 (Churn Detection) Churn Detection 개요업종부서목적 고객 retention을위한핵심지표산출각종서비스업영업산출지표를통한이상고객집중관리전략수립
Vision 애플이초기컴퓨터기술과일반사용자를이어주는다리가되었다면, 솔리드웨어는인공지능기반분석기술과일반사용자를연결하는것을지향 초기컴퓨터기술 Apple Eco-System 사용자 목적 : 과학 / 군사용 개발 : 연구원 / 전문가집단 미국의 2 억 3 천 5 백만인구중, 오직극소수의사람만이컴퓨터를사용할수있다. - 1983, 애플 Think different. 대상 : 일반사용자 ( 개인 / 기업 / 대학 ) 인공지능기술 사용자 목적 : 과학 / 기타 개발 : 학계 / 연구소 / 거대 IT 기업 Your Personal Artificial Intelligence 데이터전처리 분석 시각화 리포트 Creation Of Insights 리스크관리 OCR 운영관리자동화 GBM ETL Neural Network VTT 타겟마케팅 의사결정최적화 Etc. Etc. Regression Forest 대상 : 일반사용자 ( 개인 / 기업 ( 중소규모포함 )/ 공공기관 / 대학 )
sophie.eom@solidware.io