슬라이드 0

Similar documents
PowerPoint 프레젠테이션

빅데이터_DAY key

2017 년 6 월한국소프트웨어감정평가학회논문지제 13 권제 1 호 Abstract

PowerPoint 프레젠테이션

<BFACB1B831382D31355FBAF2B5A5C0CCC5CD20B1E2B9DDC0C720BBE7C0CCB9F6C0A7C7E820C3F8C1A4B9E6B9FD20B9D720BBE7C0CCB9F6BBE7B0ED20BFB9C3F8B8F0C7FC20BFACB1B82D33C2F7BCF6C1A E687770>

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

금융은튼튼하게, 소비자는행복하게 보도자료 보도 ( 수 ) 조간배포 ( 화 ) 담당부서보험사기대응단송영상실장 ( ), 박동원팀장 ( ) 제목 : 2015 년보험사기적발금액 6,549 억원, 역대최고

슬라이드 1

딥러닝 첫걸음

Kaggle 이란? 2010 년설립된빅데이터솔루션대회플랫폼회사 2017 년 3 월구글에인수 2

1. Introduction : 모멘텀효과와패턴학습의적용 모멘텀현상은약 1 년여간의가격상승을보인자산이그방향성을단기간 (1~3 개월 ) 동안지속하는것을말한다. 이러한현상이주식, 채권, 커머더티, 환등의거의모든자산에서발생했음을 Moskovitz (2012) 등이조사, 보고

보험판매와 고객보호의 원칙

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (

第 1 節 組 織 11 第 1 章 檢 察 의 組 織 人 事 制 度 등 第 1 項 大 檢 察 廳 第 1 節 組 대검찰청은 대법원에 대응하여 수도인 서울에 위치 한다(검찰청법 제2조,제3조,대검찰청의 위치와 각급 검찰청의명칭및위치에관한규정 제2조). 대검찰청에 검찰총장,대

보고싶었던 Deep Learning과 OpenCV를이용한이미지처리과정에대해공부를해볼수있으며더나아가 Deep Learning기술을이용하여논문을작성하는데많은도움을받을수있으며아직배우는단계에있는저에게는기존의연구를따라해보는것만으로도큰발전이있다고생각했습니다. 그래서이번 DSP스마

방송공학회논문지 제18권 제2호

(......).hwp

다중 한것은 Mahout 터 닝알 즘몇 를 현 다는것외 들을 현 Hadoop 의 MapReduce 프 워크와결 을 다는것 다. 계산 많은 닝은 컴퓨터의큰메 와연산기 을 만 Mahout 는최대한 MapReduce 기 을활용 터분 다용 졌다.. Mahout 의설 Mahou

제 31회 전국 고교생 문예백일장 산문 부문 심사평.hwp

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제


Reinforcement Learning & AlphaGo

Operation-name: 악성행위의종류를말하며, Sending SMS Calling Sending sensitive information Converting data 로분류합니다. Operation-target: 악성행위의목표물을말하며, Premium-rate SM

장기계획-내지4차


Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

Ⅰ 총괄 * 1 인당보험사기금액 (869 만원 ) 은전년동기 (758 만원 ) 대비 14.6% 증가 * 1 보험가입내역조회시스템보강 2 보험사기상시감시시스템도입 3 보험사기 인지시스템고도화 ( 사회관계망분석 : Social Network Analysis 도입등 ) <

PowerPoint 프레젠테이션

Contents I 패턴분석 II Falkonry LRS III 사용방법 IV 적용사례 V 적용방안

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>

에듀데이터_자료집_완성본.hwp

3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : /45

QYQABILIGOUI.hwp

슬라이드 1

분석기법의기본개념부터활용까지사례중심의 A to Z 학습 데이터분석기본 교육기간 : 3 일 (24 시간 )/ 비합숙 교육비 : 회원 62 만원 / 비회원 69 만원 데이터분석핵심이론학습및현업에적용 현장에서발생하는변수를이해하고상황에따른최적화방안도출 품질향상을위한부적합원인도

Ch 1 머신러닝 개요.pptx

비아이큐브_백서.indd

½½¶óÀ̵å Á¦¸ñ ¾øÀ½

adfasdfasfdasfasfadf

Introduction to Deep learning

RM hwp

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 29(7),

<B0A3C3DFB0E828C0DBBEF7292E687770>

제 출 문 한국산업안전공단 이사장 귀하 본 보고서를 2002 년도 공단 연구사업계획에 따라 수행한 산 업안전보건연구수요조사- 산업안전보건연구의 우선순위설정 과제의 최종보고서로 제출합니다. 2003년 5월 연구기관 : 산업안전보건연구원 안전경영정책연구실 정책조사연구팀 연

PowerPoint 프레젠테이션

PowerPoint Presentation

PowerPoint 프레젠테이션

- 2 -

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

PowerPoint 프레젠테이션

지도임자_1204_출판(최종).hwp

Ch 8 딥강화학습

1-1-basic-43p


[ 그림2] 를참조하여이알고리즘의프로세스를순서대로생각해보면첫번째는최초중심값을랜덤하게선택한다. 두번째는 k개의중심값과각개별데이터간의거리를측정하고, 가장가까운클러스터를할당한다. 세번째는각클러스터마다새로운중심값을계산하고마지막엔새로선택된중심값이변화가없다면멈추고, 변화가있다면첫

김기남_ATDC2016_160620_[키노트].key

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

True number of clusters = 3 V V1 2 군집의수선택 2.1 군집내와군집간제곱합이용 군집분석은각군집의평균의차이를크게하고 ( 군집간의변동을크게하고 ) 군집내의변동을작게하는 것이좋다. 군집의개수가늘어날수록커지고

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a


<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

해외유학생보험3단팜플렛1104

SMV Vending Machine Implementation and Verification 김성민 정혁준 손영석

92302 대한무역투자진흥공사 대한무역투자진흥공사


빅데이터 분석을 위한 데이터 마이닝

Delving Deeper into Convolutional Networks for Learning Video Representations - Nicolas Ballas, Li Yao, Chris Pal, Aaron Courville arXiv:

2016년 신호등 10월호 내지.indd

보험사기적발현황분석을통해본보험사기스코어링모형개발의의의 보험사기적발현황분석을통해본보험사기스코어링모형개발의의의 백철수석조사역 박선우조사역 < 요약 > 최근보험사기적발금액이지속적으로증가하고있으며 (

04 Çмú_±â¼ú±â»ç


Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

170918_hjk_datayanolja_v1.0.1.

e01.PDF

KAKAO AI REPORT Vol.01

단순 베이즈 분류기

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

181004_보도자료_보험설계사·GA 관련 정보, 이제 투명하게 보여드립니다.hwp

다중 곡면 검출 및 추적을 이용한 증강현실 책

450 공기업 2 총괄요약표 평가범주 지표명 비계량계량합계 가중치등급가중치득점 ( 점 ) 가중치득점 1. 리더십 5 B 책임경영 3 B 리더십 책임경영 3. 국민평가 ( 고객만족도, 브랜드 )

11.indd

표상학습을이용한딥러닝이미지특성의범용분류성에대한실험적분석 지도교수장병탁 이논문을공학학사학위논문으로제출함 년 12 월 21 일 서울대학교공과대학컴퓨터공학부한동식 2016 년 2 월

2014 년도사업계획적정성재검토보고서 차세대바이오그린 21 사업

슬라이드 1

연금저축손해보험 스마트연금보험 1303

2016년 신호등 4월호 내지A.indd

[NO_11] 의과대학 소식지_OK(P)

정치사적

3

1,.,, ICT,.,..,.,,.,. 6.,. QuantumFundHoldings.

사회통계포럼

05 ƯÁý

PowerPoint 프레젠테이션

12 김명섭 B-RN (2).hwp

슬라이드 1

PowerPoint 프레젠테이션

소성해석

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

<C5F0B0E8C7D0B0FA20C7D1B1B9B9AEC8AD20C1A63435C8A328C3D6C1BE292E687770>

제1강 인공지능 개념과 역사

Transcription:

지능형보험부당청구탐지와예측 위세아이텍 김상수 0

11

부당청구탐지서비스의차별적경쟁우위를확보하기위함임 도입배경 프로젝트목적 효과적조사대상선정 보험부당청구세그먼트별탐지모형차별화 머신러닝기반탐지정확도향상 기대효과 최신기술기반민첩한탐지 머신러닝을이용한데이터기반모형 학습과탐지모형의구조화 보험사기는해마다다양한방법으로 10% 씩증가하는추세이다. 2016 년한해동안적발된보험사기금액은전년대비 9.7% 가증가했다. 단순히보험사기가증가하는것뿐만아니라그수법이다양해지고있어기존적발규칙을보완할필요성이있다. 또한기존의시스템보다정확도를높이는고도화가필요하다. 신규규칙에대한설명적탐지와근거자료제공 고객, 지급내역레벨의탐지병행 설명적모형적용 ( 의사결정트리 ) 조사결과의피드백및활용 현지조사결과의탐지모형피드백 OLAP, 시각화에의한결과활용 2

마이리얼플랜은실제보험가입자정보를기반으로보험설계사들의경쟁입찰과보험분석알고리즘을통해최적의보험플랜을제공 6 개월만에누적플랜요청 1,200 건을달성 약 50% 의낙찰률 3

Swiss Re( 스위스재보험 ) 언더라이터의계약심사과정을지원하기위해건강및생명보험사업부문에인공지능기술도입 업무효율증대 심사결과 Risk 감소 4

일본후코쿠생명은병원기록, 환자진료이력, 상해정보등을이용해보험금지급업무를 AI가담당 생산성 30% 향상 비용 14 억절감 5

6

정형 Data 와비정형 Data 의결합으로심사효율화와부당지급누수방지등지급심사프로세스개선 최종목표시스템 1 정형 Data 패턴분석을통한신규 Rule 생성 1 단계 : 비지도학습을통한신규패턴분석 2 단계 : 신규패턴적용및기존 Rule 과의결합 ( 월 1 회신규 Rule 적용 ) 기존 Rule 에대한변경, 삭제등업데이트병행 2 Rule 고도화및비정형 Data 활용 모델고도화작업을위한비정형 Data 활용 - 사건뉴스, 분쟁판례, 신규법규적용 Deep Learning 기술을적용 Rule 에대한 SME 검토및판단은유지 Target Process 개선사항 지급심사의업무생산성을높이는지원시스템을인공지능을통해구현 동시에부당청구업무판단지원 지급심사분류작업지원 심사난이도에따라 3 단계로분류 ( 자동심사 / 일반심사 / 세부심사 ) 세부심사는전문심사자를통해판단하고, 적정심사와부당청구로구분 지급심사오류, 누락방지지원 보험이상지급유무판단 ( 특약사항 ) 보험지급분쟁조정판례등외부비정형데이터 활용 ( 분쟁조정결정서등 ) 3 청구심사및지급프로세스개선 청구 Data 全영역으로확대하여지급 / 비지급자동심사 지급오류, 누락, 현장실사업무효율화달성 목표 Model 기존수작업을통한지급보험심사를 KM 기반으로기계학습을통하여업무효율화수준을높여지급심사품질개선 7

Machine Learning, Deep Learning 기술을통해보험사기신규패턴을발굴하고정확도가향상된보험사기탐지모델을제공하는시스템을구현함 접수 고객창구 현장확인여부심사 고객창구 현장확인 손해사정사 지급여부심사 지급심사팀 보험사기심사 지급 & 비지급 SIU 심사팀 보험사기신규패턴분류 보험사기신규패턴판별 청구데이터 전처리 변수선정 프로파일링 부당 룰생성 계약데이터 정상 기존룰시스템적용 지급데이터 부당여부탐지 설계사데이터 부당 신규룰 기존룰 정상 심사결과데이터 8

수행범위는전체업무영역중보험부당청구탐지로제한함 프로젝트의유형목록및모델링적용범위 유형파일럿모형적용범위목표 신규보험부당청구패턴개발 보험부당청구패턴분류모형보험부당청구패턴판별모형 요양급여청구데이터를학습하여숨겨진패턴을분류하고, 분류된패턴중에서알려지지않은새로운보험부당청구유형을정의새롭게분류된패턴유형을학습하고, 학습된판별모형을통해신규청구건에대해해당되는패턴유형을판별 머신러닝알고리즘을이용하여신규보험부당청구패턴의효율적개발가능성을평가새롭게발견된보험부당청구패턴을판별 모형화하여패턴의검증및시범운영을위한방법제공 보험부당청구탐지모형개발 보험부당청구탐지모형 보험부당청구현지조사결과데이터에서보험부당청구패턴을학습하고, 학습된탐지모형을통해신규청구건의부당여부를탐지 기존룰기반탐지시스템대비모형의탐지정확도를비교하여인공지능모형기반보험부당청구탐지의타당성을평가 보험부당청구 보험부당청구 비정형데이터분석을통해보험부당청구탐지모형의신규변 SNS, 기사, 동향보고서등을기반으로보험 탐지모형고도화 고도화탐지모형 수로써활용하여보험부당청구탐지를고도화함 부당청구와관련된비정형데이터분석 9

4 현장조사 5 결과환류 고객 1 접수 지급여부심사팀 2 부당청구의심대상 머신러닝기반보험부당청구탐지시스템 부당 3 검토 보험사기조사팀 (SIU) 4 지급 정상 7 적용 기존룰기반보험부당청구탐지시스템 보험사기조사팀 (SIU) : 사기가의심된다는제보건이나회사내사기인지시스템을통해드러난사기행태의진실여부를밝힌다. 생명보험사중대한, 삼성, 교보에서만보유 / 손해보험사에서는동양, 삼성, 현대, 엘지, 동부, 서울보증에서보유함 10

비지도학습을통한보험부당청구신규패턴분류모형과지도학습을통한부당청구패턴판별모형 청구데이터 계약데이터 지급데이터 보험설계사데이터 전처리 변수선정 [ 분류모형 ] ( 군집알고리즘 ) 분류 [ 패턴분류결과 ] 부당패턴분류 DB 프로파일링 정상패턴 부당패턴 고객데이터 학습 [ 판별모형 ] ( 분류알고리즘 ) 결과적용 판별 [ 패턴판별결과 ] 판별결과 DB [ 일치여부검증 ] 모형알고리즘설명 군집알고리즘 분류알고리즘 K-means Clustering SOM(Self-Organizing Maps) EM & Canopy Decision Tree Random Forest Support Vector Machine 전통적인분류기법으로대상집단을거리의평균값을기준으로 K개의군집으로반복세분화하는기법인공신경망을기반으로훈련집합의입력패턴을가중치로학습하여군집화하는기법주어진초기값으로가능성이최대인것부터반복과정을통해파라미터값을갱신해군집화하는기법분류 Class와변수들의관계를규칙으로도출하고트리의형태로분기하는가장기본적인분류알고리즘수많은 Decision Tree들이 Forest를구성하여각각의예측결과를하나의결과변수로평균화하는알고리즘데이터의분포공간에서가장큰폭의경계를구분하여데이터가속하는분류를판단하는비확률적알고리즘 11

비지도학습을통한보험부당청구신규패턴분류모형 청구데이터에대해클러스터링기법을적용하여거리를기반으로동질청구패턴유형을분류하고새로운부당청구패턴을발견 청구데이터 Clustering 빈도수 군집간분리도 계약데이터 지급데이터 부당의심패턴 정상패턴 보험설계사데이터 고객데이터 모형알고리즘설명 군집알고리즘 K-means Clustering SOM(Self-Organizing Maps) EM & Canopy 전통적인분류기법으로대상집단을거리의평균값을기준으로 K 개의군집으로반복세분화하는기법 인공신경망을기반으로훈련집합의입력패턴을가중치로학습하여군집화하는기법 주어진초기값으로가능성이최대인것부터반복과정을통해파라미터값을갱신해군집화하는기법 12

지도학습을통한보험부당청구신규패턴판별모형 머신러닝은어떤변수에영향을받아분류되었는지알수없음. 따라서설명력이높은 Decision Tree 알고리즘을사용 하여 Decision Tree 그래프와 If {} Then.. Rule 의형태로분류기준을설명가능 보험부당청구데이터 설명 Decision 그래프 학습 [ 판별모형 ] (Decision Tree) 생성된룰을기존시스템에반영가능 Rule :...SEX_TP_CD = 1: :...s1_f3 in {B00,B02,B35,C69,D21,D23,D31,E10,E11,E13,E14,E50,E66,E78,F51, 2,R52,S01,S02,T85, Z01,Z94,Z97}: cluster3 (0) : s1_f3 in {H00,H01,H02,H04,H10,H11,H15,H16,H19,H20,H21,T26,T90,Z96}: : :...s_cnt > 1: cluster3 (1051/15) : : s_cnt <= 1: : : :...PLC_TY_CD <= 2: cluster3 (118/1) : : PLC_TY_CD > 2: : : :...OPRSCD_CNT <= 0: : : :...rvd_damt_tamt_scaled <= 0.096629: cluster3 변수중요도 13

지도학습을통한보험부당청구탐지모형 청구데이터 계약데이터 지급데이터 보험설계사데이터 고객데이터 전처리 변수선정 학습 [ 탐지모형 ] ( 분류 / 예측알고리즘 ) 탐지 [ 부당탐지결과 ] 탐지결과 DB 검증 [ 성능평가 ] 부당 정상 환류 알고리즘 Random Forest Support Vector Machine Extra Tree XGBoost Deep Learning 설명수많은 Decision Tree들이 Forest를구성하여각각의예측결과를하나의결과변수로평균화하는알고리즘데이터의분포공간에서가장큰폭의경계를구분하여데이터가속하는분류를판단하는비확률적알고리즘 Random forest와비슷하나속도가 Random forest에비해빠른알고리즘 Randomforest의 Tree는독립적이라면 XGBoost의 Tree의결과를다음트리에적용하는 boost방식의알고리즘다층구조의 Neural Network을기반으로변수의패턴이결과에미치는영향을가중치로조절하며학습하는알고리즘 14

지도학습을통한보험부당청구탐지모형 부당청구탐지모형의후보알고리즘간성능평가 - 평가지표는 Accuracy, Precison, Recall 를사용하며, 현지조사업무에서는 Y Recall 의향상에중점을둠 실제결과 (Actual) 탐지결과 (Predict) 부당 정상 부당 True Positive(TP) False Positive(FP) 정상 False Negative(FN) True Negative(TN) 재현율 정밀도 Accuracy( 정확도 ) = 모형이탐지한결과와실제결과와일치하는정탐지의비율 (TP + TN) / (Total), 100에가까울수록좋은지표 Precision( 정밀도 ) = 모형이부당이라고탐지한결과중에서실제결과도부당인정탐비율 (TP) / (TP + FP), 1-정밀도 = 오탐율 Recall( 재현율 ) = 전체부당중에서모형이부당이라고정확하게탐지한정탐비율 (TP) / (TP + FN), 1-재현율 = 미탐율 -> 현지조사업무의특성상부당을놓치지않고정확하게탐지하는 Y Recall 의지표가중요함 15

지도학습을통한보험부당청구탐지모형 부당청구탐지모형의후보알고리즘간성능평가 높은정확도도중요하지만부당을부당으로탐지하는 Y Recall 값도고려한다면 Randomforest 와 Extra Tree 알고리즘이우수함 Accuracy 고위험군 _Recall 고위험군 _Precision Randomforest 0.961 0.945 0.928 SVM 0.983 0.705 0.947 Extra Tree 0.963 0.97 0.962 XGBoost 0.962 0.854 0.959 16

딥러닝을이용한보험부당청구탐지모형고도화 부당청구탐지적용알고리즘 Random Forest Deep Learning Deep Learning 을사용하면 Random Forest 보다 안정성과유연성이향상 알고리즘설명장단점 Rule 기반탐지 딥러닝기반탐지 a* 청구금액 +b* 의사수 +c* 수진수 를기준으로판정하거나, 청구금액 >a, 의사수 >b, 수진수 >c 이면 이상 으로분류하는방식 - 이상상태에해당하는 ( 청구금액, 의사수, 수진수 ) 조합을찾아냄 - Convolutional Neural Network(CNN) 은이미지처리에적합 - Recurrent Neural Network(RNN) 은시계열처리에17 적합 - 선형관계를가지는변수를알려진규칙에적용하기적합 - 연관변수가많아지면오히려정확성이떨어질수있음 - 변수의조합을패턴으로학습하여새로운패턴을스스로발견 - 어떤패턴에대해서도이상가능성을산출가능 - 많은변수를대상으로정확도높은예측을수행

머신러닝을이용한부당청구탐지모형 부당청구탐지모형의학습데이터구성 - 분류된패턴군에서고위험군이총 177건으로다른패턴의건수보다현저하게수가적어성능을저하시킴 - 딥러닝은학습의개수가적으면성능이저하되어 upsampling을하여성능을높임 Accuracy Y_Recall Y_Precision Tensorflow 0.964 0.872 0.905 Tensorflow_upsampling 0.955 0.988 0.922 Under Sampling 을통해부당의비율을높여가며비교해보면 전체적인정확도인 Accuracy 는다소 (1%) 낮아지나부당을정확하게예측하는 Y Racall 은급격히 (11%) 높아짐 18

머신러닝을이용한부당청구탐지모형 딥러닝을이용한부당청구탐지모형의구성과탐지결과 정상 : 부당 : : : 구분 항목 1회차 2회차 3회차 4회차 Hidden Layer 1 1 1 1 learning rate 0.006 0.004 0.006 0.005 파라미터 bath size 1000 1200 1300 1500 dropout prob 0.6 0.6 0.8 0.9 Accuracy 0.935 0.937 0.946 0.955 성능 Recall 0.895 0.896 0.953 0.988 Precision 0.912 0.915 0.919 19 0.922 성능향상 딥러닝알고리즘은데이터의량과 Hidden Layer의구조에따라성능의차이가크게달라지기때문에본사업수행시다양한 Layer 구조로성능최적화가필요함

< 사고이미지판독구성도 > 20

2016 년보험사기적발금액은 7,185 억원 ( 적발인원 83,012 명 ) 으로전년대비금액기준 9.7%(636 억원 ) 증가, 인원기준 0.5%(419 명 ) 감소 [ Estimation ] 적발률추정 머신러닝탐지시스템을적용할경우 5~15% 적발률향상 생보 손보 5% 향상 4,816( 백만원 ) 31,108( 백만원 ) 10% 향상 9,633( 백만원 ) 62,216( 백만원 ) 15% 향상 14,450( 백만원 ) 93,325( 백만원 ) 합계 35,924( 백만원 ) 71,848( 백만원 ) 107,772( 백만원 ) 21

22

End of Document