우체국보험 CRM 강화를위한추가가입유망고객에관한연구 3) 김소연 * 생명보험시장이포화되고시장내경쟁이심화됨에따라신규고객을유치하는것만큼이나기존고객을활용하여추가가입을유도하는것에대한전략적중요성이강조되고있다. 본연구에서는로지스틱회귀분석모형과의사결정트리모형을활용하여우체국보험고객을대상으로어떠한요인이추가가입에영향을미치는지에대해살펴봄으로써우체국보험사업 CRM 강화방안을모색해본다. Ⅰ. 머리말 1990 년대후반까지생명보험가입이폭증한데기인하여 2008 년현재국내생명보험가구가입률은 90% 에육박하고있으며이처럼시장이포화상태에도달함에따라보험에대한신규수요는크지않은상황이다. 더욱이금융자율화와규제완화로인하여보험시장내경쟁이심화됨에따라기존의마케팅전략만으로는효율적으로고객을유치하는데한계가있다. 고객의라이프스타일변화에따라점차다양한형태의위험보장이요구되고있으며이에따라각생명보험사가고객요구에맞추어세분화된상품개발을추진하고있는지금상품과고객의요구를일치시키는과학적인마케팅기술은그어느때보다도중시되고있다. 이러한관점에서볼때 * 우정사업본부보험사업팀전임연구원 우정경영연구소 73
우정정보 75 (2008 겨울 ) 보험시장의가장큰이슈는과거보험사들이앞다투어추진하던신규고객유치가아니라기존 가입고객을얼마나잘유지하며그들에게추가상품가입을유도할수있느냐하는부분이라 할수있다. [ 그림 1] 업종별고객유지율증가 (5%) 에따른고객가치변화 100% 고객가치증가율 80% 60% 40% 20% 0% 광고 손해보험 자동차서비스 은행 신용카드 공산품중개 공산품유통 고객가치증가율 세탁 생명보험 건물관리 출판 소프트웨어 자료 : 베인 & 컴퍼니. 업종 최근많은기업들은자사가보유한고객데이터를이용하여시장에서의경쟁력확보를위한다양한형태의모델을개발하는데데이터마이닝 1) 방식을적극활용하고있다. 특히, 은행, 카드, 보험등과거고객데이터를확보하는데심혈을기울였던금융회사들은이데이터를적극적으로활용할수있는방법을모색하고있다. 생명보험업계에서이탈모형과신상품에대한추가가입모형개발에큰관심을가지고적극추진하는이유도이처럼고객관계관리 (Customer Relationship Management, CRM) 에서기존고객관리의중요성이강조되고있기때문이다. [ 그림 1] 과같이고객유지율을 5% 증가시키는경우, 평균고객의가치는업종별로 35~100% 증가하는것으로조사되었다. 또한신규고객획득에소요되는비용은기존고객유지비용보다 5~10배가 1) 데이터마이닝 : 대용량의데이터에서유용한정보와관계를탐색하고모형화한후지식으로변환하여기업의의사결정에활용하는과정. 74
높은것으로조사되었다. < 표 1> 에서보는바와같이 Allied Insurance 사가자사의고객들을대상으로실시한조사에서도고객이자사로부터구입한보험상품의수가증가할수록유지율이증가하는경향이있음을보여주고있다. 미국보험대리점협회 2) 가 10년에걸쳐실시한연구에서도가입한보험상품의수가 1개에서 2개로증가할때유지율은 40% 가증가하고 2개에서 3개로증가할때에는무려 90% 가증가함을보여주고있다. 또한 1996 년미국에서실시된조사도비슷한결과를보이고있다. 1개상품에가입한고객의연간실효율은 10.4% 의높은수준인데반하여, 가입상품의개수가 2개, 3개, 4개로증가함에따라실효율은 6.9%, 3.3%, 2.4% 로낮아지는것으로나타났다. 실효율 1% 가가져다주는엄청난이득을감안하면추가판매가단순한판매증진이상의큰의미를지니고있음을알수있다. 즉, 고객가치를증대시키기위해서는고객유지율을증가시켜야하고, 고객유지율을증대시키기위해서는가입한보험상품의수를증가시켜야한다는결론에도달할수있다. < 표 1> 가입한보험상품별평균유지율 가입한보험상품별고객구분 평균유지율 자동차보험만가입한고객 77% 주택보험만가입한고객 79% 자동차보험및주택보험을가입한고객 96% 자동차보험, 주택보험, 생명보험을가입한고객 97% 2) 미국보험대리점협회 (PIA): Professional Insurance Agents Association of America 우정경영연구소 75
우정정보 75 (2008 겨울 ) Ⅱ. 분석모형설계와자료탐색 1. 추가가입모형및분석대상정의 1) 모형정의추가판매모형은우체국보험 1건만을보유한고객중추가가입확률이높은것으로여겨지는고객의속성을발견하여추가가입시에정확한타깃을선정하고자하는데에그목적이있다. 이에따른모형의목표변수는 2007 년 1월말시점 1건보유고객중 2007 년 2월 1일에서 2007 년 7월 31일사이에보험추가가입여부 (1: 가입, 0: 미가입 ) 이며, 설명변수는보험계약고객의인구통계학적속성정보및거래행태, 모집자관련정보등에대한데이터를활용하였다. 2) 분석대상정의일반적으로추가가입은 1건이상의승인된계약을보유하고있는고객이계약이유지된상태에서 1건이상을계약하는경우이지만본고에서는 계약이승인된상품을 1건만보유하고있는계약자가계약이유지된상태에서추가로 1건이상의계약을체결했을경우 로분석대상을한정한다. 2007 년 1월 31일을유지계약판정시점으로정하고, 추가가입기간은 2007 년 2월 1일에서 2007 년 7월 31일까지 6개월로정한다. 또한기존유지계약만기일 ( 해약또는해지포함 ) 이추가가입기간중인경우는분석대상에서제외하고, 외국인및주민번호오류건과계약자가직원이거나보험관리사인경우도분석대상에서제외한다. 2. 자료탐색및변수선택 1) 자료수집본연구에서사용된데이터는우체국보험데이터베이스에서추가가입모형에유의하다고생각되어지는고객데이터이다. < 표 2> 와같은 29개의변수로, 크게인구통계학적인변수와계약과관련된변수들로구성되어있다. 76
< 표 2> 분석모형을위한필요변수항목 대분류 변수명 내용 계약자나이 계약자연령 계약자성별 계약자남자 / 여자 인구통계 계약자직업 11개범주의직종대분류로구성계약자지역 16개지역으로분류 피보험자연령 피보험자연령 피보험자성별 피보험자남자 / 여자 보유상품군 건강 / 암 / 재해 / 종신 / 저축 / 연금 / 어린이 / 교육 납입방법 월납 /3개월납/6 개월납 / 연납 / 일시납 수금방법 방문 / 창구 / 우체국이체 / 은행이체 납입기간 보험료납입기간 ( 월단위 ) 보험기간 보험계약유지기간 ( 월단위 ) 보장경과기간 계약일로부터기간 ( 월단위 ) 월납환산보험료 납입방법에따라환산된매월납입보험료 과거실효횟수 해당증서과거실효횟수 지급보험금 사고보험금 환급금대출잔액 환급금대출잔액 가입기간 계약자의첫가입증서계약일로부터기간 계약관련 소멸건수 과거증서소멸건수 모집직군 모집직군 모집자성별 모집자의성별 모집자연령 모집자의연령 모집자입사차월 모집자입사차월 계 _ 피동일여부 계약자와피보험자가동일이면 1, 아니면 0 모 _ 수동일여부 모집자와수금자가동일이면 1, 아니면 0 미아고객여부 미아고객이면 1, 아니면 0 보험료완납여부 보험료를정상및면제완납이면 1, 미완납이면 0 피보험자보유건수 피보험자기준보유건수 보험금지급여부 사고보험금지급한경험이있으면 1, 아니면 0 환급금대출여부 환급금대출한경험이있으면 1, 아니면 0 인구통계학적인변수중계약자의직업은전문직, 행정 사무관리직, 농림수산업및광업, 섬유제조업, 인쇄 출판업, 식료품제조업, 화학 비금속 금속산업, 전기통신업, 건설업, 유 우정경영연구소 77
우정정보 75 (2008 겨울 ) 흥 서비스업, 기타의 11개범주로구성되어있다. 보험계약과관련된변수들로는보유상품군, 납입 수금방법, 납입기간, 보험기간, 지급보험금, 월납환산보험료, 미아고객여부, 모집자입사차월, 과거실효횟수등이있다. 보험테이블에원시적으로존재하는변수를이용하여새롭게구성된파생변수에대한설명을한다면다음과같다. 보장경과기간이란보유중인 1건증서의계약일로부터기준월까지의기간을월단위로나타낸것이며, 과거실효횟수는보유중인증서의계약일로부터기준월까지의기간동안실효횟수를의미한다. 지급보험금은사고발생으로인한지급보험금만을한정하며, 가입기간은보유하고있는증서뿐만아니라고객이우체국에최초가입한계약일로부터의기간으로, 고객에따라서보장경과기간과동일할수도있고, 보장경과기간보다훨씬더길수도있다. 소멸건수는 2007 년 1월말현재고객별소멸된증서수를의미하며, 모집자입사차월은모집자의입사일로부터기준월까지의월단위기간이고, 모집자가퇴직이나이직등의이유로수금자가관서로바뀌게되는경우가있는데, 고객별모든수금자가관서로되어있는경우미아고객이라고한다. 계 _ 피동일여부, 모 _ 수동일여부는계약자와피보험자, 모집자와수금자가같으면 1, 다르면 0으로정의하였고, 보험료완납여부, 보험금지급여부, 환급금대출여부는해당사항이면 1, 아니면 0으로하였다. 2) 자료분석 (1) 인구통계학적속성분석대상자에대한인구통계학적인특성을살펴보면다음과같다. 성별로는전체 2,127,901 명중계약자는여성 58.4%, 남성 41.6% 인반면, 피보험자는남성이 47.3% 로계약자로는여성이월등히높은비율을보이고있다. 지역별로는서울이약 16.7% 로가장높은비율을차지하고다음으로경기, 부산, 대구순이다. 연령대로는계약자는 46세 ~55 세가가장높은비율을차지한반면, 피보험자는전체연령대별로고른분포를볼수있다. 즉 40~50 대여성계약자가다양한연령대의피보험자를대상으로보험에가입함을알수있다. 78
(2) 보험계약과관련된변수의특성보험계약과관련된변수들의특성을살펴보면다음과같다. 보험상품의종류로는재해보험이 44.7% 로가장높은비율을차지하고, 건강ㆍ암보험이 18.6%, 11.8% 의비율로보장성위주의보험이높은비율을차지하고있다. 납입방법은매월보험료를납입하는월납이 97% 이상으로가장많으며, 수금방법으로는우체국및은행이체가 89.2% 로가장높은비율을차지하고있다. 보장경과기간 ( 계약일로부터의기간 ) 은 4년~7 년이 52.5% 로가장많은분포를보이며, 미아고객은전체고객의 49.2% 를차지하고있다. 보험료납입기간은 49.1% 가 5년에서 10년사이에분포함을알수있다. 보험기간은 55년이넘는보험계약이 40.4% 로가장많고다음으로 10년에서 20년사이의보험계약이약 36.4% 를차지하고있다. 모집직군으로는보험관리사 36.5%, 기능직내근자 29%, 일반직공무원 15.8% 의순서이고, 모집자성별로는 67.7% 로여성의비율이높으며모집자연령대는 40대가가장높은비율을차지한다. 모집자와수금자가동일한경우가 48.7% 이고계약자와피보험자가동일한경우가 78.8% 로계약자가다른피보험자로의추가가입여력이있다. 보험료완납인경우는 16.1% 에불과하여납입방법이일시납에비해월납이많은부분과같은의미일수있다. 모집자입사차월을보면 10~20 년이 62.0%, 5~10 년이 30.8% 로장기근속의특징을알수있다. 보험금을지급받은경험이있는고객은 13.5% 로많지않음을알수있다. 대상기간을판단하는시점이전에실효한적이있는횟수는 0건이 95% 를넘는것으로나타나며, 피보험자기준으로보유하고있는증서수가 1건이 90% 를넘는것으로보아추가가입여력이충분함을알수있다. 계약자가과거에가입한증서중소멸된증서수는 0건이 72.7% 이고, 가입기간이 1년초과~10 년이하가 80% 를넘는것으로보아현재보유하고있는증서가우체국보험에첫번째가입한증서이면서가입한지 1년~10 년정도인고객이 70~80% 를차지함을알수있다. 3) 모형구축에사용할변수선택전체분석대상중분석하고자하는추가가입률이 2.4%(2,127,901명중 50.624명추가가입 ) 로추가가입자의비율이현저히낮아서모형분석시추가가입자의속성및행태가잘드러 우정경영연구소 79
우정정보 75 (2008 겨울 ) 나지않을수있어, 모형을위한마스터테이블생성시 Over-sampling 방식을적용하였다. 3) 즉, 추가가입한고객은 50,624 명을전체추출하고비가입한고객은추가가입고객의 3배를표본으로추출하여분석대상으로선정한다. 모형구축시모든변수를이용하여모형을구축하지는않는다. 지나치게많은변수를사용하면, 모형의적합도는올라가지만모형의구축에사용되지않은새로운데이터에적용시켰을경우에는오류율이오히려높아지는과잉맞춤 (Over-fitting) 문제가발생할수있기때문이다. 모형구축에사용할변수를선정하기위하여입력변수들을줄이기위한다양한통계적방법들이다양하게사용되고있다. 본연구에서는다양한입력변수및파생변수중추가가입모형구축에사용될변수를예측하는데유의하지않은변수를일부제거하기위해카이제곱 (Chi- Square) 통계량과 Correlation 분석, F통계량, 그리고로지스틱회귀분석을실시하였다. 먼저 16개의범주형변수들을대상으로목적변수 ( 추가가입, 미가입 ) 와의교차분석을실시한결과, 유의수준 0.05 에서모든변수값이유의하여변수목록에모두포함되었다. 다음으로 13개의연속형변수들을대상으로목적변수 ( 추가가입, 미가입 ) 와의상관분석과 F- test 를실시하여, 유의수준 0.05 에서유의하지않은변수들을제외시켰다. 그결과지급보험금과환급금대출잔액의상관분석 p-value 가 0.5742, 0.5669 로유의하지않게나타나서분석에사용되는변수목록에서제외되었다. 마지막으로 29개의변수들모두를목적변수 ( 추가가입, 미가입 ) 와의로지스틱회귀분석을스텝와이즈 (stepwise) 4) 방식으로실시하여유의수준 0.05 에서최종적으로선택되는변수들을살펴보면, 모집자성별의유의수준이 0.1450 으로유의하지않게나타나서변수목록에서제외되었다. 이상의분석결과를바탕으로네가지분석방법모두에서선택된변수들을사용하여고객추가가입예측모형구축에사용하였다. 3) Over-sampling 방법 : 모집단내에 Event 발생건은샘플링수행시발생건을모두이용하며, 상대적으로 Non-Event 영역은샘플링을수행하여 Event 발생정보의손실을줄여특성을밝혀내는데유리한샘플링기법. 4) Stepwise( 증감법 ): 독립변수를하나도포함시키지않은회귀식에서각독립변수에대하여독립변수가추가혹은제거함을반복하여유의한변수들만선택하는통계적기법. 80
Ⅲ. 분석결과 1. 추가가입예측모형성능비교로지스틱회귀분석과의사결정나무모형 (Decision Making Tree Analysis) 을이용한추가가입예측모형의성능에어떠한차이가있는지살펴본다. 로지스틱회귀분석, 의사결정나무모형을각각이용한추가가입예측모형에서정확도를나타내는지표인오분류율 5) 과실제추가가입고객들을얼마나잘예측하였는지를나타내는검출력을기준으로살펴보기로한다. < 표 3> 로지스틱회귀분석에의한추가가입모형의오분류표 구분 모형구축용 모형검증용 모형시험용 예측실제 미가입 가입 합계 미가입 가입 합계 미가입 가입 합계 미가입 59,527 1,318 60,845 44,529 962 45,491 44,369 913 45,282 가입 18,217 1,835 20,052 13,847 1,335 15,182 14,047 1,343 15,390 정분류율 : 75.9% 정분류율 : 75.6% 정분류율 : 75.3% < 표 4> 의사결정나무분석에의한추가가입모형의오분류표 구분 모형구축용 모형검증용 모형시험용 예측실제 미가입 가입 합계 미가입 가입 합계 미가입 가입 합계 미가입 59,231 1,614 60,845 44,211 1,280 45,491 44,083 1,199 45,282 가입 17,774 2,278 20,052 13,519 1,663 15,182 13,762 1,628 15,390 정분류율 : 76.0% 정분류율 : 75.6% 정분류율 : 75.3% 로지스틱회귀분석의세부옵션은가장일반적인형태인디폴트로하였다. 의사결정나무분석 5) 오분류율 : 목표변수의범주가 0, 1 일때, 실제 1 인관찰치의빈도중 ( 실제 0, 예측 1) 의빈도 +( 실제 1, 예측 0) 의빈도의비율로서정분류율 (Correct Classification) 은 1- 오분류율과같은개념. 우정경영연구소 81
우정정보 75 (2008 겨울 ) 은기본설정에따르기로하고, 분리기준으로는 Chi-square 를이용하여유의수준이 0.2 를넘지않도록하였으며뿌리마디로부터끝마디까지의깊이는최대 10을넘지않도록설정하였다. 기타 Advanced 옵션들은디폴트로하였다. 예측의정확도를나타내는로지스틱모형과의사결정나무모형의오분류표를살펴보면 < 표 3>, < 표 4> 와같다. 로지스틱회귀분석모형에서는전체 202,242 명에서모형구축용 (Training) 으로추출된 80,897 명중에서가입을가입으로분류하고, 미가입을미가입으로분류한고객의수가 61,362 명이고정확도는 75.9% 이다. 모형검증용 (Validation) 으로추출된 60,673 명의고객중에서가입을가입으로분류하고, 미가입을미가입으로분류한고객의수가 45,864 명이고정확도는 75.6% 이다. 모형시험용 (Test) 으로추출된고객 60,672 명중에서가입을가입으로분류하고, 미가입을미가입으로분류한고객의수가 45,712 명으로정확도는 75.3% 이다. 의사결정나무모형에서는전체 202,242 명에서모형구축용 (Training) 6) 으로추출된 80,897 명중에서가입을가입으로분류하고, 미가입을미가입으로분류한고객의수가 61,509명이고정확도는 76.0% 이다. 모형검증용 (Validation) 7) 으로추출된 60,673 명의고객중에서가입을가입으로분류하고, 미가입을미가입으로분류한고객의수가 45,874명이고정확도는 75.6% 이다. 모형시험용 (Test) 8) 으로추출된고객 60,672명중에서가입을가입으로분류하고, 미가입을미가입으로분류한고객의수가 45,711 명으로정확도는 75.3% 이다. 앞의표와같이의사결정나무분석, 로지스틱회귀분석모두정분류율은 75.9~76.0% 이고, 검증결과나테스트결과의정분류율은 75.6%, 75.3% 로잘분류되므로안정적인모형이며, 정확도가유사함을알수있다. 검출력은 < 표 5> 와같이모형검증용 (Validation) 데이터 60,673 개를대상으로 Threshold 가 15, 20, 25, 30, 35일때를살펴보면, 로지스틱회귀분석이 Threshold 가 20일때는 0.766 으로의사결정나무분석 0.803 보다낮지만, 나머지 Threshold 에서는검출력도높고, 전 6) 모형구축용 (Training): 모형에가장적합한가중치 (weight) 를찾기위해사용하는데이터셋트. 7) 모형검증용 (Validation): 분석용 (Training) 데이터를이용하여찾은모형의적합도를평가하는데이터셋트. 8) 모형시험용 (Test): 모형의일반오류의최종적인불편추정치 (unbiased estimate) 를선택하는데사용하는데이터셋트. 82
반적으로안정적임을볼수있다. < 표 5> 의사결정나무, 로지스틱회귀분석모형검출력 Threshold 의사결정나무분석 로지스틱회귀분석 15 0.803 0.893 20 0.803 0.766 25 0.375 0.620 30 0.321 0.474 35 0.313 0.347 추가로 [ 그림 2], [ 그림 3] 의 ROC 곡선 9) 과 Lift 도표 10) 를통해서도모형을평가하고비교할수있는데, 2개모형의 ROC 곡선패턴이유사하며, 도표의왼쪽상단에더가까운모형일수록성능면에서우수한모형으로판단한다고할때, 두모형모두민감도가비교적높은편임을알수있다. Lift 도표를보면, 상위 10% 에서 Lift 값이모두 2를넘는것으로볼수있다. 즉, 모형을고려하지않은상태에서 10% 를무작위표본추출하여캠페인등의마케팅을할때의성공률보다모형의추가가입점수상위 10% 집단에대해서마케팅활동을시행할때의성공률이 2배이상이됨을알수있다. 결국, 모형구축의효과를 2배이상볼수있다는점에서두모형모두우수한모형임을알수있다. 앞에서본바와같이, 두가지모형의정분류율이 75.9~76.0% 이고, 검증결과와테스트결과모두안정적이므로, 정확도에큰차이가없는것으로판단되며, 검출력부분에서는로지스틱회귀분석이더안정적임을볼수있으나, ROC 곡선및 Lift 도표를통해 2가지모형이유사한성능을나타내는모형임을알수있다. 9) ROC 곡선 : 이진형의목표변수를가지는모형들의성능을민감도와특이도를이용하여비교, 평가하는도표. 10) Lift 도표 : 사후확률을정렬한뒤각 10% 집단별향상도를나타냄. 우정경영연구소 83
우정정보 75 (2008 겨울 ) 2. 추가가입요인분석 본절에서는로지스틱회귀분석, 의사결정나무분석각모형에의해추가가입에유의한설명 변수를찾아내고, 선정된유의변수에의한유망노드발굴및고객군집별 profiling 을시도한다. [ 그림 2] ROC 곡선및 Lift 도표 1) 로지스틱회귀분석로지스틱회귀분석결과를살펴보면다음과같다. < 표 6> 은유의한변수들을정리한것이다. 추가가입에유의한변수들을살펴보면, 계약자피보험자동일여부, 모집자수금자동일여부, 보험기간, 모집자연령및입사차월, 소멸건수, 계약자성별및연령, 보장경과기간, 환급금대출여부, 지급보험금여부가있다. 이들변수들중소멸건수, 보험기간, 계약자 _ 피보험자동일여부는추가가입에긍정적인영향을미치는것으로나타났다. 즉, 소멸건수가많을수록, 보험기간이길수록, 계약자와피보험자가다른경우추가가입률이향상되는것으로판단된다. 보험기간은회귀계수값이 0.003 이하로그영향력이비교적미비한것으로나타난다. 11) 84
모집자 _ 수금자동일여부, 모집자연령및입사차월, 계약자성별및연령, 보장경과기간, 환급금대출여부, 지급보험금여부는추가가입에부정적인영향을미치는것으로나타났다. 즉, 모집자나계약자연령이낮을수록, 보장경과기간이짧을수록, 계약자성별이여성인경우추가가입할확률이높은것으로나타났고, 환급금대출이없는경우, 모집자와수금자가다른경우, 지급보험금을받지않은경우는추가가입확률이낮아진다. 입사차월은회귀계수값이 -0.000188 로영향력이다소미약한것으로판단된다. < 표 6> E-miner 의로지스틱회귀분석결과 구분 Estimate pr.>chisq 구분 Estimate pr.>chisq 계 _ 피동일여부 (0) 0.0726 <.0001 입사차월 -0.000188 <.0001 소멸건수 0.1775 <.0001 계약자성별 -0.3186 <.0001 환급금대출여부 (0) -0.1883 <.0001 계약자연령 -0.00885 <.0001 모집자연령 -0.00472 <.0001 보장경과기간 -0.0111 <.0001 모 _ 수동일여부 (0) -0.1261 <.0001 지급보험금여부 (0) -0.0499 <.0001 보험기간 0.00226 <.0001 로지스틱회귀분석의결과중입력변수가분류결정에얼마나영향을미치는지의정도를오즈비 (Odds Ratio) 12) 를통해서도살펴본다. < 표 7> 을살펴보면다음과같다. 계약자와피보험자가다른경우는동일한경우에비해추가가입가능성이 1.156 배높고, 계약자성별이여성인경우남성에비해 1.890(1/0.529) 배높다. 또한소멸건수가적은고객이많은고객에비해추가가입할가능성이 1.194 배높으며, 모집자와수금자가동일한조건의고객이동일하지않은고객에비해 1.287(1/0.777) 배높음을 11) 회귀분석결과, 각변수의 Estimate( 회귀계수 ) 가양의값이면값이커질수록영향력이높고, 음의값이면값이작을수록영향력이높아짐. 12) 오즈비 (odds ratio): 다른모든입력변수가일정한상태에서 x 가 1단위증가할때의영향력. 여기서오즈비가 1보다작다는것은입력변수가 x 가감소방향으로영향을미침을의미하고, 반대로오즈비가 1보다크다는것은증가방향으로영향을미침을의미한다. 우정경영연구소 85
우정정보 75 (2008 겨울 ) 알수있고, 환급금대출을받은고객이받지않은고객에비해 1.458(1/0.686) 배높음을알 수있다. 보험금지급받은경험이있는고객이받지않은고객보다 1.105(1/0.905) 배높다. 입사차월은 0.999, 보험기간은 1.002 로영향력이약함을볼수있다. < 표 7> E-miner 의로지스틱회귀분석오즈비결과 Input Odds Ratio 계약자피보험자동일여부 0 vs 1 1.156 보장경과기간 0.989 계약자성별 1 vs 2 0.529 소멸건수 1.194 모집자수금자동일여부 0 vs 1 0.777 환급금대출여부 0 vs 1 0.686 계약자연령 0.991 입사차월 0.999 보험기간 1.002 보험금지급여부 0 vs 1 0.905 앞에서와같이로지스틱회귀분석결과를회귀계수와 p-value 를통한유의성검증, 오즈비를통한목표변수에의영향정도의두가지기준으로살펴보았다. 공통된점으로는계약자와피보험자가다른, 낮은연령의여성계약자, 보장경과기간이짧고, 모집자와수금자가동일한경우에추가가입확률이높아지는것으로나타난다. 2) 의사결정나무분석 SAS의 Enterprise-Miner 의 Tree 를이용한의사결정나무모형결과를살펴보면 [ 그림 4] 와같다. 노드의 depth 를 7로하였을때총 19개의터미널노드 13) 가생성되며, 분석대상의추가가입률이 25% 에비하여최고 72.2% 의추가가입률을나타내는유망고객노드도나타남을볼수있다. 유망고객을선정하기위한분류규칙변수로는보장경과기간, 계약자성별, 소멸건수, 13) 터미널노드 : 가장마지막에있는 Node 이며세분화집단의수를나타냄. 86
계약자연령, 모집자입사차월, 계약자 _ 피보험자동일여부가선정됨을알수있다. 첫번째분류기준은보장경과기간 22.5 개월이상, 22.5 개월미만으로분할되고, 두번째는계약자성별, 세번째는소멸건수에의해분할되었고, 네번째이하로는직전노드의성향에따라달라지는데, 새로운변수로는계약자연령, 계약자피보험자동일여부, 모집자입사차월이분류규칙변수로나타나고, 보장경과기간, 소멸건수가또다시분류변수로나타나분류된다. < 표 8> 의사결정나무분석결과추가가입률상위 6 개노드특성 순위노드 1 14 2 5 3 11 4 3 5 6 6 12 추가가입고객특성 보장경과기간 13 개월이상 22 개월이하, 여성계약자, 소멸건수 7 건이상 보장경과기간 8 개월이하, 여성계약자, 소멸건수 1 건이하, 모집자입사차월 3 년 3 개월이하 보장경과기간 12 개월이하, 여성계약자, 소멸건수 2 건이상 보장경과기간 22 개월이하, 49 세이하남성계약자, 소멸건수 1 건이상, 계약자 _ 피보험자다름 보장경과기간 8 개월이하, 여성계약자, 소멸건수 1 건이하, 모집자입사차월 3 년 4 개월이상, 계약자 _ 피보험자다름 보장경과기간 13 개월이상 22 개월이하, 44 세이하여성계약자, 소멸건수 2 건이상 6 건이하 추가가입률 구축용 검증용 72.2% 79.6% 69.8% 57.2% 63.9% 63.8% 59.6% 53.3% 58.9% 56.1% 54.7% 49.6% 비율 전체 80,897 명중 115 명이며 83 명 (72.2%) 이추가가입 전체 80,897 명중 338 명이며 236 명 (69.8%) 이추가가입 전체 80,897 명중 840 명이며 537 명 (63.9%) 이추가가입 전체 80,897 명중 161 명이며 96 명 (59.6%) 이추가가입 전체 80,897 명중 475 명이며 280 명 (58.9%) 이추가가입 전체 80,897 명중 358 명이며 196 명 (54.7%) 이추가가입 19개의노드중추가가입률상위 6개의노드에대한고객특성및노드내 1건유지계약자및추가계약자비율을살펴보면 < 표 8> 과같다. 구축용과검증용의추가가입률이큰차이를보이지않으므로, 안정적인모형이라고볼수있다. 49세이하남성계약자가포함된추가가입률이네번째로높은노드를제외하고는여성계약자가공통유의변수로포함되고, 보장경과기 우정경영연구소 87
우정정보 75 (2008 겨울 ) [ 그림 3] E-miner 에의한의사결정나무분석결과 88
[ 그림 4] 의사결정나무분석결과 19 개노드별고객속성 우정경영연구소 89
우정정보 75 (2008 겨울 ) 간은 22개월이하로압축된다. 모집자입사차월을살펴보면, 5번노드는모집자입사차월이 3 년 3개월이하, 6번노드는 3년 4개월이상으로상이하게나타나지만, 5번노드의추가가입률이 6번노드의추가가입률보다높고, [ 그림 4] 에서 5번노드가, 6, 7번노드보다추가가입률이높고, 8, 9번노드의추가가입률이 10번노드보다높음을볼때, 모집자입사차월이낮을수록추가가입률이높음으로판단할수있다. 소멸건수도입사차월과마찬가지로, < 표 8> 은소멸건수가낮은경우, 높은경우모두나타나지만, [ 그림 4] 에서보면, 소멸건수가 l.5 미만인 1번노드가소멸건수가 0.5 이상인 2, 3, 4번노드에비해추가가입률이낮고, 소멸건수가 2.5 미만인 15번노드가소멸건수가 2.5 이상인 16, 17, 18노드에비해추가가입률이낮음으로소멸건수가많은경우가추가가입률이높음으로예측할수있다. < 표 9> 유망고객군분석 노드 4, 13 2 7, 9, 12 3 5 6, 8 분석결과및평가 추가가입가능성이높다. 보험료 10 만원이상비율이높고, 저축성보험비율이높은노년층집단. 특히일시납비율이높은것으로보아경제적으로여유가있는고객층 추가가능성도높고사무직비율이높은 40 세이하남성계약자집단. 모두계약자와피보험자가동일하고, 10 만원이상의보험료비율이높은편이므로, 추가가입여력이있음으로판단되며, 추가계약을통해관리강화를할경우회사입장에서유리한고객임 추가가능성이높고전문직및사무직비율이높은 40 세이하여성계약자집단. 10 만원이상의보험료비율이높으며저축성보험비율이높으므로, 향후밀착된고객관계관리를통한안정고객에서우수고객으로의가능성이높은고객층. 특히어린이보험가입비율이 12 노드는 13.4%, 7, 9 노드는 0% 로대조적인결과를보이는데, 두가지모두추가가입기회가많을것으로보이는고객층 추가가능성이높고 40 세이하비율이 47.4% 로높고사무직비율이 30% 를넘는남성집단. 보험료는낮은편이고타인을피보험자로한계약이 100% 로본인을담보로한추가계약이가능한고객층 추가가능성이높음. 40세이하그룹과 40세이상그룹이 50% 씩점유하고있는여성고객층이며, 전문직비율이높은편이며본인을담보로한계약이 60% 를넘으며건강보험가입비율이높은고객층으로본인을담보로한기타상품추가가입이가능해보임추가가입가능성이높으며, 10만원이하의보험료비율이높고, 타인을피보험자로한계약이 100% 로어린이보험비율이높은여성계약자집단. 본인을담보로한추가계약이가능한고객층 90
[ 그림 4] 와같이 19개각각의노드별로, 40세이하계약자비율, 전문직및사무관리직비율, 월납환산보험료 10만원이상자비율, 판매 _ 숙박 _ 유흥업종사자비율, 납입방법이일시납비율, 계약자 _ 피보험자동일비율, 모집자 _ 수금자동일비율, 저축성보험및어린이보험등각상품비율등을비교분석하였다. 3, 6, 8번노드는대상고객전체가계약자와피보험자가다른것으로나타났고다른노드는계약자와피보험자가동일한비율이 60% 이상이됨을알수있다. 1, 2, 3, 4, 19 노드는대상전체가남성계약자이고, 나머지노드는여성계약자이다. 4, 13 노드는 40세이하계약자비율이 0% 임으로보아노년층비율이높음으로판단할수있다. 노드별월납환산보험료 10만원이상비율과저축성보험비율패턴이유사한것으로보아, 보험료가 10만원이상이면저축성보험가입비율이높은것으로판단되며, 2, 4, 13 노드는월납환산보험료 10만원이상비율과저축성보험비율이둘다높고, 18, 19 노드는월납환산보험료와저축성보험비율모두낮은것으로나타난다. 또한, 어린이보험가입비율이높은 3, 6, 8번노드가계약자와피보험자가모두다른것으로보아, 3, 6, 8번노드는어린이보험혹은기타보험을타인을담보로만계약하는계약자의속성임을파악할수있다. 각각의노드별고객을파악하여, 19개의노드중추가가능성이높고, 차별화된특성을가진유망노드 10개를 < 표 9> 와같이특징이유사한 6개의군집으로하였다. 각군집의특성을파악할수있고, 이를통해고객집단의특성에맞는추가상품제시가가능하다. 앞에서와같이의사결정나무결과를통해서는추가가입률을높이기위해고객세분화를위한유의변수를찾아내고, 유망고객들을군집화하여고객특성을분석하고평가하였다. 즉노드별추가가입률을고려한다면, 보장경과기간이짧고, 소멸건수가적고모집자입사차월이낮고계약자와피보험자가다르며낮은연령대의여성계약자가유망한것으로나타나며, 유망고객군별특성을기반으로추가상품판매전략이가능하다. 우정경영연구소 91
우정정보 75 (2008 겨울 ) Ⅳ. 맺음말 연구결과, 로지스틱회귀분석의검출력이더안정적인것으로나타났으나, ROC 곡선이나 Lift 도표로판단해볼때두모형의차이는크지않으며, 모두우수한모형으로나타났다. 두가지분석모형을통해서도출된결과를바탕으로고객추가가입에영향을주는변수들을살펴보면다음과같다. 로지스틱회귀분석의경우계약자와피보험자가다른낮은연령의여성계약자, 보장경과기간이짧고모집자와수금자가동일한경우에추가가입확률이높아지는것으로나타났다. 의사결정나무모형은보장경과기간이짧고소멸건수가적고모집자입사차월이낮으며계약자와피보험자가다르고낮은연령의여성계약자인경우에추가가입확률이높아지는것으로나타났다. 본연구의시사점으로는첫째, 고객관리측면에서는, 보장경과기간이짧고, 소멸건수가적고, 계약자와피보험자가다른, 낮은연령의여성계약자가추가가입유망고객임을알수있었고, 신규고객관리의중요성을실감할수있다. 둘째, 모집자입사차월이낮을수록추가가입가능성이높아지는것으로보아모집자코드를부여받은지 3년이하가되는모집자의추가가입확률이높음을알수있다. 즉신규모집자가우체국보험가치증대에중요한역할을할것임을알수있다. 본연구의한계점으로는분석에활용된변수를들수있다. 특히, 고객속성정보중직업변수의충실도가낮은편이어서변수의유의성을판단하기힘들고, 군집별속성파악도충분치않다. 최근 2~3 년내에연락정보현행화율은많이향상된반면, 분석에필요한정보는아직부족함을알수있다. 앞으로시행되는각종캠페인시고객정보현행화를통한고객정보충실도율을향상시키는것이중요하다고할수있다. 고객관계관리를위한모형의구축은단순히일회로끝나는작업이아니라, 지속적으로이루어져야만실효성을거둘수있다. 그러나본연구에서는시간상의제약으로인해서예측결과를실무에직접적용하여실질적인마케팅성과나수익성에대한영향을조사 분석하지못한한계점도있다. 향후모형의정확도와예측력, 활용도모두를제고할수있는연구가계속되어야할것이다. 92
참고문헌 박찬욱, 금융기관의데이터베이스마케팅, ( 주 ) 시그마인사이트컴, 2002. 안철경 조혜원, 보험회사의 CRM에관한연구, 보험개발원, 2001. 이호영, 생명보험회사고객관계관리를위한고객이탈예측모형에관한연구, 한국외국어대학교, 2004. 정요천, 교차판매스코어링모델개발에관한연구, 호서대학교, 2002. 정홍주, 보험마케팅의이해, 보험일보, 2005. 최정환 이유재, 죽은 CRM 살아있는 CRM, 한언, 2001. 최종후 한상태외, SAS Enterprise Miner 를이용한데이터마이닝-기능과사용법, 자유아카데미, 1999., SAS Enterprise Miner 를이용한데이터마이닝-방법론및활용, 자유아카데미, 1999. 한국마케팅연구원, CRM New Marketing, 2003. SAS Institute, Getting Started with the Enterprise Miner Software, 1997. 질디체, The CRM Handbook, 야스미디어, 2003. 필립코틀러, 마케팅 A to Z, 세종연구원, 2003. 우정경영연구소 93