국가통계방법론심포지엄 2017. 10. 26. 오미애 한국보건사회연구원빅데이터연구팀장
1. 연구배경 2. 3. 4. 5. 6. 2
4 2014 년 12 월송파세모녀법으로불리는 국민기초생활보장법 및 긴급복지지원법 개정안, 사회보장급여의이용 제공및수급권발굴에관한법률 제정등복지사각지대해소와관련된 3 개법안이국회를통과, 2015 년 7 월 1 일부터시행 2017-10-07 4 [ 네이버지식백과 ] 송파세모녀사건 ( 시사상식사전, 박문각 )
5 가. 이법은사회보장관련정보또는신청능력의부족으로보호받지못하는사회보장수급권자를발굴 하여지원함으로써국민의사회보장수급권을최대한보장하고사회보장급여가공정하고효과적으로 제공하는것을목적으로함 ( 안제 1 조 ) 나. 수급권자의발굴을위하여사회복지법인, 국민연금공단, 보건소또는경찰서등의기관및단체간 의연계및협력, 관련정보의공유등이원활하게이루어질수있도록하고, 이들정보를사회보장사각 지대해소를위해제공될수있도록함 ( 안제 4 조및제 7 조부터제 9 조 ) 다. 누구든지사회적위험에처한보호대상자를발견하였을때에는보장기관에신고하도록하고, 신고된보호대상자에대하여조사 상담 안내 의뢰하며, 보호대상자가사회보장급여를신청하는데필요한서비스를제공하도록함 ( 안제9조부터제14조 ) 2017-10-07 5 위키백과세모녀 3 범
6 라. 국가및지방자치단체는수급권자별사회보장급여제공계획을수립하고제공결과를정기적으로 평가하여그결과에따라보호계획을변경하도록하며, 이들업무를실시하기위하여전담하는직원 을두도록함 ( 안제 15 조 ) 마. 수급권자의발굴, 의뢰, 신청, 조사, 결정, 보호계획의수립등의업무에종사하거나종사하였던자 는사회보장업무수행과관련하여알게된개인 법인또는단체의정보를관계법령에서정하는바 에따라보호하도록함 ( 안제 17 조 ) 바. 국가및지방자치단체의장의권한또는업무의일부를소속기관의장이나사회복지관련기관및단체에위탁하고, 그업무의처리에필요한인력또는경비를지원할수있는근거를마련함 ( 안제 19조및제20조 ) 2017-10-07 6 위키백과세모녀 3 범
7 복지사각지대로인한사회적문제가지속적으로제기됨에따라지자체일제조사를통한사각지대대상자발굴추진 ( 11 년 ~) 지자체공무원, 통 리반장등이참여한민관협력을통해지역사회취약계층을발굴하기위한복지사각지대일제조사 15 년보건복지부중점업무계획으로 사각지대관리시스템구축을통한잠재위기가구주기적모니터링 과제제시 ( 15.1 월 ) 다양한공공정보를수집 분석하여위기가구를발굴하고, 지자체를통해복지지원을연계하며, 그지원이력을지속관리 2015 년도부터보건복지부, 한국보건사회연구원, 사회보장정보원, 서울대학교통계학과가협업하여복지사각지대발굴방안연구진행중 사회보장정보시스템을활용한복지사각지대발굴방안연구 ( 15.1 ~ 9 월 ) 사회보장정보시스템을활용한복지사각지대발굴방안후속연구 ( 16.3 ~ 12 월 ) 사회보장정보시스템을활용한복지사각지대발굴방안확대연구 ( 17~ ) 2017-10-07 7 7
2. 개념정의 개념 Ⅰ 개념 Ⅱ 개념 Ⅲ
9 사회보장정보시스템 2017-10-07 9 사회보장정보원홈페이지 9
10 사회보장정보시스템 사회보장정보원홈페이지 2017-10-07 10 10
11 복지사각지대 사회보장정보시스템을고려할때의복지사각지대의범위는사회보장정보시스템에서관리하는복지제도의지원기준에적합하지만해당복지급여의지원을받지않는개인이나가구를의미 사회보장정보시스템에서관리하는복지제도의지원기준에적합하지않지만, 업무담 당자가민간자원을통해한시적도움을제공할필요가있다고판단되는개인이나가구 를의미 본연구에서는복지사각지대의분석대상을사회보장정보시스템에서접근가능한 차상위계층까지한정 2017-10-07 사회보장정보시스템을활용한복지사각지대발굴방안연구 (2015) 11 11
12 사회보장빅데이터 사회보장빅데이터의개념은사회보장의정의에따라사회보장이포괄하는영역의범위와관련되며, 사회보장분야에서생산및구축된행정데이터또는빅데이터 로정의할수있음 이는사회보장기본법제 3 조에제시된사회보장의정의를근거로설정할수있는데, " 사 회보장 " 은출산, 양육, 실업, 노령, 장애, 질병, 빈곤및사망등의사회적위험으로부터 모든국민을보호하고국민삶의질을향상시키는데필요한소득 서비스를보장하는 사회보험, 공공부조, 사회서비스를의미함 ( 제 3 조의 1) 사회보장기본법에기초하여사회보장의개념과범위를정의할수있는것처럼, 행정데이터또는빅데이터를의미하는정보및이러한정보가구축및운영되는시스템은, 사회보장급여의이용ㆍ제공및수급권자발굴에관한법률 ( 사회보장급여법 ) 제 23 조의 사회보장정보 와사회보장기본법제 37 조에근거한 사회보장정보시스템 ( 행복 e 음, 범정부시스템 ) 으로정의된다고할수있음 2017-10-07 12
13 사회보장빅데이터 따라서, 사회보장빅데이터의개념과범위는 사회보장분야 ( 사회보장기본법제 3조 ) 의다양한정책수립및시행과관련하여정책의집행과정에서사회보장정보시스템 ( 사회보장기본법제37조 ) 과각종사회보험제도운영을지원하는정보시스템을통해구축된사회보장정보 ( 사회보장급여법제23조제1항 ) 로설정할수있음 2017-10-07 13
3. 복지사각지대발굴을위한연계정보
15 2017-10-07 사회보장정보시스템을활용한복지사각지대발굴방안연구 (2015) 15 15
16 구분 대상기관 개인및가구영역 일자리영역 범죄피해자정보화재피해자정보재난피해자정보주거위험 1( 전세보증금 ) 주거위험 2( 월세정보 ) 위기학생정보고용위험1 ( 개별연장급여대상 ) 고용위험2 ( 임금체불등사유로실업급여수급 ) 고용위험3 ( 실업급여수급기관과소자 ) 고용위험4 ( 실업급여비대상자 ) 경찰청국민안전처국토교통부교육부고용노동부 2017-10-07 사회보장정보시스템을활용한복지사각지대발굴방안연구 (2015) 16 16
17 구분 대상기관 경제적여건 심리 사회적특성 단전정보전기료체납정보단수정보단가스정보건보료체납가구의료비과다지출가구 ( 본인부담금상한액 ) 장기요양보험수급상태국민연금보험료체납자살고위험군자살 자해시도자정보 한국전력공사상수도사업본부도시가스사업자건강보험공단국민연금관리공단보건소, 자살예방센터응급의료센터 제도 / 서비스등 건강위험1 ( 방문건강사업집중관리대상 ) 보건소건강위험2 ( 미숙아지원사업 ) 시설입소및퇴소자 기초생활수급 / 긴급복지탈락및중지자 복지부 2017-10-07 17 사회보장정보시스템을활용한복지사각지대발굴방안연구 (2015) 17
18 외부기관 한국전력공사 건강보험공단 국민연금공단 교육부 광역상수도사업본부 국민안전처 고용노동부 신용정보원 외부연계정보 (23 종 ) 단전, 단수, 단가스데이터사회보장시스템내부정보 (33종) 응급의료센터 건보료체납데이터 의료비과다지출데이터경찰청 국민연금체납데이터 개인건강상태국토교통부 위기학생데이터 개인장애유무 건강위험데이터보건소 장애인가구여부 범죄피해데이터 일자리정보도상수도사업소 화재피해데이터 소득인정액 주거, 고용위험데이터도시가스사업자 자살위험데이터 가구유형정보등자살예방센터 공공임대주택체납데이터 금융연체데이터근로복지공단 재난데이터 산재요양종결데이터 2017-10-07 18 사회보장정보시스템을활용한복지사각지대발굴방안확대연구 (2017) 18
4. 복지사각지대발굴프로세스
20 2017-10-07 사회보장정보시스템을활용한복지사각지대발굴방안연구 (2015) 20 20
21 복지사각지대고위험가구예측및발굴프로세스 (step1) 전체데이터를 training set( 모델구축 ), test set( 모델평가 ) 로나누어각각의모델에대한정확도측정 (step2) 구축된여러모델을통합하여최초통계모델로선택. 모형평가란, 예측 (prediction) 을위해만든모형이임의모형 (random model) 보다예측력이우수한지, 고려된다른모형중어느모형이가장우수한예측력을보유하고있는지를비교, 분석하는과정이라고할수있음 (step3) 통계모델에의해고위험가구선정결과 list 를지자체에제공고위험가구 list 를바탕으로지자체방문조사수행및복지서비스제공 (step4) ( 환류 ) 조사및조치결과를비교분석하여통계모델개선및정확도제고에활용 정교화된통계모델을활용한고위험가구선정결과제공 지자체방문조사수행및결과입력 통계모델정교화및새로운정보연계확대 ( 반복 ) 2017-10-07 21 21
5. 복지사각지대발굴예측모형
23 Predictive Modeling : 주어진 Data 에근거하여 Model 을만들고이 Model 을이용하여새로운 Case 들에대한예측을하는작업 축적된데이터 예측모델 예측 1. Logistic Regression 2. Logistic + Elastic Net 3. Random forest 4. Boosting 복지사각지대위험가구의위험정도예측 복지사각지대발굴에유의한변수정의 2017-10-07 23 23
24 2015 년 7 월시행된사회보장급여법및시행령을통해복지사각지대관련정보를수집할수있는법적근거가마련되었으나, 이러한정보들이연계되고수집된다고할지라도복지사각지대예측을위한통계모형구축을위해서는복지사각지대와관련된특성뿐만아니라조사결과에따른복지사각지대해당여부에대한정보가필요함 이에따라, 복지사각지대발굴방안마련을위한취약계층실태조사 를계획하여수행하였음 이러한사전실태조사 ( 일선지자체실태조사 ) 결과 (6,849 가구, 74 개변수 ) 를바탕으로복지사각지대예측을위한분석및통계모형구축을실시 본실태조사결과를기초로복지사각지대위험확률이높은가구를추출할수있는초기통계모형을개발하고, 이를기반으로사각지대발굴관리시스템에적용구축함 2017-10-07 24 24
25 (step1) 실태조사기반모형구축및검증 1 차연구에서수행된복지사각지대실태조사 (6,849 가구 ) 74 개변수기반으로신규연계정보와동일또는유사한변수생성 < 한계 > 실태조사당시복지사각지대비율이 85.9% 로높았으며, 모형구축시 74 개변수중신규연계정보와동일또는유사한변수만활용 신규연계정보변수 (X) 와복지사각지대 ( 차상위지원대상이하 ) 가능성여부판단변수 (Y) 기준으로, 4 가지방법론 (Logistic, Elastic-net, Random forest, Boosting) 별모형구축및검증 (step2) 신규연계정보활용복지사각지대위험가구확률예측 4 개방법론 (Logistic, Elastic-net, Random forest, Boosting) 별구축모형과신규연계정보중해당여부관련변수를활용하여개별사례의잠재적복지사각지대위험가구확률예측 (step3) 현장발굴대상복지사각지대위험가구추출및제공 개별사례의잠재적복지사각지대위험가구확률예측결과를바탕으로현장발굴대상복지사각지대위험가구리스트추출및제공 전체 case 중현장발굴대상위험가구규모및확률순위등을고려하여추출 복지사각지대위험가구확률에따른우선순위및등급부여후지자체제공 2017-10-07 25 25
26 (step4) 복지사각지대발굴조사및지원결과환류데이터기반예측모형재구축 실태조사의한계를개선하고, 연계정보 ( 해당여부및세부정보 ) 활용을통한예측모형정교화를위해발굴및처리결과 ( 실태조사포함 ) 환류필수 신규연계정보중다양한상세정보를활용한예측및모형정교화는, 발굴대상조사및지원결과환류데이터기반으로 2016 년연구에서수행 2015. 12 월신규연계정보기반복지사각지대위험가구예측결과제공을통해지자체조사및지원결과환류데이터중심으로모형비교및재구축 < 비교 > 실태조사당시조사대상의특성으로인해복지사각지대해당비율이 85.9% 로높았으나, 1 차환류데이터분석대상 (8,922 건중중복지원및가구 ID 중복을제외한 4,785 가구 ) 중복지사각지대로확인된지원완료가구는 20.4% 로, 실태조사의한계와환류데이터분석의중요성을확인할수있음 2017-10-07 26 26
27 method Advantages Disadvantages 모형이안정적 Logistic 모형의해석이쉬움 Regression 계산이어렵지않음 오직 linear decision boundary 를제공 Interaction term 없음 Elastic Net 회귀분석에서다중공선성문제해결가능 모형의해석이쉬움 변수선택가능 parameter tunning Random Forest 매우높은예측력 독립변수의수가많을때에도좋은결과를얻을수있음 이상치에둔감 독립변수의변환에 invariant Interaction terms : 비선형효과고려 이론적설명부족 최종결과에대한해석이어려움 Boosting 매우높은예측력 독립변수의변환에 invariant Interaction terms : 비선형효과고려 parameter tunning 2017-10-07 27 27
28 1~3 차환류데이터및 1~4 차환류데이터반영예측모형 Logistic Coeff 변화 2017-10-07 28 28
29 1~4 차환류데이터반영예측모형 Boosting 상대적영향도 2017-10-07 29 29
6. 개선사항및향후방향
31 일선현장의업무담당자들이중요하다고생각하는복지사각지대발굴에유효한항목과사회보장빅데이터를활용한예측모형에서유의미한항목의간극을줄일필요가있음 연계정보의유의미성에대한체감도및신규연계정보에대한아이디어수렴 그동안축적된발굴및지원결과에근거하여복지대상자발굴정확도제고를위한통계모형개선 Deep Learning 적용검토 복지사각지대지원현황분석및업무처리개선방안마련 정보시스템을활용하여복지사각지대대상자업무처리과정이효율적으로이루어질수있도록지원방안마련 2017-10-07 31 31
32 빅데이터와인공지능기반복지사각지대발굴시스템에의한복지패러다임의전환 http://gov30.hiphen.net/bbs/board.php?bo_table=case&wr_id=73 2017-10-07 32 32
33 2017-10-07 33