KLIPS 에근거한주거력데이터구축및활용 Ⅰ. 서론및선행연구 ----------------------------------------------------- * 한국노동연구원연구위원 (kheelee@kli.re.kr) ** 경희대학교경제학과교수 (imin@khu.ac.kr) - 1 -
1) 주거이동과관련된이론적배경및선행연구들에대한자세한사항은조성진 (2014), 문근식 이현석 (2016) 등참고. 특정주거지 ( 주택 ) 에서의거주기간이아닌이주여부 / 계획을종속변수로하여로짓 (Logit) 이나프로빗 (Probit) 모형등을이용하여분석한연구들도많이있다 (S nchez & Andrews, 2011; 최열 김형준, 2012; 조성진, 2014; 문근식 이현석, 2016 등 ). 2) 전세가구의경우에는, 가구소득이높거나주택규모가작은경우, 가구주의직업이 ( 상용직대비 ) 자영업인경우, 특정주거지에서의거주기간이길어지는경향을보였다. 한편, 자가가구의경우에는, 통근거리가길거나주택규모가작을수록, 거주기간이짧아지는 ( 주거이동확률이높아지는 ) 양상을보였다. - 2 -
Ⅱ. 주거패널데이터 3) 주거패널데이터구축시 Stata 명령어 klips_use 와 klips_add 를이용하였다 ( 민인식, 2016). - 3 -
변수이름 변수정의 변수설명 가구id 가구 id 조사 wave 조사 wave (1차 ~ 18차 ) 조사년도 조사년도 (1998년 ~2015년 ) 이사여부 해당 wave에이사여부 (1= 이사 0= 비이사 ) 점유형태 주택의점유형태 (1= 자가 2= 전세 3= 월세 4= 기타 ) 주택유형 주택유형 (1= 단독주택 2= 아파트 3= 연립 4= 다세대 다가구 5= 상가및기타 ) 주거면적 주거면적 : 자가인경우전체면적, 자가이외경우실사용면적 주택시가 주택의시가 ( 자가이외의경우는결측치 ) 보증금 임차보증금 ( 자가인경우에는결측치 ) 월세 월세 ( 점유형태가월세또는기타인경우에만관찰됨 ) 거주시작년월 현재주택거주시작년월 Pr 4) 따라서 변수의 1998 년값은모두결측치이다. - 4 -
lowess: (mean) move.12.13.14.15.16.17 2000 2005 2010 2015 조사년도 Pr 시점 시점 89.3 10.6 82.0 17.9-5 -
.1.2.3.4.5.6 1998 2000 2002 2004 2006 2008 2010 2012 2014 조사년도 자가전세월세 Pr 5) 점유형태가 상가및기타 인가구의이행확률은제시하지않는다. - 6 -
Pr 시점 95.4 2.76 0.85 시점 11.7 79.9 6.5 4.9 11.3 80.5 klips_use klips_add klips_use klips_final.dta klips_use 거주지역가구주성별가구주나이자녀수0세6세자녀수7세12세 /// 자녀수13세15세가구원수가구주혼인가구주교육총소득부채총액 /// 고등학교이하자녀수 ///, wave(01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18) wd(c:\klips) klips_final.dta klips_ 주거패널데이터.dta klips_ 주거패널데이터 1.dta - 7 -
cd c:\klips use klips_final, clear merge 1:1 hhid wave using klips_ 주거패널데이터, nogen save klips_ 주거패널데이터1, replace klips_ 주거패널데이터 1.dta 변수 가구수 observations id 및 wave 변수 : 3개가구특성변수 : 12개주거관련변수 : 8개 9,574 가구 99,017 개 6) KLIPS 에서 1 인가구를정확히식별 (identify) 하기위해서는가구원수변수뿐아니라가구원의동거여부까지고려해서 1 인가구를정의해야할것으로판단된다. - 8 -
.15.2.25.3.35.4 1998 2000 2002 2004 2006 2008 2010 2012 2014 조사년도 자가전세월세 점유형태 월주거비계산 전세가구 ( 전세보증금 이자율 ) 12 월세가구 {( 월세보증금 이자율 ) 12} + 월세 7) 임대차가구비율 = 100% - 자가비율 38% = 62%. 한편전월세비율은 16% + 28% = 44%. 8) 한국은행경제통계시스템에서연도별이자율변수를가져와서사용한다. 9) 월주거비비율이 100% 가넘는경우는이상치 (outlier) 로간주하고제외하였다. - 9 -
lowess: (mean) hcost_ratio 16 18 20 22 24 1998 2000 2002 2004 2006 2008 2010 2012 2014 조사년도 Ⅲ. 주거력데이터 - 10 -
변수이름 변수정의 변수설명 가구 id 가구 id 주택순서 거주주택의순번 거주시작년도 해당순번주택의거주시작년도 마지막거주년도 해당순번주택의마지막거주년도 거주시작 wave 거주시작년도에매칭되는 wave 거주이전 wave 마지막거주년도에매칭되는 wave 우측절단여부 마지막거주년도가관찰되지않으면 1 마지막거주년도가관찰되면 0 거주기간 해당순번주택에서거주기간 ( 마지막거주년도 거주시작년도 +1) 로계산 - 11 -
klips_ 주거력데이터.dta 단계제 1 단계제 2 단계제 3 단계제 4 단계제 5 단계제 6 단계 과정설명 변수를새로만든다. 이변수는 시점의주거상태를 시점의주거상태와비교하여주택이바뀌었으면 이고바뀌지않았다면 이된다. 는 KLIPS에서조사하는 이사여부 변수와정확히일치하지는않는다. 이되는경우 1) 거주지역이바뀐경우 2) 주택점유유형이바뀐경우 3) 주택종류가바뀐경우 4) 이사여부 변수에서 이사 로답한경우위 4가지경우중한가지라도해당하면 이된다. 인데 가결측치로되어있으면 값은해당조사년도에이사한것으로간주한다. 인데 시점의 값이 시점의 보다작으면해당조사년도에이사한것으로간주한다. 인데 시점의 값과 시점의 값이서로다르면 시점의 값을 시점의 값으로대신한다. wave 8 이후의조사에서 인경우, 이결측이면 시점의 값으로대신한다. 10) 자세한구축과정에대한설명은교신저자 ( 민인식 ) 에게문의할수있다. 11) 변수값이 60 년초과인경우는이상치로제외하고평균을계산하였다. - 12 -
변수표본수평균표준편차중앙값최소값최대값 9,344 가구 3.26 2.27 3 1 13 30,285 obs 5.12 7.46 3 1 60 (mean) duration 0.0 5.0 10.0 15.0 20.0 25.0 24.5 5.9 ~1989 년 1990~1999 년 2000~2009 년 2010 년이후 2.4 1.7 12) < 표 7> 과마찬가지로 인표본은제외하고계산하였다. - 13 -
klips_use klips_add klips_use klips_final.dta klips_ 주거패널데이터 1.dta klips_use 거주지역가구주성별가구주나이자녀수0세6세자녀수7세12세 /// 자녀수13세15세가구원수가구주혼인가구주교육총소득부채총액 /// 고등학교이하자녀수 ///, wave(01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18) wd(c:\klips) merge 1:1 hhid wave using klips_ 주거패널데이터, nogen save klips_ 주거패널데이터 1, replace klips_ 주거력데이터.dta klips_ 주거패널데이터 1.dta use klips_ 주거력데이터, clear ren (house_begin house_end) (house_year1 house_year2) ren (house_bwave house_ewave) (house_wave1 house_wave2) reshape long house_year house_wave, i(hhid house_num) j(nn) ren house_wave wave order hhid house_num wave merge m:1 hhid wave using klips_ 주거패널데이터1 keep if _m==3 drop _m order hhid house_num wave drop move hbegin save klips_ 주거력데이터1, replace - 14 -
점유형태 주택유형 자가 전세 월세 기타 8.28년 (11,950) 2.94년 (9.620) 2.94년 (5,161) 3.16년 (2,354) 단독주택 아파트 연립 다세대 / 다가구 상가및기타 8.40년 4.61년 3.75년 3.06년 3.42년 (7,567) (11,220) (3,177) (5,030) (2,067) - 15 -
Ⅳ. 거주기간에대한생존분석 exp log exp - 16 -
y 0.2.4.6.8 1 0 1 2 3 4 5 x gamma IG - 17 -
변수속성변수이름변수설명 종속변수 거주기간우측절단 (right-censored) 인경우에는 2015년까지거주했다고가정함가구주나이 가구주성별 (1= 남자, 2= 여자 ) 설명변수 고등학교이하자녀수가구주교육수준 (1= 고졸미만, 2= 고졸또는대학중퇴, 3= 전문대졸이상 ) 가구주혼인상태 (1= 미혼 / 기혼무배우 2= 기혼유배우 ) 거주지역 (1= 광역시 2= 비광역시 ) 2015년실질소득으로환산한가구실질소득의로그값주택점유형태 (1= 자가 2= 전세 3= 월세및기타 ) 13) 로그로지스틱분포에서 값과해저드함수와의관계는이경희 민인식 (2016) 참고. - 18 -
모수적분포함수 : Weibull distribution 모수적분포함수 : Log-logistic distribution frailty 분포 : Gamma frailty 분포 : IG frailty 분포 : Gamma frailty 분포 : IG 0.032 (0.0007)*** 0.034 (0.0007)*** 0.024 (0.0006)*** 0.025 (0.0007)*** 0.056 (0.009)*** 0.053 (0.009)*** 0.067 (0.009)*** 0.066 (0.009)*** 0.027 (0.009)*** 0.021 (0.009)** 0.028 (0.009)*** 0.025 (0.009)*** ( 여자 ) -0.003 (0.025) -0.010 (0.025) -0.037 (0.022) -0.010 (0.025) ( 기혼유배우 ) -0.074 (0.023)*** -0.083 (0.023)*** -0.037 (0.022)* -0.039 (0.022)* ( 비광역시 ) 0.111 (0.016)*** 0.124 (0.017)*** 0.090 (0.015)*** 0.098 (0.015)*** ( 전세 ) -0.850 (0.017)*** -0.869 (0.017)*** -0.681 (0.017)*** -0.692 (0.017)*** ( 월세 ) -0.833 (0.020)*** -0.850 (0.020)*** -0.692 (0.020)*** -0.704 (0.020)*** ( 고졸 ) 0.152 (0.024)*** 0.144 (0.024)*** 0.237 (0.023)*** 0.242 (0.024)*** ( 전문대졸이상 ) 0.219 (0.026)*** 0.206 (0.027)*** 0.332 (0.026)*** 0.341 (0.027)*** 상수항 0.085 (0.086) 0.063 (0.087) -0.198 (0.086) -0.231 (0.087) log 0.261 (0.006)*** 0.256 (0.006)*** log -0.699 (0.039)*** -0.521 (0.049)*** log -0.572 (0.006)*** -0.573 (0.007)*** log -1.126 (0.050)*** -1.066 (0.056)*** log -32585-32614 -32125-32132 LR 검정 1,683*** 1,625*** 807*** 791*** 26,657 26,657 26,657 26,657-19 -
Hazard function.05.1.15.2.25.3 0 10 20 30 40 analysis time 자가전세월세 14) 로그로지스틱분포모형에서는 5% 유의수준에서는유의하지않게추정된다. 15) 관심변수이외의변수는평균에서고정시킨상태에서그래프를작성한다. - 20 -
Hazard function.05.1.15.2.25.3 0 10 20 30 40 analysis time 30 대 40 대 50 대 V. 결론및시사점 - 21 -
- 22 -
참고문헌 - 23 -