I. 서론 국민삶의질지표에관한통계분석 1.1 연구목적 삶의질 (EQ-5D) 이라는종속변수를대상으로하여나머지여러개의설명변수가종속변수를어떻게설명하는지, 또어떠한영향을가져올수있으며, 서로어떠한연관성을가지는지에대한의문을풀기위하여분석을실시하고, 이에 대하여조사목적이있다. 먼저삶의질이란한지역에대하여개인에대한건강한삶의질이나아지면, 자신의행복이 각지역들의합으로이어지기때문에시민들이어느변수에서정신적으로나또한육체적으로얼마나건강한지에대하 여, 또얼마나연관성을가지는지에대하여알아보기위해데이터를사용해서분석하고자하는것에목적을가지고분 석과조사를할것이다. 이에앞서, 종속변수인 EQ-5D 지표에대해설명하자면 EQ-5D( 삶의질 ) 은, 국가통계포털사이트인 www.kosis.kr 에서수집하였으며, 통계청조사기획과에서분석하였다. 이데이터는각도시별로 78 개의도시데이터 를가지고있으며, 또한각시, 군, 구보건소단위로생산된통계자료이고, 조율값을사용한다. EQ-5D 의정확한정의 는건강에대한삶의질의 5 가지차원의기술체계를종합한지표로, 수치가 1 에가까울수록건강에대한삶의질이높 다고할수있다. 또한, 만성질환의증가와수명의증가로사망률뿐만아니라삶의질을포괄하는건강지표의필요성이 대두되었는데, 한정된자원의효율적사용과근거중심의보건정책을위하여경제성평가의필요성이강조되고있다. 비 용효용분석에사용되는 QALY 는근거중심정책의중요한도구가되며이를산출하기위해서는다양한건강상태의 가치를하나의점수로나타낼수있어야한다. EQ-5D 는 EuroQol 그룹에서개발한일반적측정도구로, 운동능력, 자기 관리, 일상활동, 통증 / 불편, 불안 / 우울 의 5 개차원에대해서 문제없음, 다소문제있음, 심각한문제있음 의 3 가지수 준으로평가하도록구성되어있다. 그리고 EQ-5D 는가장많이사용되고있는일반적측정도구로, 이를이용하면질 보정수명을구하는데필요한효용가중치도구할수있어널리사용되고있다. 삶의질 (EQ-5D) 의산출식은 y = 1 - (0.05 + 0.096*M2 + 0.418*M3 + 0.046*SC2 + 0.136*SC3 + 0.51*UA2 + 0.208*UA3 + 0.037*PD2 + 0.151*PD3 + 0.043*AD2 + 0.158*AD3 + 0.05*N3) 이다. < 표 1> EQ-5D 변수명 정의 변수명 정의 M2 운동능력이 수준 2 인경우 1; 그렇지않으면 0 M2 운동능력이 수준 2 인경우 1; 그렇지않으면 0 M3 운동능력이 수준 3 인경우 1; 그렇지않으면 0 M3 운동능력이 수준 3 인경우 1; 그렇지않으면 0 SC2 자기관리가 수준 2 인경우 1; 그렇지않으면 0 SC2 자기관리가 수준 2 인경우 1; 그렇지않으면 0 SC3 자기관리가 수준 3 인경우 1; 그렇지않으면 0 SC3 자기관리가 수준 3 인경우 1; 그렇지않으면 0 UA2 일상활동이 수준 2 인경우 1; 그렇지않으면 0 UA2 일상활동이 수준 2 인경우 1; 그렇지않으면 0 UA3 일상활동이 수준 3 인경우 1; 그렇지않으면 0 UA3 일상활동이 수준 3 인경우 1; 그렇지않으면 0 PD2 통증 / 불편감이 수준 2 인경우 1; 그렇지않으면 0 PD2 통증 / 불편감이 수준 2 인경우 1; 그렇지않으면 0 PD3 통증 / 불편감이 수준 3 인경우 1; 그렇지않으면 0 PD3 통증 / 불편감이 수준 3 인경우 1; 그렇지않으면 0 AD2 불안 / 우울이 수준 2 인경우 1; 그렇지않으면 0 AD2 불안 / 우울이 수준 2 인경우 1; 그렇지않으면 0 AD3 불안 / 우울이 수준 3 인경우 1; 그렇지않으면 0 AD3 불안 / 우울이 수준 3 인경우 1; 그렇지않으면 0 N3 수준 3 이하나라도있을때 1, 나머지는 0 N3 수준 3 이하나라도있을때 1, 나머지는 0 설명변수의대분야를사회와환경으로두가지의분류를하였다. 삶의지표에영향을줄것같은많은변수들을 포괄적이게분류를하여총 10 개의변수들을소분류로생각하고, 최종적으로사회와환경이라는대분류로나누었다. 또한자신이종속변수에영향을줄것같은 10 가지의설명변수들을중분류로나누고, 이변수들의실제데이터를찾아 보았다. 이데이터들역시국가통계포털사이트인 www.kosis.kr 에서모든자료를확보하였다. 이사이트에서엑셀 자료를다운받아정리하였으며, 변수의단위는국가통계포털사이트에있는데이터안에들어있는단위를사용하였 -1-
다. 이변수들은두가지의설명변수인사회분야에서는, 의료보장성, 복지보장성, 사회안전성, 도시재정건강성, 직업안정성으로정했고, 나머지설명변수인환경분야에서는, 거주환경쾌적성, 교육수준, 문화시설접근성, 가정환경안정성, 교통용이성으로정하여 10개의변수로이루어져있다. 이데이터들은모두 2013 년도의자료를사용하였으나, 부득이하게도 2013 년도의자료가없는복지보장성의측정변수인사회복지시설수의데이터는 2012년도의데이터로대체해서분석하였다. 1.2 데이터설명먼저첫번째설명변수인사회에대한분야에서는 5가지의설명변수를조사한뒤정하였으며, 조사과정에대한데이터수집방법에대하여설명을하겠다. 사회분야에서의측정변수로는첫번째의변수로는의료보장성으로, 보건과의료의보장성이높아지면주민의건강이높아져건강에대한삶의질의만족도가높아지기때문이다. 의료보장성의데이터로는두개의데이터인인구천명당의료고가장비수와, 의료기관종사의사수로정했다. 하지만의료고가장비수를정하는기준을명확하게하기어려움이있고, 데이터도정확하지않기때문에인구천명당의료기관종사의사수를측정변수로정하여분석할것이다. 의료기관에종사하는의사의수가많을수록이에따른여러종류의의료기술을가지고있을것이며, 또한이에대하여좋은품질의진료를받을수있고, 또한자신의건강을알기위해좋은환경이기때문에의료에대한편의성이보장된다고설명할수있다. 또한보건과의료보장성에서긍정적인영향을미쳐양의효과를가지고올수있다고생각하여의료보장성을분석할수있다. 국가통계포털사이트에서가져온데이터인인구천명당의료기관종사의사수 ( 시 ) 는, 78개의시로이루어져있고단위는 명 이며, 인구천명당의료기관종사의사수의산출식 ( 계산방법 ) 은 ( 의사 + 치과의사 + 한의사 )/ 주민등록인구 *1000 이다. 두번째는복지보장성으로, 복지보장성이높아지면주민들의건강에긍정적인영향을가져오기때문에건강에대한삶의질이좋아진다고설명할수있다. 복지보장성의변수, 데이터로는노인복지시설수, 또는유아인구천명당보육시설수인구십만명당사회복지시설수, 인구십만명당노인여가복지시설로정했지만, 유아인구천명당보육시설은주민전체의건강의삶의질에대한설명과분석이어려울것으로생각되어다른복지보장성의변수인인구십만명당노인여가복지시설수로측정변수로정하여분석을할것이다. 이노인여가복지시설들의수가많아질수록도시에대한복지율도높아지는경향을보일수있고, 또한이에따른복지보장성이높아진다고설명할수있다. 그러므로, 시설에의존을해야하는사람들이사용할수있는노인여가복지시설의수가많을수록건강에대한주민들의삶의질에양의효과를가져올수있다고생각하여복지보장성에대한설명을할수있다고생각한다. 국가통계포털사이트에서가져온데이터인인구십만명당노인여가복지시설수 ( 시 ) 는 77개의도시로이루어져있고, 단위는 개 이며, 행정자치부주민등록인구 -일부자료가없는지역은해당출처기관에서자료를제공하지않고있다고한다. 노인여가복지시설은노인복지관, 경로당, 노인교실, 노인휴양소를포함한수치이다. 세번째는사회안전성으로, 사회에대한안전성이낮아지면주민들이느끼는삶의대한안전성이낮아져서, 건강에대한삶의질에부정적인영향을미쳐서주민들의건강성이낮아진다고생각된다. 사회안정성의측정변수로는범죄발생건수, 소년범죄발생건수, 자동차천대당교통사고발생건수로정했지만소년범죄발생건수로는주민들전체의사회안정성을설명하고분석하지못할것으로생각되어이데이터를선택하지않았고, 범죄발생건수의데이터는자료가분명하지않고시에대한데이터가없기때문에자동차천대당교통사고발생건수로측정변수를정해분석을할 -2-
것이다. 또한이데이터가다른데이터보다사회안전성에대하여더욱영향을가져올것으로생각되어교통사고발생건수로측정변수를정할것이다. 교통사고발생건수가많을수록사회안정성에대한믿음이낮아지기때문이다. 그러므로건강에대한지수와연관이있을것이라고생각되어음의효과를가져올것이라고생각한다. 그러므로사회안전성을설명할수있다고본다. 국가통계포털사이트에서가져온데이터인자동차천대당교통사고발생건수는, 78개의시로이루어져있고, 단위는 건 이며, 제 1당사자차종별교통사고발생건수이다. 이데이터에는승용차, 승합차, 화물차, 특수차가포함되어있으며, 자료는도로교통공단에서분석한자료가출처로쓰였다. 네번째는도시재정건강성으로도시재정건강성이높아지거나, 주민들이도시의재정이안정적이라고느낄수록주민들의건강성이높아져삶의질이좋아질것으로예상된다. 도시면적당공장업소수와, 시별회계중사회복지예산비중, 또는재정자립도의데이터로정했으며도시면적당공장업소수는도시재정건강성과환경에대하여서로유사변수라고생각되고, 또한재정자립도의변수가다른변수인공장업소수보다도시재정건강성으로더욱적합하고, 영향을많이가져올것이라고생각되어재정자립도의데이터로측정변수로정하여분석을할것이다. 또한, 재정자립도가높아질수록시에서건강에투자하는복지예산이많아지고, 이로인하여건강에신경을써야하는비중과비율이높아지기때문이라고생각하여도시재정건강성에대하여긍정적인영향과양의효과를동시에가져올것이라고생각하여분석을할것이다. 국가통계포털사이트에서가져온데이터인재정자립도는총 78개의시로이루어져있으며, 단위는 % 이고, 행정자치부의지방재정연감이분석해서나온자료가출처로쓰였다. 다섯번째는직업안정성이다. 직업의안정성이높아지면주민들이느끼는심리적변화에주민들의건강성도높아질것이고, 이에따라서삶의질이좋아질것이라고예상된다. 고용율과실업률을변수로정했다. 하지만고용률, 취업률보다는실업률이직업안정성에대한체감효과가더욱많을것이라고생각되어실업률을최종으로측정변수로선택하여분석할것이다. 실업률이높을수록심리적여유가없어지고경제적으로도불안해져건강에대한부정적인영향을가져올것이라고생각한다. 또한실업률이높을수록직업을잃은사람이많다는이야기로이어지므로, 직업을잃으면수입이없다는것과마찬가지라고생각된다. 그러므로정신적인건강에부정적인영향을미치고스트레스를받는지수가높아질것이며, 또한육체적으로도건강을챙길수없다고생각되어건강에대한삶의질에대하여부정적인영향인음의효과를가져올것이라고생각하여분석할것이다. 국가통계포털사이트에서가져온자료인실업률은, 총 78개의도시로이루어져있으며실업률의구성으로는실업자가경제활동인구 ( 취업자 + 실업자 ) 에서차지하는비율로산출식 ( 계산방법은 ) ( 실업자 / 경제활동인구 )*100 이고, 단위는 % 이며, 이자료는통계청과지역별고용조사에서분석한자료가출처로사용되었다. 두번째설명변수인환경에대한분야에서도마찬가지로 5가지의변수를지정하였다. 이환경분야역시조사과정에대한데이터수집방법에대하여설명을하겠다. 우선첫번째로는, 거주환경쾌적성으로, 거주환경쾌적성이높아지면주민들이느끼는건강성도같이높아져삶의질이좋아진다고생각하였다. 도시면적당폐수배출업소수는폐수를배출하는업소들이많을수록, 또폐수배출율이높을수록거주환경에대한쾌적성이낮아질것이라고생각된다. 하지만인구천명당도시공원조성면적으로측정변수를정하는것이폐수배출업소수로분석하는것보다거주환경쾌적성에더욱영향을미칠것이라고생각되어인구천명당도시공원면적을측정변수로정하여분석을할것이다. 인구천명당도시공원조성면적이넓을수록대기에대하여직접적인영향과, 이로인하여긍정적인영향을미칠것이라고생각되고, 또한면적이넓을수록대기에대하여양의효과인양의영향을가져올것이기때문에거주환경에대한쾌적성 -3-
에대하여긍정적인영향을주어거주환경쾌적성이높아질것이라고생각된다. 또한도시공원조성면적이넓을수록 그주변에있는주민들은공원을더욱자주이용하게되어운동을유도할수있다고생각되고, 이러한환경을더욱용 이하게형성할수있어건강에대한삶의질에대하여긍정적인영향을가져올것이라고생각된다. 국가통계포털사이트에서가져온인구천명당도시공원조성면적데이터는, 총 78 개의시로이루어져있고, 광역 자치단체도시공원조성면적은시와도청에서관리하는공원을포함한수치라고한다. 또공원의도시자연공원항목이 부분적으로용도구역의도시자연공원구역항목으로변경되었으며, 단위는 천m2 이고, 이자료는국토교통부의도시계 획현황과, 행정자치부의주민등록인구가분석한출처이다. 두번째로는교육수준으로, 교육수준이높아지면주민이느끼는건강성도같이높아져삶의질에긍정적인영향 을미친다. 인터넷기사에서교육수준에관한자료를찾아보았는데, 이기사에따르면가톨릭인천성모병원사회사업 팀은다양한프로그램을통해치료중인환자및가족의삶의질을높이며일상으로의빠른복귀를돕고있다고한다. 이렇게많은프로그램을통하여삶의질을높여건강에대한삶의질에관련성이있다고생각하여교육수준에대한 조건을조사할것이다. 사회복지정보교육은인천성모병원의료사회사업가가각질환의특성에맞는질환별의료비지 원정보부터장애등록절차, 의료급여수급권신청방법, 노인장기요양보험신청방법, 기타사회적인혜택등에대해 안내한다. 이런사회복지정보교육은환자들이질병으로인한사회와경제적인부담을줄이고일상생활로빠른복귀가 가능하도록돕도록하는데초점을맞추었다고한다. 이기사의출처는 http://www.edaily.co.kr/news/newsread.edy?scd=jg61&newsid=01787606609366624&dcd=a0 0706&OutLnkChk=Y 이다. 측정변수로는인구천명당사설학원수, 인구천명당전문대및대학교수, 혹은인구천명당초등학교수로정했 다. 하지만인구천명당전문대및대학교수는데이터에누락된도시가많아데이터의수가적고, 사설학원수나전문 대및대학교수보다인구천명당초등학교수가더욱교육수준에대하여많은설명할할수있고, 영향을미칠것이 라고생각되어이변수를측정변수로정하여분석을할것이다. 교육수준에대한초등학교수가많아질수록주민들의 교육에대한선택의폭의넓어져자신의생각대로교육의질을선택할수있어, 교육수준이높아질것이고또한물질 적으로도저축할수있다고생각된다. 이로인하여삶에대한여유가생겨건강에대한신경을쓰는비율이연관이되 어양의효과를얻을것이라고생각된다. 또한교육시설의환경과접근성이높아질수록더욱건강에대하여지적인삶 의질을얻을수있으며, 학교와가까워질수록정신적으로받는스트레스를줄일수있어건강에대한삶의질이높아진다고생각된다. 국가통계포털사이트에서가져온초등학교수의데이터는총 78 개의데이터를가지고있으며, 단위는 개 이고, 초등학교수에서분교는제외가되었다. 이자료는한국교육개발원교육통계연구센터에서분석한자료이고, 출처로쓰 였다. 세번째로는문화시설접근성으로, 문화시설접근성이높아지게되면주민들이느끼게되는건강성이높아져삶의 질에대하여긍정적인영향을가져올것이다. 측정변수로는인구천명당영화관수, 혹은미술관수로정했다. 하지만 인구십만명당문화시설기반수의데이터로측정하는것이나머지변수를측정하여분석하는것보다문화시설접근성에대하여더욱많은영향을가져올것이라고생각되어인구십만명당문화시설기반수의데이터를측정변수로정 하여분석할것이다. 문화시설기반수가많아질수록삶의대한여유를느끼며건강에대한긍정적인영향을미칠것이 라고생각된다. 또한정신적스트레스를줄이기위해서, 또문화생활을즐기기위해문화기반시설로인하여주민들이 문화생활을하는시간이많아져정신건강에대한삶의질이높아질것이라고예상되어분석을할것이다. 국가통계포털사이트에서가져온인구십만명당문화기반시설수의데이터는총 78 개의시로이루어져있고, -4-
단위는 개 이며, 문화체육관광부의전국문화기반시설총람, 행정자치부주민등록인구, 통계청조사기획과가분석한자료가출처이다. 인터넷기사에서문화시설과삶의질에대한자료를찾아보았는데, 문화생활까지원스톱으로누릴수있는주민편의시설인근아파트의인기가높아지며입지의중요성이다시금부각되고있다. 특히단지에서멀더라도시간과비용을들여서이용하게되는수영장이나농구장, 실내체육관등을도보로이용할수있다면주말여가시간은매우풍성해질수있다고한다. 이기사의출처는 http://www.cnews.co.kr/uhtml/read.jsp?idxno=201406190925056100867 이다. 네번째로는가정환경안정성으로, 주민들이가정환경에대한안정성이낮아지면이에따른건강성이낮아져삶의질에부정적인영향을가져올것이다. 측정변수는결혼율과인구천명당이혼율로정했지만, 결혼율에대한정확한데이터가없고, 이혼율이결혼율보다더욱가정환경에대한안정성에대하여많은영향을가져올수있고가정환경에대한안정성을설명할수있다고생각하여이혼율을측정변수로정하여분석을할것이다. 이혼율이낮아지면심리적으로가정환경에대한만족성이떨어지고또한정신적인스트레스를가져올것으로생각된다. 그러므로가정환경에대한안정성에대하여부정적인영향을미쳐음의효과를가져올것이다. 국가통계포탈사이트에서가져온인구천명당이혼율 ( 조이혼율 ) 에대한데이터는총78개의도시로이루어져있으며, 단위는 건 이고, 이자료는통계청조사기획과에서조사한인구동태통계에서분석한출처이다. 마지막으로다섯번째변수는교통용이성으로, 교통에대한환경이용이하면심리적으로긍정적인영향을받게되어주민들의건강성에대하여양의효과를미칠것이다. 이로인하여지역소요시간별통근, 통학인구수로측정하려고하였다. 하지만시별소요시간통근통학인구수는데이터를측정하기도어렵고, 교통용이성을설명할수있는기준을정하기에는어려움이있을것이라고생각되어적합하지않다. 또한, 데이터가시별데이터가없는관계로도로포장률측정변수를분석하여교통용이성을설명할것이다. 도로포장률이높을수록교통을사용하는사람들에게좋은환경으로인하여건강에대한삶의질에긍정적인영향을주고, 또한정신건강에대하여양의효과를가져와서건강에대한삶의질이높아질것이라고생각하여도로포장률을측정변수로하여교통용이성에대하여설명할것이다. 국가통계포털사이트에서가져온데이터인도로포장률은 78개의도시로단위는 % 이며, 국토해양부도로현황조서가분석한출처이다. -5-
1.3 연구구성도 ( 사회 ) 의료보장성 (+) 복지보장성 (+) 사회안전성 (-) 도시재정건강성 (+) 직업안정성 (-) ( 환경 ) 거주환경쾌적성 (+) 교육수준 (+) 문화시설접근성 (+) 가정환경안정성 (-) 교통용이성 (+) -6-
II. 본론 2.1 데이터클린징정규변환을하는이유는분석전작업을할때, 즉정규성검정을할때어느한쪽으로의치우침이없어야하는분포로모양이정확해야한다. 회귀분석의가정을만족시키지못하거나, 또는설명력이기대했던것보다낮게나올경우에변환여부를결정해야한다. 분석을할때에평균은치우침이나이상치에대하여영향을많이받으므로, 평균과평균차이에대한분석을하기위해서는치우침에대한정규성변환과이상치진단으로하여이상치제거를해야하고, 이를바탕으로하여정확한분석을해야한다. 분석전에치우침에대한것은정규성검정으로본다. 이정규성을검정하는과정에서히스토그램을활용하면, 시각적인판단으로인하여중위값과평균에대한값이일치해야정규성을띄고있다고본다. 시각적인판단과정규성검정을하여중위값과평균에대한값이일치하는조건이나오면변환을하지않아도된다. 회귀분석을할때, 회귀분석의가정에는 3가지의조건이있다. 이조건에는모형중에오차항인 e에대하여조건이있는데, 이조건에는오차항은등분산성을따라야하며, 독립성을따라야하고또정규성의조건에도따라야한다. 이 3가지의조건과가정이이루어져야잔차를검토해서분석할수있다. 하지만, 만약에모형이등분산성의내용을충족하지않고, 즉분산이종속변수에대하여같은값이아니거나, 종속변수에따라서증가하거나값이변한다면등분산성의가정이충족되지않고어긋나기때문에가정에대하여충족할수없다. 예를들어서, 회귀분석에대하여사용되는데이터가치우침이있는경우에는종속변수와설명변수의선형관계를왜곡시킬수있다. 이이유로는설명변수가하나인단순회귀에서는종속변수와설명변수의선형변환을적용하면된다고한다. 하지만이논문에서는다중회귀에대하여분석하고있으므로선형변환이종속변수변환을요구하는경우와, 종속변수와다른설명변수와의관계에대하여영향을미치기때문에정규성검정을해야한다. 따라서정규성변환에는로그변환, 제곱변환, 제곱근변환등여러가지방법으로확률변수에변환을취하면정규분포를따르기때문에데이터를분석할수있다. 만약에사용되는데이터가정규성검정을하였을때우로치우친경우는로그변환, 또는제곱근변환을해야하고, 다른경우인사용되는데이터가좌로치우친경우에는제곱변환을해야정규분포로변환이된다. 이논문에서사용되는데이터들중변수들중에서몇가지가우로치우쳐있는모양으로, 로그변환을하여정규변환을완성했다. 이과정으로분석전검정을하였다. 아래에변수들의정규성검정및정규변환에대한표가그려져있는데, 이표에대한설명으로는인구천명당의료기관종사의사수변수인 X1은, 변환전유의확률이거의 0.249 로작은수이며정규성검정을했을때변환을하지않아도된다고생각하여하지않았다. 인구십만명당노인여가복지시설수인변수 X는, 0.133 로작은수이며, 위의변수와마찬가지로정규성검정을했을때변환을하지않아도되어변환하지않았다. 자동차천대당교통사고발생건수인 X3은, 변환전유의확률이 0.238 로변환을하지않아도된다. 재정자립도인 X4도마찬가지로정규성검정을했을때 0.930 으로변환을하지않았다. 도시별실업률인 X5는, 0.607 로변환을하지않았고, 인구천명당도시공원면적인 X6은 0.033 으로 0.05 보다낮은값으로오른쪽으로치우침이있어로그변환을하였다. 변환후에는 0.547 로 0.05 보다큰값으로만족으로평가되었다. 인구천명당초등학교수 X7도 0.304 로변환을하지않았고, 인구십만명당문화기반시설수 X8도정규성검정을해서 0.05 보다큰값인 0.505 로변환을하지않았고, 나머지변수들인인구천명당이혼율 X9는, 0.078 로변환을하지않았고, 도시별도로포장률인 X10 의변수도마찬가지로 0.195 로치우침이없어변환을하지않았다. -7-
< 표 2> 변수들의정규성검정및정규변환 변수명 변환전유의확률 변환후유의확률 변환방법 변환후평가 EQ-5D Y 0.441 인구천명당의료기관종사의사수 X1 0.249 인구십만명당노인여가복지시설수 X2 0.133 자동차천대당교통사고발생건수 X3 0.238 재정자립도 X4 0.930 도시별실업률 X5 0.607 인구천명당도시공원면적 X6 0.033 0.547 로그변환 만족 인구천명당초등학교수 X7 0.304 인구십만명당문화기반시설수 X8 0.505 인구천명당이혼율 X9 0.078 도시별도로포장률 X10 0.195 아래의선형성검정에서는빨간선에대하여선의모양을따르는것은선형성을따른다고할수있는데, 아래의표중에서모든변수들이대체로선형성을따르지만, 재정자립도같은경우는, 아래쪽으로선이치우쳐있으므로이상치제거를할것이다. 또한실업률도마찬가지로, 아래쪽으로선이치우쳐있으므로이상치제거를해야할것이다. 또다른변수들중에서는, 도로포장률이가운데에있는변수가이상치가발견되어있으므로이상치제거를할것이다. ( 그림 1) 선형성검정 1-8-
( 그림 2) 선형성검정 2 ( 그림 3) 산점도행렬 ( 변환후 ) -9-
2.2 상관분석음과양의관계에서연구구성도와상관계수부호다른것에대한이유를설명하자면, 인구천명당의료기관봉사의사수 (X1) 의데이터는의료보장성으로, 연구구성도에서는양의효과를낼것이라고생각했지만프로그램을돌려서확인해보니음의효과로결과가나왔다. 이것은흔히생각하기에의사의수가많을수록더욱건강에대한삶의질에양의관계가있다고연관을지어생각했지만, 실제로데이터에따라서분석을해보면의사수가많을수록건강에대하여많은영향을끼치지않고의사의수가많을수록병이무조건적으로낫지않고, 또한주변에병원을가야하는사람들이많아반대의영향을미칠수있다고생각할수있기때문에결국삶의질에는음의효과로나타나는것을알수있다. 또한인구십만명당문화기반시설수 (X8) 은연구구성도에서문화시설접근성이양의효과를낼것이라고생각했지만. 데이터를돌려보니음의효과로나타나는것을알수있다. 문화기반시설수는영화관이나, 미술관등지역안의주위에있는여러가지의주민들을위한편의시설을기반으로한문화시설이라고할수있다. 하지만종속변수인건강에대한삶의질에대해서는연관성이없다고결과가나왔다. 이것은우리가건강에대한삶의질에대하여사람들이문화생활을하며생각하고느끼는것이건강에대해서는양의영향을미치지않는것으로보이므로. 건강에대한좋지않은효과가나타난다고해석할수있다. 마지막으로, 도시별도로포장률 (X10) 은교통용이성으로종속변수인건강에대한삶의질에대하여양의효과를미칠것이라고생각했지만데이터로프로그램을돌려보니음의효과로나타나는것으로분석이되었다. 이것은교통용이성, 즉도로포장률이종속변수인건강에대한삶의질에많은영향을미치지않는것으로해석이된다. 이것은곧도로포장률이높을수록주민에대한삶의질지수가올라가는것이아니고, 부호가양으로해석되는것이아니라음의효과가나타나므로건강에대한삶에질에대하여영향을미치지않고건강에좋지않는효과가나타나는것으로해석을할수있다. < 표 3> 부호일치여부 변수명 연구구성도부호 상관계수부호 일치여부 EQ-5D Y 인구천명당의료기관종사의사수 X1 + - 불일치 인구십만명당노인여가복지시설수 X2 + + 일치 자동차천대당교통사고발생건수 X3 - - 일치 재정자립도 X4 + + 일치 도시별실업률 X5 - - 일치 인구천명당도시공원면적 X6 + + 일치 인구천명당초등학교수 X7 + + 일치 인구십만명당문화기반시설수 X8 + - 불일치 인구천명당이혼율 X9 - - 일치 도시별도로포장률 X10 + - 불일치 -10-
설명변수들은종속변수인 EQ-5D에대하여설명력이있다고말할수있으며, * 이많을수록, 1%, 5%, 10% 로구 분을하여각변수들은종속변수에더욱유의한영향을미친다고분석이되고있다. 즉종속변수에대한설명력이더욱 높아진다고할수있다. 종속변수에유의한변수데이터는인구천명당이혼율 (X9) 으로, * 이두개인 5% 유의한수치이 다. 나머지변수들중에서유의수준 0.2 에서구분하면, 이것은종속변수에대하여영향을미치지않는것으로해석되며 자동차천대당교통사고발생건수 (X3) 는 0.582 의수치로이것에포함이되고, 또재정자립도 (X4) 는 0.331 의수치로 종속변수에대하여유의한영향을주지않는다. 도시별실업률 (X5) 는 0.444 의수치이고, 인구십만명당문화기반시 설수 (X8) 의변수는 0.941 의높은값으로이변수들은유의수준이 0.2 가넘는수치로종속변수에유의한영향을주지 않는것으로해석할수있다. 유의확률이높으면높을수록종속변수에대하여관련성이없는것이라고분석할수있고, 예를들면자동차천대 당교통사고발생건수는건강에대한삶의질에대하여관련이없다고분석된다. 교통사고발생건수같은경우는교 통사고가일어날수록건강에악영향을미친다고생각하여종속변수에영향을미칠것이라고생각했지만, 데이터를이 용해프로그램을돌려보니종속변수에는별다른영향을미치지않는것이라고해석된다. 주민들에대하여직접적인영 향이없을수도있고, 실제데이터와주민들이느끼는체감도는사람들마다다르기때문에건강에대한삶에대하여관 련이없을수밖에없다고생각된다. 재정자립도는, 도시에대한지방자치단체의전체재원에대한자주재원의비율을 말하는것으로, 지방자치단체의자율적재정운영능력을말한다. 이수치는종속변수에대하여별다른영향을주지않 는것으로분석된다. 지방자치단체의자율적재정능력에대하여주민들이느끼는것즉체감하는것이적거나, 자율적 재정능력이늘어나도주민들의건강에관하여서는별다른영향을미치지않은것으로해석되어유의한영향을미치지 않는것으로분석할수있다. 또다른변수인도시별실업률은, 실업률의수치가올라갈수록종속변수에영향을미치 지않는것으로나타났다. 실업률이높아지더라도주민들이느끼는건강과관련한삶의질이관련이없는것으로나타 났다. 그이유는, 위와같은이유로실업률이란직장을잃은사람으로심적으로힘들수는있지만, 이이유로건강에대 한사람에대하여문제가있을수는없다는것이다. 즉체감상건강에대하여영향을미치지않는것으로분석할수있 다. 문화기반시설수는, 도시자체의문화기반시설수가많다고하더라도문화시설을즐길수있는사람은한정되어 있고, 만약가더라도주민들에따라서만족도가다를수밖에없으므로즉만족도에대하여관련성이없을수도있으므 로건강에대한삶의질에대하여연관이없다고생각할수있다. 이같은이유로종속변수인건강에대한삶의질에 대하여영향이없을것으로분석되고있다. < 표 4> 상관계수행렬 Y X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Y -0.299 0.454-0.116 0.203-0.160 0.314 0.265-0.015-0.403-0.300 X1-0.093 0.371-0.251-0.094 0.208 0.159-0.037-0.322 0.022 X2 0.179-0.432-0.434 0.537 0.141 0.393-0.090-0.502 X3-0.531-0.076 0.281-0.240 0.250 0.235 0.052 X4 ** *** 0.385-0.369 0.287-0.494-0.080 0.451 X5 ** -0.233-0.241-0.570 0.107 0.342 X6 *** -0.013 0.305-0.280-0.448 X7 0.068-0.283 0.110 X8 ** *** 0.147-0.421 X9 ** 0.187 X10 * ** * ** ** *:10% 유의, **:5% 유의, ***:1% 유의 -11-
설명변수들중에서서로상관관계가높은변수는다중공선성문제를일으킬것이다. 즉, 위의표에서 * 의개수가많은설명변수군에서서로설명변수들끼리겹치는다중공선성의문제가일어난다고볼수있기때문에분석을할때주의해야한다. 인구천명당이혼율 (X9) 를기준으로잡을때, 변수들사이에서인구천명당의료기관종사의사수 (X1) 가가장상관계수가높다고설명할수있다. 이다중공선성이발생이유는, 의사라는직업만보고결혼을하는사람들이많기때문에생활을하다보면서로맞지않아부득이하게이혼을하게될경우가생길수도있으므로연관성이제일높을것이라고분석되어이런이유로인하여변수들은다중공선성에대하여문제가일어날경우, 즉가능성이높기때문에분석을해야할때주의를해야한다. 2.3 변수선택 III. 결론 -12-