Journal of the Korean Data & Information Science Society 2016, 27(6), 1511 1523 http://dx.doi.org/10.7465/jkdi.2016.27.6.1511 한국데이터정보과학회지 한국의강력범죄발생추이및통제요인연구 권태연 1 전새봄 2 1 고려대학교경제연구소 2 고려대학교통계학과 접수 2016 년 9 월 21 일, 수정 2016 년 10 월 31 일, 게재확정 2016 년 11 월 5 일 요약 우리나라의 5 대강력범죄 ( 살인, 강도, 강간, 폭력, 절도 ) 발생의증가추세는우리나라의사회, 경제적요인의변화추세와무관하지않으며, 이와관련한논의는여러사회과학연구에서논의되어져왔으나시계열자료의특성을제대로반영하지않은경우가많다. 이에본연구에서는강력범죄변화의추이를살펴보고그통제요인들에관하여논의하였다. 통제요인들을살펴봄에있어시간, 계절및순환과같이시계열자료로써갖는내재적요인들과경제적, 사회변동및범죄통제에관련한외재적요인들로범주화하여고려하였다. 또한시계열자료가본질적으로갖는자기상관성을반영한모형역시고려하여비교하였다. 이러한다양한시계열모형들을통하여 5 대강력범죄의발생요인을점검하는한편발생건수를예측함으로써강력범죄에대한예방적정책적도움을주고자하였다. 주요용어 : 강력범죄, 내적요인, 시계열회귀모형, 외적요인, 자기상관성. 1. 머리말 우리나라 5 대강력범죄는살인, 강도, 강간, 폭력그리고절도를의미하며, 이러한강력범죄는점점 증가추세에있다 (Ju 와 Cho, 2012; Park 과 Kim, 2015). 강력범죄발생건수의증가는많은피해자를 양산할뿐아니라, 인터넷과미디어의발달로인해국민들의심리적동요와불안정을심화시켜사회적 안정을저해하므로강력범죄증가를억제하기위한노력및대책마련이절실하다. 그러나범죄에대한 대책및예방정책수립을위해서는범죄발생에대한현황및추이, 이러한강력범죄와관련된요인등 에대한파악이우선되어야할것이다. 범죄의현황및실태, 그리고그에대한원인은한국에서도강력범죄뿐아니라청소년범죄에이르 기까지상당히연구되어왔다. Park (2002) 은실업률등의경제지표가우리나라범죄율증가에미치 는영향을확인하였으며, Kim (2004) 은도시내녹지환경의부족이범죄에미치는영향을연구하였다. Lee (2010) 는시간 요일별 연령별 성별 교육수준별범죄현황을통해이들의연관성을연구하였으며, 이 외에도국내총소득, 실업률, 지니계수등과같은경제적요인, 경찰 1 인당인구변수등과같은범죄통제 요인등다양한범죄발생원인이제시되어왔다 (Park 등, 2009). 그러나범죄발생을단순히현황측면에서살피는것이아니라, 시간흐름에따른발생추이및변동 요인에대해심층적으로살피기위해서는기존의횡단면적연구는방법론적으로한계가있으며, 따라서 이러한결과에대한해석역시바로적용하여예방정책을논의하는것은적절하지않다. 범죄발생증 이논문은고려대학교재원을일부지원받아수행된연구임. 1 (02841) 서울시성북구안암로 145, 고려대학교경제연구소, 연구교수. 2 교신저자 : (02841) 서울시성북구안암로 145, 고려대학교통계학과, 연구교수. E-mail: alwaysns@korea.ac.kr
1512 Tae Yeon Kwon Saebom Jeon 가추세및변동은내재적으로시간에대해자기상관성을갖고있으므로일반적인회귀모형을근간으로하는방법이아닌시계열적인접근이필요하다. 범죄발생연구와관련한시계열연구는외국의경우상당히연구되어왔으며, Corman 등 (1987) 과 Corman 과 Mocan (2000) 은뉴욕의범죄발생에대하여, Shah Habibullah and Baharom (2009) 은말레이시아의범죄발생, Deadman과 Pyle (1997) 는영국의범죄발생에대해, 그리고 Beki 등 (1999) 는약 50년에걸친장기간의네덜란드내범죄율변동및범죄발생요인과의관계를파악하였다. 이처럼외국에서는다양한시계열모형을이용하여주요국가및대도시의범죄발생의사회, 경제, 범죄통제적요인을파악하고있는데비해, 우리나라의경우는이러한시계열접근은미비한현실이다. Park 등 (2009) 이자기상관오차항을갖는회귀모형을사용하여한국의범죄율관련요인연구를시도한바있으나, 최근다양한공공자료의공개로인해자료접근의한계가극복되었으므로이러한자료들의특성에맞는다양한범죄발생연구는매우필요하다. 이에본논문에서는최근한국에서발생하는주요 5대강력범죄추이를살펴보고, 월별범죄발생건수의특성을반영할수있는 ARIMA모형, 시계열회귀모형, 자기회귀오차항모형을통해범죄발생요인에대한영향력을파악하는한편, 향후범죄발생에대한예측을실시하여모형들을비교하였다. 이때범죄발생요인을크게시계열자료로써의내재적요인 (endogenous factor) 과외재적요인 (exogenous factor) 으로나누어살펴보았다. 본논문에서정의한범죄발생의시계열적내재적요인은범죄발생과관련된시계열자료자체에서파악될수있는요인으로추세 (trend), 계절 (seasonality) 및순환 (cycle) 요인을의미한다. 본논문에서는범죄발생에대한추세요인을반영하기위해선형추세의시간변수 (time variable) 와시차변수 (lagged variable) 를사용하였으며, 계절성을반영하기위해월별더미변수 (month dummy variable) 를이용하였다. 순환요인을반영하기위해서는삼각함수 (trigometric function) 를이용하였다. 범죄발생의외재적요인은범죄발생에영향을주는외부의독립변수들 (independent variable) 로거시적관점으로크게경제변동, 사회변동그리고범죄통제요인으로나누고이들과의관계를다양한시계열모형으로살펴보았다. 우선경제변동요인으로는 GDP와실업률을고려하였고, 사회변동요인으로는외국인유입수와젊은남성의비율변화를살펴보았으며, 범죄통제변인으로경찰 1인당담당인구수와검거자수를고려하였다. 본논문은범죄발생증가추세에영향을끼치는다양한요인들의시계열자료를이용하여자료의성격에부합하는모형들의적합도및예측력을비교하였다는점에서기존연구와차별되며, 향후한국의범죄관련연구방법론적확장에있어서도의의가있다고할수있겠다. 본논문은총 4절으로구성되어있으며, 2절은범죄발생의요인에대한기존연구결과들을근거로본논문의연구자료인 5대강력범죄발생건수및고려할요인변수들에대해기술하고있다. 3절은본논문에서고려하는시계열모형을소개하고, 4절에서는범죄발생건수시계열회귀모형들의분석결과를제시, 비교하였다. 마지막으로 5절은결론및제언을제시하였다. 2. 강력범죄발생및범죄발생의요인본연구에서지칭하는강력범죄발생건수는주요한 5대강력범죄인살인, 강도, 강간, 폭력, 절도발생건수를의미하며, 분석에사용되는자료는대검찰청범죄통계시스템에서제공하는 2003년 1월부터 2013년 12월까지 10년간의월별강력범죄발생건수 (y t) 이다. 최근들어추가로공개된 2013년이후자료는범죄에대한정의및범주구분이이전자료와차이가있어범죄발생에대한시계열자료의내적일치성을위하여분석에제외하고 2013년까지의자료만을이용하였다. 범죄발생의현상및범죄발생요인을보다잘파악함으로써미래의범죄발생에대한예방적정책적도움을주기위해서, 본연구는범
A study on the violent crime and control factors in Korea 1513 죄발생건수자체에대한시계열적접근으로설명하는모형과외부적인위험요인을고려하는회귀적접근을모두고려하고, 이를각각내재적요인과외재적요인으로명명하여비교분석하고있다. 한사회의범죄발생이그사회의경제적, 사회적, 정치적여러특징에의해영향을받으므로기존의횡단면적연구인회귀모형은범죄발생과관련한기저의관련원인을찾는심층적연구가가능하다는장점이있는반면, 미래의범죄발생예측을위해서는관련외부요인즉독립변인에대한예측이선행되어야한다는점에서예측모형으로활용되기에어려움이존재한다. 반면, 내재적요인만을고려하는경우이러한외부요인에대한예측이필요없이기존의강력범죄발생의추이및패턴을통해향후의범죄발생을예측한다는점에서그장점을찾을수있다. 그러나, 내재적요인을이용한시계열모형은향후의범죄발생이기존의범죄발생추이나패턴과다른양상을갖는경우예측력이떨어지게되므로, 범죄발생을예측함에있어내재적접근및외재적접근둘다살펴볼필요가있다고하겠다. 2.1. 범죄발생의내재적요인범죄발생을설명하기위한시계열적내재적요인은범죄발생을측정한자료가시계열자료로써갖는특징을설명하기위한요인으로시간, 계절성및순환요인을의미한다. Figure 2.1에제시된바와같이, 2003년 1월부터 2013년 12월까지우리나라 5대강력범죄의발생건수의추이를살펴본결과, 5대강력범죄의발생건수는전반적으로선형적으로증가하는추세를따르고있으며, 분산은큰변화없음을알수있다. 또한매해 1, 2월엔범죄발생건수가저점을보이는반복적인양상을갖고있어, 강력범죄의발생이계절적특성을가짐을알수있다. 이에시간, 계절성및순환요인을고려한시계열회귀모형을통해범죄발생의내재적특성을반영을고려할수있다 (Park과 Kim, 2002). Figure 2.1 Time plot of 5-violent crime outbreak 시간추세를반영하기위해선형추세 (linear trend) 인추세변수 T R t = t 를고려하고, 계절성을반영하기위한가변수로범죄발생건수의시차변수 (y t 1:t 13) 를, 월별효과를반영하기위한월별더미변수 (m 1:11) 를모형에고려하였으며, 순환요인은고정계절변동을위한삼각함수 (trigometric function) 인 sin(2πt/12), cos(2πt/12) 과확산계절변동을위한삼각함수 t sin(2πt/12), t cos(2πt/12) 를모형에고려하였다.
1514 Tae Yeon Kwon Saebom Jeon 2.2. 범죄발생의외재적요인한사회내의범죄발생은경제적요인, 인구사회적변동요인, 범죄통제요인등다양한요인에의해영향을받는다. 먼저범죄발생을산업화, 경제발전, 경제적불평등및경제적빈곤과같은경제적요인과관련하여파악하는연구들은다음과같다. Corman and Mocan (2000) 은미국뉴욕시범죄발생을국가로부터생계보조금을받는가정의수 (number of case to aid to families with depedent children) 를고려함으로써경제적빈곤이특정범죄의발생과관련이있음을설명하였으며, Corman 등 (1987) 은뉴욕의실업률과범죄의발생의관계를설명하였다. Deadman and Pyle (1997) 은국내총생산 (GDP), 실업률, 국내총소비를범죄의경제적요인으로고려하였다. Shah Habibullah and Baharom (2009) 는말레이시아범죄발생의경제적원인으로국민총생산 (GNP) 를, 그리고 Beki 등 (1999) 는가계지출 (personal consumption of house holds per capita) 을이용하여분석하였다. 국내연구로는 Park 등 (2009) 및 Park (2002) 에서국내총소득, 실업률및지니계수등의경제적범죄요인을밝힌바있다. 이에본논문에서는범죄의경제적요인으로국내총생산 (GDP) 을고려함으로써, 전반적인사회의경제규모및경기를파악하여전반적인경제상황이범죄의원인이되는지를파악하였다. 또한, 실직등을이유로경제활동을하지않는집단은빈곤이나상대적박탈감을느끼는환경에보다더노출되어있기때문에범죄행위를저지를가능성이크다고알려져있으므로비경제활동인구수의증가를 5대강력범죄발생증가에유의한영향을미치는변수로고려하였다. 두번째범죄발생요인으로인구변동, 도시화등환경변동을포함한사회변동요인을들수있다. Kim (2004) 은도시내녹지환경의부족과범죄의관계를연구한바있으며, Corman 등 (1987) 은 16세에서 24세의젊은남성인구의비율변화와범죄에미치는영향을연구한바있다. Beki 등 (1999) 역시남성인구의연령별구조변화와범죄율의연관관계에대하여파악하였다. 이들은강력범죄자의주요인구통계학적특징이젊은남성임을보이고있으므로, 전체인구에서의젊은남성의비율변화는강력범죄발생과관련한외재적사회변동요인으로고려할수있다. 한편체류외국인의급격한증가는여러가지사회적문제점을발생시킬가능성이크다는것이다양한연구를통해검증되었다 (Choi, 2007; Lee 2007). 2003년대비 2007년에는체류외국인이 1.7배증가하는동안외국인범죄는 2.36배증가하였으며, 외국인범죄자중 16% 는범죄를목적으로입국했다는보도와함께실제로국내에입국한외국인이범죄를일으키는건수는점점증가하는추세이다. 이러한맥락에서외국인수역시범죄발생건수에영향을끼치는사회변동요인으로고려할수있다. 이에본논문에서는범죄발생에대한사회변동요인으로외국인유입수와전체인구대비젊은남성의비율변화를고려하였다. 세번째범죄발생요인은앞의두요인에비해범죄발생에보다직접적요인인범죄통제요인으로, 경찰규모의변화 (Deadman and Pyle, 1997; Corman 등, 1987; Park 등, 2009) 와검거율 (Beki 등, 1999; Corman and Mocan, 2000) 등을들수있다. 경찰의규모가클수록검거율이높을수록범죄행위를하는데있어심리적압박감을받을가능성이크다. 따라서낮은치안율이범죄발생건수의증가에영향을미치는것으로볼수있다. 이런점을고려하여본논문에서는경찰 1인당담당인구수와 5대강력범죄검거자수, 전월검거율을범죄발생건수에영향을미치는변수로고려하였다. 이러한강력범죄발생의외재적요인인경제적, 사회변동및범죄통제요인에대한 2003년 1월부터 2013년 12월까지의양상은 Figure 2.2과같다. 이때경제적요인인국내총생산 (GDP) 은통계청에서제공하는동기간분기별자료를월별자료로변환하여이용하였으며, 실업자수 (unemp) 의경우는통계청에서제공하는동기간월별자료를이용하였다. 사회변동요인인외국인유입수 (foreigner) 와 16 24세의젊은남성 (r male) 의비율변화는통계청에서제공하는동기간의인구자료를월별추출하여사용하였고, 마지막으로범죄통제요인인검거자수 (arrest) 와경찰 1인당담당인구수 (police) 는대검찰청에서제공하는 2003년부터 2013년까지연도별자료를선형보간법을이용하여월별자료로변환하여분석에사용하였다.
A study on the violent crime and control factors in Korea 1515 (a) GDP (b) Unemployment (unemp) (c) Number of Foreigners (foreigner) (d) 16-24 year-old male ratio (r male) (e) Number of arrested (arrest) (f) Police charge per population (police) Figure 2.2 Time plot of risk factors of crime 국내총생산의분기별효과는뚜렷하게나타나며분석기간동안의분산의변화는미미함을확인하였다. 비경제활동인구수는다른자료에비해강한계절성을보이면서분산이점차증가하고있으며, 상승하는추세를가지고있다. 외국인유입자수의경우, 분산이증가하는폭이점차적으로커지며꾸준히상승하는추세와계절성이있다. 한편, 16 24세남성인구는 2008년에서 2009년사이추세의방향이전환되는시점이있음을확인할수있었다. 이에추세의구조변화를검정하는 Chow Test (Chow, 1960) 을통하여구조변화여부와그시점을테스트한결과, 2008년 6월 (F -value:2.88,p-value: 0.0384) 추세의구조변화가있음이파악되어이러한구조변화시점에대한더미변수 (Date Change) 와남성인구비율과구조변화시점의교호효과를추가로모형내에고려하였다. 검거자수는 2005년까지감소하는추세에서전환되어 2010년까지증가추세에있었으나, 2011년이후큰추세변화없이일정수준으로유지됨을볼수있다. 경찰 1인당담당인구수는전반적으로감소추세에있으나 2012년에소폭증가하였다.
1516 Tae Yeon Kwon Saebom Jeon 3. 범죄발생요인파악을위한시계열모형 본연구에서적용한시계열모형은 ARIMA 모형, 회귀모형, 자기회귀오차항회귀모형의세가지범 주로나누어볼수있으며, 시계열회귀모형과자기회귀오차항회귀모형을위해범죄발생건수의시계열 적시간효과를반영할수있는추세변수와시차변수를반영한모형, 여기에계절효과의반영을위한월 별효과를고려한모형, 순환효과까지추가적으로고려한모형을적용하였다. 그다음이러한범죄발생 의내재적변동요인이외에, 범죄발생에영향을끼치는요인으로알려진경제변동, 사회변동그리고범 죄통제요인들및이들의구조적변화효과를함께고려한모형을적용하였다 (Ryu 와 Kim, 2013). 본연 구에서고려한상기의총 13 개시계열모형은다음의 Table 3.1 에정리하였다. 우선내재적요인에대한모형 (Endogenous Model) 으로는 ARIMA(p, d, q) 에덧붙여 3 개유형의 시계열모형으로 (1) Linear Trend, 즉시간효과 t와시차변수 y t 1,, y t 12 만을고려하는추세모형, (2) Linear Trend and Month effect, 즉추세뿐아니라계절성을반영하기위해월별가변수 D 1,, D 11 을고려하는모형, (3) Linear Trend, Month effect and Cycle effect, 즉추세와계절성뿐 아니라확산주기까지반영하기위해고정계절변동을나타내는삼각함수 sin(2πt/12), cos(2πt/12) 및 확산계절변동을나타내는삼각함수 t sin(2πt/12), t cos(2πt/12) 항들을포함하는모형을고려하였다. Table 3.1 Time series models for crime outbreaks Factors Model Model Formula ARIMA(p, d, q) (1 φp(b))(1 Φps (B)) Ds d y t = (1 θq (B))(1 Θqs (B))ϵ t, ϵ t N(0, σ 2 ) y t = β 0 + β 1 t + 12 β 2l y t l + ϵ t, l=1 (1) Trend ϵ N(0, σ 2 ), (3.1a) p ϵ t = φpϵ t p + a t, a t N(0, σ 2 ), (3.1b) y Endogenous t = β 0 + β 1 t + 12 β 2l y t l + 11 β 3m Dm + ϵ t, (2) Trend and l=1 m=1 Model ϵ N(0, σ 2 ), (3.2a) Month effect p ϵ t = φpϵ t p + a t, a t N(0, σ 2 ), (3.2b) y t = β 0 + β 1 t + 12 β 2l y t l + β 41 sin( 2πt 12 ) + β 42 cos( 2πt 12 ) (3) Trend, Month l=1 + β and Cycle effect 43 t sin( 2πt 12 ) + β 44tcos( 2πt 12 ) + ϵ t, ϵ N(0, σ 2 ), (3.3a) p ϵ t = φpϵ t p + a t, a t N(0, σ 2 ), (3.3b) y t = β 0 + β 1 t + 12 β 2l y t l + 6 β 5p x tp + β 6 C t + ϵ t, (4) Trend with l=1 Exogenous factors ϵ N(0, σ 2 ), p (3.4a) ϵ t = φpϵ t p + a t, a t N(0, σ 2 ), (3.4b) y t = β (5) Trend and 0 +β 1 t+ 12 β 2l y t l + 11 β 3m Dm + 6 β 5p x tp +β 6 C t +ϵ t, l=1 m=1 Exogenous Month effect with ϵ N(0, σ 2 ), (3.5a) Model Exogenous factors p ϵ t = φpϵ t p + a t, a t N(0, σ 2 ), (3.5b) y t = β 0 + β 1 t + 12 β 2l y t l + β 41 sin( 2πt 12 ) + β 42 cos( 2πt 12 ) l=1 (6) Trend, Month and Cycle effect +β 43 t sin( 2πt 12 )+β 6 44tcos( 2πt )+ β 12 5p x tp +β 6 C t +ϵ t, with Exogenous ϵ N(0, σ factors ), (3.6a) p ϵ t = φpϵ t p + a t, a t N(0, σ 2 ), (3.6b) 다음으로외재적요인에대한모형 (Exogenous Model) 으로는, 상기의여러내재적요인뿐아 니라범죄발생과관련있는다른외재적요인인외부위험요인 x t1,, x t6 및이와관련한구조변화 C t 를추가적으로반영하는 3개유형의시계열모형 (4) (6) 을고려하였다. 이때외부위험요인 x t1,, x t6 는경제적요인, 인구사회적변동요인, 범죄통제요인을대표하는국내총생산 (GDP), 실 업자수 (unemp), 외국인유입수 (foreigner), 16 24 세의젊은남성 (r male) 의비율, 검거자수 (ar-
A study on the violent crime and control factors in Korea 1517 rest) 와경찰 1인당담당인구수 (police) 를의미하며, C t 는 16 24세남성인구비시계열에서 2008년 6월부터나타나는구조변화를반영하기위한변수로, C t 는 2008년 6월부터는 1의값을갖고그이전에는 0의값을갖는다. 이러한내재적요인및외재적요인에대한 6개유형의모형 (1) (6) 은, 오차항에대한가정에따라시계열회귀모형식 (3.1a) 부터 (3.6a), 그리고자기회귀오차항을갖는시계열회귀모형 (Lee, 2015; Lim, 2014) 식 (3.1b) 부터 (3.6b) 로구분할수있다. 4. 범죄발생에대한시계열모형들의적합및예측결과비교 4.1. 강력범죄발생건수에대한 ARIMA 모형첫번째모형인 ARIMA(p, d, q) 모형적합을위해서는자료의추세와분산의정상화과정이필요하다. 예측의비교를위하여모형구축및적합은 2012년 12월까지의자료만을이용하였으며, 해당기간범죄발생건수는 Dickey-Fuller 추세검정결과추세안정화를위해 1차차분및계절차분이필요함을알수있었다. 이에시계열분석을위한정상화자료인 12 1 5대강력범죄발생건수 ( 12 1y t) 를생성하여적합하였다. 그결과 ARIMA(2, 1, 0)(0, 1, 1) 12 로식별되었으며최종모형의모수추정결과는다음의식 (4.1) 과같았다. 모형의적합도는 SBC값이 2065.56, AIC값은 2057.54였으며예측치의 RMSE는 4228.24였다. (1 + 0.46B + 0.29B 2 ) 12 1y t = (1 0.59B 12 )a t. (4.1) 4.2. 강력범죄발생건수에대한내재적및외재적요인시계열모형 Table 3.1에제시된총 12개의시계열모형, 즉시계열회귀모형과오차항이자기상관을갖는회귀모형식 (3.1a) 부터 (3.6b) 적합시변수선택은모형의간명성을위하여후진소거법 (Backward elimination) 을이용하였으며, 유의한자기상관성을갖는오차항은 Godfrey s Serial Correlation Test (Godfrey, 1978) 를이용하여 AR(13) 까지고려한후, 후진소거법으로선택하였다 (Park과 Song, 1998). 한편각모형에대한예측력비교를위하여분석자료의가장최근 1년치자료를제외한 2012년 12월까지의자료만을이용하여모형을적합하고그이후의자료값을이용하여모형의예측력을비교하였다. Table 4.1은내재적요인만을이용한시계열모형들 (Table 3.1의 (1) (3) 번유형 ), 즉시계열회귀모형과오차항의자기상관을갖는회귀모형의모형적합결과이다. 각모형적합시통계적으로유의하지않은변수들은후진소거법으로제거되었으므로 Table 4.1에제시된회귀계수값은모두통계적으로의미있는값이므로표에대한간명성과가독성을위하여 t값및유의확률은생략하였다. Model 1a의경우, 범죄발생은시간에따라선형적증가추세를보여해당기간동안매월약 67.36건정도강력범죄가증가해왔을알수있다. Model 1a와 Model 1b에서고려하는내재적변동요인중시간추세다음으로범죄발생에영향을끼치는것은전월범죄발생건수 (y t 1) 와전년도해당월의범죄발생건수 (y t 12) 임을알수있다. Model 2a와 Model 2b의경우, 내재적요인에월별효과를추가적으로반영한결과, 1월, 2월가변수회귀계수값이유의한음 (-) 의값으로나타난것을볼수있는데, 이는 1, 2월에범죄발생건수가저점을보이는반복적인양상을반영하였음을알수있다. 한편일반적으로여름철강력범죄가높을것이라는예상과는달리, 여름철가변수는유의하게나타나지않았는데, 이는원계열시도표상에서도볼수있듯이, 최저점은 1,2월로상당히일정한패턴으로나타나고있는데비하여고점 (peak) 은여름이아닌오히려봄철 5월혹은가을철 9, 10월로나타난것에기인한다. 월별평균강력범죄발생건수를보면, 1월의평균범죄발생건수는약 19,722건, 2월의평균범죄발생건수는약 21,104건으로상당히낮은값을보
1518 Tae Yeon Kwon Saebom Jeon 이고있는데비해, 7 월과 8 월의월별평균범죄발생건수는각각약 29,178 건, 약 28,471 건으로 12 월의 평균발생건수 ( 약 30,314) 에비해유의한차이를보이지않음을확인할수있다. 물론월별평균범죄발 생건수는시간에따른증감을고려하지않은단순평균에불과하므로이를근거로해석하기에는무리가 따를수있으나원계열에대한시도표증감패턴및이러한월별평균값을총체적으로판단하여볼때, 최근 10 여년간여름철강력범죄발생건수는연말보다유의하게더많지는않은것으로판단된다. 오히 려 5 월의경우회귀계수값이유의한양 (+) 의값을보이며, 즉 5 월은다른월에비해많은강력범죄가 발생함을나타내고있는데, 이는 5 월이가정의달, 가계지출이많은달이라는점에서강력범죄발생과 의연관성을파악하고이와관련한캠페인등을고려할수있음을시사한다고할수있다. Model 3a 과 Model 3b 는계절성순환주기를고려하는모형으로확산계절변동은유의하지않았고, 고 정계절변동을나타내는삼각함수 sin(2πt/12), cos(2πt/12) 이통계적으로유의하기는하였으나, 모형 의간명성 (parsomony) 및적합도측면에서볼때, Model 1a 와 Model 1b 에비해효용이없으며, 확산 계절변동이없으므로해석에의용이성 (interpretability) 측면에서볼때 Model 2a 과 Model 2b 의월별 가변수로도추세및월별계절성을충분히반영하는것으로판단된다. 한편오차항의자기상관은 Model 1b, Model 2b, Model 3b 모두 13 차만유의하였으며, 이는월별 강력범죄발생은전년도전월에의존함을나타낸다. 한편이들 6 개모형에비해 ARIMA 모형은모형의 적합도 (AIC, SBC) 는좋으나, 2013 년 1 월부터 12 월까지의예측값에대한예측력 (root mean square; RMSE) 이크게떨어지는것을확인할수있었는데, 이는 ARIMA 모형이빠른변동을갖는시계열에 적합한모형으로시계열의정상성을가정하고있는데비해, 2013 년이후의범죄발생자료의성격이기 존의양상과는다소달라져정상성가정에어긋났기때문일것으로예상된다. 반면시계열회귀모형및 자기회귀오차항을갖는시계열회귀모형은 ARIMA 모형보다는덜민감하게변동하는보다강건한모 형이므로예측력이더나음을알수있다. Table 4.1 Estimated coefficients of each model considering endogenous factors Variable Model 1a Coefficient estimates Model 1b Model 2a Model 2b Model 3a Model 3b Intercept 3945 3377 7452 7624 5897 5295 t 67.36 51.28 102.43 109.16 102.80 87.56 y t 1 0.38 0.39 0.33 0.32 0.31 0.33 y t 3 0.20 0.19 y t 12 0.35 0.40 0.26 0.30 Jan -8512-8298 Feb -4164-4216 March April May 3459 3663 June July August September October November sin(2πt/12) -720.94-566.28 cos(2πt/12) -1100.00-1037.00 t sin(2πt/12) t cos(2πt/12) AR(13) 0.24 0.27 0.26 AIC 2088.77 2083.11 2215.57 2207.46 2187.62 2180.67 SBC 2099.50 2096.52 2234.90 2229.56 2203.71 2199.45 RMSE 3536.34 3545.81 3764.88 4024.61 3711.00 3563.00 Note that the number of each model in Table 4.1 corresponds to the number of formula in Table 3.1.
A study on the violent crime and control factors in Korea 1519 한편, Table 4.2 는외재적요인으로고려하는변수들과범죄발생의관련성, 그리고외재적요인들간 의다중공선성문제를확인하기위하여상관분석을실시하고각변수에해당하는분산팽창계수 (variance inflation factor) 를확인한결과이다. 상관분석결과, 각변수들과 5 대강력범죄수의연관성이높 아이들을외재적요인으로범죄발생을설명하는것이타당함을확인할수있다. 이들발생요인들간에 도어느정도강한상관관계를보이고는있으나, GDP 와경찰 1 인당담당인구수를제외하고는일반적 으로다중공선성문제가우려되는 0.8 0.9 수준보다하회하였으며, GDP 와외국인유입수와경찰 1 인당 담당인구, 그리고검거자수에서나타나는강한상관관계역시강한추세에기인한것이므로추세항을 포함하는회귀모형내에독립변수로서함께고려하기에무리가없을것으로판단하여이들을모두포함 하여외재적모형을적합하였다. 분산팽창인자인 VIF 역시모두 10 이내의값으로다중공선성이문제되 지않는것으로확인하였다 (Kutner 등. 2004). Table 4.2 Correlation coefficient of exogenous factors and variance inflation factor y t x t1 x t2 x t3 x t4 x t5 x t6 VIF crimes y t 1 gdp x t1 0.885 1 8.227 unemp x t2 0.663 0.758 1 3.810 foreigner x t3 0.787 0.876 0.742 1 5.789 r male x t4-0.683-0.712-0.652-0.515 1 3.460 arrest x t5 0.791 0.751 0.785 0.63-0.793 1 4.500 npop police x t6-0.81-0.889-0.822-0.818 0.749-0.821 1 7.712 Table 4.3 은내재적요인과외재적요인을모두고려한시계열모형들 (Table 3.1 의 (4) (6) 번유 형 ), 즉시계열회귀모형과오차항의자기상관을갖는회귀모형의모형적합결과이다. 추세에외적요 인을함께고려한 Model 4a 과 Model 4b 는경제적요인으로는실업자수 (umemp), 사회변동요인으 로는 16 24 세남성인구비율 (r male) 과구조변화 (Date Change) 및교호효과 (Change rmale) 가 강력범죄발생에영향을끼치는유의한외적요인으로나타났으며, 범죄통제요인으로는경찰 1 인당 담당인구수 (npop police) 가강력범죄발생에영향을끼치는유의한외적요인으로나타났다. 이때 Date Change는 16 24세남성인구비시계열에서 2008년 6월부터나타나는구조변화를반영하기 { 위한변수로 1, since Jun2008, C t = 와같이정의할수있으며, 이의교호효과 (Change rmale) 는 0, otherwise. r male C t 를나타낸다. 젊은남성인구에대한구조변화의교호작용이유의한것으로보아, 2008년 6 월이전에는젊은남성인구가줄어들지만범죄발생이늘어났던것에반해, 2008 년 6 월이후에는젊은 남성인구증가가강력범죄발생에유의한양 (+) 의영향을끼치고있음을알수있다. 한편, 외국인유입수의경우지수적증가추세를보이고분산이다소커지는양상을보여로그변환을 고려할수있으나, 오히려기존에유의하였던 GDP 등의외재적요인의유의성이없어지고예측력또한 매우낮아져원변수그대로모형적합하였다. 비록외국인유입수의유의성은 Model 4a 부터 Model 6b 어느모형에서도유의성이입증되지는않았으나, 최근외국인노동력유입의증가추세등을고려할때 젊은남성인구비율등의효과로반영되었을가능성도존재할수있으며, 향후이러한외국인유입의 증가추세가어느정도지속될것으로보이므로이에대한검토는의미가있다고할수있다 추세와월별효과를고려하는 Model 5a 과 Model 5b 의경우, 외재적요인으로 GDP 와검거자수 (arrest) 가선택되는것으로보아, 범죄발생을설명하는외재적경제, 사회, 통제요인들이월별효과에어 느정도잠재적으로반영되었을것으로예상된다. Model 6a 과 6b 에서고려하는순환요인삼각함수는 내재적모형에서와마찬가지로모형의복잡성에비해효용이없어, 적합도및해석적측면에서볼때 Model 5a 과 Model 5b 보다나은모형이라할수없다. 2012 년까지의범죄발생만을이용한모형적합도 (AIC, SBC) 측면에서는내적요인으로추세만을고 려하는 Model 4a 과 Model 4b 가더우수하나, 2013 년범죄발생에대한예측력 (RMSE) 측면에서는
1520 Tae Yeon Kwon Saebom Jeon Model 5a 과 Model 5b 가더우수함을알수있다. 즉강력범죄발생을설명및예측하는데가장우수한 모형은범죄발생의내재적변동요인인추세및월별효과를고려하는한편, 외재적요인중사회전반적인 경제상황을나타내는 GDP, 범죄통제요인인검거자수를고려하는모형이라할수있다. Table 4.3 Estimated coefficients of each model with endogenous and exogenous factors Variable Model 4a Coefficient estimates Model 4b Model 5a Model 5b Model 6a Model 6b Intercept 239350 277761-3922 -12647 47922 51291 t 80.06 66.26 59.51 38.78 y t 1 0.17 0.13 0.28 0.18 0.21 0.20 y t 3 0.18 0.09 0.02-0.08 y t 12 0.17 0.21 Jan -8073-7361 Feb -3745-3036 March April May June July August September November -2599-3085 sin(2πt/12) -1457-1670 cos(2πt/12) -1757-1552 t sin(2πt/12) t cos(2πt/12) gdp 0.05 0.10 unemp -5.74-5.29 r male -824779-1041621 -566008-607314 foreigner arrest 0.03 0.03 0.04 0.05 npop police -181.41-236.18 Date Change -143503-200888 -273505-323412 Change rmale 2330657 3241805 4398793 5191845 AR(11) 0.30 0.21 AR(13) 0.31 0.31 0.24 AIC 2073.16 2043.63 2254.09 2232.81 2264.81 2257.63 SBC 2099.98 2075.81 2276.32 2260.60 2289.67 2285.25 RMSE 4657.29 5556.56 2519.03 2985.02 3725.00 3587.00 Note that the number of each model in Table 4.3 corresponds to the number of formula in Table 3.1. 4.3. 모형의평가본연구에서고려하는 13개의시계열모형중, ARIMA 모형을제외한나머지내재적모형및외재적모형중적합도가가장우수한모형은범죄발생의내재적변동중추세를반영하는모형들즉 Model 1a, Model 1b, Model 4a, Model 4b이었다. 특히범죄발생의내재적증가추세와여러외재적요인, 그리고젊은남성인구의구조변화를함께고려한자기회귀오차을갖는시계열회귀모형 Model 4b가가장적합도가우수하였고그다음으로는 Model 1b, Model 4a, Model 1a순이었다. 그러나향후 1년간 (2013년 1월 2013년 12월 ) 의예측력이가장우수한모형은, 내재적요인으로는추세외에월별효과까지고려하는동시에외재적요인들을함께고려한모형 Model 5a, Model 5b이가장우수하였다. 특히과거범죄발생정도와계절효과그리고범죄발생에대한여러위험요인및이의구조적변화까지고려한시계열회귀모형인 Model 5a가가장우수하였으며그다음으로는 Model 5b, Model 6a의예측력이좋았다.
A study on the violent crime and control factors in Korea 1521 이처럼모형을평가함에있어서적합도와예측력측면에서우수한모형이동일한것은아니다. 이는 적합도는기존의자료를가장잘설명할수록우수한반면, 예측력은새로운자료를잘설명할수록우수 하기때문인데, 기존의자료에너무의존하는모형은새로운자료가기존의양상과약간의차이가있을 때이를제대로잘반영하지못하기때문이다. 이는동일변수를적합시키는모형에오차항에대한가정 만을다르게하더라도확인할수있는데, Table 4.1 과 Table 4.3 에서오차항에대해자기상관을고려하 지않은모형과자기상관을고려하는모형간에적합도및예측력차이를보더라도알수있다. 대체로 기존자료에대한양상을최대한반영시키는자기회귀오차항을갖는회귀모형이적합도는더좋으나, 반 대로예측력은떨어지는것을볼수있는데, 오차항에대한상관을반영함으로써기존의자료에최적화 된과적합 (overfitted) 때문으로예상된다. 따라서모형의적합도와예측력측면에서우수한모형은, 강 력범죄발생의내재적증가추세및변동을고려하는동시에범죄발생에영향을끼칠수있는외재적요 인까지반영하는 Model 5a 이가장강건 (robust) 하게우수함을알수있다. Table 4.4 는예측력이가장좋은 Model 5a, Model 5b, Model 6a 과 Model 6b 의범죄발생건수 의실제값과각모형의예측값을정리한표이다. 예측결과, Model 6a 과 Model 6b 이 Model 5a 과 Model5b 에비해예측력이떨어지는이유는범죄발생예측에있어서겨울의과대예측및여름의과소예 측정도가크기때문이다. 가장예측력이좋은 Model 5a 역시이와같은겨울철범죄발생에과대예측, 여름철범죄발생에과소예측을보이고있는데, 이는 Model 5a 에서유의한월별효과가 11, 1, 2 월즉겨 울철범죄발생효과만반영된데비해, 2013 년에는이전보다여름에강력범죄가더많이발생하고, 다른 계절에는강력범죄발생이줄어들었기때문으로보인다. Table 4.4 Predicted number of violent crime outbreaks Time Observed value Model 5a Predicted value Model 5b Model 6a Model 6b 2013.01 29,985 31888.78 31821.89 38193.01 36723.33 2013.02 28,589 32209.87 34528.57 35697.22 38263.95 2013.03 33,105 35951.79 37754.17 36289.46 37471.53 2013.04 35,389 38093.36 38454.16 38206.01 39450.82 2013.05 37,629 39433.30 40583.82 39976.04 41801.08 2013.06 42,290 40169.43 38834.28 41642.73 42018.21 2013.07 42,230 41300.67 40093.36 43293.79 44257.03 2013.08 40,835 41365.37 39939.79 43347.31 43691.10 2013.09 38,359 41627.80 39755.07 42588.99 42819.22 2013.10 42,172 41753.28 42648.07 41109.31 42219.89 2013.11 35,673 40594.94 38678.11 40813.31 40068.87 2013.12 41,003 40903.49 41127.84 38533.92 39233.88 Note that the number of each model in Table 4.4 corresponds to the number of formula in Table 3.1. 5. 결론본연구에서는강력범죄발생의요인을시간, 계절, 순환의내재적요인과경제, 사회변동및범죄통제와관련된외재적요인으로나누고다양한시계열회귀모형및오차항의자기상관을고려한시계열회귀모형을적합하고그적합도와예측력을비교하였다. 내재적요인변수와외재적요인변수들을함께고려함에있어전이함수모형을고려하였으나다중전이함수로의적합이가능하지않아본논문에서는포함하지않았다. 시계열회귀모형과자기상관시계열회귀모형의회귀계수들의적합결과내재적요인이외재적요인에비하여그영향력이큼을확인할수있었으며범죄발생의내재적변동요인중추세와계절성은시간변수, 시차변수, 그리고월별효과에대한가변수로충분히반영할수있음을확인할수있었다. 범죄발생의내재적변동요인외에범죄발생에영향을끼치는외재적요인까지모두고려하는모형이적합도와
1522 Tae Yeon Kwon Saebom Jeon 예측력을개선함을확인할수있었으며, 가장적합도와예측력이우수한모형을기준으로볼때, 범죄발생에영향을끼치는외재적요인으로는전반적인경제상황을반영하는 GDP와범죄통제상황을반영하는검거자수가가장유의함을알수있었다. 즉 GDP가낮아지는등전반적인경제상황이어려워지면강력범죄가발생할가능성이높은데, 검거와같은강력한범죄통제를통해강력범죄발생을낮추거나예방할수있음을시사한다. 또한 12월을기준으로볼때, 11, 1, 2월의범죄발생건수가낮은것으로보아, 겨울보다는봄부터가을까지, 특히여름철강력범죄발생예방을위한적절한범죄통제정책이필요함을시사한다고할수있다. 향후범죄발생과관련하여검거자수이외에범죄발생에영향을끼치는기타통제요인등의공공자료가추가적으로수집및공표된다면, 이를모형에반영함으로써범죄발생예측시나타나는예측오류를더개선할수있을것으로예상된다. References Beki, C., Zeelenberg, K. and Montfort, K. (1999). An analysis of the crime rate in the Netherlands 1950-93. British Journal of Criminology, 39, 401-415. Chow, G. C. (1960). Tests of equality between sets of coefficients in two linear regressions. Econometrica, 28, 591-605. Choi, Y. (2007). Illegal stay of foreigners and their crime. Korean Criminological Review, 18, 1319-1340. Corman, H. and Mocan, H. N. (2000). A time-series analysis of crime, deterrence, and drug abuse in New York city. The American Economic Review, 90, 584-604. Corman, H., Joyce, T. and Lovitch, N. (1987). Crime, deterrence and the business cycle in New York city: A VAR approach. The Review of Economics and Statistics, 69, 695-700. Deadma, D. and Pyle, D. (1997). Forecasting recorded property crime using a time-series econometric model. British Journal of Criminology, 37, 437-445. Godfrey, L. (1978). Testing for high order serial correlation in regression equations when the regressors include lagged endogenous variables. Econometrica, 46, 1303-1310. Ju, I. and Cho, K. (2012). Analysis of seasonal factors on crime occurrence. Journal of Korean Public Police and Security Studies, 8, 101-124. Kutner, M. H., Nachtsheim, C. J. and Neter, J. (2004). Applied linear regression models, 4th Ed., McGraw- Hill Irwin, Chicago. Kim, H. (2004). The effect of the green space on the crime in the city, Master Thesis, Hongik University, Seoul. Lee, H. (2015). Analysis of statistical models on temperature at the Suwon city in Korea. Journal of the Korean Data & Information Science Society, 26, 1409-1416. Lee, S. (2007). A study on the foreigners crimes in Korea. Korean Police Studies Review, 6, 79-110. Lee, T. (2010). A study on crime factors : Focusing on urban areas, Master Thesis, Kyunghee University, Seoul. Lim, S. S. (2014). A study on the forecasting models using housing price index. Journal of the Korean Data & Information Science Society, 25, 65-76. Park, M. R. and Kim, Y. S. (2015). Crime risk implementation for safe return service. Journal of the Korean Data & Information Science Society, 26, 1097-1104. Park, S., Jang, A. and Lee, J. (2009). Social change and crime trends in Korea, 1966-2007. Social Research, 18, 45-72. Park, Y. and Kim, K. (2002). Time series analysis using SAS/ETS 1, Freedom Academy, Seoul. Park. Y. and Song, S. (1998). Business & economic data analysis using SAS/ETS, Freedom Academy, Seoul. Park, H. (2002). A study on the relationship between crime rates and economic indicator: focusing on unemployment, Master Thesis, Korea University, Seoul. Ryu, S. R. and Kim, J. T. (2013). Time series regression model for forecasting the number of elementary school teachers. Journal of the Korean Data & Information Science Society, 24, 321-332. Shah Habibullah, M. and Baharom, A. H. (2009). Crime and economic conditions in Malaysia. International Journal of Social Economics, 36, 1071-1081.
Journal of the Korean Data & Information Science Society 2016, 27(6), 1511 1523 http://dx.doi.org/10.7465/jkdi.2016.27.6.1511 한국데이터정보과학회지 A study on the violent crime and control factors in Korea Tae Yeon Kwon 1 Saebom Jeon 2 1 Institute for Economic Research, Korea University 2 Department of Statistics, Korea University Received 21 September 2016, revised 31 October 2016, accepted 5 November 2016 Abstract The increasing trend of the five violent crimes (murder, robbery, rape, violence, theft) in Korea is not independent of social and economic factors. Several social science research have discussed about this issue but most of them do not properly reflect the nature of the time-series data. Based on several time series models, we studied about the endogenous factors (time, seasonal and cycle factors) and exogenous factors (economical, social change and crime control factors) on violent crime occur in Korea. Autocorrelation were also taken into account. Through this study, we want to help to make preventive policy by explaining the cause of violent crime and predicting the future incidence of it. Keywords: Autocorrelation, crimes ourbreaks, endogenous factors, exogenous factors, time series regression model. This work is partially supported by a Korea University Grant. 1 Research professor, Institute for Economic Research, Korea University, Seoul 02841, Korea. 2 Corresponding author: Research professor, Department of Statistics, Korea University, Seoul 02841, Korea. E-mail: alwaysns@korea.ac.kr