Save this PDF as:
 WORD  PNG  TXT  JPG

Size: px
Start display at page:

Download ""

Transcription

1 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우, 이저작물에적용된이용허락조건을명확하게나타내어야합니다. 저작권자로부터별도의허가를받으면이러한조건들은적용되지않습니다. 저작권법에따른이용자의권리는위의내용에의하여영향을받지않습니다. 이것은이용허락규약 (Legal Code) 을이해하기쉽게요약한것입니다. Disclaimer

2

3

4

5 - 국문요약 - 시계열자료를이용한응급의료센터수요예측모델링 본연구는응급의료센터수요예측의주요기준이되는 응급의료센터일일 내원환자수 를예측하는시계열모델을개발하는것이목적이다. 응급의료센터일일내원환자수 를미리예측함으로써수요에맞게응급의료센터의한정된자원을효율적으로배분하고시기적절하게활용할수있을뿐아니라응급의료센터에내원하는환자들의만족도나치료결과, 예후에도좋은영향력을미칠수있을것이다. 본연구에사용된데이터는병원정보시스템데이터베이스로부터응급의료센터내원환자정보를수집하였으며, 예측모델개발을위해서 2007~2008 년의 2 년간데이터를, 모델평가를위해서 3 개월간의데이터를가공하여사용하였다. 예측모델구축에사용한변수는날짜변수 ( 월, 요일, 계절, 분기, 휴일, 추석여부 ) 와날씨변수 ( 평균기온, 최저기온, 최고기온, 일교차, 강수여부, 신적설여부, 풍속도, 상대습도, 황사여부 ) 이다. 예측모델구축을위해사용한 2 년간의데이터에서는응급의료센터에내원한전체환자수가 169,375 명, 일일평균내원환자수가 232 명이었으며, 동일기간동안의응급의료센터일일내원환자의추이는 7 일주기성과계절적추세를보였다. 특히 추석 변수에갑작스런상승추이를보였으며, 상대적으로 설 의경우에는약한상승추이를보여본연구의선택변수에서는제외하였다. i

6 평균과분산은안정되어차분이필요하지않았으나, 계절적추세로인해 1 차의계절차분으로자료의정상성을유지하였다. 응급의료센터의일일내원환자수를예측하는모델로본연구에서는시계열모델중 1) MA(Moving Average) 모델, 2) 단변량 - 계절형 ARIMA(Seasonal Auto- Regressive Integrated Moving Average) 모델, 3) 다변량 - 계절형 ARIMA(Seasonal Auto- Regressive Integrated Moving Average) 모델을구축하였다. 그리고, 각모델의적합도평가를위해 1) 잔차분석, 2) AIC(Akaike Information Criterion), BIC(Bayesian Information Criterion) 값을비교 평가하였고, MAPE(Mean Absoulute Percentage Error) 를통해각모델의예측정확도를평가하였다. 구축한세종류의예측모델을비교한결과, 다변량 Seasonal ARIMA 모델이응급의료센터일일내원환자수예측에가장적합함을알수있었고 (AIC : , BIC : ), 예측정확도는 MAPE(Mean absolute Percentage Error) 가 7.4% 로오차가가장적어본연구의목적에부합하는최종예측모델로선정하였다. 그리고, 설명변수는추석여부, 계절, 평균기온, 강수여부를채택하였다. 그러므로, 본연구에서는다변량계절형 ARIMA 모델이비교되었던 MA 모델과단변량계절형 ARIMA 모델에비해설명변수를반영하고있어예측모델설명력이높고, 응급의료센터일일내원환자수에대한예측이정확함을확인할수있었다. 핵심어 : 수요예측모델, 응급의료센터과밀화현상, 시계열분석, Seasonal Auto- Regressive Integrated Moving Average(ARIMA), ii

7 차례 국문요약 ⅰ 차례 ⅱ 그림차례 ⅲ 표차례 ⅳ Ⅰ. 서론 1 A. 연구배경 1 B. 연구목적 8 Ⅱ. 연구대상및방법 9 A. 연구대상 9 B. 연구방법 제안하는응급의료센터수요예측모델 시계열예측모델적용 SARIMA 을활용한수요예측모델구축 31 Ⅲ. 결과 36 Ⅳ. 고찰 52 Ⅴ. 결론 58 참고문헌 59 ABSTRACT 63 iii

8 그림차례 Fig. 1. Overview of Research Method 13 Fig. 2. Time Plots of Daily Emergency Department Patients( ~ ) 39 Fig. 3. Transforms of Daily Emergency Department Patients using seasonal difference 40 Fig. 4. ACF Correlogram of Daily Emergency Department patients 41 Fig. 5. PACF Correlogram of Daily Emergency Department patients 42 Fig. 6. MA(2) Model Residual Analysis 44 Fig. 7. SARIMA(1,0,1)(0,1,1) 7 Model Residual Analysis 45 Fig. 8. SARIMA(1,0,2)(0,1,1) 7 Model Residual Analysis 46 Fig. 9. Observed and Predicted daily ED patients; MA (Moving Average) Model 50 Fig. 10. Observed and Predicted daily ED patients ; Uni-variate SARIMA (Seasonal Auto-regressive Integrated Moving Average) Model 50 iv

9 Fig. 11. Observed and Predicted daily ED patients ; Multi-variate SARIMA (Seasonal Auto-regressive Integrated Moving Average) Model 51 v

10 표차례 Table 1. Previous Studies 5 Table 2. Definition of Variables 12 Table 3. Commentary of MAPE value 35 Table 4. The Results of Comparison between Training Date Set and Validation Data Set by χ 2 test 37 Table 5. Residual Analysis of MA(2) Model, Univariate SARIMA Model, Multivariate SARIMA Model 43 Table 6. Multivariate Seasonal ARIMA Model Parameters 48 Table 7. Goodness of fits for Models(AIC, BIC) 49 Table 8. MAPE values of constructed Models 49 vi

11 I. 서론 A. 연구배경 현대의학이발전하면서인구의고령화, 급박한환경변화로인해발생하는스트레스압박, 자살 폭행및약물중독으로인한사회범죄의증가, 차량증가로인한교통사고증가, 산업의발달로야기될수있는대량재해등으로응급의료서비스에대한요구와관심이늘어나고있다 ( 정대유등, 2006). 그로인해응급의료센터내원환자수의증가, 내원하는환자들의질병형태의다양화, 중증도치료에대한요구의증가, 응급의료센터의인력부족 ( 의사, 간호사, 의료기사, 당직인력, 행정및사무직원등 ) 과입원병실부족, 진료공간의부족등으로인해응급의료센터는점점더과밀화 (Overcrowding) 해지고있다 (Tandberg 와 Qualls, 1994; 서동우등, 2004; 제상모등, 2005; 유인술등, 2007). 응급의료센터과밀화현상은응급의료센터의수요와공급의변화를초래하게하였고, 응급의료센터서비스에대한환자의만족도뿐만아니라환자의치료결과, 예후에도직접적인악영향을미치고있다 ( 이은숙과박금선, 1994; Sun 등, 2000; Schull 등, 2004; 최효선과이경원, 2006). 응급의료센터과밀화현상을해소하기위한방안으로는국내의응급의료에대한제도적발전과제공체계의확장, 응급의료센터의인력확충, 응급의료센터병상및공간확대, 응급의료센터의검사장비확충, 특수검사를위한진료인력보강, 단순질환치료를위한 Walk in clinic 운영, Hallway 운영, 관찰병상운영등이추진 (Derlet 와 Richards, 2000; Arnold 등, 2006) 되고있으나, 이러한 - 1 -

12 해소방안은응급의료센터의시설, 장비, 인력이갖추어지기위해서시간과비용이많이필요하다. 그러므로, 응급의료센터의과밀화를효율적으로해소하기위해서는 수요예측 방법을이용하여개별응급의료센터의수요를미리예측하고수요에맞게자원을활용하는것이필요하다 (Schweiger 등, 2007; Spenser 등, 2009). 즉, 개별응급의료센터의수요를미리예측함으로써시기적절하게응급의료센터의한정된자원들을효율적으로활용하는것이과밀화현상을해소할수있는효율적인방안이다 ( 정구영등, 1997; Arnold 등, 1998; 유인술등, 2007). 수요예측 이란계획을세우는것을전제로하며, 불확실한미래에발생할수있는다양한것중에서가장발생할가능성이높은것을미리예측하기위한의사결정방법이다. 급박하게변화하는환경속에서수요를미리예측함으로써의사결정과관련된불확실성과위험을줄이고, 경영자또는관리자들이합리적인의사결정을할수있도록하는중요한역할을하는것이다 ( 이종원, 2006; 황성완등, 2008; Lisa 등, 2009). 각개별응급의료센터의수요예측모델의개발및적용은한정된응급의료센터의자원을적절하게배분할수있도록할뿐만아니라, 환자의만족도나치료결과, 예후등에도좋은영향을미치게된다 (Asplin 등, 2006). 수요예측의방법은정치, 경제등다양한분야에서흔히활용되고있는방법이며, 의료보건분야에서는사용한사례가많지는않으나응급의료센터수요예측에관한연구들이 (Table 1.) 과같이몇몇논문에서수행되었다. Spencer S. Jones 등은 3 개의각각다른응급의료센터를대상으로 SARIMA 모델 (Seasonal Auto-Regressive Integrated Moving Average), Time Series Regression, - 2 -

13 지수평활법, 인공신경망모델, 선형회귀분석방법으로응급의료센터일일내원환자수를예측하기위한모델을구축하고, 구축된다양한예측모델을비교하기위한연구를수행하였다. 이연구에서는대부분의예측방법이단변량예측모델이었으며, 다변량예측모델은 Time Series regression 으로날짜변수 ( 요일변수, 월, 휴일변수 ( 휴일, 휴일다음날, 평일 ) 등 ) 와날씨변수 ( 일일최고기온, 최저기온, 강우량 ( 인치 ), 적설량 ( 인치 )) 를포함한예측모델과날씨변수를제외한예측모델로구축하여비교하였다. 그결과, 다중선형회귀분석법은시계열자료의특성을반영하고있지못하므로, 시계열자료인응급의료센터일일내원환자수를예측하기위한방법으로 Time Series Regression 이가장좋은모델로선정되었다. 또한, Time Series Regression 모델간비교에있어서도날씨변수를제외한 Time Series regression model 이응급의료센터일일환자수에대해더적절하게예측되었다고연구를통해결론을내렸다 (Table 1.). 그러나, 이연구는 3 개의병원이거의동일한지역에위치해있다는점, 각각병원의특정요인들을고려하지않은예측모델을구축하였다는제한점이있었다 (Spencer 등, 2008). Yan Sun 등은응급의료센터에내원하는일일환자수에영향을미치는지역적인요인을확인하고, 그요인을기반으로한예측모델을개발하는것이었다. 또한, 자원은환자질환의격심한정도에따라달라질수있음을 가정하여환자질환의격심한정도를 3 가지로나누어 ARIMA 를이용하여 응급의료센터에내원하는일일환자수를예측한연구이다 (Table 1.). 이연구에서응급의료센터에내원하는일일환자수에영향을미치는지역적인요인으로는각각의예측모델마다조금씩다르긴했지만, PSI(Pollution - 3 -

14 Standard Index) 와공휴일을선택하였으며, 모델구축시독립변수중날씨변수로는평균기온, 상대습도를고려하였으나, 예측모델의설명변수로는채택되지않았다 (Table 1.). 이연구의제한점은응급의료센터에내원하는일일환자수에영향을미칠수있는다른개별병원들의지역요인에대해고려하지못했다는점과날씨변수로평균기온과상대습도만을독립변수로고려하였다는점이었다 (Yan 등, 2009). 국내에서는이러한응급의료센터수요예측연구가많지않았으며, 그중 4 곳의대학병원을대상으로날씨및날짜변수가응급실로내원한환자수에미치는영향에대해수행되었던이장영등의연구가있었다 (Table 1.). 이연구에서는월별병원당내원환자수의변화는 1 월이가장적었고, 그이후로증가하다 9 월에정점에오르고다시줄어드는양상을보였고, 요일별로는일요일 92±13, 토요일 75±11, 월요일 71±10, 나머지평일은 64~65 명의분포를보였는데, 토, 일, 월요일은각각다른요일에비해유의한차이가 있었다. 계절별로는여름이하루평균 74±12 명으로가장많았고, 겨울이 65±13 명으로가장적었다. 그리고, 날씨변수들은일일최고, 최저, 평균기온과내원환자수와의상관분석결과약한상관관계를보였으며, 비가내린날과그렇지않은날의내원환자의수에는차이가없었고, 눈이쌓인날과그렇지않은날의내원환자의수에도차이가없었다. 이연구에서는응급의료센터일일내원환자에영향을주는요인으로날짜변수중월, 계절, 요일, 휴일여부가연관이있었고, 날씨변수중에서는기온이외에는의미있는변수가없었음을확인하였다 ( 이장영등, 2005)

15 Table 1. Previous Studies. Author Spencer at al, 2008 Yan at al,2009 Lee at al, 2005 Source 3 Emergency Dept. 1 Emergency Dept. 4 Emergency Dept. Daily ED Patients. 1) Daily P1 group Daily ED Patients. Dependent Variables 2) Daily P2 group 3) Daily P3 group 4) Daily ED Patients Independent Variables * Calendar Variables - Weeks - Months - Holidays * Weather Variables - MAX. air temperature - MIN. air temperature - Daily precipitation - Daily snowfall * Calendar Variables - Day of the Week - Month of the year, - Public Holiday * Weather Variables - Ambient temperature - Relative humidity * PSI : Pollution Standards Index * Calendar Variables - Seasons - Months - Weeks - Holidays * Weather Variables - MAX. air temperature - MIN. air temperature - Average temperatures, -The Rainfall(>10mm), -The Snowfall) Forecasting Method - Uni-variate SARIMA Method - Time Series Regression - Exponential smoothing - Artificial neural Network - Simple linear Regression model (Benchmark model). - Multi-variate non-seasonal ARIMA Model - Multi-variate Seasonal ARIMA Model -Multiple linear Regression model Final * Time Series regression *Multi-variate *Multiple linear Forecasting - Without climatic ARIMA Model Regression model Model Variables MAPE MAPE Calibrated R 2 : 62.6% Facility 1: 14.4% P1 : 18.2% Result Facility 2: 9.41 % P2: 7.7% Facility 3: 9.13% P3: 7.2% All: 4.4% - 5 -

16 또한, 이연구에서는선형회귀분석을통해미래의응급의료센터에내원하는환자를예측하는회귀식을 3 가지의변수만을이용하여만들었으나, Batel 등의연구에서는 13 개의변수를이용한복잡한회귀식에비해예측력이낮았다. 그리고, 우리나라의특성상설과추석명절기간에환자들이폭주하는현상으로인해회귀모델의예측력을떨어뜨리는결과를초래하기도하였다 (Batel 등, 2001; 이장영등, 2005). 그리고, 이장영등의연구에서는요일별내원환자수가일요일이가장많았고, 화요일부터금요일까지는낮은분포를보이다가토요일부터올라가는양상을보였으나, Batel 등의국외연구에서는월요일이가장높았고, 일요일로갈수록낮아지는양상을보였다. 이러한차이의원인으로는한주에 7 일모두하루에 15.5 시간을진료하는외래형응급실 (Walk-in-Clinic) 과같은우리나라와다른의료체계를가지고있었기때문이었다 (Batel 등, 2001). 이처럼각나라의의료체계에따라응급의료센터의요일별내원환자의추이가달라질수있음을이연구를통해확인할수있었으며 ( 김민정등, 2005; 최효선과이경원, 2006), 이연구의제한점으로는선형회귀분석법을이용한응급의료센터내원환자수예측이므로연구기간을연장하거나병원수를늘리는것에따라서통계결과및회귀식이달라질수있다는점과단일병원연구의 오류를줄이기위해 4 개의대학병원을대상으로하였지만, 특정시의모든 응급환자를대상으로하지못하였으므로예측에한계를가진다는점 등이었다 ( 이장영등, 2005). 위선행연구의고찰을통해발견한관련연구들의몇가지제한점을요약하면, 다음과같다

17 1) 국외와달리국내연구에서는응급의료센터과밀화에대한연구는많았으나그에비해응급의료센터 수요예측 에관한연구는부족하였다는점 2) 국내의수요예측관련연구중선형회귀분석을이용한연구외에시계열자료의특징을고려하여시계열모델을이용한연구가없었다는점 3) 응급의료센터의수요예측모델에영향을미치는개별병원의다양한요인을고려하지못했다는점이다. 그러므로, 본연구에서는이러한제한점을보완하기위해국내단일기관권역응급의료센터를대상으로시계열모델중시계열구성요소가시간의흐름에따라매우빠르게변동하는경우에효과적이며어떤형태를가진시계열자료라도분석이가능한장점을가진 SARIMA 모델을이용한응급의료센터수요예측의기본이되는 응급의료센터일일내원환자수 를예측하는모델개발이필요하며, 계절성을반영한 ARIMA 모델을이용한응급의료센터의일일내원환자수예측모델에대해단변량이아닌다변량 SARIMA 모델에영향을미치는다양한요인들을고려할필요가있다

18 B. 연구목적 본연구는국내단일기관응급의료센터를대상으로응급환자정보와지역의날씨정보, 휴일등을포함한날짜변수를이용하여응급의료센터과밀화현상의주요한기준이되는 응급의료센터일일내원환자수 를예측하는시계열모델을개발하고, 구축된예측모델을비교 평가하는것을목적으로수행하였다 본연구의목표는 시계열자료의특성을고려하여시계열모델중 MA(Moving Average) 모델, 단변량 SARIMA 모델, 다변량 SARIMA 모델구축, 구축된시계열모델의예측정확도상호비교, 국내단일기관응급의료센터내원환자수예측에가장적합한최종 예측모델선정이다. 위의목표를달성함으로써향후기대되는효과는다음과같다. 첫째, 국외연구에서는미처반영하지못한국내의지역적특성이반영된응급의료센터수요예측을위한시계열모델을개발할수있을것이다. 둘째, 응급의료센터의수요를미리예측함으로써그수요에맞는응급의료서비스및응급의료자원을효과적으로공급하고자원을배분할수있을것이다. 셋째, 응급의료센터의한정된자원을효율적으로활용함으로인해기관의시간-비용-노력등의경제적효과를기대할수있게될것이다

19 II. 연구대상및방법 A. 연구대상 권역응급의료센터는전국을 16개의권역으로나누고, 그지역에서가장중추적역할을할수있는병원 1개소씩을응급의료의중심병원으로지정한것으로미흡한응급의료체계를개선하여각종재해나사고로생긴응급환자를보다전문적이고체계적으로관리하기위한제도이며, 중증응급환자치료의중심일뿐만아니라, 응급환자치료를위한정보의제공, 응급의료인의교육, 재해중심병원의역할을수행하도록한다. 1. 연구대상선정의타당성본연구의대상이된응급의료센터는권역응급의료센터로지정되어운영되고있으며, 응급의료센터에내원하는연간평균환자수는 84,688명 (2007년 80,496명, 2008년 88,879명 ), 평균일일내원환자수는 232명으로전국권역응급의료센터중에서연간내원환자수에대해서는상위권의규모를가지고있다. 응급의료센터의전담인력은응급의학과전문의 ( 교수및강사 ), 외상전문외과전문의 ( 교수 ), 소아과전문의 ( 강사 ), 각임상과의교수및강사 ( 당직체계 ) 를비롯한응급의학과전공의 13명, 인턴 8명, 몇개임상과의파견전공의, 2인이상의모든임상진료과전공의 ( 당직협진체계 ) 로구성되어있으며, 간호사는응급간호팀장 1명, 파트장 ( 수간호사 ) 3명외수십명의간호사들과 7명의방사선기사, 6명의응급구조사, 7명의원무팀직원, - 9 -

20 2명의행정요원, 9명의청원경찰, 3명의안내요원등으로이루어져있다. 응급의료센터의시설및장비는별도의권역응급의료센터건물내에응급의료센터중환자실, 응급병동등의시설을갖추고있으며, 응급의료센터별도의진단장비, 환자감시장치, 치료장비, 기타장비 ( 혈액냉장고, 온장고 ( 수액보관 ), 제빙기, 정수기등 ) 를구비하고있다. 2. 데이터수집및가공본연구는병원정보시스템 (Hospital Infromation System(HIS) 에서추출한데이터집합을이용한후향적연구로, 연구에사용된데이터는병원정보시스템데이터베이스 (DataBase=DB) 로부터 2007년 1월부터 2009년 3월까지응급의료센터에내원한환자들의정보를병원정보관리팀으로부터개인식별정보 ( 이름, 병록번호 ) 를제외하여익명화된데이터로 189,511건을수집하였다. 2007년 1월 ~ 2008년 12월까지의훈련데이터집합 (Training Data Set) 은응급의료센터수요예측모델개발 ( 구축 ) 에사용하였고, 2009년 1월 ~ 2009년 3월까지의평가데이터집합 (Validation Data Set) 은예측모델의평가를위하여사용하였다. 연구에사용된데이터는응급의료센터에내원하여전산등록한환자정보를일별로된시계열자료로가공하였으며, 통상동일한환자가응급의료센터를여러번방문한경우가있을수있으나, 본연구의목적이일일내원환자수를예측하는것이므로중복된경우도환자수의합계에포함시켜자료를가공하였다

21 3. 데이터의특징본연구에사용된변수들은일일내원환자수, 월별, 요일별, 분기별, 휴일별, 추석여부, 계절별, 지역의날씨 ( 평균기온, 최저기온, 최고기온, 일교차, 강수여부, 신적설여부, 풍속도, 상대습도, 황사여부 ) 등의변수를사용하였으며, 변수에대한설명은 (Table 2.) 과같다. 일일내원환자수는내원일시를기준으로오전 0시부터다음날오전 0시까지응급의료센터에내원한환자수의합계로하였으며, 휴일별의휴일은공휴일과일요일, 휴일다음날은휴일다음날에위치하는정상근무일과토요일을함께분류하였다일일내원환자수의시계열도표에서눈에띄게갑작스럽게상승한특이점 (outlier) 은확인한결과추석이었으며, 이는특이점 (outlier) 이아니라의미있는값으로추석여부를변수로처리하여특이점을보정하지않았다. 날씨변수는기상청웹사이트로부터수집하였으며, 강수여부는기상청의권고대로일반인이비가충분히내렸다고생각하는 10mm이상을기준으로나누었고, 신적설은눈이쌓인높이를말하는것으로그유무에따라변수를나누었다

22 Table 2. Definition of Variables Variables Month Day of the Week Quarters of the year Holiday Chusuk Seasons Average-Temperature Minimal-Temperature Maximal-Temperature Temperature Gap RAIN SNOW Air-Velocity Relative Humidity Yellow dust Explanation January, February, March, April, May, June, July, August, September, October, November, December Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday 1Q, 2Q, 3Q, 4Q Weekdays, After Holiday, Holiday, Chusuk (Y/N) Spring, Summer, Fall, Winter Average-Temperature Minimal-Temperature Maximal-Temperature Maximal-Minimal Temperature RAIN (Y( 10mm),N) SNOW (Y/N) The speed of the wind Relative Humidity Sandy dust Phenomena B. 연구방법 1. 제안하는응급의료센터수요예측모델 (A) 응급의료센터수요예측모델본연구에서제안하는응급의료센터수요예측모델에관한연구방법의개괄은 (Fig. 1.) 와같다

23 Data Set Collection Number of Daily ED Patients. - Calendar Variables - Weather Variables Time Series Analysis Stationarity : Seasonal Difference(1) Construction of Models (1) MA (2) Model (2) Univariate SARIMA(1,0,1)(0,1,1 )7 Model (3) Multivariate SARIMA(1,0,2)(0,1,1) 7 Model - Identification - Estimation - Diagnosis Model AIC BIC MA PE MA (2) Uni-variate SARIMA(1,0,1)(0,1,1) Comparison for Models Multi-variate - AIC, BIC - MAPE SARIMA(1,0,2)(0,1,1) 7 - Chusuk(Y/N) - Season - Average Temperature - Rain(Y/N) Forecasting Observed and Predicted Daily ED Patients. Fig. 1. Overview of Research Method. ED=Emergency Department, MA=Moving Average, SARIMA=Seasonal Auto-Regressive Integrated Moving Average, ACF=Auto-Correlation Function, PACF=Partial Auto-Correlation Function, AIC=Akaike Information Criterion, BIC=Bayesian Information Criterion, MAPE=Mean Absolute Percentage Error

24 응급의료센터과밀화현상을해소하기위한효과적인방법으로본연구에서는 수요예측 을이용하고자하며, 수요예측 이란수요분석을통하여시장조사나각종예측조사의결과를종합해서미래의수요를예측하는것이다. 수요를예측하는방법으로는예측대상이나목적에따라여러가지로분류할수있지만, 일반적으로정성적예측방법 (Qualitative Technique) 과정량적예측방법 (Quantitative Technique) 으로구분할수있다. 정성적예측방법은주로경영자, 종업원등조직내외의인간이가진경험이나이들의견해에의존하여미래의결과를주관적으로예측하는방법으로신제품및서비스도입시와같이과거자료와시간이불충분할때흔히사용되는방법이고, 정량적예측방법은관측된과거자료에대한통계적분석을통하여미래의수요를예측하는방법으로과거에대한자료가충분하고, 그자료가수치로나타낼수있을때사용되는방법이다. 또한, 정량적예측기법은다시인과형예측기법 (Causal Forecasting Method) 과시계열예측기법 (Time Series Analysis) 으로분류될수있으며, 인과형예측기법은수요에영향을주는환경요인들을파악하고수요와이요인들간의인과관계를파악함으로써수요를예측하는방법이고, 시계열예측기법은과거의수요를분석하여시간에따른수요의패턴을파악하고과거의수요패턴이미래에도지속된다는기본적인가정하에미래의수요를예측하는방법이다. 이러한수요예측기법에는공통적특징이있는데, 효과적으로수요를예측하는데있어공통적인특징을이해하는것이매우중요하다

25 수요예측기법의공통적특징은다음과같다. 1) 수요예측기법들은일반적으로과거에존재했던인과관계가미래에도계속될것이라는가정하에이루어진다. 즉, 시계열예측기법의경우과거의패턴이미래에도그대로지속된다는것을전제로하며, 실제로는과거의패턴이계속되는것이아니므로안정성이기본적으로가정되어야한다. 2) 예측은언제나정확할수없으며, 오차가발생된다. 이러한예측값과실제값과의차이를최소화시키는것이수요예측의목적이다. 3) 개별적으로예측하기보다는집단화, 그룹화하여예측하는것이오차를줄일수있다. 집단화, 그룹화해서예측하게되면, 개체수가증가한만큼신뢰성있는계획을할수있게되므로예측오차 (Forecasting error) 를줄일수있다. 4) 예측의정확성은예측기간이증가할수록감소하게된다. 일반적으로단기예측이장기예측보다정확성이높다. 수요예측기법은이러한공통적인특징을바탕으로관측된과거의시계열로부터시간이흘러도변하지않고, 계속되어온현상이미래에도계속되리라는가정하에예측모델을개발하고, 그모델을통해미래를예측하는것이다. 모든수요예측기법들에는오차가발생할수밖에없으므로, 예측모델을구축하는과정에서오차를최소화하는것이수요예측의목적이된다

26 본연구에서는수요예측의방법중 시계열예측기법 을이용하여사회 문화 경제 기술적환경에따라급격히변화하는응급의료서비스에대한요구를파악하고, 미래의응급의료서비스에대한미래의수요를예측하고자한다. 응급의료센터의수요예측 은응급의료센터에내원하는환자수를기준으로전반적인응급의료센터의수요를예측할수있다는가정하에단일기관의응급의료센터를내원하는일일환자수를예측하는모델을구축하고, 예측모델을비교 평가하는연구를수행하고자한다

27 2. 시계열예측모델적용 (A) 시계열모델의이론적고찰 (1) 시계열자료의특성과구성시계열 (Time Series) 은어떠한현상에대하여시간의흐름에따라일정한간격으로이들을관측하여기록한자료를말하며, 일반적으로자료는횡단면자료 (Cross-Sectional Data) 와종단면자료 (Longitudinal Data) 로구분하는데, 시계열자료는종단면자료에해당된다. 시계열자료즉, 종단면자료는횡단면자료에비해관측값들의독립성이가정되지않고관측값들사이의상호연관성이정보획득을위한중요한원리가된다. 즉, 시계열자료는어떠한현상에관한시간의변화를나타내는것이므로어느한시점에서관측된시계열자료는그이전까지의자료들에영향을받게된다 ( 정동빈과원태연, 2001). 시계열은시계열의특성에따라하나의통일된시간단위로관찰하여기록되어져야하며, 시계열의특성을파악하기위해서는시계열도표를통해시계열의구성요인을알아보아야한다. 시계열자료의주요구성요소는다음과같다. 1 추세변동 (T;Trend Movement): 장기간에걸쳐수요가일정하게증가또는감소하는추세의형태를말하며, 기술및환경의변화로인해시계열자료에영향을주는장기변동요인이다. 2 순환변동 (C;Cyclical Fluctuation): 1 년이상의주기를가지고순환하는시계열의구성요소로추세를중심으로반복된

28 상승과하강의형태를보이는변동이다. 수요의추세가경기 순환과같이장기적인경제변동에의하여결정되고, 순환의 기간이변동적이다. 3 계절변동 (S;Seasonal Variation): 주로 1 년을주기로발생 하는시계열의변동요인으로추세나순환변동에비해상대적으로단기변동에해당하며, 월효과나분기효과등이대표적이다. 4 불규칙변동 (I;Irregular Movement): 추세, 계절, 순환변동으로설명되지않는변동으로지진, 전쟁, 홍수, 파업과같은사전에예상할수없는사건에의한변동과파악되지않는요인에의해서발생되는우연적변동이있다. 단기간에만일어나고, 측정이나예측이어려운오차변동을말한다. (2) 시계열모델과확률과정 (Stochastic Process) 과거의사실이나현상은미래에영향을미치며, 년, 월, 주, 일등의시간간격에따라관측된과거의자료를토대로추세나경향을분석하여일정한법칙을발견하고미래에도그러한법칙이지속될것이라는가정하에모델을구축하고, 예측모델을통해미래의수요를예측하는것이시계열모델 (Time Series Model) 의원리이다. 1 시계열과확률과정시계열은시간의흐름에따라변하는현상을일정한시간간격으로관측하여얻어진일련의자료들이며, 각시점 t에서의시계열을 Y t 로 확률변수 라고하고, 관측된실제값은확률변수 Y t 의모집단으로부터각시점에서얻어진표본으로이를실현값

29 (realization) 이라고한다 ( 이덕기, 1999). 불규칙하게변동하는시계열모델의특징을파악하기위해서는 확률의 개념을 도입하여야 하며, 특히 시점마다 얻어진 값을 확률변수의실현값으로간주해서, 시계열을만드는확률적인구조를 모델화하는것즉, 확률변수들의모임인 {Y n, t=1,2,, n} 를확률 과정 (Stochastic Process) 이라하며, 특히 t가시간을나타낼때의 확률과정을시계열모델이라고한다. 따라서 이러한 시계열 모델 {Y t } 의 확률적 특성은 Y t 들의 결합분포함수에의해서결정되고, 시계열의확률적특성을구하기 위해서는평균이나분산또는자기상관함수를통해시계열의분포를 알수있다. 특히시계열이정규분포로안정되어있다면, 평균과 분산만으로도분포의특성을정확하게알수있다. 2 평균및자기상관함수 시계열모델의확률적특성을알기위해서는시계열의평균및 분산, 자기상관함수 (Auto-Correlatiom Function) 을구하여야한다. 평균 (means) 은 μ t = E(Y t, ), t=0,1,2,,n 이고, 자기공분산함수 (Autocovariance Function) 는 γ t,s = Cov(Y t, Y s ) = E(Y t - μ t )( Y s μ s ), t,s = 0,1,2,,n, 자기상관함수 (Auto-Correlatiom Function) 는 ρ t,s = Corr (Y t, Y s ) = Υ t,s / (Υ t,t Υ 1/2 s,s), t,s = 0,1,2,,n 이다

30 3 정상성 (Stationarity) 표본으로부터모집단을추론하는것처럼시계열모델에서도 주어진시계열 Y t 를어떤확률과정에의해실현값을생성하는 과정을추론하게된다. 이를추론하기위해서는 정상성 의가정이 필요하다. 정상성 (Stationarity) 이란시계열의확률적특징이시간에따라 변하지않는다는것이다. 즉, 정상확률과정은시계열의평균과분산이시점 t 에관계없이 일정하고, 정상적인확률과정일경우에는다음과같은특징이있다. (1) 모든 t 에대하여평균이일정하다. E ( Y t ) = m. (2) 모든 t 에대하여분산이일정하며, 상수이다. Var ( ) = g (0) <. Y t (3) 모든 t 에대하여두시점사이의자기공분산은시차에만 의존한다. Cov( Y, Y ) = g ( t s ). t s - 4 자기상관함수 (ACF) 와편자기상관함수 (PACF) 자기공분산값은변수를측정하는스케일에따라달라지기 때문에대부분자기상관계수 rk 를계산하게된다. 자기상관함수 (Auto-Correlation Function) 는동일한변수에대해 서로다른시점에관찰된값들사이에존재하는상호작용관계를 나타내는것으로동일한변수에서얻어진연속적인관측값들사이의

31 상호연관관계를나타내는척도이다 ( 이덕기, 1999). r Cov( Y Y ( Y - Y)( Y - Y) t t+ k t t+ k t -1 k = Corr ( Yt, Yt -k ) = = = T Var( Yt ) 2 å( Yt - Y ) t= 1 ) T -k å g g k 0 편자기상관함수 (Partial Auto-Correlation Function) 는 k 이외의 모든시차를갖는관측치 (Υ t-1, Υ t-2,, Y t-k+1 ) 들로부터의영향력을 배제한가운데특정의두관측치 Υ t 와 Υ t-k 가얼마나관련이 있는지를나타내는척도이다 ( 이덕기, 1999). 즉, Y t-1, Y t-2,, Y t-κ+1 의영향을제거시킨후 Y t 와 Y t-κ 의순수한 상관계수를의미한다. 정상시계열 {Y t } 에서시차가 κ 인편자기상관함수는회귀식 Y + t = fk1yt -1 + fk 2Yt -2 + L + fkk Yt -k at 에서 시차가 κ 번째회귀계수를편자기상관계수 fkk fkk 로나타낸다. [ Y Y Y, Y, Y ] = Corr t, t-k t -1 t-2 L, t-k + 1 (3) 시계열예측방법다양한수요예측기법중본연구에사용한예측방법은시계열예측방법이며, 시계열예측방법에는이동평균 (Moving Average) 법, 지수평활법 (Exponential Smoothing Model), ARIMA(Auto-Regressive Integrated Moving Average) 모델이있다. 1 이동평균법 (Moving Average)

32 이동평균은시계열자료의일정기간즉, 기준시점과인접한 n 개의관측값들의평균을의미하며, 이동평균법이란이동평균을 이용하여불규칙변동이나계절변동을제거하는것으로평활법중한가지이다. 단순이동평균법은 시계열모델중가장단순한예측방법으로과거시계열자료 ( 연도별, 월별, 분기별자료 ) 를연속적으로산술평균하여수요를예측하는것 을말하며, 이것을식으로표현하면다음과같다 ( 우주리, 2007). F 1 ( X m X X n+ 1 = n + n-1 + n-m+ 1 ) ( F n+ 1 = 현재시점이 n 일때다음시점 n+1 의예측값, X n : 시점 n 의실제값, m= 이동평균기간 ) 이동평균법은불규칙변동이나계절변동을간단히제거할수 있는장점이있으나, 긴기간의이동평균이나반복되는이동평균은 많은의미있는자료를잃게할수있다. 2 지수평활법 (Exponential Smoothing Model) 과거의관측값들에대해동일한가중치를부여하는이동평균법과는달리최근의관측치가미래예측에더많은영향을줄것이라는가정하에과거보다현재의관측값에많은가중치를주어

33 수요의변화를평활시키는방법이다. 즉, 미래시계열을예측하기 위하여과거의시계열값들을단순또는가중평균하여시계열에 포함된확률오차를평준화시키는것이다. 3 ARIMA(AutoRegressive Integrated Moving Average) 모델 ARIMA 모델은이동평균법, 지수평활법과달리확률적인접근을통해예측하는것으로, 시계열의추세성을제거하여정상성을확보한후시계열을확률에의해서모델을구축하고, 예측하는방법이다 ( 이주호, 2006). ARIMA 의일반적인표현은다음과같다. ARIMA ( p, d, q)( P, D, Q) s ARIMA 모델은자기회귀 (AR) 부분, 차분부분, 이동평균부분으로 크게 3 가지부분으로구성되어있으며, 여기서 ( p, d, q) 부분은 비계절부분을, ( P, D, Q) 나타낸다. 부분은계절부분을, s 는계절의기간을 비계절적부분은비계절적자기회귀 (AR) 차수 = p, 비계절적차분 (Difference) 차수 = d, 그리고비계절적이동평균 (MA) 차수 = q 로표현되며, 계절성을가지는시계열자료의경우에는계절적자기회귀 (Seasonal AR) 차수 = P, 계절적차분 (Seasonal Difference) 차수 = D, 그리고계절적이동평균 (Seasonal MA) 차수 Q 로표현된다

34 ARIMA 과정이란, 시계열의패턴을정확하게반영해줄수있는차수 p,d,q 와 P,D,Q 를적절하게찾아내는것이며, 이러한개념식을수학적으로표현하면다음과같다. s s D d s f B) F( B )(1 - B ) (1 - B) yˆ = q ( B) Q( B ) e yˆ = y - m ( t t, t t y t: 시차, t : 종속변수또는차분변수, m : 종속변수의평균 d= 비계절적차분횟수, D: 계절적차분횟수 B= 후향연산자, BX t = X t-1, f(b) : 비계절적 AR 모델 F( B q (B) Q( B s s ) : 계절적 AR 모델 : 비계절적 MA 모델 ) : 계절적 MA 모델 e t, : 오차항 ( 백색잡음, white noise)

35 (B) 시계열모델의적용시계열모델을구축하는과정은 (1) 시계열모델예비단계 ( 정상화 ), (2) 모델식별단계, (3) 모수추정단계, (4) 모델진단단계 (5) 예측에의해이루어진다. (1) 시계열모델예비단계, 시계열모델구축을위한예비단계로시계열도표를통해서시계열이시간이흐름에따라증가하거나감소하는추세가있는지, 분산이커지거나작아지는지, 일정한현상이규칙적으로나타나는계절성이있는지, 특정시점에서시계열이갑자기크게변하는지, 그리고그변화가바로소멸되는지아니면오래지속되는지등을살펴보아야한다 ( 정동빈과원태연, 2003). 만약이러한현상들이나타난다면, 비정상시계열을적절한변환을통해서정상시계열로변환한후에모델식별을하여야한다. 시계열의적절한변환방법으로는 1 차분을통해추세를제거하는 방법과 2 분산안정화변환방법이있다. 1 추세성의제거 시계열도표를통해추세가있는경우에는추세가큰의미를 부여하지않는다면, 차분을통해서추세를제거하여정상시계열로

36 변환한다. 그러나, 차분을 수행할 때 주의해야 할 점은 과다차분 이며 일반적으로선형추세의경우는 1차차분을통해서추세성분이제거된다. 과다차분여부를확인하기위해서는차분을한후차분된시계열의 시계열도표와자기상관함수도표를다시그려보고시계열의정상성여부를 판단해야한다. 이처럼이미정상화된시계열에대하여다시차분을실시하는것을 과다 차분이라 하며, 과다차분은 시계열의 분산을 증가시키거나 자기상관함수를복잡하게만든다 ( 이덕기, 1999). 2 분산안정화변환 시계열도표에서시계열의분산이시간의흐름에따라변한다면, 비정상시계열이며, 비정상 시계열은 분산안정화변환을 통해 분산이 일정하게되도록정상시계열로변환한다. 일반적으로 많이 이용되는 분산안정화 변환으로는 로그변환과 루트변환그리고 Box-Cox변환등이있다. (2) 모델식별단계모델식별이란 ARIMA(p,d,q)(P,D,Q)s 모델의차수 p,d,q와 P,D,Q 를결정하는것이다. 모델식별을위해서일반적으로사용하는도구로는. 1 자기상관함수 (ACF : Auto-Correlation Function) 2 편자기상관함수 (PACF : Partial Auto-Correlation Function) 가있다즉, 주어진시계열의자기상관함수와편자기상관함수의도표를그린

37 후이미알려져있는각시계열모델의자기상관함수와편자기 상관함수의형태비교를통해서주어진시계열의모델을식별하게된다. 자기상관함수와편자기상관함수는혼합모델의경우, 모델식별이 어려우므로이러한문제점을보완하기위해서는아카이케정보판단기준 (AIC) 과베이지언정보판단기준 (BIC) 을사용한다. 3 아카이케정보판단기준 (Akaike Information Criterion) AIC 를수식으로나타내면다음과같다. AIC=n ln 2 s ˆ a + 2(p+q) 여기서 n 은시계열의관측값들의개수이고, 2 ŝ a 은 2 s a 의최대우도 (Maximum Likelihood) 추정량이며, (p+q) 는설정된모델의모수의수로 모델을과다적합하여모수를너무많이포함시키는것을견제하는 일종의벌칙함수의역할을한다 ( 이덕기, 1999). 모델식별방법은복수의잠정모델에서 AIC 을기준으로최소값을 가지는모델을선정한다. 4 베이지언정보판단기준 (BIC= Bayesian Information Criterion) AIC 와유사한정보판단기준으로 BIC 통계량식은다음과같다 BIC= n ln 2 s ˆ a + 2(p+q) ln n 여기서 n 은시계열의관측값들의개수이고, 2 ŝ a 은 2 s a 의최대우도 (Maximum Likelihood) 추정량이며, (p+q) 는설정된모델의모수의 수이다 ( 이덕기, 1999). 모델식별방법은 AIC 와같이여러개의잠정모델중작은 BIC 값을

38 가질수록모델이잘적합되었음을의미한다. (3) 모수추정단계모델식별단계에서모델이식별되면, 다음단계로식별된모델의모수를추정하여야한다. 식별된 ARIMA 모델의모수를추정하는방법으로는크게 1 조건부최소제곱법 (CLS: Conditional Least Squares Estimation), 2 비조건부최소제곱법 (ULS:Un-conditional Least Squares Estimation), 3 최대우도추정법 (ML:Maximum Likelihood Estimation) 등이있다. 1 조건부최소제곱추정 (CLS: Conditional Least Squares Estimation) 법 : 조건부최소제곱법으로모수추정을간편하게하기위하여처음몇개의관측값에조건화하여잔차제곱합을최소화하는방법이다. 계산이비교적간단하나, 처음몇관측값이갖는정보가효율적으로이용되지못한다. 2 비조건부최소제곱추정 (ULS: Unconditional Least Squares Estimation) 법 : 조건부최소제곱법과같은조건이없이잔차제곱합을최소화하는방법이다. 이는자료의수가크지않을경우나계절시계열모델에서는추정값에영향을미치게되므로초기값을지정하지않고, 오차제곱합을최소화시키기위해비조건부최소제곱법을사용한다. 3 최대우도추정 (ML: Maximum Likelihood Estimation) 법 : 최대우도추정법은시계열의결합밀도함수인우도함수를최대화시키는모수를구하는방법이다

39 이를위해서는백색잡음의분포를가정해야하며, 일반적으로 백색잡음의분포는평균이 0, 분산이 2 s a 인정규분포로가정한다. (4) 모델진단단계 모델진단단계는추정된모델의적합성을검토하는단계이다. ARIMA 모델에서는잔차의백색잡음여부를확인하는 잔차분석 (Residual Analysis) 을통해서추정된모델이타당한지의여부를판단한다. 시계열모델의오차항 a t 즉, 모델의잔차는다음의백색잡음성질을 만족해야한다 ( 노형진, 2007). i) 오차들은서로독립적어서, 자기상관계수 ρ κ = Corr(Y 1,Y t-κ ) = 0 이고, ii) 평균은 E(a t ) = 0, 분산은 V(a t ) = iii) 정규분포를한다. a t ~ N(0, 2 s a ) 2 s a 이며, 따라서, 잔차들의시계열도표와자기상관함수도표에서잔차들의 평균 0 을중심으로랜덤하게움직이고, 특정한패턴이보이지않으며, 분산이일정하고또한잔차들의자기상관함수가모든시차에서 신뢰한계내에존재한다면, 이것은잔차들의자기상관함수가 0 이라는 귀무가설 (H 0 : ρ κ =0) 을채택하게되어잔차들이통계적으로서로 독립적이다라는것을의미한다 (5) 예측 시계열분석의목적은시계열모델의구축과예측에있으며, 연속성 의원리 (The Principle of Continuity) 에입각하여미래를예측하는방법이다

40 따라서, 시계열분석을통한예측에서는관측된과거의자료들을분석하여일정한규칙을발견해서이를모델화하여추정하고, 이추정된모델을사용하여미래에관측될값을예측하게된다이러한예측모델은과거에일어났던일이예기치못한사건에의하여방해받지않는한미래에도재연될것이라는가정이므로예측모델을구축하는과정에서오차가발생할수밖에없으며, 이러한오차는확률분포에의해구하게된다. 또한, 시계열자료들을통해분석한결과가미래에도지속되고, 일정한규칙성을가지고, 시계열자료의타당성과신뢰성을확보한다면, 예측의정확성을높일수있다

41 3. SARIMA 를활용한수요예측모델구축 (A) SARIMA 모델 SARIMA 모델의시계열자료들은일정한시간간격을두고동일한현상이반복되는경향을보이는계절성을가지고있다. 이러한반복적인현상이계속일어나는시간간격을계절주기라고하며, 이러한특징을지닌시계열을계절시계열이라고한다. SARIMA 모델은비계절적부분과계절적부분, 계절주기를포함한 ARIMA (p,d,q)(p,d,q) s 로표현된다. SARIMA 모델은가장활용도가높은시계열모델방법론으로크게자기회귀부분, 차분, 이동평균부분으로구성되어있다 ( 허명회, 2009). (1) 자기회귀부분자기회귀과정은 AR(p) 과정이라고하며, 시계열의현재값은과거의영향을받아실현된다는가정하에이루어지는것이고, P 차 AR 모델은다음과같이표현된다. AR(p); Y fy + fy + L + Y + a. t = t-1 t-2 f p t - p t 여기서 at 는평균이 0 이고분산이 2 s 인정규분포를독립적으로 따르는잡음 ( 오차 ) 항이다. (2) 차분보통의시계열자료는추세를가지고있거나변동이불규칙하므로정상성가정을충족시키지못하므로, 비정상시계열자료를분석하기위해서는차분을통하여추세를제거하여야한다

42 또한계절성을띠고있는계절시계열은 계절차분 (Seasonal difference) 을통해추세를제거하여시계열을정상화시킨다. (3) 이동평균부분이동평균과정은시계열을백색잡음과정의누적평균으로표현되도록한확률과정이며, q 차 MA 모델은다음과같이표현된다. MA(q) : = a -qa -qa -L q a. zt t t-1 t-2 - q t-q 그리고, q, q, 1 2 L, q 등은자료로부터추정되어야할모수이다 ( 허 명회, 2009). 여기서 at 는평균이 0 이고분산이 2 s 인정규분포를따르는 잡음 ( 오차 ) 항이다

43 (B) SARIMA 모델의적용 (1) 시계열예비단계관측된시계열의특성을파악하기위해서는시계열도표과자기상관함수도표를그려서시계열의추세성분이있는지, 계절성분이있는지, 아니면분산이변하고있는지등을알아보아야하며, 보통의시계열자료는추세를가지고있거나변동이불규칙한비정상시계열이므로적절한변환을통해서정상적인시계열로변환하는것이필요하다. 본연구에서는응급의료센터의일일내원환자수의시계열도표와편자기상관함수 (PACF), 자기상관함수 (ACF) 도표에서별다른추세는보이지않았으나, 계절적추세로인해비계절적차분인 d=0, 계절적차분인 D=1로설정하여정상적인시계열로변환하였다. (2) 모델식별단계정상화된시계열에대하여자기상관함수와편자기상관함수도표를통해서잠정적인모델을설정한다. 편자기상관함수 (PACF:partial Auto-Correlation Function) 와자기상관함수 (ACF:Auto-Correlation Function) 도표에서는 PACF에서 1번째의상관계수가유의하게돌출되어있었으므로 AR(1) Model를잠정모델로결정할수있으며, ACF에서 1번째에서유의하게돌출되어있었으므로 MA(1) Model를잠정모델로결정할수있었다. 비계절적자기회귀를나타내는 p=1로, 계절적자기회귀를나타내는 P=0로설정, 비계절적이동평균을나타내는 q=1로, 계절적이동평균을

44 나타내는 Q=1로설정하여단변량 SARIMA 모델을식별하였다. 이와같이모델식별단계에서는 ARMA모델의식별을 AR모델과 MA모델의절충모델을여러개시도해본뒤, 적합도가좋으며최대간결한모델을선택하여결정하여야한다. 즉, 순수 AR모델중에는차수가 p인것이좋게나타났고, 순수한 MA모델중에는차수가 q인것이좋게나타났다면, 다수의 ARMA(k,l) 모델에서는잠정모델에대한차수를 1 k p-1, 1 l q-1 으로 고려해볼수있다 ( 허명회, 2009). 본연구에서는최종후보모델로 1) 이동평균모델 : MA (2) Model과 SPSS version 15.0의시계열모델자동판별 Modelar 모듈을통해 2) 단변량 Seasonal ARIMA 모델 : SARIMA(1,0,1)(0,1,1) 7, 3) 다변량 Seasonal ARIMA 모델 : SARIMA (1,0,2)(0,1,1) 7 을구축하였다. (3) 모델추정및진단단계구축된수요예측모델의추정 (Estimation) 은최대우도추정법 (Maximum Likelihood) 에의해이루어졌으며, 모델진단을위하여예측모델의잔차를분석하였다. 그리하여구축된수요예측모델중최종모델을선정하기위하여적합모델의엔트로피를측정한것인 AIC(AKaike Information Criterion) 와 BIC(Bayesian Information Criterion) 기준값을비교하였으며, 그값이작은모델을최적예측모델로선택하였다

45 (4) 예측 수요예측모델을평가하기위하여응급의료센터일일내원환자수의 예측값과관측값의차이인예측오차의상대적인오차의크기를 나타내는 MAPE (Mean Absolute Percentage Error) 를비교하여 예측정확도를평가하였다. MAPE (Mean Absolute Percentage Error) 를구하는공식은다음과 같으며, 여기서 X 는실제값 ( 관측값 ), F 는예측값, 그리고 n 은관측값의 기간수를각각나타내며, 계산된 MAPE 값은 (Table 3.) 과같이해석될 수있다 (Lewis, 1982; 이충기, 2003). MAPE = 1 X - å t Ft n X t *100 Table 3. Commentary of MAPE value. MAPE Commentary 0% MAPE < 10% Very accurate prediction 10% MAPE < 20% Relatively accurate predictions 20% MAPE < 50% A relatively reasonable prediction MAPE 50% Inaccurate forecasts

46 III. 결과 A. 연구결과 응급의료센터환자정보를분석한결과, 2007년 ~2008년도 2년간응급의료센터에내원한전체환자수는 169,375명이었으며, 연간평균환자수는 84,688명 (2007년 80,496명, 2008년 88,879명 ), 평균일일내원환자수는 232명이었다. 본연구에사용된훈련데이터집합 (Training Data Set) 과평가데이터집합 (Validation Data Set) 간의유의한차이가있는지에대해알아보기위하여카이제곱검정을하였으며, 두 Data Set 간의성별, 연령대, 응급진료결과, 진료구역에대한카이제곱검정결과는 (Table 4.) 과같으며, 유의확률 P-value가 0.05보다커두군간의유의한차이는없었음을확인하였다

47 Table 4. The results of Comparison between Training Data Set and Validation Data Set by χ 2 test. Characters Training Data Set Validation Data Set P-Value Sex Age Group ER care Result Male 47.90% 47.10% Female 52.10% 52.90% Geriatric (Age>65) 34.00% 31.90% Adult (16 Age<65) 37.00% 42.00% Pediatric (Age<16) 28.90% 26.10% Discharge 25.60% 26.90% Others 3.60% 0% Death 9.00% 5.90% Admission 25.60% 31.10% Transfer 15.70% 17.60% Cancel 20.50% 18.50% st Zone (New Pt area) 15.10% 18.50% 2 nd Zone (Med.-Adult) 14.20% 14.30% Emergency Zone 2 nd Zone (Surgery-Adult) 3 rd Zone (Child area) 13.30% 18.50% 12.30% 14.30% th Zone (CPR,ICU) 16.60% 18.50% Delivery 14.50% 5.90% Waiting Room 9.90% 10.10% for Admission The results of Comparison between Training Data Set and Validation Data Set by χ 2 test is non-significant (p-value > 0.05)

48 (A) 시계열의사전조정응급의료센터의일일내원하는환자수의시계열도표는 (Fig. 2.) 과같이나타났으며, 응급의료센터일일환자수는일요일에증가하였다가화요일부터금요일까지는낮게분포하는양상을보이는 7 일을주기로반복됨을확인하였다. 또한, 시계열도표에서시간이흐름에따라증가하거나감소하는추세는있지않았으며, 분산이커지거나작아지는양상등의별다른추세가보이지않아차분이필요하지는않았지만, 7 일을주기로반복되는계절적추세가있어 1 차계절적차분을통해정상성을유지하였다. 모델구축을위한 2 년간의데이터를계절적 1 차차분을한시계열도표는 (Fig. 3.) 와같이나타났다계절적차분을한시계열도표에서평균과분산의변화를뚜렷하게볼수없어정상시계열임을확인할수있었다

49 600 Training Data Set Validation Data Set Chusuk 500 Chusuk ED patients/day /01/01 04/11 07/20 10/ /02/05 DATE 05/15 08/23 12/ /03/11 Fig. 2. Time Plots of Daily Emergency Department Patients( ~ ). During the period from January 2007 to March 2009, Total of 189,511 ED patients visited and average number of daily patients was 231. The Sequencing graph showed 7-day periodicity and seasonal trend. In particular, there was a sharp increase in the number of patients in Chusuk

50 ED Patient/day /01/ /04/ /07/ /11/04 DATE 2008/02/ /05/ /08/ /12/08 Fig. 3. Transforms of Daily Emergency Department Patients using seasonal difference. (B) 모델식별모델식별을위해서편자기상관함수 (PACF: Partial Auto-Correlation Function) 와자기상관함수 (ACF : Auto-Correlation Function) 를이용하고자그려진상관함수도표는 (Fig. 4.) 과 (Fig. 5.) 같으며, PACF에서 1번째의상관계수가유의하게돌출되어있었고, AR(1) Model과 ACF에서 1번째에서유의하게돌출되어있었으므로 MA(1) Model을잠정모델로결정할수있음을확인하였다

51 그리고, 본연구에서최종후보모델로 1) 이동평균모델 : MA (2) Model과 SPSS의시계열모델의자동판별 Modelar 모듈을통해 2) 단변량 Seasonal ARIMA 모델 :SARIMA(1,0,1)(0,1,1) 7, 3) 다변량 Seasonal ARIMA모델 : SARIMA (1,0,2)(0,1,1) 7 구축하였다. ED patients/day 1.0 Coefficient Upper Confidence Limit Lower Confidence Limit 0.5 ACF Lag Number Fig. 4. ACF Correlogram of Daily Emergency Department Patients

52 ED patients/day 1.0 Coefficient Upper Confidence Limit Lower Confidence Limit 0.5 PACF Lag Number Fig. 5. PACF Correlogram of Daily Emergency Department Patients. (C) 모델추정및진단단계구축된모델은 SPSS Time Series Modeler에의해자동판별된모델이며, 모델을판별하는알고리즘은가장좋은모델을 BIC를기준으로적용하여선택하게된다

53 (1) 잔차분석구축된모델을진단하기위해서는일반적으로많이사용되는잔차분석 (Residual Analysis) 을이용하였으며, 세모델의잔차분석결과는 (Table 5.) 와같다. Table 5. Residual Analysis of MA(2) Model, Univariate SARIMA Model, Multivariate SARIMA Model. MA(2) Model Univariate Multivariate SARIMA Model SARIMA Model White noise X O O P-value Two SARIMA Model are satisfied with the nature of White noise and MA(2) Model is dissatisfied with it. 1 이동평균 MA 모델 - MA(2) 시차 2 를이용한이동평균법으로구축된예측모델의잔차에대한 분석은 (Fig. 6.) 와같으며, 여기서유의확률 < 유의수준 이므로 가설 H 0 :ρ(1)=ρ(2)=ρ(3)=..= ρ(m)=0 는기각된다. 따라서이추정된모델의모수들은유의하지않으며, 적합된모델에의해서추정된잔차 ( 관측값-적합된값 ) 들은모델에대한정보를가지고있어백색잡음 (White noise) 의성질을만족하지못하였다. 즉, 모든 m차의자기상관계수가 (Fig. 6.) 와같이신뢰구간내에존재하지않으므로이예측모델은잘적합되지못하였음을알수있었다

54 Residual ACF Residual PACF Lag Residual Fig. 6. MA(2) Model Residual Analysis. 2 단변량 Seasonal ARIMA 모델 - ARIMA(1,0,1)(0,1,1) 7 Seasonal ARIMA 모델 ARIMA(1,0,1)(0,1,1) 7 의잔차에대한분석은 Fig. 7. 과같이나타났으며, 유의확률 > 유의수준0.005이므로가설 H 0 :ρ(1)=ρ(2)=ρ(3)=..= ρ(m)=0 는기각되지않는다. 따라서이잔차는백색잡음 (White noise) 이라고생각할수있으며, 모든 m차의자기상관계수가신뢰한계에있으므로이잔차들의자기상관함수가 0이라는귀무가설을채택하게되고, 잔차들은통계적으로

55 자기상관이없이독립적이라는것을알수있었다. 따라서이예측모델은 잘적합되었음을알수있었다. Residual ACF Residual PACF Lag Residual Analysis Fig. 7. SARIMA(1,0,1)(0,1,1) 7 Model Residual Analysis. 3 다변량 Seasonal ARIMA 모델 - SARIMA(1,0,2)(0,1,1) 7 기상변수와날짜변수를고려한 Seasonal ARIMA(1,0,2)(0,1,1) 7 의잔차에대한분석은 (Fig. 8.) 와같이나타났으며, 유의확률 > 유의수준 0.005이므로가설 H 0 :ρ(1)=ρ(2)=ρ(3)=..= ρ(m)=0 는기각되지않는다

56 따라서이잔차는백색잡음 (White noise) 이라고생각할수있으며, 모든 m차의자기상관계수가신뢰한계에있으므로이잔차들의자기상관함수가 0이라는귀무가설을채택하게되고, 잔차들은통계적으로자기상관이없이독립적이라는것을알수있었다. 따라서이예측모델은잘적합되었음을알수있었다. Residual ACF Residual PACF Lag Residual Analysis Fig.8. SARIMA(1,0,2)(0,1,1) 7 Model Residual Analysis

57 (2) 모델추정 ( 비교 ) 세개의예측모델의모수추정은최우추정 (ML:Maximum Likelihood Estimation) 법에의해이루어졌으며, 다변량계절형 ARIMA 모델의모수추정결과는 (Table 6.) 와같이나타났다. 모수추정결과, 다변량모델구축시고려하였던독립변수 ( 월, 일, 요일, 계절, 분기, 휴일, 추석여부, 평균기온, 최저기온, 최고기온, 일교차, 강수여부, 신적설여부, 풍속도, 상대습도, 황사여부 ) 중예측모델이채택한설명변수는추석여부, 계절별, 평균기온, 강수여부임을확인하였다

58 -48- Table 6. Multivariate Seasonal ARIMA Model Parameters. Variables Transformation Estimate SE t Sig. ED patient/day NO Constant AR Lag MA Lag Seasonal Difference 1 MA, Seasonal Lag Chusuk(Y/N) NO Delay 1.00 Numerator Lag Seasonal Difference 1 Seasons NO Numerator Lag Lag Seasonal Difference 1.00 AVG-Temperature NO Numerator Lag Seasonal Difference 1 RAIN(Y/N) NO Delay 4.00 Numerator Lag Lag Seasonal Difference 1 Adopted 4 Predictors by Multivariate SARIMA(Seasonal Autoregressive Integrated Moving Average) Model were Season, Chusuk(Y/N), Average Temperature, Rain(Y/N).

59 또한, 예측모델들을비교하기위해서는모델간의 AIC(Akaike Information Criterion) 와 BIC(Bayesian Information Criterion) 를비교하였으며, 그결과는 (Table 7.) 과같이나타났다. AIC 및 BIC 값이적을수록잘적합된모델로판단할수있으므로, 본연구에서는가장적합한모델로다변량계절형 ARIMA 모델, 즉 Seasonal ARIMA(1,0,2)(0,1,1) 7 모델을채택하였다. Table 7. Goodness of fits for Models (AIC, BIC) a a Multivariate SARIMA Model is The Best Model. - SARIMA(Seasonal Autoregressive Integrated Moving Average) - AIC(Akaike Information Criterion) - BIC(Bayesian Information Criterion) (D) 모델평가 Model AIC BIC MA(2) Univariate SARIMA(1,0,1)(0,1,1) Multivariate SARIMA(1,0,2)(0,1,1) a a 예측모델을평가하기위한모델의예측정확도는실제관측값과예측값의 차이인예측오차의상대적인크기를나타내는 MAPE(Mean Absolute Percentage Error) 를비교하였으며, 그결과는 (Table 8.) 과같았다. Table 8. MAPE values of constructed models Model MAPE MA(2) Univariate SARIMA(1,0,1)(0,1,1) Multivariate SARIMA(1,0,2)(0,1,1) 7 b Multivariate SARIMA Model is The Best Model. - SARIMA(Seasonal Auto-Regressive Integrated Moving Average) - MAPE(Mean Absolute Percentage Error) b

60 (E) 예측세예측모델의예측기간 3 개월의예측값과관측값을비교한도표를그려본결과, 1) 이동평균 (MA) 모델에관한비교표는 (Fig. 9)., 2) 단변량 Seasonal ARIMA 모델에관한예측비교는 (Fig. 10.), 3) 다변량 Seasonal ARIMA 모델에관한예측비교는 (Fig. 11.) 과같았다. Fig. 9. Observed and predicted daily attendances at an ED ; MA(Moving Average) Model. Fig. 10. Observed and predicted daily ED patients ; Uni-variate SARIMA(Seasonal Autoregressive Integrated Moving Average) Model

61 Fig. 11. Observed and predicted daily ED patients ; Multivariate SARIMA (Seasonal Autoregressive Integrated Moving Average) Model

62 IV. 고찰 본연구의대상이된응급의료센터는전담인력과응급의료센터별도의진단 장비, 환자감시장치, 치료장비, 기타장비등을구비하고있었으며, E-ICU, Emergency 병동등의시설을구비하고있는권역응급의료센터로 2007 년 ~2008 년도 2 년간응급의료센터에내원한전체환자수는 169,375 명, 연간평균환자수는 84,688 명 (2007 년 80,496 명, 2008 년 88,879 명 ), 평균일일내원환자수는 232 명으로전국에서상위권의규모를차지하고있어응급의료센터일일내원환자수예측을위한적절한연구대상이었다. 본연구에사용된훈련데이터집합 (Training Data Set) 과평가데이터집합 (Validation Data Set) 간의유의한차이를확인하기위하여카이제곱검정을한결과, 두 Data Set 간의성별, 연령대, 응급진료결과, 진료구역의유의한차이는없었으며, 본연구기간동안의응급의료센터일일내원환자추이에영향을줄수있는특별한요인은없이국내단일기관응급의료센터의일상적인일일내원환자추이에대한수요예측을할수있는데이터집합이었다. 응급의료센터일일내원환자수의추이는주말인토요일부터증가하여일요일이가장많았고, 휴일다음날인월요일에조금감소하다가, 화요일부터금요일까지는낮은분포로 7 일을주기로변동하는양상과계절적추세를보였다. 그리고, 7 일의주기성을벗어나는특이점으로 추석 과 설 의경우가있었으며, 추석 에는갑작스럽게상승하는양상을보이는데반해 설 의경우에는

63 상대적으로약한상승추이를보여본연구에서는추석여부만을변수로선택하여예측모델에반영하였다. 본연구에서사용한다변량예측모델의독립변수로는날짜변수 ( 월, 일, 요일, 계절, 분기, 휴일, 추석여부 ) 와날씨변수 ( 평균기온, 최저기온, 최고기온, 일교차, 강수여부, 신적설여부, 풍속도, 상대습도, 황사여부 ) 를사용하였으며, 이중다변량예측모델의설명변수로 추석여부, 강수여부, 계절, 평균기온 을채택하였다. 본연구에서보여준응급의료센터의일일환자추이는이장영등의연구에서요일별로는일요일 92±13, 토요일 75±11, 월요일 71±10, 나머지평일은 64~65 일의분포와거의비슷하게나타났으며, 국내응급의료센터일일내원환자수에대한수요예측모델에있어요일, 휴일, 추석 과 설 에대해고려하여야함을알수있었다. 또한, 각개별병원의사회문화적배경, 지역적특성에따라응급의료센터일일내원환자수에미치는영향의차이가있음을국내에서이루어진이장영등의연구에서는휴일중특히추석과설, 일요일과같은공휴일에응급의료센터일일내원환자수가많았으나, Batel 등의연구에서는국내의의료체계와달리한주에 7 일모두하루에 15.5 시간을진료하는외래형응급실 (Walk-in-Clinic) 운영으로인해요일별내원환자수가월요일이가장높았고, 일요일로갈수록낮아지는양상을통해알수있었다. 그리고, 휴일및휴일다음날 ( 월요일 ) 에응급의료센터를내원하는환자수가증가하는양상은적정인력배치에있어주말및공휴일에대해고려하여야함을시사하는것이다

64 날씨변수에있어서는이장영등의연구에서는일일최고, 최저, 평균기온과내원환자수와의상관분석결과약한상관관계를보였으며, 비가내린날과그렇지않은날의내원환자의수에는차이가없었고, 눈이쌓인날과그렇지않은날의내원환자의수에도차이가없었으나, 본연구에서는일일내원환자수가강수여부에의해영향을받는것을확인할수있었다. 선행연구를통해서도응급의료센터일일내원환자수에영향을미치는대표적인날씨변수로는기온이있었으며, 이는기온이상승하면사람들의활동이증가됨으로인해사고발생이증가할수있기때문이다. 또한, 본연구에서채택한날씨변수중강수여부는비가내리지않는날에비해비가내리는날에는비응급환자들의내원이줄어들었기때문인것으로보인다. Spencer 등의연구에서와같이통상적으로응급환자들의응급의료센터방문에는날씨의영향력이미미할수있을것이나, 국내현실상응급의료센터를방문하는환자들은 (1) 실제응급상황으로인한진료를받기위해서, (2) 휴일또는야간에진료를받기위해서, (3) 진료의뢰서가없이외래진료를받기위해서응급의료센터를방문하고있으며, 황성완과이해종의연구를통해서본바와같이초진환자 4273 명중 2276(53.3%) 명이응급실을경유해서진료를보는것으로나타났다 ( 황성완과이해종, 2008). 즉, 응급의료센터를방문하는비응급환자들을고려한다면, 국내응급의료센터수요예측모델에있어서는날씨변수를고려할필요가있다. 위에서언급한것과같이국내응급의료센터일일내원환자수에대한수요예측모델에있어서고려되어야할지역적인특성에대해살펴본결과,

65 국외에서이루어진응급의료센터수요예측에관한연구들이국내의의료체계와사회문화적배경, 지역적요인등을고려하지못한점이있었으므로, 국내각개별단일병원의특성을반영한수요예측모델개발의필요성을본연구를통해확보할수있었다. 본연구에서는응급의료센터일일내원환자수를예측하기위하여 1) MA 모델, 2) 단변량계절형 ARIMA 모델, 3) 다변량계절형 ARIMA 모델, 세가지형태의예측모델을구축하였으며, 예측모델을비교해본결과 MA(2) 모델을제외한두개의 SARIMA 모델에서는단변량모델과다변량모델간의차이가있긴했지만추정된모델의잔차가신뢰한계내에포함되어있어두모델모두예측모델이잘적합되었음을확인할수있었다이러한결과는 MA 모델이 SARIMA 모델과달리시계열의자기상관이라는특성과계절성을반영하지못했기때문이다. 따라서, 국내응급의료센터선행연구중다중선형회귀분석법을이용한예측의제한점인 1) 연구기간을연장하거나병원수를늘리는것에따라서통계결과및회귀식이달라질수있다는점과 2) 단일병원연구의오류를줄이기위해 4 개의대학병원을대상으로하였지만, 특정시의모든응급환자를대상으로하지못하였으므로예측에한계를가진다는점을단일기관을대상으로시계열의구성요소가시간의흐름에따라매우빠르게변동하는경우에효과적이며어떤형태를가진시계열자료라도분석이가능한장점을가진 SARIMA 모델을이용하여수요예측모델을구축함으로써보완할수있었다. 또한, 예측모델의예측정확도 MAPE 값에있어서도 1) MA 모델, 2) 단변량계절형 ARIMA 모델, 3) 다변량계절형 ARIMA 모델순으로 12.9%, 7.78%, 7.37%

66 으로나타났으며, MA 모델외의두모델의 MAPE 가 10% 미만이어서정확하게예측되었음을확인할수있었다. 따라서, SARIMA 모델이시계열의자기상관이라는특성과계절성을고려햐여예측모델을구축하였기때문에예측정확도가 MA 모델에비해정확함을알수있었고, 단변량 SARIMA 모델과다변량 SARIMA 모델의예측정확도는예측기간 3 개월간의관측값과예측값의시계열도표를통해최종예측모델로선정한다변량 SARIMA 모델이더정확하게예측되었음을확인할수있었다. 이는다변량 SARIMA 모델이단변량 SARIMA 모델과달리예측모델의설명변수들이설명력을높여주었기때문이다. 본연구에서는예측모델의예측기간을 3 개월로정하였으나, 수요예측의 일반적인특징에따르면, 예측기간을단축하였을때예측오차가더작아진다는특징이있으므로, 추후연구진행시에는예측모델구축에있어예측기간을 1 개월이나 1 주로정하는등의예측기간에대한세심한고려도필요할것이다. 이처럼수요예측은아무리정교한기법을사용한다고해도오차가존재하기마련이며, 완벽하게실제값과일치할수없으므로하나의기법을이용한예측절대치를사용하기보다는대안적인방법들을병행하여활용함으로써예측정확도를높일수있을것이다. 본연구의제한점으로는다양한수요예측기법에대해고려하지못한점과지역적특성을반영한좀더다양한변수에대해고려하지못한점이있었으며, 추후연구에서는응급의료센터개별병원의날씨변수, 날짜변수, 추석여부, 계절외의다른요인에대한연구들도이루어져야할것이다

67 다른요인으로고려해볼수있는것으로는최근 SARS, 신종플루등과같은신종전염병의유행, 즉어느특정시점에어떤지역에서만발생되는특정질환의발생유무가있을수있으며, 이러한질환들로인해응급의료센터의수요는급격히증가할것이므로이에따른응급의료센터의수요예측을통한효율적인자원활용이필요할것이다. 또한, 본연구에서사용한예측방법인다변량계절형 ARIMA model 은시계열의구성요소가시간의흐름에따라매우빠르게변동하는경우에효과적이며어떤형태를가진시계열자료라도분석이가능한장점을가지고있으며, 설명변수를통해수요예측모델을잘설명할수있어새롭게발생되는요인들을잘반영한수요예측모델을개발할수있을것으로기대한다. 그리고, 최근에는국가응급환자진료정보망 (NEDIS: National Emergency Department Information System) 및병원정보시스템 (HIS : Hospital Information System), 전자의무기록 (EMR: Electronic Medical Record) 의사용의확대로인해환자정보를이용한수요예측모델개발에도촉진제가될것이라기대하며, 향후에는후향적연구가아닌전향적연구를통해수요예측모델에대한평가뿐아니라수요예측모델도입으로인한인력배분에대한평가나과밀화개선에대한평가, 의료진의반응을평가하는연구가필요할것이다

68 V. 결론 본연구는국내단일기관의응급의료센터의환자정보및지역의날씨정보, 휴일을포함한날짜정보를이용하여응급의료센터일일내원환자수예측모델을개발하고자 1) MA(2) 모델, 2) 단변량 SARIMA (1,0,1)(0,1,1) 7 모델, 3) 다변량 SARIMA(1,0,2)(0,1,1) 7 모델을구축한후 1) 잔차분석과 2) AIC, BIC 값을통해모델을비교하고, MAPE를통해예측정확도를평가한결과, MA 모델을제외한두 SARIMA 모델이잘적합되었음을확인할수있었다. 이는 MA(2) 모델이응급의료센터일일내원환자수의계절성과자기상관이라는특징을반영하지못했기때문이었으며, 단변량 SARIMA모델에비해다변량 SARIMA (1,0,2)(0,1,1) 7 모델의 AIC와 BIC 값이 , 로적어가장적합한최종모델로선정하였다. 그리고, 다변량 SARIMA 모델의설명변수로는추석여부, 계절별, 평균기온, 강수여부를채택하였고, 이중추석여부는국내응급의료센터의사회문화적특성을반영한변수였으며, 강수여부는국내응급의료센터를방문하는환자중비응급환자들에의한영향으로판단하였다. 다변량 SARIMA 모델의예측정확도는 MAPE가 7.4% 로 MAPE가 10% 미만이므로정확하게예측하였음을확인할수있었다. 그러므로, 본연구에서는다변량계절형 ARIMA모델이비교되었던 MA모델과단변량계절형ARIMA 모델에비해설명변수를반영하고있어예측모델설명력이높고, 응급의료센터일일내원환자수에대한예측이정확함을확인할수있었다

69 참고문헌 1. 김민정, 이대로, 김갑득 : 주말이응급의료센터에내원하는환자의예후에 미치는영향. 대한응급의학회지 16: , 노형진 : SPSS/Excel 에의한재미있는시계열분석. 도서출판효산, 서동우, 임경수, 문이상, 손유동, 조민우, 김원, 이상일 : 응급의료관리료제도 시행전후의응급환자내원양상의변화와효과. 대한응급의학회지 15: , 우주리 : 시계열모델을이용한방한일본인관광객수요예측에관한연구 ( 석사학위논문 ). 경희대학교일반대학원, 유인술, 허탁, 신상도, 박정배, 양혁준, 유연호 : 응급실과밀화해소방안마련 을위한기초연구. 보건복지부연구용역과제최종보고서. 충남대학교, 이덕기 : 예측방법의이해. SPSS 아카데미, 이은숙, 박금선 : 응급의료서비스에대한만족도분석. 대한응급의학회지 5: , 이장영, 민진홍, 박정수, 정성필, 박준석, 정시경, 양영모 : 요일및날씨특성 이응급센터내원환자수에미치는영향. 대한응급의학지 16: , 이종원 : 경제예측론. 도서출판해남,

70 10. 이주호, 박영환 : ARIMA 모델을이용한모든교통량예측에관한연구. 산업기술연구소 14: 81-96, 이충기 : 관광응용경제학. 일신사, 정구영, 임경수, 민용일, 이삼범, 김세경 : 응급환자의현황과응급의료의실태 - 응급의료센터를중심으로 -. 대한응급의학회지 8: , 정대유, 조수형, 김성중 : 광주전남지역응급실진료환경및현황에대한 보고. 대한응급의학회지 17: , 정동빈, 원태연 : SPSS 를활용한시계열자료와단순화분석 I. SPSS 아카데미, 정동빈, 원태연 : SPSS 를활용한시계열자료와단순화분석 II. SPSS 아카데미, 제상모, 최영환, 박유선, 조영순, 김승호 : 응급의학전문의는얼마나필요한가. 대한응급의학회지 16: , 최효선, 이경원 : 전미응급의료센터과밀화지수. 대한응급의학회지 17: , 황성완, 이해종 : 초진환자재방문예측모형개발. 대한의료정보학회지 14: ,

71 19. 허명회 : SPSS 시계열분석. SPSS, Arnold JL, Song HS, Chung JM: The recent development of emergency medicine in seoul Korea. Ann Emerg Med 32: , Asplin BR, Flottemesch TJ, Gordon BR: Developing models for patient flow and daily surge capacity research. Acad Emerg Med 13: , Batel H, Tencj J, Memillan S, Adams J, Mehler PS: Predicting patient visits to an urgent care clinic using calendar variables. Acad Emerg Med 8: 48-53, Derlet RW, Richards JR: Overcrowding in the nation s emergency departments: complex causes and disturbing effects. Ann Emerg Med 35: 63-68, Korea Meteorological Administration website Lisa M. Schweigler, Jeffrey S. Desmond, Melissa L. McCarthy, Kyle J. Bukowski, Edward L. Ionides, John G. Younger: Forecasting Models of Emergency Department Crowding. Acad Emerg Med 16: , Lewis CD; Industrial and Business Forecasting Methods, London. Butterworth, Schweiger L, Younger J, Ionides E, Desmond J: Autoregression models can reliably forecast emergency department occupancy levels 12 hours in advance. Acad Emerg Med 14(5 Suppl. 1):S82,

72 28. Schull MJ, Vermeulen M, Slaughter G, Morrison L, Daly P: Emergency department crowding and thrombolysis delays in acute myocardial infarction. Ann Emerg Med 44: , Spencer S. Jones, MStat, Alun Thomas, PhD, R. Scott Evans, PhD, Shari J. Welch, MD, Peter J. Haug, MD, Gregory L. Snow, PhD: Forecasting Daily Patient Volumes in the Emergency Department. Acad Emerg Med 15: , Spencer S. Jones, R. Scott Evans, Todd L. Allen, Alun Thomas, Peter J. Haug, Shari J. Welch, Gregory L. Snow: A multivariate time series approach to modeling and forecasting demand in the emergency department. Journal of Biomedical Informatics 42: , Sun BC, Adams J, Orav EJ, Rucker DW, Brennan TA, Burstin HR: Determinants of patient satisfaction and willingness to return with emergency care. Ann Emerg Med 35: , Tandberg D, Qualls C: Time series forecasts of emergency department patient volume, length of stay, and acuity. Ann Emerg Med 23: , Yan Sun, Bee Hoon Heng, Yian Tay Seow, Eillyne Seow: Forecasting daily attendances at an emergency department to aid resource planning. BMC Emerg Med 9: 1,

73 - ABSTRACT Time Series Forecasting Modeling for Demand of Emergency Department Jin Ok Sung Department of Medical Sciences The Graduate School, Ajou University (Supervised by Associate Professor Rae Woong Park) The purpose of this study is to develop and evaluate Models to forecast the number of patients who are admitted to an Emergency Department of a Korean hospital in a day as a solution to solve overcrowding issue of Emergency Department(ED). Forecasting the number of Daily ED patients is the basis of demand forecast of an Emergency Department and it will be able to distribute and utilize restricted resources of an Emergency Department effectively according to the demand forecast. The data used in the study was collected from the Hospital Information System(HIS) database. In order to develop a Forecasting Model, two-year data from 2007 to 2008 were used and for Model Validation, three-month data were processed for use. In establishing a Forecasting Model, Calendar variables (month, day of the week, season, quarter, holiday, and Chusuk) and Weather variables (average temperature, minimal

74 temperature, maximal temperature, temperature gap, rain(y,n), snow(y,n), air velocity, relative humidity, yellow dust) were used as variables. In the two-year database that were used for establishing a forecast model, the whole number of patients admitted to the Emergency Department was 169,375 and average number of daily patients was 232. Also, as for the transition of daily patients during the same period, they showed 7-day periodicity and seasonal trend. In particular, there was a sharp increase in the number of patients in Chusuk. However, as for New Year, there was relatively weak increase and hence New Year was excluded as a selective variable in this study. Since average and variance was stable, difference was not required, but primary seasonal difference was used to maintain the stability of data caused by the seasonal transition. As for the time series models to forecast the number of patients admitted in an Emergency Department in a day, 1) MA(Moving Average) model; 2) Univariate-Seasonal ARIMA(Seasonal Auto- Regressive Integrated Moving Average) model; and 3) Multivariate-Seasonal ARIMA(Seasonal Auto- Regressive Integrated Moving Average) model were set up. In order to test the goodness of fit, 1) residual analysis was done; 2) AIC(Akaike Information Criterion) and BIC(Bayesian Information Criterion) were compared ; and forecast accuracy was assessed for each model through MAPE(Mean Absolute Percentage Error). As a result to compare existing three forecast models, it was found that multivariate seasonal ARIMA model was the most suitable for forecasting the number of patients who are

75 admitted to an Emergency Department in a day(aic : , BIC : ). Since its MAPE(Mean absolute Percentage Error) was 7.4%, which was the smallest among the models, it was selected as the final Forecasting Model that is fit for the purpose of this study. Chusuk, season, average temperature, and rain were selected as explanatory variables. Unlike MA model and univariate seasonal ARIMA model, this study applied explanatory variables in multivariate seasonal ARIMA model. In that sense, it has high reliability and accuracy on forecasting the number of patients admitted in Emergency Department in a day. Key words : Forecasting Model, Time Series Model, Auto- Regressive Integrated Moving Average(ARIMA), Emergency Department Overcrowding