8. ARIMA 모형 (ARIMA Procedure) 8.1 ARMA(AutoRegressive Moving-Average) 모형 ARIMA 모형의기본형태 계절형 ARIMA 모형 8.2 ARIMA modeling 과정 데이터 모형의식별 (identification) 모형의추정 (estimation) 모형의진단 (diagnostic checking) 예 아니오 최종모형선택 1 모형의식별 ⅰ) 정상시계열과비정상시계열의특징 뚜렷한추세가없다. 정상시계열 진폭이시간의흐름에따라일정하다. 비정상시계열평균수준이시간대에따라다르다. 추세를가진다. 계절성을가진다. 분산이변한다. ⅱ) 비정상시계열의정상화ㄱ. 분산이일정하지않은경우 : 분산안정화변환 ( 로그변환, 제곱근변환, Box-Cox 변환을시도 ) ㄴ. 추세를가지는경우결정적추세 -> 분해법또는추세항모형에포함확률적추세 (Dickey-Fuller의단위근검정 ) -> 차분ㄷ. 계절성을가지는경우결정적계절추세 -> 계절추세항모형에포함확률적계절추세 ( 계절형단위근검정 ) -> 계절차분
ⅲ) ARMA(p,q) 과정의 ACF 와 PACF 의이론적인특성 확률과정 ACF PACF AR(p) 지수적으로감소하거나소멸하는싸인함수형태시차 p 이후에는 0 으로의절단형태 MA(q) 시차 q이후에는 0으로의절단형태지수적으로감소하거나소멸하는싸인함수형태시차 (q-p) 이후에는지수적으로감소하거나소멸시차 (p-q) 이후에는지수적으로감소하거나소멸 ARMA(p,q) 하는사인함수형태하는싸인함수형태 => 시계열그림과 identity 문에의한결과로나오는 ACF, PACF의형태를보고차분의필요여부및차수를 d를결정하고 AR차수와 MA차수를결정하면된다. 2 모형의추정및진단모형의식별단계에서선택한분석방법에대한모수를추정해낸다. 추정방법으로는최대가능도법, 비조건부최소제곱법, 조건부최소제곱법등이있다. 모형의진단단계에서는모형의추정단계에서나온추정식을이용하여나온잔차의시계열그림이나독립성들을알아보는통계량을검토해평균이 0이고독립성을만족하는지확인한다. 잔차가이런성격을가지지않는경우모형의식별단계부터다시시작하며잔차가좋은성격을가지는경우이모형을최종모형으로선택한다. 3 예측 모형의적합단계에서선택된모형을이용하여 시차이후의예측값과예측구간등을구한다. 비정 상시계열의경우는예측구간이발산하여별의미가없다. 8.3 단위근검정 (unit root test) 확률적추세가존재하는경우차분에의해시계열자료를정상화한후분석을하여야하며결정적추세의경우는추세항을모형에포함시킨다. 따라서추세가확률적인지결정적인지여부를미리판단하여야한다. 시계열그림만으로는어떤추세인지알기어려우므로 Dickey and Fuller 에의한단위근검정을시행하여확인한다. 즉, AR 연산자 가 항을포함하고있을때 인지여부를판단하는문제를단위근검정이라고한다. 따라서단위근검정은 를검정하는문제이며검정통계량은확률변수의적분을필요로하므로기존에는 SAS 매크로를이용하였으나현버전에서는 ARIMA procedure에서검정이가능하다. 시계열자료의평균수준이 0인지또는결정적추세를가지는지여부에따라다른검정통계량을사용하므로시계열자료의특성을잘알고단위근검정결과를이용하여야한다. 8.4 ARIMA 절차 PROC ARIMA options ; IDENTIFY VAR = variable options; ESTIMATE options; FORECAST options; 1 PROC ARIMA 문 options DATA = SAS dsn : 분석에사용될데이터자료명을지정한다. OUT = SAS dsn : 예측값을기억시킬자료명을지정
2 IDENTIFY 문 ACF, PACF의형태를보고차분의차수 d, AR 차수 p와 MA 차수 q를결정 options VAR = variable( ) : 분석에사용될변수를지정해주며 d는차분을의미예 ) variable(1,12) => 라는차분연산자를사용하여차분하라. variable(1,1) => variable(2) => CLEAR : 과거에적합되었던모형들을모두취소 NLAG= number : ACF, PACF를구할 lag의수를지정. 디폴트 24 NOPRINT : IDENTIFY문에의한분석결과를출력하지않는다. CENTER : 분석에사용될시계열에서표본평균을뺀후분석하라는명령. 를분석에이용 STATIONARITY = (ADF=AR orders DLAG=s) : augmented Dickey-Fuller test = (PP = AR orders) : Phillips-Perron test 단위근검정을시행한다. trend=0 : ( 절편도 0이고선형추세도없는경우 ) trend=1 : ( 절편만존재하고선형추세도없는경우 ) trend=2 : ( 절편과선형추세가동시에존재하는경우 ) 3 ESTIMATE 문 모수를추정하고, 유의성여부와잔차분석을통한 diagnostic statistic 출력 : AIC, SBC 및적합성검정통계량 (goodness-of-fit test statistics) options PLOT : 잔차의 ACF, PACF, IACF를그려준다. METHOD : 모수의추정방법을지정. 디폴트 CLS METHOD = ML (Maximum Likelihood Estimation : 최우추정법 ) ULS (Unconditional Least Squares Estimation : 최소제곱법 ) CLS (Conditional Least Squares Estimation : 조건부최소제곱법 ) p = (lag, lag,..., lag) : 모형의 AR 부분의차수를지정예 ) p = (1,2,5) ==> : subset model p = ==> : saturated model q = (lag, lag,..., lag) : 모형의 MA 부분의차수를지정 NOPRINT : ESTIMATE 문에의한결과를출력하지말것을명령한다. NOINT : 변수들이차분되거나 CENTER 옵션이사용된경우주로사용되며절편을추정하지않음. 4 FORECAST 문최종선택된모형으로예측값과예측구간을구한다. options LEAD = n : 구하고자하는예측값의개수를지정. 디폴트 24 OUT = SAS dsn : 예측결과를출력하고자하는자료명지정 ID = variable : 시계열자료의관측주기를나타내는시간변수의변수명을적어준다. INTERVAL : 분석에사용될시계열자료의관측주기형태를지정
8.5 예제 프로그램 data female; input female@@; date=intnx('month', '1dec82'd, _n_); format date monyy.; cards; 216 223 229 235 227 236 232 234 237 238 244 270 278 277 274 285 262 243 241 238 259 267 272 269 262 276 297 327 341 323 317 322 337 330 329 342 349 346 345 354 345 354 343 355 362 366 367 348 355 362 373 370 375 395 405 408 399 402 403 402 398 408 427 427 433 442 397 416 425 424 434 434 432 440 469 486 495 506 514 529 528 529 521 537 537 544 557 556 561 569 578 589 570 563 566 571 574 569 596 610 627 655 670 663 664 668 664 667 ; run; 프로그램 /* 모형식별단계 : 시계열그림및시계열의정상성검정 */ proc gplot data=female; symbol i=join v=none; plot female*date; run; proc arima data=female; identify var=female nlag=15 stationarity=(adf=3 dlag=1); run; /* 모형의추정및진단 */ identify var=female(1) nlag=24; estimate plot; run; /* 예측 */ forecast lead=12 interval=month id=date out=female2; run; Augmented Dickey-Fuller Unit Root Tests Type Lags Rho Pr < Rho Tau Pr < Tau F Pr > F Zero Mean 0 1.0561 0.9187 3.82 0.9999 1 1.0322 0.9151 3.17 0.9996 2 1.0295 0.9146 3.27 0.9997 3 1.0215 0.9134 3.24 0.9997 Single Mean 0 0.5032 0.9763 0.55 0.9876 7.47 0.0010 1 0.4578 0.9748 0.44 0.9839 5.15 0.0341 2 0.5801 0.9785 0.60 0.9892 5.42 0.0258 3 0.6628 0.9808 0.71 0.9919 5.29 0.0300 Trend 0-9.6999 0.4389-2.13 0.5220 2.77 0.6233 1-13.6305 0.2160-2.49 0.3310 3.57 0.4639 2-13.0856 0.2397-2.35 0.4056 3.34 0.5100 3-13.6444 0.2150-2.31 0.4254 3.36 0.5053 [ 참고 ] 단위근검정결과를보면여러가지 Type에따른검정결과들이나오는데이중에서시계열자료가평균을가진다고판단되면 type이 Single Mean의결과를이용하고, 선형추세를가진다고판단되면 type이 Trend의결과를이용하면된다. 3가지경우모두단위근이존재함을보여주고있다. F검정은 type에따라다른데 type이 Trend인경우는귀무가설 의검정결과이다. 유의확률이커서귀무가설을기각하지못하므로이자료의추세는확률적추세라고판단한다. 프로그램 symbol1 i=join v=star; symbol3 i=none v=circle; proc gplot data=female2; plot female*date=1 forecast*date=3/legend overlay; run; plot residual*date=1 /vref=0; run;
8.6 Time Series Forecasting System 이용방법 (1) 시계열예측시스템실행하기 4.1 절참고 : 솔루션 -> 분석 -> 시계열예측시스템을선택한다. : 분석에이용할 Data Set 셋선택하기 Time Series Forecasting 창이나오면 Data Set : 옆에 Browse... 를클릭하여분석할데이터셋 을선택한다. 분석할 Data set 이둘어있는 Library 와 Data Set 을선택한다. 이전의예제의데이터를이용하기위해 time 라이브러리안의 Female Data Set 을선택하고 OK 를클릭한다. Data Set 에 TIME.FEMALE 이선택된것을볼수있으며 Date 변수가있으면자동으로 Time ID 에 지정된것을볼수있다. Date 변수가 Data Set 에포함되어있지않으면 create... 을클릭하여생성해 주면된다.
: ARIMA 모형적합하기. ARIMA 모형을분석하기위해 Develop Models 를클릭한다. Female Data Set 에서분석할변수 Female 을선택한뒤 OK 를클릭한다 Develop Models 대화상자가나타나고여기서모형을적합할수있다. 1 모형식별위의창에서 Time Series Viewer 를실행하여다음과같이시계열의형태와 ACF, PACF 및단위근검정을통해적당한차수의 ARMA모형을선택한다.
< 원자료의시계열그림 > < 원자료의 ACF 와 PACF 및 IACF> < 원자료에대한백색잡음검정과단위근검정및계절형단위근검정 > 백색잡음검정의유의확률은매우작고단위근검정의유의확률은 1 에가까우므로단위근이존재하여 차분이필요함을알수있다.
<1 차차분한자료에대한시계열그림 > <1 차차분한자료에대한 ACF, PACF, IACF> <1 차차분한자료의백색잡음검정과단위근검정및계절형단위근검정 > 1 차차분한자료의 ACF 와 PACF 는모든시차에서유의하지않으며백색잡음검정의유의확률은 0.05 보다커서 1 차차분후에는모형이잘적합된것으로판단된다.. 2 모형적합 ARMA 모형을적합시키기위해마우스의단추를클릭하면의모형적합을할수있는대화상자가나 타나고여기서 Fit ARIMA Model... 을선택한다.
모형의식별단계에서선택한 AR 차수 p=0, MA 차수 q=0, 차분횟수 d=1 을선택한후확인버튼을 클릭한다. 적합된모형이 Develop Models 창에 Root Mean Square Error 와함께나타난다. [ 참고 ] 동일 Data Set 에여러개의 ARIMA 모형을적합하여보려면동일한모형적합방법을각모형 별로반복해서실행하면, Develop Models 에실행시킨각각의모형이표시되며여러가지진단조 건들을통해최적의모형을선택하면된다. 3 추정된모형의결과물확인 현재적합시킨모형의결과를보기위해서는 합결과물들을확인할수있다. 를선택하고, vertical bar 버튼을하나씩눌러절
< 원자료와적합된모형의시계열그림 > 잔차그래프를보려면를선택한다. < 잔차그래프 > < 잔차의 ACF, PACF, IACF>
< 잔차의백색잡음검정및단위근검정 > < 적합한모형의모수의추정값 > < 여러가지진단통계량 > 적합된모형 :,
< 예측값에대한시계열그림 > < 예측값 >