FORECASTING / 2 장. 지수평활법 14 Chaer 2. 지수평활법 시계열자료는시간에따라관측되며자료의수가많다는특징을갖는다. 시계열자료는시간에따른변화를 (rend, cycle, seasonaliy) 가지고있으므로과거관측치를이용하여미래값을예측할수있을것이다. 이를모형화하는방법이 ARMA 에서살펴보았다. ARMA 모형은시계열데이터의주기 (cycle) 을모형화하는것이다. 경향 (rend) 이나계절성 (seasonaliy) 이있는시계열자료의경우차분 (differencing) 을통하여경향이나계절성을제외하고 ARMA 모형 (3장에서다룸 ) 을적합시킨다. 이장에서는모형을설정하지않고 Time lo을보고과거의관측치만의평균을이용하여예측치를구하는방법인지수평활법에대해살펴보기로한다. 지수평활법의종류로는단순지수평활법 (simle exonenially smoohing), 이중지수평활법 (double exonenially smoohing), 삼중지수평활법 (rile exonenially smoohing), 윈터스계절지수평활법 (WINSTERS seasonal exonenially smoohing) 등이있다. 2.1 이동평균법 시계열데이터는주기나불규칙성을가지고있으므로과거의몇개관측치를평균하여전반적인추세를파악할수있는방법을이용하여예측치를구할수있는데이를이동평균법 (Moving average) 이라한다. 이동평균법은과거몇개의과거치의평균으로미래값을예측하는방법이다. 지수평활법과는달리이동평균법에서는과거치에적용되는가중치는동일하다. 예를들어 m-개이전관측치의이동평균은다음과같으므로가중치는 1/ m 이다. Y Y Y Yˆ + 1 +... + m+ 1 + 1 = MA, m = m 지수평활법은예측 (forecas) 이목적이라면이동평균법은계절조정을통한추세 (rend) 분석이목적이다. EXAMPLE 이동평균법예제 SASHELP.WORKERS 데이터에서전기공인력에대한 6개월이동평균과 3개월이동평균을구하고 Time lo 상에함께나타내보자.
FORECASTING / 2 장. 지수평활법 15 가중치가동일하다는단점이있어자주사용하지않아서인지 SAS에는이동평균법예측도구가없네. T.T. 평균을구하는 MEAN 함수와과거치를얻는 LAGn 함수 (n차이전값을얻는함수 ) 를이용하여이동평균법예측치를얻는다. SYMBOL 문장은그래프의점들을설정하는문장이다. I=inerolae로점들을연결하는방법을지정한다. 직선은 JOIN, 곡선은 SPLINE을이용하고연결하는선이필요없으면 NONE을사용하거나아무지정도하지않으면된다. V=value는점들의형태를지정한다 C=color 점들의색을, L=line은라인의단절개수를지정한다. 0(defaul) 이면실선, L의크기 는직선의끊어진수를의미하므로클수록많이끊어지게된다.
FORECASTING / 2 장. 지수평활법 16 이동평균법에의해얻은 ime lo을보면원래값에비해곡선에가까워짐을알수있다. 즉원데이터의이동추세를파악하는도움이된다. 3개월이동평균법은 3시점, 6개월이동평균법은 6시점 ime lo을뒤로밀면원데이터 ime lo 위치에있게된다. 3개월이동평균보다 6개월이동평균이훨씬완만하게변하고있음을알수있다. 일반적으로가장많이 사용하는것은 6 기간, 12 기간이다. 주가에대한이동평균? 일별효과가다를것이므로요일별로주별이동평균 (6 주, 12 주 ) 이어떨지 HOMEWORK #1-1 Due 3 월 24 일 ( 목 ) SASHELP.CITYWK 데이터에 MF3505( 홀수 ) 시계열데이터 (n=309, 주 ) 에대해 (_n_=251-300) 개데이터를이용하여 6 주이동평균, 12 주이동평균구하고 ime lo 에그리시오. HOMEWORK #1-2 Due 3 월 24 일 ( 목 ) 종목하나를선택하여 1 월요일 (20 주, 6 주이동평균 ), 2 금요일 (20 주, 6 주이동평균 ), 3 일 별 (4 주, 6 일이동평균 ) 을구하고각각 ime lo 을그려보자.
FORECASTING / 2 장. 지수평활법 17 2.2 지수평활법방법 동일한가중치를부여하는이동평균법과는달리다른가중치 ( 멀어질수록낮은가중치 ) 를사용하는것을지수평활법이라한다. 시계열데이터 { Y, = 1,2,..., T} 는주기, 경향, 계절성, 불규칙성이존재하는데경향과계절성이없다면다음과같이쓸수있다. Y = μ + e e 는불규칙성을나타내는것이다. 만약 μ 가시간에의존하지않는다면이에대한추 정치는회귀분석으로부터 yi y = 이다. 이는이동평균법과같이동일한가중치를준다는 T 것이다. 그러나 μ 가시간에따라변동한다면 y 는추정치로부적절하다. 최근관측치에는 큰가중치를부여하고이전으로감에따라가중치를줄여가는방법을평활법 (smoohing mehod) 이라한다. 2.2.1 단순지수평활법 Y+1 의예측치는식 1의 S 에의해추정된다. S = wy + ( 1 w) S 1 S 는 시점에서평활된값이고가중치 0 < w < 1, ---1 T yi i S0 = =1 이고일반적으로 T = 6 혹 T 은 T = n / 2 을사용한다. 식 1을시계열데이터 Y } 표시하면다음과같다. 이처럼가중 치가지수적으로감소하므로지수평활법이라한다. 단순지수평활법은경향이나계절성이 없을때사용한다. ˆ 2 Y S = wy + w(1 w) Y + w(1 w) Y... --- 2 { + 1 = 1 2 + HOMEWORK #1-3 Due 3 월 24 일 ( 목 ) 식 2 를증명하고가중치의합이 1 임을증명하시오. 이제가중치를결정하는문제를생각해보자. 일반적으로지수평활법은현재에가까운 관측치에높은가중치를주기위하여 0.05에서 0.3 사이의값을준다. ( 다른측면에서보면 μ 가시간에따른변화가느리기때문이다 ) 그럼어떤값이가장적절할까?
FORECASTING / 2 장. 지수평활법 18 어떤가중치가좋은가를판단하는기준은많으나가장많이사용되는것은다음과같다. 최소 MSE(Mean Square redicion Error): 2 ( Y S ) T 최소 MAPE(Mean Absolue Percenage Predicion Error): 1 ( Y S ) T Y 최소 MAE(Mean Absolue Predicion Error): Y S T EXAMPLE 이동평균법예제 SASHELP.USECON 데이터에는 1971 년 1 월부터 1991 년 12 월까지미국경제관련월별 데이터가저장되어있다. 위의데이터중 HSTOTAL(Housing Sarers, Toal Privae 개인주택 Morgage 시작한사람수 ) 시계열데이터에대한 Time lo을그려보자.
FORECASTING / 2 장. 지수평활법 19 METHOD는 Exonenial의약어인 EXPO를 TREND는지수평활법을설정하는옵션으로 1이면단순, 2= 이중, 3= 삼중을의미한다. Weigh는가중치를 OUT은예측치 S 을저장하는명령이고 OUTEST는모수추정치와적절한가중치선택을위한적합 (Goodness-of-fi) 통 계량을저장한다. OUTACTUAL 은원시계열데이터를 OUTFORECAST 는예측치를출력하 라는의미이다. 실제관측치가있는경우에는 Y (Acual) 와 S (Forecas) 를동시에출력한다. OUT1STEP에의해 1시점이후예측치를출력한다. 단순지수평활법은바로 1시점이후 ( Y ˆ +1 = S ) 만예측이가능하다. Y ˆ + k = S ( k > 0 ) 이다.
FORECASTING / 2 장. 지수평활법 20 만약가중치를 0.05 로주면 MSE, MAPE, MAE 모두가중치가 0.3인경우낮다. 가중치 0.4를넣었을경우 MSE, MAPE는낮으나 MAE가가중치 0.3에비해높다. 일반적으로가중치 0.05~0.3 범위내에서사용한다. 가중치를얻는것은다소번거로운작업이다. 그러므로아래 MACRO 문장을이용하여 MSE, MAPE, MAE를최소화하는가중치를얻을수있을것이다. 반드시 double quoaion을사용하시오. 2.2.2 이중지수평활법 시계열자료가경향 (rend) 이존재하는경우사용된다. 은단순지수평활법을두번연속적용하면된다. y = μ + β + e 이중지수평활법 [1] [1] = wy + ( 1 w) S 1 S, S [2] [1] [2] = ws + ( 1 w) S 1 [1] 즉 S 은 Y 의 smoohing 값이고예측치는다음과같이구한다. [2] S 는 [1] S 의 smoohing 값이다. 그리고 k 기간이후 Yˆ + k w = (2 + k) S 1 w [1] w (1 + k) S 1 w [2]
FORECASTING / 2 장. 지수평활법 21 EXAMPLE 이중지수평활법 데이터 Olymic.x 의 LONG_JUMP 기록에적절한지수평활법을적용해보자. 증가하는 추세 ( 경향 ) 가있으므로이중지수평활법을사용하면된다.
FORECASTING / 2 장. 지수평활법 22 가중치를 0.05 와 0.1, 0.2 를사용해보았다. 0.2 가적절해보인다. 위의오른쪽결과는가 중치 0.2 를사용하였을경우향후 5 개대회멀리뛰기기록에대한예측치이다. 삼중지수평활법은시계열데이터의추세 ( 경향 ) 가이차형식을가질때사용하는것으로 SAS 프로그램에서 rend=3을사용하는것을제외하고는이중지수평활법과동일하다. 그 러므로 [3] [2] [ 3] = ws + ( 1 w) S 1 S 이다. 2.2.3 WINTERS 방법시계열데이터가계절성을갖는경우사용하며 METHOD=WINTERS를사용하면된다. TREND나가중치는지수평활법과동일하다. smoohing의 S와구별하기위하여계절성성분으로 SE를사용하였다. 추세 ( 경향 ) 없는경우 WINTERS 평활법방정식은다음과같다. 예측치는 Y = μ + SE ( ) + e S = w( Y SE ) + (1 w) S 1, SE = δ ( Y S ) + (1 δ ) SE ˆ 이다. Y ( k) = S + SE + k 추세가있는경우 WINSTERS 평활법은다음과같다. Y = μ + β + SE ( ) + e S = 1 w( Y SE ) + (1 w)( S T 1) SE = δ ( Y S ) + (1 δ ) SE, T γ S S 1 ) + (1 γ ) T 1 = ( 예측치는 ˆ 이다. Y ( k) = S + kt + SE + k 시간의흐름에따라변동의폭이변화가없다면 addiive WINSTERS 방법을사용하는
FORECASTING / 2 장. 지수평활법 23 것이좋다. (METHOD=ADDWINTERS) 다음 ime lo 을보면추세가 2 차형식이므로 TREND=3 을사용하면된다. 그리고월별 자료에의한계절성이있으므로 SEANSONS=12 를사용하였다.
FORECASTING / 2 장. 지수평활법 24 HOMEWORK #2-1 Due 3월 31일 ( 목 ) SASHELP.CITYWK 데이터에 MF3505 시계열데이터에대해 ( 아래와같이일부 50개자료만이용하여 ) 1이중지수평활법 ( 적절한가중치 ) 을이용하여향후 6주예측치를구하시오. 2삼중지수평활법 ( 적절한가중치 ) 을이용하여향후 6주예측치를구하시오. 3151~156 관측치와이중, 삼중지수평활법의예측치를한그래프에나타내시오. 그리고비교해석하시오. HOMEWORK #2-2 Due 3월 31일 ( 목 ) 여러분이 HOMEWORK1-2에서선택한종목의이전관측치 ( 주가 ) 50개를얻고적절한지수평활법에의해향후 5일간주가를예측하시오.