시계열분석의개요 (the nature of time series analysis) 시계열자료 (time series data) 연도별 (annual), 분기별 (quarterly), 월별 (monthly), 일별 (daily) 또는시간별 (hourly) 등시간의경과 ( 흐름 ) 에따라순서대로 (ordered in time) 관측되는자료를시계열자료 (time series data) 라함. 예 : 국내총생산 (GDP), 물가지수, 판매량, 종합주가지수 (KOSPI), 강우량, 태양흑점수, 실험및관측자료등 시계열들은생성되는특성에따라연속적으로생성되는연속시계열 (continuous time series) 과이산적시점에서생성되는이산시계열 (discrete time series) 로구분할수있음. 그러나실제로는많은시계열들이연속적으로생성되고있지만일정한시차를두고관측되므로이산시계열의형태를지니는경우가많음.
시계열분석의개요 (the nature of time series analysis) 시계열자료 (time series data) 시계열자료 (time series data) 들은시간의경과에따라관측된자료이므로시간에영향을받음. 따라서시계열자료를분석할때관측시점들간의시차 (time lag) 가중요한역할을함. 예를들어오늘의주가가한달전, 일주일전의주가보다는어제의주가에더많은영향을받는것과마찬가지로가까운관측시점일수록관측자료들간에상관관계가커짐. 시계열은일반적으로시간 t 를하첨자로하여다음과같이표현됨. {Z t : t=1, 2, 3, } 또는 Z 1, Z 2, Z 3,
시계열분석의개요 (the nature of time series analysis) 시계열분석 (time series analysis) 의목적 과거시계열자료의패턴 (pattern) 이미래에도지속적으로유지된다는가정하에서현재까지수집된자료들을분석하여미래에대한예측 (forecast) 을하는것임. 예를들어과거부터수집되어온어떤상품의매출액자료를분석하면미래의매출액을예측할수있음. 시계열자료가생성된시스템또는확률과정을모형화하여시스템또는확률과정을이해하고제어 (control) 할수있도록하는것임. 예를들어원료가투입되어제품이생산되는시스템을모형화할수있으면제품의목표값 (target value) 을달성하기위해원료를어떻게입력시키는것이가장최적인지를알아낼수있음.
시계열의형태 (the components of time series) 시계열분석시우선선행되어야할일은시계열그림 (time series plot) 을그려보는것임. 시계열그림은시간의경과에따라시계열자료의값이변하는것을나타낸그림으로시간 t 를가로축, 시계열의관측값 Z t 를세로축에나타냄. 이그림을도출하는이유는시계열의특징을쉽게파악할수있어해당자료에적합한분석방법의선택에도움이되기때문임. 일반적으로시계열에서나타나는변동으로는우연적으로발생하는불규칙변동 (irregular variation) 과체계적변동 (systematic variation) 을들수있음.
시계열의형태 (the components of time series) 불규칙변동 (irregular variation 또는확률적변동 : random variation) 은시계열자료에서시간에따른규칙적인움직임과는달리어떤규칙성이없이예측이불가능하게우연적으로발생하는변동을말함. 예 : 전쟁, 홍수, 화재, 지진, 파업등 체계적변동에는장기간에걸쳐어떤추세로나타나는추세변동 (trend variation), 추세선을따라주기적으로오르고내림을반복하는순환변동 (cyclical variation), 그리고계절적요인이작용하여 1 년주기로나타나는계절변동 (seasonal variation) 이있음.
시계열의형태 (the components of time series) 불규칙변동 (irregular variation or random variation)
시계열의형태 (the components of time series) 추세변동 (trend variation) 추세변동이란시계열자료가갖는장기적인변화추세임. 추세란장기간에걸쳐지속적으로증가또는감소하거나또는일정한상태 (stationary) 를유지하려는성향을의미함. 그러므로시계열자료에서짧은기간동안에는추세변동을찾기어려움. 따라서추세변동은짧은기간동안급격하게변동하는것이아니라장기적인추세경향이나타나는것으로직선이나부드러운곡선의연장선으로표시함. 이러한추세는직선뿐만아니라곡선, S 자형태의추세를가질수도있음. 예 : 국내총생산 (GDP), 인구증가율, 기술변화등
시계열의형태 (the components of time series) 추세변동 (trend variation)
시계열의형태 (the components of time series) 순환변동 (cyclical variation) 추세변동은장기적으로 ( 일반적으로 1 년초과 ) 나타나는추세경향이지만, 순환변동은대체로 2~3 년정도의일정한기간을주기로순환적으로나타남. 즉, 1 년이내의주기로곡선을그리며추세변동에따라변동하는것을말함. 시간의경과 ( 흐름 ) 에따라상하로반복되는변동으로추세선을따라변화하는것이순환변동임. 경기변동곡선 (business cycle curve) 은불황과경기회복, 호황과경기후퇴로인하여수년을주기로나타나고있는데순환변동을나타내는좋은예임. 예 : 경기변동등
시계열의형태 (the components of time series) 순환변동 (cyclical variation)
시계열의형태 (the components of time series) 계절변동 (seasonal variation) 시계열자료에서보통계절적영향과사회적관습에따라 1 년주기로발생하는변동요인을계절변동이라하고, 보통계절에따라순환하며변동하는특성을지님. 예 : 설, 추석등명절요인등 그런데계절변동이순환변동과다른점은순환주기가짧다는점임. 그러나대부분의경제관련시계열들은추세와계절요인을동시에포함함. 이는경제성장에따라백화점의판매액, 해외여행자수, 청량음료, 전력소비량등과같이계절상품판매량자료들이시간의변화에따라증가하기때문임.
시계열의형태 (the components of time series) 계절변동 (seasonal variation)
시계열의형태 (the components of time series) 추세와계절변동요인을갖는시계열
시계열의형태 (the components of time series) 시간의변화에따라변동폭이커지는시계열
시계열의형태 (the components of time series) 두개의추세선을갖는시계열
시계열의형태 (the components of time series) 시계열자료가앞의변동요인으로구성된다면이들간의관계는가법모형 (additive model) 이나승법모형 (multiplicative model) 으로나타낼수있음. 가법모형은관심변수의관측값인 Z t 가앞의네가지시계열변동요인의합으로설명될수있다는가정하에만들어진모형을말함. Z t =T t +C t +S t +R t 여기서 T t 는추세변동, C t 는순환변동, S t 는계절변동, R t 는불규칙변동임. 이와같은가법모형은변동요인들간에서로독립이라고가정하며, 각변동요인들의값들은원래단위 (unit) 로표현함.
시계열의형태 (the components of time series) 승법모형은관심변수의관측값인 Z t 가앞의네가지시계열변동요인의곱으로설명될수있다는가정하에만들어진모형을말함. Z t =T t C t S t R t 여기서 T t 는추세변동, C t 는순환변동, S t 는계절변동, R t 는불규칙변동임. 이와같은승법모형은추세변동의값만원래단위 (unit) 로표현하고, 나머지변동요인들은백분율 (%) 또는비율로표현함.
이동평균법 (moving average method) 단순이동평균법 (simple moving average method) 비교적간단한시계열분석기법중의하나로최근몇개관측값의단순평균값을다음기간의예측값으로추정하는방법임. 이는시계열자료에서계절변동 (S t ) 과불규칙변동 (R t ) 을제거하여추세변동 (T t ) 과순환변동 (C t ) 만가진시계열자료로변환하는평활법 (smoothing method) 임. Z t +Z t-1 + +Z t-n+1 M t = n 최근 n 개의관측값 Z t, Z t-1,, Z t-n+1 을이용하여계산한이동평균임 ( 관측값에동일한가중치를부여함 ). M t 는다음시점 (t+1) 의예측값 (F t+1 ) 으로이용됨.
이동평균법 (moving average method) 단순이동평균법 (simple moving average method) 단순이동평균법은예측값을계산하기위해사용하는과거관측값의개수로그종류가구분됨. 예를들어 n=3 이면 3 기간단순이동평균 (M 3 ), n=5 이면 5 기간단순이동평균 (M 5 ), n=10 이면 10 기간단순이동평균 (M 10 ) 임. 이동평균법을이용할때해결해야하는가장중요한문제는이동평균을계산하기위해사용하는과거자료의적정개수, 즉 n 의개수를결정하는것임. 일반적으로시계열자료에뚜렷한추세가나타나있거나불규칙변동이심하지않은경우에는작은 n 의개수를사용하고, 그렇지않은경우에는 n 의개수를크게함.
이동평균법 (moving average method) 함수마법사를활용하여함수인수 AVERAGE 를선택함.
이동평균법 (moving average method) C5셀의수식을작은열십자 (+) 가나타나게한후드래그함.
이동평균법 (moving average method) D10셀의수식을작은열십자 (+) 가나타나게한후드래그함.
이동평균법 (moving average method) B4:D14영역을지정한후삽입-차트의꺾은선형을클릭함.
이동평균법 (moving average method) 이번에는 Excel 의분석도구를이용하여보다쉽게예측할수있음. 단순이동평균법을분석하기위하여 Excel 의데이터 - 데이터분석을선택함. 그리고통계데이터분석의팝업창에서 이동평균법 을선택하고확인을클릭함.
이동평균법 (moving average method)
이동평균법 (moving average method) 입력범위에는관측값을지정하고, 예를들어 3 기간이동평균이면구간에 3 을입력한후출력범위를지정함 ( 차트를출력하고자할경우차트출력을클릭함 ).
이동평균법 (moving average method)
이동평균법 (moving average method)
이동평균법 (moving average method) 단순이동평균법 (simple moving average method) 한편, 예측오차를비교하여가장정확한예측값을제공하도록 n 의개수를결정하기도함. 이때예측오차를비교하는기준으로평균절대편차 (mean absolute deviation : MAD) 와평균제곱오차 (mean squared error : MSE) 가사용됨. 평균절대편차 (MAD) 는 t 기의관측값과 t 기의값에대한예측값간차이 (=e t ) 절대값의평균을말함. S MAD= t=1 T e t S = t=1 T t기관측값-t기예측값 T T 여기서 e t 는예측오차로 (t기관측값-t기예측값 ) 임.
이동평균법 (moving average method) 단순이동평균법 (simple moving average method) 평균제곱오차 (MSE) 는 t 기의관측값과 t 기의예측값간차이제곱값의평균을말함. S MSE= t=1 T (e t ) 2 = T 여기서 T 는 ( 비교 ) 기간수임. S t=1 T (t 기관측값 -t 기예측값 ) 2 이상의예측오차인평균절대편차 (MAD) 와평균제곱오차 (MSE) 를비교하여예측오차가작은경우의 n 의개수로선택하는것이바람직함. T
이동평균법 (moving average method) 다음은각각의예측오차를구함.
이동평균법 (moving average method) 각각의예측오차를구하면다음과같음.
이동평균법 (moving average method) 6 주부터 10 주까지 3 주이동평균에의한예측오차의 MAD 와 MSE 가 5 주이동평균에의한 MAD 와 MSE 보다작음. 따라서 11 주차의매출액의예측값은 1,650 만원을사용하는것이타당함 ( 여기서 T=5 임 ). 각각의예측오차를기준으로 MAD 와 MSE 는다음과같음. 165
이동평균법 (moving average method) 단순이동평균법 (simple moving average method) 단순이동평균법의단점으로는다음과같음. 첫째, 이동평균법은 n 개의최근자료로다음기간의자료를예측하는계산방법상의특성때문에처음의일부기간에대한예측값을구할수없으며, 또한구간에포함되지않은이전의자료는무시됨. 둘째, 이동평균의기간 n 이짝수인경우이동평균법으로계산하면이동평균에대응하는시기에문제가발생함. 예를들어 4 기간이동평균을계산하면첫번째이동평균뿐만아니라다른이동평균도실제시계열기간 ( 연, 월, 일등 ) 의중간에위치하게됨.
이동평균법 (moving average method) 단순이동평균법 (simple moving average method) 따라서이동평균의기간이짝수인경우인접한두이동평균의평균을계산하여이동평균을중심화하는중심이동평균 (centered moving average) 을구함. Z M t *= t-0.5 *+Z t+0.5 * 2
이동평균법 (moving average method) n= 짝수인경우중심이동평균 (centered moving average)
이동평균법 (moving average method) n= 짝수인경우중심이동평균 (centered moving average)
이동평균법 (moving average method) 단순이동평균법 (simple moving average method) 셋째, 이동평균의계산에사용되는관측값들에대해동일한가중치를적용하여최근자료와오래된자료의중요성을동일시하고있다는점임. 즉, 불규칙변동요인이나타나는경우정확하게추출하기어려움.
이동평균법 (moving average method) 가중이동평균법 (weighted moving average method) 관측값에따라가중치를다르게한이동평균법임. 가중평균이동법의다른요소는단순이동평균법과동일하지만관측값마다다른가중치를적용한다는것이차이임. M t =w 1 Z t +w 2 Z t-1 + +w n Z t-n+1 여기서 w i 는해당기간가중치 (0<w i <1), S i=1 n w i =1 임. 최근 n 개의관측값 Z t, Z t-1,, Z t-n+1 에각각다른가중치를적용하여계산한이동평균임. M t 는다음시점 (t+1) 의예측값 (F t+1 ) 으로이용됨.
지수평활법 (exponential smoothing method) 과거의모든자료를사용하여평균을구하면서최근의자료에더높은가중치를부여하는방법임. 단기간에발생하는파동이나충격을완화하는평활법 (smoothing method) 임. F t =αz t-1 +(1-α)F t-1 여기서 F t 는 t 기간의예측값, F t-1 는 t-1 기간의예측값, Z t-1 는 t-1 기간의실제값, α 는지수평활계수 (0<α<1) 임. 지수평활법에서의지수평활계수 α 는가중치역할을하는것으로불규칙변동이큰자료에서는작은값의 α 를적용하고, 불규칙변동이작은자료에서는큰값의 α 를적용함. 일반적으로 α 는 0.05 와 0.3 사이의값을사용함.
지수평활법 (exponential smoothing method) 지수평활법은이동평균법과마찬가지로예측오차를비교하여예측오차가작은 α 값을선택하는것이바람직함. 지수평활법에서가중치는과거로갈수록지수적으로감소하게됨. 그러므로지수평활법에서는최근과거값 ( 현재시점의관측값 ) 에가장큰가중치를부여하므로일종의가중이동평균법이라할수있음.
지수평활법 (exponential smoothing method) 우선, 지수평활법을분석하기위하여여기서는 α=0.1 과 α=0.9 인경우의예측값을구해보기로함. 지수평활법을분석하기위하여 Excel 의데이터 - 데이터분석을선택함. 그리고통계데이터분석의팝업창에서 지수평활법 을선택하고확인을클릭함.
지수평활법 (exponential smoothing method) 입력범위에는관측값을지정하고, 감쇠인수에는 1-α 값을입력한후출력범위를지정함. Excel 에서 (1-α) 를 감쇠인수 라고부르며, 그값을입력해야함. 여기서주의해야할점은 α=0.1 을사용하고자하는경우에는감쇠인수를 0.9 를입력해야하고, α=0.9 를사용하고자하는경우에는감쇠인수를 0.1 을입력해야함.
지수평활법 (exponential smoothing method)
지수평활법 (exponential smoothing method) 입력범위에는관측값을지정하고, 감쇠인수에는 1-α 값을입력한후출력범위를지정함. Excel 에서 (1-α) 를 감쇠인수 라고부르며, 그값을입력해야함. 여기서주의해야할점은 α=0.1 을사용하고자하는경우에는감쇠인수를 0.9 를입력해야하고, α=0.9 를사용하고자하는경우에는감쇠인수를 0.1 을입력해야함.
지수평활법 (exponential smoothing method)
지수평활법 (exponential smoothing method) B4:D14영역을지정한후삽입-차트의꺾은선형을클릭함.
지수평활법 (exponential smoothing method) 다음은각각의예측오차를구함.
지수평활법 (exponential smoothing method) 각각의예측오차를구하면다음과같음.
지수평활법 (exponential smoothing method) 6 주부터 10 주까지 α=0.9 인경우지수평활법에의한예측오차의 MAD 와 MSE 가 α=0.1 인경우지수평활법에의한 MAD 와 MSE 보다작음. 따라서 11 주차의매출액의예측값은 1,690 만원을사용하는것이타당함 ( 여기서 T=5 임 ). 각각의예측오차를기준으로 MAD 와 MSE 는다음과같음. 169
지수평활법 (exponential smoothing method) 지수평활법은이동평균법과마찬가지로불규칙변동의영향을약화시키는효과가있지만, 단점으로는장기추세나계절변동이포함된시계열의예측에는적합하지않음. 앞에서의분석결과를보면장기증가추세를별도로고려하지않기때문에대부분의예측값들이매출액에못미치는것을알수있음.
계절변동을포함한시계열의예측 추세선의예측은자료의변동을하나의직선으로간단히나타내기때문에장기추세의예측에는장점을가지지만, 계절변동이나순환변동을포함하는시계열자료에는적절하지않음. 계절지수는 100 을기준으로특정계절과다른계절의변동을비교하여차이를판단하는척도임. 예를들어 1/4 분기의계절지수가 120 이라면 1/4 분기매출액이분기별평균매출액의 120% 가됨을의미함. 계절지수는평균계절지수가 1 이되도록조정하여얻어짐. 즉, 각분기평균의합이 4 가되도록조정되어야하기때문에계절지수는평균에조정요인을곱하여계산함.
계절변동을포함한시계열의예측 다음과같이분기수치를중심이동평균값으로나누어계절성수치 (S t ) 를구함. 계절성수치 (S t )= 계절지수를이용한시계열예측은다음과같은과정을거쳐수행함. 이동평균을이용하여계절지수를생성함. 계절성을제거한자료를이용하여추세선을추정함. 미래에대한추세예측값을구함. 4 S 1 +S 2 +S 3 +S 4 추세예측값에계절지수를곱하여최종예측값을구함.