Atmosphere. Korean Meteorological Society Vol. 28, No. 3 (2018) pp. 291303 https://doi.org/10.14191/atmos.2018.28.3.291 pissn 15983560 eissn 22883266 연구논문 (Article) 북서태평양태풍강도예측컨센서스기법 오유정 1) 문일주 1) * 이우정 2) 1) 제주대학교태풍연구센터 / 해양기상학협동과정, 2) 기상청국가태풍센터 ( 접수일 : 2018 년 6 월 2 일, 수정일 : 2018 년 7 월 13 일, 게재확정일 : 2018 년 7 월 31 일 ) A Consensus Technique for Tropical Cyclone Intensity Prediction over the Western North Pacific Youjung Oh 1), IlJu Moon 1) *, and Woojeong Lee 2) 1) Typhoon Research Center/Graduate School of Interdisciplinary Program in Marine Meteorology, Jeju National University, Jeju, Korea 2) National Typhoon Center, Korea Meteorological Administration, Jeju, Korea (Manuscript received 2 June 2018; revised 13 July 2018; accepted 31 July 2018) Abstract In this study, a new consensus technique for predicting tropical cyclone (TC) intensity in the western North Pacific was developed. The most important feature of the present consensus model is to select and combine the guidance numerical models with the best performance in the previous years based on various evaluation criteria and averaging methods. Specifically, the performance of the guidance models was evaluated using both the mean absolute error and the correlation coefficient for each forecast lead time, and the number of the numerical models used for the consensus model was not fixed. In averaging multiple models, both simple and weighted methods are used. These approaches are important because that the performance of the available guidance models differs according to forecast lead time and is changing every year. In particular, this study develops both a multiconsensus model (MCON), which constructs the best consensus models with the lowest error for each forecast lead time, and a single best consensus model (SCON) having the lowest 72hour cumulative mean error, through on training process. The evaluation results of the selected consensus models for the training and forecast periods reveal that the MCON and SCON outperform the individual bestperformance guidance models. In particular, the MCON showed the best overall performance, having advantages in the early stages of prediction. This study finally suggests that forecaster needs to use the latest evaluation results of the guidance models every year rather than rely on the wellknown accuracy of models for a long time to reduce prediction error. Key words: Tropical cyclone, intensity prediction, consensus, guidance models 1. 서론 해마다발생하는태풍에의한피해를저감하기위 *Corresponding Author: IlJu Moon, Typhoon Research Center/ Graduate School of Interdisciplinary Program in Marine Meteorology, Jeju National University, College of Ocean Science, Ara 1 Dong, Jeju 63243, Korea. Phone: +82647543412, Fax: +82647563483 Email: ijmoon@jejunu.ac.kr 해서는정확한태풍예측이필수적이다. 최근인공위성을포함한관측기술과수치모델의발달로태풍진로및강도예측정확도는많이향상되었다 (Knaff et al., 2003; DeMaria et al., 2005; Rogers et al., 2006). 특히, 수치모델기술의발달에는여러수치모델들의예측결과를통계적인방법을통해하나의예측으로조합하는컨센서스 (Consensus) 기법이큰기여를하였다 (Cangialosi and Franklin, 2013). 컨센서스기법은 291
292 북서태평양태풍강도예측컨센서스기법 개별수치모델들의무작위적인오차들을상쇄시키는효과가있어, 현재국내 외태풍예보기관에서태풍진로예측에널리사용되고있으며그효과도매우큰것으로보고되었다 (WMO, 2007; Elsberry, 2014; Jun et al., 2015). 컨센서스방법은단순평균방법과가중치평균방법으로나눌수있다. 단순평균방법은여러수치모델들의예측결과를같은가중치로단순하게평균하는방법이다. Goerss (2000) 는 1995~1996 년에대서양에서발생한태풍과 1997 년에북서태평양에발생했던태풍에대하여 3 개의전구모델또는 2 개의지역모델결과를단순평균한결과가개별수치모델들보다태풍예측의정확도를향상시킬수있음을보였다. 가중치평균방법은컨센서스에구성되어있는개별수치모델들의과거예측성능을고려하여모델별로다른가중치를주어평균하는방법을말한다. Kumar et al. (2003) 는가중치평균방법중에하나인슈퍼앙상블방법을이용하여 1998~2000 년태평양에서발생한태풍의진로및강도예측에적용하여개별수치모델들보다보다향상된예측결과를얻었다. Kotal and Bhowmilk (2011) 은 5 개의수치모델에대해예측시간별로다른가중치를적용하는컨센서스기법을 2008~ 2009 년북인도양에서발생한사이클론의진로예측에적용하여오차를획기적으로감소시켰다. Jun et al. (2015) 는 2013~2014 년북서태평양에서발생했던태풍에대해가중치평균방법을사용할경우단순평균방법보다진로예측오차를줄일수있음을보고하였다. 국내 외현업태풍예보기관에서도컨센서스방법을널리사용하고있다. 기상청국가태풍센터에서는태풍분석및예보시스템 (Typhoon Analysis and Prediction System, TAPS) 을통해선택과가중기법이적용된다중모델앙상블 (Optimal Multi Model Ensemble, OMME) 을수행하고있다 (KMA, 2017). 미국 NHC 에서는다양한수치모델들을이용하여단순평균방법, 보정하는방법, 슈퍼앙상블 (Florida State University Super Ensemble, FSSE) 방법등과같은다양한컨센서스기법을현업에활용하고있다. 동경지역특별기상센터 (Regional Specialized Meteorological CentersTokyo Typhoon Center, RSMCTokyo) 에서는가용모델중모델들을선택적으로사용하여단순평균하는컨센서스방법 (Selective consensus) 만을사용하고있다 (Ueno, 2014). 미국합동태풍경보센터 (Joint Typhoon Warning CenterHonolulu) 에서도보유하고있는수치모델중이용가능한모델이 2 개이상일때, 이수치모델들을이용하여단순평균하는방법인 CONW (JTWC track consensus) 를현업에활용하고있다. 지금까지컨센서스방법을적용한연구들은대부분진로예측에집중되어있고강도예측에적용된경우는 Fig. 1. Changes in annualmean errors (MAEs) of GFS and for TC maximum wind speed (MWS) predicted at the lead time of 48 h during 2008~2015. 드물다. 또한강도예측에사용된경우에도수치모델의예측성능을고려하지않고예측시점에서가용되는모든수치모델들을사용하거나가중치평균방법에서이미찾은고정된수치모델들의가중치를매년보정없이계속사용하고있다. 그러나최근해마다달라지고있는개별수치모델의성능변화를고려하면고정된가중치를사용하거나선별없이이용가능한개별모델을모두사용하는방법은컨센서스기법의성능을저하시킬수있다. 예를들면, 미국의전구모델인 NCEP GFS (Global Forecast System) 와 (Navy Global Environmental Model) 의경우 48 시간예측성능을 2008 년부터 2015 년까지연도별로비교한결과 (Fig. 1) 를보면, 얼마나최근수치모델들이매년업그레이드를통해예측성능이달라지고있는지를단적으로보여준다. 가중치평균방법을사용하는기존대부분의연구에서는모든예측시간 (Lead time) 에대해같은가중치를사용하고있다. 그러나모델별로예측시간에따라성능차이가뚜렷한경우가많다. 예를들면, 일본전지구모델 (JGSM, JMA Operational Global Spectral Model) 과미해군전지구모델 의경우를비교해보면 (Fig. 2), 예측시간이길어질수록두모델의예측성능이반대의경향을보인다. 즉, JGSM 의경우대부분의수치모델과유사하게예측시간이길어질수록오차가커지는반면, 는예측초반의오차가비교적높았지만예측시간이길어질수록오차가줄어드는특징을보인다. 이러한결과는예측시간별 한국기상학회대기제 28 권 3 호 (2018)
오유정 문일주 이우정 293 Fig. 2. Comparison of MAEs between JGSM and, according to the lead time, for TC maximum wind speed (MWS) predicted during 2008~2014. 특징을고려한컨센서스모델의필요성을시사한다. 본연구에서는북서태평양의태풍강도예측을위한다양한컨센서스기법을적용한최적의앙상블예측방법을개발하는데목적이있다. 특히, 본연구에서는최근수치모델들의성능이해마다달라지고있는점을고려하여, 수치모델들의과거 1 년예측성능평가를통해컨센서스모델에사용할모델들을선택하고가중치를구하여이듬해에강도예측에사용하는새 로운방법을적용하여그성능을조사하고자한다. 이방법은컨센서스구성에있어가용한수치모델들을모두사용하지않고, 이전해의개별모델성능을고려한모델들의여러조합실험을통해컨센서스에사용될모델의최적개수뿐아니라가중치를해마다그리고예측시간별로달리사용한다는점에서기존컨센서스기법과차별화된다. 또한개별모델의성능을평가하는방법에서도기존연구에서는대부분절대적인오차만을그기준으로사용하고있지만본연구에서는수치모델들중에오차가크지만태풍강도변화경향성을잘모의하는수치모델들을선택할수있도록상관도 (correlation coefficient) 분석결과를추가적으로기준에사용하였다. 제 2 장에서는북서태평양태풍의강도예측을위해개발된컨센서스모델에사용된수치모델과최적경로자료를소개하고, 제 3 장에서는본연구에서개발한태풍강도컨센서스방법에대해설명한다. 제 4 장에서는개발된태풍강도컨센서스방법을이용하여태풍강도예측성능을검증한다. 마지막제 5 장에서는본연구의요약및결론을제시한다. 2. 자료 현재기상청국가태풍센터에서는태풍현업예보를위해국내 외에서입전되는다양한수치모델들을활용하고있다. 본연구에서는이중 2008 년부터 2015 년까지예보에활용가능했던총 11 개의수치모델들을분석에이용하였다. 사용된수치모델들은 5 개의전구모델, 2 개의앙상블모델, 4 개의지역모델로구성되어있다. 각수치모델들의설명, 자료기간, 공간해상 Table 1. Description and information on guidance numerical models used for present study. No. Model name Description Data period Spatial resolution Forecast interval 01 GDAPS Global Data Assimilation and Prediction System (Unified Model) 2010~2015 25 km 6 h 02 RDAPS Regional Data Assimilation and Prediction System (Unified Model) 2011~2015 12 km 3 h 03 TWRF WRFbased Typhoon Model 2013~2014 15 km 6 h 04 KWRF WRFbased KMA Operational Regional Model 2011~2014 10 km 6 h 05 JGSM JMA Operational Global Spectral Model 2008~2015 20 km 6 h 06 TEPS JMA Operational Typhoon Ensemble Prediction System 2009~2015 60 km 6 h 07 Navy Global Environmental Model 2012~2015 37 km (NOGAPS) (Navy Operational Global Prediction System) (2008~2011) (55 km) 6h 08 GFS NCEP Global Forecast System 2008~2015 1 o 6h 09 ECMWF European Center for Mediumrange Weather Forecasting 2008~2015 0.5 o 24 h 10 KEPS KMA Ensemble Prediction System (24 members) 2012~2015 40 km 6 h 11 HWRF NCEP EMC WRFbased Regional Model 2012~2015 27/9/3 km 6 h Atmosphere, Vol. 28, No. 3. (2018)
294 북서태평양태풍강도예측컨센서스기법 도, 자료생산주기는 Table 1 에기술되었다. 여기서한가지언급할사항은 11 개의수치모델들이연구기간에모두사용된것이아니다라는점이다. 예를들면, KEPS 와 HWRF 는 2012~2015 년기간만그리고 TWRF 는 2013~2014 년에만사용되었다. 반면, JGSM,, GFS, 그리고 ECMWF 는 2008 년부터 2015 년까지전기간사용되었다. 이렇게매년가용한수치모델들이달라지기때문에본연구에서는매년가용한수치모델들을달리사용하는컨센서스기법을개발하였다. 사용된모델은가용기간뿐아니라예측간격에있어서도차이가있다. 예를들면, 대부분의모델은 6 시간간격으로예측자료를제공하지만 RDAPS 는 3 시간그리고 ECMWF 는 24 시간간격으로자료를제공한다. 본연구에서는이러한모델별예측간격차이를고려하여, 12 시간후부터 72 시간까지 12 시간간격으로통일된컨센서스모델을개발하였다. 이를위해 3 시간또는 6 시간간격의수치모델의결과들은 12 시간간격의자료만을뽑아사용하였고, ECMWF 의경우에는 24 시간간격의자료를 12 시간으로내삽하여사용하였다. 연구에사용된 11 개의수치모델및개발된컨센서스모델들의성능평가를위한기준자료는 RSMCTokyo 에서제공하는최적경로자료를사용하였다. RSMC Tokyo 최적경로자료는 6 시간간격의 10 분평균최대풍속, 중심기압, 그리고태풍중심위치자료를제공한다. 3. 컨센서스모델구성 가중치평균방법에서는다중선형회귀모델을이용 하여수치모델별가중치가계산된다. 다중선형회귀모델은독립변수가 2 개이상인경우에대해식 (1) 를이용하여수치모델의예측값을독립변수로간주하여최종예측값 ( 종속변수 ) 을계산하는방법이다. y = a 0 + a i x i n x i i=1 y = 1 n n i=1 (1) (2) 여기서 y 는예측하고자하는값 ( 즉, 태풍강도 ), a 0 는회귀상수, n 은사용한수치모델의수 ( 단, 2 n), x 는수치모델의예측값, a 는모델들의가중치를의미한다. 단순평균방법은식 (2) 와같이표현되며가용되는수치모델들의예측값을같은가중치를가지고단순평균된다. 이렇게구성된컨센서스모델들은반복적으로수행하는교차타당성검사를통해예측시간별로따로검증을하고이중가장낮은오차를보인모델이선정된다. 다중선형회귀모델을구성할때본연구에서는예측인자들간의다중공선성을피하기위해분산팽창계수 (Variance Inflation Factor, VIF) 를사용하여예측인자간상관도가높은수치모델은제외하고분석에사용하였다. VIF 는다중선형회귀모델을이용한많은선행연구들에서다중공선성을피하기위한방법으로널리사용되어왔다 (Davis et al., 1986; Villarini et al., 2011; Kim et al., 2012). 여기에서 VIF 는예측인자들사이의독립성을나타내는지수로 1 에가까울수록예측인자간의상관관계가적다는것을나타낸다. 본연구에서는 VIF 값이 10.5 를넘는경우그수치모델은선형회귀모델구성에서제외하였다. 컨 Fig. 3. Flow chart explaining training and forecasting processes for MCON and SCON. 한국기상학회대기제 28 권 3 호 (2018)
오유정 문일주 이우정 295 Table 2. Mean absolute errors (MAE) for TC MWS at lead times of 12 to 72 hours (12hour interval) obtained from training process in 2008. Bold numbers with asterisk represent the lowest errors (i.e., selected method) for each forecast lead time. Simple average (AVE) and weighted average (WEI) methods are evaluated based on both MAE and correlation coefficient (R) depending the number of models used. The last two rows represent the selected method and number of model used (in bracket) for MCON and SCON. Number of model 2 3 4 Method MAE R MAE R MAE MCON SCON 12 h 24 h 36 h 48 h 60 h 72 h Total AVE 4.96* 6.06* 7.21* 7.90* 08.11* 7.47* 5.14* WEI 4.22* 5.73* 6.89* 7.75* 07.88* 7.15* 4.84* AVE 4.96* 6.06* 7.21* 7.90* 10.76* 9.22* 5.14* WEI 4.22* 5.73* 6.89* 7.75* 07.98* 6.72* 4.84* AVE 6.80* 7.38* 8.05* 8.05* 08.34* 7.74* 5.66* WEI 4.29* 5.75* 6.76* 7.56* 07.74* 6.90* 4.60* AVE 6.73* 7.46* 8.13* 8.39* 08.51* 7.74* 5.71* WEI 4.33* 5.82* 6.84* 7.56* 07.73* 6.90* 4.62* AVE 7.84* 8.58* 8.93* 8.65* 08.83* 8.29* 6.30* WEI 4.36* 5.86* 6.84* 7.66* 07.78* 7.07* 4.61* AVE 7.84* 8.58* 8.93* 8.65* 08.83* 8.29* 6.30* R WEI 4.36* 5.86* 6.84* 7.66* 07.78* 7.07* 4.61* MCON MAEWEI(2) MAEWEI(2) MAEWEI(3) MAEWEI(3) RWEI(3) RWEI(2) SCON MAEWEI(3) 센서스모델구성은예측시간별로가장낮은오차를보인가이던스모델들을각각조합하여예측시간별컨센서스모델을따로개발하는 Multiconsensus model (MCON) 방법과 72 시간누적평균오차가가장낮았던단일컨센서스모델을선정하는방법인 Singleconsensus model (SCON) 방법을함께사용하였다. 컨센서스모델은훈련기간 (Training period) 과예측기간 (Forecasting period) 으로나누어매해평가된다 (Fig. 3). 즉, 개별수치모델들의과거 1 년 ( 훈련기간 ) 에대해다양한컨센서스모델을구성하고, 이중에가장좋은성능을보인컨센서스모델을다음해 ( 예측기간 ) 에적용하여그성능을평가하는방법을채택한다. 훈련기간의컨센서스모델들은모델개수 (2 개이상부터 ), 평균방법 ( 단순또는가중치방법 ), 그리고순위결정방법 ( 절대평균오차또는상관도 ) 에따른가능한모든조합으로부터구성되고총 5 개의예측시간 (12~ 72 h, 12h 간격 ) 에대해그성능이평가된다. Table 2 는 2008 년에가용한수치모델들을이용하여다양한방법으로구성한컨센서스모델의성능평가결과를나타낸것이다. 2008 년에는가용한수치모델이 4 개밖에없어 2 개부터 4 개까지모델개수를변화시키며성능을평가하였다. 사용된모델의우선순위 는절대평균오차 (Mean Absolute Errors, MAE) 와상관도 (Correlations, R) 에따라각각평가되었고, 모델의평균방법도단순평균방법 (AVE) 과가중치평균방법 (WEI) 에대해따로평가되었다. 이러한방법으로만들어진컨센서스모델은 순위결정방법 앙상블평균방법 ( 사용수치모델수 ) 의형식으로표시되었다. 예를들면, MAEWEI(3) 는 MAE 순위결정방법에따라상위 3 개의수치모델을가중치평균하여구성한컨센서스모델을의미한다. Table 2 에서별표와함께진하게표시된부분은각예측시간에서가장낮은오차를보인컨센서스모델을나타내며이모델은최종적으로다음해에그예측기간에해당되는태풍강도를예측하는모델로사용된다. 2008 년의경우, MCON 은 MAE 기준의 2 개또는 3 개상위모델을가중평균하는모델들이많이선택되었고, SCON 는 MAE 기준가중치방법으로 3 개의상위모델을사용하는 MAEWEI(3) 방법이선택되었다. 같은방법으로 2008 년부터 2014 년까지매년수치모델들의훈련기간예측성능을바탕으로선택된 M CON 과 SCON 의컨센서스모델들을분석해보면 (Table 3), 가중치평균방법 (WEI) 이 49 개중 39 개 ( 약 80%) 가선택되어컨센서스기법을구성할때단순평 Atmosphere, Vol. 28, No. 3. (2018)
296 북서태평양태풍강도예측컨센서스기법 Table 3. List of the consensus models (MCON and SCON) that constructed from training process of every year for 2008~ 2014. The numbers in the bracket for lead time and consensus models represent the average of sample numbers at each forecast time and the number of guidance model used, respectively. Training period MCON SCON 12 h (97) 24 h (83) 36 h (71) 48 h (62) 60 h (51) 72 h (44) Total (382) 2008 MAEWEI(2) MAEWEI(2) MAEWEI(3) MAEWEI(3) RWEI(3) RWEI(2) MAEWEI(3) 2009 RWEI(3) RWEI(5) RWEI(5) RWEI(5) MAEWEI(5) MAEWEI(5) MAEWEI(5) 2010 RWEI(4) RWEI(4) RWEI(3) MAEWEI(6) RWEI(2) RWEI(3) MAEWEI(5) 2011 MAEAVE(3) MAEAVE(4) RWEI(5) RWEI(5) MAEWEI(6) MAEWEI(6) MAEWEI(7) 2012 RWEI(3) RWEI(7) RWEI(8) MAEWEI(7) RWEI(3) RWEI(2) RWEI(9) 2013 MAEAVE(7) RAVE(5) RAVE(6) MAEAVE(8) RAVE(5) RAVE(4) MAEAVE(8) 2014 RWEI(4) RWEI(2) RWEI(3) RWEI(2) MAEWEI(6) MAEAVE(8) RWEI(3) Fig. 4. Comparison of MAEs among the best model, simpleaverage (Simpleavg.), MCON, and SCOM, according to the lead time, for TC MWS obtained from training process during 2008~2014. 균하는방법보다가중치평균방법이더유용하게사용됨을알수있다. 이것은태풍진로에대한 Jun et al. (2015) 의결과와일치한다. 순위결정방법에서는상관도 (R) 를기준으로사용하는경우 (28 개, 57%) 가오 한국기상학회대기제 28 권 3 호 (2018)
오유정 문일주 이우정 297 Fig. 5. Scatter plots of MWS between all model predictions and RSMCTokyo best track for all lead times up to 72 hours (12hour interval) during 2012~2015: (a) GDAPS, (b) RDAPS, (c) JGSM, (d) TEPS, (e), (f) GFS, (g) ECMWF, (h) KEPS, (i) HWRF, (j) MCON, and (k) SCON. The correlation coefficients (R), MAE, and bias are denoted with the rank (number in bracket) based on the model performance in terms of R, MAE, and bias, respectively. 차(MAE)를 사용하는 경우(19개)보다 더 많았다. 훈련기간에 구성 된 MCON과 SCON의 예측성능 을 확인하기 위해 매해 가장 낮은 오차를 보인 개별 수치모델(Best model)과 예측결과를 단순 평균한 모 델(Simpleavg.)의 오차를 비교하였다(Fig. 4). 그 결과, 모든 연도와 예측시간에서 MCON과 SCON이 Best model 보다 더 좋은 예측성능을 보여주었다. 또한 일 부 예측시간(2013년 72 h, 2014년 60 h)을 제외한 대 부분의 평가에서 MCON과 SCON이 단순하게 평균 한 모델보다 더 낮은 오차를 보였다. MCON과 SCON는 대부분 비슷한 성능을 보였지만 특정 시기(특 히, 2011년 72 h, 2013년 72 h, 2014년 12 h, 2011년 모든 시간)에는 MCON이 SCON에 비해 좋은 성능 을 보였다. Atmosphere, Vol. 28, No. 3. (2018)
298 북서태평양태풍강도예측컨센서스기법 Fig. 6. Same as in Fig. 4, but for forecast results during 2009~2015. 4. 예측성능검증 제 3 장에서구성된두가지컨센서스기법 (MCON 과 SCON) 을사용하여 2009~2015 년의훈련기간동안매년다음해의강도를예측하였다. Figure 5 는훈련기간중비교적가이던스모델이많아진최근 4 년 (2012~2015 년 ) 에대해개별수치모델 (2015 년에중단된 TWRF 와 KWRF 를제외한 9 개모델 ) 과두컨센서스기법의예측결과를 RSMCTokyo 의자료와비교한그림이다. 여기에사용된자료는 12 h 부터 72 h 까지 12 시간간격의모든예측자료이다. 성능평가는상관도 (R), 절대평균오차 (MAE), 그리고편차 (Bias) 를사용하여이루어졌으며, 이결과는그림의우측하단에각평가항목의순위 ( 괄호안의표시 ) 와함께각각나타내었다. 4 년간의분석결과에서세평가항목에대해가장좋은예측성능을보인것은 MCON 이었다. MCON 은 MAE 가가장낮았고상관도와 Bias 평가에서모두 2 위를차지하였다 (Fig. 5). MCON 은상관도에서 2 위였지만 0.86 으로 1 위인 SCON 과소수셋째자리에서근소한차이를보였다. SCON 또한 MAE 에서 2 위를차지하였지만 MCON 과큰차이는없었다. 개별수치모델중에서 HWRF 는상관도, GFS 는 MAE 평가에서컨센서스모델들다음으로좋은성능을보였다. TEPS 의경우 Bias 평가에서 0.16 으로 1 위를하였지만상관도와절대평균평가에서 3 위이하의순위를보였다. Bias 는 MCON ( 0.27 m s 1 ) 이 SCON ( 0.42 m s 1 ) 과유의한차이를보이며 TEPS 다음으로가장낮은값을나타내었다. 총훈련기간에대해예측시간별로 MCON 과 SCON 한국기상학회대기제 28 권 3 호 (2018)
오유정 문일주 이우정 299 Table 4. Comparisons of MAE between the consensus models (MCON, SCON) and GFS, according to the forecast lead time, for TC MWS predicted from 2009 to 2015. Lead time MCON SCON GFS 12 4.37 4.78 6.64 24 4.70 5.03 7.02 36 5.68 5.14 7.25 48 5.69 5.64 7.46 60 7.05 5.85 7.78 72 6.86 6.44 8.06 Total 5.45 5.35 7.26 의오차를매해가장낮은오차를보였던개별모델 ( 그림에서 Best model 로표시 ) 과비교한결과에서도 (Fig. 6), 앞서 Fig. 5 의총누적오차분석결과와유사하게대부분의경우개발된컨센서스기법들의예측오차가 Best model 보다낮았다. 특히, 2009 년, 2010 년, 그리고 2015 년 72 h 컨센서스모델의예측결과에서가장많은성능개선이보였다. MCON 과 SCON 의오차는대부분의연도와예측시간에서큰차이가없었지만, 최근 3 년 (2013~2015) 의예측결과 ( 특히, 60 h 이후 ) 에서 MCON 의오차가 SCON 에비해유의하게 낮게나타났다. 이렇게일부시기에 MCON 의예측정확도가 SCON 보다높게나타난것은앞서언급한바와같이이시기에모델별성능이예측시간별로달라졌을가능성을암시한다. Figure 6h 와 Table 4 는예측시간별로 MCON 과 SCON 의총 4 년 (2009~2015 년 ) 의평균오차를동기간예측을수행한수치모델중평균적으로가장예측성능이좋았던 GFS 와비교한것이다. 이기간에대해개발된두컨센서스기법의예측오차는 Best model 인 GFS 보다평균적으로낮았다. 예측시간별로보면, MCON 은예측초반에좋은성능을보였고, SCON 은예측시간이길어질수록더좋은성능을보였다. 총누적평가 (Total) 에서는 SCON 이가장낮은오차를보였다. 각예측시간별로어떠한개별모델이선택되었는지그리고어떠한컨센서스기법이가장좋은성능을보였는지를확인하기연구기간중가장최근 (2015 년 ) 의강도예측에사용된수치모델의목록및컨센서스기법을조사하였다 (Table 5). 여기서컨센서스모델에사용된개별모델의회귀상수는괄호안에표시되었다. 예를들면, 12 h 예측모델에서는 TEPS, JGSM, GFS, 가상관도기준에의해선택되었고, 이모델중에 (0.40) 가가장큰회귀상수 ( 즉높은가중치 ) 를가진것을알수있다. 72 h 의경우는 8 Table 5. List of the consensus models (MCON and SCON) that constructed from training process for 2014 and their guidance models selected for each lead time. Numbers in the bracket for guidance models and consensus models represent the regression coefficients and the number of guidance model used, respectively. MCON SCON 12h 24h 36h 48h 60h 72h Total Selected model RWEI(4) RWEI(2) RWEI(3) RWEI(2) MAEWEI(6) MAEAVE(8) RWEI(3) 1 2 3 4 TEPS (0.24) JGSM (0.38) GFS (0.05) (0.40) (0.36) GFS (0.51) (1.38) RDAPS ( 0.31) ECMWF ( 0.18) (0.58) GFS (0.33) 5 6 (0.78) GFS (0.21) RDAPS ( 0.64) TEPS ( 0.00) HWRF (0.29) JGSM (0.01) 7 8 GFS RDAPS TEPS HWRF JGSM GDAPS KEPS GFS (0.35) (0.33) TEPS (0.23) Atmosphere, Vol. 28, No. 3. (2018)
300 북서태평양태풍강도예측컨센서스기법 Fig. 7. Comparisons of individual intensity (MWS) predictions from MCON, SCON, and best guidance model with RSMC Tokyo best track for Typhoon (a) Mirinae (0921), (b) Nida (0922), and (c) Roke (1115) along their tracks (d). 개모델이 MAE 기준으로선택되어같은가중치를가지고단순평균하는방법이채택되었다. SCON 의경우는전예측시간에대해 GFS,, TEPS 를가중치평균하는방법이선택되었다. 선택된개별모델을분석해보면, GFS 와 가 36 h 예측시간을제외한전예측시간에모두선택되었고, TEPS 가그다음으로많이 (SCON 포함총 4 번 ) 선택된것을알수있다. JGSM 은초기값의정확도가높아 12 h 예측에선택되었다. 개발된두컨센서스모델 (MCON 과 SCON) 과 Best model 의성능은실제태풍에대한예측사례를통해잘비교할수있다. Figure 7 은 Best model 이태풍강도를과대또는과소모의한세태풍, Mirinae (0921), Nida (0922), Roke (1115) 에대해연속적인 72 시간강도예측결과를관측값 ( 검정 ) 및 MCON( 빨강 ) 과 SCON ( 파랑 ) 의결과와비교하고있다. 여기서 Mirinae (0921) 와 Nida (0922) 는태풍이발생한후약 2 일이내에급속하게생애최대강도에도달한사례로대부분의개별수치모델들이이러한급발달을예측하지못하였다. 가이던스모델중에그래도이두사례를가장잘예측한 Best model 은 JGSM 이었다. 그러나 JGSM 은태풍이최대강도에도달하기전에는실제강도보다약하게예측하였고최대강도에도달한후에는실제보다더강하게모의하는특징을보였다. 태풍 Mirinae 는외해저위도 ( 위도 14.9 o N, 경도 143.7 o E) 에서발생한후필리핀을통과하며소멸할때까지계속서진한 한국기상학회대기제 28 권 3 호 (2018)
사례이다. JGSM 의예측결과를보면, 태풍 Mirinae 가필리핀육지지역을통과한 10 월 30~31 일기간에 JGSM 은실제강도보다 2 배넘게강도를과대예측한것을알수있다. 이렇게 JGSM 이필리핀을지나면서도태풍이계속강화될것으로예측한주원인은 JGSM 이태풍진로를잘못된예측결과로분석된다 ( 본연구에서는제시하지않음 ). 두컨센서스모델들은 JGSM 과는달리실제태풍이약화되는경향을어느정도잘재현하였다. 태풍 Nida 사례또한 Mirinae 와유사하게 Best model 이태풍의생애최대강도도달전에는과소그리고후에는과대모의하는경향을보였고이와달리컨센서스모델들은특히태풍의약화경향을잘모의하였다. 태풍 Roke 은앞선사례들에비해비교적높은위도에서발생하였으며일본을관통하였다. 태풍 Roke 은 2 일안에급격하게강도가증가한태풍 Mirinae 와 Nida 와는달리약 7 일에걸쳐서서히강도가증가하였다. Best model 의결과에서도이런태풍의강도변화경향은어느정도잘모의되었지만전체적으로실제강도보다약하게모의하였다. 컨센서스모델들은태풍강도변화경향뿐아니라과소모의경향을보정하여보다개선된예측결과를보였다. 5. 토의 오유정 문일주 이우정 301 본연구에서는최근거의매년업그레이드되는가이던스수치모델들에특성을고려하여매년수립된컨센서스모델을그다음해에적용하는기법을사용하였다. 이렇게그전해에가장좋은성능을보인가이던스모델을사용하는것이가장좋은방법인가를검증하기위해 2008 년부터 2013 년까지매년구성된 MCON 과 SCON 을이용하여 2014 년에대한예측실험을수행하였다 (Fig. 8). 그결과, 전반적으로 MCON 과 SCON 모두 2014 년에더가까운해를훈련기간으로사용했을때 ( 그림에서색이진해질수록 ) 2014 년에대한예측성능이더좋아진것을확인할수있었다. 즉, 2014 년예측을위해서는 2013 년에훈련된컨센서스모델을사용할경우오차가가장낮았고, 그다음으로 2012, 2011, 2010, 2009, 2008 년순으로오차가커졌다. 이것은컨센서스모델의구성시에가능하면수치모델들의최근경향을반영할수있도록이전해의결과를사용하는것이예측오차를줄일수있음을의미한다. 그렇다면최근 1 년의결과를기준으로컨센서스모델을구성하는것이가장좋은방법일까? 1 년을사용하면훈련기간이너무짧은것은아닌가? 이러한의문에답하기위하여전반적인예측성능평가에서가장낮은오차를보인 MCON 에대해훈련기간을 1 년을사용한것과더긴 2 년의기간을사용한경우에대해 Fig. 8. Comparisons of MAEs for TC MWS predicted from consensus models (a, MCON; b, SCON) trained using data of 2008, 2009, 2010, 2011, 2012, and 2013. 2010 년부터 2015 년까지예측성능을비교하였다 (Fig. 9). 그결과, MAE 비교에서 36 h 예측시간을제외한모든예측시간에서훈련기간을 1 년으로했을때오차가더낮게나타났다. 상관도비교에서도대부분의시간에서훈련기간을 1 년으로한경우더높은상관성을보였다. 특히, 예측시간이길어질수록그차이는커지는경향이보였다. 이결과는훈련기간을 2 년으로사용할경우분석할수있는샘플수가많아지지만모델의최근성능변화를고려하는효과가감소되어결과적으로훈련기간을 1 년으로했을때보다컨센서스모델의예측성능이더떨어지는것으로분석된다. 그러나, 이러한결과는앞으로매년모델의업그레이드가이루어질때에유효한결과임을고려하여야한다. 즉, 앞으로만약모델이매년성능변화가이루어지지않는다면더많은과거예측결과를활용하여컨센서스모델을구성하는것이더바람직할수도있다. Atmosphere, Vol. 28, No. 3. (2018)
302 북서태평양태풍강도예측컨센서스기법 Fig. 9. Comparisons of (a) MAE and (b) correlation coefficient for TC MWS predicted from MCON models trained using data of previous 1 year and 2 years, respectively. 6. 요약및결론 본연구에서는북서태평양에서발생한태풍에대하여최적의태풍강도예측을위해예측시간별로사용한수치모델, 컨센서스방법, 순위결정방법이다른컨센서스모델을개발하였다. 또한매년가용할수있는수치모델들이달라지고그성능도변화하기때문에매년새롭게구성할수있는컨센서스방법론을제시하였다. 이에따라두가지기법인 Multiconsensus model (MCON) 과 Singleconsensus model (SCON) 방법이제시되었다. MCON 은예측시간별로가장낮은오차를보인가이던스모델들을각각조합하여예측시간별로컨센서스모델을따로개발하는방법이고, SCON 는 72 h 까지누적오차가가장낮은하나의컨센서스모델을개발하는방법이다. 컨센서스기법을구성할때대부분가중치평균방법이단순평균방법보다많이선택되었고, 순위결정방법에서는절대평균오차를사용한경우보다상관도를고려한경우가많았다. 총 7 년 (2009~2015) 에대하 여두방법을적용한결과, MCON 과 SCON 은모두개별모델들보다낮은오차를보였다. 특히 MCON 은모든평가에서 1, 2 위를하며가장좋은예측성능을보여주었다. SCON 도 MCON 과유사한좋은성능을보였지만예측초반에비교적큰오차를보였다. 개별적인사례분석결과에서도 MCON 과 SCON 이모두과대또는과소모의하는수치모델들의경향을완화시키는모습을확인할수있었다. 특히태풍의강도가약화되는구간을잘모의하는특징을보이며개별모델들의태풍강도과소모의경향을개선하였다. 훈련기간에대한민감도실험에서컨센서스모델의성능은최근자료를사용할때더좋았고, 훈련기간을최근 2 년을사용한것보다 1 년을사용한것이더효과적이었다. 이는최근 1 년의결과만을사용하는것이빠르게변화하는모델들의최신업그레이드정보가잘반영되기때문인것으로사료된다. 본연구에서는수치모델이예측성능이최근빠른속도로업그레이드되기때문에매해수치모델을평가한결과를이용하여새롭게구성하는컨센서스방법론을제시하였다. 또한예측시간별로수치모델들의성능이다른점을고려하여예측시간별로다른앙상블모델을구성하였다. 그러나본연구에서는훈련기간을과거 1 년으로사용하였기때문에그해에업그레이드된정보가포함되지못하는단점이있다. 이러한문제점을보완하는방법으로향후에는현재예측하고자하는태풍바로전태풍의사례까지도훈련기간에포함하여모델들의최근예측성능을최대한반영한모델을구성하여그효과를조사해보고자한다. 감사의글 이논문은해양수산부의재원으로한국해양과학기술진흥원의지원을받아수행된연구입니다 ( 종합해양과학기지구축및활용연구 ). 또한이논문은제주대학교발전기금의지원을받았습니다. REFERENCES Cangialosi, J. P., and J. L. Franklin, 2013: 2012 National hurricane center forecast verification report. National Hurricane Center (NHC), 79, [Available online at http://www.nhc.noaa.gov/verification/pdfs/verification_ 2012.pdf]. Davis, C. E., J. E. Hyde, S. I. Bangdiwala, and J. J. Nelson, 1986: An example of dependencies among variables in a conditional logistic regression, in Modern Statistical Methods in Chronic Disease Epidemiology, edited by S. H. Moolgavkar and R. L. Prentice, 한국기상학회대기제 28 권 3 호 (2018)
오유정 문일주 이우정 303 pp. 140147, Wiley, New York. DeMaria, M., M. Mainelli, L. K. Shay, J. A. Knaff, and J. Kaplan, 2005: Further improvements to the statistical hurricane intensity prediction scheme (SHIPS). Wea. Forecasting, 20, 531543. Goerss, J. S., 2000: Tropical cyclone track forecast using an ensemble of dynamical models. Mon. Wea. Rev., 128, 11871193. Elsberry, R. L., 2014: Advances in research and forecasting of tropical cyclones from 1963~2013. AsiaPacific J. Atmos. Sci., 50, 316, doi:10.1007/s13143014 00011. Jun, S. H., W. J. Lee, K. R. Kang, K. Y. Byun, J. Y. Kim, and W. T. Yun, 2015: Applicability of the superensemble to the tropical cyclone track forecast in the western north pacific. AsiaPacific J. Atmos. Sci., 51, 3948, doi:10.1007/s131430140058x. Korea Meteorological Administration (KMA), 2017: 2016 Yearbook. KMA, 342343. Knaff, J. A., M. DeMaria, C. R. Sampson, and J. M. Gross, 2003: Statistical, 5day tropical cyclone intensity forecasts derived from climatology and persistence. Wea. Forecasting, 18, 8092. Kotal, S. D., and S. K. R. Bhowmilk, 2011: A multimodel ensemble (MME) technique for cyclone track prediction over the North Indian Sea. GEOFIZIKA, 28, 275291. Kumar, T. S. V. V., T. N. Krishnamurti, M. Fiorino, and M. Nagata, 2003: Multimodel superensemble forecasting of tropical cyclone in the pacific. Mon. Wea. Rev., 131, 574583. Kim, H. S., C. H. Ho, J. H. Kim, and P. S. Chu, 2012: Trackpatternbased model for seasonal prediction of tropical cyclone activity in the western North Pacific. J. Climate, 25, 46604678, doi:10.1175/jclid11 00236.1. Rogers, R., and Coauthors, 2006: The intensity forecasting experiment: A NOAA multiyear field program for improving tropical cyclone intensity forecasts. Bull. Amer. Meteor. Soc., 87, 15231537. Ueno, M., 2014: Tropical Cyclogenesis Monitoring at RSMC Tokyo. JMA/WMO Workshop on Effective Tropical Cyclone Warning in Southeast Asia 1114 March, 2014 [Available online at http://severe.worldweather.wmo.int/tcfw/jmaworkshop/311.tcyclogenesis_monitoring_at_rsmc_tokyo_mueno.pdf]. Villarini, G., G. A. Vecchi, T. R. Knutson, and J. A. Smith, 2011: Is the recorded increase in shortduration North Atlantic tropical storms spurious?. J. Geophys. Res., 116, D10114, doi:10.1029/2010jd015493. WMO (World Meteorological Organization), 2007: Sixth WMO International Workshop on Tropical Cyclone (IWTCVI). WMO, 92, [Available online at http:// www.aoml.noaa.gov/hrd/landsea/wwrp2007_1_i WTC_VI.pdf]. Atmosphere, Vol. 28, No. 3. (2018)