B-05 Hierarchical Bayesian Model을 이용한 GCMs 의 최적 Multi-Model Ensemble 모형 구축



Similar documents
433대지05박창용

03이경미(237~248)ok

歯SN92-M.PDF

01À̽ÂÈ£A9-832š

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석


untitled

Forecast2014_add.indd

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

04김호걸(39~50)ok

< D B4D9C3CAC1A120BCD2C7C1C6AEC4DCC5C3C6AEB7BBC1EEC0C720B3EBBEC8C0C720BDC3B7C2BAB8C1A4BFA120B4EBC7D120C0AFBFEBBCBA20C6F2B0A E687770>

Journal of Educational Innovation Research 2017, Vol. 27, No. 1, pp DOI: * The

., (, 2000;, 1993;,,, 1994), () 65, 4 51, (,, ). 33, 4 30, 23 3 (, ) () () 25, (),,,, (,,, 2015b). 1 5,

02¿ÀÇö¹Ì(5~493s

Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: A Study on the Opti

, ( ) 1) *.. I. (batch). (production planning). (downstream stage) (stockout).... (endangered). (utilization). *

09권오설_ok.hwp

Index

<C7A5C1F620BEE7BDC4>

Journal of Educational Innovation Research 2016, Vol. 26, No. 2, pp DOI: * Experiences of Af

02ÇãÀÎÇý ~26š

목 록( 目 錄 )

03-1영역형( )

02-1기록도전( )

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

04-다시_고속철도61~80p

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: : A Study on the Ac

보고서(겉표지).PDF

ePapyrus PDF Document

3. 클라우드 컴퓨팅 상호 운용성 기반의 서비스 평가 방법론 개발.hwp

노동경제논집 38권 4호 (전체).hwp

16-기06 환경하중237~246p

<C3D6C1BE2DBDC4C7B0C0AFC5EBC7D0C8B8C1F D32C8A3292E687770>

¸Þ´º¾ó-ÀÛ¾÷5

진단, 표시・광고법 시행 1년

09È«¼®¿µ 5~152s

<B9CCB5F0BEEEB0E6C1A6BFCDB9AEC8AD5F31322D32C8A35FBABBB9AE5FC3CAC6C731BCE25F6F6B5F E687770>

46-2대지.3박병익

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

14(4)-14(심고문2).fm

한국성인에서초기황반변성질환과 연관된위험요인연구

<30382E20B1C7BCF8C0E720C6EDC1FD5FC3D6C1BEBABB2E687770>

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

???? 1

Journal of Educational Innovation Research 2016, Vol. 26, No. 1, pp.1-19 DOI: *,..,,,.,.,,,,.,,,,, ( )

¾Ö´º¾ó¸®Æ÷Æ®(2010)1.ps

05서찬양(521~529)ok

歯제7권1호(최종편집).PDF

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: 3 * The Effect of H

확률과통계 강의자료-1.hwp

<2D3828C8AE29B9DAC3B5B1D42E687770>

???? 1

September Vol

October Vol

1. 연구 개요 q 2013년 연구목표 제2-1과제명 건축물의 건강친화형 관리 및 구법 기술 연구목표 건강건축 수명예측 Lifecycle Health Assessment (LHA) 모델 개발 건축물의 비용 기반 분석기술(Cost-based Lifecycle Health

<31372DB9DABAB4C8A32E687770>

현대패션의 로맨틱 이미지에 관한 연구

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: A study on Characte

232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

IT현황리포트 내지 완

09구자용(489~500)

I

15_3oracle

< C6AFC1FD28B1C7C7F5C1DF292E687770>

02À±¼ø¿Á

부문별 에너지원 수요의 변동특성 및 공통변동에 미치는 거시적 요인들의 영향력 분석

00약제부봄호c03逞풚

<33C2F DC5D8BDBAC6AEBEF0BEEEC7D02D3339C1FD2E687770>


Development of culture technic for practical cultivation under structure in Gastrodia elate Blume

08Ưº°±â»ç2-2

<C7D1B9CEC1B7BEEEB9AEC7D03631C1FD28C3D6C1BE292E687770>


서론 34 2

<BFACBAB832342D3033C5F0C1F7BFACB1DDC8B0BCBAC8ADB8A6C0A7C7D1BCBCC1A6C3BCB0E8BFACB1B82E687770>

공휴일 전력 수요에 관한 산업별 분석


µµÅ¥¸àÆ®1

공급업체평가를 위한 DEA 모형의 확장

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

Journal of Educational Innovation Research 2017, Vol. 27, No. 1, pp DOI: NCS : G * The Analy

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr

에너지경제연구 Korean Energy Economic Review Volume 18, Number 1, March 2019 : pp 에너지전환정책및고령화가국민경제에미치는영향 : 확률적중첩세대일반균형모형 (Stochastic Overlapping Genera

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

- 1 -

제 출 문 한국산업안전공단 이사장 귀하 본 보고서를 2002 년도 공단 연구사업계획에 따라 수행한 산 업안전보건연구수요조사- 산업안전보건연구의 우선순위설정 과제의 최종보고서로 제출합니다. 2003년 5월 연구기관 : 산업안전보건연구원 안전경영정책연구실 정책조사연구팀 연

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: * Review of Research

02김헌수(51-72.hwp

1

< FC3D6C1BEBCF6C1A45FB1E2B5B6B1B3B1B3C0B0B3EDC3D E687770>

02 February 2012 자주 만나는 동창회가 되었으면 합니다 K Y U N G P O O K N A T I O N A L U N I V E R S I T Y A L U M N I N E W S Contents 02 자랑스러운 경북대인상 수상자 프로필 03 총동창

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

GMMFS_Catalog_Ko.indd


x y w» w œ» w w. w» j w» (dynamical downscaling) m w» (statistical downscaling) ù. w»»z x(rcms, Regional Climate Models) ù LAMs(Limied Area Models), G

<303720C7CFC1A4BCF86F6B2E687770>

12È«±â¼±¿Ü339~370

(72) 발명자 정진곤 서울특별시 성북구 종암1동 이용훈 대전광역시 유성구 어은동 한빛아파트 122동 1301 호 - 2 -

10(3)-09.fm

Transcription:

Hierarchical Bayesian Model 을 이용한 GCMs 의 최적 Multi-Model Ensemble 모형 구축 Optimal Multi-Model Ensemble Model Development Using Hierarchical Bayesian Model Based 권 현 한 * 민 영 미 **Saji N. Hameed *** Hyun-Han Kwon Young-Mi Min Saji N. Hameed... 요 지 In this study, we address the problem of producing probability forecasts of summer seasonal rainfall, on the basis of Hindcast experiments from a ensemble of GCMs(cwb, gcps, gdaps, metri, msc_gem, msc_gm2, msc_gm3, msc_sef and ncep). An advanced Hierarchical Bayesian weighting scheme is developed and used to combine nine GCMs seasonal hindcast ensembles. Hindcast period is 23 years from 1981 to 23. The simplest approach for combining GCM forecasts is to weight each model equally, and this approach is referred to as pooled ensemble. This study proposes a more complex approach which weights the models spatially and seasonally based on past model performance for rainfall. The Bayesian approach to multi-model combination of GCMs determines the relative weights of each GCM with climatology as the prior. The weights are chosen to maximize the likelihood score of the posterior probabilities. The individual GCM ensembles, simple poolings of three and six models, and the optimally combined multimodel ensemble are compared. 핵심용어 : Multi-Model Ensemble GCMs, Bayesian Weighting, Summer Rainfall,... 1. 서론 수자원분야에서 기상자료를 활용한 홍수 및 가뭄 예측은 중요한 연구테마로서 지난 국외를 중심으로 많은 연구가 진행되고 있다. 1년 동안 특히 여름 강수량은 우리나라의 수자원 관리에서 5% 이상을 차지한다고 해도 과언이 아니다. 이러한 점에서 여름 계절 강수량과 기상인자와의 상 관성을 검토함과 동시에 이들 기상인자를 토대로 유량을 예측하는 연구는 브라질, 미국 등 수력발 전이 발전한 나라들에서 실질적인 연구가 진행되고 있다. 지금까지의 연구를 살펴보면 주로 기상인자와 상관성을 토대로 수문사상을 평가한 연구들로서 Lall과 Mann(1995) 은 SSA(Singular Spectrum Analysis) 와 MTM(Multi-taper method) 를 이용하여 Great Salt Lake 의 월별 용적변화에 대한 시계열, 월 강우량, 온도 그리고 대기순환의 관계를 해석하였다. Moon과 Lall(1996) 은 기후변동성과 수문학적 시스템에 잠재된 동역학적 관계를 이해하기 위하여 * 정회원한국건설기술연구원 선임연구원 E-mail : hkwon@kict.re.kr ** APEC Climate Center Research Scientist *** APEC Climate Center Senior Research Scientist

미국의 Great Salt Lake 와 남방진동지수(Southern Oscillation Index, SOI) 를 포함한 여러 대기 순환지 수를 이용한 저빈도 관계를 연구한 바 있다. Kwon 등(29) 은 중국 양쯔강의 여름평균유량과 최 대유량을 3 개월 이전에 예측하기 위해서 해수면온도, Snowpack 등을 예측인자로 하여 모형을 구 축한 사례가 있다. 본 연구에서는 1개월 이전에 제공되는 GCMs Ensemble로부터 우리나라에 가장 적합한 Multimodel Ensemble의 대한 확률적 예측모형을 구축하고 각 모형에 대한 적합성을 평가하고자 한 다. APEC Climate Center로부터 총 8개의 GCMs(cwb, gcps, gdaps, metri, msc_gem, msc_gm2, msc_gm3 and ncep) Hindcast Experiment 를 제공받았으며 이를 활용하여 연구를 진행하였다. 자료는 1981년부터 23년까지 총 23년의 JJA(June-July-August) 계절을 대상으로 하였다. 최적의 Multimodel Ensemble(MME) 를 구축하기 위해서 본 연구에서는 Hierachical Bayesian 모형 을 구축하였으며 이를 통해 모형이 가지는 전체적인 불확실성 및 최적의 가중치를 추정하였다. 2. 연구 방법 최적의 MME 를 구성하기 위한 식은 다음과 같이 간단히 나타낼 수 있다. 여기서 는 각 GCM 모형에 주어지는 가중치를 나타내며 는 각 GCM이 가지는 Ensemble로부터 추정되는 확률밀 도함수를 나타낸다. 는 실측강수량을 나타낸다. (1) 여기서 는 정규분포로 가정하였으며 실측치 와 는 모두 가정하였다. Lognormal 분포를 따른다고 (2) (3) (4) (5) 식 1에서 5 까지 모형의 계층적 구조를 간단히 나타내었다. 이외에도 각 매개변수간의 관계등 더 복잡한 형태로 모형이 구성되게 된다. 이러한 계층적 구조를 가지는 특정 Bayesian 모형을 Hierarchical Bayesian 모형이라고 한다. 계층적 모형에 대해서 자세히 살펴보면 다음과 같다. 계층적(hierarchical) Bayesian 모형은 2 개의 단계를 가지고 있기 때문에 Hierarchical 이라는 이 름으로 불리어진다. 우선 상위단계에서, 각각의 모형 매개변수들은 다변량 정규분포와 같은 다변 량 확률분포로 나타내어질 수 있다고 가정하며 이러한 확률분포들은 또한 평균과 공분산을 이용 하여 분포형의 특성이 결정되어진다. 하위단계에서는 우리가 모의하고자 하는 변량의 확률을 상위 단계에서 매개변수들을 이용한 선형 및 비선형 모형으로 추정하게 된다. 여기서 각 변량은 특정 확률분포를 가지게 되며 Bayesian 방법을 통해 사후분포를 추정하게 되는 것이다. 계층적 Bayesian 모형의 가장 큰 장점은 모형을 통해 각 매개변수들이 갖는 불확실성이 파급된다는 것이다. 이를 통해 각 매개변수들의 유의성을 쉽게 판단할 수 있다( 권현한과 문영일, 27).

본 연구에서, 계층적 Bayesian 모형을 구성하기 위해서 Markov Chain Monte Carlo(MCMC) 을 이 용하였다. MCMC기법은 주어진 다변량 확률분포가 복잡하여 이를 따르는 iid 난수를 얻을 수 없 는 경우에 사용가능한 기법으로서 iid 난수 대신 Markov Chain 난수를 추출하여 사용한다. Markov Chain을 통해 난수를 발생시킨다고 해서 정확하게 관심이 되는 확률분포를 따르지 않지만 이를 일정 시간동안 반복 후에 얻어지는 난수들은 추출을 원하는 분포에 수렴하게 된다. 따라서 MCMC기법은 복잡한 다변량 확률분포 및 매개변수의 추정을 요하는 문제에서 주로 사용되며 또 한 Bayesian 통계 기법에서 사후분포의 추론의 이용될 수 있다( 권현한과 문영일, 27, Kwon et. al, 28; 29). 3. 연구결과 및 결론 그림 1은 CWB GCM 모형으로부터 추정된 1개의 Ensemble Member의 여름강수량과 단순히 산 술 평균된 Ensemble Mean 결과를 그림 1 에 나타내었다. 그림처럼 각 모형 간에 매우 큰 변동성을 나타내고 있어 여름강수량 예측이 그만큼 쉽지 않음을 알 수 있다. 1985 199 1995 2 25 Time(year) 그림 1. CWB GCM 모형으로부터 추정된 여름강수량과 Ensemble Mean 결과 그림 2 는 식(1) 에서 해당하는 값에 대한 확률분포를 나타낸다. 그림에서 보는 것처럼 Bayesian 방법을 적용함으로서 각 GCM 들에 대한 가중치에 대한 확률분포를 추정할 수 있다. 앞서 가정했듯이 가중치 는 정규분포를 가정하였으므로 사후분포 또한 정규분포로서 추정되어야 한 다. 가중치가 확률분포로서 결정되므로 가중치에 대한 적합성을 용이하게 평가할 수 있다. 즉 그 림 2에 GCPS GCM의 경우 을 기준으로 대부분의 밀도가 양의 값을 가지고 있으므로 그 영향 또 한 일관성을 가지고 MME 결과치에 영향을 미치고 있다는 것을 의미한다. 반대로 NCEP GCM의 경우 을 중심으로 거의 대칭형태를 나타내고 있다. 이는 MME 결과치에 거의 영향을 미치지 못 하고 통계적으로 Noise 로서 작용함을 의미한다. 이들 가중치에 대한 보다 자세한 값은 표 1에 나 타내었다. 표에서 Bold체로 나타낸 값은 타 GCM 에 비해 영향정도가 큼을 의미한다.

.4.2.4.2 1 15 gdaps -4-2 2.8.6 metri -5 5.8.6 msc-gem.4.2.4.2 2 4 msc-gm2-4 -2 2.8.6 msc-gm3-5 5.8.6 ncep.4.2.4.2 5-5 5-5 5 그림 2. MME 추정에서 각 GCM의 가중치와 확률분포 표 1. MME 추정에서 각 GCM의 가중치와 확률분포 G CM s M ean St. D ev. 2.5% M edian 97.5% O ffset 6.89 1.353 4.676 6.72 1.17 cw b -1.115.577-2.94-1.37 -.137 gcps 1.492.7216.1338 1.43 2.596 gdaps.6718.393 -.3142.619 1.47 m etri -.371.2159 -.6736 -.3111.1134 m sc_gem.2737.444 -.5772.2834 1.9 m sc_gm 2 -.3195.411 -.9956 -.4169.4684 m sc_gm 3 -.663.7732-2.29 -.3997.4789 ncep -.2692.3712 -.976 -.3299.7549 그림 3은 Bayesian 모형을 통해 Fitting 한 결과를 나타낸다. 여기서 결과는 Fitting과정을 통해 각 GCM 이 가지는 영향정도를 평가하기 위함이지 실측값과의 상관성 비교는 의미가 없다. 즉 그림 3 에서 보이는 결과는 과대적합(overfitting) 된 결과이다. 그림에서 보듯이 상당한 불확실성이 존재함 을 알 수 있다. 3개의 자료를 제거한 후 Blind Forecasting을 실시한 결과를 보면 21년에는 비교 적 정확한 예측이 수행되고 있으나 22년의 경우 Fitting의 경우처럼 2mm 가까운 차이를 보이 고 있다. 그러나 불확실성 구간 안에 실측값이 포함되고 있다. 마지막으로 23년의 경우 Fitting의 경우보다 더욱 왜곡된 결과를 보여주고 있으며 불확실성 구간 밖에서 예측이 이루어지고 있다.

Seasonal Rainfall(mm) 18 16 14 12 1 8 6 4 Confidence Interval Ensemble Mean Observation Seasonal Rainfall(mm) 25 2 15 1 5 Fitting CI Ensemble Mean Observation Forecast CI 3-year Forecasts 2 198 1985 199 1995 2 25 Time(year) 198 1985 199 1995 2 25 Time(year) 그림 3. Hierarchical Bayesian 모형을 통한 Fitting 결과 및 3-Year Blind Forecasts 본 연구에서는 기존 MME방법을 개선하기 위해서 Hierarchical Bayesian방법을 도입하여 23년간 의 여름강수량에 대해서 적용하였다. 적용결과 각 GCM이 가지는 예측력에 정도를 확률밀도함수 로 정량화 할 수 있었다. 또한 이들 결과를 활용하여 MME를 구축하였으며 전체적인 불확실성 정 량화뿐만 아니라 비교적 만족한 개선된 결과를 확인할 수 있었다. 그러나 보다 정확한 지역적 예 측을 위해서는 SST 와 같은 기상상태변량이 예측인자로 포함되어야 할 것으로 판단된다. 참고문헌 1. Kwon, H.-H., U Lall, (28), Simulation of Daily Rainfall Scenarios with Interannual and Multidecadal Climate Cycles for South Florida, Stochastic Environmental Research and Risk Assessment, DOI 1.17/s477-8-27-2. 2. Kwon, H.-H., C. Brown, K.-Q Xu and U. Lall (29), Seasonal and Annual Maximum Streamflow Forecasting using Climate Information: Application to the Three Gorges Dam in the Yangtze River Basin, Hydrological Sciences Journal, in press. 3. 권현한, 문영일, 김병식, 윤석영, Bayesian Markov Chain Monte Carlo 기법을 통한 NWS-PC 강우 - 유출 모형 매개변수의 최적화 및 불확실성 분석, 대한토목학회 논문집, 대한토목학회, 제 28 호, 4B 호, 28. 4. 권현한, 문영일, 기상정보 및 태풍특성을 고려한 계절 강수량의 확률론적 모형 구축, 대한토목 학회 논문집, 대한토목학회, 제 27 호, 1B 호, 27.