<4D6963726F736F667420576F7264202D20B1E2BBF3C5EBB0E85F36C0E55FC7D0BBFD2E646F6378>



Similar documents
<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

10김묘선

cat_data3.PDF

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

Microsoft PowerPoint - IPYYUIHNPGFU

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

DBPIA-NURIMEDIA

제 4 장회귀분석

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

exp

MATLAB for C/C++ Programmers

nonpara6.PDF

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

Microsoft Word - sbe13_reg.docx

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

Microsoft PowerPoint - Info R(3) pptx

<39372D3032C6F3B1A4C1F6BFAAC4ABC1F6B3EBBCB3C4A1B9D7BFEEBFB5B9E6BEC8BFACB1B82E687770>

슬라이드 1

비선형으로의 확장

슬라이드 1

untitled

(001~006)개념RPM3-2(부속)

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

Microsoft Word - LectureNote.doc

statistics

슬라이드 1

G Power


<C0E5B7C1BBF328BEEEB8B0C0CCB5E9C0C729202D20C3D6C1BE2E687770>

Microsoft Word - ch2_simple.doc

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

고객관계를 리드하는 서비스 리더십 전략

Chapter 8 단순선형회귀분석과 상관분석

Microsoft Word - sbe_anova.docx

슬라이드 1

Forecast2014_add.indd

PowerPoint 프레젠테이션

4 _ 한국지역정보화학회기획세미나발표논문집

Microsoft Word - SAS_Data Manipulate.docx

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

< B5BFBEC6BDC3BEC6BBE E687770>


<3130BAB9BDC428BCF6C1A4292E687770>

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차

abstract.dvi

자료의 이해 및 분석

<C3D6BFECBCF6BBF328BFEBB0ADB5BF29202D20C3D6C1BE2E687770>

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

<4D F736F F F696E74202D FC0E5B4DCB1E220BCF6BFE4BFB9C3F8205BC8A3C8AF20B8F0B5E55D>

PowerPoint 프레젠테이션

Microsoft Word - ch3_residual.doc

표본재추출(resampling) 방법

진단, 표시・광고법 시행 1년

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

No Title

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

슬라이드 1


<BACFC7D1B3F3BEF7B5BFC7E22D3133B1C733C8A BFEB2E687770>

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

PowerPoint 프레젠테이션

며 오스본을 중심으로 한 작은 정부, 시장 개혁정책을 밀고 나갔다. 이에 대응 하여 노동당은 보수당과 극명히 반대되는 정강 정책을 내세웠다. 영국의 정치 상황은 새누리당과 더불어 민주당, 국민의당이 서로 경제 민주화 와 무차별적 복지공약을 앞세우며 표를 구걸하기 위한

- 1 -

R t-..

1) 음운 체계상의 특징 음운이란 언어를 구조적으로 분석할 때, 가장 작은 언어 단위이다. 즉 의미분화 를 가져오는 최소의 단위인데, 일반적으로 자음, 모음, 반모음 등의 분절음과 음장 (소리의 길이), 성조(소리의 높낮이) 등의 비분절음들이 있다. 금산방언에서는 중앙

Microsoft Word - multiple

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

입장

- 2 -

1 수사 경과 수사 착수 배경 신용카드 및 현금영수증 결제승인 대행 서비스업체인 밴사와 대형 가맹점 간의 리베이트 수사 과정에서,밴 수수료로 창출되는 막대한 이익을 둘러싸고 밴 업계의 경쟁이 과열되고 있다는 점에 착안 관련 비리를 집중 내사한 결과,밴 사업자 선정을 위

슬라이드 1


Microsoft Word - SBE2012_anova.docx


Resampling Methods

Microsoft PowerPoint - ANOVA pptx

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의

슬라이드 1

eda_ch7.doc

MATLAB for C/C++ Programmers

Microsoft Word - ch2_smoothing.doc

<31B1E8C1A4B7E6B9DAC1F6BCF6B1E8B9CCBCF72E687770>

Microsoft PowerPoint Predicates and Quantifiers.ppt

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

한국색채학회 논문심사 및 편집일정

한국정책학회학회보

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

PPT Template

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

데이터마이닝 제 1강

Microsoft Word - 동태적 모형.doc

Microsoft PowerPoint - LM 2014s_Ch4.pptx

Microsoft PowerPoint - m22_ODE(Print) [호환 모드]

hwp

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

Transcription:

6. Relaton and Statstcal Weather Forecastng (관 계와 통계적인 일기예보) 6.1 Background 대기운동은 비선형이므로 결정론적인 의미에서 완벽하게 예측될 수 없다. 보완책으 로 통계적인 방법이 유용하고 예보의 일부로 사용된다. 1 수치예보모델 없이 순수하게 통계 모형만을 이용하는 경우 단시간 예보나 아주 긴 시간(수주이상) 예보에서 사용 수치예보모델과 결합하여 사용되는 경우 모델이 표현하지 못하는 량이나 지역에 대해서 확률 값을 제시하는 경우 6. Relatonshp

Scatter plot: 두 변수 사이의 관계를 보기 위하여 사용 Lnear regresson: 독립변수에 의존하는 종속변수의 평균적 관계를 나타내는 관 계식 결정적 관계식(좌) 통계적 관계식(우): 결정성분+오차성분 Determnstc(결정적): f we know the value of one varable, we can determne the value of the other exactly Statstcal(통계적): natural varablty exsts n both measurements Correlaton: 선형 상관관계의 방향과 정도를 나타냄 6.3 Revew of least-squares regresson 정의

회귀 분석 : 변수들 간의 함수적인 관련성을 규명하기 위하여 어떤 수학적 모형을 가정 하고 이 모형을 측정된 변수들의 자료로부터 추정하는 통계적 분석방법 종속 변수 : 다른 변수의 영향을 받는 변수 독립 변수 : 다른 변수에 영향을 주는 변수 모델 설계 1 모델은 다음으로 표현 y = α + βx + ε ( = 1,, L, n) 오차(무작위 오차)의 평균은 0, 따라서 y값의 평균은 결정성분과 동일 3 즉, 결정성분을 다음과 같이 가정 E( y) = α + β x 4 Sample 자료에서 α,β에 대한 추정치 a,b를 구하여 수식을 완성: ŷ 는 E(y)의 추정치가 됨 ŷ = a+ bx 5 오차항은 다음과 같이 정규분포로 가정 ε σ ~ N (0, ) 6 통계적으로 유용성을 검증: 표준편차? 7 모델을 예측이나 추정에 사용 예제: 약품사용량과 반응

섭씨와 화씨 온도 yˆ = 3 + 1.8x 6.3.1 최소자승법(Least square method) 회귀모형에서 미지의 모수 a와 b를 추정할 때 오차(잔차)의 제곱 합을 최소로 하도록 추정하 는 방법 구하고자 하는 수식은 ŷ = a+ bx 잔차(resdual)의 정의 ˆ = = + + ~ (0, ) e y y y a bx e e N σ 오차(잔차)의 제곱 합

오차(잔차)의 제곱 합이 최소가 되는 추정치 잔차 제곱합을 a의 함수로 나타내었을 때, 최소치에서는 a에 대하여 미분하면 0 잔차 제곱합을 b의 함수로 나타내었을 때, 최소치에서는 b에 대하여 미분하면 0 정규방정식 (Normal equaton)

6.3. 분산분석 최소제곱 회귀직선을 구하여 사용하는 것이 의미가 있는가를 판단하는데 사용 y y = ( y y ) + ( y y) ˆ ˆ

y ˆ : 잔차 y yˆ y : 회귀직선에 의하여 설명되는 편차 분산 우변 마지막 항 왜냐고? y = a+ bx yˆ = a+ bx = y bx + bx 정규방정식에서

따라서 분산은 다음과 같이 n n n ( y ) ( ˆ ) ( ˆ y = y y + y y) = 1 = 1 = 1 1 3 SST=SSE+SSR 1 항: 평균과 차이의 총제곱합, 총변동 = SST(Sum of Squares Total) 항: 잔차 제곱합 = SSE(Sum of Squared Error) 3 항: 회귀 제곱합 = SSR(Sum of Squares for Regresson) 결정계수(Coeffcent of Determnaton): 단순회귀모형에서 회귀직선에 의한 분산(변동)이 종 속변수 분산(변동)에 기여하는 정도를 나타냄 SSR R = SST 0 R 1 R은 상관계수

분산분석 평균제곱: 각각의 제곱합을 대응하는 자유도로 나눈 것 SST SSE SSR 자유도 n-1 n- 1 표준편차 구할 때와 동일 개 parameters (a,b)가 사용 평균제곱 MST=SST/(n-1) MSE=SSE/(n-) MSR=SSR/1 ANOVA: Analyss of Varance MSR F-rato : F = = t MSE - 회귀직선의 유의성 검정에 사용 - F값이 클수록 유의성 커짐 Resdual vs ftted values resdual vs x 가중 회귀모형 잔차(resdual)에 가중치(w )를 줌 e = w ( y yˆ ) 6.3.3 찬차의 분석 단순회귀모형에서 직선관계, 정규성, 독립성, 등분산성의 가정이 옳은가 검토할 때 사용 y = α + β + ε x 잔차 e = y yˆ

잔차의 분포가 정규분포인가? 잔차와 추정값과의 도표 등분산을 만족하는가? 잔차와 x 값들과의 도표 독립성을 만족하는가? 6.3.3 중회귀 분석 독립변수의 정해진 값 x, L, x ( = 1,, L, n) 에서 측정되는 종속변수 관계식이 성립한다고 가정하자. Y 에 대하여 다음의 k개의 β Y = α + β1x + β x + L+ βkx + e, = 1,, L n e 은 서로 독립이며 ~ N (0, σ ) 1, β, L, β k, e α, β σ 이고 은 미지의 모수이다. α, β β 최소제곱법에 의한 의 추정 1, 정규방정식 중회귀의 분산분석 SST=SSE+SSR [k개의 독립변수를 사용하는 경우] SST SSE SSR 자유도 n-1 n-k-1 k 평균제곱 MSE=SSE/(n-k-1) MSR=SSR/k F-rato: SSR / k MSR F = t SSE /( n k 1) = MSE =

- k와 (n-k-1)의 자유도를 가진 F 선형관계가 있는가? 가설: 귀무가설(H 0 ), 대응가설(H 1 ) H 0 1 1 : β = β =... = β = 0 H : β 0 for some Reject H 0 when F exceeds kn, k 1( α ) k F 다항식 모형 k Y = α + β1x+ βx + L + βk x + e Logstc regresson y = 1+ exp( b 1 + b x + b x + Lb 0 x 1 K K x )

6.4 Statstcal forecast 6.4.1. 일반적 통계예보 예보시점에 이용 가능한 변수들을 예보자(predctor)로 사용하여 예측하고자 하는 변수 (predctand)와 회귀식을 구축함 (고전적인 예보) 자료의 분류와 합성 자료의 분류 predctor와 predctand의 관계는 조건에 달라 다를 수 있음 예) 계절에 따른 분류, 낮과 밤에 따른 분류 등 자료의 합성 비슷한 조건을 갖는 여러 관측소의 자료를 함께 이용하여 하나의 회귀관계식을 도 출. 사용되는 자료의 수를 증가시킬 수 있음 6.4. 예보자(predctor) 예보자 이용시 주의점 물리적으로 의미있는 predctor를 선택함 회귀식은 그 관계식의 개발에 사용되지 않은 독립된 자료를 이용하여 평가함 회귀식의 개발에 충분히 많은 자료들이 사용되야 함 overft regresson: 자료의 수가 n개일 때 회귀식의 독립변수의 수가 n-1개이면 물리적 관 계와 상관없이 완벽한 회귀식을 도출하게 됨 predctor 수 예보자 수를 증가하였을 때 개선 효과가 나타나지 않으면 현 predctor가 적정 predctor의 수의 증가가 R 의 값을 의미있는 (예: 0.05%) 증가를 초래하지 않는 경우 predctor의 수의 증가가 MSE의 의미있는 증가를 초래하지 않는 경우 6.4.3 확률예보 Regresson estmaton of event probabltes (REEP) predctand가 0 또는 1의 값을 갖는 선형회귀식의 개발 예) 강수가 온 경우 : 1, 강수가 안 온 경우: 0

물리적으로 의미없는 결과가 나오기도 함 예를 들어 음수나 1이상이 되는 값. 그러나 음 수인 경우 0으로 1이상인 경우 1로 예보하면 됨 6.4.4. 수치예보의 결과를 이용한 통계예보 통계모델의 필요성 국지기상에 중요한 작은 규모의 효과들이 수치예보모델에는 명시적으로 포함되어지지 못 함. 예보가 요구되는 작은 지역이나 특정 변수(강수확률)들을 수치예보모델에서 명시적으 로 나타나지 못함 수치예보모델이 완벽하지 않음 => systematc 오차 수치예보모델은 결정론 적이므로 결과의 불확실성을 정량화 할 수 없음 Perfect Prog forecasts 수치모델결과가 완벽하다고 가정 관측된 predctor와 관측된 predctand가 회귀 관계식 개발에 사용됨 예보시 해당 predctor의 수치모델결과를 사용 예) 1000-850hPa의 층후가 기온에 대한 좋은 predctor인 경우 예보된 1000-850hPa의 층후 가 기온예보를 위한 통계모델에 사용됨 모델이 predctor를 잘 예측하면 perfect prog forecast는 좋은 예보결과를 줄 수 있음 Model Output statstcs (MOS) forecasts 수치모델 결과와 관측결과가 회귀관계식 개발에 사용됨 수치모델결과를 predctor로 사용하고 관측결과가 predctand로 사용됨 수치모델 결과의 완벽성을 가정하지 않음 perpect prog approach와 달리 예보시간의 길이에 따라 다른 통계식이 요구됨 예) 1hr 예보시와 4hr 예보시 모델결과의 정확성이 떨어짐에 따라 다른 관계식이 요구 됨 고전적인 방법과 Perfect prog, MOS의 비교 고전적인 방법 통계예보모델 개발시와 예보시 같은 입력변수들이 사용됨 y t = f c ( x 0 ) Perfect prog 통계예보 모델 개발시

y 0 = f pp x ) ( 0 예보시 y = t f pp ( x t ) - x t 는 수치모델 결과 관측결과에 predctor와 predctand는 좋은 관계식을 갖고 있고 수치예보모델에서 predctor는 잘 예측이 되어지나 predctand가 잘 예측되어 지지 않는 경우 perfect prog forecastng이 사용될 수 있음 장점: 많은 자료가 통계예보모델 개발에 사용될 수 있음. 수치예보모델 또는 forecast projecton에 의존적이지 않음 단점: 모델의 systematc error를 고려하지 못함 MOS 통계예보모델 개발시와 예보시 둘다 수치모델 결과를 predctor로 사용함 장점: 모델의 systematc error를 고려할 수 있음 단점: 적은 자료만이 통계예보모델 개발에 사용됨, 수치예보모델과 forecast projecton 에 의존적임 6.4.5 앙상블 예보 조금씩 다른 초기조건을 갖고 모델을 반복적으로 수행하여 그 결과를 평균함으로써 예보결과 를 얻고 불확실성을 정량화 함

Term Project: 태풍의 예상진로 예보 태풍진로 예상위치는 필요에 따라 수시간에서 48시간까지 발표하고 있다. 태풍의 이동 방향과 속도의 변화가 심할 때는 예상위치에 대한 예보시간 간격을 조정하여 발표 하기 도 한다. 태풍예상위치 표시는 아래 그림과 같이 예상위치의 범위를 원형으로 표시한다. 이때 원의 크기는 태풍의 중심이 들어갈 예보확률을 70%로 한다. 현재 위치에서 다음 예 상 위치에 있는 원의 가장자리를 개의 실선으로 연결한다. 다만, 태풍 예상위치 표시는 태풍정보 발표구역 및 발표시간에 따라 생략 또는 단축시킬 수 있다. 태풍이 거의 정체 할 것으로 예상되어 예상위치 범위를 표시하기 어려울 때는 거의 정체 라고 표기한 다. 일반적 진로와 특이 진로

월별 진로 태풍진로에 대한 자료: 속도, 방향 자료 지역: 10~130E, 0~30N 월: 7월 셀마 사라 나비 속도 00 km/4h 30 km/4h 170 km/4h 방향 5 10 350 분석 결과

속도 - 평균 - 표준편차 방향 - 평균 - 표준편차