슬라이드 1

Similar documents
슬라이드 1

슬라이드 1

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

슬라이드 1

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

G Power

Microsoft Word - multiple

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

eda_ch7.doc

슬라이드 1

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

Microsoft PowerPoint - IPYYUIHNPGFU

歯4차학술대회원고(장지연).PDF

슬라이드 1

abstract.dvi

슬라이드 1

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

슬라이드 1

untitled

제 1 부 연구 개요

Chapter 8 단순선형회귀분석과 상관분석

hwp


ASETAOOOCRKG.hwp

Microsoft Word - 동태적 모형.doc

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

슬라이드 1

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

에너지경제연구 제12권 제2호

10. ..

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

R t-..

에너지경제연구 제13권 제1호

통계학 개론

<C7A5C1F620BEE7BDC4>


01_°íºÀÂùöKš

시스템경영과 구조방정식모형분석

제 4 장회귀분석

untitled

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

methods.hwp

<3131BFF92D3828C6D0B3CEBFACB1B82DC0CCBBF3C8A D38302E687770>

II. 기존선행연구

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

<C8A3C5DABBEABEF720B0E6B1E2B5BFC7E220BFB9C3F820B8F0B5A8BFA120B4EBC7D120BFACB1B85FC3D6C1BE28C7D1C3A2BFB1292E687770>

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

Microsoft Word - skku_TS2.docx

164

통계학 개론

韓國開發硏究제 33 권제 3 호 ( 통권제 112 호 ) 재직자직업훈련관련공적재정의구조와성과 : 효과분석 이철인 ( 서울대학교사회과학대학경제학부교수 ) 유경준 ( 한국개발연구원선임연구위원 ) Training Incentives in the Korean Levy-Gran

MATLAB for C/C++ Programmers

PowerPoint 프레젠테이션

cat_data3.PDF

, ( ) * 1) *** *** (KCGS) 2003, 2004 (CGI),. (+),.,,,.,. (endogeneity) (reverse causality),.,,,. I ( ) *. ** ***

슬라이드 1

비선형으로의 확장

R&D : Ⅰ. R&D OECD 3. Ⅱ. R&D

nonpara1.PDF

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx

Blue Geometry

메타분석: 통계적 방법의 기초

<3136C1FD31C8A35FC3D6BCBAC8A3BFDC5F706466BAAFC8AFBFE4C3BB2E687770>




확률과통계 강의자료-1.hwp

R

자료의 이해 및 분석

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt


벡터자기회귀 (Vector Autoregression : VAR) 모형은경제이론없이모형만으로변수들간의관계를설명할수있다는점에서자주이용되는모형임. y t =α 1 y t-1 + +α p y t-p +βx t +ε t 여기서 y t 는내생변수 (endogenous varia

PowerPoint 프레젠테이션

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

Microsoft Word - ch2_simple.doc

Microsoft PowerPoint - Info R(3) pptx

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Communications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는

노동경제논집 38권 3호 (전체).hwp

nonpara6.PDF

Microsoft PowerPoint - analogic_kimys_ch10.ppt

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

슬라이드 1

- 1 -

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

untitled

<C3D6C1BE2DBDC4C7B0C0AFC5EBC7D0C8B8C1F D32C8A3292E687770>


THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 25(12),

고객관계를 리드하는 서비스 리더십 전략

시계열분석의개요 (the nature of time series analysis) 확률과정 (stochastic processes) 이란시간으로순서가매겨진확률변수들의집합임. 만일확률변수 y 가연속이라면 y(t) 라고표기하지만이산이라면 y t 라고표기함 ( 대부분의경제자

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

Transcription:

Principles of Econometrics (3e) 013 년 1 학기 윤성민

10.0 서론 The assumptions of the simple linear regression are: SR1. SR. yi =β 1 +β xi + ei i= 1,, N Ee ( i ) = 0 SR3. var( e i ) = σ SR4. cov( e, e ) = 0 i j SR5. The variable x i is not random, and it must take at least two different values. SR6. (optional) e N σ i ~ (0, ) In this chapter, we relax the assumption that variable x is not random.

10.0 서론 설명변수 x 는확률적인가아닌가? 경제학자가사용하는통계는대부분비실험적성격의통계 x와 y의값은보통동시에알려짐 따라서 x와 y는모두확률변수라고볼수있음 지금까지 (1~9장) 설명변수가확률적이아니라고생각한이유 - 통제된실험에의한자료를분석하는경우에타당한가정임 - OLS와관련된대수학을간단하게처리할수있음 - x가확률적이더라도 OLS를사용할수있는경우가있음 3

10.0 서론 10 장의주요내용 이제부터는설명변수가확률적이라고가정함 어떤경우 ( 혹은조건하에서 ) 여전히 OLS를사용해도좋은가? E( e x ) = 0, 혹은 cov ( xe, ) = 0 어떤경우에 OLS는적절한추정법이되지못하는가? E e x, 혹은 cov ( xe, ) 0 ( ) 0 설명변수가확률적인경우에적절한추정법은무엇인가? 적률추정법 Method of Moments Estimation (MM 혹은 GMM) 4

10.1 x 가확률변수인경우의 OLS 10.1 x 가확률변수인경우의 OLS 이장에서는가정을다음과같이수정하기로함 A10.1 는모집단에서 y 와 x 의관계를적절하게 나타냄 ( 선형모형가정의타당성 ) A10. x, y 자료들은무작위표본추출 (random sampling) 을 A10.3 통해수집되었음. 즉, x, y ~ iid (x i 는확률변수라고가정 ) A10.4 x i 는적어도 개의상이한값을가짐 A10.5 A10.6 y =β +β x + e i 1 i i ( ) i i ( ) ( ) E e x = 0 cov( x, e ) = 0 i i i i ( e x ) = σ var i i ( ) e x ~ N 0, σ i i i i 5

(1) OLS 추정량의소표본특성 E( e x ) = 0 ( ) cov xe, = 0, 혹은이면 10.1 x 가확률변수인경우의 OLS OLS를적용해도아무문제없음즉, 설명변수가확률변수이더라도위경우라면 OLS 추정량은 BLUE Gauss-Markov 정리에의해유한표본 (finite sample) 혹은소규모표본 (small sample) 에서도성립함 자료가무작위표본추출법을통하여구해졌다면, OLS 추정법은표본의크기와무관하게사용할수있음 6

() OLS 추정량의점근적특성 : x 가확률적이아닌경우 (Asymptotic (Large) Sample Properties of the Least Squares Estimator) 대규모표본이면, 오차항이정규분포하든하지않든다음의두가지특성이존재함. (a) OLS 추정량은불편추정량이다. (b) OLS 추정량의분산은 0으로수렴한다. ( 일치추정량, consistent estimator) 10.1 x 가확률변수인경우의 OLS 7

10.1 x 가확률변수인경우의 OLS 일치성 (consistency of estimator) - 대규모표본에서나타나는특성, 점근적특성 - 표본의크기가증가하면추정치는모수에근접함을의미 8

10.1 x 가확률변수인경우의 OLS (3) OLS 추정량의점근적특성 : x 가확률적인경우 ( ) : cov xe, = 0 의경우 (a) 대표본이면 OLS 추정량은일치추정량이다 ( 추정치는모수에근접혹은수렴함 ) (b) 대표본이면 OLS 추정량은정규분포한다 ( 통상적인구간추정, 가설검정타당함 ) 9

(4) OLS 추정량의점근적특성 : x 가확률적인경우 ( ) : cov xe, 0 의경우 10.1 x 가확률변수인경우의 OLS 대표본이더라도 OLS 추정량은일치추정량이아니다 OLS 추정치는모수에수렴하지않음통상적인구간추정이나가설검정타당하지않음 요약 cov ( xe, ) = 0 cov ( xe, ) 0 이면, 설명변수가확률적이더라도 OLS 적용가능 이면, OLS 는적절한추정방법이아님 ( 대표본경우에도 ) cf. 검정방법 : Hausman test (10.4) 10

cov ( xe, ) 0 10.1 x 가확률변수인경우의 OLS 의경우, OLS 가일치추정량이아닌이유 : Monte Carlo 모의분석기법을이용한설명 cov( x, e) > 0인가상적인 x와 e 통계자료생성 ( 상관계수 0.6) 그림 10. 모회귀선이 즉, 모수의참값은 E y) = β 1 + β x = 1+ 1 x ( β =1 β = 1 1 다음과같이인위적인 y 값생성 라고가정하자 이라고가정 인위적으로생성된 (y,x) 자료를이용, OLS 로추정 그림 10.3 기울기가체계적으로과대평가, 대표본인경우에도과대평가 OLS 추정량은일치추정량아님 y = E y) + e = β 1 + β x + e = 1+ 1 x + e ( 11

cov( x, e) > 0 인가상적인 x 와 e 와통계 10.1 x 가확률변수인경우의 OLS y = 1+ 1 x + e OLS 추정 체계적인오류 1

10.1 x 가확률변수인경우의 OLS cov( x, e) > 0 인가상적인 x 와 e 와통계 y = 1+ 1 x + e Dependent Variable: Y Method: Least Squares Date: 09/19/1 Time: 10:43 Sample: 1 100 Included observations: 100 Variable Coefficient Std. Error t-statistic Prob. C 0.978893 0.08881 11.08838 0.0000 X 1.703431 0.089950 18.93754 0.0000 R-squared 0.785385 Mean dependent var 1.38687 Adjusted R-squared 0.783195 S.D. dependent var 1.838819 S.E. of regression 0.856198 Akaike info criterion.547166 Sum squared resid 71.8418 Schwarz criterion.59970 Log likelihood -15.3583 Hannan-Quinn criter..56853 F-statistic 358.6306 Durbin-Watson stat.103601 Prob(F-statistic) 0.000000 OLS 추정 체계적인오류 13

10.1 x 가확률변수인경우의 OLS cov( x, e) > 0 인가상적인 x 와 e 와통계 y = 1+ 1 x + e Dependent Variable: Y Method: Generalized Method of Moments Date: 09/19/1 Time: 17:46 Sample: 1 100 Included observations: 100 Linear estimation with 1 weight update Estimation weighting matrix: HAC (Bartlett kernel, Newey-West fixed bandwidth = 5.0000) Standard errors & covariance computed using estimation weighting matrix Instrument specification: Z1 Z Constant added to instrument list Variable Coefficient Std. Error t-statistic Prob. C 1.166695 0.106393 10.96593 0.0000 X 1.06139 0.19078 5.578105 0.0000 R-squared 0.67346 Mean dependent var 1.38687 Adjusted R-squared 0.670130 S.D. dependent var 1.838819 S.E. of regression 1.056113 Sum squared resid 109.3068 Durbin-Watson stat 1.9690 J-statistic 3.5889 Instrument rank 3 Prob(J-statistic) 0.06057 GMM 추정 체계적인오류나타나지않음 14

10.1 x 가확률변수인경우의 OLS cov( x, e) > 0 인가상적인 x 와 e 와통계 y = 1+ 1 x + e Dependent Variable: Y Method: Two-Stage Least Squares Date: 09/19/1 Time: 17:48 Sample: 1 100 Included observations: 100 Instrument specification: Z1 Z Constant added to instrument list Variable Coefficient Std. Error t-statistic Prob. C 1.137591 0.116444 9.769431 0.0000 X 1.03987 0.1943 5.3540 0.0000 R-squared 0.66607 Mean dependent var 1.38687 Adjusted R-squared 0.66801 S.D. dependent var 1.838819 S.E. of regression 1.067780 Sum squared resid 111.7351 F-statistic 8.66555 Durbin-Watson stat 1.967390 Prob(F-statistic) 0.000001 Second-Stage SSR 30.0610 J-statistic 3.5550 Instrument rank 3 Prob(J-statistic) 0.059366 SLS 추정 체계적인오류나타나지않음 15

10. x 와 e 가상관된경우 10. x 와 e 가상관된경우 cov ( xe, ) 0 측정오차 (Measurement Error) 혹은변수오차 (Errors-in-variables) 문제 누락변수 (Omitted Variables) 연립방정식편의 (Simultaneous Equations Bias) 계열상관이존재하는시차종속변수모형 (Lagged Dependent Variable Models with Serial Correlation) 공통점 - 설명변수가내생적으로결정됨 - 내생성문제 (endogeneity problem) 가존재한다고말함 16

10. x 와 e 가상관된경우 (1) 측정오차혹은변수오차문제 설명변수를측정할때오차가있는경우 ( 예 ) 저축함수추정할때, 저축 (y) 은항상소득에의존한다고가정 y =β +β x + v * i 1 i i 항상소득 (x*) 의대리변수 (proxy variable) 로현재소득 (x) 사용 x = x + u * i i i * yi =β 1 +β xi + vi =β 1 +β + =β +β x + v β u =β +β x + e ( xi ui) vi ( ) 1 i i i 1 i i * ( x e ) = E( xe ) = E ( x + u )( v β u ) cov, = E β = β σ 0 i i i i i i i i ( ui ) u ( ) 따라서측정오차경우 OLS 는부적절한추정방법임 cov xe, 0 17

10. x 와 e 가상관된경우 설명변수측정오차문제의사례 ( 교과서 p. 381), 저축 =f( 현재소득 ) Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 0.074 0.074 0. 0.6444 Error 48 49.09998 1.09 Corrected Total 49 49.307 Root MSE 1.01139 R-Square 0.0045 Dependent Mean 3.95066 Adj R-Sq -0.0163 Coeff Var 5.60061 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept 1 4.3477 0.8561 5.07 <.0001 x 1-0.00519 0.01116-0.46 0.6444 18

10. x 와 e 가상관된경우 () 누락변수 누락된변수가포함된설명변수와상관된경우에는 cov ( xe, ) 0 ( 예 ) 임금함수 WAGE =β +β EDUC + e i 1 i i - EDUC 는교육받은연수 누락변수 (Omitted Variables) : 경험, 능력, 열의 ( 동기 ) 등등 - 누락된요인들의영향은오차항에포함됨 - 누락변수들은교육연수와밀접히관련되어있음 cov( EDUC, e ) 0 i i OLS 는부적절 ( 불편추정량아님, 일치추정량아님 ) 19

10. x 와 e 가상관된경우 (3) 연립방정식편의 ( 예 ) 수요-공급모형 경쟁시장에서균형가격 (P i ) 과균형 ( 수급 ) 량 (Q i ) 은동시에결정되므로모두내생변수임 이를무시하고 ( 가격을외생변수로가정하고 ), 아래의단일방정식을 OLS로추정하면, 내생성문제가발생함 Q =β +β P + e i 1 i i 내생성을고려하면 cov( Pe, ) 0 i i OLS 는부적절 ( 불편추정량아님, 일치추정량아님 ) 연립방정식편의 (simultaneous equations bias) 라고함 0

10. x 와 e 가상관된경우 (4) 계열상관이존재하는시차종속변수모형 시차종속변수가설명변수로포함된모형, 예를들어 y =β +β y +β x + e t 1 t 1 3 t t 이모형의오차항이시계열적으로상관되는경우, 예를들어 AR(1) process: e t =ρ e t 1 + v t 만약이라면, y t-1 ~ e t-1 ~ e t 셋모두관련됨 ρ 0 cov( y, e ) 0 t 1 t OLS 는부적절 ( 불편추정량아님, 일치추정량아님 ) 1

10.3 적률방법에기초한추정량 ( ) cov xe, 0 이면, y =β +β x + e t 1 t t OLS 추정량은불편추정량도일치추정량도아님, 대안필요함 적률방법추정량 cov ( xe, ) = 0 cov ( xe, ) 0 이면 OLS 추정량과동일해짐 이면 수단변수추정법, SLS ( 단계 OLS) 와동일

10.3 적률방법에기초한추정량 적률추정방법 모집단에서의적률 (moment) - 확률변수 Y 의 k 번째모집단적률은다음과같이정의됨 k ( ) =µ k = 'th moment of EY k Y 표본에서의적률 - k 번째표본적률은다음과같이정의됨 EY =µ ˆ = k th sample moment of Y ( k ) k k = yi N k 번째모집단적률은 k 번째표본적률로추정가능 ( 일치추정량 ) 3

10.3 적률방법에기초한추정량 적률방법에서의추정절차 m번째모집단적률을 m번째표본적률과같다고놓고 m개의미지의모수를추정함 - 즉 µ ( = µ ) 1 를 µ ( = ˆ µ ), 를 ˆµ 로, 이렇게각각의적률을추정함 ( ) ˆ 1 Population Moments ( ) 1 µ Sample Moments EY =µ =µ µ= ˆ y N EY =µ µ ˆ = y N i i 4

적률방법에의한평균및분산의추정방법 모집단평균의추정량 µ= ˆ yi N = y 10.3 적률방법에기초한추정량 모집단분산의추정량 ( 불편추정량과약간다르나, 일치추정량 ) σ =µ µ = = = N N N ( ) yi yi Ny yi y ˆ ˆ y 5

적률방법에의한회귀모형의추정방법 ( ) cov xe, = 0 : 인경우 적률조건 (moment conditions) ( ) ( ) E e = 0 E y β β x = 0 i i 1 i ( ) ( ) E xe i i = 0 E x i yi β1 βxi = 0 두개의모집단적률을표본적률로대체시키면, 10.3 적률방법에기초한추정량 y =β +β x + e t 1 t t β, β 1 의적률방법추정량 b,b 1 를아래와같이구할수있음 1 N 1 N ( yi b1 bx i) = ( ) i i 1 i 0 x y b bx = 0 b = ( xi x)( yi y) ( xi x) b= y bx 1 OLS 와 동일 6

적률방법에의한회귀모형의추정방법 ( ) : cov xe, 0 인경우 두번째적률조건을사용할수없게됨, 왜냐하면 그렇지만두번째적률조건을만족시키는또다른 가있을 수있음 ( 이변수를수단변수 (instrumental variable) 라함 ) ( ) ( ) E ze i i = 0 E zi yi β1 βxi = 0 그러면다음표본적률조건으로 β 1, β 의추정량을구할수있음 1 ( y ˆ ˆ ) i β1 β xi = 0 N 1 z ( ˆ ˆ ) i yi β1 β xi = 0 N 1 이적률방법추정량을수단변수추정량이라고함 ( ) 0 E xe i i i i ( zi z)( yi y) i i i i ( i )( i ) ˆ N zy z y β = = N zx z x z z x x β ˆ = y βˆ x 10.3 적률방법에기초한추정량 z t t 7

10.3 적률방법에기초한추정량 수단변수추정량의특성 ( ) cov ze, = 0 이면, 수단변수추정량은일치추정량임 대표본인경우, 수단변수추정량은정규분포를함 ˆ σ β ~ N β, ( xt x) r zx 수단변수추정량의효율성을높이기위해서는 x와긴밀히상관된변수를수단변수 (z) 로선택해야함 r zx ( 이유 ) 이커질수록수단변수추정량의분산이작아짐 오차항및추정량의분산은다음과같이계산하면됨 σ ˆ = IV ( y ˆ ˆ ) i β1 βxi var ( ˆ ) N σ β = = ( i ) var r r zx x x zx ( b ) 8

10.3 적률방법에기초한추정량 ( 예1) 수단변수추정법을이용한저축함수추정 저축 = f ( 항상소득 ) 앞에서항상소득의대리변수로 현재소득 (x) 을이용하여저축함수를 OLS로추정하면, 측정오차혹은변수오차의문제가있음을보았음 OLS 추정결과는불편추정량도일치추정량도아님 Sˆ = 4.348 0.005x OLS (se) (0.856) (0.001) 이제항상소득의수단변수로 10년간의평균소득 (z) 을이용해보자. 이수단변수는항상소득 ( 장기평균소득 ) 을더잘대변함이수단변수는항상소득과도상관되며, 현재소득과도상관됨 Sˆ = 0.9883 + 0.039z OLS (se) (1.54) (0.00) 9

10.3 적률방법에기초한추정량 SAS program <OLS / Linear model> <OLS / Non-linear model> proc reg ; proc model ; model y = x ; parms b1 b ; y = b1 + b*x ; fit y ; < 수단변수추정법 > proc model ; parms b1 b ; exogenous z ; y = b1 + b*x ; fit y / sls ; * instruments; 30

10.3 적률방법에기초한추정량 PROC REG, OLS, 저축 =f( 현재소득 ) Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 0.074 0.074 0. 0.6444 Error 48 49.09998 1.09 Corrected Total 49 49.307 Root MSE 1.01139 R-Square 0.0045 Dependent Mean 3.95066 Adj R-Sq -0.0163 Coeff Var 5.60061 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept 1 4.3477 0.8561 5.07 <.0001 Income 1-0.00519 0.01116-0.46 0.6444 31

10.3 적률방법에기초한추정량 수단변수추정법 : SLS Nonlinear SLS Summary of Residual Errors DF DF Adj Equation Model Error SSE MSE Root MSE R-Square R-Sq Savings 48 65.557 1.3595 1.1660-0.331-0.3507 Nonlinear SLS Parameter Estimates Approx Approx Parameter Estimate Std Err t Value Pr > t b1 0.98867 1.54 0.65 0.5198 b 0.039176 0.000 1.96 0.0564 3

10.3 적률방법에기초한추정량 OLS, 저축 =f( 현재소득 ) savings.wfl Dependent Variable: SAVINGS Method: Least Squares Date: 09/17/1 Time: 3:48 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-statistic Prob. C 4.34769 0.856116 5.07643 0.0000 INCOME -0.005185 0.011163-0.464539 0.6444 R-squared 0.004476 Mean dependent var 3.950660 Adjusted R-squared -0.01664 S.D. dependent var 1.00367 S.E. of regression 1.011393 Akaike info criterion.899713 Sum squared resid 49.09998 Schwarz criterion.976194 Log likelihood -70.498 Hannan-Quinn criter..98837 F-statistic 0.15796 Durbin-Watson stat 1.856169 Prob(F-statistic) 0.64436 상식밖의결과 33

10.3 적률방법에기초한추정량 수단변수추정법 : SLS Dependent Variable: SAVINGS Method: Two-Stage Least Squares Date: 09/18/1 Time: 00:07 Sample: 1 50 Included observations: 50 Instrument specification: AVERAGE_INCOME Constant added to instrument list <Quick>-<Estimate Equation> 클릭, <Method> 에서 <TSLS> 선택, 윗칸 : savings c income 아랫칸 : average_income Variable Coefficient Std. Error t-statistic Prob. C 0.98867 1.54164 0.648400 0.5198 INCOME 0.039176 0.00038 1.955094 0.0564 R-squared -0.33089 Mean dependent var 3.950660 Adjusted R-squared -0.350653 S.D. dependent var 1.00367 S.E. of regression 1.165973 Sum squared resid 65.5569 F-statistic 3.8391 Durbin-Watson stat.16585 Prob(F-statistic) 0.056408 Second-Stage SSR 44.140 J-statistic 0.000000 Instrument rank 34

10.3 적률방법에기초한추정량 ( 예 ) 임금함수추정 OLS 추정 기혼여성의임금 = f ( 교육연수, 경험연수 ) 아래 OLS 추정결과는문제가있을수있음 누락변수의문제가있을가능성이높음 - 능력 은임금에영향을미치지만누락변수여서오차항에반영됨 - 능력 이있는사람은교육연수가길수있음 ( ) ln WAGE =β +β EDUC +β EXPER +β EXPER + e 1 3 4 ( WAGE) + EDUC + EXPER EXPER ln =.50.1075.0416.0008 (se) (.1986) (.0141) (.013) (.0004) cov ( EDUC, e) 0 OLS 추정결과는불편추정량도일치추정량도아님 35

10.3 적률방법에기초한추정량 OLS 추정결과 ( ) ln WAGE =β +β EDUC +β EXPER +β EXPER + e 1 3 4 Dependent Variable: LNWAGE Method: Least Squares Date: 09/18/1 Time: 13:0 Sample: 1 753 IF WAGE>0 Included observations: 48 교육을 1 년더받으면, 임금이 10.7% 증가한다는의미, 추청치의크기가상식밖으로너무큰값으로나타남 Variable Coefficient Std. Error t-statistic Prob. C -0.5041 0.19863 -.68179 0.0089 EDUC 0.107490 0.014146 7.59833 0.0000 EXPER 0.041567 0.013175 3.154906 0.0017 EXPER -0.000811 0.000393 -.06834 0.0397 R-squared 0.15680 Mean dependent var 1.190173 Adjusted R-squared 0.150854 S.D. dependent var 0.73198 S.E. of regression 0.66640 Akaike info criterion.035509 Sum squared resid 188.3051 Schwarz criterion.073445 Log likelihood -431.5990 Hannan-Quinn criter..05049 F-statistic 6.8615 Durbin-Watson stat 1.960988 Prob(F-statistic) 0.000000 36

( 예) 임금함수추정 - 수단변수추정법을이용 딸의교육연수는엄마의교육연수와밀접히관련되어있을수있음 이관계를고려하여연립방정식구성하여 SLS로추정하는방법있음 (1) 아래식을 OLS로추정 () 임금함수추정에대신그것의추정치 EDUC 를이용 cov ( EDUC, e ) = 0 이므로 OLS 로추정가능함 10.3 적률방법에기초한추정량 EDUC = 9.7751 +.0489 EXPER.0013 EXPER +.677 MOTHEREDUC (se) (.449) (.0417) (.001) (.0311) EDUC ( ) WAGE = + EDUC + EXPER EXPER ln.198.0493.0449.0009 (se) (.479) (.0374) (.0136) (.0004) - EDUC 는수단변수의역할 ( 유의성낮음, 불충분한개선 ) 37

10.3 적률방법에기초한추정량 SLS 추정결과 ( ) ln WAGE =β +β EDUC +β EXPER +β EXPER + e 1 3 4 <Quick>-<Estimate Equation> 클릭, Dependent Variable: LNWAGE <Method> 에서 <TSLS> 선택, Method: Two-Stage Least Squares 윗칸 : lnwage c educ exper exper Date: 09/18/1 Time: 13:39 아랫칸 : exper exper mothereduc Sample: 1 753 IF WAGE>0 Sample: 1 753 if wage>0 Included observations: 48 Instrument specification: EXPER EXPER MOTHEREDUC Constant added to instrument list Variable Coefficient Std. Error t-statistic Prob. C 0.198186 0.47877 0.419107 0.6754 EDUC 0.04963 0.037436 1.31594 0.1889 EXPER 0.044856 0.013577 3.303856 0.0010 EXPER -0.0009 0.000406 -.68993 0.038 R-squared 0.13130 Mean dependent var 1.190173 Adjusted R-squared 0.11696 S.D. dependent var 0.73198 S.E. of regression 0.679604 Sum squared resid 195.891 F-statistic 7.347957 Durbin-Watson stat 1.941610 Prob(F-statistic) 0.00008 Second-Stage SSR 13.146 J-statistic 0.000000 Instrument rank 4 38

수단변수가과잉인경우의수단변수추정법 단순회귀모형의경우수단변수는하나만필요함 그러나보통그보다더많은수단변수를가지게됨 w x e 10.3 적률방법에기초한추정량 예를들어는와는상관되지만와는상관되지않는 또하나의수단변수라고하면세개의적률조건이만들어짐 두개의미지수 ˆβ 1 ˆβ 에대해세개의관계식이존재 39

수단변수가과잉인경우의수단변수추정법 ( 계속 ) 이경우는다음의추정절차가최선의방법으로알려져있음 x 0 1 + = a + a z a w xˆ (1) 를 OLS 로추정하여, 을구함 x xˆ 10.3 적률방법에기초한추정량 () 의수단변수로을사용하여회귀모수를 OLS 추정함 두단계의 OLS를이용하여모수를추정하므로, 수단변수추정량을 단계최소제곱추정량 (two-stage least squares estimators: SLS) 이라고도함 40

( 예 3) 임금함수추정 - 수단변수과잉경우의추정법 딸의교육연수는엄마의교육연수와아빠의교육연수모두와밀접히 관련되어있을수있음 이관계를고려하여연립방정식구성하여 SLS 로추정하는방법있음 (1) 아래식을 OLS 로추정, 추정결과는 < 표 10.1> 10.3 적률방법에기초한추정량 EDUC = f ( EXPER, EXPER, MOTHEREDUC, FATHEREDUC) () 임금함수추정에 EDUC 대신그것의추정치 EDUC 을이용 ln WAGE =.0481 +.0614 EDUC +.044 EXPER.0009EXPER ( ) (se) (.4003) (.0314) (.0134) (.0004) 앞의추정결과와는달리 EDUC 추정치가유의하게나타남 41

SLS 추정결과 Dependent Variable: LNWAGE Method: Two-Stage Least Squares Date: 09/19/1 Time: 10:01 Sample: 1 753 IF WAGE>0 Included observations: 48 10.3 적률방법에기초한추정량 ( ) ln WAGE =β +β EDUC +β EXPER +β EXPER + e 1 3 4 <Quick>-<Estimate Equation> 클릭, <Method> 에서 <TSLS> 선택, 윗칸 : lnwage c educ exper exper 아랫칸 : exper exper mothereduc fathereduc Sample: 1 753 if wage>0 Instrument specification: EXPER EXPER MOTHEREDUC FATHEREDUC Constant added to instrument list Variable Coefficient Std. Error t-statistic Prob. C 0.048100 0.40038 0.1015 0.9044 EDUC 0.061397 0.031437 1.95304 0.0515 EXPER 0.044170 0.01343 3.8839 0.0011 EXPER -0.000899 0.00040 -.37993 0.057 R-squared 0.135708 Mean dependent var 1.190173 Adjusted R-squared 0.19593 S.D. dependent var 0.73198 S.E. of regression 0.67471 Sum squared resid 193.000 F-statistic 8.140709 Durbin-Watson stat 1.945659 Prob(F-statistic) 0.00008 Second-Stage SSR 1.096 J-statistic 0.374538 Instrument rank 5 Prob(J-statistic) 0.540541 4

10.3 적률방법에기초한추정량 수단변수추정법 일반적인경우 y =β +β x + β x + e 1 K K 설명변수중일부가내생변수 ( 오차항과상관된변수 ) 라고하자 G exogenous variables B endogenous variables y =β +β x + β x +β x + +β x + e 1 G G G+ 1 G+ 1 K K L 개의수단변수있다고하자 ; z1, z,..., zl (1) 다음식을 OLS로추정, xg + j =γ 1j +γ j x + +γ Gj xg +θ 1j z1 + +θ Lj zl + vj, ( j = 1,, B) () 내생변수의추정치구함 xˆ ˆ ˆ ˆ ˆ ˆ G+ j =γ 1j +γ j x + +γ Gj xg +θ 1j z1 + +θ Lj zl, ( j = 1,, B) (3) 두번째단계의 OLS 추정 y =β +β x + β x +β xˆ + +β xˆ + error 1 G G G+ 1 G+ 1 K K 43

10.4 모형설정에대한검정 설명변수가오차항과상관되어있는지를검정 하우스만검정 (Hausman test) OLS 이용할것인지수단변수법이용할것인지를판단함 선택한수단변수가충분히강한지 ( 적절한지 ) 를검정 선택한수단변수가오차항과비상관되었는지여부에대한검정 44

(1) 설명변수와오차항사이의상관관계검정 ( 내생성검정 ) ( ) H0 : Cov x, e = 0 하우스만검정 (Hausman test) H1 : Cov( x, e) 0 귀무가설이참인경우 - OLS 추정량과수단변수추정량은모두일치추정량임 - 대표본인경우동일해짐, 즉 OLS 사용하는것이적절함 귀무가설이거짓인경우 ( ) - OLS 추정량은일치추정량아니고, 수단변수추정량은일치추정량임 - 대표본인경우에도양자는차이남, 즉 q= b ˆ ols β IV 0 수단변수추정량사용하는것이적절함 10.4 모형설정에대한검정 ( ols IV ) q= b β ˆ c 0 45

10.4 모형설정에대한검정 Hausman test < 방법 1> y =β +β x + e 에서설명변수와오차항의상관여부를알고자함 t 1 t t 수단변수는, z 라고하자 1 OLS 이용하여 x = a + az + az + v 를추정, 잔차를계산 z1 t 0 1 t1 t t 인위적인회귀식 y x v e ˆ t =β 1+β t +δ t + t 를 OLS 로추정 3 t- 검정이용하여다음과같은유의성검정실시 0 1 ( ) ( ) H : δ= 0 no correlation between x and e H : δ 0 correlation between x and e z z 불필요 OLS로충분 1, x~ y~ e cov( xe, ) 0 OLS 추정량의성과와수단변수추정량의성과를비교하는검정 46

Hausman 검정결과 / 앞에서 Monte Carlo simulation 에서사용한자료 Dependent Variable: Y Method: Least Squares Date: 09/19/1 Time: 18:38 Sample: 1 100 Included observations: 100 귀무가설기각, 즉설명변수와오차항은상관됨 따라서수단변수추정법을사용하여야함 10.3 적률방법에기초한추정량 Variable Coefficient Std. Error t-statistic Prob. C 1.137591 0.079746 14.6510 0.0000 X 1.03987 0.133013 7.817819 0.0000 VHAT 0.99578 0.16939 6.111053 0.0000 R-squared 0.845043 Mean dependent var 1.38687 Adjusted R-squared 0.841848 S.D. dependent var 1.838819 S.E. of regression 0.73168 Akaike info criterion.41466 Sum squared resid 51.87097 Schwarz criterion.31961 Log likelihood -109.0733 Hannan-Quinn criter..73097 F-statistic 64.4899 Durbin-Watson stat.04781 Prob(F-statistic) 0.000000 47

10.3 적률방법에기초한추정량 Hausman 검정결과 () / 앞에서 Monte Carlo simulation 에서사용한자료 OLS 결과 Dependent Variable: Y Variable Coefficient Std. Error t-statistic Prob. C 0.978893 0.08881 11.08838 0.0000 X 1.703431 0.089950 18.93754 0.0000 SLS 결과 Instrument specification: Z1 Z Variable Coefficient Std. Error t-statistic Prob. C 1.137591 0.116444 9.769431 0.0000 X 1.03987 0.1943 5.3540 0.0000 Endogeneity Test Specification: Y C X Instrument specification: C Z1 Z Endogenous variables to treat as exogenous: X <TSLS> 추정후, <View>-<IV Diagnostics and Tests/>- <Regressor Endogeneity Test> 클릭 Value df Probability Difference in J-stats 7.4186 1 0.0000 48

10.3 적률방법에기초한추정량 Hausman 검정결과 (3) / 앞의저축함수추정에서사용한자료 OLS 결과 Dependent Variable: SAVINGS Variable Coefficient Std. Error t-statistic Prob. C 4.34769 0.856116 5.07643 0.0000 INCOME -0.005185 0.011163-0.464539 0.6444 SLS 결과 Instrument specification: C AVERAGE_INCOME Variable Coefficient Std. Error t-statistic Prob. C 0.98867 1.3096 0.747500 0.4584 INCOME 0.039176 0.017381.53907 0.088 Endogeneity Test Specification: SAVINGS C INCOME Instrument specification: C AVERAGE_INCOME Endogenous variables to treat as exogenous: INCOME <TSLS> 추정후, <View>-<IV Diagnostics and Tests/>-<Regressor Endogeneity Test> 클릭 Value df Probability Difference in J-stats 11.08634 1 0.0009 49

10.4 모형설정에대한검정 Hausman test <SAS 에서의검정방법 > : 저축함수경우 OLS 추정량과수단변수추정량을각각추정하여비교 <SAS program> proc model data=savings ; parms b1 b ; exogenous z ; y = b1 + b*x ; fit y / ols sls hausman ; * Automatic Hausman test; * parms; * instrument; * model; * Hausman comparing OLS-sls; <Hausman's Specification Test Results> Comparing To DF Statistic Pr > ChiSq OLS SLS 7.11 0.086 귀무가설기각, 즉설명변수와오차항은상관됨따라서수단변수추정법을사용하여야함 50

10.4 모형설정에대한검정 () 약한수단변수에대한검정 선택한변수가약한수단변수인경우라면, 수단변수추정량은큰편의및큰표준오차를가질수있음 다음과같은모형을생각해보자 y =β +β x + +β x +β x + e 1 G G G+ 1 G+ 1 x, x 3,, x G 는외생변수, x G+1 은내생변수, z 1 은수단변수 x =γ +γ x + +γ x +θ z + v G+ 1 1 G G 1 1 z 1 이강한수단변수인지약한수단변수인지를검정하는방법 H : θ = 0 검정, t- 값이 3.3 보다작으면, 약한수단변수로판단 0 1 51

10.3 적률방법에기초한추정량 Test for weak instruments / Monte Carlo simulation 에서사용한자료 Dependent Variable: X Method: Least Squares Date: 09/19/1 Time: 18:3 Sample: 1 100 Included observations: 100 Variable Coefficient Std. Error t-statistic Prob. C 0.19473 0.079499.449486 0.0161 Z1 0.569978 0.088785 6.419747 0.0000 Z 0.06786 0.077161.679940 0.0087 R-squared 0.333594 Mean dependent var 0.39161 Adjusted R-squared 0.319854 S.D. dependent var z 0.956655 1 z S.E. of regression 0.788963 Akaike info criterion.393346 Sum squared resid 60.37887 Schwarz criterion.471501 Log likelihood -116.6673 Hannan-Quinn criter..44977 F-statistic 4.7844 Durbin-Watson stat 1.88811 Prob(F-statistic) 0.000000 z1 z 은유의 ( 강한수단변수 ), 의 t 값은 3.3 보다작음 ( 약한수단변수 ) 두추정치가동시에 0 이라는귀무가설 ( 결합가설 ) 에대해 F- 검정, 기각 5

< 과제 > 10.5 / data 는 WILEY 교과서홈페이지에있음 http://principlesofeconometrics.com/poe3/poe3.htm 53