Principles of Econometrics (3e) 013 년 1 학기 윤성민
10.0 서론 The assumptions of the simple linear regression are: SR1. SR. yi =β 1 +β xi + ei i= 1,, N Ee ( i ) = 0 SR3. var( e i ) = σ SR4. cov( e, e ) = 0 i j SR5. The variable x i is not random, and it must take at least two different values. SR6. (optional) e N σ i ~ (0, ) In this chapter, we relax the assumption that variable x is not random.
10.0 서론 설명변수 x 는확률적인가아닌가? 경제학자가사용하는통계는대부분비실험적성격의통계 x와 y의값은보통동시에알려짐 따라서 x와 y는모두확률변수라고볼수있음 지금까지 (1~9장) 설명변수가확률적이아니라고생각한이유 - 통제된실험에의한자료를분석하는경우에타당한가정임 - OLS와관련된대수학을간단하게처리할수있음 - x가확률적이더라도 OLS를사용할수있는경우가있음 3
10.0 서론 10 장의주요내용 이제부터는설명변수가확률적이라고가정함 어떤경우 ( 혹은조건하에서 ) 여전히 OLS를사용해도좋은가? E( e x ) = 0, 혹은 cov ( xe, ) = 0 어떤경우에 OLS는적절한추정법이되지못하는가? E e x, 혹은 cov ( xe, ) 0 ( ) 0 설명변수가확률적인경우에적절한추정법은무엇인가? 적률추정법 Method of Moments Estimation (MM 혹은 GMM) 4
10.1 x 가확률변수인경우의 OLS 10.1 x 가확률변수인경우의 OLS 이장에서는가정을다음과같이수정하기로함 A10.1 는모집단에서 y 와 x 의관계를적절하게 나타냄 ( 선형모형가정의타당성 ) A10. x, y 자료들은무작위표본추출 (random sampling) 을 A10.3 통해수집되었음. 즉, x, y ~ iid (x i 는확률변수라고가정 ) A10.4 x i 는적어도 개의상이한값을가짐 A10.5 A10.6 y =β +β x + e i 1 i i ( ) i i ( ) ( ) E e x = 0 cov( x, e ) = 0 i i i i ( e x ) = σ var i i ( ) e x ~ N 0, σ i i i i 5
(1) OLS 추정량의소표본특성 E( e x ) = 0 ( ) cov xe, = 0, 혹은이면 10.1 x 가확률변수인경우의 OLS OLS를적용해도아무문제없음즉, 설명변수가확률변수이더라도위경우라면 OLS 추정량은 BLUE Gauss-Markov 정리에의해유한표본 (finite sample) 혹은소규모표본 (small sample) 에서도성립함 자료가무작위표본추출법을통하여구해졌다면, OLS 추정법은표본의크기와무관하게사용할수있음 6
() OLS 추정량의점근적특성 : x 가확률적이아닌경우 (Asymptotic (Large) Sample Properties of the Least Squares Estimator) 대규모표본이면, 오차항이정규분포하든하지않든다음의두가지특성이존재함. (a) OLS 추정량은불편추정량이다. (b) OLS 추정량의분산은 0으로수렴한다. ( 일치추정량, consistent estimator) 10.1 x 가확률변수인경우의 OLS 7
10.1 x 가확률변수인경우의 OLS 일치성 (consistency of estimator) - 대규모표본에서나타나는특성, 점근적특성 - 표본의크기가증가하면추정치는모수에근접함을의미 8
10.1 x 가확률변수인경우의 OLS (3) OLS 추정량의점근적특성 : x 가확률적인경우 ( ) : cov xe, = 0 의경우 (a) 대표본이면 OLS 추정량은일치추정량이다 ( 추정치는모수에근접혹은수렴함 ) (b) 대표본이면 OLS 추정량은정규분포한다 ( 통상적인구간추정, 가설검정타당함 ) 9
(4) OLS 추정량의점근적특성 : x 가확률적인경우 ( ) : cov xe, 0 의경우 10.1 x 가확률변수인경우의 OLS 대표본이더라도 OLS 추정량은일치추정량이아니다 OLS 추정치는모수에수렴하지않음통상적인구간추정이나가설검정타당하지않음 요약 cov ( xe, ) = 0 cov ( xe, ) 0 이면, 설명변수가확률적이더라도 OLS 적용가능 이면, OLS 는적절한추정방법이아님 ( 대표본경우에도 ) cf. 검정방법 : Hausman test (10.4) 10
cov ( xe, ) 0 10.1 x 가확률변수인경우의 OLS 의경우, OLS 가일치추정량이아닌이유 : Monte Carlo 모의분석기법을이용한설명 cov( x, e) > 0인가상적인 x와 e 통계자료생성 ( 상관계수 0.6) 그림 10. 모회귀선이 즉, 모수의참값은 E y) = β 1 + β x = 1+ 1 x ( β =1 β = 1 1 다음과같이인위적인 y 값생성 라고가정하자 이라고가정 인위적으로생성된 (y,x) 자료를이용, OLS 로추정 그림 10.3 기울기가체계적으로과대평가, 대표본인경우에도과대평가 OLS 추정량은일치추정량아님 y = E y) + e = β 1 + β x + e = 1+ 1 x + e ( 11
cov( x, e) > 0 인가상적인 x 와 e 와통계 10.1 x 가확률변수인경우의 OLS y = 1+ 1 x + e OLS 추정 체계적인오류 1
10.1 x 가확률변수인경우의 OLS cov( x, e) > 0 인가상적인 x 와 e 와통계 y = 1+ 1 x + e Dependent Variable: Y Method: Least Squares Date: 09/19/1 Time: 10:43 Sample: 1 100 Included observations: 100 Variable Coefficient Std. Error t-statistic Prob. C 0.978893 0.08881 11.08838 0.0000 X 1.703431 0.089950 18.93754 0.0000 R-squared 0.785385 Mean dependent var 1.38687 Adjusted R-squared 0.783195 S.D. dependent var 1.838819 S.E. of regression 0.856198 Akaike info criterion.547166 Sum squared resid 71.8418 Schwarz criterion.59970 Log likelihood -15.3583 Hannan-Quinn criter..56853 F-statistic 358.6306 Durbin-Watson stat.103601 Prob(F-statistic) 0.000000 OLS 추정 체계적인오류 13
10.1 x 가확률변수인경우의 OLS cov( x, e) > 0 인가상적인 x 와 e 와통계 y = 1+ 1 x + e Dependent Variable: Y Method: Generalized Method of Moments Date: 09/19/1 Time: 17:46 Sample: 1 100 Included observations: 100 Linear estimation with 1 weight update Estimation weighting matrix: HAC (Bartlett kernel, Newey-West fixed bandwidth = 5.0000) Standard errors & covariance computed using estimation weighting matrix Instrument specification: Z1 Z Constant added to instrument list Variable Coefficient Std. Error t-statistic Prob. C 1.166695 0.106393 10.96593 0.0000 X 1.06139 0.19078 5.578105 0.0000 R-squared 0.67346 Mean dependent var 1.38687 Adjusted R-squared 0.670130 S.D. dependent var 1.838819 S.E. of regression 1.056113 Sum squared resid 109.3068 Durbin-Watson stat 1.9690 J-statistic 3.5889 Instrument rank 3 Prob(J-statistic) 0.06057 GMM 추정 체계적인오류나타나지않음 14
10.1 x 가확률변수인경우의 OLS cov( x, e) > 0 인가상적인 x 와 e 와통계 y = 1+ 1 x + e Dependent Variable: Y Method: Two-Stage Least Squares Date: 09/19/1 Time: 17:48 Sample: 1 100 Included observations: 100 Instrument specification: Z1 Z Constant added to instrument list Variable Coefficient Std. Error t-statistic Prob. C 1.137591 0.116444 9.769431 0.0000 X 1.03987 0.1943 5.3540 0.0000 R-squared 0.66607 Mean dependent var 1.38687 Adjusted R-squared 0.66801 S.D. dependent var 1.838819 S.E. of regression 1.067780 Sum squared resid 111.7351 F-statistic 8.66555 Durbin-Watson stat 1.967390 Prob(F-statistic) 0.000001 Second-Stage SSR 30.0610 J-statistic 3.5550 Instrument rank 3 Prob(J-statistic) 0.059366 SLS 추정 체계적인오류나타나지않음 15
10. x 와 e 가상관된경우 10. x 와 e 가상관된경우 cov ( xe, ) 0 측정오차 (Measurement Error) 혹은변수오차 (Errors-in-variables) 문제 누락변수 (Omitted Variables) 연립방정식편의 (Simultaneous Equations Bias) 계열상관이존재하는시차종속변수모형 (Lagged Dependent Variable Models with Serial Correlation) 공통점 - 설명변수가내생적으로결정됨 - 내생성문제 (endogeneity problem) 가존재한다고말함 16
10. x 와 e 가상관된경우 (1) 측정오차혹은변수오차문제 설명변수를측정할때오차가있는경우 ( 예 ) 저축함수추정할때, 저축 (y) 은항상소득에의존한다고가정 y =β +β x + v * i 1 i i 항상소득 (x*) 의대리변수 (proxy variable) 로현재소득 (x) 사용 x = x + u * i i i * yi =β 1 +β xi + vi =β 1 +β + =β +β x + v β u =β +β x + e ( xi ui) vi ( ) 1 i i i 1 i i * ( x e ) = E( xe ) = E ( x + u )( v β u ) cov, = E β = β σ 0 i i i i i i i i ( ui ) u ( ) 따라서측정오차경우 OLS 는부적절한추정방법임 cov xe, 0 17
10. x 와 e 가상관된경우 설명변수측정오차문제의사례 ( 교과서 p. 381), 저축 =f( 현재소득 ) Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 0.074 0.074 0. 0.6444 Error 48 49.09998 1.09 Corrected Total 49 49.307 Root MSE 1.01139 R-Square 0.0045 Dependent Mean 3.95066 Adj R-Sq -0.0163 Coeff Var 5.60061 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept 1 4.3477 0.8561 5.07 <.0001 x 1-0.00519 0.01116-0.46 0.6444 18
10. x 와 e 가상관된경우 () 누락변수 누락된변수가포함된설명변수와상관된경우에는 cov ( xe, ) 0 ( 예 ) 임금함수 WAGE =β +β EDUC + e i 1 i i - EDUC 는교육받은연수 누락변수 (Omitted Variables) : 경험, 능력, 열의 ( 동기 ) 등등 - 누락된요인들의영향은오차항에포함됨 - 누락변수들은교육연수와밀접히관련되어있음 cov( EDUC, e ) 0 i i OLS 는부적절 ( 불편추정량아님, 일치추정량아님 ) 19
10. x 와 e 가상관된경우 (3) 연립방정식편의 ( 예 ) 수요-공급모형 경쟁시장에서균형가격 (P i ) 과균형 ( 수급 ) 량 (Q i ) 은동시에결정되므로모두내생변수임 이를무시하고 ( 가격을외생변수로가정하고 ), 아래의단일방정식을 OLS로추정하면, 내생성문제가발생함 Q =β +β P + e i 1 i i 내생성을고려하면 cov( Pe, ) 0 i i OLS 는부적절 ( 불편추정량아님, 일치추정량아님 ) 연립방정식편의 (simultaneous equations bias) 라고함 0
10. x 와 e 가상관된경우 (4) 계열상관이존재하는시차종속변수모형 시차종속변수가설명변수로포함된모형, 예를들어 y =β +β y +β x + e t 1 t 1 3 t t 이모형의오차항이시계열적으로상관되는경우, 예를들어 AR(1) process: e t =ρ e t 1 + v t 만약이라면, y t-1 ~ e t-1 ~ e t 셋모두관련됨 ρ 0 cov( y, e ) 0 t 1 t OLS 는부적절 ( 불편추정량아님, 일치추정량아님 ) 1
10.3 적률방법에기초한추정량 ( ) cov xe, 0 이면, y =β +β x + e t 1 t t OLS 추정량은불편추정량도일치추정량도아님, 대안필요함 적률방법추정량 cov ( xe, ) = 0 cov ( xe, ) 0 이면 OLS 추정량과동일해짐 이면 수단변수추정법, SLS ( 단계 OLS) 와동일
10.3 적률방법에기초한추정량 적률추정방법 모집단에서의적률 (moment) - 확률변수 Y 의 k 번째모집단적률은다음과같이정의됨 k ( ) =µ k = 'th moment of EY k Y 표본에서의적률 - k 번째표본적률은다음과같이정의됨 EY =µ ˆ = k th sample moment of Y ( k ) k k = yi N k 번째모집단적률은 k 번째표본적률로추정가능 ( 일치추정량 ) 3
10.3 적률방법에기초한추정량 적률방법에서의추정절차 m번째모집단적률을 m번째표본적률과같다고놓고 m개의미지의모수를추정함 - 즉 µ ( = µ ) 1 를 µ ( = ˆ µ ), 를 ˆµ 로, 이렇게각각의적률을추정함 ( ) ˆ 1 Population Moments ( ) 1 µ Sample Moments EY =µ =µ µ= ˆ y N EY =µ µ ˆ = y N i i 4
적률방법에의한평균및분산의추정방법 모집단평균의추정량 µ= ˆ yi N = y 10.3 적률방법에기초한추정량 모집단분산의추정량 ( 불편추정량과약간다르나, 일치추정량 ) σ =µ µ = = = N N N ( ) yi yi Ny yi y ˆ ˆ y 5
적률방법에의한회귀모형의추정방법 ( ) cov xe, = 0 : 인경우 적률조건 (moment conditions) ( ) ( ) E e = 0 E y β β x = 0 i i 1 i ( ) ( ) E xe i i = 0 E x i yi β1 βxi = 0 두개의모집단적률을표본적률로대체시키면, 10.3 적률방법에기초한추정량 y =β +β x + e t 1 t t β, β 1 의적률방법추정량 b,b 1 를아래와같이구할수있음 1 N 1 N ( yi b1 bx i) = ( ) i i 1 i 0 x y b bx = 0 b = ( xi x)( yi y) ( xi x) b= y bx 1 OLS 와 동일 6
적률방법에의한회귀모형의추정방법 ( ) : cov xe, 0 인경우 두번째적률조건을사용할수없게됨, 왜냐하면 그렇지만두번째적률조건을만족시키는또다른 가있을 수있음 ( 이변수를수단변수 (instrumental variable) 라함 ) ( ) ( ) E ze i i = 0 E zi yi β1 βxi = 0 그러면다음표본적률조건으로 β 1, β 의추정량을구할수있음 1 ( y ˆ ˆ ) i β1 β xi = 0 N 1 z ( ˆ ˆ ) i yi β1 β xi = 0 N 1 이적률방법추정량을수단변수추정량이라고함 ( ) 0 E xe i i i i ( zi z)( yi y) i i i i ( i )( i ) ˆ N zy z y β = = N zx z x z z x x β ˆ = y βˆ x 10.3 적률방법에기초한추정량 z t t 7
10.3 적률방법에기초한추정량 수단변수추정량의특성 ( ) cov ze, = 0 이면, 수단변수추정량은일치추정량임 대표본인경우, 수단변수추정량은정규분포를함 ˆ σ β ~ N β, ( xt x) r zx 수단변수추정량의효율성을높이기위해서는 x와긴밀히상관된변수를수단변수 (z) 로선택해야함 r zx ( 이유 ) 이커질수록수단변수추정량의분산이작아짐 오차항및추정량의분산은다음과같이계산하면됨 σ ˆ = IV ( y ˆ ˆ ) i β1 βxi var ( ˆ ) N σ β = = ( i ) var r r zx x x zx ( b ) 8
10.3 적률방법에기초한추정량 ( 예1) 수단변수추정법을이용한저축함수추정 저축 = f ( 항상소득 ) 앞에서항상소득의대리변수로 현재소득 (x) 을이용하여저축함수를 OLS로추정하면, 측정오차혹은변수오차의문제가있음을보았음 OLS 추정결과는불편추정량도일치추정량도아님 Sˆ = 4.348 0.005x OLS (se) (0.856) (0.001) 이제항상소득의수단변수로 10년간의평균소득 (z) 을이용해보자. 이수단변수는항상소득 ( 장기평균소득 ) 을더잘대변함이수단변수는항상소득과도상관되며, 현재소득과도상관됨 Sˆ = 0.9883 + 0.039z OLS (se) (1.54) (0.00) 9
10.3 적률방법에기초한추정량 SAS program <OLS / Linear model> <OLS / Non-linear model> proc reg ; proc model ; model y = x ; parms b1 b ; y = b1 + b*x ; fit y ; < 수단변수추정법 > proc model ; parms b1 b ; exogenous z ; y = b1 + b*x ; fit y / sls ; * instruments; 30
10.3 적률방법에기초한추정량 PROC REG, OLS, 저축 =f( 현재소득 ) Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 0.074 0.074 0. 0.6444 Error 48 49.09998 1.09 Corrected Total 49 49.307 Root MSE 1.01139 R-Square 0.0045 Dependent Mean 3.95066 Adj R-Sq -0.0163 Coeff Var 5.60061 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept 1 4.3477 0.8561 5.07 <.0001 Income 1-0.00519 0.01116-0.46 0.6444 31
10.3 적률방법에기초한추정량 수단변수추정법 : SLS Nonlinear SLS Summary of Residual Errors DF DF Adj Equation Model Error SSE MSE Root MSE R-Square R-Sq Savings 48 65.557 1.3595 1.1660-0.331-0.3507 Nonlinear SLS Parameter Estimates Approx Approx Parameter Estimate Std Err t Value Pr > t b1 0.98867 1.54 0.65 0.5198 b 0.039176 0.000 1.96 0.0564 3
10.3 적률방법에기초한추정량 OLS, 저축 =f( 현재소득 ) savings.wfl Dependent Variable: SAVINGS Method: Least Squares Date: 09/17/1 Time: 3:48 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-statistic Prob. C 4.34769 0.856116 5.07643 0.0000 INCOME -0.005185 0.011163-0.464539 0.6444 R-squared 0.004476 Mean dependent var 3.950660 Adjusted R-squared -0.01664 S.D. dependent var 1.00367 S.E. of regression 1.011393 Akaike info criterion.899713 Sum squared resid 49.09998 Schwarz criterion.976194 Log likelihood -70.498 Hannan-Quinn criter..98837 F-statistic 0.15796 Durbin-Watson stat 1.856169 Prob(F-statistic) 0.64436 상식밖의결과 33
10.3 적률방법에기초한추정량 수단변수추정법 : SLS Dependent Variable: SAVINGS Method: Two-Stage Least Squares Date: 09/18/1 Time: 00:07 Sample: 1 50 Included observations: 50 Instrument specification: AVERAGE_INCOME Constant added to instrument list <Quick>-<Estimate Equation> 클릭, <Method> 에서 <TSLS> 선택, 윗칸 : savings c income 아랫칸 : average_income Variable Coefficient Std. Error t-statistic Prob. C 0.98867 1.54164 0.648400 0.5198 INCOME 0.039176 0.00038 1.955094 0.0564 R-squared -0.33089 Mean dependent var 3.950660 Adjusted R-squared -0.350653 S.D. dependent var 1.00367 S.E. of regression 1.165973 Sum squared resid 65.5569 F-statistic 3.8391 Durbin-Watson stat.16585 Prob(F-statistic) 0.056408 Second-Stage SSR 44.140 J-statistic 0.000000 Instrument rank 34
10.3 적률방법에기초한추정량 ( 예 ) 임금함수추정 OLS 추정 기혼여성의임금 = f ( 교육연수, 경험연수 ) 아래 OLS 추정결과는문제가있을수있음 누락변수의문제가있을가능성이높음 - 능력 은임금에영향을미치지만누락변수여서오차항에반영됨 - 능력 이있는사람은교육연수가길수있음 ( ) ln WAGE =β +β EDUC +β EXPER +β EXPER + e 1 3 4 ( WAGE) + EDUC + EXPER EXPER ln =.50.1075.0416.0008 (se) (.1986) (.0141) (.013) (.0004) cov ( EDUC, e) 0 OLS 추정결과는불편추정량도일치추정량도아님 35
10.3 적률방법에기초한추정량 OLS 추정결과 ( ) ln WAGE =β +β EDUC +β EXPER +β EXPER + e 1 3 4 Dependent Variable: LNWAGE Method: Least Squares Date: 09/18/1 Time: 13:0 Sample: 1 753 IF WAGE>0 Included observations: 48 교육을 1 년더받으면, 임금이 10.7% 증가한다는의미, 추청치의크기가상식밖으로너무큰값으로나타남 Variable Coefficient Std. Error t-statistic Prob. C -0.5041 0.19863 -.68179 0.0089 EDUC 0.107490 0.014146 7.59833 0.0000 EXPER 0.041567 0.013175 3.154906 0.0017 EXPER -0.000811 0.000393 -.06834 0.0397 R-squared 0.15680 Mean dependent var 1.190173 Adjusted R-squared 0.150854 S.D. dependent var 0.73198 S.E. of regression 0.66640 Akaike info criterion.035509 Sum squared resid 188.3051 Schwarz criterion.073445 Log likelihood -431.5990 Hannan-Quinn criter..05049 F-statistic 6.8615 Durbin-Watson stat 1.960988 Prob(F-statistic) 0.000000 36
( 예) 임금함수추정 - 수단변수추정법을이용 딸의교육연수는엄마의교육연수와밀접히관련되어있을수있음 이관계를고려하여연립방정식구성하여 SLS로추정하는방법있음 (1) 아래식을 OLS로추정 () 임금함수추정에대신그것의추정치 EDUC 를이용 cov ( EDUC, e ) = 0 이므로 OLS 로추정가능함 10.3 적률방법에기초한추정량 EDUC = 9.7751 +.0489 EXPER.0013 EXPER +.677 MOTHEREDUC (se) (.449) (.0417) (.001) (.0311) EDUC ( ) WAGE = + EDUC + EXPER EXPER ln.198.0493.0449.0009 (se) (.479) (.0374) (.0136) (.0004) - EDUC 는수단변수의역할 ( 유의성낮음, 불충분한개선 ) 37
10.3 적률방법에기초한추정량 SLS 추정결과 ( ) ln WAGE =β +β EDUC +β EXPER +β EXPER + e 1 3 4 <Quick>-<Estimate Equation> 클릭, Dependent Variable: LNWAGE <Method> 에서 <TSLS> 선택, Method: Two-Stage Least Squares 윗칸 : lnwage c educ exper exper Date: 09/18/1 Time: 13:39 아랫칸 : exper exper mothereduc Sample: 1 753 IF WAGE>0 Sample: 1 753 if wage>0 Included observations: 48 Instrument specification: EXPER EXPER MOTHEREDUC Constant added to instrument list Variable Coefficient Std. Error t-statistic Prob. C 0.198186 0.47877 0.419107 0.6754 EDUC 0.04963 0.037436 1.31594 0.1889 EXPER 0.044856 0.013577 3.303856 0.0010 EXPER -0.0009 0.000406 -.68993 0.038 R-squared 0.13130 Mean dependent var 1.190173 Adjusted R-squared 0.11696 S.D. dependent var 0.73198 S.E. of regression 0.679604 Sum squared resid 195.891 F-statistic 7.347957 Durbin-Watson stat 1.941610 Prob(F-statistic) 0.00008 Second-Stage SSR 13.146 J-statistic 0.000000 Instrument rank 4 38
수단변수가과잉인경우의수단변수추정법 단순회귀모형의경우수단변수는하나만필요함 그러나보통그보다더많은수단변수를가지게됨 w x e 10.3 적률방법에기초한추정량 예를들어는와는상관되지만와는상관되지않는 또하나의수단변수라고하면세개의적률조건이만들어짐 두개의미지수 ˆβ 1 ˆβ 에대해세개의관계식이존재 39
수단변수가과잉인경우의수단변수추정법 ( 계속 ) 이경우는다음의추정절차가최선의방법으로알려져있음 x 0 1 + = a + a z a w xˆ (1) 를 OLS 로추정하여, 을구함 x xˆ 10.3 적률방법에기초한추정량 () 의수단변수로을사용하여회귀모수를 OLS 추정함 두단계의 OLS를이용하여모수를추정하므로, 수단변수추정량을 단계최소제곱추정량 (two-stage least squares estimators: SLS) 이라고도함 40
( 예 3) 임금함수추정 - 수단변수과잉경우의추정법 딸의교육연수는엄마의교육연수와아빠의교육연수모두와밀접히 관련되어있을수있음 이관계를고려하여연립방정식구성하여 SLS 로추정하는방법있음 (1) 아래식을 OLS 로추정, 추정결과는 < 표 10.1> 10.3 적률방법에기초한추정량 EDUC = f ( EXPER, EXPER, MOTHEREDUC, FATHEREDUC) () 임금함수추정에 EDUC 대신그것의추정치 EDUC 을이용 ln WAGE =.0481 +.0614 EDUC +.044 EXPER.0009EXPER ( ) (se) (.4003) (.0314) (.0134) (.0004) 앞의추정결과와는달리 EDUC 추정치가유의하게나타남 41
SLS 추정결과 Dependent Variable: LNWAGE Method: Two-Stage Least Squares Date: 09/19/1 Time: 10:01 Sample: 1 753 IF WAGE>0 Included observations: 48 10.3 적률방법에기초한추정량 ( ) ln WAGE =β +β EDUC +β EXPER +β EXPER + e 1 3 4 <Quick>-<Estimate Equation> 클릭, <Method> 에서 <TSLS> 선택, 윗칸 : lnwage c educ exper exper 아랫칸 : exper exper mothereduc fathereduc Sample: 1 753 if wage>0 Instrument specification: EXPER EXPER MOTHEREDUC FATHEREDUC Constant added to instrument list Variable Coefficient Std. Error t-statistic Prob. C 0.048100 0.40038 0.1015 0.9044 EDUC 0.061397 0.031437 1.95304 0.0515 EXPER 0.044170 0.01343 3.8839 0.0011 EXPER -0.000899 0.00040 -.37993 0.057 R-squared 0.135708 Mean dependent var 1.190173 Adjusted R-squared 0.19593 S.D. dependent var 0.73198 S.E. of regression 0.67471 Sum squared resid 193.000 F-statistic 8.140709 Durbin-Watson stat 1.945659 Prob(F-statistic) 0.00008 Second-Stage SSR 1.096 J-statistic 0.374538 Instrument rank 5 Prob(J-statistic) 0.540541 4
10.3 적률방법에기초한추정량 수단변수추정법 일반적인경우 y =β +β x + β x + e 1 K K 설명변수중일부가내생변수 ( 오차항과상관된변수 ) 라고하자 G exogenous variables B endogenous variables y =β +β x + β x +β x + +β x + e 1 G G G+ 1 G+ 1 K K L 개의수단변수있다고하자 ; z1, z,..., zl (1) 다음식을 OLS로추정, xg + j =γ 1j +γ j x + +γ Gj xg +θ 1j z1 + +θ Lj zl + vj, ( j = 1,, B) () 내생변수의추정치구함 xˆ ˆ ˆ ˆ ˆ ˆ G+ j =γ 1j +γ j x + +γ Gj xg +θ 1j z1 + +θ Lj zl, ( j = 1,, B) (3) 두번째단계의 OLS 추정 y =β +β x + β x +β xˆ + +β xˆ + error 1 G G G+ 1 G+ 1 K K 43
10.4 모형설정에대한검정 설명변수가오차항과상관되어있는지를검정 하우스만검정 (Hausman test) OLS 이용할것인지수단변수법이용할것인지를판단함 선택한수단변수가충분히강한지 ( 적절한지 ) 를검정 선택한수단변수가오차항과비상관되었는지여부에대한검정 44
(1) 설명변수와오차항사이의상관관계검정 ( 내생성검정 ) ( ) H0 : Cov x, e = 0 하우스만검정 (Hausman test) H1 : Cov( x, e) 0 귀무가설이참인경우 - OLS 추정량과수단변수추정량은모두일치추정량임 - 대표본인경우동일해짐, 즉 OLS 사용하는것이적절함 귀무가설이거짓인경우 ( ) - OLS 추정량은일치추정량아니고, 수단변수추정량은일치추정량임 - 대표본인경우에도양자는차이남, 즉 q= b ˆ ols β IV 0 수단변수추정량사용하는것이적절함 10.4 모형설정에대한검정 ( ols IV ) q= b β ˆ c 0 45
10.4 모형설정에대한검정 Hausman test < 방법 1> y =β +β x + e 에서설명변수와오차항의상관여부를알고자함 t 1 t t 수단변수는, z 라고하자 1 OLS 이용하여 x = a + az + az + v 를추정, 잔차를계산 z1 t 0 1 t1 t t 인위적인회귀식 y x v e ˆ t =β 1+β t +δ t + t 를 OLS 로추정 3 t- 검정이용하여다음과같은유의성검정실시 0 1 ( ) ( ) H : δ= 0 no correlation between x and e H : δ 0 correlation between x and e z z 불필요 OLS로충분 1, x~ y~ e cov( xe, ) 0 OLS 추정량의성과와수단변수추정량의성과를비교하는검정 46
Hausman 검정결과 / 앞에서 Monte Carlo simulation 에서사용한자료 Dependent Variable: Y Method: Least Squares Date: 09/19/1 Time: 18:38 Sample: 1 100 Included observations: 100 귀무가설기각, 즉설명변수와오차항은상관됨 따라서수단변수추정법을사용하여야함 10.3 적률방법에기초한추정량 Variable Coefficient Std. Error t-statistic Prob. C 1.137591 0.079746 14.6510 0.0000 X 1.03987 0.133013 7.817819 0.0000 VHAT 0.99578 0.16939 6.111053 0.0000 R-squared 0.845043 Mean dependent var 1.38687 Adjusted R-squared 0.841848 S.D. dependent var 1.838819 S.E. of regression 0.73168 Akaike info criterion.41466 Sum squared resid 51.87097 Schwarz criterion.31961 Log likelihood -109.0733 Hannan-Quinn criter..73097 F-statistic 64.4899 Durbin-Watson stat.04781 Prob(F-statistic) 0.000000 47
10.3 적률방법에기초한추정량 Hausman 검정결과 () / 앞에서 Monte Carlo simulation 에서사용한자료 OLS 결과 Dependent Variable: Y Variable Coefficient Std. Error t-statistic Prob. C 0.978893 0.08881 11.08838 0.0000 X 1.703431 0.089950 18.93754 0.0000 SLS 결과 Instrument specification: Z1 Z Variable Coefficient Std. Error t-statistic Prob. C 1.137591 0.116444 9.769431 0.0000 X 1.03987 0.1943 5.3540 0.0000 Endogeneity Test Specification: Y C X Instrument specification: C Z1 Z Endogenous variables to treat as exogenous: X <TSLS> 추정후, <View>-<IV Diagnostics and Tests/>- <Regressor Endogeneity Test> 클릭 Value df Probability Difference in J-stats 7.4186 1 0.0000 48
10.3 적률방법에기초한추정량 Hausman 검정결과 (3) / 앞의저축함수추정에서사용한자료 OLS 결과 Dependent Variable: SAVINGS Variable Coefficient Std. Error t-statistic Prob. C 4.34769 0.856116 5.07643 0.0000 INCOME -0.005185 0.011163-0.464539 0.6444 SLS 결과 Instrument specification: C AVERAGE_INCOME Variable Coefficient Std. Error t-statistic Prob. C 0.98867 1.3096 0.747500 0.4584 INCOME 0.039176 0.017381.53907 0.088 Endogeneity Test Specification: SAVINGS C INCOME Instrument specification: C AVERAGE_INCOME Endogenous variables to treat as exogenous: INCOME <TSLS> 추정후, <View>-<IV Diagnostics and Tests/>-<Regressor Endogeneity Test> 클릭 Value df Probability Difference in J-stats 11.08634 1 0.0009 49
10.4 모형설정에대한검정 Hausman test <SAS 에서의검정방법 > : 저축함수경우 OLS 추정량과수단변수추정량을각각추정하여비교 <SAS program> proc model data=savings ; parms b1 b ; exogenous z ; y = b1 + b*x ; fit y / ols sls hausman ; * Automatic Hausman test; * parms; * instrument; * model; * Hausman comparing OLS-sls; <Hausman's Specification Test Results> Comparing To DF Statistic Pr > ChiSq OLS SLS 7.11 0.086 귀무가설기각, 즉설명변수와오차항은상관됨따라서수단변수추정법을사용하여야함 50
10.4 모형설정에대한검정 () 약한수단변수에대한검정 선택한변수가약한수단변수인경우라면, 수단변수추정량은큰편의및큰표준오차를가질수있음 다음과같은모형을생각해보자 y =β +β x + +β x +β x + e 1 G G G+ 1 G+ 1 x, x 3,, x G 는외생변수, x G+1 은내생변수, z 1 은수단변수 x =γ +γ x + +γ x +θ z + v G+ 1 1 G G 1 1 z 1 이강한수단변수인지약한수단변수인지를검정하는방법 H : θ = 0 검정, t- 값이 3.3 보다작으면, 약한수단변수로판단 0 1 51
10.3 적률방법에기초한추정량 Test for weak instruments / Monte Carlo simulation 에서사용한자료 Dependent Variable: X Method: Least Squares Date: 09/19/1 Time: 18:3 Sample: 1 100 Included observations: 100 Variable Coefficient Std. Error t-statistic Prob. C 0.19473 0.079499.449486 0.0161 Z1 0.569978 0.088785 6.419747 0.0000 Z 0.06786 0.077161.679940 0.0087 R-squared 0.333594 Mean dependent var 0.39161 Adjusted R-squared 0.319854 S.D. dependent var z 0.956655 1 z S.E. of regression 0.788963 Akaike info criterion.393346 Sum squared resid 60.37887 Schwarz criterion.471501 Log likelihood -116.6673 Hannan-Quinn criter..44977 F-statistic 4.7844 Durbin-Watson stat 1.88811 Prob(F-statistic) 0.000000 z1 z 은유의 ( 강한수단변수 ), 의 t 값은 3.3 보다작음 ( 약한수단변수 ) 두추정치가동시에 0 이라는귀무가설 ( 결합가설 ) 에대해 F- 검정, 기각 5
< 과제 > 10.5 / data 는 WILEY 교과서홈페이지에있음 http://principlesofeconometrics.com/poe3/poe3.htm 53