Principles of Econometrics (3e) Ch. 6 다중회귀모형에관한 추가적인논의 013 년 1 학기 윤성민
6장의주요내용 다중회귀모형의모수에관한둘이상의가설로구성된귀무가설을동시에검정하는경우 ( 결합가설의검정 ) F-검정 표본의정보이외에비표본정보도함께이용하는경우 제한최소제곱법 모형설정의오류를찾는방법 RESET 검정 다중공선성문제의탐지와해결방법 Ch. 6 다중회귀모형에관한추가적인논의
6.1 F- 검정 < 햄버거체인점사례 > 제한되지않은모형 (U) S =β +β P +β A + e i 1 i 3 i i 가설이 H β 0 H β 0 0 : = 1 : 로설정된다면 t- 검정 제한된모형 (R) S =β +β A + e i 1 3 i i ( β = 0) 귀무가설이참이라면 귀무가설이거짓이라면 SSE R = SSE U SSE R > SSE U Ch. 6 다중회귀모형에관한추가적인논의 3
6.1 F- 검정 F- 분포 F-distribution : 각각자유도가 m 1, m 인카이제곱분포를갖는 두확률변수 ( V 1, V ) 의비율은 F- 분포를따름 F = V V 1 1 ~ / m / m F m 1, m Ch. 6 다중회귀모형에관한추가적인논의 4
6.1 F- 검정 Ch. 6 다중회귀모형에관한추가적인논의 5
6.1 F- 검정 F- 통계량 ( SSER SSEU)/ J F = ~ F( J, N K) SSE /( N K) U t χ SSE = eˆ ~ ( N K) 모형에설정된제한이부적절할수록 ( SSE SSEU ) 커짐 R PF ( > F α ) = α F- 값커짐 귀무가설기각 Ch. 6 다중회귀모형에관한추가적인논의 6
6.1 F- 검정 Ch. 6 다중회귀모형에관한추가적인논의 7
6.1 F- 검정 single restriction F- 검정 ( 단일가설검정경우 ) 가설 : H β 0 H β 0 ( 총수입은가격에의존하는가?) 검정통계량 : 유의수준선택 : 자유도및임계값 : 단일가설이므로 J=1, (N-K)=75-3=7 이므로 F- 통계량 : 0 : = 1 : ( SSER SSEU)/ J F = ~ F( J, N K) SSE /( N K) U α = 0.05 임계값은 ( R U ) SSE ( N K ) U Fc = F = (1,7;0.05) 3.97 ( ) 1718.943 ( 75 3) SSE SSE J 961.87 1718.943 1 F = = = 5.06 =FINV(0.05,1,7) 검정결과 : F = 5.06 > 3.97 = Fc 따라서귀무가설기각 ( 가격에의존 ) P- 값계산 : p = PF [ 5.06] =.0000 (1,7) =FDIST(5.06,1,7) p = 0.0000 < 0.05 = α Ch. 6 다중회귀모형에관한추가적인논의 8
6.1 F- 검정 햄버거체인점의총수입은가격에의존하는가? (t- 검정 ) 가설 : 검정통계량 : 유의수준선택 : H β 0 H β 0 0 : = t = 1 : b ~ t se( b ) α = 0.05 ( N K) 임계값및기각역 : 자유도 =75-3=7이므로임계값은기각역은 t 1.993 =TINV(0.05,7) t = ± 1.993 c t-통계량및 P-값계산 : t 검정결과 : 7.15 < 1.993, p F b 7.908 se( b ) 1.096 = = = ( ( ) ) Pt 7 ( 7) Pt 7.15 10 ( ) > 7.15 + < 7.15 = (. 10 ) = 0.000 = 0.000 < 0.05 = α =TDIST(-7.15,7,) 따라서귀무가설기각, 즉수입은가격에의존함 = 5.06 = t = ( 7.15) F c = 3.97 = t = (1.993) c Ch. 6 다중회귀모형에관한추가적인논의 9
6. 모형의유의성검정 y =β + x β + x β + + x β + e t 1 t t3 3 tk K t 단일추정치의유의성검정 t- 검정 (F- 검정과동일한결과 ) H H 0 1 : 어느 : β k 0 한 β k = 0 회귀모형의전반적인유의성검정 = 결합가설의검정 F-검정 H H 0 3 1 : β = 0, β = 0,, β = 0 : at least one of the β is nonzero K k Ch. 6 다중회귀모형에관한추가적인논의 10
6. 모형의유의성검정 multiple restriction F- 검정 ( 결합가설검정경우 ) y =β+ x β+ x β+ + x β + e i 1 i i3 3 ik K i ( 귀무가설 ) H : β = 0 and β = 0 and β = 0 0 3 K ( 대립가설 ) H β 들중적어도하나는 0이아니다 1 : k 이경우제한된모형 : * 이모형의 OLS 추정량 b1 = Yt / T = Y SSE U = SSE J = K 1 ( SSER SSEU)/ J ( SST SSE) / ( K 1) F= = ~ FK ( 1, N K) SSE /( N K) SSE /( N K) U y i =β+ e N N * R ( i 1 ) ( i ) i= 1 i= 1 SSE = y b = y y = SST 1 Ch. 6 다중회귀모형에관한추가적인논의 11 i
6. 모형의유의성검정 햄버거체인점, 결합가설검정 ( 회귀식의전반적유의성검정 ) S =β +β P +β A + e i 1 i 3 i i 귀무가설 : - 대립가설 : H 0 : β = 0 and β 3 = 0 H : β 0 or β 3 1 0 분산분석 자유도 제곱합 제곱평균 F 비 유의한 F 회귀 1396.539 698.695 9.4786 5.04E-10 잔차 7 1718.943 3.8741 계 74 3115.48 F ( SST SSE) / ( K 1) (3115.48 1718.943) / = = = SSE / ( N K) 1718.943 / (75 3) 9.5 F = F(,7 ; 0.05) = 3.1 9.5 > 3.1 귀무가설기각함 c p= PF [ 9.5] =.0000 (,7) Ch. 6 다중회귀모형에관한추가적인논의 1
6. 모형의유의성검정 Eviews output Dependent Variable: SALES Method: Least Squares Date: 11/04/10 Time: 3:9 Sample: 1 75 Included observations: 75 SALES=C(1)+C()*PRICE+C(3)*ADVERT Coefficient Std. Error t-statistic Prob. C(1) 118.9136 6.351638 18.717 0.0000 C() -7.907854 1.095993-7.1541 0.0000 C(3) 1.86584 0.683195.7683 0.0080 R-squared 0.44858 Mean dependent var 77.37467 Adjusted R-squared 0.4393 S.D. dependent var 6.488537 S.E. of regression 4.88614 Akaike info criterion 6.049854 Sum squared resid 1718.943 Schwarz criterion 6.14553 Log likelihood -3.8695 Hannan-Quinn criter. 6.086868 F-statistic 9.4786 Durbin-Watson stat.183037 Prob(F-statistic) 0.000000 Ch. 6 다중회귀모형에관한추가적인논의 13
6.3 확장된모형 S =β 1+β P+β 3A+ e 광고비지출을늘리면매출액이계속비례적으로증가할것인가? 현실적으로광고비의효과에는수확체감의법칙이작용할것같음 Ch. 6 다중회귀모형에관한추가적인논의 14
6.3 확장된모형 확장된모형 광고비지출이매출액증대에미치는효과에수확체감이 작용하는경우, 다음과같은모형이적합할수있음 S =β 1+β P+β 3A+β 4A + e ES ( ) ES ( ) = =β + β A ( P held constant) A 3 4 A 이경우 β > 0, β < 0 으로예상됨 3 4 Ch. 6 다중회귀모형에관한추가적인논의 15
6.3 확장된모형 확장된모형의추정결과 추정방법 : 아래와같이변수를변환하여 OLS 적용함 S =β 1+β P+β 3A+β 4A + e y = S, x = P, x = A, x = A i i i i i3 i i4 i y =β +β x +β x +β x + e i 1 i 3 i3 4 i4 추정결과 Sˆ = 109.7 7.640 P + 1.151A.768 A i i i i (se) (6.80) (1.046) (3.556) (0.941) Ch. 6 다중회귀모형에관한추가적인논의 16
6.4 경제적가설의검정 6.4.1 광고의유용성 광고는매출에영향을미치는가? 제한되지않은모형 S P A A e U i =β 1 +β i +β 3 i +β 4 i + i ( ) H0 : β 3 = 0, β 4 = 0 H1: β3 0 or β4 0 귀무가설이옳다면 ( 즉, 광고가매출에아무런도움이안된다면 ) Si =β 1 +β Pi + ei ( R) Ch. 6 다중회귀모형에관한추가적인논의 17
햄버거체인점의광고는총수입에영향을미치는가? (F- 검정 ) 유의수준선택 : 임계값및기각역 : 자유도 =75-4=71 이므로임계값은 F- 통계량및 P- 값계산 : 검정결과 : S =β +β P +β A +β A + e i 1 i 3 i 4 i i 가설 : H0 : β 3 = 0, β 4 = 0 H1: β3 0 or β4 0 ( SSER SSEU ) 검정통계량 : F = F(,71) SSE 75 4 Fc U α = 0.05 기각역은 ( ) = 3.16 < F = 8.44 F > 3.16 ( ) 153.084 ( 75 4) 6.4 경제적가설의검정 따라서귀무가설기각, 즉광고는매출액에영향미침 Fc 1896.391 153.084 F = = 8.44 PF [ (,71) > 8.44] =.0005 = F = (.95,,71) 3.16 Ch. 6 다중회귀모형에관한추가적인논의 18
6.4 경제적가설의검정 6.4. 광고의최적수준 S =β +β P +β A +β A + e i 1 i 3 i 4 i i 경제이론에따르면한계수익이한계비용보다큰모든행위를해야함 광고를한단위증가시킴에따른한계수익 = 기대매출액의증가 ES ( ) A ( P held constant) =β + β 3 4 광고를한단위증가시킴에따른한계비용 = 광고비 (1 단위금액 ) ( 매출증가에따른재료비, 인건비, 관리비등은없다고가정함 ) 한계수입 = 한계비용은아래의조건이충족될때나타남 β + β = 1 3 4A o 추정치대입, (1.151) + (.76796) ˆ = 1 A ˆ =.104 따라서광고의최적수준은 $,104 임 A A o o Ch. 6 다중회귀모형에관한추가적인논의 19
6.5 비표본정보의이용 비표본정보 (Nonsample Information) 표본자료에포함된정보이외에추가적인정보 경제원칙, 경제이론, 경험등에서얻을수있음 모수를추정할때정확성을향상시킬수있음 Ch. 6 다중회귀모형에관한추가적인논의 0
6.5 비표본정보의이용 비표본정보의이용 : 맥주수요함수예 (,,, ) q= f p p p m B L R - q : 맥주수요량, P B : 맥주가격, P L : 다른술가격 P R : 기타다른모든재화가격, m : 소득 ln q=β +β ln p +β ln p +β ln p +β ln m 1 B 3 L 4 R 5 화폐착각 (money illusion) 이없다면, 모든가격과소득이동일한비율로증가할경우수요량은변화하지않을것임 ( B) ( L) ( R) ( ) p p p m ( ) ln q=β +β ln λ p +β ln λ p +β ln λ p +β ln λm 1 3 4 5 =β +β ln +β ln +β ln +β ln + β +β +β +β ln λ 1 B 3 L 4 R 5 3 4 5 화폐착각이없다면 ( 소비자가합리적이라면 ) β +β 3+β 4 +β 5 = 0 Ch. 6 다중회귀모형에관한추가적인논의 1
6.5 비표본정보의이용 맥주수요함수추정에사용된통계자료의기통통계값 q : 맥주수요량, P B : 맥주가격, P L : 다른술가격 P R : 기타다른모든재화가격, m : 소득 ln q=β +β ln p +β ln p +β ln p +β ln m 1 B 3 L 4 R 5 β +β 3+β 4 +β 5 = 0 Ch. 6 다중회귀모형에관한추가적인논의
비표본정보인다음관계식을원래식에대입 β 4 = β β3 β5 ( ) ( ln ln ) ( ln ln ) ( ln ln ) ln q =β +β ln p +β ln p + β β β ln p +β ln m + e t 1 Bt 3 Lt 3 5 Rt 5 t t =β +β p p +β p p +β m p + e 1 Bt Rt 3 Lt Rt 5 t Rt t p Bt p Lt m t =β 1+β ln +β 3ln +β 5ln + e prt prt prt p Bt p Lt m t ln qˆ t = 4.798 1.994ln + 0.1868ln + 0.9458ln prt prt prt (3.714) (0.166) (0.84) (0.47) t 6.5 비표본정보의이용 b = b b b * * * * 4 3 5 = ( 1.994) 0.1868 0.9458 = 0.1668 Ch. 6 다중회귀모형에관한추가적인논의 3
맥주수요함수추청결과 : linear model Dependent Variable: Q Method: Least Squares Date: 04/3/11 Time: 16: Sample: 1 30 Included observations: 30 Q=C(1)+C()*PB+C(3)*PL+C(4)*PR+C(5)*M Coefficient Std. Error t-statistic Prob. C(1) 8.15871 17.96176 4.574090 0.0001 C() -3.7460 5.49409-4.3796 0.000 C(3) -4.077410 3.890489-1.048046 0.3046 C(4) 1.9434 4.163896 3.103906 0.0047 C(5) 0.001995 0.000776.57061 0.0165 R-squared 0.8118 Mean dependent var 56.11333 Adjusted R-squared 0.793657 S.D. dependent var 7.857381 S.E. of regression 3.56919 Akaike info criterion 5.53358 Sum squared resid 318.4831 Schwarz criterion 5.767115 Log likelihood -78.00374 Hannan-Quinn criter. 5.6089 F-statistic 8.88559 Durbin-Watson stat.508801 Prob(F-statistic) 0.000000 4
맥주수요함수추청결과 : log-log model Dependent Variable: LOG(Q) Method: Least Squares Date: 04/3/11 Time: 16:37 Sample: 1 30 Included observations: 30 LOG(Q)=C(1)+C()*LOG(PB)+C(3)*LOG(PL)+C(4)*LOG(PR)+C(5)*LOG(M) Coefficient Std. Error t-statistic Prob. C(1) -3.4338 3.743000-0.866481 0.3945 C() -1.00419 0.3904-4.68787 0.000 C(3) -0.58934 0.560150-1.040674 0.3080 C(4) 0.09545 0.079693.69415 0.0144 C(5) 0.9864 0.415514.1016 0.0356 R-squared 0.85389 Mean dependent var 4.018531 Adjusted R-squared 0.797451 S.D. dependent var 0.13358 S.E. of regression 0.059973 Akaike info criterion -.63883 Sum squared resid 0.08990 Schwarz criterion -.40590 Log likelihood 44.5835 Hannan-Quinn criter. -.564114 F-statistic 9.54377 Durbin-Watson stat.630645 Prob(F-statistic) 0.000000 5
맥주수요함수추청결과 : 비표본정보이용 (1) Dependent Variable: LOG(Q) Method: Least Squares Date: 04/3/11 Time: 16:50 Sample: 1 30 Included observations: 30 LOG(Q)=C(1)+C()*LOG(PB/PR)+C(3)*LOG(PL/PR)+C(5)*LOG(M/PR) Coefficient Std. Error t-statistic Prob. C(1) -4.797798 3.713905-1.91847 0.078 C() -1.99386 0.165738-7.8400 0.0000 C(3) 0.186816 0.84383 0.656916 0.5170 C(5) 0.94589 0.47047.14813 0.0357 R-squared 0.807949 Mean dependent var 4.018531 Adjusted R-squared 0.785789 S.D. dependent var 0.13358 S.E. of regression 0.061676 Akaike info criterion -.61091 Sum squared resid 0.098901 Schwarz criterion -.43465 Log likelihood 43.15437 Hannan-Quinn criter. -.55054 F-statistic 36.4601 Durbin-Watson stat.686998 Prob(F-statistic) 0.000000 6
맥주수요함수추청결과 : 비표본정보이용 () Dependent Variable: LOG(Q) Method: Least Squares Date: 04/3/11 Time: 17:03 Sample: 1 30 Included observations: 30 LOG(Q)=C(1)+C(3)*LOG(PL/PB)+C(4)*LOG(PR/PB)+C(5)*LOG(M/PB) Coefficient Std. Error t-statistic Prob. C(1) -4.797798 3.713905-1.91847 0.078 C(3) 0.186816 0.84383 0.656916 0.5170 C(4) 0.16674 0.077075.163369 0.0399 C(5) 0.94589 0.47047.14813 0.0357 R-squared 0.807949 Mean dependent var 4.018531 Adjusted R-squared 0.785789 S.D. dependent var 0.13358 S.E. of regression 0.061676 Akaike info criterion -.61091 Sum squared resid 0.098901 Schwarz criterion -.43465 Log likelihood 43.15437 Hannan-Quinn criter. -.55054 F-statistic 36.4601 Durbin-Watson stat.686998 Prob(F-statistic) 0.000000 7
6.6 모형설정 < 설정된모형에따라달라지는문제들 > 모형의모수를추정하는최선의방법은무엇인가? 모형의모수에관한가설을어떻게설정하여야하는가? 모형의모수에관한가설을어떻게검정할수있는가? 예측은어떻게해야하는가? 모형을선택할경우어떤사항을중요하게고려하여야하나? 선택한모형이적절한지를평가하는방법은무엇인가? Ch. 6 다중회귀모형에관한추가적인논의 8
6.6 모형설정 < 모형을선택할경우고려해야할사항 > (1) 모형에포함되어야할설명변수의선정 () 함수형태의선택 (3) 다중회귀모형의기본가정인 MR1~MR6 의준수여부 Ch. 6 다중회귀모형에관한추가적인논의 9
6.6.1 주요변수의누락이유발하는문제 (omitted-variable problem) 올바른모형이다음과같다고하자 W =β +β E +β M + e t 1 t 3 t t : 피고용인임금, : 경험, : 열의 (motivation) W E M 부적절한모형 ( 주요설명변수 M 이누락된모형 ) W =β +β E + v t 1 t t 6.6 모형설정 부적절한제약 β 3 = 0 이부과된셈 누락된변수 ( M ) 와포함된변수 ( E ) 가완전독립이아니라면, β 1 β, 의 OLS 추정량은분산이감소하나불편추정량이못됨 추정된계수가예상하지못한부호를갖거나비현실적인값을 가지는원인이되기도함 ( 증명 : 6 장부록 6B) Ch. 6 다중회귀모형에관한추가적인논의 30
6.6 모형설정 가계소득추정사례 맞벌이가계가많아, 가계총소득 (FAMINC) 은남편의교육수준 (HEDU) 과아내의교육수준 (WEDU) 에크게의존한다고하자 아래자료로추정 Ch. 6 다중회귀모형에관한추가적인논의 31
6.6 모형설정 가계소득추정결과 FAMINC = 5534 + 313 HEDU + 453 WEDU i i i (se) (1130) (803) (1066) ( p-value) (.6) (.000) (.000) - 남편이교육을 1년더받을경우연간가계소득은 $3,13 증가 중요변수 (WEDU) 가누락된경우의추정결과 FAMINC i = 6191 + 5155 HEDU (se) (8541) (658) ( p-value) (.00) (.000) - 남편이교육을 1년더받을경우연간가계소득은 $5,155 증가 즉, 약 $,000 과대평가 ( 불편추정량아닌것을확인할수있음 ) i Ch. 6 다중회귀모형에관한추가적인논의 3
6.6 모형설정 가계소득추정결과 FAMINC = 5534 + 313 HEDU + 453 WEDU i i i (se) (1130) (803) (1066) ( p-value) (.6) (.000) (.000) - 남편이교육을 1년더받을경우연간가계소득은 $3,13 증가 중요하지않은변수 (KL6, 6세미만자녀수 ) 가누락된경우의추정결과 FAMINC = 7755 + 311 HEDU + 4777 WEDU 14311 KL 6 i i i i (se) (11163) (797) (1061) (5004) ( p-value) (.488) (.000) (.000) (.004) - 남편이교육을 1년더받을경우연간가계소득은 $3,11 증가 HEDU와 WEDU 추정치에별변화없음 ( 불편추정량일가능성높음 ) - KL6가 HEDU 및 WEDU와독립이면, 누락되어도전혀영향주지않음 Ch. 6 다중회귀모형에관한추가적인논의 33
6.6 모형설정 어떤한변수가회귀모형에포함되어야하는지를판단하는방법 기본원칙 : 유의성검정추정치가 0이라는귀무가설이기각되면포함시킴 < 주의 > 추정치가 0이라는귀무가설이기각되지못하는이유 (1) 해당변수가종속변수와무관한경우 제외시켜야함 () 중요한변수임에도불구하고, 표본이적절하지못한경우 제외시키면, 나머지추정치는불편추정량이되지못함 가능한많은변수를포함시키는것이좋은전략인가? Cf. stepwise 옵션 model Y = X1 X X3 X4 / selection=stepwise ; Ch. 6 다중회귀모형에관한추가적인논의 34
6.6 모형설정 가계소득추정결과 FAMINC = 5534 + 313 HEDU + 453 WEDU (se) (1130) (803) (1066) ( p-value) (.6) (.000) (.000) - 남편이교육을 1 년더받을경우연간가계소득은 $3,13 증가 무관한변수 (KL6, 6 세미만자녀수 ) 가누락된경우의추정결과 - 남편이교육을 1 년더받을경우연간가계소득은 $3,11 증가 HEDU 와 WEDU 추정치에별변화없음 ( 불편추정량일가능성높음 ) - KL6 가 HEDU 및 WEDU 와독립이면, 누락되어도전혀영향주지않음 Ch. 6 다중회귀모형에관한추가적인논의 i i i FAMINC = 7755 + 311 HEDU + 4777 WEDU 14311 KL 6 i i i i (se) (11163) (797) (1061) (5004) ( p-value) (.488) (.000) (.000) (.004) KL6 은 6 세미만자녀수 ( 남편및아내의교육수준과무관 ) 35
6.6. 종속변수와관련되지않은변수가포함되었을때의문제 올바른모형이다음과같다고하자 W =β +β E +β M + e t 1 t 3 t t 부적절한아래모형을추정하였다고하자 W =β +β E +β M +β C + e t 1 t 3 t 4 t t 6.6 모형설정 문제점 - β1, β, β3 의 OLS 추정량은불편추정량이기는하지만, 분산이증가하게됨 ( C 가 E 및 M 과완전독립이아니면 ) 나머지추정치의정확도를떨어뜨리고, 유의하지않은것으로오해하게만들수있음 Ch. 6 다중회귀모형에관한추가적인논의 36
6.6 모형설정 가계소득추정결과 FAMINC = 7755 + 311 HEDU + 4777 WEDU 14311 KL 6 i i i i (se) (11163) (797) (1061) (5004) ( p-value) (.488) (.000) (.000) (.004) - 남편이교육을 1년더받을경우연간가계소득은 $3,13 증가 종속변수와인위적인 ( 무관한 ) 변수 (X5, X6) 가포함된경우의추정결과 FAMINC = 7759 + 3340 HEDU + 5869WEDU 1400 KL6 + 889X 1067X i i i i i5 i6 (se) (11195) (150) (78) (5044) (4) (198) ( p-value) (.500) (.008) (.010) (.005) (.69) (.591) - HEDU와 WEDU 추정치에큰변화없음 ( 불편추정량일가능성있음 ) - 주요추정치의표준오차가크게증가하는문제확인됨, 정확성감소 Ch. 6 다중회귀모형에관한추가적인논의 X5, X6 는난수발생시켜만든변수 ( 무관, 독립 ) 37
6.6.3 RESET 검정 (Regression Specification Error Test) 적절한변수누락여부와함수형태의잘못된설정을검정 다음과같은두개의인위적인모형을생각해보자 이나가 0 이아니라면, 비선형함수가적절하다는의미 따라서 RESET 검정의가설은아래와같음 t t t t e Y X X Y t + + + + = 1 3 3 1 ˆ γ β β β t t t e X X Y t + + + = 3 3 1 β β β t t X b X b b Y t 3 3 1 ˆ + + = t t t t t e Y Y X X Y t + + + + + = 3 1 3 3 1 ˆ ˆ γ γ β β β 1 γ γ 0 : 0, : 1 1 1 0 = γ γ H H 0 0 : 0, : 1 1 1 0 = = γ γ γ γ or H H 6.6 모형설정 Ch. 6 다중회귀모형에관한추가적인논의 38
6.6 모형설정 RESET 검정결과 귀무가설기각되면, 원래모형이부적절하여향상될수있다는의미 귀무가설을기각하는데실패할경우, RESET 검정은모형설정의오류를알아낼수없다는의미 proc autoreg ; loglog: model lq = lpb lpl lpr lm / reset ; liner: model q = pb pl pr m / reset ; Ch. 6 다중회귀모형에관한추가적인논의 39
Ramsey (1969) 의 RESET 검정예 : 맥주수요모형 <log-log model> ln( q ) =β +β ln( p ) +β ln( p ) +β ln( p ) +β ln( m ) + e t 1 Bt 3 Lt 4 Rt 5 t t <linear model> q =β +β p +β p +β p +β m + e t 1 Bt 3 Lt 4 Rt 5 t t 6.6 모형설정 Ramsey RESET Test: LOGLOG Model F-statistic (1 term) 0.0075 Probability 0.9319 F-statistic ( terms) 0.3581 Probability 0.708 Ramsey RESET Test: LINEAR Model F-statistic (1 term) 8.8377 Probability 0.0066 F-statistic ( terms) 4.7618 Probability 0.0186 Ch. 6 다중회귀모형에관한추가적인논의 40
6.6 모형설정 맥주수요모형 RESET 검정결과 (1 term) : 예측치의제곱변수가추가된경우 ( terms) : 예측치의제곱및세제곱변수가함께추가된경우 <log-log model> F-값이아주작음 (0.0075, 0.3581), 이것들에상응하는 p-값은 0.9319 및 0.708로유의수준 (0.05) 보다훨씬큼 log-log model이부적절한모형이라고주장할수없음 <linear model> p-값은 0.0066 및 0.0186로유의수준 (0.05) 보다훨씬작음 linear model은부적절한모형이라는결론 Ch. 6 다중회귀모형에관한추가적인논의 41
6.6 모형설정 Model Dependent Variable loglog lq Ordinary Least Squares Estimates SSE 0.08991989 DFE 5 MSE 0.00360 Root MSE 0.05997 SBC -7.158707 AIC -79.164694 Regress R-Square 0.854 Total R-Square 0.854 Durbin-Watson.6306 Ramsey's RESET Test Power RESET Pr > F 0.0074 0.9319 3 0.3581 0.708 4 0.7385 0.5403 Standard Approx Variable DF Estimate Error t Value Pr > t Intercept 1-3.43 3.7430-0.87 0.3945 lpb 1-1.004 0.390-4.7 0.000 lpl 1-0.589 0.560-1.04 0.3080 lpr 1 0.095 0.0797.63 0.0144 lm 1 0.99 0.4155. 0.0356 Ch. 6 다중회귀모형에관한추가적인논의 4
6.6 모형설정 Model liner Dependent Variable q Ordinary Least Squares Estimates SSE 318.483105 DFE 5 MSE 1.7393 Root MSE 3.569 SBC 173.01346 AIC 166.007473 Regress R-Square 0.81 Total R-Square 0.81 Durbin-Watson.5088 Ramsey's RESET Test Power RESET Pr > F 8.8377 0.0066 3 4.7618 0.0186 4 3.3019 0.039 Standard Approx Variable DF Estimate Error t Value Pr > t Intercept 1 8.1587 17.9618 4.57 0.0001 pb 1-3.746 5.494-4.37 0.000 pl 1-4.0774 3.8905-1.05 0.3046 pr 1 1.943 4.1639 3.10 0.0047 m 1 0.001995 0.000776.57 0.0165 Ch. 6 다중회귀모형에관한추가적인논의 43
6.7 다중공선성 (multicollinearity) 설명변수들사이에는밀접한관련이있을수있음 ( 두변수가공선 (collinear) 되어있다고라고말함 ) 이경우설명변수가종속변수에미치는영향을추정하기어려움설명변수자료는풍부한정보를가지지못함 (poor data) ( 공선성문제 collinearity problem 라고말함 ) ( 예1) 신문광고와우대권 ( 할인권 ) 나누어주기를동시에하는경우 매출액의증가에미치는광고의효과와우대권의효과를분리하여추정하기어려움 ( 예) 노동과자본이고정된비율로생산에투입되는경우 ( 버스-운전사 ) 노동과자본의한계생산물을각각분리하여추정하기어려움 Ch. 6 다중회귀모형에관한추가적인논의 44
6.7 다중공선성 6.7.1 다중공선성이유발하는효과들 R 및모형의 F 값이높음에도불구하고추정치들의 t-값이낮게나타남, 추정치들이유의하지않은것으로오해하게함 몇개의표본을추가하거나제외시키면, 추정치들이매우민감하게달라짐 모형에서명백하게유의하지않은설명변수를삭제하면추정치들이민감하게달라짐 공선관계가표본외관찰값에도동일하게존재하는경우에는예측의정확도가높을수있음 Ch. 6 다중회귀모형에관한추가적인논의 45
6.7 다중공선성 다중공선성문제 (multicollinearity problem) 설명변수들사이에정확한선형관계가존재하는경우, OLS 를이용해서는모수추정치를구할수없음 var( b ) = σ N 3 i i= 1 (1 r ) ( x x ) 설명변수들사이에거의정확한선형관계가존재하는경우, OLS 추정량의일부분산, 표준오차가큰값으로나타남 구간추정이넓은폭으로나타나모수의참값에대한정보를얻기어려움 Ch. 6 다중회귀모형에관한추가적인논의 46
6.7 다중공선성 6.7. 자동차연비사례 MPG = 연비 (miles per gallon) CYL = 실린더의수 (number of cylinders; V4, V6, V8, ) ENG = 배기량 (engine displacement in cubic inches) WGT = 차량무게 (vehicle weight in pounds) CYL, ENG, WGT 가 MPG 에미치는영향을추정하려고함 일반적으로대형차 ( 소형차 ) 의경우 CYL, ENG, WGT 가모두큼 ( 작음 ) 설명변수들사이에다중공선성이존재할가능성이높음 Ch. 6 다중회귀모형에관한추가적인논의 47
6.7 다중공선성 자동차연비사례추정결과 설명변수가하나만포함된모형의추정결과 MPG i = 4.9 3.558 CYL (se) (0.83) (0.146) ( p-value) (0.000) (0.000) 설명변수가모두포함된모형의추정결과 i MPG = 44.4 0.68 CYL 0.017 ENG 0.00571 WGT i i i i (se) (1.5) (0.413) (0.0083) (0.0071) ( p-value) (0.000) (0.517) (0.15) (0.000) CYL 변수추정치의유의성이크게낮게나타나고있음 Ch. 6 다중회귀모형에관한추가적인논의 48
6.7 다중공선성 6.7.3 다중공선성의탐지및해결 다중공선성탐지방법 (1) 설명변수들사이의상관관계측정 ( 상관계수가 0.8 이상 ) R () 나 F- 값이높음에도불구하고, 추정치의 t- 값이낮을때 (3) 다음과같은보조적인회귀모형추정, 가 0.8 이상 x = a x + a x + + a x + error i 1 i1 3 i3 K ik R (4) 표본을몇개늘리거나줄이면, 추정치크기가크게변화 Ch. 6 다중회귀모형에관한추가적인논의 49
6.7 다중공선성 다중공선성해결방법 상관관계높은설명변수삭제 - 설명변수들사이의상관계수계산해서찾음 표본의수늘림 비표본정보의이용, 제약부과 Ch. 6 다중회귀모형에관한추가적인논의 50
6.8 예측 y =β+ x β+ x β+ e i 1 i i3 3 i 단순회귀경우와유사함 (1, x, x ) 에서의점예측치는아래와같음 0 03 ŷ0 = b1 + x0b + x03b3 Ch. 6 다중회귀모형에관한추가적인논의 51
< 과제 > 6.6 6.10 (beer_new.dat 자료를이용하시오 ) Eviews output을출력하고, 출력물의빈여백에간단하게답을적으시오. 참고 : 6.10 문제에필요한 data 는사이버강의실에있음 http://principlesofeconometrics.com/ Ch. 6 다중회귀모형에관한추가적인논의 5