|
|
- 천희 강
- 5 years ago
- Views:
Transcription
1 회귀분석의 기초 한국보건사회연구원 2017년 6월 19일(월요일) & 22일(목요일) 강의 슬라이드 9 1/ 78
2 목차 / 78
3 지난 시간 복습 모집단 평균 µ에 대한 통계적 추론을 하는 방법: σ 신뢰구간: x ± t 유의성 검정: t = x µ σ/ 위 공식을 보면 모집단 표준편차 σ가 들어 있는데 이 σ를 모르니까 표본 표준편차 s로 대체해서 다음 공식을 사용해서 통계적 추론을 함: s 신뢰구간: x ± z 유의성 검정: z = x µ s/ s = 위에서 를 표준오차(stadard errors)라고 하는데 이것이 의미하는 바는 어떤 추정량의 추출분포의 변이(분산)를 지칭!! 왜 σ를 s로 대체? = s가 σ의 일치(cosistet) 추정량이기 때문!! 3/ 78
4 지난 시간 복습 수리통계학: 1. 추정량의 유한표본(fiite sample) 성질 = 표본의 크기와 상관 없이 항상 성립하는 추정량의 성질 2. 추정량의 대표본(large sample) 성질 혹은 점근적(asymptotic) 성질 = 표본의 크기가 클 때만 성립하는 추정량의 성질 4/ 78
5 지난 시간 복습 추정량의 유한표본 성질: 1. 비편의성(ubiasedess) = E(W ) = θ; E(X ) = µ 2. 효율성(efficiecy) = W1 과 W2 가 모수 θ의 비편의 추정량일 때, V ar(w1 ) V ar(w2 )이면 추정량 W1 이 W2 에 비해 효율적이라고 함 3. 평균제곱오차(mea squared error, MSE) = M SE(W ) = E (W θ)2 = V ar(w ) + Bias(W )2 5/ 78
6 지난 시간 복습 추정량의 대표본 성질: 일치성(cosistecy) 1. E(W ) = θ이고 일 때 V ar(w ) 0이면 W 는 θ의 일치 추정량! 2. 어떤 추정량을 사용하기 위해서는 이 추정량에 일치성이 요구됨! 3. X 는 µ의 일치 추정량 2 = E(X ) = µ이고 V ar X = σ /이기 때문에 일 때 V ar X 0이 되므로! 6/ 78
7 들어가며 두 변수 간에 존재하는 선형 관계를 최소자승 회귀선을 이용해서 검토하는 법을 다뤘을 때, 최소자승 회귀선은 다음과 같은 형태를 갖고 있음을 배움: y i = β 0 + β 1 xi 그리고 위 절편 β 0 과 기울기 β 1 의 공식, 즉 추정량은 β 1 = r sy sx β 0 = y β 1 x = 위 추정량 즉 β i 은 모집단 모수 βi 의 추정량이라고 생각할 수 있음 변수 y와 x는 어떤 모집단을 대변하는 변수이고 우리의 관심사는 x를 이용해 y를 설명하고자 하는 것 모집단 에서의 y와 x 간의 관계식을 다음과 같이 기술할 수 있음 y = β0 + β1 x + ε 7/ 78
8 들어가며 y = β0 + β1 x + ε 위 식에서 ε는 오차항(error term)이라고 부름 = 오차항이 나타내는 것은 y의 변화 중에서 x가 설명하지 못하는 변화 재밌는 것은 위 식에서처럼 모집단에서 y와 x 간의 관계식이 선형적으로 기술이 되고 또 절편 β0 이 포함되어 있다면 다음과 같은 가정을 해도 아무 문제가 되지 않는다는 사실: E(ε) = 0 즉 모집단에서 오차항의 기대값은 0이라는 것! = 이런 가정을 해도 될까? Yes! 8/ 78
9 들어가며 y = β0 + β1 x + ε 우선 E(ε) 6= 0이라고 가정하겠음. 이 때 상수 a = E(ε)를 위 모집단 관계식의 왼쪽에 다음과 같이 더했다가 빼도록 하겠음: y = β0 + β1 x + ε = (a + β0 ) + β1 x + (ε a) = 위 식을 보면 새로운 절편 a + β0 와 오차항 ε a가 생겼음을 알 수 있음 이 새로운 절편과 오차항을 이용해서 모집단을 기술한 것인데 재밌는 것은 여기서 새로운 오차항은 0이라는 사실: E(ε a) = E(ε) E(a) = E(ε) a = E(ε) E(ε) = 0 = 즉 모집단 관계식에 절편 을 포함한다면 오차항은 항상 0으로 만들 수가 있고, 따라서 E(ε) = 0이라는 가정을 해도 아무 문제가 없음 예를 들어, y가 임금이고 x가 교육수준, 그리고 ε에는 우리가 관측할 수 없는 끈기가 포함되어 있다고 하겠음 세상에는 끈기가 있는 사람(+)과 없는 사람( )으로 나눌 수가 있을텐데, E(ε) = 0이라는 가정은 모집단에서 사람들의 끈기의 기대값은 0이라는 것 = 전혀 비합리적인 가정이 아니고 절편만 식에 포함한다면 항상 성립하는 가정!! 9/ 78
10 들어가며 y = β0 + β1 x + ε 위에서 β0 과 β1 은 모집단 모수이고 β 0 과 β 1 은 표본 통계량!! 위 β0 과 β1 을 추정량 β 0 과 β 1 으로 추정하는 것 무엇을 이용해서? = 우리가 갖고 있는 표본 자료를 이용해서 추정! 10/ 78
11 들어가며 y = β0 + β1 x + ε 자 이제 통계학을 공부했기 때문에 다음과 같은 질문에 답을 할 수 있어야 함: 추정량 β 0 과 β 1 을 이용해 모수 β0 와 β1 을 추정하기 위해서는 이 추정량에 어떠한 특성이 존재해야 할까? 통계학에서 모수 µ를 추정할 때 x 라는 추정량을 사용했음. Why? 1. x 는 µ의 비편의 추정량 2. x 가 µ의 일치 추정량 3. 일정한 조건(이 크고 무작위 표본)을 갖추면 CLT에 의해 이 x 와 관련해서 통계적 추론 가능 11/ 78
12 들어가며 추정량 β 0 과 β 1 을 이용해 모수 β0 와 β1 을 추정하기 위해서는 이 추정량에 어떠한 특성이 존재해야 할까? β 0 과 β 1 을 이용해 β0 와 β1 을 추정하기 위해서는 이 추정량에 x 와 같이 비편의성이나 일치성과 같은 바람직한 성질이 존재해야 함 그럼 β 0 과 β 1 에 이러한 바람직한 성질이 존재하는지 확인하기 위해서는 뭘 검토해야 할까? = β 0 과 β 1 의 추출분포의 중앙, 변이, 그리고 모양에 대해서 알아야 함 이제 왜 계량경제학을 배우기 전에 통계학을 배워야 하는지 아시겠나요? 12/ 78
13 들어가며 그래서 계량경제학의 기초에서는 β 0 과 β 1 의 추출분포의 특성에 대해서 배움 통계학을 배웠으니 좀 더 엄밀하게 말하면: 1. β 0 과 β 1 의 유한 표본(fiite sample) 성질을 검토 2. 대표본(large sample) 성질 검토 3. β 0 과 β 1 의 추출분포의 모양에 대해서 검토하고 이를 토대로 β 0 과 β 1 에 대한 통계적 추론을 하는 방법 계량경제학에서는 매우 귀찮은 수리적 도출과정을 많이 다룰 것임 좀 짜증이 나도 이러한 도출과정을 꼼꼼하게 익힐 것을 권함 = 그 이유는 이러한 과정을 공부해야 회귀분석의 기초를 튼튼하게 다질 수 있고, 또 제가 경험한 바에 의하면, 회귀분석의 기초를 완벽하게 마스터해야 추후에 나오는 계량경제학이나 실험 및 준실험적 연구방법론의 내용을 제대로 이해할 수 있음 13/ 78
14 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) β 1 = r sy sx β 0 = y β 1 x 위 추정량을 β0 와 β1 의 보통최소제곱(ordiary least squares, OLS) 추정량이라고 함 표본 자료를 추정량에 대입을 해서 위 추정량의 추정값을 구하면 다음과 같은 OLS 회귀선을 도출할 수 있음 y = β 0 + β 1 x = 위 OLS 회귀선을 적합(fitted) OLS선이라고도 하는데 그 이유는 표본 자료를 추정량에 적합(fit)했기 때문 과 대표본 성질을 공부하기 전에 위 적합 회귀선의 대수 성질을 먼저 배우겠음 = 대수 성질이란 어떤 표본을 갖고 있든 성립하는 성질이라고 생각하면 됨. 즉 표본을 무작위로 추출을 했든 안했든 성립한다는 것을 의미 14/ 78
15 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) 적합값(Fitted Values)과 잔차(Residuals) 표본을 이용해 β 0 과 β 1 의 추정값을 구하고 이 추정값을 토대로 각각의 관측치 i의 적합값 y i 을 구할 수 있음 = 이 각각의 적합값 y i 은 OLS 회귀선 상에 위치 실제 자료값 yi 와 이 적합값 y i 의 차이를 i의 잔차(residual)라고 하고 ε i 라고 표기함: ε i = yi y i = yi β 0 β 1 xi 만약 ε i 이 양수이면 OLS 회귀선이 실제 yi 값을 과대 추정한 것이고, ε i 이 음수이면 OLS 회귀선이 실제 yi 값을 과소 추정한 것이 됨 ε i = 0이면 실제 자료값과 추정값이 일치한다는 것임 = 물론 대개의 경우 잔차가 0으로 나오지는 않습니다. 15/ 78
16 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) OLS 통계량의 대수 성질 OLS 통계량의 대수 성질을 다루기 전에 확률변수의 공분산 및 표본 공분산에 대해서 배우겠음 모집단 공분산(populatio covariace)는 두 확률변수의 선형 관계의 정도를 나타내는 지표: Cov(X, Y ) E[(X E(X))(Y E(Y ))] 모집단 공분산은 다음과 같이 나타낼 수도 있음: Cov(X, Y ) E(XY ) E(X)E(Y ) 표본 공분산 sxy 은: sxy 1X xi yi 1X xi! 1X yi! 16/ 78
17 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) OLS 통계량의 대수 성질 OLS 통계량에는 3가지 유용한 대수 성질이 존재: 1. 잔차들의 합은 항상 0. 수리적으로 표현을 하면: X ε i = 0 = 다시 말해, 어떤 표본 자료를 사용하던 잔차들의 합이 0이 되게끔 하는 게 OLS 추정값 β 0 과 β 1 2. 설명변수 값 xi 와 OLS 잔차들 ε i 간의 표본 공분산은 0. 수리적으로 나타내면: X xi ε i = 0 3. 성질 1과 2를 이용해서 y i 과 ε i 간의 표본 공분산이 0임을 알 수 있음: 1X 1X 1X y i ε i y i ε i = 0 17/ 78
18 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) OLS 통계량의 대수 성질 위 대수의 성질을 이용해서 총제곱합(total sum of squares, TSS), 설명제곱합 (explaied sum of squares, ESS), 그리고 잔차제곱합(residual sum of squares, RSS)에 대해서 배우겠음 각각의 정의: 1. T SS X (yi y )2 = yi 의 변이! 2. ESS X 2 X y i y = (y i y )2 = OLS 적합값 y i 의 변이! 3. RSS X 2 X ε i ε = ε 2i = OLS 잔차 ε i 의 변이! 어떤 표본 자료의 yi 의 총 변이는 ESS와 RSS의 변이에 의해 설명됨: = T SS = ESS + RSS 18/ 78
19 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) OLS 통계량의 대수 성질 T SS = ESS + RSS 증명: T SS = X (yi y )2 = = X X [(yi y i ) + (y i y )]2 [ε i + (y i y )]2 = X ε = RSS + X ε i (y i y ) + X 2 X (y i y )2 ε i (y i y ) +ESS {z } y i 과 ε i 간의 표본 분산을 의미 = RSS ESS (성질 3에 의해) = RSS + ESS 19/ 78
20 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) 적합도(Goodess-of-Fit) 이제 연구에 자주 나오는 R2, 즉 적합도라는 것에 대해서 공부를 할 수 있음 적합도란 설명변수 x가 결과변수 y를 얼마나 잘 설명하는지를 나타내는 지표 = 다르게 표현을 하면 추정한 OLS 회귀선이 자료를 얼마나 적합하는지를 나타내는 지표 T SS가 0이 아니라는 가정 하에, T SS = ESS + RSS의 양변을 T SS로 나누면: = T SS ESS RSS = + T SS T SS T SS 1= RSS ESS + T SS T SS 1 RSS ESS = T SS T SS 회귀선의 R2 는 다음과 같이 정의됨: R2 ESS RSS =1 T SS T SS 단, T SS 6= 0 20/ 78
21 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) 적합도(Goodess-of-Fit) R2 ESS RSS =1 T SS T SS 단, T SS 6= 0 위 R2 는 결정계수(coefficiet of determiatio)라고도 부름 R2 은 T SS에서 ESS가 차지하는 비율 = 쉽게 설명하면 결과변수 yi 의 총 변이 중 설명변수 xi 가 설명하는 비중을 나타내는 것 R2 는 0과 1 사이에 값을 가짐. 왜냐하면 0 ESS T SS이기 때문 만약 자료 값들이 모두 OLS 회귀선에 위치해 있다면 OLS선이 자료를 완벽하게 적합한다는 것이고, 그렇다면 이 경우에는 R2 = 1 R2 이 0에 가까울수록 OLS선이 자료를 적합하는 정도가 낮다는 것을 의미 21/ 78
22 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) 적합도(Goodess-of-Fit) 사회과학 연구에서 그리고 특히 정책 평가와 관련해서 R2 값은 대개 낮게 나옴 = 이 R2 값이 낮다고 해서 OLS 회귀선이 나쁘다는 것을 의미하는 것이 결코 아님 많은 연구자들이 R2 값이 낮으면 안 좋은 것이라고 생각을 하는데 그렇게 생각할 필요가 전혀 없음 R2 값이 낮다는 것의 의미는 단지 설명변수 x가 결과변수 y의 변이를 많이 설명을 못한다는 것이지 y를 틀리게 설명한다는 것이 아님 또한 R2 값이 낮다고 해서 어떤 정책의 효과가 없다라고 해석되는 것도 아님 22/ 78
23 적합값(Fitted Values)과 잔차(Residuals) OLS 통계량의 대수 성질 적합도(Goodess-of-Fit) 적합도(Goodess-of-Fit) 예: 어떤 흡연 정책의 효과를 추정하기 위해 결과변수는 흡연량(Yi ), 설명변수는 정책의 수혜 여부를 나타내는 이항 변수(Di )를 사용해서 다음과 같은 회귀분석 식을 추정함 Yi = β0 + β1 Di + εi = 위 결과 나온 R2 값이 0.03이라고 하겠음 0.03이 의미하는 것이 뭘까? = 이 0.03이 의미하는 것은 정책의 수혜 여부가 흡연량의 변이 의 3% 정도를 설명한다는 것임 물론 정책 변수가 흡연량의 변이를 많이 설명하지는 못함. 하지만 그렇다고 해서 이 정책 변수가 잘못됐다고 주장할 수 있나? No!! 어떤 설명변수 x가 y를 얼마나 잘 예측 하느냐가 관심 사항이면 높은 R2 값이 좋은 거지만 x가 y에 미치는 효과가 얼마 인지가 관심 사항이면 R2 값이 낮든 높든 아무 상관이 없음 이러한 인식 때문인지는 모르겠으나 실제로 최근 해외의 저명한 논문(예를 들어 Quarterly Joural of Ecoomics나 Joural of Policy Aalysis ad Maagemet)을 보면 이 R2 값이 표기되어 있는 경우는 잘 없음 23/ 78
24 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) (즉 β 의 추출분포의 중앙 및 변이)을 본격적으로 배우기 전에 몇 가지 확률이론에 대해서 공부를 해야함 = 왜냐하면 이 이론을 모르면 OLS 추정량의 유한 표본 및 대표본 성질을 제대로 이해할 수 없기 때문 이렇게 계량경제학은 확률과 통계학을 모르고서는 제대로 공부할 수 없다는 것을 명심하시길 바랍니다! 두 가지 확률이론: 1. 조건부 기대값(Coditioal Expectatio) 2. 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) 24/ 78
25 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 조건부 기대값(Coditioal Expectatio) 연구자는 어떤 한 설명변수 X와 결과변수 Y 간에 어떤 관계가 존재하는지 연구를 함 이 때 이 관계는 선형 으로 나타날 수도 있고 비선형 으로 나타날 수도 있음 = 어떤 형태의 관계가 존재하든 이 두 변수 간의 관계를 연구함 연구자가 연구하는 Y 의 예로 임금수준 그리고 X의 예로 교육수준을 들 수 있음 확률이론을 공부할 때 조건부 확률에 대해서 배움: P (Y X = x) 조건부 확률을 아는 것도 중요하지만 연구자가 주로 밝혀내고 싶은 것은 X의 변화로 인해 Y 의 분포가 어떻게 변하는지임 = 이러한 관계식은 X가 주어졌을 때 Y 의 조건부 기대값을 구하면 알 수 있음 25/ 78
26 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 조건부 기대값(Coditioal Expectatio) 설명변수 X가 어떤 특정한 값 x를 취한다고 하겠음. 이 때 Y 의 기대값을 계산할 수 있는데 이 기대값을 E(Y X = x)로 표기함 = 대개 x가 변하면 E(Y X = x)의 값도 변하게 됨 예: (X, Y )는 어떤 모집단을 대변하는 두 확률변수. X는 교육수준이고 Y 는 임금수준 1. E(Y X = 12)가 의미하는 것이 뭘까? = 이 조건부 기대값이 의미하는 것은 모집단에서 교육수준이 12년인(즉 고졸) 사람들의 임금수준의 기대값(평균)임 2. E(Y X = 16)은 교육수준이 16년인(즉 4년 제 대졸) 사람들의 임금수준의 기대값(평균)임 이와 같이 모든 교육수준 에 대해서 Y 의 조건부 기대값을 계산하면 교육수준(X)과 임금(Y )이 어떤 식으로 연관되어 있는지를 파악할 수 있음 26/ 78
27 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 조건부 기대값(Coditioal Expectatio) 밑의 그림이 그 예를 보여주고 있음: 그림: X가 주어졌을 때의 Y 의 조건부 기대 함수 27/ 78
28 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 조건부 기대값(Coditioal Expectatio) OLS 회귀식도 이 조건부 기대 함수를 나타내는 한 예: E(Y X = x) = β 0 + β 1 x = 조건부 기대 함수와 관련해서 OLS 회귀식은 두 변수 간의 관계를 선형 으로 기술한 것임 조건부 기대값과 관련해서 다음의 법칙이 유용: E(g(X) X) = g(x) = 즉 X가 주어졌을 때의 g(x)의 기대값은 g(x)라는 것을 의미 직관적으로 명백. X를 아니까 당연히 이 X의 함수 g(x)도 알게 된다는 것임 예: E(X 2 X) = X 2 E(X + Y X) = X + E(Y X) 28/ 78
29 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) 조건부 기대 함수와 관련해서 굉장히 유용한 법칙: 기대값의 반복 법칙! = 이 법칙을 계량경제학에서 굉장히 많이 활용 Theorem 두 개 확률변수 X와 Y 에 대해서 다음이 성립: E [E(Y X)] = E(Y ) 위 정리를 기대값의 반복 법칙(LIE)이라고 함 = 즉 어떤 조건부 기대 함수 E(Y X)가 있을 때 이 함수에 또 기대값을 취하면 무조건부 기대 함수 E(Y )가 된다는 것임 29/ 78
30 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 추정량 x 는 모수 µ의 비편의 추정량! = E(x ) = µ. 항상 그랬나? No! x 가 µ의 비편의 추정량이기 위해서는 한 가지 가정이 필요했음: = 바로 표본을 무작위로 추출했을 때만 성립 안타깝게도 OLS 추정량 β 이 모수 β의 비편의 추정량이기 위해서는 총 4 가지 가정이 필요!! = 다시 말해 이 4가지 가정이 만족하지 않으면 β 은 β의 비편의 추정량이 되지 않는다는 것임!!! 이 4가지 가정이 매우 매우 중요!!! 30/ 78
31 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정 1 Assumptio 1 (선형 모수) 모집단에서 결과변수 y는 설명변수 x 및 오차항 ε과 선형적인 관계에 놓여 있다는 가정! 즉 다음과 같은 가정을 만족해야 함: y = β0 + β1 x + ε = 위에서 β0 와 β1 은 모집단에서의 절편과 기울기를 나타내는 모수 질문: 모집단 관계식이 y = β0 + β1 x + β2 x2 + ε이면 가정 1 위배인가? = No! 가정 1이 말하는 선형 모수 라는 것은 모수에 있어서 선형이어야 1 한다는 것을 의미. 즉 y = β0 + x + ε 이런 관계식이 안된다는 것을 의미! β1 31/ 78
32 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정 2 Assumptio 2 (무작위 표본) 모집단에서 개 크기의 표본을 무작위로 추출했다는 가정 모집단 관계식은 무작위 표본 하에서 다음과 같이 표시됨: yi = β0 + β1 xi + εi, i = 1, 2,..., 위에서 εi 는 오차항. 잔차 ε i 가 아님 32/ 78
33 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정 3 Assumptio 3 (설명변수의 변이 필요) 표본 자료에서 설명 변수 xi 에 변이가 존재해야 함 가정 3이 왜 필요할까? = 그 이유는 설명 변수 xi 에 변이가 존재하지 않으면 OLS 추정량을 계산할 수 없기 때문 노트 2에서 β 1 = r (sy ) / (sx )인 것을 배웠음. 즉 x에 변이가 없으면 sx = 0 이 되어서 분수가 정의가 안됨! 33/ 78
34 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정 4 Assumptio 4 (영 조건부 기대값) 설명변수 x가 주어졌을 때의 오차항 ε의 기대값은 0이라는 가정이 필요. 즉 다음과 같은 가정: E(ε x) = 0 무작위 표본 하에서 가정 4가 의미하는 것: E(εi xi ) = 0, i = 1, 2,..., = 이 가정이 가장 중요!!!! 34/ 78
35 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정 위에 언급한 가정 1부터 4가 모두 만족을 해야 OLS 추정량에 비편의성이 성립하므로 각각의 가정이 뭘 의미하는지 알아야 함! 가정 1: y = β0 + β1 x + ε = 가정 1은 모집단에서 x와 y가 선형적인 관계에 놓여 있어야 한다는 것을 의미 이 가정은 당연히 만족하지 않을 수 있음 = 가정 1이 만족하지 않을 때 OLS 추정량에 편의 가 존재하기 때문에 OLS 추정량 β 은 β에 근사하지 않을 확률이 매우 큼 이 가정 1이 만족하지 않을 때 사용할 수 있는 추정량이 비선형 최소제곱법 (o-liear least squares)인데, 이 방법은 매우 어렵기 때문에 여기서는 못다룸 35/ 78
36 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정의 의미 가정 2: 무작위 표본이어야 한다는 것 = 따라서 통계 분석에 앞서 자신이 갖고 있는 표본이 모집단을 잘 대표하는 표본인지에 대해서 항상 생각을 해봐야 함 가정 3: 설명변수에 변이가 존재 = 가정 3은 웬만하면 성립하는 가정 = 예를 들어, 어떤 정책을 평가할 때 정책의 수혜자가 있고 수혜를 못 받은 사람이 있어야 정책의 효과를 분석할 수 있다는 것임 36/ 78
37 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정의 의미 OLS 추정량을 사용할 때 연구자가 가장 신경써야 할 가정은 네 번째 가정!! 영 조건부 기대값 가정이라고 하는데 이 가정은 Corr(ε, x) 6= 0일 때 위배됨 = 즉 ε과 x 간에 상관관계가 존재할 때 가정 4가 만족을 안 하게 됨 따라서 연구에서 OLS 추정량을 사용해서 β 을 추정하고자 한다면 ε와 x 간에 상관관계가 존재하는지 안 하는지에 대해서 판단을 반드시 해야 함 37/ 78
38 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정의 의미 ε와 x 간에 상관관계가 존재한다는 것의 의미? 예: 교욱수준(x)이 임금(y)에 미치는 효과를 추정하고자 다음과 같은 회귀식을 추정 yi = β0 + β1 xi + εi 만약 위에서 Corr(xi, εi ) 6= 0이면 가정 4 위배!! 이 세팅에서는 가정 4가 위배될까? = 위배될 소지가 너무나도 많음! 38/ 78
39 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정의 의미 yi = β0 + β1 xi + εi εi 는 오차항인데 이 안에 포함되어 있는 것들: 1. yi 에 영향을 미치는 관측 가능한 변수 중에 우리가 통제하지 않은 변수 2. 우리가 관측할 수 없는 변수: 어떤 사람의 자제심, 호기심, 끈기 이러한 특성이 xi 와 상관관계가 존재할까? 충분히 존재할 소지가 있음 기본적으로 호기심, 끈기 등이 강한 사람일수록 교육수준이 높을 것임 = 즉 이 세팅에서는 Corr(xi, εi ) 6= 0!! 따라서 가정 4가 만족하지 않음. 가정 4가 만족 안 하기 때문에 OLS 추정량에는 편의가 존재 = 이런 상태에서 OLS 추정량으로 β1 을 β 1 으로 추정하면 이 β 1 값이 반영하는 것이 교육수준의 효과인지 혹은 끈기의 효과인지를 알 수가 없다는 것 39/ 78
40 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정의 의미 yi = β0 + β1 xi + εi 어떤 정책의 효과를 추정하는 연구에서도 가정 4가 위배되는 경우가 허다함 예를 들어 고혈압 환자에 대한 상담 서비스와 같은 정책(x)을 시행한다고 하겠음 이 상담 서비스를 받는 사람들은 대개 자신의 상태를 개선시키고 싶어하는 사람. 이런 사람들은 건강에 관심이 많은 사람일 것임 = 따라서 이 정책에 참여하는 사람과 참여하지 않는 사람 간에는 다양한 형태의 차이점이 존재할 것임 그렇다고 한다면 이런 상태에서도 Corr(정책 수혜 여부, εi ) 6= 0이어서 가정 4 위배! 40/ 78
41 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정의 의미 yi = β0 + β1 xi + εi 질문: 어떤 상황이 가정 4가 만족하는 상황일까? 통계학을 배울 때 인과관계 증명에 있어서 가장 강력한 툴이? = 무작위 배정! 만약 어떤 정책의 수혜 여부를 무작위로 결정했다고 하면 정책에 참여하는 사람과 정책에 참여하지 않은 사람 간에 어떤 특성 차이가 존재하지 않을 것임 = 따라서 이런 경우에는 Corr(정책 수혜 여부, εi ) = 0이 성립할 확률이 굉장히 높을 것임 통계학에서와 마찬가지로 계량경제학에서도 설명변수를 무작위로 결정하는 게 가정 4를 만족시키는 가장 확실한 방법으로 간주되고 있음 41/ 78
42 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정의 의미 지금까지 가정 4에 대해서 참 많은 얘기를 했음 사실 계량경제학이나 실험 및 준실험 설계 기법의 여러 이론이 개발된 이유가 이 가정 4를 만족시키기 위해 개발되었다고 해도 과언이 아님 나중에 제가 또 강의를 할 기회가 생기면 그 때 배우게 되겠지만 고정효과모형(fixed effects model), 도구변수 추정량(istrumetal variable estimator), 이중차이추정량(differece-i-differeces estimator) 등이 개발된 이유가 바로 이 가정 4를 만족시키기 위해서임 강조하고 싶은 것은 어떤 연구를 OLS 회귀분석을 통해 수행하고자 할 때, 위 가정(특히 가정 4)이 만족을 하는지 반드시 검토를 해야 한다는 것임 = 양적 연구는 어떻게 보면 이 가정들이 만족한다는 것을 여러 형태로 보여주는 과정이라고 해도 과언이 아니라고 생각함 42/ 78
43 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 위해 필요한 가정의 의미 이제 OLS 추정량의 비편의성 정리를 논할 수 있음: Theorem (OLS 추정량의 비편의성 정리) 가정 1부터 4가 만족하면, OLS 추정량 β 0 과 β 1 은 모수 β0 과 β1 의 비편의 추정량이 됨. 즉, E βˆ0 = β0 E βˆ1 = β1 OLS 추정량의 비편의성이 가정 1부터 4에 아주 크리티컬하게 달려 있다는 것을 여러분이 안 잊었으면 하는 바램으로 위 정리를 증명해보도록 하겠음 43/ 78
44 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 증명 증명에 앞서 다음과 같은 사실을 알고 있어야 함: X X X (xi x )(yi y ) = xi (yi y ) x (yi y ) = X " X xi (yi y ) = = = X x yi " xi (yi y ) x X X X X # x y yi X # x y xi (yi y ) [x y x y ] xi (yi y ) 마찬가지로 P (xi x )(xi x ) = P xi (xi x ) 44/ 78
45 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 증명 Cov(xi, yi ) β 1 = = V ar(xi ) P P (xi x )yi (xi x )(yi y ) P = P 2 2 (x x ) i (xi x ) 가정 1과 2 에 의해 yi = β0 + β1 xi + εi 이고 이를 위 β 1 식에 대입하면 P P (xi x )yi (xi x )(β0 + β1 xi + εi ) β 1 = P = 2 T SSx (xi x ) 위 식에서 분자만을 놓고 보면 다음이 성립: X (xi x )(β0 + β1 xi + εi ) = X (xi x )β0 + = β0 X (xi x )β1 xi + X (xi x ) + β1 X X (xi x )εi X (xi x )xi + X = β0 0 + β1 T SSx + (xi x )εi (xi x )εi 45/ 78
46 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 증명 그럼 β 1 은 β 1 = P P β1 T SSx + (xi x )εi (xi x )εi = β1 + T SSx T SSx = 가정 3 에 의해 분수 정의됨! β 1 의 비편의성을 증명하기 위해 조건부 기대값 E(β 1 x)을 먼저 계산: P X 1 (xi x )εi x = β1 + E (xi x )εi E(β 1 x) = E β1 + T SSx T SSx = β1 + 가정 4 에 의해 = = β1 + 1 X (xi x )E εi T SSx! x x 1 X (xi x ) 0 T SSx = β1 = E E(β 1 x) = E(β1 ) E(β 1 ) = β1 (LIE에 의해) 46/ 78
47 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 증명 즉 우리는 추정량 β 1 이 모수 β1 의 비편의 추정량인 것을 증명했음: E(β 1 ) = β1 증명 쉽나요????? 증명 과정을 다시 차분하게 보면 E(β 1 ) = β1 이기 위해서는 가정 1, 2, 3, 4 모두 만족을 해야 한다는 것을 알 수 있음!!! 47/ 78
48 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 증명 다음은 β 0 의 비편의성 증명: h i = E β 0 x = E y + β 1 x x = β0 + E β1 β 1 x x + E (ε i x)! 1X εi x = β0 + x E β1 β 1 x + E 1X E(εi x) (기대값의 성질에 의해) = β0 + x E β1 β 1 x + = β0 + x E β1 β 1 x (가정 4에 의해 E(εi x) = 0) h i = β0 + x E (β1 x) E β 1 x = β0 + x (β1 β1 ) = = = β0 i E E β 0 x = E(β0 ) E β 0 = β0 h (LIE에 의해) 48/ 78
49 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 증명 자꾸 이런 증명 과정에 익숙해져야 고급계량경제학에 도전을 할 수 있음 = 따라서 책을 읽으면서 이런 과정을 회피하면 안됨 이 증명 과정을 통해 다시 한 번 강조할 것은 가정 1부터 4가 만족을 할 때만이 OLS 추정량이 비편의 추정량이 된다는 사실!! = 즉 이 가정들이 만족할 때만 이 추정량의 추출분포의 중앙이 모수와 일치한다는 것! 49/ 78
50 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량의 비편의성 서울시는 강북에 사는 학생들이 점심 끼니를 많이 거른다는 설문조사의 결과를 토대로 강북에 사는 학생들에 대해서 무상급식을 실시하는 정책을 실시. 이 무상급식 정책이 학생들의 학업성취도에 미친 효과를 분석하기 위해 서울시에 있는 학생을 대상으로 통계분석을 실시. 변수 x는 무상급식을 제공받은 학생의 경우 1의 값을 갖고 그렇지 않은 학생의 경우 0의 값을 갖는 이항변수. 이 변수를 토대로 다음과 같은 회귀식 추정: y = β0 + β1 x + ε 교육패널을 이용해 다음과 같은 OLS 회귀식을 추정함: y = β 0 + β 1 x = x 위 OLS 추정값을 보면 학생이 무상급식을 제공받으면 학업성취도가 약 0.32 표준편차 만큼 떨어진다는 것을 알 수 있음 = 이 추정값이 맞을까? 저는 이 추정량을 안 믿음. 왜냐하면 OLS 추정량에 편의가 존재하기 때문. 제일 문제가 되는 것은 가정 4가 만족을 안한다는 것. 즉 Corr(ε, x) 6= 0 강북에 사는 학생들은 다른 지역에 사는 학생에 비해 가구 소득수준도 낮고 학교 시설이나 주변 환경도 강남에 있는 학교에 비해 그 질이 좀 떨어질 것임 = 이러한 요인들이 ε에 포함되어 있을 것임. 따라서 당연히 Corr(ε, x) 6= 0 그렇기 때문에 OLS 추정량에는 편의가 존재하게 되고 위에 도출한 추정값 0.319이 x가 y 에 미치는 인과적 효과라고 주장할 수 없음 50/ 78
51 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) OLS 추정량과 관련해서 우리가 또 알아야 할 것은 변이 즉 추출분포의 분산 = 이와 관련해서 OLS 추정량이 다른 추정량에 비해서 큰 장점이 있다는 것을 말해주는 Gauss-Markov 정리에 대해서 배울 것임 좀 전에 가정 1부터 4가 만족하면 OLS 추정량이 비편의 추정량이 된다는 것을 증명 = 문제는 이 4개의 가정이 모두 만족할 때 모수 βj 의 비편의 추정량이 되는 추정량은 많이 존재한다는 사실 수리통계학을 배울 때 여러 개의 비편의 추정량이 존재할 때 사용할 수 있는 기준은? = 효율성 기준 어떤 두 개의 비편의 추정량 W1 과 W2 가 존재할 때, V ar(w1 ) < V ar(w2 )이면 추정량 W1 이 W2 에 비해 효율적이라고 배움 51/ 78
52 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 따라서 OLS 추정량 β j 이 효율적인지 안 효율적인지를 판단하기 위해서는 우선 β j 의 분산 즉 V ar β j 을 구해야 함 V ar β j 을 계산하기 위해서 다음과 같은 다섯 번째 가정이 필요 Assumptio 5 (등분산성(Homoskedasticity)) 설명변수 x에 따라 오차항 ε의 분산 값이 변하지 않는다는 가정. 수학적으로는: V ar(ε x) = σ 2 가정 5를 등분산성 가정이라고 함 52/ 78
53 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) V ar(ε x) = σ 2 등분산성이 의미하는 것: 예: X =소득, Y =저축 = 등분산성이 의미하는 것은 소득수준이 적든 많든 사람들의 저축 행태가 똑같다는 것임 OLS 추정량의 분산을 구하기 위해서는 이와 같은 등분산성의 가정이 필요하다는 것! 53/ 78
54 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) V ar(ε x) = σ 2 연구를 할 때 이 등분산성 가정이 만족하는 경우는 거의 없음. 이 예에서도 당연히 성립하지 않을 소지가 큼 = 소득수준이 높은 사람의 경우 그렇지 않은 사람에 비해 투자 기회 등이 많기 때문에 저축의 행태에 많은 변이가 존재할 것임. 따라서 등분산성 가정이 성립하지 않음 이렇게 등분산성이 아닐 때 이분산성(heteroskedasticity)이 존재한다고 함 54/ 78
55 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 이분산성이면: V ar(ε x) = σi2 그림 : 이분산성의 예시 55/ 78
56 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 앞서 OLS 추정량의 분산을 계산하기 위해서는 가정 5 즉 등분산성 가정을 만족해야 한다고 했음 이분산성이 존재할 때는 그럼 OLS 추정량의 분산을 구할 수 없느냐? 그렇지는 않음 우리의 똑똑한 통계학자들이 등분산성이 만족을 안할 때 사용할 수 있는 분산 공식을 개발함: 1. 강건 표준오차(robust stadard errors) 2. 클러스터 표준오차(cluster stadard errors) = 하지만 위 분산식은 좀 어렵기 때문에 여기서는 다루지 못함 우선 여기서는 등분산성 가정이 만족한다는 가정 하에 OLS 추정량의 분산을 계산함 56/ 78
57 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) 가정 1부터 5 까지 모두 만족을 하면 OLS 추정량의 추출변이(분산)는 다음 공식을 이용해서 구할 수 있음 Theorem (OLS 추정량의 추출변이) 가정 1부터 5가 만족을 하면 OLS 추정량의 분산은: 1 2X 2 σ xi σ2 V ar β 0 x = V ar β 1 x = X X (xi x ) (xi x ) 위 정리 증명하길 원하시나요? 57/ 78
58 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) V ar β 0 x 의 증명 과정: 58/ 78
59 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) Gauss-Markov 정리 어쨌든 위 증명 과정을 찬찬히 따라가시면 OLS 추정량의 분산을 구하기 위해서도 가정 1부터 4 그다음에 추가적으로 가정 5까지 필요하다는 것을 알 수 있음 = 이렇게 OLS 추정량을 실제 연구에 사용하기 위해서는 이 가정들이 만족한다는 것을 연구에서 보여줘야 함! 이제 우리는 Gauss-Markov 정리를 논할 수 있음 우리가 OLS로 어떤 연구 주제를 통계 분석하는 이유가 바로 이 정리 때문임 = 이 정리가 알려주는 것은 가정 1부터 5가 만족을 하면 모수 βj 의 여러 선형(liear) 추정량 중에 이 OLS 추정량 β j 이 가장 좋다는 사실! 59/ 78
60 조건부 기대값(Coditioal Expectatio) 기대값의 반복 법칙(Law of Iterated Expectatio, LIE) OLS 추정량의 비편의성(β 의 추출분포의 중앙) Gauss-Markov 정리 Theorem (Gauss-Markov 정리) 가정 1부터 5가 만족을 하면, β 0 과 β 1 이 모수 β0 과 β1 의 가장 좋은 선형 비편의 추정량(best liear ubiased estimators, BLUE)이 됨 가장 좋다는 것의 의미는 뭘까? = 이 OLS 추정량이 효율적이다, 즉 다시 말해 OLS 추정량의 추출분포의 변이가 가장 적다는 측면에서 좋다는 것임 어떤 두 개의 비편의 추정량이 존재할 때, 변이가 작은 추정량을 사용해야 좀 더 모수 값과 일치하는 통계량을 얻을 수 있음! 다시 한 번 강조: 가정 1부터 5가 모두 만족해야 함! 60/ 78
61 OLS 추정량의 일치성(Cosistecy) OLS 추정량의 일치성(Cosistecy) 어떤 추정량의 사용 여부를 결정할 때 추정량에게 최소한으로 요구되는 대표본 특성이 있음. 바로 일치성 일치성의 정의: 일 때 W θ(모수)이면 추정량 W 을 θ의 일치 추정량이라고 함 많은 사람들이 이 OLS 추정량을 사용하는 이유가 이 OLS 추정량도 일치 추정량이기 때문!! β i 이 모수 βi 의 일치 추정량이라는 것은 이면 β i βi 이 된다는 것을 의미 = 언제 β i 이 일치추정량이 될까? 61/ 78
62 OLS 추정량의 일치성(Cosistecy) OLS 추정량의 일치성(Cosistecy) Theorem (OLS 추정량의 일치성) 가정 1부터 4가 모두 만족할 때, β 0 과 β 1 은 β0 과 β1 의 일치 추정량이 됨 = 정리를 보면 일치성도 가정 1부터 4가 모두 만족해야 성립!! 62/ 78
63 OLS 추정량의 일치성(Cosistecy) OLS 추정량 결론 지금까지 OLS 추정량의 비편의성(가정 1부터 4가 모두 만족할 때), 변이 및 효율성(가정 1부터 5가 모두 만족할 때), 그리고 일치성(가정 1부터 4가 모두 만족할 때)에 대해서 배움 연구에서 OLS 추정량으로 어떤 정책의 효과를 추정하고자 한다면 이 가정들이 만족을 하는지 안 하는지에 대해서 많은 고민을 해야 함 만족을 안한다면 만족을 하게끔 연구설계를 짜던가 혹은 그 연구를 하면서 상관관계만을 도출하는데에 만족을 해야 함 계량경제학이나 실험 및 준실험 설계 기법에서 배우는 내용은 이러한 가정이 만족하지 않을 때 OLS 추정량에 어떤 문제점이 생기고 또 그에 따라 어떻게 대응을 해야 하는지를 배우게 됨 63/ 78
64 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 이제 을 하는 법에 대해서 배울 것임 통계적 추론을 하기 위해서는 뭘 알아야 할까? = OLS 추정량의 추출분포의 중앙과 변이, 그리고 모양 중앙과 변이는 이미 알아냄. 이제 남은 건 OLS 추정량의 추출분포의 모양이 어떻게 되는지임 64/ 78
65 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량의 추출분포의 모양 지금까지 OLS 추정량의 추출분포의 중앙 및 변이 가 어떻게 되는지 알아보았음. 가정 1부터 4가 모두 만족을 하면 OLS 추정량 β 0 과 β 1 의 추출분포의 중앙은 모수 β0 과 β1 에 위치. 즉, E β 0 = β0 E β 1 = β1 그리고 가정 1부터 5가 모두 만족하면 우리는 OLS 추정량의 분산을 구할 수 있음. 즉 OLS 추정량의 추출분포의 변이는 다음과 같은 공식을 이용해 계산할 수 있음: V ar β 0 x = 1 2X 2 σ x i X V ar β 1 x = (xi x ) σ2 X (xi x ) 65/ 78
66 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량의 추출분포의 모양 문제는 중앙과 변이에 대한 정보만을 갖고는 을 할 수가 없음. 추론을 하기 위해서는 OLS 추정량의 추출분포의 모양을 알아야 함 x 의 추출분포의 모양은 CLT에 의해 정규분포를 띤다는 것을 배움 = 이 때 두 가지 가정 즉, 무작위 표본과 표본 수가 커야한다는 가정필요했음 β 0 과 β 1 의 추출분포의 모양을 알기 위해서는 다음과 같은 여섯 번째 가정이 추가적으로 필요함. 계량경제학에는 참 많은 가정이 나옴... Assumptio 6 (정규성 가정) 모집단 모수인 오차항 ε은 평균이 0이고 분산이 σ 2 인 정규분포를 따른다는 가정임. 즉, ε N 0, σ 2 66/ 78
67 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량의 추출분포의 모양 가정 1부터 5 그리고 가정 6 까지 모두 만족하면 이제 우리는 OLS 추정량의 추출분포의 모양에 대해서 알 수 있음 Theorem (추출분포의 정규성) 가정 1부터 6이 모두 만족하면: β j N E β j, V ar β j = N βj, V ar β j 이에 따라 추론을 할 때 사용되는 z 검정 통계량과 관련해서 다음이 성립: z= β j βj N (0, 1) SD β j 67/ 78
68 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량의 추출분포의 모양 z= β j βj N (0, 1) SD β j 위 검정통계량을 보면 한 가지 곤란한 점이 있음. 분모에 SD(β j )가 문제 β 1 의 표준편차: SD β 1 = r V ar β 1 v u σ2 u =u ux t (xi x ) = 위 식을 보면 σ 2 즉 오차항의 모집단 분산 V ar(ε)을 알아야 검정통계량을 계산할 수 있음을 알 수 있음 68/ 78
69 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량의 추출분포의 모양 통계학에서 x 에 대한 통계적 추론을 할 때 x 와 관련해서 사용하는 z 검정통계량: z= x µ σ/ = 식 안에 σ 즉 모집단 표준편차가 있음 통계학에서 우리는 이 σ를 모를 때 뭐로 대체? = 바로 표본의 표준편차 s로 σ를 대체하고 t 검정 통계량을 계산 계량경제학에서도 V ar(ε)을 표본을 이용해 추정해서 그 추정값으로 대체를 할 것임. 즉 V ar(ε i )을 구해서 V ar(ε)을 대체하고 검정 통계량을 계산할 것임 69/ 78
70 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량의 추출분포의 모양 왜 V ar(ε i )로 V ar(ε)를 대체할까? 통계학에서는 왜 σ를 s로 대체? = s가 σ의 일치 추정량이기 때문 여기서 V ar(ε)를 V ar(ε i )로 대체하는 이유 또한 마찬가지 = V ar(ε i )는 V ar(ε)의 일치 추정량이기 때문. 즉, E (σ ) = σ V ar(ε i )로 V ar(ε)를 대체하면 분모는 SD β j 이 아닌 SE β j 가 됨. 즉 표준오차가 됨. 표준오차를 이용하면 다음과 같은 사실이 성립: t= β j βj t( k 1) SE β j = 즉 검정 통계량이 자유도가 k 1인 t 분포를 따르게 됨. 여기서 k는 설명변수의 개수 70/ 78
71 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량의 신뢰구간 이제 을 하기 위한 모든 정보가 있음 모수 βj 에 대한 신뢰구간은: β j ± t SE β j = µ의 신뢰구간을 구하는 공식과 비슷한 형태 여기서 강조하고 싶은 것은 저 신뢰구간 추정량이 맞기 위해서는 반드시 가정 1부터 6까지 만족을 해야 한다 는 것 = 만약 가정이 만족 안 하면 β j 에는 편의가 있게 되고 심지어 표준오차 (SE) 식 또한 알 수가 없기 때문에 표준오차 값도 계산할 수 없기 때문 71/ 78
72 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량의 신뢰구간 예 예: 기업의 규모(x)가 R&D 지출(y)에 미치는 효과를 추정하기 위해 42개의 기업을 모집단에서 무작위로 추출한 후에 회귀분석을 실시. 기업 규모는 연 매출액으로 측정. 표본 자료를 토대로 다음과 같은 선형 회귀식을 추정. 괄호 안에 있는 숫자는 표준오차 y = x (0.47) (0.038) β1 의 95% 신뢰구간은? 답: 95% 신뢰구간을 추정하기 위해서는 t 값을 구해야 함. 우선 자유도는 k 1 = = 40. t 분포표를 보면 t = 2.021인 것을 알 수 있음 β 1 = 0.084이고 SE β 1 = 0.038이므로, β1 의 95% 신뢰수준은: 95% 신뢰구간 = β 1 ± t SE β 1 = = (0.007, 0.161) 다시 강조를 하지만 위에서 추정한 신뢰구간이 타당하기 위해서는 가정 1부터 6이 만족해야 함!! 72/ 78
73 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량에 대한 유의성 검정 두 번째 통계적 추정 방법인 유의성 검정은 t 검정 통계량과 p 값을 구하면 됨 앞서 배웠듯이 t 검정 통계량은: t= β j βj SE β j 예: 학생의 강의 출석율과 학점(GPA) 간의 인과관계를 분석하기 위해 표본의 크기를 = 82로 해서 무작위로 학생을 추출하고 대학 학점(y)을 결과변수로 그리고 한 주에 빠진 강의 수(x)를 설명변수로 해서 회귀분석을 돌림. 추정된 회귀모형은: y = x (0.762) (0.032) 위에서 계수 밑에 있는 숫자(괄호 안 숫자)는 각각의 OLS 추정값의 표준오차 = 변수 x의 계수 값의 유의성을 5% 유의수준에서 검정해보시오 답: 유의성 검정을 할 때 첫 번째로 해야할 일? 가설 설정! 이 세팅에서 가설은 다음과 같이 설정할 수 있을 것 같음: H0 : β1 = 0 vs. Ha : β1 6= 0 = 즉 귀무가설은 출석율이 학점에 미치는 영향이 전혀 없다는 것! 73/ 78
74 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량에 대한 유의성 검정 y = x (0.762) (0.032) 그다음으로 할 일은 다음과 같이 t 검정 통계량을 구하는 것: t= β 1 β1 SE β = 0.68 = 마지막 단계는 p 값을 구하는 것 = 자유도는 = 80이고 양측검정이기 때문에 t 분포표에 의하면 p 값은 = 0.5임 이 추정된 p = 0.5는 0.05 즉 5% 유의수준보다 크기 때문에 우리는 귀무가설을 기각할 수 없음 = 다시 말해 강의 출석률이 학점에 미치는 영향이 없다 라는 가설을 기각할 수 있는 강력한 근거가 부족!! 74/ 78
75 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량에 대한 유의성 검정 y = x 위 결과를 갖고 강의를 빠지는 것이 학점에 아무런 영향을 미치지 않는다고 결론 내릴 수 있나? 즉 강의 출석율과 학점 간에 아무런 인과관계가 존재하지 않는다고 결론 내릴 수 있을까? = 결코 그렇게 결론 내릴 수 없음. Why? 이 세팅 하에서는 OLS 추정량에 편의가 존재하기 때문. 특히 가정 4가 만족할 가능성이 없음 다시 말해 이 세팅 하에서는 다음과 같이 가정 4가 만족하지 않음 Cov(x, ε) 6= 0 = E(ε x) 6= 0 예를 들어 관측 불가능한 특성(의지력) 같은 것이 ε에 포함되어 있을 것임 = 당연히 의지력이 높은 학생일수록 강의 출석율이 높을 것임 가정 4가 만족을 안하기 때문에 위 OLS 추정량에는 편의가 존재하고 위와 같은 결과를 토대로 두 변수 간에 인과관계를 주장할 수 없음!! 75/ 78
76 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 OLS 추정량에 대한 유의성 검정 가정 4, 인과관계 증명과 관련해서 너무나도 중요한 가정!! 실험 및 준실험적 연구방법론이 이 가정 4를 만족시키는 방법을 다룬다고 해도 과언이 아님 통계학 및 계량경제학의 기초를 튼튼히 해서 반드시 이 실험 및 준실험적 연구방법론을 마스터 하고 이러한 방법론이 갖고 있는 매력을 여러분이 느끼셨으면 좋겠음 76/ 78
77 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 당부의 말씀 이제 Wooldridge 책을 이해하기 위해 필요한 기초는 갖추었다고 해도 과언이 아닙니다 Data를 활용한 연구 능력을 증진시키기 위해서는 반드시 교재를 읽어야 합니다. 즉 공부를 하셔야 합니다! 공부를 하지 않으면 결코 연구 능력이 증진되지 않습니다! 책을 읽으면서 항상 why?라는 질문을 하고 그 why라는 질문에 답을 하면서 교재 진도를 빼십시오! 책을 읽다가 모르는 게 있으면 언제든지 저한테 찾아 오세요 책 뒤에 있는 연습문제를 꼭 푸세요. 온라인에 답이 다 나와 있습니다 Wooldridge 책에 나와 있는 내용을 정말 확실하게 알고 있으면 웬만한 경제학 박사보다도 더 연구를 잘 할 수 있게 됩니다. 제가 장담합니다! 공부할 시간이 도저히 없다면 최소한 9장까지는 철저하게 공부하길 바랍니다! 77/ 78
78 OLS 추정량의 추출분포의 모양 OLS 추정량의 신뢰구간 OLS 추정량에 대한 유의성 검정 강의를 마치며 강의를 마치며: 1. 제가 이번에 강의를 하면서 강의 내용을 바탕으로 책을 썼어요. 6월 말에 출간되는데 저의 허접한 강의를 끝까지 열심히 들어준 분들께 보내드리겠습니다 2. 이렇게 강의를 통해 만나게 된 것도 인연이니 저와의 인연을 유지하고 싶으시면 언제든지 찾아오세요. 연구를 하면서 궁금한 것이 생기면 찾아오세요. 저는 커피 한잔 하면서 연구 얘기하는 걸 전 굉장히 좋아합니다. 물론 커피 값은 내주시면 감사하고요 3. 앞으로의 진로(유학, 박사 진학, 전공 결정)와 관련해서 조언을 구하고 싶으시면 언제든지 찾아오세요! 4. 강의를 또 맡게 될 일이 없으면 좋겠지만... 혹시라도 맡게되면 그 때 또 보아요 5. 강의를 끝까지 들어주셔서 감사합니다! 78/ 78
모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ
수리통계학(Mathematical Statistics)의 기초 I. 들어가며 지금부터 계량경제학이나 실험 및 준실험 연구설계 기법을 공부할 때 도움이 되는 수리통계 학의 기초에 대해 다룰 것입니다. 이 노트에서 다루게 될 내용은 어떤 추정량(estimator)이 지니고 있는 성질입니다. 한 가지 말씀 드릴 것은 이 노트에 나오는 대부분의 성질들은 지금까 지
More information<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>
제 3 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0
More information공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은
2013 년도연구용역보고서 공공기관임금프리미엄추계 - 2013. 12.- 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한국노동연구원선임연구위원정진호 공공기관임금프리미엄추계 2013. 12. 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영
More informationstatistics
수치를이용한자료요약 statistics hmkang@hallym.ac.kr 한림대학교 통계학 강희모 ( 한림대학교 ) 수치를이용한자료요약 1 / 26 수치를 통한 자료의 요약 요약 방대한 자료를 몇 개의 의미있는 수치로 요약 자료의 분포상태를 알 수 있는 통계기법 사용 중심위치의 측도(measure of center) : 어떤 값을 중심으로 분포되어 있는지
More information1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut
경영학을 위한 수학 Fial Eam 5//(토) :-5: 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오.. (각 6점) 다음 적분을 구하시오 4 ( ) (a) ( )4 8 8 (b) d이 성립한다. d C C log log (c) 이다. 양변에 적분을 취하면 log C (d) 라 하자. 그러면 d 4이다. 9 9 4 / si (e) cos si
More informationVector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표
Vector Differential: 벡터 미분 Yonhee Lee October 7, 08 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표기법을 정의하는 방법이다 보통 스칼라(scalar)에 대한 미분은 일분수 함수 f : < < 또는 다변수 함수(function
More information생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포
생존분석의 추정과 비교 : 보충자료 이용희 December, 8 Cotets 생존함수와 위험함수. 생존함수와 위험함수....................................... 예제: 지수분포.......................................... 예제: 와이블분포.........................................
More information저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할
저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More information저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할
저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More information2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사
회귀분석 올림픽 100m 우승기록 2004년 9월과학저널 Nature에발표된 Oxford 대학교의임상병리학자인 Andrew Tatem과그의연구진의논문 1900~2004년까지의남성과여성의육상 100m 우승기록을분석하고앞으로최고기록이어떻게변할것인지를예측 2008년베이징올림픽에서남자의우승기록은 9.73±0.144(9.586, 9.874), 여자는 10.57±0.232(10.338,
More information= ``...(2011), , (.)''
Finance Lecture Note Series 사회과학과 수학 제2강. 미분 조 승 모2 영남대학교 경제금융학부 학습목표. 미분의 개념: 미분과 도함수의 개념에 대해 알아본다. : 실제로 미분을 어떻게 하는지 알아본다. : 극값의 개념을 알아보고 미분을 통해 어떻게 구하는지 알아본다. 4. 미분과 극한: 미분을 이용하여 극한값을 구하는 방법에 대해 알아본다.
More information(001~006)개념RPM3-2(부속)
www.imth.tv - (~9)개념RPM-(본문).. : PM RPM - 대푯값 페이지 다민 PI LPI 알피엠 대푯값과산포도 유형 ⑴ 대푯값 자료 전체의 중심적인 경향이나 특징을 하나의 수로 나타낸 값 ⑵ 평균 (평균)= Ⅰ 통계 (변량)의 총합 (변량의 개수) 개념플러스 대푯값에는 평균, 중앙값, 최 빈값 등이 있다. ⑶ 중앙값 자료를 작은 값부터 크기순으로
More information... —....—
통계학 추출분포 한국보건사회연구원 2017 년 5 월 22 일 ( 월요일 ) 강의슬라이드 6 1/ 36 목차 1 들어가며 2 표본평균의추출분포 3 추출분포결론 2/ 36 추출분포와통계적추론 통계량의추출분포모집단분포 통계적추론이어떤표본을토대로모집단에대한결론을내리게끔해줌 어떤표본을토대로모집단에대한결론을내릴때, 이표본이모집단을잘대표해야한다는것은이제두말하면잔소리 =
More informationG Power
G Power 부산대학교통계학과조영석 1. G Power 란? 2. G Power 설치및실행 2.1 G Power 설치 2.2 G Power 실행 3. 검정 (Test) 3.1 가설검정 (Test of hypothesis) 3.2 검정력 (Power) 3.3 효과크기 (Effect size) 3.4 표본수산정 4. 분석 4.1 t- 검정 (t-test) 4.2
More informationR t-..
R 과데이터분석 집단의차이비교 t- 검정 양창모 청주교육대학교컴퓨터교육과 2015 년겨울 t- 검정 변수의값이연속적이고정규분포를따른다고할때사용 t.test() 는모평균과모평균의 95% 신뢰구간을추청함과동시에가설검증을수행한다. 모평균의구간추정 - 일표본 t- 검정 이가설검정의귀무가설은 모평균이 0 이다 라는귀무가설이다. > x t.test(x)
More information152*220
152*220 2011.2.16 5:53 PM ` 3 여는 글 교육주체들을 위한 교육 교양지 신경림 잠시 휴간했던 우리교육 을 비록 계간으로이지만 다시 내게 되었다는 소식을 들으니 우 선 반갑다. 하지만 월간으로 계속할 수 없다는 현실이 못내 아쉽다. 솔직히 나는 우리교 육 의 부지런한 독자는 못 되었다. 하지만 비록 어깨너머로 읽으면서도 이런 잡지는 우 리
More information와플-4년-2호-본문-15.ps
1 2 1+2 + = = 1 1 1 +2 =(1+2)+& + *=+ = + 8 2 + = = =1 6 6 6 6 6 2 2 1 1 1 + =(1+)+& + *=+ =+1 = 2 6 1 21 1 + = + = = 1 1 1 + 1-1 1 1 + 6 6 0 1 + 1 + = = + 7 7 2 1 2 1 + =(+ )+& + *= + = 2-1 2 +2 9 9 2
More information<B3EDB4DC28B1E8BCAEC7F6292E687770>
1) 초고를읽고소중한조언을주신여러분들게감사드린다. 소중한조언들에도불구하고이글이포함하는오류는전적으로저자개인의것임을밝혀둔다. 2) 대표적인학자가 Asia's Next Giant: South Korea and Late Industrialization, 1990 을저술한 MIT 의 A. Amsden 교수이다. - 1 - - 2 - 3) 계량방법론은회귀분석 (regression)
More informationPowerPoint 프레젠테이션
응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 13 장상관분석 1. 상관계수 2. 상관분석의가정과특성 3. 모상관계수의검정과신뢰한계 4. 순위상관 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 - 실습 - 상관분석 지금까지한가지확률변수에의한현상을검정하였다.
More information한국보건사회연구원통계학및계량경제학의기초및응용 강의노트 2017 년 4 월 5 월 통계학 : 통계적추론 (Statistical Inference) I. 들어가며 이제통계학에서가장중요한토픽이라고할수있는통계적추론에대해서본격적으로공부를해보도록하겠습니다. 통계적추론을통해연구와관
통계학 : 통계적추론 (Statistical Inference) I. 들어가며 이제통계학에서가장중요한토픽이라고할수있는통계적추론에대해서본격적으로공부를해보도록하겠습니다. 통계적추론을통해연구와관련한두가지중요한일을할수가있습니다. i) 한개표본의통계량을토대로모집단에대한결론을내릴수있고 ii) 그결론에어느정도의신뢰를부여할수있는지에대한판단을할수있습니다. 통계적추론은두가지방식으로할수있습니다.
More information<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>
Par II. 다중회귀모형및기본가정의완화 I. 다중회귀모형 A. 다중회귀모형에대한가정 = β+β x + +β x +ε, =,..., ( x ) 관측치의수, 설명변수의수 K-, 추정모수의수 K 개별모수들의의미 : E( ) 예컨대, β = : 다른설명변수들이일정할때, x 의한 x 단위변화에대한종속변수의평균값의변화 즉다른변수들의영향력이통제 (conrol) 된상황에서첫번째설명변수의종속변수에대한영향력을나타내는값임
More information... —... ..—
통계학 통계적추론 한국보건사회연구원 2017 년 5 월 29 일 ( 월요일 ) 강의슬라이드 7-1 1/ 72 목차 1 서론 2 신뢰구간을이용한통계적추론 3 통계적유의성검정 4 유의성검정과관련해서유의해야할점 2/ 72 지난시간복습 왜 x 가 µ 와완벽하게일치하지않고또어떤표본을추출했냐에따라 x 값이달라지는데이 x 를이용해서모집단 µ 를추정할까? 두가지사실때문 :
More information2013unihangulchar {45380} 2unihangulchar {54617}unihangulchar {44592} unihangulchar {49328}unihangulchar {50629}unihangulchar {51312}unihangulchar {51
Proem Se 4 산업조직론 (ECM004N) Fall 03. 독점기업이 다음과 같은 수요함수를 각각 가지고 있는 두 개의 소비자 그룹에게 제품을 공급한다고 하자. 한 단위 제품을 생산하는 데 드는 비용은 상수 이다. 다음 질문에 답하시오. P = A B Q P = A B Q () 두 그룹에 대하여 가격차별을 하고자 할 때 각 그룹의 균형생산량(Q, Q )과
More information(Hyunoo Shim) 1 / 26 조건부생명확률 (coningen probabiliy) 이란? 사망의순서 ( 조건이됨 ) 를고려한생명확률동시생존자 / 최종생존자생명확률 : 사망이 x이든 y이든가리지않음 ( 대칭적 ) [ 조건부생명확률 : x와 y의사망순서를고려함 ( 비대칭적 ) ➀ 기호 : 예를들어, q 1 xy a) 사망순서 : 숫자 1, 2, 3,...
More information제 4 장회귀분석
회귀의역사적유래 (historical origin of the regression) 회귀 (regression) 라는용어는유전학자 Francis Galton(1886) 에의해처음사용된데서유래함. 그의논문에서 비정상적으로크거나작은부모의아이들키는전체인구의평균신장을향해움직이거나회귀 (regression) 하는경향이있다. 고주장 회귀의역사적유래 (historical
More information제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint
제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Winters의계절지수평활법 이동평균법 (moving average method) 평활에의해계절성분또는불규칙성분을제거하여전반적인추세를뚜렷하게파악
More information슬라이드 1
Principles of Econometrics (3e) 013 년 1 학기 윤성민 10.0 서론 The assumptions of the simple linear regression are: SR1. SR. yi =β 1 +β xi + ei i= 1,, N Ee ( i ) = 0 SR3. var( e i ) = σ SR4. cov( e, e ) = 0 i
More informationPowerPoint 프레젠테이션
응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 15 장공분산분석 1. 공분산분석의통계적모형 2. 공분산분석에의한처리효과검정 3. 공분산분석과정 - 실습 - 회귀분석 두확률변수간에관계가있는지검정
More informationMicrosoft PowerPoint - IPYYUIHNPGFU
분산분석 분산분석 (ANOVA: ANALYSIS OF VARIANCE) 두개이상의모집단의차이를검정 예 : 회사에서세종류의기계를설치하여동일한제품을생산하는경우, 각기계의생산량을조사하여평균생산량을비교 독립변수 : 다른변수에의해영향을주는변수 종속변수 : 다른변수에의해영향을받는변수 요인 (Factor): 독립변수 예에서의요인 : 기계의종류 (I, II, III) 요인수준
More information정부3.0 국민디자인단 운영을 통해 국민과의 소통과 참여로 정책을 함께 만들 수 있었고 그 결과 국민 눈높이에 맞는 다양한 정책 개선안을 도출하며 정책의 완성도를 제고할 수 있었습니다. 또한 서비스디자인 방법론을 각 기관별 정부3.0 과제에 적용하여 국민 관점의 서비스 설계, 정책고객 확대 등 공직사회에 큰 반향을 유도하여 공무원의 일하는 방식을 변화시키고
More information슬라이드 1
Principles of Economerics (3e) Ch. 4 예측, 적합도, 모형화 013 년 1 학기 윤성민 4.1 OLS 예측 (1) 점예측 x0 y0 - 설명변수일때, 종속변수의값을예측하고자함 y ˆ = b + 0 1 b x 0 Ch. 4 예측, 적합도, 모형화 /60 4.1 OLS 예측 예측오차 (forecas error), f 예측오차의기대값
More information<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>
제 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0
More informationMicrosoft Word - multiple
Chapter 3. Multiple Liear Regressio Data structure ad the model yi 0 1xi1 pxip i, i1,, (Y X ),,, : idepedet with E( ) 0 ad 1 : ukow 0, 1,, p, 0 1 i var( i ) X (1, x,, xp), rak( X) p1, X : give where xj
More information고객관계를 리드하는 서비스 리더십 전략
제 13 장분산분석 1 13.1 일원분산분석 13. 분산분석 - 무작위블럭디자인 13.3 이원분산분석 - 팩토리얼디자인 분산분석 (ANOVA) - 두개이상의집단들의평균값을비교하는데사용. 일원분산분석 - 처치변수가한개인분산분석. 1. 분산분석의원리 A 3.0 8.0 7.0 5.0 5.0 6.0 4.0 7.0 6.0 4.0 평균 5.0 6.0 B 3.0 9.0
More information연구보고서 2009-05 일반화선형모형 (GLM) 을이용한 자동차보험요율상대도산출방법연구 Ⅰ. 요율상대도산출시일반화선형모형활용방법 1. 일반화선형모형 2 연구보고서 2009-05 2. 일반화선형모형의자동차보험요율산출에적용방법 요약 3 4 연구보고서 2009-05 Ⅱ. 일반화선형모형을이용한실증분석 1. 모형적용기준 < > = 요약 5 2. 통계자료및통계모형
More information비선형으로의 확장
비선형으로의확장 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 비선형으로의확장 1 / 30 개요 선형모형은해석과추론에장점이있는반면예측력은제한됨능형회귀, lasso, PCR 등의방법은선형모형을이용하는방법으로모형의복잡도를감소시켜추정치의분산을줄이는효과가있음해석력을유지하면서비선형으로확장다항회귀 (polynomial regression): ( 예 )
More information제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라
제 절 two way ANOVA 제절 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라고 한다. 교호작용은 두 변수의 곱에 대한 검정으로 유의확률이 의미있는 결과라면 두 변수는 서로 영향을
More informationMATLAB for C/C++ Programmers
오늘강의내용 (2014/01/16) 회귀분석 1 회귀분석 (Regression Analysis) 2 회귀분석 회귀분석이란? 연관된변수들간의관계를찾는통계적방법 즉, 어떠한변수 x가변수 Y에함수관계를통해영향을미친다는것을찾아내는것 예를들어 강우량 ( 변수 x) 이곡물의수확량 ( 변수 Y) 에미치는영향 화학공정의수율 ( 변수 x) 이촉매의사용량 ( 변수 Y) 에따라어떻게변하는지..
More informationMicrosoft PowerPoint - chap_2_rep.ppt [호환 모드]
제 강.1 통계적기초 확률변수 (Radom Variable). 확률변수 (r.v.): 관측되기전까지는그값이알려지지않은변수. 확률변수의값은확률적실험으로부터결과된다. 확률적실험은실제수행할수있는실험뿐아니라가상적실험도포함함 (ex. 주사위던지기, [0,1] 실선에점던지기 ) 확률변수는그변수의모든가능한값들의집합에대해정의된알려지거나알려지지않은어떤확률분포의존재가연계됨 반면에,
More informationMicrosoft PowerPoint - chap_11_rep.ppt [호환 모드]
제 11 강 111 자기상관 Autocorrelation 자기상관의본질 11 유효성 (efficiency, accurate estimation/prediction) 을위해서는모든체계적인정보가회귀모형에체화되어있어야함 표본의무작위성 (randomness) 은서로다른관측치들에대한오차항들이상관되어있지말아야함을의미함 자기상관 (Autocorrelation) 은이러한표본의무작위성을위반하게만드는오차항에있는체계적패턴임
More information»êÇÐ-150È£
Korea Sanhak Foundation News VOL. 150 * 2011. 12. 30 논단 이슈별 CSR 활동이 기업 충성도에 미치는 영향 : 국가별 및 산업별 비교분석 최 지 호 전남대 경영학부 교수 Ⅰ. 서론 Ⅰ. 서론 Ⅱ. 문헌 고찰 및 가설 개발 2. 1. 호혜성의 원리에 기초한 기업의 사회적 투자에 대한 소
More information메타분석: 통계적 방법의 기초
메타분석: 통계적 방법의 기초 서울시립대학교 통계학과 이용희 209년 4월 23일 Contents 하나의 실험과 효과의 크기 관심있는 모수: 효과의 크기 2 모수의 추정량 3 추정량에 대한 믿음 4 추정량의 분산과 표준오차 5 추정량의 분산과 모집단의 분산 6 통계적 효과의 크기 7 신뢰구간 8 일반적인 관심 모수 2 2 2 3 개의 실험의 비교 실험들의 이질성
More information에듀데이터_자료집_완성본.hwp
단위학교성과제고를위한 교육여건개선방안탐색 모시는글 2012 년도에듀데이터활용학술대회프로그램 목차 n n [ 주제 1] 교육지원청수준에서기초학력결정요인분석연구 천세영 이성은 3 [ 주제 2] 비용함수모형에의한국 공립중학교적정교육비및가중치산출연구 오범호 윤홍주 엄문영 37 n n [ 주제 1] 토론 김영애 67 [ 주제 2] 토론 김성식 73 n n [ 주제
More information<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>
제 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics) 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion) 고검정 (es) 하는학문 거시소비함수 (Keynse). C=f(Y), 0
More informationMicrosoft Word - ch2_simple.doc
REGRESSION / 장. 단순회귀 0 Chapter 단순회귀 회귀분석은종속변수 ( Y ) 와설명변수들 ( X 1, X,..., X p, 독립변수 ) 과관계를분석하는도 구이다. (1) 모형에설정된설명변수들의유의성검정?( 모형과회귀계수의유의성검정 ) () 유의한설명변수중종속변수에영향력이가장큰변수는무엇인가?( 표준화회귀계수 ) (3) 그리고설명변수값들이주어진경우종속변수의예측치는?
More informationMicrosoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt
수명분포및신뢰도의 통계적추정 포항공과대학교산업공학과전치혁.. 수명및수명분포 수명 - 고장 까지의시간 - 확률변수로간주 - 통상잘알려진분포를따른다고가정 수명분포 - 확률밀도함수또는 누적 분포함수로표현 - 신뢰도, 고장률, MTTF 등신뢰성지표는수명분포로부터도출 - 수명분포추정은분포함수관련모수의추정 누적분포함수및확률밀도함수 누적분포함수 cumulav dsbuo
More information2014학년도 수시 면접 문항
안 경 광 학 과 세부내용 - 남을 도와 준 경험과 보람에 대해 말해 보세요. - 공부 외에 다른 일을 정성을 다해 꾸준하게 해본 경험이 있다면 말해 주세요. - 남과 다른 자신의 장점과 단점은 무엇인지 말해 주세요. - 지금까지 가장 고민스러웠던 또는 어려웠던 일과 이를 어떻게 해결하였는지? - 자신의 멘토(조언자) 또는 좌우명이 있다면 소개해 주시길 바랍니다.
More information마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다.
마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. http://min7014.iptime.org/math/2017063002.htm 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다. https://goo.gl/edxsm7 http://min7014.iptime.org/math/2018010602.pdf
More information(Hyunoo Shim) 1 / 24 (Discrete-time Markov Chain) * 그림 이산시간이다연쇄 (chain) 이다왜 Markov? (See below) ➀ 이산시간연쇄 (Discrete-time chain): : Y Y 의상태공간 = {0, 1, 2,..., n} Y n Y 의 n 시점상태 {Y n = j} Y 가 n 시점에상태 j 에있는사건
More information40043333.hwp
1 2 3 4 5 128.491 156.559 12 23 34 45 안녕하십니까? 본 설문은 설악산과 금강산 관광연계 개발에 관한 보다 실질적인 방향을 제시하고자 만들어졌습니다. 귀하께서 해주신 답변은 학문적인 연구에 도움이 될 뿐 아니라 더 나아가 다가오는 21세기 한국관광 발전에 많은 기여를 할 것입니다.
More information한국정책학회학회보
한국정책학회보제 22 권 2 호 (2013.6): 181~206 정부신뢰에대한연구 - 대통령에대한신뢰와정부정책에대한평가비교를중심으로 * - 주제어 : 민주화이후정부신뢰, 대통령신뢰, 정부정책만족도 Ⅰ. 서론 182 한국정책학회보제 22 권 2 호 (2013.6) 정부신뢰에대한연구 183 Ⅱ Ⅲ Ⅳ Ⅴ Ⅱ. 정부신뢰에대한이론적논의 184 한국정책학회보제 22
More information기본소득문답2
응답하라! 기본소득 응답하라! 기본소득 06 Q.01 07 Q.02 08 Q.03 09 Q.04 10 Q.05 11 Q.06 12 Q.07 13 Q.08 14 Q.09 응답하라! 기본소득 contents 16 Q.10 18 Q.11 19 Q.12 20 Q.13 22 Q.14 23 Q.15 24 Q.16 Q.01 기본소득의 개념을 쉽게 설명해주세요. 06 응답하라
More information741034.hwp
iv v vi vii viii ix x xi 61 62 63 64 에 피 소 드 2 시도 임금은 곧 신하들을 불러모아 나라 일을 맡기고 이집트로 갔습니다. 하 산을 만난 임금은 그 동안 있었던 일을 말했어요. 원하시는 대로 일곱 번째 다이아몬드 아가씨를
More information완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에
1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에대하여 AB=BA 1 가성립한다 2 3 (4) 이면 1 곱셈공식및변형공식성립 ± ± ( 복호동순 ), 2 지수법칙성립 (은자연수 ) < 거짓인명제 >
More informationMicrosoft PowerPoint Predicates and Quantifiers.ppt
이산수학 () 1.3 술어와한정기호 (Predicates and Quantifiers) 2006 년봄학기 문양세강원대학교컴퓨터과학과 술어 (Predicate), 명제함수 (Propositional Function) x is greater than 3. 변수 (variable) = x 술어 (predicate) = P 명제함수 (propositional function)
More informationJkafm093.hwp
가정의학회지 2004;25:721-739 비만은 심혈관 질환, 고혈압 및 당뇨병에 각각 위험요인이고 다양한 내과적, 심리적 장애와 연관이 있는 질병이다. 체중감소는 비만한 사람들에 있어 이런 위험을 감소시키고 이들 병발 질환을 호전시킨다고 알려져 있고 일반적으로 많은 사람들에게 건강을 호전시킬 것이라는 믿음이 있어 왔다. 그러나 이런 믿음을 지지하는 연구들은
More information표본재추출(resampling) 방법
표본재추출 (resampling) 방법 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 표본재추출 (resampling) 방법 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과
More informationMicrosoft Word - skku_TS2.docx
Statistical Package & Statistics Univariate : Time Series Data () ARMA 개념 ARIMA(Auto-Regressive Integrated Moving-Average) 모형은시계열데이터 { Y t } 의과거치 (previous observation Y t 1,,... ) 들이설명변수인 AR 과과거의오차항 (
More informationArtificial Intelligence: Assignment 5 Seung-Hoon Na December 15, Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오.
Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, 2018 1 Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오. https://docs.scipy.org/doc/numpy-1.15.0/user/quickstart.html https://www.machinelearningplus.com/python/
More information<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>
삼각함수. 삼각함수의덧셈정리 삼각함수의덧셈정리 삼각함수 sin (α + β ), cos (α + β ), tan (α + β ) 등을 α 또는 β 의삼각함수로나 타낼수있다. 각 α 와각 β 에대하여 α >0, β >0이고 0 α - β < β 를만족한다고가정하 자. 다른경우에도같은방법으로증명할수있다. 각 α 와각 β 에대하여 θ = α - β 라고놓자. 위의그림에서원점에서거리가
More information10. ..
점추정구간추정표본크기 차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기 추정의종류 점추정구간추정표본크기 점추정 (point estimation): 모수를어떤하나의값으로추측하는것 구간추정 (interval estimation): 모수를어떤구간으로추측하는것 예 ) 피그미족 (Pygmytribe) 의평균키는모수 µ 표본을추출하여평균을구해보니 135cm
More informationuntitled
통계청 통계분석연구 제 3 권제 1 호 (98. 봄 ) 91-104 장기예측방법의비교 - 전도시소비자물가지수를중심으로 - 서두성 *, 최종후 ** 본논문의목적은소비자물가지수와같이시간의흐름에따라변동의폭이크지않은시계열자료의장기예측에있어서쉽고, 정확한예측모형을찾고자하는데에있다. 이를위하여네가지의장기예측방법 - 1회귀적방법 2Autoregressive error 방법
More informationº»ÀÛ¾÷-1
Contents 10 http://www.homeplus.co.kr 11 http://www.homeplus.co.kr 12 http://www.homeplus.co.kr 13 http://www.homeplus.co.kr Interview 14 http://www.homeplus.co.kr Interview 15 http://www.homeplus.co.kr
More information저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More information저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할
저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More information자료의 이해 및 분석
어떤실험이나치료의효과를측정할때독립이아닌표본으로부터관찰치를얻었을때처리하는방법 - 동일한개체에어떤처리를하기전과후의자료를얻을때 - 가능한동일한특성을갖는두개의개체에서로다른처리를하여그처리의효과를비교하는방법 (matching) 1 예제 : 혈청 cholesterol 치를줄이기위해서 12 명을대상으로운동과함께식이요법의효과를 측정하기위한실험실시 2 식이요법 - 운동실험전과후의
More information슬라이드 1
Prncples of Econometrcs (3e) 013 년 1 학기 윤성민 8.1. 이분산의본질 ( 예 ) 식료품지출 / 식료품지출과소득에관한 40 개표본 8.1 이분산의본질 3 8.1 이분산의본질 4 8.1 이분산의본질 동분산가정 5 8.1 이분산의본질 이분산가정 6 8.1
More informationCommunications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는
Communications of the Korean Statistical Society Vol 5, No 4, 2008, pp 53 542 국소적 강력 단위근 검정 최보승), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는 추세를 제거하기 위하여 결 정적 추세인 경우 회귀모형을 이용하고, 확률적 추세인 경우 차분하는 방법을
More informationR
R 과데이터분석 상관관계 양창모 청주교육대학교컴퓨터교육과 2015 년여름 양창모 ( 청주교육대학교컴퓨터교육과 ) Data Analysis using R 2015 년여름 1 / 20 상관관계 양적변수quantitative variables 사이의관계relationships를나타내기위하여상관계수correlation coefficients를사용한다. ± 기호를사용하여관계의방향을나타낸다.
More information조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a
조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a) b) 조사연구 주제어 패널조사 횡단면가중치 종단면가중치 선형혼합모형 일반화선형혼 합모형
More information4 7 7 9 3 3 4 4 Ô 57 5 3 6 4 7 Ô 5 8 9 Ô 0 3 4 Ô 5 6 7 8 3 4 9 Ô 56 Ô 5 3 6 4 7 0 Ô 8 9 0 Ô 3 4 5 지역 대표를 뽑는 선거. 선거의 의미와 필요성 ① 선거의 의미`: 우리들을 대표하여 일할 사람을 뽑는 것을 말합니다. ② 선거의 필요성`: 모든 사람이 한자리에 모여 지역의 일을 의논하고
More informationResampling Methods
Resampling Methds 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) Resampling Methds 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과 )
More informationuntitled
- 186 - HANYANG Univ. Paul Hwang (http://www.cyworld.com/transportation) - 187 - - 188 - HANYANG Univ. Paul Hwang (http://www.cyworld.com/transportation) - 189 - 한시간교통량 - 190 - HANYANG Univ. Paul Hwang
More information<B3EDB9AEC0DBBCBAB9FD2E687770>
(1) 주제 의식의 원칙 논문은 주제 의식이 잘 드러나야 한다. 주제 의식은 논문을 쓰는 사람의 의도나 글의 목적 과 밀접한 관련이 있다. (2) 협력의 원칙 독자는 필자를 이해하려고 마음먹은 사람이다. 따라서 필자는 독자가 이해할 수 있는 말이 나 표현을 사용하여 독자의 노력에 협력해야 한다는 것이다. (3) 논리적 엄격성의 원칙 감정이나 독단적인 선언이
More information<5BB0EDB3ADB5B55D32303131B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E28322920BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D3031292D3135B9AEC7D72E687770>
고1 융합 과학 2011년도 1학기 중간고사 대비 다음 글을 읽고 물음에 답하시오. 1 빅뱅 우주론에서 수소와 헬륨 의 형성에 대한 설명으로 옳은 것을 보기에서 모두 고른 것은? 4 서술형 다음 그림은 수소와 헬륨의 동위 원 소의 을 모형으로 나타낸 것이. 우주에서 생성된 수소와 헬륨 의 질량비 는 약 3:1 이. (+)전하를 띠는 양성자와 전기적 중성인 중성자
More information(초등용1)1~29
3 01 6 7 02 8 9 01 12 13 14 15 16 02 17 18 19 20 21 22 23 24 03 25 26 27 28 29 01 33 34 35 36 37 38 39 02 40 41 42 43 44 45 03 46 47 48 49 04 50 51 52 53 54 05 55 56 57 58 59 60 61 01 63 64 65
More informationA Time Series and Spatial Analysis of Factors Affecting Housing Prices in Seoul Ha Yeon Hong* Joo Hyung Lee** 요약 주제어 ABSTRACT:This study recognizes th
A Time Series and Spatial Analysis of Factors Affecting Housing Prices in Seoul Ha Yeon Hong*Joo Hyung Lee** 요약 주제어 ABSTRACT:This study recognizes that the factors which influence the apartment price are
More information2017 Summer.Vol. 07 국토교통과학기술진흥원 소식지 제4산업혁명시대 핵심인프라 공간정보 그 미래를 KAIA가 함께 합니다 국토교통과학기술진흥원은 국토공간정보의 효율적, 체계적 생산 및 가공과 다양한 국토공간정보의 활용 융합 서비스 기술 구현을 통해 국민 편의와 산업발전 향상을 도모하고자 노력하고 있습니다. 제4산업혁명시대 핵심인프라 공간정보 그
More information문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의
제시문 문제지 2015학년도 대학 신입학생 수시모집 일반전형 면접 및 구술고사 수학 제시문 1 하나의 동전을 던질 때, 앞면이나 뒷면이 나온다. 번째 던지기 전까지 뒷면이 나온 횟수를 라 하자( ). 처음 던지기 전 가진 점수를 점이라 하고, 번째 던졌을 때, 동전의 뒷면이 나오면 가지고 있던 점수를 그대로 두고, 동전의 앞면이 나오면 가지고 있던 점수를 배
More informationMicrosoft PowerPoint - Info R(3) pptx
Coelaton Analyss 개념 Bvaate analyss 측정형두변수간의관계분석 상관관계? 두측정형변수의산점도 : 상호직선적관련성을상관계수 (Coelaton Coeffcent 측정. 잠재설명 ( 원인 변수 (X s 상관관계, 잠재변인과결과변수 (Y 의상관관계 Peason 상관계수 측정형변수직선관계정도 cov( X, Y E( X E( X E( Y E( Y
More informationMicrosoft PowerPoint - chap_11_rep.ppt [호환 모드]
제 11 강 자기상관 Auocorrelaion 111 유효성 (efficiency, accurae esimaion/predicion) 을위해서는모든체계적인정보가회귀모형에체화되어있어야함 표본의무작위성 (randomness) 은서로다른관측치들에대한오차항들이상관되어있지말아야함을의미함 자기상관 (Auocorrelaion) 은이러한표본의무작위성을위반하게만드는오차항에있는체계적패턴임
More information<B1DDC0B6B1E2B0FCB0FAC0CEC5CDB3DDB0B3C0CEC1A4BAB82E687770>
여 48.6% 남 51.4% 40대 10.7% 50대 이 상 6.0% 10대 0.9% 20대 34.5% 30대 47.9% 초등졸 이하 대학원생 이 0.6% 중졸 이하 상 0.7% 2.7% 고졸 이하 34.2% 대졸 이하 61.9% 직장 1.9% e-mail 주소 2.8% 핸드폰 번호 8.2% 전화번호 4.5% 학교 0.9% 주소 2.0% 기타 0.4% 이름
More informationMicrosoft Word - SAS_Data Manipulate.docx
수학계산관련 함수 함수 형태 내용 SIN(argument) TAN(argument) EXP( 변수명 ) SIN 값을계산 -1 argument 1 TAN 값을계산, -1 argument 1 지수함수로지수값을계산한다 SQRT( 변수명 ) 제곱근값을계산한다 제곱은 x**(1/3) = 3 x x 1/ 3 x**2, 세제곱근 LOG( 변수명 ) LOGN( 변수명 )
More information제 3강 역함수의 미분과 로피탈의 정리
제 3 강역함수의미분과로피탈의정리 역함수의미분 : 두실수 a b 와폐구갂 [ ab, ] 에서 -이고연속인함수 f 가 ( a, b) 미분가능하다고가정하자. 만일 f '( ) 0 이면역함수 f 은실수 f( ) 에서미분가능하고 ( f )'( f ( )) 이다. f '( ) 에서 증명 : 폐구갂 [ ab, ] 에서 -이고연속인함수 f 는증가함수이거나감소함수이다 (
More information새로운 지점에서 단이 시작하는 경우 기둥코로 시작하라고 표시합니다. 기둥코(standing stitch)로 시작하는 방법은 YouTube 에서 찾아볼 수 있습니다. 특수 용어 팝콘뜨기: 1 코에 한길긴뜨기 5 코, 바늘을 빼고 첫번째 한길긴뜨기코의 앞에서 바늘을 넣은
Desire Copyright: Helen Shrimpton, 2016. All rights reserved. By: Helen at www.crystalsandcrochet.com 12 인치 모티브 worsted/aran(10ply), 5mm 바늘 사용 약 10인치 Double Knitting(8ply), 4mm 바늘 사용 미국식 용어를 사용합니다. 약어
More information동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석
동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석 목차 I. 서론 II. 동아시아각국의무역수지, 실질실효환율및 GDP간의관계 III. 패널데이터를이용한 Granger인과관계분석 IV. 개별국실증분석모형및 TYDL을이용한 Granger 인과관계분석 V. 결론 참고문헌 I. 서론 - 1 - - 2 - - 3 - - 4
More informationMicrosoft PowerPoint - chap04-연산자.pptx
int num; printf( Please enter an integer: "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num = %d\n", num); } 1 학습목표 수식의 개념과 연산자, 피연산자에 대해서 알아본다. C의 를 알아본다. 연산자의 우선 순위와 결합 방향에
More informationANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행
Ch4 one-way ANOVA ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행 One-way ANOVA 란? Group Sex pvas NSAID
More information750 1,500 35
data@opensurvey.co.kr 750 1,500 35 Contents Part 1. Part 2. 1. 2. 3. , 1.,, 2. skip 1 ( ) : 2 ( ) : 10~40 (, PC, ) 1 : 70 2 : 560 1 : 2015. 8. 25~26 2 : 2015. 9. 1 4 10~40 (, PC, ) 500 50.0 50.0 14.3 28.6
More information외국인투자유치성과평가기준개발
2010 년도연구용역보고서 외국인투자유치의성과평가기준개발 - 2010. 10. - 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 책임연구원 국립부경대학교지역사회연구소권오혁 수신 : 대한민국국회예산정책처장귀하. 2010 10 : : : : 요약문 I. 서론 1.
More informationMicrosoft PowerPoint - SBE univariate5.pptx
이상치 (outlier) 진단및해결 Homework 데이터 ( Option.XLS) 결과해석 치우침? 평균이중앙값에비해다소크다. 그러나이상치때문이지치우친것같지않음. Toys us 스톡옵션비율이이상치 해결방법 : Log 변환? 아니다치우쳐있지않기때문에제거 제거후 : 평균 :.74, 중위수 :.7 31 치우침과이상치 데이터 : 노트북평가점수 우로치우침과이상치가존재
More informationMicrosoft Word - Ch3_Derivative2.docx
통계수학 Chapter. 미분.5 미분응용.5. 최대값과최소값 지역 (local) 과절대 (absolute) 의의미 f 절대최소지역최대지역최소절대최대지역최소 차미분정리함수 f 가일정구간안의모든점에서미분가능하고구간내임의의점 c 에서 차미분이 0 이면 ( c) 0 ) 함수 f 는점 c 에서지역최대값이나최소값을갖는다. 증가함수와감소함수정의만약 > f ( ) > f
More information= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan ,
Finance Lecture Note Series 학습목표 제4강 소유와 경영의 분리 효용함수(utility function): 효용함수, 한계효용(marginal utility), 한계대체율(marginal rate of substitution) 의 개념에 대해 알아본다 조 승 모2 (production possibility curve): 생산가능곡선과 한계변환율(marginal
More information저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할
저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More informationuntitled
R 과함께하는통계학의이해 빅북이라명명된이책은지식공유의세계적인흐름에동참하고지적인업적들이세상과인류의지식이되도록하며, 누구나쉽게접근하고활용할수있는환경을만들고자한다. 이책의저작권은빅북 (www.bigbook.or.kr) 에있으며모든용도로활용할수있다. 다만상업용출판을하고자하는경우에는사전에문서로된허락을받아야한다. 공유와협력의교과서만들기운동본부 R 과함께하는 통계학의이해
More information<4D6963726F736F667420576F7264202D20B1E2BBF3C5EBB0E85F36C0E55FC7D0BBFD2E646F6378>
6. Relaton and Statstcal Weather Forecastng (관 계와 통계적인 일기예보) 6.1 Background 대기운동은 비선형이므로 결정론적인 의미에서 완벽하게 예측될 수 없다. 보완책으 로 통계적인 방법이 유용하고 예보의 일부로 사용된다. 1 수치예보모델 없이 순수하게 통계 모형만을 이용하는 경우 단시간 예보나 아주 긴 시간(수주이상)
More information