Microsoft Word - ch2_simple.doc

Size: px
Start display at page:

Download "Microsoft Word - ch2_simple.doc"

Transcription

1 REGRESSION / 장. 단순회귀 0 Chapter 단순회귀 회귀분석은종속변수 ( Y ) 와설명변수들 ( X 1, X,..., X p, 독립변수 ) 과관계를분석하는도 구이다. (1) 모형에설정된설명변수들의유의성검정?( 모형과회귀계수의유의성검정 ) () 유의한설명변수중종속변수에영향력이가장큰변수는무엇인가?( 표준화회귀계수 ) (3) 그리고설명변수값들이주어진경우종속변수의예측치는? 이에대한해답을회귀분석이 제공한다. 회귀분석은종속변수 ( Y ) 와설명변수들 ( X 1, X,..., X p, 독립변수 ) 사이의함수는매우다 양하다. Y = f X, X,.., X ) 일반적으로다루기편하고해석이용이한선형함수형태를고 ( 1 p 려하게되는데이런이유로회귀분석은선형회귀분석이라고도한다. 선형함수가아닌회귀 모형에대한분석을비선형 (olear) 회귀분석이라한다. 비선형회귀모형에대한분석은 다소복잡하고무엇보다도모형에대한해석이 ( 선형회귀모형에서회귀계수의의미는편미 분계수이므로해석이용이 ) 쉽지않아사용빈도가낮다. 선형회귀모형 : α, = 1,,...,, ~ dn (0, σ ) Y = + β1 X1 + β X β p X p1 + e 선형변환경제학의 Cobb-Douglas 생산모형은비선형모형이다. e β λ Q = αk L u, Q = 생산 량, K = 자본, L = 노동력, u 는오차항이고나머지는계수이다. 양변에 Log 를취하면 l( Q) = lα + β l K + λ l L + l u 이되므로선형회귀분석이가능하다. 인구성장모형 Pt βt e et = α 도선형변환이가능하다. l Q = lα + l( β ) T + l( e ) 회귀계수선형회귀모형에서회귀계수 ( β k ) 의의미는설명변수 X k 가한단위증가할 때종속변수가얼마나변하는지 ( 편미분계수 ) 나타내는값이다. 이처럼선형모형에서 는회귀계수에대한해석이용이하다. 회귀모형에서설명변수가하나인경우에대한분석을단순회귀분석이라하는데이장에 서는회귀분석에대한개념, 이론, 분석방법에대한이해를높이기위하여 고자한다. t t 이를살펴보.1 산점도.1.1 개요 산점도 (scatter plot) 는두변수간의 ( 함수 ) 관계를나타내는이차원그래프로종속변수는 Sprg

2 REGRESSION / 장. 단순회귀 1 Y 축, 설명변수는 X 축으로 ( 인과관계가존재할때, 상관관계존재할때는아무변수나 Y 축에지정 ) 하여데이터관측치쌍을그린다. 산점도를통해두변수 (X, Y) 간의함수관 계를쉽게파악할수있으므로회귀분석의시작이다. 다음은키와몸무게 ( 종속변수 ) 의인과관계를알아보기위해조사한자료의일부이다. 표본 18명의키와몸무게데이터에대한산점도를그린것이다. ( 그림1) 만약산점도를그리지않고 F-검정에의한분산분석만 ( 산점도아래 ) 을실시하면설정한회귀모형은적 절하면이로부터추정된모형을이용하게된다. [ 그림 1] [ 그림 ] 그러나산점도를살펴되면 ( 그림, 물론붉은선은추정회귀선 ) 두가지특이한관측치 가발견된다. 1 관측치는같은키의다른사람에비해몸무게가많이나가는것을알수 있다.[ 이상치 outler] 관측치는키와몸무게의관계가선형이아니라 차식관계가성립하지않을까하는의심을갖게한다.[ 영향치 fluetal observato] 이처럼산점도는다음을알수있다. 1종속변수와설명변수들간의함수 ( 직선 ) 관계 ( 유의성 ) 를미리진단할수있다. 설명변수들간의상관관계가존재하는지알수있어다중공선성문제를예상할수있다. 다중공선성문제는다중회귀모형에서일어나는일이다. 다중회귀분석에서는산점도행렬 (scatter plot matrx) 을그리게된다. 1 3 특이한관측치 ( 이상치, 영향치 ) 가존재하는지를알수있다. Sprg

3 REGRESSION / 장. 단순회귀.1. 산점도그리기 EXAMPLE -1 산점도그리기 AD.xls ( 엑셀데이터 ) 1983 년미국 1 개기업광고비 (SPEND, 단위 : 백만 $) 가소비자평가도 (RATE) 를조사한 것이다. 두변수간의함수관계를살펴보기위하여산점도를그려보자. 광고비와소비자평가간의함수관계가있는지알아보기위하며산점도를그려보자. 데이터입력이정형화되지않은경우 INFILE 문은사용해 SAS 데이터를만드는것은 시간낭비이다. 회귀분석데이터의경우데이터의양이많지않으므로 CTRL+C CTRL+V 를이용해프로그램에디터 ( 확장편집기 ) 에데이터를복사하여 DATALINES;( 혹은 CARDS;) 이용하여 SAS 데이터를만들자 의의미는 1 열부터 14 열까지를변수 ame 의관측치 로읽으라는명령이다. 만약이옵션을사용하지않으면 8 자리만읽어온다. ( 이전프로그램 ) I=Iterpolato 관측치를연결하는방법이다. JOIN 은관측치를직선으로연결하는것이 고 SPLINE는곡선으로연결한다. R은회귀선 (Regresso Le) 을의미하며 L은직선 (Lear) 을의미한다. 이차곡선이면 L 대신 Q를적어주면된다. V=Value 관측치점의모양설정한다. dot, tragle, square, star 등을사용할수있고 V= a 사용하면점들이 a로찍힌다. Sprg

4 REGRESSION / 장. 단순회귀 3 메뉴에서 선택하고다음과같이메뉴를설정한다. 광고비가증가할수록평가정도는높아짐을알수있다. 원의관측치는이상치 (outler) 일 가능성이높다. 문제는네모상자안에있는관측치들이다. 이관측치들로인하여특히원 안의관측치, 추정된회귀직선은 와같다. 그러나네모상자안의관측치 3 개를제외하 면추정회귀식은 1 이다. 어느것이적절한가? 광고비를많이지출하는회사를보니자동 차회사 FORD, 전화회사 ATT, 그리고 MacDoald이다. 이들회사는다양한이유로유난히많이광고비를지출하고있는회사이다. 그러므로이들을제외하고 ( 분석자판단 ) 회귀모형을추정하는것이바람직해보인다. 만약네모안의 3 관측치가 ( 그렇다면원의관측치는이상치이지만 ) 유효하다면직선관 Sprg

5 REGRESSION / 장. 단순회귀 4 계가어니라이차식을관계가아닐는지? 즉점선의이차식으로광고비용이평가도에영향 을미치고있다고해야하는한다. HOMEWORK #- DUE 3 월 16 일 ( 수 ) CARPRICE.txt ( 텍스트데이터 ) 1990 년미국 Ford 자동차구매자중 6 명을임의선택조사한자료이다. 목적은구매하 는자동차종류 ( 가격 ) 에영향을미치는변수 ( 요인 ) 를알아보기위한것이었다. 성별 (1= 남 자, 0= 여자 ), 연소득 ($), 나이, 결혼여부 (1= 기혼, 0= 미혼 ), 자녀수, 학력 (1= 대졸, 0= 고졸이 하 ), 자동차가격 ($) 구매하는자동차가격에연소득이영향을미치는지알아보고자회 귀분석을실시하고자한다. 먼저산점도를그리고해석하시오. (SAS 이용하기 ). 모형및가정..1 모형 종속변수를 y, 설명변수를 x 라하고첨자 (subscrpt) 는관측치를나타내며 을표본 의개수라하면선형회귀모형 (model) 은다음과같다. Y = α + βx + e, = 1,,..., α : 회귀계수 (regresso coeffcet), 모수, 절편 (tercept) ---(1) β : 회귀계수, 설명변수 x 의기울기, 설명변수 x 가한단위증가할때마다종속변수 y 의증가량 ( 미분계수 ), 다중회귀모형에서는편미분계수이다. x : 설명변수, 확률변수가아닌다. e : 오차항 (error term), 회귀직선 ( α + βx ) 에의해설명되지못하는부분 y1 = α + βx1 + e1 y = α + βx + e 모형 (1) 을관측치에따라풀어쓰면다음과같다.... y = α + βx + e 모형 (1) 행렬의형태로표시하면 y1 1 x1 e1 y 1 x α e y + = = = X β + e M M β M y x e 1 Sprg

6 REGRESSION / 장. 단순회귀 5.. 가정 회귀모형의가정 (assumpto) 은다음과같다. 1회귀계수 α, β 는모수이며상수 (costat) 이다. 종속변수와설명변수간에는선형 ( 직선 ) 함수관계가존재한다. 3 설명변수 X 는확률변수가아니라수학변수 (determstc) 로오차없이측정할수있 다고가정한다. 그러므로회귀모형에서확률변수는 e 와 Y 이다. 확률변수이면확률분 포함수를갖는다. 4 ~ d N(0, σ ) : depedetly ad detcally dstrbuted e 독립성 (depedet): 오차항은서로독립이다. 즉각오차는서로영향을주지않 는다. 독립성가정은시계열데이터 ( 시간적순서를갖는데이터 ) 경우에만체크한다. 정규성 (ormalty): 오차항은정규분포를따른다. 이가정은 F- 검정방법을사용하 기위하여반드시필요하다. 등분산성 (homoscadcty): 오차항의분산은동일하다. 분산이일정하다는가정의주 어진설명변수값에서관측되는 Y 의값의분산이일정하다는의미와같다. 분산이 다르면설정된회귀모형이적절함에도불구하고관측치가직선에모여있지않게 된다. 분산이크므로벗어나는경향이있다. 회귀직선설명변수각값에대해분포의평균은회귀직선 정규분포확률밀도함수 EXAMPLE - 종속변수의평균과분산 가정 e ~ d N(0, σ ) 하에서종속변수 Y 의분포, 평균과분산을구하시오. Sprg

7 REGRESSION / 장. 단순회귀 6.3 회귀계수추정 회귀모형을추정한다는것은수집된데이터 ( 산점도 ) 에가장적절한회귀직선을구하는것이다. 방법으로는 OLS(Ordary Least Square: 최소자승법 ) 과 MLE(MLE: Maxmum Lkelhood Estmator: 최대우도추정법, 최우추정법 ) 방법이있다..3.1 최소자승법 각관측치에가장적합한회귀직선은회귀직선과관측치의벗어난정도 ( 오차 : e ) 가가 장적은직선일것이다. 그런데 e = 0 이므로 e ( 절대값대신제곱하는이유는 (1) 다 = 1 = 1 루기쉽고 () 멀리떨어질수록더큰페널티를부여 ) 을최소화하는 을최소자승법 (OLS) 라한다. = 1 Q = e α, β 을추정하는방법 = ( y α βx ) 을최소화하는추정치 ˆ α, ˆ β 를 OLS 추정치라한다. 즉, = 1 OLS 추정치를구하려면 Q 를 y y α, β 에대해각각편미분 (partal dervatve) 하고그결과를 0 이라놓고얻은연립방정식을풀면된다. 이를정규방정식이라한다. 정규방정식 (ormal equato): yˆ = ˆ α + ˆ βx = 1 = 1 Q = ( y α Q = x β y ˆ α ˆ βx ( y e = y yˆ ˆ α ˆ βx ) = 0 ) = 0 정규방정식에서 α, β 의해를구하면다음과같고이를 OLS 추정치라한다. Sprg

8 REGRESSION / 장. 단순회귀 7 S xy.3. 최대우도추정량 (MLE) ˆ ( x x)( y y) β =, ˆ α = y ˆ βx ( x x) = ( x x)( y y), S = ( x x) xx 라정의하면 xy βˆ = 이다. S xx 최대우도추정량이란우도함수 (Lkelhood fucto, 확률밀도함수의곱 ) 를최대화하는 추정량이다. 확률표본 x, x,..., x) ~ f ( x; ) 인경우우도함수는 L θ; x, x,..., x ) = f ( x ; ) ( 1 θ 이고이함수를최대화하는 θˆ 을최대우도추정량 (MLE) 이라한다. 1 σ S ( 1 θ 회귀모형의가정으로부터 ( y, y,..., y ) ~ N( α + βx, ) 임을알았다. 그러므로우도함수는 우도함수를최대화하는 L( α, β; x1, x,..., x ) = f ( y1, y,..., y ; α, β ) = Π 1 ( y α βx ) exp( ) πσ σ = ( 1 ( y α βx ) ) exp( ) πσ σ 다는것은우도함수의로그 l L ( y α βx ) α, β 을구하면이것이 MLE 추정치이다. 우도함수를최대화한 로회귀계수에대한 MLE 추정치는 OLS 추정치와동일하다 추정된회귀식성질 최소자승 (OLS) 추정치 을최대화하는것과동일하다. 그러므 ˆ ( x x)( y y) β =, ˆ α = y ˆ βx 을이용하여얻은 yˆ = ˆ α + ˆ βx 을 ( x x) 추정된회귀식혹은적합된 (ftted le) 회귀직선이라한다. GAUSS-MARKOV Theorem 회귀계수에대한 OLS 추정치는 BLUE(Best Lear Ubased Estmator) 이다. 즉모든선 형, 불편추정량중최소분산 (mmum varace) 를갖는다. 3.3.절에의해본것처럼 MLE와 OLS 추정치와동일하다. MLE 추정치의성질에의하면 MLE 함수중불편성을갖는추정치는 Rao-Blackwell 정리에의해그추정량이 MVUE 이다. 다음에살펴보겠지만 OLS 추정치는불편성을갖는다. 그러므로 GAUSS-Markov 정리가증명된다. Sprg

9 REGRESSION / 장. 단순회귀 8 종속변수의예측치 ( 적합치 ) ŷ 와실제관측치의차이를잔차 (resdual) 라하면이는오차의추정치가되는데이는다음장에서다루기로한다. r = eˆ = y ˆ ˆ β α x = y y ( 잔차 ) ˆ 적합된회귀직선의성질을살펴보면다음과같다. 1 r = 0 잔차의합은 0이다. x = 0 ( 관측치 x 을가중치로한잔차의가중치평균은 0이다 ) r ˆ 3 y r = 0 ( 예측치 ŷ 을가중치로한잔차의가중치평균은 0이다 ) 4적합된회귀직선은 ( x, y) 을지난다. EXAMPLE -3 1, 는정규방정식에의해당연하다. 3 yˆ ( ˆ ˆ ) ˆ ˆ r = α + βx r = αr + βxr = 0 from 1, 4 ˆ α = y ˆ βx.4 회귀계수에대한가설검정 단순회귀모형 y = β + 잔차성질증명하기 α + x e 에서의하면 α, β 는모수 (parameter) 이다. 모수에대한추 정량을구하는방법으로 OLS, MLE 방법을살펴보았고이는동일함을알았다. 이절에서 는각추정량의성질과분포함수를도출하고모수에대한가설검정하는방법을살펴보 기로하자..4.1 회귀계수 β 에대한추론 회귀계수 β 의분포 회귀분석에서가장관심을갖는것은기울기회귀계수 β 이다. 설명변수의유의성을검 Sprg

10 REGRESSION / 장. 단순회귀 9 정한다는것을귀무가설 H : β 0 의유의성검정과동일하다. H : β 0 채택되면회귀 모형에서 βx 않다 ) ) 회귀모형은 0 = 0 = 가없어지므로 1) 설명변수 ( x ) 는종속변수 ( y ) 를설명하지못하고 ( 유의하지 y + e = α 로줄어들어종속변수는 αˆ = Y 에의해설명된다. β 의 OLS 추정치는 ˆ ( x x)( y y) β = 이다. ( x x) EXAMPLE -4 1 ˆ ( x x)( y y) β = 가 ( x x) 1 의결과 ( βˆ 의 잔차성질증명하기 ˆ ( X X ) β = k Y, k = 임을보이시오. ( X X ) y 의선형결합이다 ) 을이용하여 βˆ 의분포가정규분포임을보이시오. HOMEWORK #-3 DUE 3 월 16 일 ( 수 ) (1) k = 0 1, k X = 1, k = 임을보이시오. ( X X ) ()(1) 을이용하여 E ( ˆ) β = β ( 불편추정량 ), (3) 위의결과를이용하여 ˆ σ β ~ Normal( β, ) 보이시오. ( x x) σ V ( ˆ) β = σ ( ˆ) β = 임을보이시오. ( X X ) 오차항 ( e ) 이정규분포라는가정 ( 그러면종속변수 ) 하에 ˆ σ β ~ Normal( β, ) 가성립 ( x x) 한다. OLS 추정치를구할때는오차항의정규성가정이사용되지않았으나회귀계수 β 에 ˆ θ θ 대한가설검정에사용된다. 대표본이론이성립하나? ~ Normal(0,1) s ˆ θ app Gauss Markov Theorem (o, why?) 회귀계수에대한 OLS 추정치는 BLUE(Best Lear Ubased Estmator) 이다. 즉모든선형, 불편추정량중최소분산 (mmum varace) 를갖는다. [ 증명 ]1 ˆ ( X X )( Y Y ) β = 가 Y 선형추정량이며 (Lear) 불편 (Ubased) 추정량 ( X X ) E( ˆ) β = β Sprg

11 REGRESSION / 장. 단순회귀 30 임을증명하였다. 이제선형추정량중최소분산을가짐을증명하면된다. β 의선형추정량을 * ˆβ = c Y 라하면불편추정량이되기위해서는 c = 0, c X = 1 을만족해야한다. 추정량 * ˆβ = c Y 의분산은 = σ ( ˆ β* ) σ c 이다. 만약 c = k + d 이라하면 (OLS 추정량의계수 ( X X ) k = ) σ ( ˆ β = + *) σ ( ˆ) β σ d ( 왜냐하면 k d = 0 ) 이므로 ( X X ) σ ( ˆ β* ) 의분산은 d 가 0인경우이므로모든 d 가 0이어야한다. 그러므로 OLS는 최소분산을갖는선형불편추정량이다. [ 증명 ] Rao-Blackwell 정리에의해 MLE 의함수중불편성을갖는추정치는 MVUE 이다. 앞에서회귀모형의회귀계수추정치 OLS 는 MLE 추정치와같고불편추정량임을보 였다. Q.E.D ˆ β β 의분포함수 (samplg dstrbuto) s( ˆ) β 앞에서 ˆ σ β ~ Normal( β, ) 임을알았으나오차분산 σ 을모르므로추정해야한다. ( x x) 오차에대한 MVUE 추정량은 y ˆ ˆ ( x = ) ˆ α β ˆ ( ) σ σ = MSE 이다. 그리고 ~ χ ( ) 이므 σ ˆ β β 로 ~ t( ), where σ 임을알수있다. s( ˆ) β EXAMPLE -5 MSE ˆ ( ˆ) β = ( X X ) ˆ ( ) σ 1 ~ χ ( ) 임을보이시오. (brefly) σ 잔차성질증명하기 HOMEWORK #-4 DUE 3 월 16 일 ( 수 ) ˆ β β EXAMPLE-4 이용하여 ~ t( ) 임을보이시오. s( ˆ) β Sprg

12 REGRESSION / 장. 단순회귀 31 β 에대한신뢰구간과가설검정 ˆ β β ~ t( ) 을이용하여신뢰구간과가설검정을할수있다. s( ˆ) β t(-) 1100(1-α)% 신뢰구간 (cofdece terval) [ ˆ β t( ;1 α / ) * s( ˆ), β ˆ β + t( ;1 α / ) * s( ˆ)] β, MSE s ( ˆ) β = ( X X ) 신뢰구간에 0이포함되어있으면양측검정의경우 H0 : β = β0 이채택된다. 가설검정 H 0 : β = β0 ( 가장일반적인형태는 H0 : β = 0 이다 ) 검정통계량 ˆ β β T = 0 이다. 만약양측검정인경우 ( H 0 : β β0 ) 검정통계량의절대값 s( ˆ) β 이 t ( ;1 α / ) 보다크면귀무가설을기각하고단측검정 ( H 0 : β > β0 혹은 H 0 : β < β0 ) 인 경우는 t( ;1 α) 보다크면귀무가설을기각한다. β 0 ( 설명변수가유의하지않다 ) 에 관심이있으므로양측검정이일반적이다. 설명변수가하나인단순회귀분석의경우.4. 회귀계수 α 에대한추론 단순선형모형에서 α 는절편에해당되므로 H0 : α = 0 가채택되면원점을지나는회귀 선이된다. 그러나일반적으로절편에대해관심이없으므로필요한경우이외에는검정하 지는않는다. ˆ α α 의분포함수 s( ˆ) α ˆ α α ˆ 1 ( X ) α = y βx 이므로 ~ Normal(0,1), σ ( ˆ) α = σ ( + ) ) 이다. σ ( ˆ) α ( X X ) 1 ( X ) ˆ α α σ ( ˆ) α = s ( ˆ) α = MSE( + ) 라하면 ~ t( ) ( X X ) s( ˆ) α α 에대한신뢰구간과가설검정 0 = t(-, α/) t(-,1-α/) 1100(1-α)% 신뢰구간 (cofdece terval) ˆ ˆ 1 ( X ) [ α t( ;1 α / )* s( ˆ), α α + t( ;1 α / )* s( ˆ)] α, s ( ˆ) α = MSE( + ) ( X X ) Sprg

13 REGRESSION / 장. 단순회귀 3 가설검정 H 0 : α = α0 = 0 : 검정통계량 ˆ α α0 ˆ α 0 T = = 의절대값이 t ( ;1 α / ) 보 s( ˆ) α s( ˆ) α 다크면귀무가설을기각하고적으면귀무가설을채택한다..4.3 회귀계수추론에대한 Commet Abormalty ( 비정규성 ) 오차항 추정치 e 가정규분포를따르지않으면 y 가정규분포를따르지않게되고회귀계수 ˆ α, ˆ β ( y 의함수 ) 도정규분포를따르지않게된다. 즉더이상회귀계수가설검정 에있어서 t- 분포를사용할수없게된다. 그러나안심하자. 비록 않더라도표본개수 이증가하면 y 가정규분포를따르지 ˆ α, ˆ β 는근사적으로정규분포에근사한다. 그러므로 t- 분포를사용하여가설검정할수있다. 회귀분석에서비정규성문제는심각한것이아니다. 설명변수 X 값의간격 설명변수 X의간격이넓어질수록 ( X X ) 이커지므로 s( ˆ), α s( ˆ β ) 는줄어들어 t-값은커 지고 (F- 값도커진다 ) 회귀계수가유의할가능성이높아진다. 다음은 4 개의자료가측정되 었는데 X 가등간격일경우와 ( 왼쪽 ) 하나가다른관측치에비해멀리떨어진경우 ( 오른쪽 ) 차이점을살펴보자. 기울기회귀계수추정치 ( βˆ ) 값은비슷하지만추정오차의차이로인 하여 t- 검정통계량이크게차이가난다. 정말로오른쪽경우가더유의한가? 그렇지않다. 그러므로 X 값이다른관측치에비해너무멀리떨어진경우에는그관측치를회귀분석 에서제외하기바란다. 또한수집된설명변수데이터범위를많이벗어나는곳에서는예측 치를구하지말자. Sprg

14 REGRESSION / 장. 단순회귀 E(Y 0 ) 에대한추론 임의의설명변수값에대해종속변수의평균을추정해보자. E( y0 ) = μ y x = α + βx 0 0. 예 를들면광고비를 500 만 $ 쓰면고객상품인지도의평균은얼마일까? 관심을갖는설명변 수의값을 x0 라하면 E( y ) = α + βx0 이고이것에대한점추정치는 E( y ˆ 0 ) = ˆ μ y x = ˆ α + βx0 이다. E( Y0 ) E( E( Y0 )) 의분포함수 s{ E( Y0 )} (Y 0 ) x =500 만 0 E 는추정치 ˆ α, ˆ β 의선형결합함수이므로정규분포따른다. ( Q ˆ α ~ Normal ˆ β ~ ormal) (Y 0 ) 1 ( X ) E 의평균 E( E( Y0 )) = α + βx0, 분산 ( ( )) ( ( )) [ 0 X V E Y0 = σ E Y0 = σ + ] ( X X ) 1 ( X ) 산의추정치 ( ( )) [ 0 X s E Y0 = MSE + ] 이다. 추정치 ( X X ) 0 추정치 E (Y 0 ) 분 ˆ α, ˆ β 의분포유도와동일한방법으 E( Y 로분포함수를유도하면 0 ) E( Y0 ) ~ t( ) 1 ( X ), { ( )} [ 0 X s E Y0 = MSE + ] ( ) s{ E( Y )} X X E( Y 0 ) 에대한신뢰구간과가설검정 (1-α)% 신뢰구간 ˆ α + ˆ βx t( ;1 α / ) * s( E( Y )), ˆ α + ˆ βxh + t( ;1 α / ) * s( E( )) 0 0 Y0 유의수준 α 가설검정 H0 : E( Y0 ) = μ y x0 E( Y0 ) μ y x T = 0 의절대값이 t( 1;1 α / ) 보다크면 ( 양측검정 ) 귀무가설을기각한다. s{ E( Y0 )} Sprg

15 REGRESSION / 장. 단순회귀 새로운관측치 Yew 에대한추론 설명변수의값이주어졌을때관측되는종속변수의값을추정해보자. 주어진설명변수의값을 xew 라하고이에대응하는종속변수의값을 yew 라하자. 점추정치는 새로운관측치 yˆ ew ˆ α + ew ˆxew y ew x ew = β 이다. 이것은 E y ) 의추정치와동일하다. 차이가있다면 ( 0 Y 의점추정치의분산이 σ 만큼크다는것이다. 수집된데이터에없는 설명변수에대한종속변수값의예측치은이방법을사용하고데이터에있는설명변수값 에대한추정치는.4.4 절 ( 종속변수평균에대한관측치 ) 방법을사용하자. 설명변수새로운값에대한종속변수예측치를구할때관측된설명변수범위내의설 명변수값들에대해서만한정하기를강력권한다. (.4.3 절에서설명 ) Yˆ ˆ ew E( Yew) 의분포 s{ Yˆ ew} Yˆ 도추정치 ˆ α, ˆ β 의선형결합함수이므로정규분포를따른다. ( Q ˆ α ~ Normal ˆ β ~ ormal) 평균 ew E yˆ 1 ( ) ( ew ) = α + βxew 이고분산은 { ˆ xew x σ Yew} = σ [1 + + ] 이다. ( x x) σ 만큼크다. 다음이성립한다. Yew Yˆ ˆ ew E( Yew) s{ Yˆ ew} ~ t( ), 1 ( ) { ˆ X ew X s Yew } = MSE[1 + + ] ( X X ) 에대한신뢰구간과가설검정 (Y 0 ) E 분산보다 1100(1-α)% 신뢰구간 ˆ α + ˆ βx t( ;1 α / ) * s( Yˆ ), ˆ α + ˆ βx + t( ;1 α / ) * s( Yˆ ), 유의수준 α 가설검정 h H 0 : Y ew = Yh T ( 양측검정 ) 귀무가설을기각한다. ew h ew Yˆ ew Y = ew 의절대값이 t( 1;1 α / ) 보다크면 s{ Yˆ ew} Sprg

16 REGRESSION / 장. 단순회귀 35.5 회귀분석에분산분석적접근 회귀분석을분산분석적측면에서다루는것은단순회귀에서는새로운것이없으나 ( 단순회귀모형에서는회귀계수에대한 t-검정은분산분석의 F-검정과동일하다. F (1, ) = t ( ) ) 보다복잡한회귀모형을다루는데도움을얻을것이다..5.1 변동분할 y yˆ 분산분석접근은종속변수 Y 에관련된총변동과자유도분할에근거한다. 총변동 (SSTO, SST, Total Sum of Square) 은종속변수의관측치와평균의편차 (devato) ( y y) 제곱 합을의미하며이는종속변수가가진정보이다. ( Y ) 총변동 SSTO = ( y y) ( 초록색부분 ) SST = Y = Y Y 회귀모형에서데이터에포함된불확실성 (ucertaty) 은적합회귀선 (ftted regresso le, 추정회귀식 ) 으로부터관측치가얼마나벗어나있나를의미하며이것에대한측정은 ( y yˆ ) 이고제곱합을오차변동 (Error Sum of Squares, SSE) 혹은오차제곱합 ( 자승합 ) 이 라하며적합회귀식에의해설명되지않는변동에해당된다. 이오차변동을 ( ) 로나 눈값을 MSE 라하면이는오차의분산에대한추정치로사용한다. 오차변동 : SSE = ( y yˆ ) ( 빨간부분 ) 두변동의차이를회귀변동 (Regresso Sum of Squares, SSR) 혹은모형변동 (Model SS) 이라하며적합된회귀식이데이터의관계를얼마나잘설명하는지나타낸다. y 회귀 ( 모형 ) 변동 : SSR = ( yˆ y ) ( 파란부분 ) y yˆ y yˆ = ˆ α + ˆ βx y SSR = ˆ β ( X Y X Y ) = ˆ β ( X X ) Sprg

17 REGRESSION / 장. 단순회귀 자유도분할 총변동의자유도 ( 관측치중자유로운개수, 관측치하나하나는독립적이고정보를갖고있다 ) 는평균이하나 ( y ) 추정되었으므로 ( 1) 이다. SSE의자유도는 ( ) 이다. 왜냐하면 ˆ α, ˆ β 가두개추정되었기때문이다. SSR의자유도는 SST 자유도로부터 SSE 자유도를뺀값으로 1이다. 회귀모형에서총변동의자유도는 ( 1) 이고모형변동자유도는설명변수의 개수 p, 오차변동의자유도는 ( p 1) 이다..5.3 평균변동과 ( 평균제곱합 ) 기대평균변동 변동합 ( 제곱합 ) 을자유도로나눈값을평균변동이라한다. SSR MSR = (Mea Sum of squares of Regresso 회귀평균변동 ) 1 SSE MSE = ( Mea Sum of squares of Error 오차평균변동 ) ( ) EMS (Expected Mea Squares 기대평균변동 ) 이에대한증명은다음과같다. E ( MSE) = σ, E( MSR) = + β ( X X ) σ 이다. ˆ ˆ ˆ SSE ( Y ) ( ) = Y Y = α βx ~ χ ( ) σ σ σ E ( MSE) = σ SSR = ˆ β ( X X ) 와 σ V ( ˆ) β = σ ( ˆ) β = E( MSR) = σ + β ( X ) X ( X X ) MSE의기대값인 σ 이므로 MSE는 σ 의불편추정치이다. MSR 기대값의의미는? 만약 β = 0 ( 설명변수가유의하지않음 ) 혹은모든관측치 ( X ) 가평균 ( X ) 과같으면 EMR은 σ 이므로 F-값은 1이다. 실제현실에서는모든관측치 ( X ) 가평균 ( X ) 과같을경우는발 생하지않으므로설명변수가유의하지않으면 MSR은 σ 다. 즉 F-값이커져야설명변수는유의하다. 에근사하고 F-값은 1에근사한 Sprg

18 REGRESSION / 장. 단순회귀 F- 검정 H0 : β = 0 이면오차변동과모형변동은같아지므로다음통계량에의해 H0 : β = 0 의유의 성을검정할수있을것이다. 그러므로 * MSR F = 의값이커지면귀무가설 H0 : β = 0 을기각 MSE 할가능성이높아지게된다. 귀무가설 ( H 0 : β = 0 ) 하에서는 SSR 과 SSE 가서로독립임 σ σ SSR /1 * MSR (1) /1 을이용하면 F = = σ χ = ~ F(1, ) 이성립한다. 그러므로 MSE SSE /( ) χ ( ) /( ) σ F* F(1 α;1, ) 이면귀무가설 H 0 : β = 0 ( 설명변수는종속변수에영향을미치지않는다 ) 채택하고 F* > F(1 α;1, ) 이면귀무가설을기각한다. F- 검정의모형에설정한설명변수전체에대한유의성검정에사용된다. 즉 F- 검정은 H 0 : β 1 = β =... = β p = 0 ( 회귀모형에고려된설명변수모두는유의하지않다 ) 의유의성을 검정한다. 그러므로분산분석적측면에서모형변동 ( SSR = ( y y ) 은고려된설명변수 들의유의성검정이다. F- 검정결과귀무가설이기각되면 설명변수중적어도하나는유의 함을알수있다 β k 0, at least oe k. 그러므로모형변동 ( SSR = ( y y ) 은 고려된모형의설명변수에의한설명력의척도이다. F- 검정결과유의하지않으면유의한설명변수가없다는의미이므로더이상의분석은 의미가없다. 유의하면설명변수각각에대한유의성검정인 t- 검정을실시하면된다. t- 검정과의관계 SSR = β ( X X ) 이고 MSE s ( ˆ) β = 이므로다음이성립하므로단순회귀분석에서는 ( X X ) 분산분석의 F-검정과기울기회귀계수에대한 t-검정은동일하다. 단순회귀에서는모형에대한 F-검정이나설명변수 ( 회귀계수 ) 에대한 t-검정은동일하다. ˆ ˆ * β ( X X ) F (1, ) = β β = = ( ) = t ( ) MSE s ( ˆ) β s( ˆ) β Sprg

19 REGRESSION / 장. 단순회귀 분산분석표 변동 SS( 자승합 ) (source) Regresso SSR = Yˆ Y ) ( 모형, 회귀 ) = 1 Error ( 오차 ) SSE = ( ˆ ) Total ( 총변동 ) Df ( 자유도 ) ( p = 1 Y Y = 1 p 1 = MS ( 평균자승합 ) MSR = SSR / p MSE = SSE /( ) EMS ( 기대평균자승합 ) E( MSR) = σ + β ( X X ) E ( MSE) = σ MSR SST = ( Y Y ) 1 F = ~ F(1, 1) = 1 MSE 다중회귀모형 ( y = α + β1 x1 + β x β p x p + e ) 에서는 H 0 : β 1 = β1 =... = β p = 0 ( 설명변수가모두유의하지않다 ) 유의성검정은 F-검정을실시하고각설명변수에대한유의성검정은 t-검정을실시한다..5 상관분석 두변수간의 ( 선형 ) 관계를분석하는방법으로상관정도는상관계수에의해측정하며상관계수에대한검정은 t-검정을이용한다..5.1 상관계수 상관계수는두변수간의선형 ( 직선 ) 관계가존재하는알아보는방법이다. 회귀분석과유사하지만인과관계에대한분석은아니다. 상관계수는다음과같이구한다. 이를 Pearso 상관계수 (correlato coeffcet) 라한다. ( x x)( y y) ( x x) ( y y) r = cov( X, Y ) E( X E( X )) E( Y E( Y )) = = var( X ) var( Y ) var( X ) var( Y ) Sprg

20 REGRESSION / 장. 단순회귀 39 x 점들이직선에모여있을수록상관계수는커진다. 상관계수의부호가양이면한변수의 값이커질수록 ( 작아질수록 ) 다른변수의값도커짐 ( 작아짐 ) 을의미하며음이면한변수의 값이커질수록 ( 작아질수록 ) 다른변수의값도작아짐 ( 커짐 ) 을의미한다. 표본의크기가커지면상관계수값이커지므로상관계수값이얼마이상이어야기준은없 으므로가설검정에의한유의확률을계산하기바란다. 상관계수에대해다음사항을주의 하기바란다. -- 상관계수는두변수간의선형관계를알아보는것이 다. 이차관계의상관계수는 0 이다. y 두변수간의관계는 차식 상관계수는점들이직선에모여있는정도를나타내는 지표이지직선의기울기의크기를나타내는것은아니 다. 오른쪽그림에서두타원의상관계수는동일하다. 이나선형관계정도를측 정하는상관계수는 0 이다. Sprg

21 REGRESSION / 장. 단순회귀 40 Pearso 상관계수는측정형변수간의상관정도를나타낸다. 데이터가순서형이거나가질수있는값이 10개이하인경우 ( 예 : 리커트 Lkert 척도 ) 비모수적인방법으로상관계수를구하는것이좋다. Spearma 순위 (rak order) 상관계수와 Kedall의 τ 이대표복인비모수적방법이다. ( R )( ) x Rx R y R y 6 d rs = 1, R 은관측치순위, ( R R ) ( R R ) ( 1) x x sg( x x ) sg( y y j ) < j τ =, ( T0 Tx )( T0 Ty ) t 는동일한.5. 상관계수추론 y y x 의 - 번째그룹내의관측치개수이다. Rx R y d = 이다. 1, w < 0 sg ( w) = 0, w = 0, T 0 = ( 1) /, T x = t ( t 1) /, 1, w > 1 귀무가설 : H : ρ 0 ( 모집단상관계수는 0이다. 두변수는서로독립이다 ) 0 = 대립가설 : H : ρ 0 a 검정통계량 : T = r ~ t( ) (1 r ) /( ) 만약귀무가설이 H ρ = ρ 0 ( 예 : 모집단의상관계수가 0.7이다.) 이라면다음절차를 0 : 0 이용하여상관관계에대한가설을검정한다. 1+ r 1+ ρ0 1 검정통계량 : T = 0.5 l ~ N(0.5 l, ) 1 r 1 ρ 3 위사실을이용하여두모집단상관계수차이검정을다음절차에의해실시할수있다..5.3 회귀계수와관계 1+ r z( x) = 0.5 l 1 r z = 1/( z( x) z( y) x x x 3) + 1/( 1+ r, z( y) = 0.5 l 1 r y y y ~ N(0,1) 3) Sxx = ( x x), Syy = ( y y) 이라하면회귀모형에서기울기회귀계수추정치와상 Syy 관계수는관계는 βˆ = r 이다. 그러므로다음사실을알수있다. Sxx 0 기울기의부호와상관계수의부호는같다. 단순회귀분석기울기에대하유의성검정과상관계수유의성검정은동일하다. Sprg

22 REGRESSION / 장. 단순회귀 41 타원이좁을수록상관계수는커지면회귀분석의정도 (precso) 은높아진다. 다음장에 서설명하게될회귀분석의결정계수 ( R ) 는상관계수는제곱과동일하다..6 원점을지나는회귀직선원점을지나는회귀모형은 y = βx + e 이므로이경우회귀계수 β 의 OLS는 ˆ x = y β 이다. 일반선형회귀모형 y = α + βx + e 에서절편 (α ) 이 0인경우이다. 선형회 x 귀모형에서절편에대한가설검정 ( H0 : α = 0) 을실시하여가설이채택되면원점을지나는 회귀직선을사용하면된다. 그러나일반적으로절편에대해관심이없으므로 ( 주로기울기, 설명변수의영향 ) 절편에대한추정, 검정은실시하지않는다. 대신분석하려는상황 ( 데이 터 ) 이원점을지나는회귀모형을고려해야한다면처음부터원점을지나는회귀모형을 설정한다. 예를들어비용과생산량과의관계를보거나약복용량에따른바이러스감소량 의관계를보는경우원점을지나는회귀모형을고려하면된다. SAS 에서는 NOINT 옵션 사용하면된다..7 결정계수 회귀계수추정과검정, 종속변수관측치에대한예측치 ( Yˆ ew ), 평균예측치 ( E (Y 0 ) ) 에대해 살펴보았으나두변수간의선형관계정도를나타낸통계량은없었다. 이에다음과같이 결정계수 (Coeffcet of Determato) 를정의한다. SSR SSE R = = 1 SST SST 결정계수는두변수 간의선형관계정도가높으면 ( 관측치들이직선가까이에모여있다는것을의미 ) 결정 계수는 1에가까워진다. 특히단순회귀모형에서는상관계수는 r = ± R 이성립한다. S yy ( 참고 : β = r ) 결정계수는단순히선형관계정도를나타내는수치일뿐검정할수 S xx 있는검정통계량이존재하지않아단지지표로사용될뿐이다. 특히설명변수가이산형 ( 설문지 Lkert 척도 ) 인경우매우낮아지는경향이있고관측치가많아지면커지는경향이 있어선형관계정도를나타내는좋은지표는아니다. 유의하지않은설명변수라도모형에삽입되면결정계수값은올라가므로모형의유의성 비교에는사용하지않는다. 대신설명변수의개수에의해조정된수정 (adjusted) 결정계수 를사용한다. 이것은다중회귀에서상세히다루기로한다. Sprg

23 REGRESSION / 장. 단순회귀 4.8 통계소프트웨어사용하기 EXAMPLE -5 단순회귀하기 AD.xls ( 엑셀데이터 ) 1983 년미국 1 개기업광고비 (SPEND, 단위 : 백만 $) 가소비자평가도 (RATE) 를조사한 것이다. 회귀분석을다음과같이실시하시오. (1) 산점도를그리시오..1. 절 ( 페이지 참고 ) () 광고비의회귀계수 OLS 추정치와추정분산을구하시오. (3) 광고비의유의성을검정하시오. (4) 유의하다면회귀모형을적고해석하시오. 회귀계수의 95% 신뢰구간도구하자. (5) 유의하다면광고비가 40.1 인경우평가도예측치를구하시오. 95% 신뢰구간 (6) 유의하다면광고비가 50 인경우평가도예측치를구하시오. 95% 신뢰구간 (1) 풀이.1. 절의산점도 ( 페이지 ) 결과광고비 100 이상인기업 (3 개, MacDoald, Ford, AT&T) 은기업구조상광고비를많이편성하는기업으로이를제외하는것이적절하다. 그러므 로향후회귀분석에서는이를제외한 17 개기업만을사용하기로한다. 을선택한후 광고비 변수로정렬한후지우려는개체의행에서지우거나다음방법을이용한다. Sprg

24 REGRESSION / 장. 단순회귀 43 을선택하고아래와같이화면을설정한다. ()-(3) 풀이 여전히이상치가존재하는것같다. 이상치를판단하는검정통계량을배 울때까지잠시덮어두자. Sprg

25 REGRESSION / 장. 단순회귀 44 분산분석표 : 유의확률이 이므로회귀모형은유의하다. 개별설명변수의유의성검정은아래 t-검정이용하면된다. 데이터가 17(3개는이상치로제외 ) 개이므로총변동의자유도는 16이다. F-검정유의확률이 이므로회귀모형에설정한설명변수광고비는유의하다. 즉광고비는소비자평가도에영향을미침을알수있다. Root MSE = MSE = 40. 3, R-square= 결정계수, Depedet Mea은종속변수 ( 평가도 ) SSE /( p 1) 40.3 의평균, Adj-R-Sq는 1 = 1 = ( 결정계수의문제점을보완 SST /( 1) 1610 /16 하기위한통계량 ) Coeff. Var은종속변수의변동계수 ( s y / y *100(%), 분산의비교에사용 ) 이다. 광고비회귀계수의유의확률이 로유의수준 0.05 보다작으므로유의하다고할수 있다. 회귀계수가 0.86 이므로광고를많이할수록평가가높아짐을알수있다. 광고비를 단위 1 만큼더사용하면평가는 0.86 만큼증가한다. 최종회귀모형 : 평가 = * 광고비 ( t = 3.97, p = ) 메뉴를선택하고아래와같이메 뉴를설정한다. 일단은설명변수와종속변수만지정하자. 나머지는 default 사용하자. 산점도그리기는페이지 3 을참고하기바란다. Sprg

26 REGRESSION / 장. 단순회귀 45 SAS 결과와동일하다. 하나더출력되는것이있다면표준화회귀계수 (stadardzed beta coeffcet) 이다. 이는설명변수를표준화 (stadardzato) 하여얻은회귀계수이다. 종속변수에대한설명변수간의영향력을비교하는데사용한다. 자세한내용은다중회귀에서다루기로한다. (4) 회귀계수신뢰구간구하기 회귀계수신뢰구간을구하려면 CLB(Cofdece Lmt for Beta) 옵션을사용하면된다. 신 뢰수준 0.95이면 α = (default) 사용하면한다. 90% 신뢰구간이면 α = 0. 1 사용한다. 기울기 ( 설명변수 sped) 의 95% 신뢰구간은 0 을포함하고있지않으므로유의하다. 검정 결과와동일하다. 사실회귀계수신뢰구간은별로사용하지는않는다. Sprg

27 REGRESSION / 장. 단순회귀 46 선형회귀모형설정창에서 통계량 옵션의신뢰구간을선택하면된다. (5)-(6) 수집된데이터에없는설명변수의값에대해예측치나예측치신뢰구간을구하려면데 이터제일마지막부분에설명변수값과종속변수는결측치 (.) 으로하여데이터를입력한 다. 물론마지막관측치는회귀모형에사용되지않는다. P(predcted) 종속변수예측치 CLM(cofdece lmt for mea) E y ) 의신뢰구간 CLI(cofdece lmt for dvdual) ŷ R(resdual) 잔차 ( r = y yˆ ) ( 0 yew 의신뢰구간 SAS 에는종속변수개별예측치신뢰구간, 평균예측치신뢰구간을그릴수있는 PROC 가있다. RL 의의미는 Regresso Le 의약어이다. E( Y 0 ) 와 Y ew 의신뢰구간그리기 Sprg

28 REGRESSION / 장. 단순회귀 47 언급한대로평균에대한예측구간, 개별관측치에대한신뢰구간에비해좁다. 잔차는관측치와예측치 ŷ 의차이이다. ŷ 는최종회귀모형평가 = * 광고비에의해계산된값이다. 회귀모형추정결과를비교해보라. 마지막관측치없는결과와동일하다. 데이터창마지막에설명변수데이터를입력한다. 선형회귀분석창의 저장 옵션을아래와같이선택하면된다. 표준화하지않음 은예 측치 ŷ, 예측구간은 E( Y 0 ) 와 Y ew 값, 표준화하지않음 잔차는 r 을의미한다. Sprg

29 REGRESSION / 장. 단순회귀 48 상관계수 단순회귀모형의회귀계수와상관계수의관계를알아보기위하여상관계수를구해보자. 이상치로보이는 3 개를제외한 AD0 데이터를이용하여상관분석을실시하였다. DATA 문옆에아무옵션을사용하지않으면 Pearso 상관계수가출력된다. 만약비모수상관계 수를출력하기원하면 KENDALL 혹은 SPEARMAN 이라적어주면된다. 유의확률이 이므로평가도와광고비의상관관계는유의하다. 상관계수는 이 므로광고비가높아지면평가도가높아진다. 페이지 40 의상관계수와회귀계수의관계식이맞는지숫자로살펴보자. 다음은 SAS 에 출력된각변수의기초통계량이다. 만약이것을출력하지않으려면 PROC CORR 문장에 옵션으로 NOSIMPLE 을사용하면된다. 관계식이 Syy Syy 8.07 βˆ = r 이었으므로 r = * = ( 페이지 45) 는회귀계수의 Sxx Sxx.96 추정치와동일하다. 그러므로단순회귀에서상관계수의유의성검정 ( H 0 : r = 0 ) 과회귀모형의기울기회귀계수유의성검정 ( H 0 : β = 0 ) 은동일하다. Sprg

30 REGRESSION / 장. 단순회귀 49 상관계수를구하려는변수를변수타원으로표시한부분은 default 로나타나므로따로 설정할필요는없다. HOMEWORK #3 DUE 3 월 3 일 ( 수 ) CANCER.txt ( 텍스트데이터 ) SPSS 와 SAS 모두사용하여분석하시오. 연평균온도 (F: Fahrehet, 설명변수 ) 가여성종양사망지수 (mortalty dex) 에영향을미 치는지알아보기위하여유럽몇지역을대상으로조사한자료이다. (SPSS 이용하기 ) 1 산점도를그리자. 산점도를이용하여이상치가있으면제외하자. 하나는있다. 이를제 외한다음분석을실시하자. 회귀모형을추정하고유의성을검정하시오. 3 예측치와잔차를구하자. 4연평균온도가 90도일때여성종양사망지수의평균예측치를구하시오. 신뢰수준은 90% 로하시오. 5 상관계수를구하고해석하시오. 회귀계수와의관계를밝히시오. Sprg

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63> 제 3 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은 2013 년도연구용역보고서 공공기관임금프리미엄추계 - 2013. 12.- 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한국노동연구원선임연구위원정진호 공공기관임금프리미엄추계 2013. 12. 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영

More information

Microsoft PowerPoint - Info R(3) pptx

Microsoft PowerPoint - Info R(3) pptx Coelaton Analyss 개념 Bvaate analyss 측정형두변수간의관계분석 상관관계? 두측정형변수의산점도 : 상호직선적관련성을상관계수 (Coelaton Coeffcent 측정. 잠재설명 ( 원인 변수 (X s 상관관계, 잠재변인과결과변수 (Y 의상관관계 Peason 상관계수 측정형변수직선관계정도 cov( X, Y E( X E( X E( Y E( Y

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 13 장상관분석 1. 상관계수 2. 상관분석의가정과특성 3. 모상관계수의검정과신뢰한계 4. 순위상관 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 - 실습 - 상관분석 지금까지한가지확률변수에의한현상을검정하였다.

More information

슬라이드 1

슬라이드 1 Principles of Economerics (3e) Ch. 4 예측, 적합도, 모형화 013 년 1 학기 윤성민 4.1 OLS 예측 (1) 점예측 x0 y0 - 설명변수일때, 종속변수의값을예측하고자함 y ˆ = b + 0 1 b x 0 Ch. 4 예측, 적합도, 모형화 /60 4.1 OLS 예측 예측오차 (forecas error), f 예측오차의기대값

More information

Microsoft PowerPoint - IPYYUIHNPGFU

Microsoft PowerPoint - IPYYUIHNPGFU 분산분석 분산분석 (ANOVA: ANALYSIS OF VARIANCE) 두개이상의모집단의차이를검정 예 : 회사에서세종류의기계를설치하여동일한제품을생산하는경우, 각기계의생산량을조사하여평균생산량을비교 독립변수 : 다른변수에의해영향을주는변수 종속변수 : 다른변수에의해영향을받는변수 요인 (Factor): 독립변수 예에서의요인 : 기계의종류 (I, II, III) 요인수준

More information

Microsoft PowerPoint - LM 2014s_Ch4.pptx

Microsoft PowerPoint - LM 2014s_Ch4.pptx 1. 회귀모형및가정 모형설명 선형 linearity 함수 (,,,, ) 회귀계수 : 모수, unknown but fixed 절편 : y-축을통과하는곳 기울기 : 편미분, 한단위증가 p개의설명변수 들은결정변수 ( 확률변수아님 ) 종속변수만확률변수 모형 설명변수개수 p 개 관측치개수 n, 1,2,, ~ 0, ( 행렬 ),, 가정 ~ 0, 정규성 normality

More information

Microsoft Word - SPSS_MDA_Ch6.doc

Microsoft Word - SPSS_MDA_Ch6.doc Chapter 6. 정준상관분석 6.1 정준상관분석 정준상관분석 (Canonical Correlation Analysis) 은변수들의군집간선형상관관계를파악하는분석방법이다. 예를들어신체적조건 ( 키, 몸무게, 가슴둘레 ) 과운동력 ( 달리기, 윗몸일으키기, 턱걸이 ) 사이의선형상관관계가있는지알아보고, 관계가있다면어떤관계가있는지분석하는것이다. 정준상관분석은 (

More information

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포 생존분석의 추정과 비교 : 보충자료 이용희 December, 8 Cotets 생존함수와 위험함수. 생존함수와 위험함수....................................... 예제: 지수분포.......................................... 예제: 와이블분포.........................................

More information

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사 회귀분석 올림픽 100m 우승기록 2004년 9월과학저널 Nature에발표된 Oxford 대학교의임상병리학자인 Andrew Tatem과그의연구진의논문 1900~2004년까지의남성과여성의육상 100m 우승기록을분석하고앞으로최고기록이어떻게변할것인지를예측 2008년베이징올림픽에서남자의우승기록은 9.73±0.144(9.586, 9.874), 여자는 10.57±0.232(10.338,

More information

제 4 장회귀분석

제 4 장회귀분석 회귀의역사적유래 (historical origin of the regression) 회귀 (regression) 라는용어는유전학자 Francis Galton(1886) 에의해처음사용된데서유래함. 그의논문에서 비정상적으로크거나작은부모의아이들키는전체인구의평균신장을향해움직이거나회귀 (regression) 하는경향이있다. 고주장 회귀의역사적유래 (historical

More information

Microsoft Word - sbe13_reg.docx

Microsoft Word - sbe13_reg.docx Statstcs 4 Busness and Economcs (Regresson) 상관계수 상관계수정의 두변수간의선형관계정도를나타내는값 COV ( X, Y ) E( X E( X ))( Y E( Y )) 정의 : V ( X ) V ( Y ) V ( X ) V ( Y ) 표본상관계수 : r ˆ ( ( x ( x x) x) ( x x x)( y x)( y /( n 1)

More information

G Power

G Power G Power 부산대학교통계학과조영석 1. G Power 란? 2. G Power 설치및실행 2.1 G Power 설치 2.2 G Power 실행 3. 검정 (Test) 3.1 가설검정 (Test of hypothesis) 3.2 검정력 (Power) 3.3 효과크기 (Effect size) 3.4 표본수산정 4. 분석 4.1 t- 검정 (t-test) 4.2

More information

Microsoft Word - ch3_residual.doc

Microsoft Word - ch3_residual.doc REGRESSION / 3 장. 잔치분석 50 Chapter 3 잔차분석 이론이나경험에의해변수간의회귀모형을설정하고 y = α + βx ( 선형 : lnearty), 관측치가 ( x, y ), = 1,,..., n 얻어지면이를이용하여회귀분석을실시한다. 설정된회귀모형에 는오차항에대한 3가지가정 e ~ dnormal(0, σ ) 을한다. ( 정규성 normalty,

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

수리통계학

수리통계학 제 강통계학 Revew Part I. 확률론 (Probablty Theory) I. 확률변수 (Radom Varable) 와확률분포 A. 확률변수 는표본공간 Ω 상에서정의되는 real valued fucto 임. 어떤확률적실험의결과로나올수있는모든가능한결과에대해어떤. 실수값이대응되어야함 하나의실험에대해여러가지의확률변수가정의될수있음. 주사위던지는실험 : 던진결과나오는값을대응시켜주는확률변수

More information

(001~006)개념RPM3-2(부속)

(001~006)개념RPM3-2(부속) www.imth.tv - (~9)개념RPM-(본문).. : PM RPM - 대푯값 페이지 다민 PI LPI 알피엠 대푯값과산포도 유형 ⑴ 대푯값 자료 전체의 중심적인 경향이나 특징을 하나의 수로 나타낸 값 ⑵ 평균 (평균)= Ⅰ 통계 (변량)의 총합 (변량의 개수) 개념플러스 대푯값에는 평균, 중앙값, 최 빈값 등이 있다. ⑶ 중앙값 자료를 작은 값부터 크기순으로

More information

Microsoft Word - multiple

Microsoft Word - multiple Chapter 3. Multiple Liear Regressio Data structure ad the model yi 0 1xi1 pxip i, i1,, (Y X ),,, : idepedet with E( ) 0 ad 1 : ukow 0, 1,, p, 0 1 i var( i ) X (1, x,, xp), rak( X) p1, X : give where xj

More information

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라 제 절 two way ANOVA 제절 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라고 한다. 교호작용은 두 변수의 곱에 대한 검정으로 유의확률이 의미있는 결과라면 두 변수는 서로 영향을

More information

Microsoft Word - ch8_influence.doc

Microsoft Word - ch8_influence.doc REGRESSION / 8 장. 영향치및잔차분석 172 Chapter 8 영향치와잔차분석 단순회귀모형에서관측점이이상치 (outlier) 인지영향치 (influential) 인지판단하는것은 매우쉽다. 산점도에서이상치혹은영향치의존재여부를미리감지한다. x- 축 ( 설명변수 ) 의 동일수준의다른관측치에비해종속변수의값이상이한빨간점은이상치이다. 반면판 단할다른관측치가동일설명변수수준에없는파란점은영향치이다.

More information

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63> 제 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut 경영학을 위한 수학 Fial Eam 5//(토) :-5: 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오.. (각 6점) 다음 적분을 구하시오 4 ( ) (a) ( )4 8 8 (b) d이 성립한다. d C C log log (c) 이다. 양변에 적분을 취하면 log C (d) 라 하자. 그러면 d 4이다. 9 9 4 / si (e) cos si

More information

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt 수명분포및신뢰도의 통계적추정 포항공과대학교산업공학과전치혁.. 수명및수명분포 수명 - 고장 까지의시간 - 확률변수로간주 - 통상잘알려진분포를따른다고가정 수명분포 - 확률밀도함수또는 누적 분포함수로표현 - 신뢰도, 고장률, MTTF 등신뢰성지표는수명분포로부터도출 - 수명분포추정은분포함수관련모수의추정 누적분포함수및확률밀도함수 누적분포함수 cumulav dsbuo

More information

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63> Par II. 다중회귀모형및기본가정의완화 I. 다중회귀모형 A. 다중회귀모형에대한가정 = β+β x + +β x +ε, =,..., ( x ) 관측치의수, 설명변수의수 K-, 추정모수의수 K 개별모수들의의미 : E( ) 예컨대, β = : 다른설명변수들이일정할때, x 의한 x 단위변화에대한종속변수의평균값의변화 즉다른변수들의영향력이통제 (conrol) 된상황에서첫번째설명변수의종속변수에대한영향력을나타내는값임

More information

untitled

untitled Mathematcal Statstcs / 6. 87 Chapter 6 radom varable probablty desty ucto. dstrbuto ucto.. jot desty ucto... k k margal desty ucto k m.. Statstcs ; θ ereces Y... p. ~ ; θ d radom sample... ; θ ~ statstc

More information

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63> 제 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics) 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion) 고검정 (es) 하는학문 거시소비함수 (Keynse). C=f(Y), 0

More information

Microsoft Word - ch4_multiple.doc

Microsoft Word - ch4_multiple.doc REGRESSION / 4 장. 다중회귀 89 Chapter 4 다중회귀 장에서는설명변수가하나인단순회귀모형에대한추론과분석방법에관해다루었 다. 간편성 회귀분석개념에대한이해 그러나현실세계에서는 설명변수하나만으로 설명력이부족하고 유의한설명변수간영향력비교가요구된다. 이로인하여설명변수 가 개이상인회귀모형에대한분석이필요하게된다. 이를다중회귀분석이라한다. 동일설명변수의

More information

고객관계를 리드하는 서비스 리더십 전략

고객관계를 리드하는  서비스 리더십 전략 제 13 장분산분석 1 13.1 일원분산분석 13. 분산분석 - 무작위블럭디자인 13.3 이원분산분석 - 팩토리얼디자인 분산분석 (ANOVA) - 두개이상의집단들의평균값을비교하는데사용. 일원분산분석 - 처치변수가한개인분산분석. 1. 분산분석의원리 A 3.0 8.0 7.0 5.0 5.0 6.0 4.0 7.0 6.0 4.0 평균 5.0 6.0 B 3.0 9.0

More information

statistics

statistics 수치를이용한자료요약 statistics hmkang@hallym.ac.kr 한림대학교 통계학 강희모 ( 한림대학교 ) 수치를이용한자료요약 1 / 26 수치를 통한 자료의 요약 요약 방대한 자료를 몇 개의 의미있는 수치로 요약 자료의 분포상태를 알 수 있는 통계기법 사용 중심위치의 측도(measure of center) : 어떤 값을 중심으로 분포되어 있는지

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 15 장공분산분석 1. 공분산분석의통계적모형 2. 공분산분석에의한처리효과검정 3. 공분산분석과정 - 실습 - 회귀분석 두확률변수간에관계가있는지검정

More information

Microsoft PowerPoint - SBE univariate5.pptx

Microsoft PowerPoint - SBE univariate5.pptx 이상치 (outlier) 진단및해결 Homework 데이터 ( Option.XLS) 결과해석 치우침? 평균이중앙값에비해다소크다. 그러나이상치때문이지치우친것같지않음. Toys us 스톡옵션비율이이상치 해결방법 : Log 변환? 아니다치우쳐있지않기때문에제거 제거후 : 평균 :.74, 중위수 :.7 31 치우침과이상치 데이터 : 노트북평가점수 우로치우침과이상치가존재

More information

슬라이드 1

슬라이드 1 Prncples of Econometrcs (3e) 013 년 1 학기 윤성민 8.1. 이분산의본질 ( 예 ) 식료품지출 / 식료품지출과소득에관한 40 개표본 8.1 이분산의본질 3 8.1 이분산의본질 4 8.1 이분산의본질 동분산가정 5 8.1 이분산의본질 이분산가정 6 8.1

More information

<4D6963726F736F667420576F7264202D20B1E2BBF3C5EBB0E85F36C0E55FC7D0BBFD2E646F6378>

<4D6963726F736F667420576F7264202D20B1E2BBF3C5EBB0E85F36C0E55FC7D0BBFD2E646F6378> 6. Relaton and Statstcal Weather Forecastng (관 계와 통계적인 일기예보) 6.1 Background 대기운동은 비선형이므로 결정론적인 의미에서 완벽하게 예측될 수 없다. 보완책으 로 통계적인 방법이 유용하고 예보의 일부로 사용된다. 1 수치예보모델 없이 순수하게 통계 모형만을 이용하는 경우 단시간 예보나 아주 긴 시간(수주이상)

More information

nonpara6.PDF

nonpara6.PDF 6 One-way layout 3 (oneway layout) k k y y y y n n y y K yn y y n n y y K yn k y k y k yknk n k yk yk K y nk (grand mean) (SST) (SStr: ) (SSE= SST-SStr), ( 39 ) ( )(rato) F- (normalty assumpton), Medan,

More information

R t-..

R t-.. R 과데이터분석 집단의차이비교 t- 검정 양창모 청주교육대학교컴퓨터교육과 2015 년겨울 t- 검정 변수의값이연속적이고정규분포를따른다고할때사용 t.test() 는모평균과모평균의 95% 신뢰구간을추청함과동시에가설검증을수행한다. 모평균의구간추정 - 일표본 t- 검정 이가설검정의귀무가설은 모평균이 0 이다 라는귀무가설이다. > x t.test(x)

More information

Microsoft Word - skku_TS2.docx

Microsoft Word - skku_TS2.docx Statistical Package & Statistics Univariate : Time Series Data () ARMA 개념 ARIMA(Auto-Regressive Integrated Moving-Average) 모형은시계열데이터 { Y t } 의과거치 (previous observation Y t 1,,... ) 들이설명변수인 AR 과과거의오차항 (

More information

cat_data3.PDF

cat_data3.PDF ( ) IxJ ( 5 0% ) Pearson Fsher s exact test χ, LR Ch-square( G ) x, Odds Rato θ, Ch-square Ch-square (Goodness of ft) Pearson cross moment ( Mantel-Haenszel ), Ph-coeffcent, Gamma (γ ), Kendall τ (bnary)

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 7 주차 회귀분석 Regression Analysis 최종후, 강현철 차례 4.1 선형회귀분석 (Linear Regression Analysis) 4.2 로지스틱회귀분석 (Logistic Regression Analysis) 4.3 회귀분석의특징과제약 4.4 분석사례 -

More information

Microsoft Word - LectureNote.doc

Microsoft Word - LectureNote.doc 5. 보간법과회귀분석 . 보간법 Iterpolto. 서론 응용예 : 원자간 pr-wse tercto Tlor Seres oe-pot ppromto 를사용할수없는이유 Appromte / t 3 usg Tlor epso t.! P! 3 4 5 6 7 P 3-3 -5-43 -85 . Newto Tlor Seres 와의관계 te dvded derece Forwrd

More information

Microsoft Word - Ch3_Derivative2.docx

Microsoft Word - Ch3_Derivative2.docx 통계수학 Chapter. 미분.5 미분응용.5. 최대값과최소값 지역 (local) 과절대 (absolute) 의의미 f 절대최소지역최대지역최소절대최대지역최소 차미분정리함수 f 가일정구간안의모든점에서미분가능하고구간내임의의점 c 에서 차미분이 0 이면 ( c) 0 ) 함수 f 는점 c 에서지역최대값이나최소값을갖는다. 증가함수와감소함수정의만약 > f ( ) > f

More information

eda_ch7.doc

eda_ch7.doc ( ) (, ) (X, Y) Y Y = 1 88 + 0 16 X =0601 Y = a + bx + cx X (nonlinea) ( ) X Y X Y b(016) ( ) log Y = log a + b log X = e Y = b ax 71 X (explanatoy va :independent ), Y (dependent : esponse) X, Y Sehyug

More information

MATLAB for C/C++ Programmers

MATLAB for C/C++ Programmers 오늘강의내용 (2014/01/16) 회귀분석 1 회귀분석 (Regression Analysis) 2 회귀분석 회귀분석이란? 연관된변수들간의관계를찾는통계적방법 즉, 어떠한변수 x가변수 Y에함수관계를통해영향을미친다는것을찾아내는것 예를들어 강우량 ( 변수 x) 이곡물의수확량 ( 변수 Y) 에미치는영향 화학공정의수율 ( 변수 x) 이촉매의사용량 ( 변수 Y) 에따라어떻게변하는지..

More information

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에대하여 AB=BA 1 가성립한다 2 3 (4) 이면 1 곱셈공식및변형공식성립 ± ± ( 복호동순 ), 2 지수법칙성립 (은자연수 ) < 거짓인명제 >

More information

MBA 통계6-12장.ppt

MBA 통계6-12장.ppt tatstcs: Descrptve tatstcs: Iferetal tatstcs: Populato: ample: Quattatve : Qualtatve Categorcal : PC Cross sectoal : Tme seres : - Populato: : : Parameter: costat : : Relatve frequec Frequec dstrbuto Frequec

More information

선형모형_LM.pdf

선형모형_LM.pdf 변수선택 8 경제성의 원리로 불리우는 Occam s Razor는 어떤 현상을 설명할 때 불필요한 가정을 해서는 안 된다는 것이다. 같은 현상을 설 명하는 두 개의 주장이 있다면, 간 단한 쪽을 선택하라. 통계학의 유 의성 검정, 유의하지 않은 설명변 수 제거의 근거가 된다. 섹션 1 개요 개념 1) 경험이나 이론에 의해 종속변수에 영향을 미칠 것 같은 설명변수를

More information

슬라이드 1

슬라이드 1 Principles of Econometrics (3e) 013 년 1 학기 윤성민 10.0 서론 The assumptions of the simple linear regression are: SR1. SR. yi =β 1 +β xi + ei i= 1,, N Ee ( i ) = 0 SR3. var( e i ) = σ SR4. cov( e, e ) = 0 i

More information

R

R R 과데이터분석 상관관계 양창모 청주교육대학교컴퓨터교육과 2015 년여름 양창모 ( 청주교육대학교컴퓨터교육과 ) Data Analysis using R 2015 년여름 1 / 20 상관관계 양적변수quantitative variables 사이의관계relationships를나타내기위하여상관계수correlation coefficients를사용한다. ± 기호를사용하여관계의방향을나타낸다.

More information

자료의 이해 및 분석

자료의 이해 및 분석 어떤실험이나치료의효과를측정할때독립이아닌표본으로부터관찰치를얻었을때처리하는방법 - 동일한개체에어떤처리를하기전과후의자료를얻을때 - 가능한동일한특성을갖는두개의개체에서로다른처리를하여그처리의효과를비교하는방법 (matching) 1 예제 : 혈청 cholesterol 치를줄이기위해서 12 명을대상으로운동과함께식이요법의효과를 측정하기위한실험실시 2 식이요법 - 운동실험전과후의

More information

Microsoft Word - ch2_smoothing.doc

Microsoft Word - ch2_smoothing.doc FORECASTING / 2 장. 지수평활법 14 Chaer 2. 지수평활법 시계열자료는시간에따라관측되며자료의수가많다는특징을갖는다. 시계열자료는시간에따른변화를 (rend, cycle, seasonaliy) 가지고있으므로과거관측치를이용하여미래값을예측할수있을것이다. 이를모형화하는방법이 ARMA 에서살펴보았다. ARMA 모형은시계열데이터의주기 (cycle) 을모형화하는것이다.

More information

untitled

untitled 통계청 통계분석연구 제 3 권제 1 호 (98. 봄 ) 91-104 장기예측방법의비교 - 전도시소비자물가지수를중심으로 - 서두성 *, 최종후 ** 본논문의목적은소비자물가지수와같이시간의흐름에따라변동의폭이크지않은시계열자료의장기예측에있어서쉽고, 정확한예측모형을찾고자하는데에있다. 이를위하여네가지의장기예측방법 - 1회귀적방법 2Autoregressive error 방법

More information

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표 Vector Differential: 벡터 미분 Yonhee Lee October 7, 08 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표기법을 정의하는 방법이다 보통 스칼라(scalar)에 대한 미분은 일분수 함수 f : < < 또는 다변수 함수(function

More information

회귀분석의 기초 한국보건사회연구원 2017년 6월 19일(월요일) & 22일(목요일) 강의 슬라이드 9 1/ 78 목차 1 2 3 4 2/ 78 지난 시간 복습 모집단 평균 µ에 대한 통계적 추론을 하는 방법: σ 신뢰구간: x ± t 유의성 검정: t = x µ σ/ 위 공식을 보면 모집단 표준편차 σ가 들어 있는데 이 σ를 모르니까 표본 표준편차 s로 대체해서

More information

슬라이드 1

슬라이드 1 회귀분석 (Regression Analysis) 회귀분석은종속변수와독립변수들갂의관련성, 또는독립변수를 이용하여종속변수를예측하는데사용하며, 종속변수와독립변수 들의함수적관련성을이용하여분석한다. 회귀분석의목적 (1) 예측을목적 주어진독립변수를이용하여종속변수의평균값을추정할목적으로 기존의자료를이용하여회귀모형을세움 (2) 각독립변수가종속변수에미치는영향을평가 종속변수에어떤독립변수들이유의한영향을미치는지를알아보고

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

Microsoft Word - SAS_Data Manipulate.docx

Microsoft Word - SAS_Data Manipulate.docx 수학계산관련 함수 함수 형태 내용 SIN(argument) TAN(argument) EXP( 변수명 ) SIN 값을계산 -1 argument 1 TAN 값을계산, -1 argument 1 지수함수로지수값을계산한다 SQRT( 변수명 ) 제곱근값을계산한다 제곱은 x**(1/3) = 3 x x 1/ 3 x**2, 세제곱근 LOG( 변수명 ) LOGN( 변수명 )

More information

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint 제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Winters의계절지수평활법 이동평균법 (moving average method) 평활에의해계절성분또는불규칙성분을제거하여전반적인추세를뚜렷하게파악

More information

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770> 삼각함수. 삼각함수의덧셈정리 삼각함수의덧셈정리 삼각함수 sin (α + β ), cos (α + β ), tan (α + β ) 등을 α 또는 β 의삼각함수로나 타낼수있다. 각 α 와각 β 에대하여 α >0, β >0이고 0 α - β < β 를만족한다고가정하 자. 다른경우에도같은방법으로증명할수있다. 각 α 와각 β 에대하여 θ = α - β 라고놓자. 위의그림에서원점에서거리가

More information

Microsoft Word - 동태적 모형.doc

Microsoft Word - 동태적 모형.doc 동태적모형 - 시차분포모형 (lag disribued model) I. 개요 A. 경제적행위나결정들의효과는즉시적으로다나타나지않고미래의상당기간동안분포됨 i. 기의행위나결정들이 기뿐아니라 + 기, + 기등에도영향을미치는경우 ii. 경제적정책변수 x 의변화가경제적결과 y, y +, y +, y +3 등에영향을미침 iii. 이는다시말하면, y 가 x, x -, x

More information

슬라이드 1

슬라이드 1 Principles of Econometrics (3e) Ch. 6 다중회귀모형에관한 추가적인논의 013 년 1 학기 윤성민 6장의주요내용 다중회귀모형의모수에관한둘이상의가설로구성된귀무가설을동시에검정하는경우 ( 결합가설의검정 ) F-검정 표본의정보이외에비표본정보도함께이용하는경우 제한최소제곱법 모형설정의오류를찾는방법 RESET 검정 다중공선성문제의탐지와해결방법

More information

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드] 제 11 강 111 자기상관 Autocorrelation 자기상관의본질 11 유효성 (efficiency, accurate estimation/prediction) 을위해서는모든체계적인정보가회귀모형에체화되어있어야함 표본의무작위성 (randomness) 은서로다른관측치들에대한오차항들이상관되어있지말아야함을의미함 자기상관 (Autocorrelation) 은이러한표본의무작위성을위반하게만드는오차항에있는체계적패턴임

More information

용역보고서

용역보고서 신뢰성샘플링검사의설계방법 ( 정수관측중단시험 ) 9.. ( 주 ) 한국신뢰성기술서비스 목차 신뢰성샘플링검사의설계방법 ( 정수관측중단시험 ).... 개요.... 기호및용어정의.... 샘플링검사의설계방법... 3. 정수중단시샘플링검사설계방법...4 4. 신뢰성샘플링시험계획예제...5 hp://www.kors.co.kr 신뢰성샘플링검사의설계방법 ( 정수관측중단시험

More information

exp

exp exp exp exp exp exp exp exp exp exp exp exp log 第 卷 第 號 39 4 2011 4 투영법을 이용한 터빈 블레이드의 크리프 특성 분석 329 성을 평가하였다 이를 위해 결정계수값인 값 을 비교하였으며 크리프 시험 결과를 곡선 접합 한 결과와 비선형 최소자승법으로 예측한 결과 사 이 결정계수간 정도의 오차가 발생하였고

More information

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는 제 12 강분산분석 분산분석 (ANOVA) (1) 1. 개요 비교하는집단의수가 3개이상일경우에사용되는통계기법이분산분석이다. 두표본 t검증에서는문제의단순성때문에야기되지않는문제들이다수의표본으로확대됨에따라문제들이야기되기도한다. 다음과같은 r개의모집단이있다고가정하자..... ~ N( μ σ ) ~ N( μ σ ).... ~ N ( μ σ )...... 위의그림과같이여러번에걸쳐두표본의

More information

Chapter 8 단순선형회귀분석과 상관분석

Chapter 8 단순선형회귀분석과 상관분석 Chapter 9 회귀모형 regression analysis 9.1 머리말 (Intro) Sir Francis Galton (18-1911) s studies on genetics Heights of parents and children: 부모의신장에비해 세의신장이일반평균치에복귀 (revert to the pop mean) 하는특성을발견하였다. 복귀 (revert)

More information

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차 가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차이가있을것이다. 가설 3 : 유권자의학력수준에따라지지후보는다를것이다. 지지후보의선택은유권자의학력수준에따라차이가있을것이다.

More information

PowerPoint Presentation

PowerPoint Presentation 09 th Week Correlation Analysis 상관관계분석 Jongseok Lee Business Administration Hallym University 변수형태와통계적분석방법 H 0 : X ㅗ Y H 1 : X ~ Y X Categorical Y Categorical Chi-square Test X Categorical Y Numerical

More information

(Hyunoo Shim) 1 / 24 (Discrete-time Markov Chain) * 그림 이산시간이다연쇄 (chain) 이다왜 Markov? (See below) ➀ 이산시간연쇄 (Discrete-time chain): : Y Y 의상태공간 = {0, 1, 2,..., n} Y n Y 의 n 시점상태 {Y n = j} Y 가 n 시점에상태 j 에있는사건

More information

Microsoft Word - sbe_anova.docx

Microsoft Word - sbe_anova.docx ANOVA 기본개요세집단이상인평균비교 => 일원분산분석집단을요인 (factor) 혹은처리효과 (treatment effect) 라하고집단의개별값을수준 (level) 이라한다. 요인이하나인경우 one-way ANOVA 분산분석 (ANOVA Analyss Of VArance) 은실험설계로부터유래, 분산 ( 변동 ) 에의해요인 ( 모형 ) 의유의성를검증한다. 실험관심대상에대한정보를얻기위한계획된테스트나관측절대실험

More information

슬라이드 1

슬라이드 1 장연립방정식을 풀기위한반복법. 선형시스템 : Guss-Sedel. 비선형시스템 . 선형시스템 : Guss-Sedel (/0) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정식을푸는반복법중에서 가장보편적으로사용되는방법이다. 개의방정식에서 인 ( 대각원소들이모두 0 이아닌 ) 경우를다루자. j j b j b j j j

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행 Ch4 one-way ANOVA ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행 One-way ANOVA 란? Group Sex pvas NSAID

More information

Microsoft PowerPoint - ANOVA pptx

Microsoft PowerPoint - ANOVA pptx 분산분석개념및기초 인과관계 casual relationship X=>Y Y 종속변수, 반응변수, 내생변수 X 설명변수, 독립변수, 요인 ( 처리효과 ), 내생변수 X 측정형 Y 범주형 로지스틱회귀분석 측정형 회귀분석 범주형교차분석분산분석 DOE Design of Experiment ( 실험설계 ) 관심대상에대한정보를얻기위한계획된테스트나관측 절대실험 absolute

More information

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ 수리통계학(Mathematical Statistics)의 기초 I. 들어가며 지금부터 계량경제학이나 실험 및 준실험 연구설계 기법을 공부할 때 도움이 되는 수리통계 학의 기초에 대해 다룰 것입니다. 이 노트에서 다루게 될 내용은 어떤 추정량(estimator)이 지니고 있는 성질입니다. 한 가지 말씀 드릴 것은 이 노트에 나오는 대부분의 성질들은 지금까 지

More information

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료 3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료 분포형태, 상대적위치, 극단값 분포형태 z-값 체비셰프의원리 경험법칙 극단값찾기 분포형태 : 왜도 (skewness) 분포형태를측정하는중요한척도중하나를 왜도 라고한다. 자료집합의왜도를구하는계산식은조금복잡하다. 통계프로그램을사용하여왜도를쉽게계산할수있다.

More information

슬라이드 1

슬라이드 1 Principle of Econometric (3e) 03 년 학기 윤성민 .0 서론 연립방정식모형 - 둘이상의종속변수가있는일련의방정식들로구성 OLS로추정하면부적절함 새로운추정방법필요 - 연립방정식추정법은계량경제학이통계학의회귀분석기법을넘어서는학문이라는것을보여주는분야이기도함 . 공급및수요모형 Demand: Supply: Q=α P+α X + e Q=β P+ e

More information

LM_matrix.pages

LM_matrix.pages 설명변수가 개이상인경우이를다중회귀라한다. 물론종속변수는하나이다. 종속변수가하나이상인회귀모형을 Simulteous Equtio( 연립방정식모형 ) 이라한다. 설명변수가 개존재하는경우선형다중회귀모형을다음과같다. Y i α + βx i + βxi +... + β Xi + ei i,,..., ( 모형 ), --- () α, β, β,..., β X 는회귀계수이고 i,

More information

Microsoft Word - SBE2012_anova.docx

Microsoft Word - SBE2012_anova.docx 실험설계개요어떤원인이반응에유의한영향을주고있는가를파악하고그영향이양적으로어느정도큰가를알아내고자실시함 ( 추정과검정 ) 적은영향밖에미치지못하는요인 ( 오차 ) 들은전체적으로어느정도영향을주고있으며, 측정오차는어느정도인가를알아내고자실시함 ( 오차항추정 ) 유의한영향을미치는원인들이어떠한조건을가질때가장바람직한반응을얻을수있는가를알아내기위해서실시함 ( 최적화 ) 용어 요인

More information

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정 . 선형시스템 : GussSedel. 비선형시스템. 선형시스템 : GussSedel (/0) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. GS 방법은선형대수방정식을푸는반복법중에서 가장보편적으로사용되는방법이다. 개의방정식에서 인 ( 대각원소들이모두 0 이아닌 ) 경우를다루자. j j b j j b j j 여기서 j b j j j 현재반복단계

More information

Microsoft Word - EDA_Univariate.docx

Microsoft Word - EDA_Univariate.docx 일변량분석개념 일변량분석은개체의특성을 측정한변수가하나인 통계분석 방법 변수의 종류 ( 수리 통계 ) 이산형 (discrete): 측정결과를셀수있는경우이다. 성별, 직업, 교통량, 나이등이여기해당된다. 연속형 (continuous): 측정결과가무한이 (infinite) 많은변수를연속형형변수라한다. 즉변수의범위 (range) 중어떤구간을설정하더라도측정치가발생할할수있는경우로키,

More information

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx Mti Matrix 정의 A collection of numbers arranged into a fixed number of rows and columns 측정변수 (p) 개체 x x... x 차수 (nxp) 인행렬matrix (n) p 원소 {x ij } x x... x p X = 열벡터column vector 행벡터row vector xn xn... xnp

More information

비선형으로의 확장

비선형으로의 확장 비선형으로의확장 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 비선형으로의확장 1 / 30 개요 선형모형은해석과추론에장점이있는반면예측력은제한됨능형회귀, lasso, PCR 등의방법은선형모형을이용하는방법으로모형의복잡도를감소시켜추정치의분산을줄이는효과가있음해석력을유지하면서비선형으로확장다항회귀 (polynomial regression): ( 예 )

More information

표본재추출(resampling) 방법

표본재추출(resampling) 방법 표본재추출 (resampling) 방법 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 표본재추출 (resampling) 방법 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과

More information

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드] 제 강.1 통계적기초 확률변수 (Radom Variable). 확률변수 (r.v.): 관측되기전까지는그값이알려지지않은변수. 확률변수의값은확률적실험으로부터결과된다. 확률적실험은실제수행할수있는실험뿐아니라가상적실험도포함함 (ex. 주사위던지기, [0,1] 실선에점던지기 ) 확률변수는그변수의모든가능한값들의집합에대해정의된알려지거나알려지지않은어떤확률분포의존재가연계됨 반면에,

More information

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770> 25 강. 수열의극한참거짓 2 두수열 { }, {b n } 의극한에대한 < 보기 > 의설명중옳은것을모두고르면? Ⅰ. < b n 이고 lim = 이면 lim b n =이다. Ⅱ. 두수열 { }, {b n } 이수렴할때 < b n 이면 lim < lim b n 이다. Ⅲ. lim b n =0이면 lim =0또는 lim b n =0이다. Ⅰ 2Ⅱ 3Ⅲ 4Ⅰ,Ⅱ 5Ⅰ,Ⅲ

More information

Microsoft Word - sbe13_anova.docx

Microsoft Word - sbe13_anova.docx 실험설계개요어떤원인이반응에유의한영향을주고있는가를파악하고그영향이양적으로어느정도큰가를알아내고자실시함 ( 추정과검정 적은영향밖에미치지못하는요인 ( 오차 들은전체적으로어느정도도영향을주고있으며, 측정오차는어느정도인가를알아내고자실시함 ( 오차항추정 유의한영향을미치는원인들이어떠한조건을수있는가를알아내기위해서실시함 ( 최적화 가질때가장바람직한반응을얻을 용어 요인 (Factor:

More information

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드] 제 11 강 자기상관 Auocorrelaion 111 유효성 (efficiency, accurae esimaion/predicion) 을위해서는모든체계적인정보가회귀모형에체화되어있어야함 표본의무작위성 (randomness) 은서로다른관측치들에대한오차항들이상관되어있지말아야함을의미함 자기상관 (Auocorrelaion) 은이러한표본의무작위성을위반하게만드는오차항에있는체계적패턴임

More information

시계열분석의개요 (the nature of time series analysis) 확률과정 (stochastic processes) 이란시간으로순서가매겨진확률변수들의집합임. 만일확률변수 y 가연속이라면 y(t) 라고표기하지만이산이라면 y t 라고표기함 ( 대부분의경제자

시계열분석의개요 (the nature of time series analysis) 확률과정 (stochastic processes) 이란시간으로순서가매겨진확률변수들의집합임. 만일확률변수 y 가연속이라면 y(t) 라고표기하지만이산이라면 y t 라고표기함 ( 대부분의경제자 시계열분석의개요 (the nature of time series analysis) 확률과정 (stochastic processes) 이란시간으로순서가매겨진확률변수들의집합임. 만일확률변수 y 가연속이라면 y(t) 라고표기하지만이산이라면 y t 라고표기함 ( 대부분의경제자료들은이산적임 ). 전통적계량접근법 (econometric approach) 종속변수와독립변수간의이론적관계를토대로모형을구성함.

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

PPT Template

PPT Template External Use SPSS 를이용한분산분석 (ANOVA) 013 년 11 월 13 일 임찬수 0 Table of Contents 1 분산분석과실험계획법 일원배치분산분석 (One-way ANOVA) 3 사후분석 (Post-hoc test) 4 일원배치분산분석의예제 5 HomeWork 1 1 분산분석과실험계획법 분산분석 분산분석 : 평균값을기초로하여여러집단을비교하고,

More information

PowerPoint Presentation

PowerPoint Presentation 5 불대수 IT CookBook, 디지털논리회로 - 2 - 학습목표 기본논리식의표현방법을알아본다. 불대수의법칙을알아본다. 논리회로를논리식으로논리식을논리회로로표현하는방법을알아본다. 곱의합 (SOP) 과합의곱 (POS), 최소항 (minterm) 과최대항 (mxterm) 에대해알아본다. 01. 기본논리식의표현 02. 불대수법칙 03. 논리회로의논리식변환 04.

More information

Resampling Methods

Resampling Methods Resampling Methds 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) Resampling Methds 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과 )

More information

<B3EDB4DC28B1E8BCAEC7F6292E687770>

<B3EDB4DC28B1E8BCAEC7F6292E687770> 1) 초고를읽고소중한조언을주신여러분들게감사드린다. 소중한조언들에도불구하고이글이포함하는오류는전적으로저자개인의것임을밝혀둔다. 2) 대표적인학자가 Asia's Next Giant: South Korea and Late Industrialization, 1990 을저술한 MIT 의 A. Amsden 교수이다. - 1 - - 2 - 3) 계량방법론은회귀분석 (regression)

More information

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345]) 수치해석 161009 Ch21. Numerical Differentiation 21.1 소개및배경 (1/2) 미분 도함수 : 독립변수에대한종속변수의변화율 y = x f ( xi + x) f ( xi ) x dy dx f ( xi + x) f ( xi ) = lim = y = f ( xi ) x 0 x 차분근사 도함수 1 차도함수 : 곡선의한점에서접선의구배 21.1

More information

hwp

hwp 2005. 12 80.0 70.0 60.0 농림어업 광공업 사회간접자본및서비스업 50.0 40.0 30.0 20.0 10.0 0.0 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001 9.0 8.0 실업률 7.0 6.0 5.0 4.0 전체남자여자

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 9 주차 예측모형에대한평가 Assessment of Predictive Model 최종후, 강현철 차례 6. 모형평가의기본개념 6.2 모델비교 (Model Comparison) 노드 6.3 임계치 (Cutoff) 노드 6.4 의사결정 (Decisions) 노드 6.5 기타모형화노드들

More information

Microsoft Word - Chapter9.doc

Microsoft Word - Chapter9.doc CHAPTER 9 분산분석 9.1. 분산분석개념 분산분석 (ANOVA: Analysis of Variance) 이란종속변수 (dependent variable: 반응변수 : response variable) 의분산 (variation: 변동 통계에서는이를변수가가진정보라한다 ) 을설명하는독립변수 (independent: 설명변수 : explanatory) 의유의성

More information