Chapter 8 단순선형회귀분석과 상관분석

Size: px
Start display at page:

Download "Chapter 8 단순선형회귀분석과 상관분석"

Transcription

1 Chapter 9 회귀모형 regression analysis

2 9.1 머리말 (Intro) Sir Francis Galton ( ) s studies on genetics Heights of parents and children: 부모의신장에비해 세의신장이일반평균치에복귀 (revert to the pop mean) 하는특성을발견하였다. 복귀 (revert) 는회귀 (regression) 로표현하기로하였다.

3 회귀분석기본모형 (model) 종속변수 Y Dependent var x i i i i ~ N(0, ) iid 정규 normal 독립변수 : 고전적인모델에선비확률 동일분산 Same variance Independent var: not random 독립 (independently) 같은분포 (identically distributed)

4 회귀모형 (Regression Model) 단순회귀분석법에서의가정 (assumptions) Y : 종속변수, 반응변수 (dependent, response variable) X : 독립변수, 설명변수 (independent, explanatory variable) 1. Y 는분포가있는확률변수 (Y: random variable). X 는고정된값으로오차없는통제가능한값 (x: fixed, so controllable variable) 3. Y 는 X 값에따라부분모집단이존재하고부분모집단은각각정규분포를하여야한다. (Y~sub-population based on x which is a normal dist n)

5 그림 단순선형회귀모형의도식 graphical description of simple regression

6 4. 부분모집단의분산은동일 variances of sub-popo are all equal 5. 선형가정 (linear assumption) E x 6. Y 값들은통계적으로독립이다. Y s are independent y x (linear association) i i i i -> 모든가정은 Check 하는것이원칙 yx ~ N(0, ),(independece, normality, homogeneity) 독립, 정규성, x 와무관한동일분산 (All assumptions need to be checked!)

7 9. 표본회귀방정식 simple linear regression 보기 9..1

8 최소제곱직선 (least square line) get a and b which minimizes the sume of squares n i1 ( y a bx ) i i n n ( ˆ i i ) ( i i ) i1 i1 A y y y a bx n da ( yi a bxi) 0 da da db i1 n ( y a bx ) x 0 i1 i i i yi na bxi x y a x b x i i i i (8.3.) (8.3.3) We need x, i yi, xi, xi yi

9 최소제곱추정치 (least square estimator) β 1 = i=1 n (x i x)(y i y) n (x i x) i=1 β 0 = y β 1 x y = β 0 + β 1 x 최소제곱법은다음과같이모든데이터의편차의제곱합을최소로만들어주는 β 0, β 1 을 β 0, β 1 로이용하는방법으로 β 0, β 1 는다음의부등식을만족해야한다. n (y i β 0 β 1 x i ) y i β 0 β 1 x i, β0, β 1 i=1 i=1 n

10 > chap9.<read.csv("e:\\kim\\yes\\myweb\\int\\018\\newlecturenote\\data\\waist.csv",header=t) > reg<-lm(fat~waist, data=chap9.) > summary(reg) Call: lm(formula = fat ~ waist, data = chap9.) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <e-16 *** waist <e-16 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 105 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: 90.3 on 1 and 105 DF, p-value: <.e-16 > anova(reg) Analysis of Variance Table Response: fat Df Sum Sq Mean Sq F value Pr(>F) waist <.e-16 *** Residuals Signif. codes: 0 *** ** 0.01 *

11 9.3 회귀방정식의평가 evaluation of the regression line 0 선형관계가없다. no linear association 0 x가증가할수록 y는증가한다. x: proportional to y < 0 x가증가할수록 y는감소한다. x: inverse-proportional to y

12 그림 그림 9.3. H 0 β 1 = 0 을기각하지못하는경우 H 0 β 1 = 0 을기각하는경우

13 총편차 (sum of squares) Total SS = explained SS + unexplained SS SST ( y y) y i i SSR ( yˆ i y) b xi SSE SST SSR ( y ) n i ( x ) n i

14 결정계수 coefficient of determination 총변동중에서회귀방정식으로설명되는변동의비율을결정계수라고한다. (proportion of SSR over SST) r 결정계수가클수록회귀방정식이 data 를잘설명한다. 0 < r < 1, ( x ) i b xi yˆ i y n SSR i ( yi ) yi ( ) ( y y) SST n

15 그림 9.3.4

16 그림 (a) r 0.99 (b) r 0.3 (c) r = 1 (d) r 0

17 ANOVA ANOVA table for simple linear regression 요인 (source) 회귀모형 (model) 제곱합 (SS) 자유도 (df) 평균제곱 (mean square) F SSR 1 MSR = SSR/1 MSR MSE 오차 (error) SSE n MSE = SSE/(n ) 합 (total) SST n 1

18 1 Hypothesis Variance Ratio F- 통계량을이용한검정 가설 : H0 : 0 H : 0 A 검정통계량 F-test : V. R ~ F(1, n - ) 아래에서 V.R.=90.5 > F(1,105;0.95)=3.91 -> Reject Ho > anova(reg) Analysis of Variance Table Response: fat Df Sum Sq Mean Sq F value Pr(>F) waist <.e-16 *** Residuals Signif. codes: 0 *** ** 0.01 *

19 T-test T- 통계량을이용한검정 가설 : b a a b H b H A 0 : 0 : 0 Ea ( ) Var( a) Eb ( ) Var( b) s i n ( x x) s ( x x) i ( x x) i i x Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <e-16 *** waist <e-16 *** ---

20 가설 : t H H b : A b 0 s 예제에서 : 0 t 0 ~ t( n ) 에대한신뢰구간 신뢰구간 t(105) Confidence interval Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <e-16 *** waist <e-16 *** --- b t s (1 ) ( xi x) ± 1.983(0.0114) (0.1716, 0.169)

21 Application 9.4 회귀방정식의사용 주어진 x 에대한 y x 의예측 p Predicting Y for a given X p ( x x) 신뢰구간: yˆ t s 1, yˆ a bx 1 p (1 ) n ( xi x) 예측구간 prediction interval

22 8.5 회귀방정식의사용 Estimating the mean of Y for a given X 주어진 x 에대한 E( y) x 의평균추정 p y ± t 1 α s 1 n + x p x i p x x Confidence interval when x p =100 y s 1 n + x p x i x x 95% 신뢰구간 Confidence interval 95% 예측구간 Predictive interval (89.81, 9.416) (77.59, )

23 Estimating the mean of Y for a given X (a) 95% 신뢰구간 (b) 95% 예측구간 > newdata = data.frame(waist=100) > predict(reg, newdata, interval="confidence") fit lwr upr > predict(reg, newdata, interval="prediction") fit lwr upr

24 chap9.<read.csv("e:\\kim\\yes\\myweb\\int\\018\\newlec turenote\\data\\waist.csv",header=t) reg<-lm(fat~waist, data=chap9.) attach(chap9.) plot(waist,fat,xlim=c(0,50),ylim=c(60,10)) abline(reg) result=data.frame(waist=1:5*10) p<-as.data.frame(predict(reg, result, level=0.95, interval="confidence")) lines(cbind(result,p$lwr), lty=) lines(cbind(result,p$upr), lty=) win.graph() plot(waist,fat,xlim=c(0,50),ylim=c(60,10)) abline(reg) result=data.frame(waist=1:5*10) pp<-as.data.frame(predict(reg, result, level=0.95, interval="prediction")) lines(cbind(result,pp$lwr), lty=) lines(cbind(result,pp$upr), lty=) PROC IMPORT OUT= WORK.waist DATAFILE= "E:\kim\yes\myweb\int\018\newl waist.csv" DBMS=CSV REPLACE; GETNAMES=YES; DATAROW=; RUN; * SAS 코드 ; proc reg; model fat=waist ; plot fat*waist; run;

25 Homework > 손으로도한번하고 (manual calculation), SAS and R 로하기

26 9.5 다중회귀분석의개념 (multiple regression) One Y& k independent variables x1,, xk Y 종속변수 (Dependent variable) 독립변수 x1,, xk (Independent variable) 반응변수 (Response variable) 설명변수 (explanatory variable) 예측변수 (predictor variable)

27 다중회귀모형 (model) y x x x j j j k kj j j j ~ iid N(0, ) 1,, n Independently & identically distributed 회귀계수의의미 (Interpreting the coefficients) e.g. independent var s Y x x ( Y : 입원기간, x : 과거입원회수, x : 연령) 1 ( Y :length of hospital stay, x :length of hospital stay, previous visit, x :age) 1

28 E[ Y( x x 0)] 0 1 가 0일때 Y의기대치 Centering 필요 E(Y x 1 =x =0) x1, x E[ y( x a 1, x b)] E[ y( x a, x b)] ( a 1) b ( a) b x 가같은값으로남아있을때 x 이한단위증가할때 y의기대치의증가값 increment of E( Y ) corresponding to unit increase of x when x is fixed 1 x 의 effect 를 adjust 한후의 x 의 y 에대한 effect 1 Effect of x on Y after controlling the effect of x 1 x 가같은값으로남아있을때 x 이한단위증가할때 y의기대치의증가값 1

29 9.6 다중회귀방정식의추정 estimating regression coef. 정규방정식 (normal equation) nb b x b x y Estimate j j j b x b x b x x x y 0 1 j 1 1 j 1 j j 1 j j b x b x x b x x y 0 j 1 1 j j j j j,, 0 1 which minimize L L y x x j j j j dl dl dl d d d 0 1 0

30 예제 chap9r<read.csv("e:\\kim\\yes\\myweb\\int\\018\\newlectureno te\\data\\cda.csv",header=t) plot(chap9r) head(chap9r) line<-lm(cda~age+ed, data=chap9r) summary(line) anova(line) y j = x 1j x j

31 9.7 다중회귀방정식의평가 evaluating regression model 중결정계수 (Multiple Coeff. of Determination) SST SSR SSE 총변수 = 설명되는자승합 + 설명되지않는자승합 sum of squares, total=ss explained + SS unexplained R ˆ j y.1... k y y SSR y y SST j

32 Ex > aa <- anova(line) > aa[,] [1] > sst=sum(aa[,]) > sst [1] 1094 > ssr=sum(aa[1,],aa[,]) > ssr [1] > Rsq=ssr/sst > Rsq [1] >

33 Notion of Matrix y X n1 n( k 1) ( k 1) 1 n1 y1 1 x11 x1 xk1 0 1 y 1 x1 x xk 1 y 1 x x x n 1n n kn k n L ( yx ) ( yx ) yy X ' y X ' X L X ' y X ' X 0 ( X ' X ) X ' y ˆ ( X ' X ) 1X ' y

34 ˆ ( ) 1 LSE X X X Y x11 x1 xk1 x11 x1 x1 n 1 x1 x xk x1 x x n 1 x13 x3 x k3 XY xk1 xk x kn 1 x1 n xn x kn n x1j x j xkj y j x1 j x1 j x1 j x j x1 j xkj x1 jyj xkj x1 jxkj x kj xkj y j 1 1 Var ˆ ( X X ) ˆ 1

35 when k n x1j x j x ˆ 1 j x1 j x1 jx j x j x1 jx j x j var( ˆ b0 ) cov( b0, b1 ) cov( b0, b ) cov( ˆ b0, b1 ) var( b1 ) cov( b1, b ) cov( b ˆ 0, b ) cov( b1, b ) var( b ) C00 C01 C0 1 ( X X ) ˆ C01 C11 C1 ˆ C0 C1 C C00 C01 C0 I ( X X ) C01 C11 C C0 C1 C 1

36 ANOVA Table 요인 (Source) 제곱합 자유도 (df) 평균제곱합 (Mean Sq) F 회귀모형 (model) SSR k MSR = SSR/k MSR/MSE 잔차 (error) SSE n k 1 MSE = SSE/(n k 1) 합 (total) SST n 1 H H : A : Not H 0 if V. R F( k, n - k -1,1- ) then reject H each b i N ( i, c ii ) k s β i 0

37 검정 (Testing) Hypothesis : H : 0 Test stat : b i bi 0 H A: i 0 s standard error : i i s bi s C If t t ( n k 1), then reject H ii 1 0

38 특정한 9.8 다중회귀방정식의사용 X i 값이주어졌을때 Y 값의부분 모집단평균에대한신뢰구간 y j ± t 1 α,df=n k 1s y j X i Application Estimating the mean of Y for a given X Predicting Y for a given X 특정한값이주어졌을때얻게되는 Y값의예측구간 y j ± t 1 α, df=n k 1s y j

39 Ex new=data.frame(age=68,ed=1) predict(line, new, level=0.95, interval="confidence") predict(line, new, level=0.95, interval="prediction")

40 9.9 회귀분석가정의위반 (checking the assumptions of regression model) 비정규분포 (not normal distributed) 이분산성 (heterogeneity) 독립변수사이의상관성 (co-linearity between independent vars)

41 9.10 질적독립변수 (Qualitative indep. Var) 변수 (variable) 양적 (quantitative) 연속 - 성적, 연령 질적 (qualitative) Continuous-score, age 범주 성별, 인종, 직업 Categorical-sex, race, job 질적변수를가변수 (dummy variable) 로이용 ( 가변수 : (0,1) 의값을갖는것 ) 질적변수 k 개범주 k-1 개의가변수사용 k categories -> k-1 dummy variables

42 가변수의예 (Examples of dummy var s) * * 성별 sex x 거주지역 x 1 0 Residential area (urban, rural, suburban) x 남자여자 도시 otherwise 농촌 otherwise male female urban rural * 흡연상태 ( 흡연자, 금연자-5 년내금연자, 금연자-5 년이상금연자, 비흡연자) Smoking status (current smoker, ex-smoker(<=5yrs), ex-smoker(.5 yrs) x 1 4 흡연자 smoker 0 otherwise x 년내금연자 ex-smoker (<=5 years) otherwise x 년이상금연자 otherwise ex-smoker (>5 years)

43 Ex Case # Birth weight Gestation (week) Smk status of the mother

44 Y 출생시체중 (birth weight, grams) x x 1 임신기간주 gestation (weeks) 산모의흡연 smk status of the mother model 1: E( Y ) x x E( Y ) x E( Y ) ( ) x for nonsmoker for smoker S, N 1 0 smoker nonsmoker same slope, different intercept data<read.csv("d:\\kim\\yes\\myweb\\int\\018\\newlecturenote\\data \ 태아몸무게.csv",header=T) reg<-lm(gram~weeks+factor(smoke),data=data) summary(reg)

45 Y 출생시체중 (birth weight, grams) x x 1 임신기간주 gestation (weeks) 산모의흡연 smk status of the mother model 1: E( Y ) x x E( Y ) x E( Y ) ( ) x for nonsmoker for smoker S, N 1 0 smoker nonsmoker same slope, different intercept data<read.csv("d:\\kim\\yes\\myweb\\int\\018\\newlecturenote\\data \ 태아몸무게.csv",header=T) reg<-lm(gram~weeks+factor(smoke),data=data) summary(reg) Call: lm(formula = gram ~ weeks + factor(smoke), data = data) Residuals: Min 1Q Median 3Q Max Coefficients:

46 Y 출생시체중 (birth weight, grams) x x 1 임신기간주 gestation (weeks) 산모의흡연 smk status of the mother model 1: E( Y ) x x E( Y ) x E( Y ) ( ) x for nonsmoker for smoker S, N 1 0 smoker nonsmoker same slope, different intercept lm(formula = gram ~ weeks + factor(smoke), data = data) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) ** weeks e-14 *** factor(smoke) * --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 97 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: 41.9 on and 97 DF, p-value: 7.594e-14

47 * E( Y X x ) E( Y X x ) 1 1 smoker 1 1 non - smoker 임신기간이같다고할때, 주어진 x 값에대해서 1 어머니가흡연자인경우와어머니가비흡연자인경우의출생아의체중의차이 expected diff of birth weights between babies from smokers and nonsmokers ˆ 45grams y.. j = β 0 + β 1 x 1j + β x j = x 1j 94.40x j ˆ 0 * T y j = x j se( = ˆ ) x 1j for smoker reject H b 0 : significantally different. *95% 신뢰구간 y j = (CI) x 1j = x b ts ( , ) 1j for non-smoker

48 Nonsmoker smoker

49 model : E( Y) x x x x E( Y ) x for nonsmoker E( Y) ( ) ( ) x different slope, different intercept for smoker If If 3 is significant -> slopes are diff btn smoker/nonsmoker is significant -> intercepts are diff not important without centering

50 체중 Model 그림 nonsmoker 1 smoker week 임신기간

51 centering if x x 38( week) 1 1 E( Y ) x x x x E( Y ) x ( x 38) for nonsmoker 는 x 38일때 Y의기대치가된다 ( 의미, 관심있는모수 ) 0 1 E( Y ) ( ) ( ) x 는 x = 0일때기대치의차이가아니라 x = 38일때 1 1 for smoker E(Y x 1 =38) 흡연자와비흡연자의기대치의차이가된다. E(Y x 1 =38, smoker) -E(Y x 1 =38, non-smoker) * 교훈 : 연속변수를 centering을시켜주면절편이 x = 0일때의기대치가아니라 x = 특정값일때의기대치가되므로더욱의미있게된다. * centering 의다른효과 x 간의 mult - colinearity( 공선성 ) 를약화시켜준다. Intercept becomes more meaningful after centering. Multicolinearity becomes weaker after centering

52 Ex effectiveness age treatment effectiveness age treatment 56 1 A A 41 3 B B B B 8 19 C C 55 8 A A 5 3 C A B 6 58 B C 36 9 C 48 4 B A A 47 9 B 5 33 A A 6 56 C B C B B 6 63 A A C C 6 51 C B A 34 7 C C

53 Model- 예제 * Y 치료효과 (trt effect) * X 1 연령 ( 양적 ) age ( quantitative) X 1, if trt * 치료방법 ( 질적 ) trt ( qualitative) X 1, if trt 3 Y x x x x x x x E( Y ) x : for trt = A EY ( ) ( ) ( ) x : for trt = B E( Y ) ( ) ( ) x : for trt = C B C

54 , : intercept & slope for reference cell A : diff of intercepts (B-A), =0? : diff of intercepts (C-A), =0? : diff of slopes (B-A), =0? :diff of slopes (C - A), = 0?

55 예제 sas * File: mreg018.sas ; data reg; input effect age method $; x1=age;x=(method= B');x3=(me thod= C'); x1=x1*x;x13=x1*x3; cards; 56 1 A 41 3 B B 8 19 C 55 8 A 5 3 C B C 48 4 B A 5 33 A 6 56 C C B A C B 34 7 C A B B C A A 6 58 B 36 9 C A 47 9 B A B B 6 63 A C 6 51 C A C ; run; proc reg; model effect=x1 x x3 x1 x13; output out=d p=pred; id age method; run; proc sort;by method; proc gplot; plot effect*age=method/ legend; symbol1 v='a' i=r c=c l=1; symbol v='b' i=r c=c l=; symbol3 v='c' i=r c=c l=3; run; proc glm ; class method; model effect=age method age*method / solution; run; proc glm ; class method(reference='a'); model effect=age method age*method / solution; run;

56 9.11 변수선택절차 variable(model) selection Forward selection Backward elimination Stepwise selection

57 Mod18.sas /* file : mod18.sas Multiple Regression Model with stepwise selection */ Filename electric 'd:\myweb\int\electric.dat'; data peak; infile electric ; input housize 1-3 income 6-11 aircapac applindx 19-3 family 6-8 peak ; label housize = 'House Size' income = 'Family Income' aircapac = 'Air Conditioning Capacity' applindx = 'Appliance Index' family = 'Number of Family Members' peak = 'Peak Hour Electric Load' ; run; proc reg data=peak; model peak = housize income aircapac applindx family /selection=stepwise; title 'Multiple Regression Model with stepwise selection'; run; proc reg data=peak outest=est; model peak = housize income aircapac applindx family /selection=rsquare cp adjrsq mse best= ; title 'Multiple Regression Model with stepwise selection'; run; proc print; title 'Actual Coefficients, etc.'; proc plot; plot _cp_*_in_ ='C' _p_*_in_='*'/overlay vaxis= 0 to 5 by 5 haxis=1 to 5 hpos=40 vpos=30; title; run;

eda_ch7.doc

eda_ch7.doc ( ) (, ) (X, Y) Y Y = 1 88 + 0 16 X =0601 Y = a + bx + cx X (nonlinea) ( ) X Y X Y b(016) ( ) log Y = log a + b log X = e Y = b ax 71 X (explanatoy va :independent ), Y (dependent : esponse) X, Y Sehyug

More information

Microsoft Word - multiple

Microsoft Word - multiple Chapter 3. Multiple Liear Regressio Data structure ad the model yi 0 1xi1 pxip i, i1,, (Y X ),,, : idepedet with E( ) 0 ad 1 : ukow 0, 1,, p, 0 1 i var( i ) X (1, x,, xp), rak( X) p1, X : give where xj

More information

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63> 제 3 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

Microsoft PowerPoint - IPYYUIHNPGFU

Microsoft PowerPoint - IPYYUIHNPGFU 분산분석 분산분석 (ANOVA: ANALYSIS OF VARIANCE) 두개이상의모집단의차이를검정 예 : 회사에서세종류의기계를설치하여동일한제품을생산하는경우, 각기계의생산량을조사하여평균생산량을비교 독립변수 : 다른변수에의해영향을주는변수 종속변수 : 다른변수에의해영향을받는변수 요인 (Factor): 독립변수 예에서의요인 : 기계의종류 (I, II, III) 요인수준

More information

G Power

G Power G Power 부산대학교통계학과조영석 1. G Power 란? 2. G Power 설치및실행 2.1 G Power 설치 2.2 G Power 실행 3. 검정 (Test) 3.1 가설검정 (Test of hypothesis) 3.2 검정력 (Power) 3.3 효과크기 (Effect size) 3.4 표본수산정 4. 분석 4.1 t- 검정 (t-test) 4.2

More information

Chapter 7 분산분석

Chapter 7 분산분석 Chapter 8 실험계획및분산분석 (ANalysis Of VAariance, ANOVA) Updated 2018/4/30 7.1 머리말 (Introduction) 분산분석 (analysis of variance) : 전체변동을몇개의성분으로분할하는기법 (Divide total variation into several components) 전체변동에대해각각의변동요인의기여규모를파악

More information

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은 2013 년도연구용역보고서 공공기관임금프리미엄추계 - 2013. 12.- 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한국노동연구원선임연구위원정진호 공공기관임금프리미엄추계 2013. 12. 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 7 주차 회귀분석 Regression Analysis 최종후, 강현철 차례 4.1 선형회귀분석 (Linear Regression Analysis) 4.2 로지스틱회귀분석 (Logistic Regression Analysis) 4.3 회귀분석의특징과제약 4.4 분석사례 -

More information

abstract.dvi

abstract.dvi 통계자료분석 강희모 2014년 5월 14일 목차 제 1장 여러가지평균비교 1 1.1. 단일표본검정.............................. 2 1.2. 독립인두표본검정........................... 4 1.3. 대응표본검정.............................. 9 제 2 장 분산분석(ANalysis Of VAriance)

More information

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사 회귀분석 올림픽 100m 우승기록 2004년 9월과학저널 Nature에발표된 Oxford 대학교의임상병리학자인 Andrew Tatem과그의연구진의논문 1900~2004년까지의남성과여성의육상 100m 우승기록을분석하고앞으로최고기록이어떻게변할것인지를예측 2008년베이징올림픽에서남자의우승기록은 9.73±0.144(9.586, 9.874), 여자는 10.57±0.232(10.338,

More information

Y 1 Y β α β Independence p qp pq q if X and Y are independent then E(XY)=E(X)*E(Y) so Cov(X,Y) = 0 Covariance can be a measure of departure from independence q Conditional Probability if A and B are

More information

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a 조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a) b) 조사연구 주제어 패널조사 횡단면가중치 종단면가중치 선형혼합모형 일반화선형혼 합모형

More information

methods.hwp

methods.hwp 1. 교과목 개요 심리학 연구에 기저하는 기본 원리들을 이해하고, 다양한 심리학 연구설계(실험 및 비실험 설계)를 학습하여, 독립된 연구자로서의 기본적인 연구 설계 및 통계 분석능력을 함양한다. 2. 강의 목표 심리학 연구자로서 갖추어야 할 기본적인 지식들을 익힘을 목적으로 한다. 3. 강의 방법 강의, 토론, 조별 발표 4. 평가방법 중간고사 35%, 기말고사

More information

untitled

untitled Math. Statistics: Statistics? 1 What is Statistics? 1. (collection), (summarization), (analyzing), (presentation) (information) (statistics).., Survey, :, : : QC, 6-sigma, Data Mining(CRM) (Econometrics)

More information

Chapter 7 분산분석

Chapter 7 분산분석 Chapter 7 분산분석 (ANalysis Of VAariance, ANOVA) 2014/4/29 7.1 머리말 (Introduction) 분산분석 (analysis of variance) : 전체변동을몇개의성분으로분할하는기법 (Divide total variation into several components) 전체변동에대해각각의변동요인의기여규모를파악 (contribution

More information

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행 Ch4 one-way ANOVA ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행 One-way ANOVA 란? Group Sex pvas NSAID

More information

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED28313531323231292D2DB1E8C7F5C1D62E687770>

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED28313531323231292D2DB1E8C7F5C1D62E687770> 통계연구(2015), 제20권 제3호, 71-92 변수선택 기법을 이용한 한국 프로야구의 득점과 실점 설명 1) 김혁주 2) 김예형 3) 요약 한국 프로야구에서 팀들의 득점과 실점에 영향을 미치는 요인들을 규명하기 위한 연구를 하였 다. 2007년부터 2014년까지의 정규리그 전 경기 자료를 대상으로 분석하였다. 전방선택법, 후방 소거법, 단계별 회귀법, 선택법,

More information

슬라이드 1

슬라이드 1 회귀분석 (Regression Analysis) 회귀분석은종속변수와독립변수들갂의관련성, 또는독립변수를 이용하여종속변수를예측하는데사용하며, 종속변수와독립변수 들의함수적관련성을이용하여분석한다. 회귀분석의목적 (1) 예측을목적 주어진독립변수를이용하여종속변수의평균값을추정할목적으로 기존의자료를이용하여회귀모형을세움 (2) 각독립변수가종속변수에미치는영향을평가 종속변수에어떤독립변수들이유의한영향을미치는지를알아보고

More information

cat_data3.PDF

cat_data3.PDF ( ) IxJ ( 5 0% ) Pearson Fsher s exact test χ, LR Ch-square( G ) x, Odds Rato θ, Ch-square Ch-square (Goodness of ft) Pearson cross moment ( Mantel-Haenszel ), Ph-coeffcent, Gamma (γ ), Kendall τ (bnary)

More information

01-07-0.hwp

01-07-0.hwp 선거와 시장경제Ⅱ - 2000 국회의원 선거시장을 중심으로 - 발간사 차 례 표 차례 그림 차례 제1부 시장 메커니즘과 선거시장 Ⅰ. 서 론 Ⅱ. 선거시장의 원리와 운영방식 정당시장 지역구시장 문의사항은 Q&A를 참고하세요 정당시장 한나라당 사기 종목주가그래프 c 2000 중앙일보 Cyber중앙 All rights reserved. Terms

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

Chapter 7 분산분석

Chapter 7 분산분석 Chapter 8 실험계획및분산분석 (Experimental Design & ANalysis Of VAariance, ANOVA) 2017/5/01 8.1 선형모형과분산분석 (Linear Model & Analysis of Variance) 선형모형 (linear model): 설명변수들의선형의선형결합의형태로반응변수를설명하고자함. (to explain the

More information

슬라이드 1

슬라이드 1 Principles of Econometrics (3e) 013 년 1 학기 윤성민 10.0 서론 The assumptions of the simple linear regression are: SR1. SR. yi =β 1 +β xi + ei i= 1,, N Ee ( i ) = 0 SR3. var( e i ) = σ SR4. cov( e, e ) = 0 i

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

슬라이드 1

슬라이드 1 Principles of Economerics (3e) Ch. 4 예측, 적합도, 모형화 013 년 1 학기 윤성민 4.1 OLS 예측 (1) 점예측 x0 y0 - 설명변수일때, 종속변수의값을예측하고자함 y ˆ = b + 0 1 b x 0 Ch. 4 예측, 적합도, 모형화 /60 4.1 OLS 예측 예측오차 (forecas error), f 예측오차의기대값

More information

선형모형_LM.pdf

선형모형_LM.pdf 변수선택 8 경제성의 원리로 불리우는 Occam s Razor는 어떤 현상을 설명할 때 불필요한 가정을 해서는 안 된다는 것이다. 같은 현상을 설 명하는 두 개의 주장이 있다면, 간 단한 쪽을 선택하라. 통계학의 유 의성 검정, 유의하지 않은 설명변 수 제거의 근거가 된다. 섹션 1 개요 개념 1) 경험이나 이론에 의해 종속변수에 영향을 미칠 것 같은 설명변수를

More information

14.531~539(08-037).fm

14.531~539(08-037).fm G Journal of the Korea Concrete Institute Vol. 20, No. 4, pp. 531~539, August, 2008 š x y w m š gj p { sƒ z 1) * 1) w w Evaluation of Flexural Strength for Normal and High Strength Concrete with Hooked

More information

제 4 장회귀분석

제 4 장회귀분석 회귀의역사적유래 (historical origin of the regression) 회귀 (regression) 라는용어는유전학자 Francis Galton(1886) 에의해처음사용된데서유래함. 그의논문에서 비정상적으로크거나작은부모의아이들키는전체인구의평균신장을향해움직이거나회귀 (regression) 하는경향이있다. 고주장 회귀의역사적유래 (historical

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 제 4 장 회귀분석 Chapter 4 Regression Analysis 차례 4.1 선형회귀분석 (Linear Regression Analysis) 4.2 로지스틱회귀분석 (Logistic Regression Analysis) 4.3 회귀분석의특징과제약 4.4 분석사례

More information

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드] 제 11 강 111 자기상관 Autocorrelation 자기상관의본질 11 유효성 (efficiency, accurate estimation/prediction) 을위해서는모든체계적인정보가회귀모형에체화되어있어야함 표본의무작위성 (randomness) 은서로다른관측치들에대한오차항들이상관되어있지말아야함을의미함 자기상관 (Autocorrelation) 은이러한표본의무작위성을위반하게만드는오차항에있는체계적패턴임

More information

전립선암발생률추정과관련요인분석 : The Korean Cancer Prevention Study-II (KCPS-II)

전립선암발생률추정과관련요인분석 : The Korean Cancer Prevention Study-II (KCPS-II) 전립선암발생률추정과관련요인분석 : The Korean Cancer Prevention Study-II (KCPS-II) 전립선암발생률추정과관련요인분석 : The Korean Cancer Prevention Study-II (KCPS-II) - i - - ii - - iii - - iv - - v - - vi - - vii - - viii - - ix - -

More information

R t-..

R t-.. R 과데이터분석 집단의차이비교 t- 검정 양창모 청주교육대학교컴퓨터교육과 2015 년겨울 t- 검정 변수의값이연속적이고정규분포를따른다고할때사용 t.test() 는모평균과모평균의 95% 신뢰구간을추청함과동시에가설검증을수행한다. 모평균의구간추정 - 일표본 t- 검정 이가설검정의귀무가설은 모평균이 0 이다 라는귀무가설이다. > x t.test(x)

More information

nonpara6.PDF

nonpara6.PDF 6 One-way layout 3 (oneway layout) k k y y y y n n y y K yn y y n n y y K yn k y k y k yknk n k yk yk K y nk (grand mean) (SST) (SStr: ) (SSE= SST-SStr), ( 39 ) ( )(rato) F- (normalty assumpton), Medan,

More information

Microsoft PowerPoint - LM 2014s_Ch4.pptx

Microsoft PowerPoint - LM 2014s_Ch4.pptx 1. 회귀모형및가정 모형설명 선형 linearity 함수 (,,,, ) 회귀계수 : 모수, unknown but fixed 절편 : y-축을통과하는곳 기울기 : 편미분, 한단위증가 p개의설명변수 들은결정변수 ( 확률변수아님 ) 종속변수만확률변수 모형 설명변수개수 p 개 관측치개수 n, 1,2,, ~ 0, ( 행렬 ),, 가정 ~ 0, 정규성 normality

More information

슬라이드 1

슬라이드 1 Principles of Econometrics (3e) Ch. 6 다중회귀모형에관한 추가적인논의 013 년 1 학기 윤성민 6장의주요내용 다중회귀모형의모수에관한둘이상의가설로구성된귀무가설을동시에검정하는경우 ( 결합가설의검정 ) F-검정 표본의정보이외에비표본정보도함께이용하는경우 제한최소제곱법 모형설정의오류를찾는방법 RESET 검정 다중공선성문제의탐지와해결방법

More information

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형 M-Plus 의활용 - 기본모형과예제명령어 - 성신여자대학교 심리학과 조영일, Ph.D. 2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형 3 / 27 1. M-plus 란? 기본정보 M-plus 는구조방정식모형과종단자료분석 ( 잠재성장모형 ) 의분석에사용되기위해서고안된프로그램임.

More information

Microsoft PowerPoint - Info R(3) pptx

Microsoft PowerPoint - Info R(3) pptx Coelaton Analyss 개념 Bvaate analyss 측정형두변수간의관계분석 상관관계? 두측정형변수의산점도 : 상호직선적관련성을상관계수 (Coelaton Coeffcent 측정. 잠재설명 ( 원인 변수 (X s 상관관계, 잠재변인과결과변수 (Y 의상관관계 Peason 상관계수 측정형변수직선관계정도 cov( X, Y E( X E( X E( Y E( Y

More information

<31372DB9DABAB4C8A32E687770>

<31372DB9DABAB4C8A32E687770> 김경환 박병호 충북대학교 도시공학과 (2010. 5. 27. 접수 / 2011. 11. 23. 채택) Developing the Traffic Severity by Type Kyung-Hwan Kim Byung Ho Park Department of Urban Engineering, Chungbuk National University (Received May

More information

nonpara1.PDF

nonpara1.PDF Chapter 1 Introduction 1 Introduction (parameter) (assumption) (rank), (median) p-value distribution free, assumption free, statistical inference based on ranks 11 Nonparametric? John Arbuthnot (1710)

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

제 1 부 연구 개요

제 1 부  연구 개요 2 출 문 차 1 부 과업의 개요 25 귀하 1 장 과업의 목적 27 1. 과업의 목적 및 목표 27 보고서를 2012년도 한돈자조금 성과분석 및 향후 사업방향 수립에 관한 연구 용역의 최종보고서로 제출합니다. 2013년 2월 제 2 장 주요 과업 내용 29 1. 과업 진행 과정 29 2. 과정별 수행 방법 30 가. 한돈자조금사업의 경제적 성과분석 30 나.

More information

확률과통계 강의자료-1.hwp

확률과통계 강의자료-1.hwp 1. 통계학이란? 1.1 수학적 모형 실험 또는 증명을 통하여 자연현상을 분석하기 위한 수학적인 모형 1 결정모형 (deterministic model) - 뉴톤의 운동방정식 : - 보일-샤를의 법칙 : 일정량의 기체의 부피( )는 절대 온도()에 정비례하고, 압력( )에 반비례한다. 2 확률모형 (probabilistic model) - 주사위를 던질 때

More information

MATLAB for C/C++ Programmers

MATLAB for C/C++ Programmers 오늘강의내용 (2014/01/16) 회귀분석 1 회귀분석 (Regression Analysis) 2 회귀분석 회귀분석이란? 연관된변수들간의관계를찾는통계적방법 즉, 어떠한변수 x가변수 Y에함수관계를통해영향을미친다는것을찾아내는것 예를들어 강우량 ( 변수 x) 이곡물의수확량 ( 변수 Y) 에미치는영향 화학공정의수율 ( 변수 x) 이촉매의사용량 ( 변수 Y) 에따라어떻게변하는지..

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 15 장공분산분석 1. 공분산분석의통계적모형 2. 공분산분석에의한처리효과검정 3. 공분산분석과정 - 실습 - 회귀분석 두확률변수간에관계가있는지검정

More information

Chapter 11 비모수 및 무분포통계학

Chapter 11 비모수 및 무분포통계학 Chapter 12 비모수통계학 (nonparametric analysis) 2017/6/5 9.1 머리말 (introduction) 모수적방법 모집단의분포를가정 그분포는모수의함수 모수를알면분포를완전히안다. 모수의추정과검정이주요문제 모집단의분포가정이틀리면전체논리가다틀리게된다. Parametric approach * assumes dist n of the pop

More information

<C8A3C5DABBEABEF720B0E6B1E2B5BFC7E220BFB9C3F820B8F0B5A8BFA120B4EBC7D120BFACB1B85FC3D6C1BE28C7D1C3A2BFB1292E687770>

<C8A3C5DABBEABEF720B0E6B1E2B5BFC7E220BFB9C3F820B8F0B5A8BFA120B4EBC7D120BFACB1B85FC3D6C1BE28C7D1C3A2BFB1292E687770> 碩 士 學 位 論 文 호텔산업 경기동향 예측 모델에 대한 연구 - 월별 계절성 더미변수를 활용한 다중회귀모형을 적용 - 2016 年 2 月 韓 南 大 學 校 社 會 文 化 行 政 福 祉 大 學 院 情 報 統 計 學 科 韓 昌 燁 호텔산업 경기동향 예측 모델에 대한 연구 - 월별 계절성 더미변수를 활용한 다중회귀모형을 적용 - 指 導 敎 授 김 명 준 이 論

More information

<3136C1FD31C8A35FC3D6BCBAC8A3BFDC5F706466BAAFC8AFBFE4C3BB2E687770>

<3136C1FD31C8A35FC3D6BCBAC8A3BFDC5F706466BAAFC8AFBFE4C3BB2E687770> 부동산학연구 제16집 제1호, 2010. 3, pp. 117~130 Journal of the Korea Real Estate Analysts Association Vol.16, No.1, 2010. 3, pp. 117~130 비선형 Mankiw-Weil 주택수요 모형 - 수도권 지역을 대상으로 - Non-Linear Mankiw-Weil Model on Housing

More information

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 - 에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 - . - 2 - . 1. - 3 - [ 그림 1] 도시가스수요와실질 GDP 추이 - 4 - - 5 - - 6 - < 표 1>

More information

012임수진

012임수진 Received : 2012. 11. 27 Reviewed : 2012. 12. 10 Accepted : 2012. 12. 12 A Clinical Study on Effect of Electro-acupuncture Treatment for Low Back Pain and Radicular Pain in Patients Diagnosed with Lumbar

More information

비선형으로의 확장

비선형으로의 확장 비선형으로의확장 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 비선형으로의확장 1 / 30 개요 선형모형은해석과추론에장점이있는반면예측력은제한됨능형회귀, lasso, PCR 등의방법은선형모형을이용하는방법으로모형의복잡도를감소시켜추정치의분산을줄이는효과가있음해석력을유지하면서비선형으로확장다항회귀 (polynomial regression): ( 예 )

More information

- 1 -

- 1 - - 1 - External Shocks and the Heterogeneous Autoregressive Model of Realized Volatility Abstract: We examine the information effect of external shocks on the realized volatility based on the HAR-RV (heterogeneous

More information

<B0A3C3DFB0E828C0DBBEF7292E687770>

<B0A3C3DFB0E828C0DBBEF7292E687770> 초청연자특강 대구가톨릭의대의학통계학교실 Meta analysis ( 메타분석 ) 예1) The effect of interferon on development of hepatocellular carcinoma in patients with chronic hepatitis B virus infection?? -:> 1998.1 ~2007.12.31 / RCT(2),

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA The e-business Studies Volume 17, Number 4, August, 30, 2016:319~332 Received: 2016/07/28, Accepted: 2016/08/28 Revised: 2016/08/27, Published: 2016/08/30 [ABSTRACT] This paper examined what determina

More information

http://www.kbc.go.kr/pds/2.html Abstract Exploring the Relationship Between the Traditional Media Use and the Internet Use Mee-Eun Kang This study examines the relationship between

More information

고객관계를 리드하는 서비스 리더십 전략

고객관계를 리드하는  서비스 리더십 전략 제 13 장분산분석 1 13.1 일원분산분석 13. 분산분석 - 무작위블럭디자인 13.3 이원분산분석 - 팩토리얼디자인 분산분석 (ANOVA) - 두개이상의집단들의평균값을비교하는데사용. 일원분산분석 - 처치변수가한개인분산분석. 1. 분산분석의원리 A 3.0 8.0 7.0 5.0 5.0 6.0 4.0 7.0 6.0 4.0 평균 5.0 6.0 B 3.0 9.0

More information

슬라이드 1

슬라이드 1 Prncples of Econometrcs (3e) 013 년 1 학기 윤성민 8.1. 이분산의본질 ( 예 ) 식료품지출 / 식료품지출과소득에관한 40 개표본 8.1 이분산의본질 3 8.1 이분산의본질 4 8.1 이분산의본질 동분산가정 5 8.1 이분산의본질 이분산가정 6 8.1

More information

22 장정규성검정과정규화변환 22.1 시각적방법 Q-Q 플롯과정규확률그림 Q-Q 플롯( 분위수- 분위수플롯, Quantile-Quantile plot) 은하나의자료셋이특정분포( 정규분 포나와이블분포등) 를따르는지또는두개의자료셋이같은모집단분포로부터나왔는지를

22 장정규성검정과정규화변환 22.1 시각적방법 Q-Q 플롯과정규확률그림 Q-Q 플롯( 분위수- 분위수플롯, Quantile-Quantile plot) 은하나의자료셋이특정분포( 정규분 포나와이블분포등) 를따르는지또는두개의자료셋이같은모집단분포로부터나왔는지를 22 장정규성검정과정규화변환 22.1 시각적방법 22.1.1 Q-Q 플롯과정규확률그림 Q-Q 플롯( 분위수- 분위수플롯, Quantile-Quantile plot) 은하나의자료셋이특정분포( 정규분 포나와이블분포등) 를따르는지또는두개의자료셋이같은모집단분포로부터나왔는지를 판단하는시각적분석방법이다. Q-Q 플롯은자료의분위수와특정( 이론적) 분포의분위수를구하여산점도로나타내거나,

More information

<4D6963726F736F667420576F7264202D20B1E2BBF3C5EBB0E85F36C0E55FC7D0BBFD2E646F6378>

<4D6963726F736F667420576F7264202D20B1E2BBF3C5EBB0E85F36C0E55FC7D0BBFD2E646F6378> 6. Relaton and Statstcal Weather Forecastng (관 계와 통계적인 일기예보) 6.1 Background 대기운동은 비선형이므로 결정론적인 의미에서 완벽하게 예측될 수 없다. 보완책으 로 통계적인 방법이 유용하고 예보의 일부로 사용된다. 1 수치예보모델 없이 순수하게 통계 모형만을 이용하는 경우 단시간 예보나 아주 긴 시간(수주이상)

More information

- i - - ii - - iii - - iv - - v - - 1 - - 2 - - 3 - - 4 - - 5 - - 6 - - 7 - - 8 - - 9 - - 10 - - 11 - - 12 - - 13 - - 14 - - 15 - - 16 - - 17 - - 18 - - 19 - α α - 20 - α α α α α α - 21 - - 22 - - 23 -

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

시스템경영과 구조방정식모형분석

시스템경영과 구조방정식모형분석 2 st SPSS OPEN HOUSE, 2009 년 6 월 24 일 AMOS 를이용한잠재성장모형 (Latent Growth Model ) 세명대학교경영학과김계수교수 (043) 649-242 gskim@semyung.ac.kr 목차. LGM개념소개 2. LGM모형종류 3. LGM 예제 4. 결과치비교 5. 정리및요약 2 적합모형의판단방법 Tips SEM 결과해석방법

More information

untitled

untitled 통계청 통계분석연구 제 3 권제 1 호 (98. 봄 ) 91-104 장기예측방법의비교 - 전도시소비자물가지수를중심으로 - 서두성 *, 최종후 ** 본논문의목적은소비자물가지수와같이시간의흐름에따라변동의폭이크지않은시계열자료의장기예측에있어서쉽고, 정확한예측모형을찾고자하는데에있다. 이를위하여네가지의장기예측방법 - 1회귀적방법 2Autoregressive error 방법

More information

(72) 발명자 정진곤 서울특별시 성북구 종암1동 54-398 이용훈 대전광역시 유성구 어은동 한빛아파트 122동 1301 호 - 2 -

(72) 발명자 정진곤 서울특별시 성북구 종암1동 54-398 이용훈 대전광역시 유성구 어은동 한빛아파트 122동 1301 호 - 2 - (51) Int. Cl. (19) 대한민국특허청(KR) (12) 등록특허공보(B1) H04B 7/04 (2006.01) H04B 7/02 (2006.01) H04L 1/02 (2006.01) (21) 출원번호 10-2007-0000175 (22) 출원일자 2007년01월02일 심사청구일자 2008년08월26일 (65) 공개번호 10-2008-0063590 (43)

More information

R&D : Ⅰ. R&D OECD 3. Ⅱ. R&D

R&D : Ⅰ. R&D OECD 3. Ⅱ. R&D R&D : 2012. 6. Ⅰ. R&D 1. 2. OECD 3. Ⅱ. R&D 1. 2. - 1 - Ⅰ. R&D R&D. R&D (TFP). R&D R&D, GDP R&D (Ha and Howitt, 2007). : (1), R&D. 1. ( )(), 1 ( ), ( ). (2) -, (Penn World Table 7.0) (growth accounting)

More information

Chapter 분포와 도수분석

Chapter 분포와 도수분석 2 χ Chapter 10 분포와도수분석 Chi-square dist n & the analysis of frequencies 2014/5/22 2 χ 10.2 분포의수리적특징 2 χ 의정의 (definition) Z,, Z ~ independent N(0,1) 1 n n i = 1 Z ~ χ 2 2 i n Y µ 2 eg.. Z = i Y ~ N( µσ,

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 13 장상관분석 1. 상관계수 2. 상관분석의가정과특성 3. 모상관계수의검정과신뢰한계 4. 순위상관 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 - 실습 - 상관분석 지금까지한가지확률변수에의한현상을검정하였다.

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA e- 비즈니스연구 (The e-business Studies) Volume 17, Number 1, February, 28, 2016:pp. 3~30 ISSN 1229-9936 (Print), ISSN 2466-1716 (Online) 원고접수일심사 ( 수정 ) 게재확정일 2016. 01. 08 2016. 01. 09 2016. 02. 25 ABSTRACT

More information

에너지경제연구 제13권 제1호

에너지경제연구 제13권 제1호 에너지경제연구 Korean Energy Economic Review Volume 13, Number 1, March 2014 : pp. 23~56 거시계량모형을이용한전력요금 파급효과분석 * 23 24 25 26 < 표 1> OECD 전력요금수준 ( 단위 : $/MWh) 27 28 < 표 2> 모형의구성 29 30 31 [ 그림 1] 연립방정식모형의개요 32

More information

<4D F736F F F696E74202D FC0E5B4DCB1E220BCF6BFE4BFB9C3F8205BC8A3C8AF20B8F0B5E55D>

<4D F736F F F696E74202D FC0E5B4DCB1E220BCF6BFE4BFB9C3F8205BC8A3C8AF20B8F0B5E55D> 생산관리론 장단기수요예측 서강대학교경영학부 경영전문대학원교수서창적 -1-1 학습내용 수요예측기법 예측오차의측정과통제 수요예측기법의선정 수요예측의의의 수요예측 (demand forecasting) 이란? 기업의제품과서비스에대한수요의양과시기를예측하는것 수요예측이이루어지면수요를충족시키기위해필요한자원에대한예측이이루어지는데이는구매되는부품과원자재뿐만아니라기업의설비, 기계,

More information

1..

1.. Volume 12, Number 1, 6~16, Factors influencing consultation time and waiting time of ambulatory patients in a tertiary teaching hospital Jee-In Hwang College of Nursing Science, Kyung Hee University :

More information

- iii - - i - - ii - - iii - 국문요약 종합병원남자간호사가지각하는조직공정성 사회정체성과 조직시민행동과의관계 - iv - - v - - 1 - - 2 - - 3 - - 4 - - 5 - - 6 - - 7 - - 8 - - 9 - - 10 - - 11 - - 12 - - 13 - - 14 - α α α α - 15 - α α α α α α

More information

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re EMF Health Effect 2003 10 20 21-29 2-10 - - ( ) area spot measurement - - 1 (Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern

More information

OR MS와 응용-03장

OR MS와 응용-03장 o R M s graphical solution algebraic method ellipsoid algorithm Karmarkar 97 George B Dantzig 979 Khachian Karmarkar 98 Karmarkar interior-point algorithm o R 08 gallon 000 000 00 60 g 0g X : : X : : Ms

More information

1 1 Department of Statistics University of Seoul August 29, 2017 T-test T 검정은스튜던트 t 통계량의분포를귀무가설하에서살펴봄으러써가설의기각여부를결정하는의사결정모형임 검정 : X i iid N(µ, σ 2 ) 이라고가정하고, 귀무가설과대립가설을아래와같이놓자. 귀무가설즉, µ = µ 0 하에서 H : µ

More information

歯1.PDF

歯1.PDF 200176 .,.,.,. 5... 1/2. /. / 2. . 293.33 (54.32%), 65.54(12.13%), / 53.80(9.96%), 25.60(4.74%), 5.22(0.97%). / 3 S (1997)14.59% (1971) 10%, (1977).5%~11.5%, (1986)

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 - 1. 분산분석 2. 회귀분석 준비 R과 R studio 설치 https://cran.r-project.org/bin/windows/base/ R 다운로드후설치 https://www.rstudio.com/products/rstudio/download/#download

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA The e-business Studies Volume 17, Number 6, December, 30, 2016:275~289 Received: 2016/12/02, Accepted: 2016/12/22 Revised: 2016/12/20, Published: 2016/12/30 [ABSTRACT] SNS is used in various fields. Although

More information

Microsoft Word - sbe13_reg.docx

Microsoft Word - sbe13_reg.docx Statstcs 4 Busness and Economcs (Regresson) 상관계수 상관계수정의 두변수간의선형관계정도를나타내는값 COV ( X, Y ) E( X E( X ))( Y E( Y )) 정의 : V ( X ) V ( Y ) V ( X ) V ( Y ) 표본상관계수 : r ˆ ( ( x ( x x) x) ( x x x)( y x)( y /( n 1)

More information

Orcad Capture 9.x

Orcad Capture 9.x OrCAD Capture Workbook (Ver 10.xx) 0 Capture 1 2 3 Capture for window 4.opj ( OrCAD Project file) Design file Programe link file..dsn (OrCAD Design file) Design file..olb (OrCAD Library file) file..upd

More information

서론 34 2

서론 34 2 34 2 Journal of the Korean Society of Health Information and Health Statistics Volume 34, Number 2, 2009, pp. 165 176 165 진은희 A Study on Health related Action Rates of Dietary Guidelines and Pattern of

More information

Microsoft Word - ch2_simple.doc

Microsoft Word - ch2_simple.doc REGRESSION / 장. 단순회귀 0 Chapter 단순회귀 회귀분석은종속변수 ( Y ) 와설명변수들 ( X 1, X,..., X p, 독립변수 ) 과관계를분석하는도 구이다. (1) 모형에설정된설명변수들의유의성검정?( 모형과회귀계수의유의성검정 ) () 유의한설명변수중종속변수에영향력이가장큰변수는무엇인가?( 표준화회귀계수 ) (3) 그리고설명변수값들이주어진경우종속변수의예측치는?

More information

DIY 챗봇 - LangCon

DIY 챗봇 - LangCon without Chatbot Builder & Deep Learning bage79@gmail.com Chatbot Builder (=Dialogue Manager),. We need different chatbot builders for various chatbot services. Chatbot builders can t call some external

More information

<3130C0E5>

<3130C0E5> Redundancy Adding extra bits for detecting or correcting errors at the destination Types of Errors Single-Bit Error Only one bit of a given data unit is changed Burst Error Two or more bits in the data

More information

09È«¼®¿µ 5~152s

09È«¼®¿µ5~152s Korean Journal of Remote Sensing, Vol.23, No.2, 2007, pp.45~52 Measurement of Backscattering Coefficients of Rice Canopy Using a Ground Polarimetric Scatterometer System Suk-Young Hong*, Jin-Young Hong**,

More information

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63> 제 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics) 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion) 고검정 (es) 하는학문 거시소비함수 (Keynse). C=f(Y), 0

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 9 주차 예측모형에대한평가 Assessment of Predictive Model 최종후, 강현철 차례 6. 모형평가의기본개념 6.2 모델비교 (Model Comparison) 노드 6.3 임계치 (Cutoff) 노드 6.4 의사결정 (Decisions) 노드 6.5 기타모형화노드들

More information

Jeeshim & KUCC625 (08/04/2009) Statistical Data Analysis Using R:22 6. 집단간평균비교 집단간평균을비교하는것은기본방법이다. 따라서비교할변수는평균을계산할수있어야하고, 의미있게해석할수있어야한다. 두집단

Jeeshim & KUCC625 (08/04/2009) Statistical Data Analysis Using R:22 6. 집단간평균비교 집단간평균을비교하는것은기본방법이다. 따라서비교할변수는평균을계산할수있어야하고, 의미있게해석할수있어야한다. 두집단 2008-2009 Jeeshim & KUCC625 (08/04/2009) Statistical Data Analysis Using R:22 6. 집단간평균비교 집단간평균을비교하는것은기본방법이다. 따라서비교할변수는평균을계산할수있어야하고, 의미있게해석할수있어야한다. 두집단을비교하는것은 T-test 로, 두집단이상이라면 ANOVA 를사용한다. 그림 6.1 은 T-test

More information

슬라이드 1

슬라이드 1 Principle of Econometric (3e) 03 년 학기 윤성민 .0 서론 연립방정식모형 - 둘이상의종속변수가있는일련의방정식들로구성 OLS로추정하면부적절함 새로운추정방법필요 - 연립방정식추정법은계량경제학이통계학의회귀분석기법을넘어서는학문이라는것을보여주는분야이기도함 . 공급및수요모형 Demand: Supply: Q=α P+α X + e Q=β P+ e

More information

歯4차학술대회원고(장지연).PDF

歯4차학술대회원고(장지연).PDF * 1)., Heckman Selection. 50.,. 1990 40, -. I.,., (the young old) (active aging). 1/3. 55 60 70.,. 2001 55 64 55%, 60%,,. 65 75%. 55 64 25%, 32% , 65 55%, 53% (, 2001)... 1998, 8% 41.5% ( 1998). 2002 7.8%

More information

- i - - ii - - iii - - iv - - v - - vi - - 1 - - 2 - - 3 - 1) 통계청고시제 2010-150 호 (2010.7.6 개정, 2011.1.1 시행 ) - 4 - 요양급여의적용기준및방법에관한세부사항에따른골밀도검사기준 (2007 년 11 월 1 일시행 ) - 5 - - 6 - - 7 - - 8 - - 9 - - 10 -

More information

Abstract Musculoskeletal Symptoms and Related Factors for Nurses and Radiological Technologists Wearing a Lead Apron for Radiation Pro t e c t i o n Jung-Im Yoo, Jung-Wan Koo 1 ) Angio Unit, Team of Radiology,

More information

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63> 제 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구 Siamese Neural Network 박천음 강원대학교 Intelligent Software Lab. Intelligent Software Lab. Intro. S2Net Siamese Neural Network(S2Net) 입력 text 들을 concept vector 로표현하기위함에기반 즉, similarity 를위해가중치가부여된 vector 로표현

More information

Microsoft Word - skku_TS2.docx

Microsoft Word - skku_TS2.docx Statistical Package & Statistics Univariate : Time Series Data () ARMA 개념 ARIMA(Auto-Regressive Integrated Moving-Average) 모형은시계열데이터 { Y t } 의과거치 (previous observation Y t 1,,... ) 들이설명변수인 AR 과과거의오차항 (

More information

Buy one get one with discount promotional strategy

Buy one get one with discount promotional strategy Buy one get one with discount Promotional Strategy Kyong-Kuk Kim, Chi-Ghun Lee and Sunggyun Park ISysE Department, FEG 002079 Contents Introduction Literature Review Model Solution Further research 2 ISysE

More information

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770> 자연과학연구 제27권 Bulletin of the Natural Sciences Vol. 27. 2013.12.(33-44) 교통DB를 이용한 교통정책 발굴을 위한 통계분석 시스템 설계 및 활용 Statistical analytic system design and utilization for transport policy excavation by transport

More information

Microsoft Word - SAS_Data Manipulate.docx

Microsoft Word - SAS_Data Manipulate.docx 수학계산관련 함수 함수 형태 내용 SIN(argument) TAN(argument) EXP( 변수명 ) SIN 값을계산 -1 argument 1 TAN 값을계산, -1 argument 1 지수함수로지수값을계산한다 SQRT( 변수명 ) 제곱근값을계산한다 제곱은 x**(1/3) = 3 x x 1/ 3 x**2, 세제곱근 LOG( 변수명 ) LOGN( 변수명 )

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA The e-business Studies Volume 17, Number 6, December, 30, 2016:237~251 Received: 2016/11/20, Accepted: 2016/12/24 Revised: 2016/12/21, Published: 2016/12/30 [ABSTRACT] Recently, there is an increasing

More information