SPSS 를이용한반복측정및종 단자료의분석 : 다층모형을중심으로 장승민 한림대학교심리학과
강의순서 반복측정자료분석의기초 반복측정자료의이해 반복측정자료분석을위한기본모형 다층모형을이용한종단자료분석 다층성장모형 SPSS를이용한분석예제 질의응답 010 년핚국심리학회연차학술대회
1 강 : 반복측정자료분석의기초
반복측정 반복측정 - 하나이상의변인을동일한대상에대해여러번에걸쳐반복적으로관찰, 측정 실험연구및종단연구에서널리사용 장점 실용적, 통계적효율성 + 연구주제의확장 단점 엄밀한설계와적절한분석절차의사용이필요 010 년핚국심리학회연차학술대회 4
반복측정자료의예 McCarthy 아동능력척도중아동의인지능력점수에대한가상자료 1 명의아동들의인지능력을 30, 36, 4, 48 개월에각각측정한것으로가정 Age (Months) Subject 30 36 4 48 1 108 96 110 1 103 117 17 133 3 96 107 106 107 4 84 85 9 99 5 118 15 15 116 6 110 107 96 91 7 19 18 13 18 8 90 84 101 113 9 84 104 100 88 10 96 100 103 105 11 105 114 105 11 1 113 117 13 130 010 년핚국심리학회연차학술대회 5
반복측정자료의탐색 기술통계량 평균 표준편차 N months30 103.00 13.711 1 months36 107.00 14.161 1 months4 110.00 13.34 1 months48 11.00 14.765 1 010 년핚국심리학회연차학술대회 6
반복측정자료의탐색 ( 예 A) months30 months36 months4 months48 months30 months36 months4 months48 Pearson 상관계수 1.795 **.696 *.599 * 유의확률 ( 양쪽 ).00.01.040 제곱합및교차곱 068.000 1698.000 1401.000 1333.000 공분산 188.000 154.364 17.364 11.18 N 1 1 1 1 Pearson 상관계수.795 ** 1.760 **.466 유의확률 ( 양쪽 ).00.004.17 제곱합및교차곱 1698.000 06.000 1580.000 107.000 공분산 154.364 00.545 143.636 97.455 N 1 1 1 1 Pearson 상관계수.696 *.760 ** 1.853 ** 유의확률 ( 양쪽 ).01.004.000 제곱합및교차곱 1401.000 1580.000 1958.000 1849.000 공분산 17.364 143.636 178.000 168.091 N 1 1 1 1 Pearson 상관계수.599 *.466.853 ** 1 유의확률 ( 양쪽 ).040.17.000 제곱합및교차곱 1333.000 107.000 1849.000 398.000 공분산 11.18 97.455 168.091 18.000 N 1 1 1 1 010 년핚국심리학회연차학술대회 7
반복측정자료의분석 반복측정자료의특징 관찰값간의상관 ( 공분산 ) 모집의 ( 오차 ) 공분산구조에대한가정이필요 ( 오차 ) 공분산의원인 수준의개인차 효과의개인차 시간효과 비구조적원인 우연 ( 표집오차 ) 반복측정자료분석을위한기본모형 대응표본 t- 검정 일변량 ( 혼합 ) 분산분석 다변량분석 고급통계모형 다층모형 (MLM) 구조방정식모형 (SEM) 일반화추정방정식 (GEE) 010 년핚국심리학회연차학술대회 8
대표적인공분산구조 항등 (IDentity) 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 대각 (DIAGonal) 1 0 0 0 0 0 0 0 0 3 0 0 0 0 4 복합대칭 (Compound Symmetry) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 1 010 년핚국심리학회연차학술대회 9
대표적인공분산구조 ToePlitz 1 3 1 1 1 1 3 1 1 1 3 1 3 1 1 1 1 1 1 1 AR(1)(First-order Autoregressive) 3 1 1 3 1 1 비구조 (UNstructured) 1 1 31 41 1 3 4 31 3 3 43 41 4 43 4 010 년핚국심리학회연차학술대회 10
기타공분산구조 상관계수표현형 CSR, UNR 이분산형 CSH, ARH1, TPH 분산요소 (Variance Components) 기타 ARMA1, AD1, FA1, FAH1, HF, Spatial 공분산구조들 010 년핚국심리학회연차학술대회 11
일변량혼합모형을이용한분석 전통적인반복측정분산분석의가정 오차공분산의구형성 (Sphericity) 구형성의정의 차이점수의분산동질성 더정확히는변형된차이점수집합 ( 직교정규하는 orthonormal 차이점수의대비계수집합 ) 의오차공분산이항등구조를갖는다는뜻 모형의오차공분산이복합대칭 (CS) 구조를갖는다는것과거의같은의미 실질적으로는반복측정된변인의전반적인수준에안정적인개인차가있음을함의 구형성 복합대칭 010 년핚국심리학회연차학술대회 1
일변량혼합모형을이용한분석 010 년핚국심리학회연차학술대회 13
일변량혼합모형을이용한분석 고정요인 ( 효과 ) 연구자의관심이연구에사용된요인의수준에한정되어있는경우 ( 예 : 성차, 계절차 ) 임의요인 ( 효과 ) 연구자의관심이연구에사용된요인의수준을넘어서는경우 ( 예, 채점자효과, 실험자효과, 개인차 ) 반복측정분산분석은피험자를임의요인으로간주함으로써개인이측정변인의전반적수준에서갖는차이 ( 개인차 - 피험자효과 ) 를모형에포함시켜모집의오차공분산구조를복합대칭구조로가정한다. 전통적인반복측정분산분석모형은고정요인 ( 조건, 시간 ) 과임의요인 ( 피험자 ) 을함께포함한다는측면에서 ( 일변량 ) 혼합모형으로불린다. 010 년핚국심리학회연차학술대회 14
구형성검증 반복측정의수준이 일때 : 구형성가정항상타당 수준이 3 이상일때 : Mauchly 의구형성검증법 일반적으로구형성에서벗어난정도를고려하여 F 검증의자유도를조정하는방식을선호 Mauchly 의구형성검정 b 개체 - 내효과 Mauchly 의 W 근사카이제곱자유도유의확률 Greenhouse- Geisser 엡실런 a Huynh- Feldt 하한값 dimension1 요인 1.43 13.768 5.018.610.75.333 정규화된변형종속변수의오차공분산행렬이단위행렬에비례하는영가설을검정합니다. a. 유의성평균검정의자유도를조절할때사용할수있습니다. 수정된검정은개체내효과검정표에나타납니다. b. Design: 절편, 개체 - 내계획 : 요인 1 010 년핚국심리학회연차학술대회 15
일변량혼합모형을이용한분석 ( 예 ) 개체-내효과검정 소스 제 III 유형 제곱합 자유도 평균제곱 F 유의확률 요인1 구형성가정 55.000 3 184.000 3.07.043 Greenhouse-Geisser 55.000 1.89 301.865 3.07.075 Huynh-Feldt 55.000.175 53.846 3.07.064 하한값 55.000 1.000 55.000 3.07.110 오차 ( 요인1) 구형성가정 006.000 33 60.788 Greenhouse-Geisser 006.000 0.115 99.77 Huynh-Feldt 006.000 3.90 83.863 하한값 006.000 11.000 18.364 개체-내대비검정 소스 요인1 제 III 유형제곱합 자유도 평균제곱 F 유의확률 요인1 선형모형 540.000 1 540.000 5.04.047 차모형 1.000 1 1.000.19.649 3차모형.000 1.000.000 1.000 오차 ( 요인1) 선형모형 118.400 11 107.491 차모형 604.000 11 54.909 3차모형 19.600 11 19.964 010 년핚국심리학회연차학술대회 16
다변량분석 공분산의구형성이위배될때사용할수있는대안은다변량분석을사용하는것 다변량분석은오차공분산구조에대한특정형식을가정하지않음 비구조행렬 ( 정규직교하는 ) 변형된차이점수집합의오차공분산의모든정보 ( 분산및공분산 ) 를이용하여검증 비교 ) 일변량접근은위공분산의 ( 항등 ) 분산값만을이용 네가지검증법이있으며일반적으로모형에수준이셋이상인개인간변인이포함되면서로다른결과산출 010 년핚국심리학회연차학술대회 17
다변량분석 ( 예 ) 다변량검정 b 효과값 F 가설자유도 오차자유도 유의확률 요인 1 a. 정확한통계량 Pillai 의트레이스.47.40 a 3.000 9.000.153 Wilks 의람다.573.40 a 3.000 9.000.153 Hotelling 의트레이스.747.40 a 3.000 9.000.153 Roy 의최대근.747.40 a 3.000 9.000.153 b. Design: 절편, 개체 - 내계획 : 요인 1 010 년핚국심리학회연차학술대회 18
일변량접근과다변량접근의비교 모집오차공분산이구형성을만족시킬때는일변량접근법의검증력 (power) 이더높다. 구형성에위배되는경우자유도조정법을사용하거나다변량접근법을사용할수있다. 구형성에위배되는경우일반적으로다변량접근법이더우수하다. 피험자의수가반복측정의수보다적을경우다변량접근법은사용할수없으며많더라도그차이가크지않은경우는오차공분산의구조에따라일변량접근법이우수한경우들이있다. 010 년핚국심리학회연차학술대회 19
여전히남는문제들 두접근법은오차공분산의구조를각각복합대칭과비구조로한정하나두구조이외에반복측정값간의공분산을더잘설명하는대안적인구조들이가능 두접근법모두반복측정시중도누락등에의해발생하는결측값이생기면해당피험자의자료모두사용할수없음. 다층모형 ( 또는혼합모형 ) 은다양한공분산구조를모형화할수있고이들중어느것이더자료를잘반영하는지통계적으로비교검증할수있음 또한결측값을갖는피험자의나머지자료를모두이용할수있음 010 년핚국심리학회연차학술대회 0
강 : 다층모형을이용한종단자료 분석
010 년핚국심리학회연차학술대회
일반선형모형 (General Linear Model) Regression/ANOVA/MANOVA/ y x e i 0 1 i i e N i i d i ~ (0, )[,, ] b b X 0 1 010 년핚국심리학회연차학술대회 3
계수의해석 β 0 : 절편, x 의값이 0 일때기대되는 y 값 β 1 : 기울기, x 가 1 단위증가할때기대되는 y 값의변화량 x 의변화가 y 의기대값의변화에미치는영향의크기 x 가 0 과 1 로표현된범주형변인일때 β 0 : x=0으로지정된집단의 y값의평균 β 1 : x=1로지정된집단의 y값의평균과 x=0으로지정된집단의 y값의평균의차이 예언변인이여럿일때 β 0 : 모든예언변인의값이 0일때기대되는 y값 β 1 : 모형에포함된다른예언변인들을고정 ( 효과를통제 ) 했을때 x의변화가 y의기대값의변화에미치는영향의크기 010 년핚국심리학회연차학술대회 4
일반선형모형의추정법 최소자승법 (Least Square): 잔차제곱의합을최소화 Ordinary Least Squares(OLS) 가정된오차공분산의구조 : 항등행렬 (i.i.d) Regression, t-test, ANOVA Weighted Least Squares(WLS) 가정된오차공분산의구조 : 대각행렬 WLS Regression Generalized Least Squares(GLS) 가정된오차공분산의구조 : 비구조행렬 (or 일반대칭행렬 ) Multivariate Analysis (e.g., MANOVA) + 구간추정및가설검증을위해정규분포를가정 010 년핚국심리학회연차학술대회 5
다층모형 (Multilevel Model) 다른이름들 Hierarchical linear model(hlm) Linear mixed model Random effects model 종단자료와같이위계적혹은다층적구조를갖는자료에적합한통계모형 Students within classrooms Siblings within families Workers within companies Repeated measures within individuals 010 년핚국심리학회연차학술대회 6
다층모형의방정식 y z e ij 0i 1i ij ij u 0i 00 0i u 1i 10 1i y z u u z e ij 00 10 ij 0i 1i ij ij E Var ui 0 ei 0 ui Gi 0 ei 0 Ri G R i i 00 I 01 11 i 010 년핚국심리학회연차학술대회 7
계수의해석 β 0i 임의집단 i의절편 ( 임의효과 ) β 1i 임의집단 i의기울기, z값의변화가 y의기대값의변화에미치는효과 ( 임의효과 ) γ 00 임의집단전체의절편의 ( 가중 ) 평균 ( 고정효과 ) γ 10 임의집단전체의 z의기대효과의 ( 가중 ) 평균 ( 고정효과 ) τ 00 β 0i ( 혹은 u 0i ) 의분산 τ 11 β 1i ( 혹은 u 1i ) 의분산 τ 01 β 1i 과 β 1i ( 혹은 u 0i 과 u 1i ) 의공분산 σ 집단내오차의분산 010 년핚국심리학회연차학술대회 8
다층모형의추정법 공분산성분의추정 최대우도법 (Maximum Likelihood: ML): 우도를최대화 * 우도 : 어떤모형 ( 모수추정치 + 분포 ) 이가정되었을때주어진자료가얻어질확률 ML, REML(Restricted ML) 고정효과의추정 GLS 공분산성분의추정과고정효과추정은각각다른하나가주어졌을때가능하기때문에상호반복적으로추정값들이수렴될때까지계속됨 010 년핚국심리학회연차학술대회 9
다층모형에서공분산의모형화 y z e ij 0i 1i ij ij u 0i 00 0i u 1i 10 1i y z u u z e ij 00 10 ij 0i 1i ij ij E Var ui 0 ei 0 ui Gi 0 ei 0 Ri 다층모형에서는공분산 Σ i 을임의효과의공분산 G i 와오 차공분산 R i 의결합에의해모형화 Σ = Z G Z + R i i i i i 010 년핚국심리학회연차학술대회 30
다층모형의특징 ( 장점 ) 상위수준 ( 예컨대개인 ) 에속한하위수준관찰값 ( 반복측정값 ) 들간의유사성 (ICC, 임의효과 ) and/or 여러형태의오차공분산구조를반영 종속변인에영향을미치는공변인 ( 예측변인 ) 들을각수준에서모형화가능 예측변인의효과와더불어그효과의개인차추정 반복측정자료 ( 종단자료 ) 의분석에널리사용됨 종단자료분석시개인에속한관찰값의수나관찰시점에서차이가있어도분석가능 ( 결측치 ) 010 년핚국심리학회연차학술대회 31
다층모형분석소프트웨어 범용통계프로그램 Proc mixed (in SAS) Mixed (in SPSS) 다층모형전문프로그램 HLM(6.08) MLwiN(.0) lme4 (for R).xtmixed (for STATA) 010 년핚국심리학회연차학술대회 3
다층모형적용예제 (CS) 복합대칭구조의이용 ( 임의절편모형 ) 복합대칭구조를정의하는두가지방법 Σ = Z G Z + R i i i i i 1. G i = 영행렬, R i =CS. G i = 임의절편, R i = 항등 0i 00 u0i 1i 10 복합대칭 (Compound Symmetry) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 1 010 년핚국심리학회연차학술대회 33
다층모형적용예제 (CS) G i = 영행렬, R i =CS G i = 임의절편, R i = 항등 제3 유형고정효과검정 a 소스 분자 df 분모 df F 유의확률 절편 1 11.000 99.739.000 Age 3 33.000 3.07.043 a. 종속변수 : score. 제3 유형고정효과검정 a 소스 분자 df 분모 df F 유의확률 절편 1 11.000 99.739.000 Age 3 33.000 3.07.043 a. 종속변수 : score. 공분산모수추정값 a 모수 추정값 표준오차 반복측정 CS 대각선변위 60.787879 14.964941 CS 공분산 135.348485 64.30177 a. 종속변수 : score. 공분산모수추정값 a 모수 추정값 표준오차 잔차 60.787879 14.964941 절편 [ 개체 = id] 분산 135.348485 64.30177 a. 종속변수 : score. 010 년핚국심리학회연차학술대회 34
다층모형과일변량접근의비교 잔차공분산 (R) 행렬 a [Age = 1] [Age = ] [Age = 3] [Age = 4] [Age = 1] 196.136 135.348 135.348 135.348 [Age = ] 135.348 196.136 135.348 135.348 [Age = 3] 135.348 135.348 196.136 135.348 [Age = 4] 135.348 135.348 135.348 196.136 복합대칭 a. 종속변수 : score. 제 3 유형고정효과검정 a 소스분자 df 분모 df F 유의확률 절편 1 11.000 99.739.000 Age 3 33.000 3.07.043 a. 종속변수 : score. 개체-내효과검정 소스 제 III 유형 제곱합 자유도 평균제곱 F 유의확률 요인1 구형성가정 55.000 3 184.000 3.07.043 Greenhouse-Geisser 55.000 1.89 301.865 3.07.075 Huynh-Feldt 55.000.175 53.846 3.07.064 하한값 55.000 1.000 55.000 3.07.110 오차 ( 요인1) 구형성가정 006.000 33 60.788 Greenhouse-Geisser 006.000 0.115 99.77 Huynh-Feldt 006.000 3.90 83.863 하한값 006.000 11.000 18.364 010 년핚국심리학회연차학술대회 35
다층모형적용예제 ( 비구조행렬 ) 제 3 유형고정효과검정 a 소스분자 df 분모 df F 유의확률 절편 1 11.000 99.739.000 Age 3 11.000.738.094 a. 종속변수 : score. 잔차공분산 (R) 행렬 a [Age = 1] [Age = ] [Age = 3] [Age = 4] [Age = 1] 188.000 154.364 17.364 11.18 [Age = ] 154.364 00.545 143.636 97.455 [Age = 3] 17.364 143.636 178.000 168.091 [Age = 4] 11.18 97.455 168.091 18.000 비구조적 a. 종속변수 : score. 공분산모수추정값 a 모수 추정값 표준오차 UN(1,1) 188.000 80.163 UN(,1) 154.364 74.791 UN(,) 00.545 85.513 UN(3,1) 17.364 67.08 반복측정 UN(3,) 143.636 71.560 UN(3,3) 178.000 75.899 UN(4,1) 11.18 71.139 UN(4,) 97.455 69.555 UN(4,3) 168.091 78.078 UN(4,4) 18.000 9.956 a. 종속변수 : score. 010 년핚국심리학회연차학술대회 36
다층모형과다변량접근의비교 제3 유형고정효과검정 a 소스 분자 df 분모 df F 유의확률 절편 1 11.000 99.739.000 Age 3 11.000.738.094 a. 종속변수 : score. 9.738.40 11 다변량검정 b 효과값 F 가설자유도오차자유도유의확률 요인 1 a. 정확한통계량 b. Design: 절편개체 - 내계획 : 요인 1 Pillai 의트레이스.47.40 a 3.000 9.000.153 Wilks의람다.573.40 a 3.000 9.000.153 Hotelling의트레이스.747.40 a 3.000 9.000.153 Roy의최대근.747.40 a 3.000 9.000.153 010 년핚국심리학회연차학술대회 37
모형비교 서로다른두모형중가능한단순하면서자료를잘설명하는더좋은모형을선택 최소자승법에기반한추정 제곱합에바탕한지수들 (e.g., R ) 을비교 최대우도법에기반한추정 우도에바탕한지수들을비교 우도 (Likelihood) 가정된모형이참이라고할때표본자료가얻어질확률. [0, 1] 로그우도 (LL) 우도에로그를취한값. (-,0] 로그우도를바탕으로한모형적합도지수 :AIC, BIC, AICC, CAIC 일반적으로값이작을수록좋은모형 (-LL) 010 년핚국심리학회연차학술대회 38
모형비교 ( 예 ) 복합대칭공분산모형 비구조공분산모형 정보기준 a - 제한로그우도 340.756 Akaike 정보기준 (AIC) 344.756 Hurvich & Tsai 기준 (AICC) 345.049 Bozdogan 기준 (CAIC) 350.35 Schwartz 베이지안기준 (BIC) 348.35 정보기준은가능한작은형태로출력됩니다. a. 종속변수 : score. 정보기준 a - 제한로그우도 35.113 Akaike 정보기준 (AIC) 345.113 Hurvich & Tsai 기준 (AICC) 351.780 Bozdogan 기준 (CAIC) 37.955 Schwartz 베이지안기준 (BIC) 36.955 정보기준은가능한작은형태로출력됩니다. a. 종속변수 : score. 010 년핚국심리학회연차학술대회 39
지분된모형 (Nested model) 비교하는두모형중한모형이다른모형의특수한경우로간주될때, 이를지분된 ( 작은둥지 ) 모형이라하고다른모형을지분하는 ( 큰둥지 ) 모형이라한다. 010 년핚국심리학회연차학술대회 40
공분산의둥지구조 비구조 (UN) 토플리츠 (TP) 자기회귀 (AR) 항등 (ID) 복합대칭 (CS) 010 년핚국심리학회연차학술대회 41
둥지 ( 지분 ) 모형비교 두모형중추정되는모수의개수가많은모형이큰둥지모형이며큰둥지모형은작은둥지모형보다언제나자료에더잘부합한다. 즉더큰우도, 더작은 -로그우도를갖는다. 서로지분관계에있는두모형의우도비의관계 L1 log( ) L log( L1) [ log( L)] ~ ( df ) 이때자유도는두모형에서추정되는모수의개수의차이 두모형이유의미한차이를보이면큰둥지모형이, 유의미한차이를보이지않으면작은둥지모형이더좋은모형 010 년핚국심리학회연차학술대회 4
둥지 ( 지분 ) 모형비교 ( 예 ) CS 모형 : -logl1=340.756, 오차공분산모수개수 = UN 모형 : -logl=35.113, 오차공분산모수개수 =10 340.756-35.113 = 15.643 ~ χ (8) 15.643 > χ (8) critic(α =.05) = 15.51 결론 : UN 모형이 CS 모형에비해추정해야할모수가많지만그수를 감안해도표본자료를유의미하게더잘설명한다. 대안모형? 010 년핚국심리학회연차학술대회 43
대안적인오차공분산 공분산모수추정값 a 모수 추정값 표준오차 Var: [Age=1] 18.1 83.96 Var: [Age=] 14.3 81.83 Var: [Age=3] 177.09 68.56 반복측정 Var: [Age=4] 18.49 67. TPH rho 1 0.80 0.07 TPH rho 0.58 0.15 TPH rho 3 0.6 0.16 a. 종속변수 : score. 잔차공분산 (R) 행렬 a [Age = 1] [Age = ] [Age = 3] [Age = 4] [Age = 1] 18.1 173.13 114.87 13.19 [Age = ] 173.13 14.3 155.97 115.54 [Age = 3] 114.87 155.97 177.09 143.95 [Age = 4] 13.19 115.54 143.95 18.49 Heterogeneous Toeplitz a. 종속변수 : score. 공분산모수추정값 a 모수 추정값 표준오차 반복측정 TP 대각선 196.69 65.81 TP rho 1 0.80 0.08 TP rho 0.59 0.17 TP rho 3 0.6 0.17 a. 종속변수 : score. 잔차공분산 (R) 행렬 a [Age = 1] [Age = ] [Age = 3] [Age = 4] [Age = 1] 196.69 157.9 115.38 11.88 [Age = ] 157.9 196.69 157.9 115.38 [Age = 3] 115.38 157.9 196.69 157.9 [Age = 4] 11.88 115.38 157.9 196.69 Toeplitz a. 종속변수 : score. 010 년핚국심리학회연차학술대회 44
대안적인오차공분산 공분산모수추정값 a 모수 추정값 표준오차 반복측정 Var: [Age=1] 195.89 81.86 Var: [Age=] 1.68 90.47 Var: [Age=3] 177.43 74.5 Var: [Age=4] 05.83 83.53 ARH1 로 0.81 0.08 a. 종속변수 : score. 공분산모수추정값 a 모수 추정값 표준오차 반복측정 AR1 대각선 199.44 66.85 AR1 로 0.81 0.07 a. 종속변수 : score. 잔차공분산 (R) 행렬 a [Age = 1] [Age = ] [Age = 3] [Age = 4] [Age = 1] 195.89 164.56 11.18 105.3 [Age = ] 164.56 1.68 156.6 136.00 [Age = 3] 11.18 156.6 177.43 154.07 [Age = 4] 105.3 136.00 154.07 05.83 이질적 1차자기회귀 a. 종속변수 : score. 잔차공분산 (R) 행렬 a [Age = 1] [Age = ] [Age = 3] [Age = 4] [Age = 1] 199.44 160.83 19.69 104.59 [Age = ] 160.83 199.44 160.83 19.69 [Age = 3] 19.69 160.83 199.44 160.83 [Age = 4] 104.59 19.69 160.83 199.44 1차자기회귀 a. 종속변수 : score. 010 년핚국심리학회연차학술대회 45
오차공분산모형의비교 AIC BIC -LL UN(10) TPH(7) TP(4) ARH1(5) UN(10) 345.11 36.96 35.11 TPH(7) 34.44 354.93 38.44 3.33 TP(4) 336.84 343.98 38.84 3.73 0.4 ARH1(5) 34.74 351.66 33.74 7.63 4.3 AR1() 337.14 340.71 333.14 8.03 4.7 4.3 0.4 CS() 344.76 348.33 340.76 15.65 1.3 11.9 Chi-square(α=.05) critical df value 1 3.84 5.99 3 7.81 4 9.49 5 11.07 6 1.59 7 14.07 8 15.51 9 16.9 10 18.31 010 년핚국심리학회연차학술대회 46
3 강 : 다층성장모형
010 년핚국심리학회연차학술대회 48
성장모형 일반적으로시간을질적변인이아닌양적변인으로다룸 ( 성장곡선 ) 종단연구에서많이사용 회귀분석모형 다층모형, SEM 등 시간에따른관찰값의변화를초기값 ( 절편 ), 변화율 ( 선형변화 ), 가속율 (차변화) 등시간의다항함수로표현 성장곡선 ( 혹은변화의궤적 ) 의개인차를모형화하는정도에따라다항함수의각항을고정효과나임의효과로설정 시간을양적변인으로할경우결측값의처리에가장효과적 시간변인을중심화하는책략의선택이중요 010 년핚국심리학회연차학술대회 49
yˆ x 0 1 t 다항성장모형 yˆ 0 1xt xt yˆ 0 1xt xt 3 yˆ 0 1xt xt 3xt 010 년핚국심리학회연차학술대회 50
계수의해석 β 0 시간변수 (x) 의값이 0일때기대되는 y값, 기대초기값 β 1 시간변수 (x) 의값이 1단위증가할때기대되는 y값의변화량, 기대 ( 단위 ) 변화율 ( 선형모형 ) * 고차 ( 차이상 ) 모형 : 시간변수의값이 0 일때의기대변화율 β 시간변수 (x) 의값이 1단위증가할때기대되는 y값의변화량의변화량, 기대단위변화율의변화율, 기대 ( 단위 ) 가속율 (차모형) *3 차이상모형 : 시간변수의값이 0 일때의기대가속율 / β 3 시간변수 (x) 의기대 ( 단위 ) 가속율의변화율 (3차모형) 성장곡선모형의항이고차일수록개별계수보다는궤적의형태를해석 010 년핚국심리학회연차학술대회 51
다층 ( 다항 ) 성장모형 y z z e it 0i 1i it i it it u 0i 00 0i u 1i 10 1i u i 0 i G 00 01 11 0 1 R 1 1 31 3 3 41 4 43 4 010 년핚국심리학회연차학술대회 5
계수의해석 γ 00 평균기대초기값 γ 10 (z it =0 일때의 ) 평균기대변화율 γ 0 평균기대가속율 τ 00, τ 11, τ 기대초기값, 기대변화율, 기대가속율의개인간분산 τ 01, τ 0, τ 1 기대초기값, 기대변화율, 기대가속율간의공분산 R행렬의성분들 개인내오차의분산및공분산 R행렬에서추정가능한모수의개수는 G행렬에서추정되는모수의개수에따라제한되며일반적으로항등행렬혹은대각행렬이많이사용됨 010 년핚국심리학회연차학술대회 53
시간변인의중심화 (1) 관찰변인 (y) 의초기값의해석을이론적으로의미가있게하기위해서시간변인을특정한값 ( 시점 ) 으로중심화함 시작 ( 시 ) 점중심화 첫번째측정시점으로중심화 초기값의추정치및그변산성에관심이있을때 평균 ( 시 ) 점중심화 기타 연구기간의중심시점으로중심화 시간변인의항들간의공선성을최소화 전체평균중심화, 개인평균중심화 해석에유의 종료시점중심화, 특정시점중심화 010 년핚국심리학회연차학술대회 54
다층성장모형 ( 예 ) y z z e ti 0i 1i ti i ti i u 0i 00 0i u 1i 10 1i i 0 y 00 u0 10z u1 z 0z e y z z u u z e ti i ti i ti ti i ti 00 10 ti 0 ti 0i 1i ti i 11 G R 1 1 0 1 0 0 1 0 0 0 1 010 년핚국심리학회연차학술대회 55
시간변인의중심화 ( 예 ) 반복측정 : 30, 36, 4, 48 개월 raw_age = 30, 36, 4, 48 시작시점중심화 (new_age) new_age = raw_age 30 (30 0, 36 6, 4 1, 48 18) 선형변인 (new_age), 이차항 (new_age=new_age*new_age) 평균시점중심화 (c_age) 평균 (raw_age) = 39 c_age = raw_age 39 (30-9, 36-3, 4 3, 48 9) 010 년핚국심리학회연차학술대회 56
다층성장모형 ( 예 :new_age) 정보기준 a - 제한로그우도 354.439 Akaike 정보기준 (AIC) 36.439 Hurvich & Tsai 기준 (AICC) 363.439 Bozdogan 기준 (CAIC) 373.666 Schwartz 베이지안기준 (BIC) 369.666 정보기준은가능한작은형태로출력됩니다. a. 종속변수 : score. 제3 유형고정효과검정 a 소스 분자 df 분모 df F 유의확률 절편 1 1.05 66.585.000 new_age 1 3.19.381.133 new_age 1 3.000.335.568 a. 종속변수 : score. 고정효과추정값 a 모수 95% 신뢰구간 추정값 표준오차 자유도 t 유의확률 하한값 상한값 절편 103 4.115 1.03 5.03 0 94.037 111.963 new_age 0.75 0.486 3.13 1.543 0.133-0.40 1.740 new_age -0.014 0.04 3-0.579 0.568-0.064 0.036 a. 종속변수 : score. 010 년핚국심리학회연차학술대회 57
다층성장모형 ( 예 :new_age) 공분산모수추정값 a 모수 95% 신뢰구간 추정값 표준오차 Wald Z 유의확률 하한값 상한값 잔차 35.809 10.559 3.391 0.001 0.090 63.85 절편 + new_age UN(1,1) 169.159 83.147.034 0.04 64.551 443.91 [ 개체 = id] UN(,1) -3.34 3.633-0.915 0.360-10.445 3.798 UN(,) 0.398 0.61 1.54 0.18 0.110 1.441 a. 종속변수 : score. 변량효과공분산구조 (G) a 절편 id c_age id 절편 id 169.159-3.34 new_age id -3.34 0.398 비구조적 a. 종속변수 : score. 잔차공분산 (R) 행렬 a 잔차잔차 35.809 a. 종속변수 : score. 010 년핚국심리학회연차학술대회 58
다층성장모형 ( 예 :c_age) 정보기준 a - 제한로그우도 354.439 Akaike 정보기준 (AIC) 36.439 Hurvich & Tsai 기준 (AICC) 363.439 Bozdogan 기준 (CAIC) 373.666 Schwartz 베이지안기준 (BIC) 369.666 정보기준은가능한작은형태로출력됩니다. a. 종속변수 : score. 제3 유형고정효과검정 a 소스 분자 df 분모 df F 유의확률 절편 1 13.085 860.57.000 c_age 1 11.000 5.04.047 c_age 1 3.335.568 a. 종속변수 : score. 고정효과추정값 a 모수 95% 신뢰구간 추정값 표준오차 자유도 t 유의확률 하한값 상한값 절편 108.65 3.703 13.085 9.336 0 100.631 116.619 c_age 0.500 0.3 11.41 0.047 0.009 0.991 c_age -0.014 0.04 3-0.579 0.568-0.064 0.036 a. 종속변수 : score. 010 년핚국심리학회연차학술대회 59
다층성장모형 ( 예 :c_age) 공분산모수추정값 a 모수 95% 신뢰구간 추정값 표준오차 Wald Z 유의확률 하한값 상한값 잔차 35.809 10.559 3.391 0.001 0.090 63.85 절편 + c_age UN(1,1) 141.593 64.47.04 0.08 58.186 344.564 [ 개체 = id] UN(,1) 0.61.860 0.091 0.97-5.345 5.866 UN(,) 0.398 0.61 1.54 0.18 0.110 1.441 a. 종속변수 : score. 변량효과공분산구조 (G) a 절편 id c_age id 절편 id 141.593 0.61 c_age id 0.61 0.398 비구조적 a. 종속변수 : score. 잔차공분산 (R) 행렬 a 잔차잔차 35.809 a. 종속변수 : score. 010 년핚국심리학회연차학술대회 60
공변인이있는다층성장모형 다층성장모형 (수준다층모형 ) 에서의공변인 시불변공변인 ( 상위수준공변인 ): 시간에따라변하지않 ( 거나그렇게가정되 ) 지만개인에따라상이한값을갖는개인차변인. 연구변인의개인간차이와공변 (e.g., 성별, 대학입학성적, 기질불안 ) 시변공변인 ( 하위수준공변인 ): 각개인내에서시간이나상황에따라변하는변인. 연구변인의개인내변화와공변 (e.g., 연애유무, 학기별성적, 상태불안 ) 수준간상호작용효과 : 상위수준공변인과 ( 시간변인을포함한 ) 하위수준공변인의상호작용 010 년핚국심리학회연차학술대회 61
공변인이있는다층성장모형 y z z e it 0i 1i 1it i it it w u 0i 00 01 i 0i w u 1i 10 11 i 1i w u i 0 1 i i z 1 : 시간변인 z : 시변공변인 w: 시불변공변인 G 11 1 13 3 33 R 1 1 31 3 3 41 4 43 4 010 년핚국심리학회연차학술대회 6
계수의해석 γ 00 (z, w i 가 0일때 ) 평균기대초기값 γ 10 (z, w i 가 0일때 ) 평균기대변화율 γ 0 (z 1, w i 가 0일때 ) 시변공변인 z 의평균기대효과 γ 01 (z 1, z 가 0일때 ) 개인차변인 w의기대효과 γ 10 ( ) 개인차변인 w와기대변화율의상호작용효과 γ 0 ( ) 개인차변인 w와 z 의기대효과의상호작용효과 010 년핚국심리학회연차학술대회 63
다층성장모형의공분산구조모형화 R 행렬의가능한구조 반복측정의시간간격이일정한경우 : 모든구조 반복측정의시간간격이일정하지않은경우 : ID, DIAG, CS, UN G행렬이 0행렬이아닌경우 R행렬은 UN 사용불가 일반적으로시간변인의 G행렬이복잡한경우 R행렬은 ID를많이사용 시간간격이일정하지않은경우 spatial 공분산구조사용가능 (SPSS 불가 ) 공분산구조자체를다른변인의함수로모형화가능 (SPSS 불가 ) 010 년핚국심리학회연차학술대회 64
4 강 : SPSS 를이용한분석예제
자료 낙태의법적허용에대한태도변화에관한종단연구 영국내 54 개지역 1983-1986 연차조사 총 64 명 조사변인 지역 응답자아이디 조사년도 1983=1,, 1986=4 낙태에대한태도 0-7( 높을수록호의적 ) 성별 ( 남 =1, 여 =0) 나이 (in 1983) 종교선호카톨릭 =1, 그외 =0 010 년핚국심리학회연차학술대회 66
분석순서 1. 하위수준모형화 I. 성장곡선설정 ( 중심화책략선택 ) II. III. 하위수준 ( 시변 ) 공변인이있으면성장곡선과동시에모형화 ( 고정효과와임의효과 ) 유의미하지않은효과의제거. 상위수준모형화 I. 유의미한임의효과분산을설명할수있는상위수준 ( 시불변 ) 공변인추가 II. 상호작용효과를먼저살피고유의미하지않은효과들을하나씩제거 3. 상위수준모형화후하위수준모형의변인효과 ( 특히임의효과 ) 의유의미성에영향을미친경우모형재조정 (1- 반복 ) 010 년핚국심리학회연차학술대회 67
시간변인의중심화 () 1. 중심화는 (1) 의미있고해석가능한영점을만들고 () 일차효과및고차효과 (e.g., 상호작용, 차효과 ) 간의공선성을최소화하기위한것. 성장모형의경우 () 보다 (1) 이더중요한경우많음 모형의최고차효과의해석과통계적유의미성은중심화에영향받지않음 ( 개인특정중심화예외 ) 중심화는 ( 최고차를제외한 ) 임의효과분산의크기와의미에영향 따라서중심화책략의선택은연구변인의개인차로서 ( 최고차를제외한 ) 임의효과분산을설명하는시불변공변인의효과에영향 010 년핚국심리학회연차학술대회 68
하위수준모형화 ( 개인별관찰값 ) 010 년핚국심리학회연차학술대회 69
하위수준모형화 ( 표본평균변화 ) 010 년핚국심리학회연차학술대회 70
성장곡선모형화 시작모형 G Y *( year 1983) *( year 1983) e ti 0i 1i ti i ti ti u 0i 00 0i u 1i 10 1i u i 0 i 00 01 11 0 1 R 1 0 1 0 0 1 0 0 0 1 010 년핚국심리학회연차학술대회 71
성장곡선모형화 선택모형 Y *( year 1983) *( year 1983) e ti 0i 1i ti i ti ti 0i 00 0i 1i 10 i 0 u G 00 R 1 0 1 0 0 1 0 0 0 1 010 년핚국심리학회연차학술대회 7
성장곡선모형화 선택모형 고정효과추정값 a 모수 95% 신뢰구간 추정값표준오차자유도 t 유의확률 하핚값 상핚값 절편 5.00 0.111 490.798 45.084.000 4.784 5.0 cyear -0.583 0.111 790-5.41.000-0.801-0.364 cyear 0.8 0.036 790 6.45.000 0.158 0.98 a. 종속변수 : Attitude toward abortion. 공분산모수추정값 a 모수 95% 신뢰구간추정값표준오차 Wald Z 유의확률하핚값상핚값잔차 1.33 0.067 19.875.000 1.07 1.470 절편 [ 개체 = ID] 분산 1.985 0.03 9.786.000 1.64.45 a. 종속변수 : Attitude toward abortion. 010 년핚국심리학회연차학술대회 73
선택된성장곡선모형 ( 고정효과 ) 010 년핚국심리학회연차학술대회 74
Attitude toward Abortion 선택된성장곡선모형 ( 고정효과 ) 5.4 표본평균 모형추정치 5. 5 4.8 4.6 4.4 4. 4 1983 1984 1985 1986 010 년핚국심리학회연차학술대회 75
선택된성장곡선모형 ( 임의효과 ) 010 년핚국심리학회연차학술대회 76
상위수준모형화 ( 성별 ) 010 년핚국심리학회연차학술대회 77
상위수준모형화 ( 선호종교 ) 010 년핚국심리학회연차학술대회 78
상위수준모형화 ( 연령 ) 010 년핚국심리학회연차학술대회 79
개인차변인 상위수준모형화 catholic, gender, age in 1983 Y *( year 1983) *( year 1983) e ti 0i 1i ti i ti ti 0i 00 0i 1i 10 i 0 u Y *( year 1983) *( year 1983) e ti 0i 1i ti i ti ti * catholic * gender * age u 0i 00 01 i 0 i 03 i 0i 1 i 10 11 * catholici 1 * genderi 13 * agei * catholic * gender * age i 0 1 i i 3 i 010년핚국심리학회연차학술대회 80
상위수준모형화 고정효과추정값 a 모수 95% 신뢰구간 추정값 표준오차 자유도 t 유의확률 하한값 상한값 절편 5.346 0.9 8.775 18.30.000 4.771 5.91 cyear -0.583 0.111 790-5.41.000-0.801-0.364 cyear 0.8 0.036 790 6.45.000 0.158 0.98 Gender 0.18 0.185 60 1.179 0.39-0.146 0.58 catholic -1.199 0.365 60-3.87 0.001-1.916-0.481 Age -0.008 0.006 60-1.403 0.16-0.00 0.003 a. 종속변수 : Attitude toward abortion. 010 년핚국심리학회연차학술대회 81
상위수준모형화 ( 최종모형 ) Y *( year 1983) *( year 1983) e ti 0i 1i ti i ti ti * catholic u 0i 00 01 i 0i 1i 10 i 0 모수 고정효과추정값 a 95% 신뢰구간 추정값 표준오차 자유도 t 유의확률 하한값 상한값 절편 5.08 0.11 480.906 45. 0.000 4.86 5.303 cyear -0.583 0.111 790-5.41 0.000-0.801-0.364 cyear 0.8 0.036 790 6.45 0.000 0.158 0.98 catholic -1.174 0.365 6-3.13 0.001-1.893-0.454 a. 종속변수 : Attitude toward abortion. 010 년핚국심리학회연차학술대회 8
대안오차공분산구조비교 -LL Deviance from ID ID 3811.74 DIAG 3804.46 7.316 AR(1) 3811.390 0.35 Chi-square(α=.05) critical df value 1 3.84 5.99 3 7.81 4 9.49 5 11.07 6 1.59 7 14.07 8 15.51 9 16.9 10 18.31 010 년핚국심리학회연차학술대회 83
요약 반복측정자료분석은오차의공분산구조를어떻게모형화할것인가가중요하다. 일반적으로반복측정 ANOVA 와다변량접근중후자가더적절하다. 다층모형접근은위의두접근을포함하여더많은공분산구조를모형화할수있다. SPSS 의혼합모형 (MIXED) 절차를이용해다층모형을사용할수있다. SPSS 의혼합모형은 Proc Mixed 등다른프로그램에비해제약이많으나일반적인분석을위해서는유용하게사용될수있다. 010 년핚국심리학회연차학술대회 84