대한간호학회지제 43 권제 5 호, 2013 년 10 월 J Korean Acad Nurs Vol.43 No.5, 587-594 구성타당도평가에있어서요인분석의활용 호서대학교정보통계학과 A Guide on the Use of Factor Analysis in the Assessment of Construct Validity Kang, Hyuncheol Department of Informational Statistics, Hoseo University, Asan, Korea Purpose: The purpose of this study is to provide researchers with a simplified approach to undertaking exploratory factor analysis for the assessment of construct validity. Methods: All articles published in 2010, 2011, and 2012 in Journal of Korean Academy of Nursing were reviewed and other relevant books and articles were chosen for the review. Results: In this paper, the following were discussed: preliminary analysis process of exploratory factor analysis to examine the sample size, distribution of measured variables, correlation coefficient, and results of KMO measure and Bartlett's test of sphericity. In addition, other areas to be considered in using factor analysis are discussed, including determination of the number of factors, the choice of rotation method or extraction method of the factor structure, and the interpretation of the factor loadings and explained variance. Conclusion: Content validity is the degree to which elements of an assessment instrument are relevant to and representative of the targeted construct for a particular assessment purpose. This measurement is difficult and challenging and takes a lot of time. Factor analysis is considered one of the strongest approaches to establishing construct validity and is the most commonly used method for establishing construct validity measured by an instrument. Key words: Factor analysis, Construct validity, Sample size, Communality, Factor loading 서론본논문의목적은탐색적요인분석 (Exploratory Factor Analysis [EFA]) 의수행과관련된여러가지사항에대하여간호학을포함한다양한분야의연구자들에게통합된관점의지침을제공하는것이다. 특히, 구성타당도 (construct validity) 평가와관련하여요인분석을적용할때고려해야하는주요사항들에대하여여러측면에서포괄적으로논의하였다. 1. 측정도구의구성타당도타당하고신뢰성있는측정도구는모든연구에있어서필수적인 구성요소이며, 연구결과에대한해석은측정도구의타당성에의존하므로연구자는측정도구의타당도를검증해야한다 (Tafreshi & Yaghmaei, 2006). 타당도 (validity) 란그측정도구 ( 검사 ) 가원래측정하려했던것을실제로잘측정하는가를의미한다. 일반적으로타당도분석방법은크게내용타당도 (content validity), 준거타당도 (criterion-related validity), 구성타당도 (construct validity) 로구분된다. 측정도구의특성과측정도구가사용되는상황에따라더중요한타당도분석방법이존재할수있으며, 어떤경우에는이들중일부의타당도만의미를가질수도있다. 이와같이타당도는절대적개념이아니며, 이러한분석방법들은다른형태의타당도분석이라기보다는단지타당화하는데있어서방법상의차이를나타낼뿐이다 (Tak, 2007). 주요어 : 요인분석, 구성타당도, 표본크기, 공통성, 요인적재 Address reprint requests to : Kang, Hyuncheol Department of Informational Statistics, Hoseo University, 20 Hoseo-ro 79 beon-gil, Asan 336-795, Korea Tel: + 82-41-540-5902 Fax: + 82-41-540-5908 E-mail: hychkang@hoseo.edu 투고일 : 2013 년 8 월 16 일심사의뢰일 : 2013 년 9 월 11 일게재확정일 : 2013 년 9 월 17 일 2013 Korean Society of Nursing Science ISSN 2005-3673
588 Tafreshi 와 Yaghmaei (2006) 는간호학연구에서사용된많은측정도구들은다른연구를위해개발되고타당화된것이므로간호학연구에서그것을사용하고자한다면다시타당화가수행되어야한다고지적하고있다. 또한, Shin 등 (2010) 은 2007년과 2008년의 JKAN (Journal of Korean Academy of Nursing) 에게재된논문들을분석하여다음과같이논의하고있다. - 도구의타당도에대해서보고한논문은 36.2% 로신뢰도보고에비해상당히낮은것을알수있다. 과학적인연구를하기위해서는도구의신뢰도및타당도가입증된도구를사용하는것이중요하므로, 논문의타당도에대한기술이증가되어야겠다. 특히, 본분석에따르면, 연구자가기존에개발된도구를수정보완하여그대로사용한경우가많이있었는데수정보완한도구는최소한전문가로부터내용타당도를검증받는절차가필요하다. 그러므로도구에대한심사시타당도에대한심사가강화되어야겠다. 측정도구의구성타당도분석은검사도구가심리적구성개념을제대로측정하고있는지를평가하는방법이다 (Tak, 2007). 구성타당도분석은쉽지않고시간소모적인여러절차들이포함될수있는데그룹간의비교, 상관계수를이용한수렴타당도 (convergent validity) 와변별타당도 (discriminant validity) 의검토, 요인분석등이구성타당도분석을위해사용될수있다. 이들중요인분석은하나의개념을측정하는도구가여러하위개념을구분하여측정한다고가정하는경우구성타당도분석을위해가장널리사용되는통계적분석기법이다. 2. 요인분석 χ 1=λ11 f 1+λ12 f 2 +...+λ1m f m+e 1 χ 2 = λ21 f 1+λ22 f 2 +...+λ2m f m+e 2... χ p = λp1 f 1+λp2 f 2 +...+λpm f m+e p 여기서, 확률변수 f 1, f 2,..., f m 은모든측정변수들의변이에영향을주 는공통요인 (common factor) 이고, 반면에 e i 는단한개의측정변수 χ i 의변이에만공헌하는확률변수로서유일성변수 (uniqueness variate) 라고한다. 위의식에서선형결합에사용된가중계수 λij 를요인적재 (factor loading) 라고부르는데, 이는모형에서고려된 i 번째측정변수 χ i 에관한 j 번째요인 f j 의중요성을나타낸다. 몇가지기본적인가정하에서측정변수 χ i 의분산을다음과같 이분할하여표현할수있다. 2 2 2 Var (χ i)= c i + ψi = { λi1+λi2 +...+λim}+ ψi 2 2 2 여기서 c i (= λi1+λi2 +...+λim) 를측정변수 χ 1 의공통성 (communality) 이라고부르는데, 이는 χ 1 의분산중 m 개의요인들에의하여설명되 는부분으로해석될수있다. 따라서, 만약어떤측정변수의공통성 이상대적으로크다면그측정변수의유일성 ( 특수성 ) ψi 는반대로 작게될것이다. 요인분석은크게탐색적요인분석과확증적요인분석으로구분 될수있는데, 이논문에서는탐색적요인분석의적용에대하여다 룰것이다. 두분석방법에대한논의는본논문의후반부에서조금 더자세히다룰것이다. 요인분석 (factor analysis, 인자분석 ) 은여러관찰가능한특성 ( 측정변수 ) 들로부터소수의일반적인잠재변수 (latent variable) 를발견해내거나만들어내는통계적과정이라고할수있다. 여기서잠재변수는측정변수들간의상관관계를생성시키는이론적인, 관찰할수없는, 저변에깔려있는요인 (factor) 을의미한다. 즉, 요인분석은상관 ( 혹은공분산 ) 행렬의구조에관한통계적모형을구축하고, 그와같은구조를생성시키는소수몇개의요인을유도하여, 측정변수들간의구조적관계를해석하는자료분석기법이라고할수있다 (Kang, Han, Kim, & Jhun, 2005). 여기서는이논문의전개를위해필요한범위내에서요인분석의통계모형에대한수리적특성을간단히서술한다. 먼저, 측정변수 χ 1, χ 2,..., χ p 에대하여 m ( p) 개의요인을고려하는통계적모형을수리적으로표현하면다음과같다 ( 단, 모든측정변수들은평균이 0이고표준편차가 1이되도록표준화되었다고가정하자 ). 사전자료분석 1. 표본크기요인분석에서표본크기의문제에대하여매우다양한견해와경험법칙이존재하는데, 요인분석의최소표본크기에대한전통적인기준은크게두가지의범주로구분할수있다. 첫번째는절대적표본크기에대한기준이다. Hair, Anderson, Tatham과 Black (1995) 은표본크기가 100보다커야한다고제안하였고, Guilford (1956) 는적어도 200은되어야한다고주장하였으며, Tabachnick 과 Fidell (2007) 은적어도 300개의표본이필요하다고제안하였다. Comrey와 Lee (1992) 를인용한여러문헌들에서는표본크기가 100이면나쁜편이고, 200 정도면괜찮은편이며, 300 정도면좋은편이고, 500 정도면매우좋은편이고, 1,000 이상이면훌륭하다고서술하고있다 (Tak, 2007; Williams, Brown, & Onsman, 2012). 두번째기준은 n : p 비 ( 사
구성타당도평가에있어서요인분석의활용 589 례수대측정변수의비율 ) 에대한기준이다. 이에대하여도 20:1 (Hair et al.), 10:1 (Nunnally, 1978), 5:1 (Tabachnick & Fidell) 등여러기준들이제안되어있으며, Guilford 는 2:1 이상이면된다고제안한바있다. 한편, Arrindel과 van der Ende (1985) 등은 n : p 비는그다지중요하지않으며중요한것은사례수대요인수의비율이라고주장하였다. 그들은안정된요인을얻기위해서는사례수가추출되는요인수의 20배이상은되어야한다고주장하였다 (Tak, 2007). 반면에 Hogarty, Hines, Kromrey, Ferron과 Mumford (2005) 은좋은해 (solution) 를얻기위하여적용될수있는최소표본크기또는 n : p 비에대한일반적인기준은존재하지않는다고언급하였다. 한편, Tak은대략사례수가 200 이상이거나사례수와측정변수의비율이 5 대 1 이상이면안정권이라볼수있다고하였다. 최근의주목할만한연구는모집단요인구조 (population factor structure) 의재생성을기준으로한것으로서 (Arrindel & van der Ende, 1985; Barrett & Kline, 1981; MacCallum, Widaman, Zhang, & Hong, 1999), MacCallum 등은 20개의측정변수에대하여 60개의사례로도모집단요인구조를훌륭하게재생해낼수있음을보였다. 그들은표본크기보다는자료의질이중요하다는점을강조하여공통성과요인적재값이높은측정변수들로구성된경우표본크기가작아도좋은결과를얻을수있음을밝혔다. 한편, MacCallum, Browne과 Sugawara (1996) 은적합도의측도인 RMSEA(root mean square error of approximation; Kang, 2013) 와측정변수의수및요인수를고려하여구조방정식모형에서검정력분석 (power analysis) 과표본크기결정에대한절차를제시하였다. 그들은 SAS 프로그램을제공하고있으며 (http://www.unc.edu/-rcm/power/power.htm), STA- TISTICA와같은일부통계프로그램에도이러한기능이제공되고있다. 아직까지는탐색적요인분석에이절차를적용하기위해서상당한수준의수치연산이필요하지만, 조만간일반연구자들이쉽게사용할수있는프로그램모듈이제공될것으로기대된다. 요약하면, 요인분석에서의표본크기문제는측정변수의수뿐만아니라요인수및공통성과요인적재값등이종합적으로고려되어야하며, 너무작은표본크기는당연히바람직하지않지만요인분석이탐색적방법론이라는점을고려할때표본크기문제에지나치게엄격한기준을적용할필요는없다고생각된다. 다만, 표본크기가작은경우에는요인분석결과의수용및기존의개념 -항목관계의변경시내용타당도평가와신뢰도분석등을포함하여매우신중하게결론을유도할필요가있다. 참고로 Table 1에최근 3년간 (2010-2012) JKAN에게재된논문중구성타당도검증을위해요인분석을적용한 11편의사례수, 측정변수의수, 요인수를제시하였다. Table 1. The Number of Cases, Variables, and Factors in the Papers of JKAN (2010-2012) No. Vol. (No.) Authors Cases Variables Factors 1 42 (5) Kim & Park 307 76 17 2 42 (5) Seo et al. 188 54 5 3 42 (5) Kim & Lee 137 35 7 4 42 (4) Jo 388 35 7 5 42 (3) Lee et al. 303 21 5 6 41 (4) Lee & Ji 151 30 5 7 41 (3) Jo 428 34 5 8 41 (3) Kwon 120 20 5 9 41 (1) Kim & Jang 960 29, 21, 26 5, 4, 4 10 40 (6) Shin 1,687 72 16 11 40 (4) Lee et al. 873 35 7 2. 측정변수들의분포 측정변수들의분포를검토하는것은모든통계분석의기본이된 다. 먼저, 평균과표준편차를통해측정변수들의기본적특징을살 펴보아야한다. 평균을통해측정값들이전체적으로어디에몰려있 는지를살펴볼필요가있다. 만약어떤측정변수의평균이너무높거 나너무낮다면, 해당문항의내용및자료가수집된대상등에대한 종합적검토를수행할필요가있다. 표준편차는자료의변이 (variation) 를나타낸다. 표준편차가너무크게나타나면특이값이존재할 수있으므로주의해야하고, 표준편차가너무작게나타나면해당 측정변수가가지고있는정보가많지않다는것을의미하므로그러 한이유를파악해보아야한다. 이러한과정에서각변수별빈도표 나히스트그램을이용하여분포를살펴보는것은매우추천된다. 탐색적요인분석이정규성가정자체를필요로하지는않지만왜 도 (skewness, 치우친정도 ) 와첨도 (kurtosis, 뾰족한정도 ) 를통해측 정변수들의다른특성들을살펴보는것도바람직하다. 특히, 요인 추정방법으로최대우도법을사용할경우그근거가되므로왜도와 첨도를통해정규성여부를평가할필요가있다. 왜도및첨도가정 규분포와유의하게다른가를검토하기위해서는표준화값 (standardized score, z-score) 을계산하여야한다. 표준화값에대한기준 은유의수준 10% 하에서 1.65, 유의수준 5% 하에서 1.96, 유의수준 1% 하에서 2.58 이다 ( 표준화값이아닌왜도와첨도의원래값에대 하여잘못된기준을적용한사례가 JKAN 에서도다수발견되었다 ). SPSS 를사용하는경우왜도 ( 첨도 ) 를그의표준오차 (standardized error) 로나누어산출할수있으며, LISREL 의 PRELIS 소프트웨어에 서는 Z-Score 라는이름으로, AMOS 소프트웨어에서는 CR (critical ratio) 이라는이름으로출력하여주므로이들소프트웨어를이용하
590 면쉽게왜도와첨도의표준화값을얻을수있다. Table 2는예시로서 12개의측정변수에대하여기술통계량을제시한예이다. Table 2. Descriptive Statistics from an Example Standard deviation Skewness Kurtosis Variables Mean SD CV(%) Raw Z-score Raw Z-score x1 3.86 0.97 25.0-0.76-3.83 0.36 1.05 x2 4.29 0.88 20.6-1.35-5.94 2.01 3.32 x3 4.25 0.84 19.8-1.26-5.67 1.96 3.28 x4 4.32 0.74 17.0-0.93-4.52 0.65 1.61 x5 3.99 0.97 24.2-1.02-4.86 0.87 1.97 x6 3.38 1.20 35.6-0.17-0.99-0.97-5.16 x7 3.56 1.17 32.9-0.53-2.82-0.54-1.92 x8 3.60 1.05 29.2-0.40-2.17-0.36-1.07 x9 3.52 1.02 28.9-0.22-1.21-0.41-1.27 x10 2.38 0.97 40.7 0.27 1.52-0.54-1.93 x11 3.24 1.09 33.7-0.30-1.65-0.62-2.34 x12 2.33 1.03 44.2 0.54 2.84-0.11-0.18 CV=(SD / Mean) 100(%). 3. 상관계수상관계수는요인분석의직접적인대상이되므로주의깊게살펴볼필요가있다. 너무낮은상관성은해당변수가요인분석에적합하지않음을나타낼수있으므로이에대한검토가필요하다. 즉, 각측정변수는같은요인으로묶일것으로기대되는변수그룹들과상대적으로높은상관계수를가져야한다. Tabachnick 과 Fidell (2007) 은 0.3을기준으로상관계수의크기를살펴볼것을추천하였고, Hair 등 (1995) 은상관계수가 ±0.3일때최소한도의, ±0.4일때중요한, ±0.5일때실제적으로유의한정도라고분류하였다. 한편, 상관계수가너무커서절대값이 1에가까운지도살펴보아야한다. 어떤두측정변수의상관계수가 1에가까우면이는두변수가거의동일한의미이거나같은정보를가지고있다는것을나타낼수있기때문이다. 분석대상이되는측정변수들이매우많을경우에는사전에상관계수를살펴보는작업이현실적으로쉽지않을수있다. 이런경우는먼저요인분석을수행한후그결과를살펴보는과정에서이상한현상이발견되는측정변수에대하여평균, 표준편차, 상관계수등을살펴보는것도좋은전략이라할수있다. 4. KMO 표본적합성측도와 Bartlett 의구형성검정 Kaiser-Meyer-Olkin의표본적합성측도 (measure of sampling ade- quacy) 는관측된상관계수들의값과편상관계수들의값을비교하는지수로서, 이값이클수록측정변수들저변에공통적인잠재요인이존재함을나타낸다. Kaiser (1974) 에의거하면 KMO 측도의값이 0.90 보다큰경우를훌륭한 (marvelous), 0.80-0.89인경우를가치있는 (meritorious), 0.70-0.79 인경우를중급의 (middling), 0.60-0.69 인경우를평범한 (mediocre), 0.50-0.59 인경우를빈약한 (miserable), 0.5 이하를받아들이기힘든 (unacceptable) 경우로분류하였다. 즉, 이측도의값이적으면요인분석을위한변수들의선정이좋지못함을나타낸다. Bartlett의구형성 (sphericity) 검정은 상관계수행렬이단위행렬이다. 라는귀무가설을기각할수있는지를검정하는것이다. 즉, 귀무가설 : 공통요인이존재하지않는다. 와 대립가설 : 공통요인이존재한다. 를대상으로검정을실시하는것이다. 따라서, Bartlett 검정의 p-값이유의수준 ( 예컨대, 0.05) 보다작아서귀무가설이기각되어야그자료에요인분석을실시할가치가있음을나타낸다. KMO 측도와 Bartlett 검정은요인분석을수행하기전에자료가최소한의조건을가지고있는지를검토하기위한것이다. 여러문헌에서 KMO 측도와 Bartlett 검정을통해요인분석의결과가타당한것으로나타났다는식으로결론을짓는경우가종종있는데 (JKAN 에서도이러한서술이일부발견되었다 ), 요인분석결과의타당성은요인적재값, 공통성등여러가지요인분석의결과를바탕으로종합하여판정할문제이다. 요인분석의수행과결과해석 1. 요인의개수요인적재값을추정하기위한여러방법들은대부분의경우자료에부합하는요인의개수를미리지정하도록요구하고있다. 대부분의소프트웨어에서 Kaiser의기준을기본적으로사용하고있지만, 요인의개수를결정하는데있어유일한기준은없으며, 여러기준들이주는결과들을종합적으로검토하여연구분야의이론적인바탕위에서합리적으로판단하여야한다. 연구자가잠정적으로상정하고있는요인수를포함하여서로다른요인수를지정하여요인분석을수행하고그결과를비교하여결론을짓는것은실제연구에서매우추천된다. Kaiser의규칙은표본상관행렬의고유값중 1보다큰개수만큼요인을보유하는것이다 (Table 3). 이방법은대부분의통계분석소프트웨어에서초기설정 ( 디폴트 ) 방법으로사용되고있으며, 일반적으로연구자가기대하는요인의개수와일치하는경우가많을뿐아니라요인의개수를미리정해놓고인위적으로만든확률모형으로부터취한표본에이기준을적용했을때에도매우잘작동되는것
구성타당도평가에있어서요인분석의활용 591 Table 3. Eigenvalues and Explained Variance (SPSS output) Component Initial eigenvalue Extracted SS loadings Rotated SS loadings Sum %Var %Cum Sum %Var %Cum Sum %Var %Cum 1 2.93 24.4 24.4 2.93 24.4 24.4 2.35 19.6 19.6 2 1.71 14.2 38.7 1.71 14.2 38.7 1.81 15.0 34.7 3 1.27 10.5 49.3 1.27 10.5 49.3 1.75 14.6 49.3 4.98 8.1 57.4 5.88 7.3 64.8 6.85 7.1 71.9 7.77 6.4 78.4 8.66 5.5 83.9 9.60 5.0 89.0 10.50 4.1 93.1 11.45 3.7 96.9 12.36 3.0 100 Table 4. χ 2 Test for the Number of Factors (SAS output) Tests DF χ 2 p H0: No common factors H1: At least one common factor H0: 1 Factor is sufficient H1: More factors are needed H0: 2 Factor is sufficient H1: More factors are needed H0: 3 Factor is sufficient H1: More factors are needed H0: 4 Factor is sufficient H1: More factors are needed 일부소프트웨어에서는아직제공하지않는경우도있다. Table 4 는 SAS 소프트웨어의결과를요약한것으로, 3 개또는 4 개의요인을적 절한요인수로고려할수있음을보여주고있다. 66 356.0 <.001 54 141.7 <.001 43 88.1 <.001 33 50.5.026 24 35.3.063 으로알려져있다. 반면에, 이방법에의한결과는종종보유되어야할것보다적은개수의요인을결정하게할수있다는점에유의할필요가있다 (Kang et al., 2005; Tabachnick & Fidell, 2007). 각요인의설명분산 (explained variance) 비율및누적비율에대한기준은하나의요인이실제적으로중요한의미를가지기위해서는그요인이전체변이에대해가지는공헌도가최소한얼마이상이되어야한다는것을규정하는것이다. Hair 등 (1995) 은사회과학분야에서누적설명분산이보통 50-60% 정도는되어야한다고제시하였다. 주축요인추출법이나최대우도법의경우이기준을사용하기위해서는요인의수를변경하며여러번요인분석을수행해보아야한다. Cartell과 Harman (1966) 에의해제안된스크리검사 (scree test) 방법은고유값의크기를그래프에나타낸도형 (scree graph) 에근거하여적절한요인의수를결정하는것이다. 이방법은고유값의크기를단순히그래프화한것이어서, 이기법에의해요인의개수를결정함에는주관성이개입되나그림이가지는시각적효과를얻을수있다는장점이있다. 이기법은도형의모양이스크리형태를보여주지않을경우에는적용하기가상당히어려우나, 만약사소한요인들이상당히존재하지만흥미의대상이주가되는요인의수를찾는데있어서는다른방법들보다우수하다는사실이여러가지모의실험의결과를통해밝혀져있다 (Kang et al., 2005). 요인의수를 0으로부터시작하여상정한요인의수에대한적합도검정의결과가기각되지않을때까지축차적으로카이제곱적합도검정을수행하는것을사용할수있다. 이방법은정규성과같은몇가지가정이충족되는경우통상적으로만족스런결과를제공하는것으로알려져있다 (Lawley & Maxwell, 1971). 다만이방법은 2. 요인추출방법요인을추출한다는것은결국자료 ( 상관행렬 ) 로부터요인적재값 λij와유일성 ( 특수성 ) ψi를추정하는것이다. 대부분의소프트웨어에서제공하는요인추출방법은매우다양하지만문헌에서주로언급되는것은주성분분석법 (principal component method), 주축요인법 (principal axis factor method), 최대우도법 (maximum likelihood method) 등이다. 주성분분석은서로연관되어있는측정변수들을서로독립적인소수의인공변수인주성분으로차원축소를꾀하는것이며, 요인분석에서의주성분분석법이란단순히첫몇개의주성분을요인으로취하는것이다. 이러한주성분분석법은측정변수들의전체분산이최대한설명될수있도록주성분 ( 요인 ) 을추출한다. 주성분분석법은요인추출과정이단순하기때문에대부분의소프트웨어에서초기설정방법으로사용되며, 최종결과를얻기전에요인분석을시험적으로수행하고자할때효율적이다. Snock과 Gorsuch (1989) 는주성분분석법의경우요인적재값의크기가실제보다크게나타나는경향이있음을보였는데, 따라서, 주성분분석법을실시했을때요인구조를해석하기쉬운경향이있으나이는잘못된결과일수있으므로주의해야한다 (Tak, 2007). 그러나구성타당도평가가요인구조의정확성보다는변수들의군집성에관심을둔다는점을고려할때, 주성분분석법의이러한성질은구성타당도평가를위해도움이되는측면도있다고하겠다. 주축요인법과최대우도법은앞에서설명한요인분석모형을상정하여측정변수들의공분산이최대한설명될수있도록요인을추출한다. 따라서, 주성분분석법에비하여전체분산에대한설명
592 비율은작아질수있다. 일반적으로요인분석의목적이많은측정변수들이공통적으로갖고있는의미있는구조를추출하는것이목적이라고할때주축요인법이나최대우도법이더타당하다고할수있다 (Tak, 2007). 주축요인법이나최대우도법에서는최종해 (solution) 를얻기위해반복적인수치적방법을이용하는데, 이과정에서해가타당한결과로수렴하지않거나공통성의추정값이 1을넘는소위 Heywood 상황이발생할수있다. 이러한상황은여러가지복잡한원인에의해발생할수있는데 (Kang et al., 2005), 아무튼 Heywood와같은상황에서얻어지는해는타당하지못하다고할수있다. 또한, 최대우도법은다변량정규분포의가정하에서타당한방법으로측정변수들의정규성이대체로만족될경우추천되는방법이라고할수있다. 많은경험적결과에의하면요인추출방법에따라그결과가크게달라지지는않는다. 그러나추정방법에따라요인적재값의패턴이달라질수있으므로연구자는여러가지추출방법으로결과를얻고연구분야의이론적근거에기초하여타당한요인구조를선택하여야한다. 3. 요인구조의회전구성타당도를검증하기위한요인분석이동일한구성개념을측정하는변수들간에는상대적으로높은상관성 ( 수렴성 ) 을, 반면에서로다른구성개념을측정하는변수들간에는상대적으로낮은상관성 ( 변별성 ) 을가지는지를알아보고자하는것이므로, 요인구조를단순화하기위한회전은실제로필수적이라할수있다. 연구자는 varimax 또는 quartimax와같은직교회전 (orthogonal rotation) 이나 oblimin 또는 promax와같은사각회전 (oblique rotation) 을사용할수있다. 직교회전은요인의직교성 ( 독립성 ) 을유지하면서요인구조를회전하는방법이며, 직교회전방법중 varimax는많은연구자들에의하여추천되며문헌에서가장많이나타나는방법이다. 요인분석의실제목적이서로상대적으로독립적인소수몇개의요인을유도하여이를통해측정변수들간의구조를파악하는데있다는점을중시할때, 통상적으로는직교회전을이용하는것이더바람직하다고판단된다. 사각회전은요인의직교성을포기하고단순성이라는측면에서요인구조의해석그자체에더큰비중을둔개념이라고할수있다. 그러나사각회전에의해회전된요인구조를얻었을경우, 요인의해석은쉬워질수있으나그대가로요인들간의상관관계가도입되어관찰될수없는요인들사이의상관성을또다시설명해야하는문제가제기된다. 따라서, 사각회전은보조적인도구로조심스럽게사 용될필요가있으며, 사각회전을사용할바에는확증적요인분석 을사용하는것이더바람직하다는주장도있다. 4. 요인적재값과설명분산 요인분석의결과해석시에필요한사항은요인구조 (factor structure) 를통해어느측정변수가어느요인에속하는지를결정하고, 높은적재값을갖는측정변수들의공통적인의미가무엇인지를파 악하여요인의의미를부여하는것이다. 높은적재값에대한기준 도다양하며보통절대값 0.3, 0.4, 0.5 정도가사용된다. 2 2 앞에서요인구조의각행 (row) 의원소들의제곱합 c i = λi1+λi2 +...+λim 를측정변수 χ 1 의공통성이라고하며이는 χ 1 의분산중 m 개의요인들 에의하여설명되는부분으로해석될수있다는것을설명한바있다. 2 2 반면에요인구조의각열 (column) 의원소들의제곱합 λ1j +λ2j +...+λpj 는 측정변수들의전체분산 ( 변이 ) 중요인에의해설명되는부분을의 미한다 (SPSS 의경우이것을 회전제곱합적재값 이라는이름으로 출력한다 ). 여러문헌에서고유값과설명분산 (explained variance) 을혼동하 여제시하는경우가많이있다 (JKAN 에서도이러한서술이다수발 견되었다 ). 사실고유값은요인분석의이전단계에서요인분석과는 독립적으로계산되는것이며, 회전된요인과 1 대 1 로대응되지않 는다. 따라서, Table 5 에서와같이요인구조와함께제시되어야할결 과는각요인에의하여설명되는분산 ( 회전제곱합적재값 ) 이다. Table 5. Factor Loadings, Communalities, and Explained Variances Variables Principal component method Factor structure Communalities Principal axis factor method Factor structure Communalities x1.72 -.06 -.10.53.57.01 -.13.34 x2.56.29 -.26.47.48.26 -.26.37 x3.77.07 -.03.61.68.10 -.07.48 x4.78.13 -.12.64.71.16 -.14.56 x5.27.31 -.54.46.25.25 -.45.33 x6.13.49 -.09.27.13.33 -.08.13 x7.10.76.05.59.08.71.03.51 x8 -.10.65 -.07.45 -.01.41 -.03.17 x9.33.49.32.46.24.42.19.28 x10 -.14.28.59.46 -.11.19.44.25 x11.07 -.05.72.53.00 -.01.54.29 x12 -.20 -.06.59.39 -.18 -.05.43.22 Explained variance 2.35 1.81 1.75 1.74 1.18 1.05 Explained (%) 19.6 15.1 14.6 14.6 9.9 8.8 Cummulative (%) 19.6 34.7 49.3 14.6 24.4 33.2 Orthogonal varimax rotation method is used.
구성타당도평가에있어서요인분석의활용 593 추가적인이슈 1. 확증적요인분석탐색적요인분석 (Exploratory Factor Analysis [EFA]) 은요인의개수나구조에대한특별한가정없이자료에내재되어있는특성을탐색하여관심있는가설이나모형및구조등을생성함으로써추가적인연구를수행하는데기여한다. 그러나탐색적요인분석을사용하는데있어몇가지제한사항이존재한다. 첫째, 연구자는모든요인들이서로상관되어있지않거나 ( 직교회전의경우 ) 모두상관되어있는 ( 사각회전의경우 ) 것으로가정해야한다. 즉, 특정한요인들사이에만상관성을두거나없앨수없다. 둘째, 모든측정변수들은모든요인에적재된다고가정해야한다. 즉, 특정측정변수를특정요인에배정하거나다른요인에배정할수없다. 확증적요인분석 (Confirmatory Factor Analysis [CFA]) 은구조방정식모형의특수한경우로서탐색적요인분석의위와같은단점을해소할수있을뿐만아니라, 요인구조에대한연구자의가설을모형화하고실제자료에의한가설의지지여부를모형의부합도라는관점에서검증할수있다 (Kang, 2013). 확증적요인분석이정확한가설검정에필요한통계적도구를제공하지만, 어떠한과정을어디까지사용할것인지는궁극적으로연구자에게달려있다. 구체적으로계획된예측이있어도연구자는탐색적요인분석을사용할수있으며, 반면확증적요인분석도상당히탐색적방식으로사용될수있다 (Munro, 2005). 일반적으로측정변수의수가많을수록타당도는떨어지게된다 (Seong, 2002). 또한, 확증적요인분석은제2종오류의위험성이높기때문에 (Munro), 측정변수의수가많을경우받아들일만한적합도를얻기위해비상식적인모수 (parameter) 를추가해야하는마찰이일어날수있다. 따라서, 요인수에비하여측정변수가매우많을경우에는확증적요인분석의남용을자제할필요가있다. 서측정변수들은해당구성개념의함수이므로동일한구성개념의측정변수값들간에는내적일관성이기대된다 (Lee & Kim, 2013). 따라서, 내적일관성신뢰도및요인분석을통해반영적지표의타당성을검토할필요가있다. 형성적지표 (formative indicators) 는측정변수가잠재변수의값을결정하는구조로측정변수가잠재변수를형성하는원인임을가정한다. 사회경제적지위 (SES) 와같은지표 (index) 가대표적인형성적지표에해당한다. 또한, 특정부분에대한지식의경우도형성적지표에해당될수있다 ( 예를들어, 골다공증이나유방암에대한지식을측정하는 20개의문항 ). 사회경제적지위는교육수준이나직업, 수입등에의해영향을받으므로, 교육수준, 직업, 수입등측정변수의변화에의해잠재변수인사회경제적지위가변화되지만, 잠재변수의변화가측정변수의변화를수반하지는않는다 (Chin, 1998). 이러한형성적지표는잠재변수에의해공통적으로영향을받아측정변수의값이결정되는것이아니기때문에측정변수들간의높은상관관계와내적일치도를필요로하지않는다 (Bollen & Lennox, 1991). 따라서, 형성적지표를이루는측정변수들은내적일관성신뢰도또는요인분석의대상이되지않는다. 그리고측정변수의추가또는제거가잠재변수에해당하는개념의변화로이어질수있다는특징을가지므로 (Jarvis et al., 2003), 주로주관적판정에의해측정변수의선정이결정된다. 형성적지표로구성되어야하는측정모형이반영적지표로간주되거나반영적지표로구성되어야하는측정모형이형성적지표로간주되는것은편향된모수추정결과의원인이되며, 오류의가능성을높일수있다. 따라서, 연구자는측정모형이반영적지표나형성적지표로구성될수있다는것을인지할필요가있으며, 변수에대한이론적배경등을고려하여측정모형을정의하고타당한통계방법론을적용해야한다 (Cho, 2011). 결론 2. 반영적지표와형성적지표반영적지표 (reflective indicator) 는측정변수의값이잠재변수의영향을받아결정되는구조로잠재변수가측정변수의원인임을가정한다. 행동과학분야에서보편적으로사용하는지능이나성격과같이이론적이며추상적인개념들이반영적지표에해당한다. 반영적지표는측정변수의값이잠재변수의영향으로인하여변화될수있기때문에측정변수들사이에상관관계가높을수있으며측정변수의변화가잠재변수인개념을변화시키지않는다는특징이있다 (Cho, 2011; Jarvis, MacKenzie, & Podsakoff, 2003). 반영적지표에 탐색적요인분석은이름그대로탐색적인자료분석방법이며, 많은분석단계를포함하는복잡한통계분석기법이다. 또한, 요인분석을적용함에있어수많은옵션과경험적기준이존재한다. 따라서, 연구자는다양한옵션들과기준들을조합하여가급적다양한형태의결과를얻고그들을세심하게비교하여, 연구분야의이론과경험에부합하는합리적인결론을내릴수있도록노력해야한다. 본논문에서는탐색적요인분석의수행과관련된여러가지사항에대하여통합된관점의지침을제공하고자하였다. 본논문에서논의된내용들이요인분석을수행하고자하는많은연구자들에게실제적도움이되기를기대한다.
594 REFERENCES Arrindel, W. A., & van der Ende, J. (1985). An empirical test of the utility of the observations-to-variables ratio in factor and components analysis. Applied Psychological Measurement, 9(2), 165-178. http://dx.doi.org/ 10.1177/014662168500900205 Barrett, P. T., & Kline, P. (1981). The observation to variable ratio in factor analysis. Personality Study and Group Behavior, 1, 23-33. Bollen, K., & Lennox, R. (1991). Conventional wisdom on measurement: A structural equation perspective. Psychological Bulletin, 110(2), 305-314. Cartell, L., & Harman, A. (1966). The scree test for the number of factors. Multivariate Behavioral Research, 1, 245-276. Chin, W. W. (1998). Issue and opinion on structural equation modeling. MIS Quarterly, 22(1), 1-10. Cho, H. D. (2011). A study on issues of using structure equation modeling in education study. Unpublished master's thesis, Korea University, Seoul. Comrey, A. L., & Lee, H. B. (1992). A first course in factor analysis (2nd ed.). Hillsdale, NJ: Erlbaum. Guilford, J. P. (1956). Psychometric methods (2nd ed.). New York, NY: McGraw-Hill. Hair, J. F. Jr., Anderson, R. E., Tatham, R. L., & Black, W. C. (1995). Multivariate data analysis (4th ed.). Upper Saddle River, NJ: Prentice Hall. Hogarty, K. Y., Hines, C. V., Kromrey, J. D., Ferron, J. M., & Mumford, K. R. (2005). The quality of factor solutions in exploratory factor analysis: The influence of sample size, communality, and overdetermination. Educational and Psychological Measurement, 65(2), 202-226. http:// dx.doi.org/10.1177/0013164404267287 Jarvis, C. B., MacKenzie, S. B., & Podsakoff, P. M. (2003). A critical review of construct indicators and measurement model misspecification in marketing and consumer research. Journal of Consumer Research, 30(2), 199-218. http://dx.doi.org/10.1086/376806 Kaiser, H. F. (1974). An index of factorial simplicity. Psychometrika, 39(1), 31-36. Kang, H. (2013). Discussions on the suitable interpretation of model fit indices and the strategies to fit model in structural equation modeling. Journal of the Korean Data Analysis Society, 15(2), 653-668. Kang, H., Han, S. T., Kim, K., & Jhun, M. (2005). Multivariate data analysis using SAS by examples. Paju: Freedom Academy. Lawley, D. N., & Maxwell, A. E. (1971). Factor analysis as a statistical method (2nd ed.). New York, NY: American Elsevier Pub. Co. Lee, H., & Kim, J. H. (2013). Structural equation modeling and AMOS 20.0. Seoul: JypHyunJae Publishing Co. MacCallum, R. C., Browne, M. W., & Sugawara, H. M. (1996). Power analysis and determination of sample size for covariance structure modeling. Psychological Methods, 1(2), 130-149. MacCallum, R. C., Widaman, K. F., Zhang, S., & Hong, S. (1999). Sample size in factor analysis. Psychological Methods, 4(1), 84-99. Munro, B. H. (2005). Statistical methods for health care research (5th ed.). Philadelphia, PA: Lippincott Williams & Wilkins. Nunnally, J. C. (1978). Psychometric theory (2nd ed.). New York, NY: McGraw-Hill. Seong, T. J. (2002). Validity and reliability (2nd ed.). Seoul: Hakjisa Publisher. Shin, H. S., Hyun, M. S., Ku, M. O., Cho, M. O., Kim, S. Y., Jeong, J. S., et al. (2010). Analysis of research papers published in the Journal of the Korean Academy of Nursing-focused on research trends, intervention studies, and level of evidence in the research. Journal of Korean Academy of Nursing, 40(1), 139-149. http://dx.doi.org/10.4040/jkan.2010. 40.1.139 Snook, S. C., & Gorsuch, R. L. (1989). Component analysis versus common factor analysis: A Monte Carlo study. Psychological Bulletin, 106(1), 148-154. http://dx.doi.org/10.1037/0033-2909.106.1.148 Tabachnick, B. G., & Fidell, L. S. (2007). Using multivariate statistics (5th ed.). Boston, MA: Pearson/Allyn & Bacon. Tafreshi, M. Z., & Yaghmaei, F. (2006). Factor analysis of construct validity: A review of nursing articles. Journal of Medical Education, 10(1), 19-26. Tak, J. K. (2007). Psychological testing: An understanding of development and evaluation method (2nd ed.). Seoul: Hakjisa Publisher. Williams, B., Brown, T., & Onsman, A. (2012). Exploratory factor analysis: A five-step guide for novices. Journal of Emergency Primary Health Care, 8(3), Article 1.