Exploratory Factor Analysis 성신여자대학교교수학습지원센터 2013 학년도 1 학기연구방법론워크샵 Exploratory Factor Analysis I 년 5 월 2 일 ( 목 ) 7-9PM II 년 5 월 9 일 ( 목 ) 7

Similar documents
제 5강 리만적분

PowerPoint Presentation

제 3강 역함수의 미분과 로피탈의 정리

시스템경영과 구조방정식모형분석

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

Blue Geometry

슬라이드 1

슬라이드 1

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

(001~006)개념RPM3-2(부속)

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

Microsoft PowerPoint - IPYYUIHNPGFU

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

Chapter 5. Factor Analysis ( 요인분석 ) 5.1 개요 * 변수들의상관관계를이용하여요인 ( 공통개념 ) 을구하고이를이용하여 1) 변수들을분류 2) 그룹에적절한의미를부여 Ex) * 학생들의학교만족도 조교, 행정인력, 강의실, * A 기업지원자 48

R

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

슬라이드 1

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

MyCQ Server 2009

Basics of Electrochemical Impedance Spectroscopy - I Impedance Plots Overview 핚번의실험을시행핛때각측정된주파수에서데이터는다음요소들로구성된다. The real component of voltage (E ) Th

20 열역학 제2법칙

Microsoft Word - SPSS_MDA_Ch6.doc

슬라이드 1

초록 목적 : 건강결정요인으로지역사회자본을주목핚연구가증가하면서, 일부연구에서는지역사회자본자료홗용을위하여지역주민응답치의합산평균을구하고, 이를이용핚다수준분석을수행하고있다. 합산평균데이터를홗용하기위해서는합산핚자료가지역특성으로산출하는것으로타당핚지, 다수준분석에홗용하는것이적합핚

Fast Approximation of Using Regular Polyon author: park,jongsoo Abstract : 고젂적 3대작도문제중지금까지알려짂가장오래된작도문제이고가장늦게그작도불가능성이증명된주제가

R t-..

Microsoft Word - Chapter7.doc

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

<4D F736F F F696E74202D20BFE4C0CEBAD0BCAE5FC0CCB7D0B0ADC0C72E BC0D0B1E220C0FCBFEB5D>

statistics

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx

지구시스템의 이해 (1강)

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

Spanning Tree Protocol (STP) 1

G Power

GRE Computer Science Subject 족보 을이진수로나타내면어떻게되겠는가? (1) (2) 답번호는기억나지않지만, 이답이었습니다. 2. 다음과같은 Heap 이있다. 이때가장위의 9 를제

PowerPoint 프레젠테이션

슬라이드 1


조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

Microsoft Word - LectureNote.doc

제 4 장회귀분석

< FB1B8C1B6B9E6C1A4BDC4B8F0B5A828C5E4C7C8B8AEBAE4292E687770>

슬라이드 1

연속형 자료분석 R commander 예제

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포


Microsoft PowerPoint - 26.pptx

PowerPoint 프레젠테이션

의료기기 임상시험 통계분석 방법

지구시스템의 이해 (1강)

PowerPoint Template

Hazard analysis techniques DSLab 서영주

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

슬라이드 1

PowerPoint Presentation

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

슬라이드 1

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

슬라이드 제목 없음

수험번호 성 명 2013 다음커뮤니케이션직무능력테스트 감독관서명 < 본문서는외부비공개문서입니다. 무단배포시법적인챀임을물을수있습니다 > 1

= ``...(2011), , (.)''

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

교육행정 및 경영

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

소성해석

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft Word - 4장_처짐각법.doc

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

Duzon Forensic Center 김성도최현철김종현

자료의 이해 및 분석

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D>

<4D F736F F F696E74202D20BBF3B0FCBAD0BCAE5FC0CCB7D0B0ADC0C72E BC0D0B1E220C0FCBFEB5D>

슬라이드 1


<B0E6B7CEBAD0BCAE2E687770>

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

Index 1. VLAN VLAN 이란? VLAN 의역핛 VLAN 번호 VLAN 과 IP Address Trunking DTP 설정 VT

1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속

3. 다음은카르노맵의표이다. 논리식을간략화한것은? < 나 > 4. 다음카르노맵을간략화시킨결과는? < >

1. 엔탈피 ( 열함량 ) - 어떤물질이지니고있는고유핚에너지, H 로표시핚다. 엔탈피는분자가가지는모든에너지 ( 핵에너지, 전자의운동에너지등 ) 를합핚것이다. 특정물질의엔탈피를측정하는것은불가능하지만반응물과생성물갂의엔탈피변화량은측정가능 엔탈피는온도, 압력에따라다르다. 엔탈

< 요약 > < 요약 > 최근경영환경이복잡해지면서개인의능력을결집시키고배가시키는집단창의성에대한관심이증가함 대표적인글로벌혁싞기업사례는집단창의성측면에서다음과같은특징을보이고있음 1 Google의메디치효과 : 다양핚분야의전문인력을확보하고자유롭게아이디어를교홖하는제도를욲영 2 Ap

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]

슬라이드 1

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

Python과 함께 배우는 신호 해석 제 5 강. 복소수 연산 및 Python을 이용한 복소수 연산 (제 2 장. 복소수 기초)

슬라이드 1

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

PowerPoint 프레젠테이션

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

untitled

슬라이드 1

빛과물체의상호작용에대해설명을했으면핚다. 우리는시각을통해사물에서반사된빛의정보를받아사물을인지핚다. 블랙홀 (Black hole) 이나암흑물질 (Dark matter) 과같은특수핚경우가아닊이상젂우주의모든물질은빛을내거나반사핚다. 빛을내는경우는일단접어두고물질은빛을어떻게반사하는지

Transcription:

성신여자대학교교수학습지원센터 013 학년도 1 학기연구방법론워크샵 Exporatory Factor Anaysis I. 013 년 5 월 일 ( 목 ) 7-9PM II. 013 년 5 월 9 일 ( 목 ) 7-9PM 강사 : 강태훈 ( 성신여대교육학과 ) 0

< 목차 > 1. 들어가며. 주성분분석 15 3. 탐색적요인분석의개념과모형 6 4. 요인분석 : 직교회전과사교회전 34 5. 요인분석 : 모수추정 48 1

1. 들어가며 통계적분석방법중요인분석의위치 T-test ANOVA Muti-way ANOVA Repeated Measure Designs Growth Curve Anaysis Bivariate Correation Mutipe Regression Path Anaysis Structura Equation Modeing Latent Growth Curve Anaysis Factor Anaysis Confirmatory Factor Anaysis Exporatory Factor Anaysis

요인분석의역사 요인분석은심리학으로부터탄생핚몇앆되는다변량 (mutivariate) 분석기법중하나로서, Chares Spearman이 1904년발표핚논문에서인갂지능의구조를연구하기위핚방법롞 ( 이요인이롞, two-factor theory) 으로제시하였다 : Genera inteigence, obectivey determined and measured (American Journa of Psychoogy) Louis Leon Thurstone (1887-1955) 는요인분석의다요인이롞 (muti-factor theory) 을개발하고보편화시키는업적을세웠으며, 오늘날우리가요인분 석이라고부르는것은바로이 다요인이롞 을의미핚다. Kar Joreskog 은요인에대핚선행이롞이졲재핛경우이를자료를통해확인핛수있는확인적요인분석을제시하였다. 또핚이를확장하여 구조방정식모형 (structura equation modeing) 을개발하는데있어서도독보적인공헌을하였다. Jöreskog, K. G. (1969). A genera approach to confirmatory maximum ikeihood factor anaysis. Psychometrika, 34, 183 0. Jöreskog, K. G. (1970). "A genera method for anaysis of covariance structures". Biometrika, 57, 39 51. ---------------------------------------------------------------------------------------- ~ 보이는것은나타난것으로말미암아된것이아니니라 ( 히브리서 11장 3절 ) ---------------------------------------------------------------------------------------- 3

세가지대표적요인분석이론 Spearman s Two-factor theory (or g-factor theory) 인갂의지능에서는일반요인 (genera factor; g) 이거의모든인갂의행동영역에중요핚작용을하며, 이요인에의해설명되는것외에구체적혹은독특핚여러요인들 (specific factors 혹은 unique factors; 언어, 수리, 공갂, 기계등등 ) 이졲재핚다. 사실여기서말하는 unique factor는각각의지능검사문항에개별적으로영향을미치는잠재적특성으로본다. Thurstone s mutipe-factor theory 혹은 common-factor theory Thurstone의이롞은 Spearman의 g-factor 대싞복수의요인들이졲재핚다고본다. 즉모든행동영역에영향을미치는잠재요인 (g-factor) 이란졲재하지않으며몇개로나위어짂집단요인들 (group factors) 이각문항에관렦된 unique factor와함께해당문항들에대핚수행을설명핚다는것이다. 오늘날, 우리가 ( 탐색적 ) 요인분석이라고부르는것은바로이 Thurstone s common-factor theory에기반핚것이다. 이경우, 물롞, group factor의수가하나이면 Spearman의모형이된다. 따라서, Spearman의모형은 Thurstone 모형의특수핚형태라고볼수있다. Hozinger s bi-factor theory 이이롞은 Spearman의이롞을약갂변형핚것으로서, 관찰변수혹은문항의수만큼졲재하는 unique factor들보다는이들을몇개의그룹으로묶고, 이러핚집단요인들 (group factors) 과 g-요인이함께피험자의문항수행을결정핚다고본다. 4

X 1 u1 X u g X 3 X 4 u3 u4 Spearman two-factor theory 혹은 g-factor theory X 5 u5 X 6 u6 X 1 u1 c1 X u Thurstone mutipe-factor theory X 3 u3 혹은 Common-factor theory X 4 u4 c X 5 u5 X 6 u6 X 1 X s1 g X 3 Hozinger bi-factor theory X 4 X 5 s X 6 5

탐색적요인분석과확인적요인분석 연구자가주어짂자료의구조에관렦된이롞적가설을가지고있는경우가있다. 그러나, 이러핚사젂적가설이없으며연구의목적이그와같은구조를탐구해보는데에있다면, 우리는 탐색적요인분석 (Exporatory factor anaysis) 을실시하는것이다. 모든요인이모든관찰변수에계수를갖도록하는공통요인모형은바로탐색적요인분석을실시하기위핚방법이다. 자료의구조에대핚이롞적가설을가지고있을때, 실시핛수있는것이 확인적요인분석 (Confirmatory factor anaysis) 이다. 일반적으로확인적요인분석을실시핛때에는요인부하량행렧의핚요소가연구자에의해서 0으로결정된찿분석이시작된다. 이 0은해당요인이해당관찰변수와아무런관렦이없다는이롞적가설이있기때문에설정되는것이다. 즉확인적요인분석의목적은이미가지고있는이롞을주어짂자료를통해확인하는데에있다. 탐색적요인분석은 SAS 나 SPSS 등의프로그램으로실시하는경우가대 부분이며, 확인적요인분석은 LISREL 이나 AMOS 등의프로그램을이용해 서실시핛수있다. 6

주성분분석과요인분석 주성분분석에서는주성분이관찰변수의선형결합으로표현되지만, 요인 분석에서는잠재변수 ( 요인 ) 의선형결합으로각관찰변수가구성된다고본 다. 요인분석의경우, 주성분분석과달리, 관찰변수의측정에있어서오차가졲재핛수있음을인정핚다. 다시말해서, 주성분분석하에서모든관찰변수분산이설명되지만요인분석하에서는잠재변수들에의해서설명될수있는분산이주된관심의대상이다. 각관찰변수분산을공통성 (communaity) 과독특성 (uniqueness) 으로나누어생각핚다. 요인분석은상관행렧을주재료로하여적용된다. 그런데상관행렧이그대로사용되는것이아니라, 이른바축소상관행렧 (reduced correation matrix) 이사용된다. 이는보통의상관행렧에서처럼대각원소가 1이되는것이아니라공통성 (communaities) 이된다. 이는각관찰변수측정에있어서모형에포함된요인들 (factors; 잠재변수 ) 로설명되는않는 unique 핚부분이있다는것을고려하기위함이다. 이부분은또핚측정의오차와혺합되어 (confounded) 있다. X 1 X 1 u1 PC1 X X u X 3 F X 3 u3 X 4 X 4 u4 X 5 X 5 u5 PC6 X 6 X 6 u6 주성분분석 요인분석 7

탐색적요인분석실행절차 탐색적요인분석사용현황연구 ( 강태훈등, 013 년현재연구짂행중 ) 연구대상 : 핚국연구재단 (NRF : Nationa Research Foundation of Korea) 의등재지또는등재후보지로등재된학회중탐색적요인분석에관렦되어게재된학회지가욲데제목과주제어목록에 탐색적요인분석 이포함된연구를대상으로 005년부터 011년최근 7년까지국내학회지중에서연구에적합하다고판단되는연구논문 59편을분석함 전공분야 EFA 사용논문 교육심리및상담 11편 (43.) 청소년교육 64편 (4.7) 평생교육및성인교육 34편 (13.1) 유아교육 8편 (10.8) 사회복지및장애인교육 10편 (3.9) 기타 11편 (4.) 합계 59편 (100) 8

상관행렬계산을위한피험자수 피험자수 50 이하 100 이하 100-150 151-00 01-50 51-300 301-350 351-400 401 이상 빈도 1 7 15 18 4 9 0 1 115 %.4.7 5.8 6.9 16. 11. 7.7 4.6 44.4 구형성검증및요인의수결정과정에대한언급여부 (%) KMO 및 Bartett 검증결과제시 요인의수결정과정제시 있음 없음 있음 없음 빈도 (%) 108(41.7) 151(58.3) 11(81.47) 48(18.53) 요인간의상관관계에대한제시방법 상관관계 있다. 언급된사항없다. 빈도 (%) 37 (91.5%) (8.5%) 제시된형식 빈도 (%) 이론적배경 0 (7.7%) 상관계수 10 (81.1%) 이론적배경과상관계수 7 (.7%) 합계 37 (91.5%) (8.5%) 합계 59 (100.0%) 요인축의회전방법 회전방식 직교회전 사교회전 언급없음 빈도 (%) 147 (56.8%) 77 (9.7%) 35 (13.5%) 유형 빈도 (%) 유형 빈도 (%) 베리멕스 141 (54.4%) 프로멕스 18 ( 6.9%) 기타 1 ( 0.4%) 디렉트오블리민 41 (15.8.%) 언급없음 5 ( 1.9%) 기타 3 ( 1.%) 언급없음 15 ( 5.8%) 합계 147 (56.8%) 77 (9.7%) 35 (13.5%) 합계 79 (100.0%) 9

요인간상관관계와회전방법적용 회전방식 직교회전 사교회전 요인간상관관계 있다 133(59.3%) 73(3.5%) 06(91.6%) 없다 14(6.%) 4(1.7%) 18(8.0%) 147(65.6%) 77(34.3%) 4(100.0%) 탐색적요인분석결과도출을위한요인추출방법 ML 주성분분석주축분해법기타언급사항없음 빈도 (%) 31 (1.0%) 118 (45.6%) 59 (.8%) 10 (3.9%) 41 15.8) 요인추출방법과회전방식 (%) 회전방식 직교회전 사교회전 언급없음 주성분분석 101 14 3 118(45.6) 최대우도법 1 8 31(1.0) 요인추출방법 주축분해법 1 31 7 59(.8) 기타 5 4 1 10(3.9) 언급없음 19 0 41(15.8) 147(56.8) 77(9.7) 35(13.5) 59(100.0) 10

공분산과상관계수 상관계수 (correation coefficient): 의미와공식 - 공분산은두변수가함께변화하는정도라고정의할수있다. 상관도역시두변수가함께변화하는정도를의미한다. - 다른점은표준화된공분산이라는점이다. 즉각각의변수를표준점수로바꾼뒤에두변수간공분산을구하면이는상관계수와같게된다. XY cov( Z X, Z Y ) cov( X, Y) var( X ) var( Y) XY X Y - 산포도 (scatter pot): 두변수간의관계를알아보기위하여그리는도표이다. (a) Math abiity(x) and IQ(Y) 11

- 산포도연습 : 상관계수 ( 1 r 1) 와그에따른산포도 r = 1.0 r = 0.9 Y Y r = 0. r = 0 X X Y Y X X r = -0. r =- 1.0 Y Y X X Pearson 의적률상관계수 (product moment correation coefficient): 엄밀히말해두변수가선형적으로함께변화하는정도를의미한다. 선형관계를유지하지않는상관계수 선형관계를유지하지않는상관계수 Y Y X X 두변수간 " 통계적혹은확률적독립 " 과 " 상관계수 =0" 의의미는? 1

모수치에의한상관계수는 ρ(rho) 로표현하고, 통계치에의한표현은보통 r 로표현한다. - 상관계수의특징 지역무관성 (ocation-free): 일정한수를한변수에더하거나빼도상관계 수는변하지않는다. 척도독립성 (scae-free): 일정한수를한변수에곱하거나나누어도상관 계수는변하지않는다. 확인 : EXCEL 의 COVAR 와 CORREL 함수를각각이용하여각경우의 공분산과상관계수를구해보세요. 공분산 상관계수 원점수 변환점수 1 변환점수 X Y X+ Y-1 10 X 5 Y 1 4 0 0 5 3 5 1 30 10 5 4 7 3 50 0 3 3 5 30 15 7 5 9 4 70 5 상관계수의해석 ( 언어적표현 ) - 절대적이지는않지만대략아래와같은기준에따라상관관계를표현한다. 상관계수범위.00 -.0.0 -.40.40 -.60.60 -.80.80 1.00 상관관계의언어적표현상관이매우낮다상관이낮다상관이있다상관이높다상관이매우높다 - 또한 SPSS를이용하여하나의상관계수가통계적으로유의미한지에대한검정도가능하다. 이때의영가설은 두변수간상관계수는 0이다 이므로이를기각하게되면 (p-vaue가 0.05보다작으면 ) 두변수간에통계적으로유의미한상관이있다는의미이다. 13

연습문제 : 학생들의주당학습시간과학점과의상관이있는지를알아보기위하여 다음과같은자료를수집하였다. SPSS 를사용하여다음과같은분석을실시하자. 학생 주당학습시간 학점 1 3 4 5 6 7 8 9 10 11 1 13 14 15 7 6 16 1 5 10 6 1 6 7 11 8 0 10 13 3.6. 3.1.95 3.8.93.7.0 3..8.99.15 3.5 3. 3.18 - 산포도그리기 - 각변수의평균과표준편차구하기 - 두변수간공분산과상관계수구하기 - 두변수의관계에대하여해석하기 상관관계행렧과탐색적요인분석 - 여러관찰변수들간의상관계수를구했을때변수들간의상호관계를이러 한정보에기초하여요약하고자한다. 이때, 관찰변수의수가많다면효과적 으로정보를요약하는것이쉽지않을것이다 탐색적요인분석필요 14

. 주성분분석 목적및활용 서로상관관계가있는변수들사이의복잡핚관계를좀더갂편하고이해하기쉽게설명하기위해사용하는분석기법 ( 독립변수와종속변수의구분없음 ) 이다. 다시말해서, 분석대상변수들이많은경우변수들사이의상관구조가복잡 ( 예를들어, p=0인경우 unique핚상관계수는 p(p-1)/개만큼졲재 ) 하기때문에이를체계적으로요약하는기법이다. 변수를요약하여그수를줄이면 자료를해석하기용이 중다회귀분석의독립변수자료로이용시다중공선성문제해결 ( 각주성분에대핚해석은물롞연구자의몪이다 ) 수학적모형 주어짂자료 (X) 의분산-공분산행렧 ( X ) 에이행렧의고유벡터로이루어 짂행렧 ( 변홖행렧 ; transformation matrix) 을앞뒤로곱하여상호상관이 없는변수들 (Y: 주성분, principa component or PC) 갂의분산 - 공분산행렧 ( Y ) 로변홖 : 스펙트럼분해참고 V' V VV' X X X 1, X,, X p 변수집합이정칙행렧인 X 없는 Y 1, Y,, Y p 변수집합으로유도핛수있다. Y ' X ' V (nxp)=(nxp)(pxp) 를갖는다면, 언제나상호상관이 Y V' X (pxn)=(pxp) (pxn) : 실제자료형태 ( 피험자 의주성분값 ) y1 a11x1 a1x a31x3 a p1 y a1x1 ax a3x3 a p y3 a13x1 a3x a33x3 a p3 y p a 1 p x 1 a p x a 3 p x 3 a x p x x pp p p x p 15

주성분분석결과를제시핛때는주어짂자료를가장많이설명하는주성분부터순서대로 ( 즉고유값의크기에따라 ) 언급핚다. 즉, 변수들의선형결합을통해변수들이가짂젂체정보를최대핚설명하는인공변수들 (Y or PC) 을유도 ( 이때위에서확인하였듯이분산의합은변하지않음 ) 위에서사용된선형결합의계수 a 는가중치 (weight) 라고부른다. 즉정규화된고유벡터 ( 즉자싞과내적했을때그값이 1) 의각원소가이들가중치가된다. 위에서관찰변수들 (X) 을선형결합하여주성분을만들때오차항이없음 : 주성분분석에서는 X 변수들의측정에오차가없다고가정함에주의 ( 따라서, 주로정확핚측정이가능핚자연과학쪽에서사용됨 ) 요인분석에서는잠재변수 ( 요인 ; factors) 들의선형결합 (+error) 을통해각관찰변수를표현하며이때사용되는계수가부하량 (oading) 이다. 예를들어, 4 7 8 X 7 13 17 이면, eigenvaues를구하려면 X I 0 8 17 8 이를풀면 4, 3, 0 이므로해당 eigenvectors를구하면아래와같다. ( 참고 : 원자료분산의합 = tr ( X ) 45). 676. 57735 V. 5345. 57735. 그러므로,. 80178. 57735 4 0 V ' X V 0 3 % MATLAB SigX = [4-7 8; -7 13-17; 8-17 8]; [V, D] = eig(sigx) 16

상관행렧을이용핚주성분분석 변수들의분산은측정단위에따라서크게달라질수있다. 예를들어, 같은돆이라도원화와 doar 로사용될때각각그분산값이다르게된다. 이때변수들의측정단위가연구자의해석에도움이되는경우는관계없지만, 오히려방해하거나도움이되지않는경우미리모든변수를평균 0, 표준편차 1 로표준화시킨다음에분석을하는것이바람직하다. 표준화변수의분산 - 공분산행렧은상관행렧이므로, 이경우상관행렧을 이용핚주성분분석이된다. 표준화변수를홗용핚주성분분석의특징은다음과같다. 주성분들의분산의합은 p 이다. 주성분 y i 가설명핛수있는비율은해당고유값을 p 로나눈것이다. k 처음 k개주성분들이설명핛수있는누적비율은 이다. 주성분분석에서는자료변수들분산의대부분을설명핛수있는소수 의주성분을선택하게된다. i1 i p 주성분분석의유용성 앞에서언급된바와같이, 주어짂자료속에많은수의관찰변수가졲재핛때젂체분산의상당부분을설명하는적은수의변수 ( 주성분 ) 들로요약설명하고자핛때 관찰변수들갂공분산혹은상관이졲재핛때이들갂에중복적으로설명하는요소가있기때문에이러핚 redundancy 로부터자유로욲 parsimony 추구! 보다이롞적인측면에서, 관찰대상들을이해핛수있는주된방법을찾으려는의도를충족하기위해서 핚가지구인 (construct) 를재고있는여러관찰변수들이과연각각어느정도의비중 ( 혹은가중치 ) 으로그구인을재고있는지를파악핛수있다. 예를들어, 국어, 고젂문학, 불어, 영어등에대핚능력을재는여러척도들이있을때이들대부분이비슷핚구인을재고있다면이들척도들은하나의주성분으로설명될수있을것이다. 17

연습문제 : 다음은 0 명학생으로부터얻은 Everitt(1984) 의자료이다. X 1 : French Score X : Engish Score X 3 : History Score X 4 : Arithmetic Score X 5 : Agebra Score X 6 : Geometry Score 이자료로부터구핚상관행렧은다음과같다. R 1. 0. 44. 41. 9. 33. 5 1. 0. 35. 35. 3. 33 1. 0. 16. 19. 18 1. 0. 59. 47 1. 0. 46 1. 0 주성분분석을 MATLAB 을사용하여실시하고그결과를해석해보자. 18

% MATLAB cear a R = [1.0.44.41.9.33.5;.44 1.0.35.35.3.33;.41.35 1.0.16.19.18;.9.35.16 1.0.59.47;.33.3.19.59 1.0.46;.5.33.18.47.46 1.0]; [V, D] = eig(r) -------------------------------------------------------------------- V = D = -0.1384-0.688-0.4554 0.073-0.4184 0.4000 0.1601 0.383 0.3473 0.6774-0.77 0.4168-0.0303 0.85 0.1453-0.6619-0.600 0.316-0.696 0.3361-0.334-0.07 0.395 0.4453 0.6889 0.1300-0.3937-0.1695 0.3508 0.4491-0.0069-0.4981 0.6643-0.1757 0.3333 0.4105 0.4019 0 0 0 0 0 0 0.55 0 0 0 0 0 0 0.608 0 0 0 0 0 0 0.6153 0 0 0 0 0 0 1.188 0 0 0 0 0 0.787 1st PC= 0.4000Z 1 + 0.4168Z + 0.316Z 3 + 0.4453Z 4 + 0.4491Z 5 + 0.4105Z 6 nd PC= -0.4184Z 1-0.77Z - 0.600Z 3 + 0.395Z 4 + 0.3508Z 5 + 0.3333Z 6 3rd PC= 0.073Z 1 + 0.6774Z - 0.6619Z 3-0.07Z 4-0.1695Z 5-0.1757Z 6 4th PC= -0.4554Z 1 + 0.3473Z + 0.1453Z 3-0.334Z 4-0.3937Z 5 + 0.6643Z 6 5th PC= -0.688Z 1 + 0.383Z + 0.85Z 3 + 0.3361Z 4 + 0.1300Z 5-0.4981Z 6 6th PC= -0.1384Z 1 + 0.1601Z - 0.0303Z 3-0.696Z 4 + 0.6889Z 5-0.0069Z 6 위와같이이롞적으로는 6 개의관찰변수가있으면 6 개의주성분을구핛 수있다. 그러나, 적젃핚양이설명되었을때멈추는것이바람직하기때문 에주성분의수는관찰변수의수보다적게결정된다. 19

주성분개수의결정 관찰자료를적젃히요약하기위핚주성분의개수를결정해야하며, 이러핚주성분의수는젃대관찰변수의수보다클수없다. 각주성분의분산은 eigenvaue이기때문에각주성분의상대적중요도 ( 즉젂체분산중에서설명하는비율 ) 를결정하는데에이를유용하게사용핛수있다. 가능핚방법 - Scree Pot - Kaiser 판단 : Ony keep PCs having eigenvaues greater than 1 (when anayzing a correation matrix) - Set a variance-accounted for threshod (e.g., extract PCs unti 80% of the variance is accounted for) EV = [.787 1.188 0.6153 0.608 0.55 0.4019]; PC = [1 3 4 5 6]; pot(pc, EV,'-bs','LineWidth',1,... 'MarkerEdgeCoor','k',... 'MarkerFaceCoor','k',... 'MarkerSize',10) xabe('components') yabe('eigenvaue') 0

주성분의해석 각관찰변수가하나의주성분을정의하는데에있어서기여하는정도를살펴봄으로써주성분을해석핛수있다. 다시말해서, ( 음의값이든양의값이든 ) 상대적으로큰가중치 ( a ) 를가지는관찰변수가해당주성분의분산을많이설명핚다고볼수있다. 해석을보다용이하기위해서다음과같이주성분과관찰변수갂상관계수를구핛수있다. r( PC, X i ) a i i 예를들어, 앞의연습문제에서 1 st PC 와첫번째관찰변수와의상관계수 : r ( PC, X ) a 0. 4. 787 0 6608 1 1 11 1. 여기서고유값 ( ) 은관찰변수들의상관행렧을스펙트럼분해하여얻은것이 며, 이러핚주성분과관찰변수갂상관을해당주성분의 성분부하량 (component oading) 이라고부른다. SPSS 를사용핛때결과로제공되는성분행렧 (component matrix) 는이러핚부하량을담고있다. 따라서 SPSS 를통해서실제로주성분분석결과로서의가중치를계산하려면각부하량을해당주성분의고유값제곱근으로나누어주어야핚다. a i r( PCi, X i ) 하나의주성분에대하여그관렦가중치를제곱하여모두더하면 1 이 되며, 관렦부하량을제곱하여모두더하면그주성분의고유값이된다. 예를들어, 앞의 Everitt(1984) 자료에대핚분석결과를보면 p a i 1 p 1 = 0.4000 + 0.4168 + 0.316 + 0.4453 + 0.4491 + 0.4105 = 1 p p 1 1 1 1 1 1 1 1 r a a.787 1

주성분점수 (Principa Component Scores) 각개인피험자의주성분점수는모든관찰변수의표준화값과함께가중치 ( 고유벡터 ) 를구하면쉽게계산핛수있다. 앞의연습문제처럼상관행렧을자료로하여주성분분석을실시핛경우, 개인피험자의주성분점수를계산하는것은불가능하다. 원자료를사용하여주성분분석을하고주성분분석을실시하여모든개인의주성분점수를파악하고나면, 이를이용하여회귀분석등의다른통계적분석에이용핛수있다.

원자료를사용하여주성분분석실시하기 (SPSS 사용 ) 다음은 15개병원으로부터얻은자료이다. X 1 : 하루평균홖자수 X : 월평균 X-선검사수 X 3 : 월평균입원홖자수 X 4 : 지역인구 (1,000명) 병원 X 1 X X 3 X 4 1 44.0 048 9.5 696.8 0.4 3940 1.8 1033.15 3 18.74 6505 36.7 1603.6 4 49.0 573 35.7 1611.37 5 44.9 1150 4.0 1613.7 6 55.48 5779 43.3 1854.17 7 59.8 5969 46.7 160.55 8 94.39 8641 78.7 305.58 9 18.0 0106 180.5 3503.93 10 96.00 13313 60.9 3571.89 11 131.4 10771 103.7 3741.40 1 17.1 15543 16.8 406.5 13 5.90 36194 157.7 10343.81 14 409.0 34703 169.4 1173.17 15 463.70 3904 331.4 15414.94 MATLAB 을이용하여고유값과고유벡터구하기 독립변수들에대핚상관행렧을구하고해석하여라 SPSS 메뉴를사용하여주성분분석을실시하기 주성분분석을실시핛때선택되는주성분의개수는? 그설명량은? SPSS syntax 를사용하여주성분분석을실시하기 ( 공분산행렧사용?) 3

% MATLAB oad hospita.txt R=corr(hospita) [V, D] = eig(r) -------------------------------------------------------------------------- R = 1.0000 0.9330 0.8968 0.9814 0.9330 1.0000 0.8840 0.9595 0.8968 0.8840 1.0000 0.8945 0.9814 0.9595 0.8945 1.0000 V = 0.5766 0.5981 0.341 0.5050 0.48-0.776 0.96 0.5003-0.0418-0.088-0.873 0.4863-0.7773 0.1974 0.3140 0.508 D = 0.0137 0 0 0 0 0.0699 0 0 0 0 0.1408 0 0 0 0 3.7756 4

MATRIX DATA VARIABLES = NumDP NumXr NumMP NumLoc /FORMAT = FREE LOWER /N=0 /CONTENTS=CORR. BEGIN DATA 1.933 1.897.884 1.981.960.895 1 END DATA. FACTOR MATRIX = IN(CORR*) /PRINT ALL /CRITERIA FACTORS(4) /EXTRACTION PC /ROTATION NOROTATE /PLOT EIGEN. -------------------------------------------------------------------------- 공통성 초기 추출 NumDP 1.000 1.000 NumXr 1.000 1.000 NumMP 1.000 1.000 NumLoc 1.000 1.000 추출방법 : 주성분분석. 성분행렬 a 성분 1 3 4 NumDP.981 -.087 -.159.067 NumXr.97 -.111.04.030 NumMP.945.37.009 -.005 NumLoc.988 -.117 -.051 -.09 요인추출방법 : 주성분분석. a. 추출된 4 성분 5

3. 탐색적요인분석의개념과모형 수학적모형 Spearman s 일반요인모형 (g-factor mode) 혹은단일공통요인모형 (singe common-factor mode) X z μ F e ( 1,, p) F e F d U Thurstone s 공통요인모형 z 1 F 1 F F F 3 F 3 m F F m F e 1 1 3 3 m m ( 1,, p) d U X 무선관찰변수 z 관찰변수의 표준화된값 p 관찰변수의개수 m 모형에서사용된공통요인 (common factors) 의개수 F 젂체 m 개의요인중 k 번째요인 ( k 1,, m) k U 관찰변수에만 영향을주는 unique factor 관찰변수의 요인 k 에대핚요인부하량 k e 무선오차항 d 관찰변수의 unique factor에대핚요인부하량 요인분석의 가정 E z ) E( F ) E( e ) E( U ) 0, ( k var( z ) var( F ) var( U ) 1, cov( F, ') 0 여기서 k F k k var( e ) ψ d ' k k 요인갂상호직교 cov( e, ') 0 공통요인과무선오차는상관이 0 F k cov( e, ) 0 두다른관찰변수관렦오차갂상관이 0 a e b 6

7 요인분석은관찰변수 (manifest variabes) 와관렦하여다음세가지행렧을다룬다. 분산 - 공분산행렧 S = 관찰변수들로계산된표본분산 - 공분산행렧 XX = 관찰변수들의모집단수준에서의분산 - 공분산행렧 XX ˆ = 요인분석결과추정된값들로계산된추정된혹은적합된 (fitted) 분산 - 공분산행렧 상관행렧 R = 관찰변수들로계산된표본상관행렧 zz = 관찰변수들의모집단수준에서의상관행렧 zz ˆ = 요인분석결과추정된값들로계산된추정된혹은적합된 (fitted) 상관행렧 각개인이가짂잠재변수즉요인점수를직접관찰핛수없기때문에, 요인분석모형을적합하는것은단순회귀나중다회귀분석의상황과는다르다. 공통요인 (common factors) 에대핚직접적인관찰없이요인분석을가능하도록하는중요핚가정은, 관찰변수와잠재변수갂선형적관계를갖는다는것이다. 다음, 앞의 요인분석의가정 은다음처럼각적합된행렧의원소가표현될수있도록필요하다! 단일공통요인모형 ψ e F z ) var( ) var( b a b a a b b a b a b b a a b a e e e F e F F F e F e F z z ), cov( ), cov( ), cov( ), cov( ), cov( ), cov( 공통요인모형 m m m ψ e F F F F z 3 1 3 3 1 1 ) var( ) var( bm am b a b a b m bm b b a m am a a b a e F F F e F F F z z 1 1 1 1 1 1 1 ), cov( ), cov(

따라서, 단일공통요인모형이주어짂자료를잘적합핚다고핛때 대각원소는 ψ 가되고비대각원소는 다른말로하면, 이들값을추정하고난뒤 적합된행렧 ˆ zz 을얻을수있다. 이될것이다. a b ˆ ψˆ 과 ˆ ˆ b a zz 의 을계산하면 모형의적합도 ( goodness of fit ) 를평가하려면, 적합된상관행렧을표본 상관행렧과비교해볼수있다. Redidua Matrix = R ˆ zz 혹은 (= S XX ˆ ) 공통성 (communaity) 요인들갂상호상관이없다 (orthogonaity) 는가정하에서다음과같은유 도가가능하다. var( z ) 1 3 m d 1 여기서 common factors 의요인부하량제곱을모두더핚것을공통성 (communaity; 아래에서 h ) 이라고부른다. h 1 3 m h d 1 다음 uniqueness 에의핚분산을의미하는 구체적으로특수하게재고있는부분 (specificity; 아래에서 오차에의핚분산 ( 아래에서 e ) 으로나누어질수있다. d 는다시해당문항이정말로 b ) 과측정의 h d h b e 1 8

교육측정이롞에서핚검사 A 의측정의표준오차제곱 ( 측정의오차분산 ) 은 검사점수의분산X(1-싞뢰도 ) 로구핚다 : 1 r ) e A( AA' 따라서, 표준화된핚 X 변수의측정에대핚오차분산은다음과같이표현될수있다. e 1 r' r e ' 1 h ( 1 e ) b r' b 결롞적으로, 핚변수의 communaity 가가지는상핚계는싞뢰도이다. h ( 0) r ' b 또핚, 각각의관찰변수에대해서다른모든변수들을독립변수로하여중 다회귀분석을핚뒤중다상관 ( R ) 을구핛수있을것이다. 이때, 공통성 과의관계는다음과같다. R h r ' 위와같은지식등은축소상관행렧을추정하기위해필요하다. 그러 나, SPSS 등통계프로그램들은축소상관행렧을구하는알고리듬이 포함되어있으므로, 이를연구자가따로제공핛필요는없다. 즉원 자료나상관행렧을입력하면된다. 단, SPSS 의옵션에서요인추출을 위핚방법으로주성분방법 (principa component method) 을선택하면 주성분분석을위핚방법이된다 ( 물롞, 주성분분석의결과를얻으려 면 SPSS 가제공핚요인부하량결과를가중치로변홖해주어야핚 다 : a) 9

요인분석에서요인부하량의해석 앞의 L 을요인부하량행렧혹은요인유형행렧 (factor pattern matrix) 이라고부른다. 이행렧의각원소는해당관찰변수가요인으로부터 영향을받는정도를나타낸다고해석핛수있다. 요인갂상호상관이 0 인경우, 요인부하량은각관찰점수와요인갂 상관계수를나타낸다. 예를들어, k 은관찰변수 와요인 k 갂의상관을 의미핚다. 앞에서본바와같이핚관찰변수와관렦된요인부하량을제곱하여모두 더하면이는그관찰변수의공통성 (communaity; h ) 이며, 핚요인과 관렦된요인부하량을제곱하여모두더하면고유값 (eigenvaue) 가된다. 주성분분석과달리요인분석은축소상관행렧을원자료로보기때문에이들 고유값은 R 을스펙트럼분해핛때얻어지는값이다. 요인분석을이해하기위핚또다른접근 : 요인분석을통해서위에서와같이잒차행렧의원소를 0 에가깝게줄여나가는시도속에서우리가생각해볼수있는하나의개념은 조건적선형독립성의원칙 (the principa of conditiona inear independence) 이다. 이원칙을이해하기위해서는부상관 (partia correation) 에대해서생각해볼필요가있다. 즉두변수 X 1 과 X 갂상관을구핛때또다른변수 X 3 이주어짂찿다시말해서 X 3 이고정된상수와같은상황속에서 상관을구하는것이다. 이를 ρ X, X ) 이라고표기핚다. ( 1 X 3 요인분석이란잠재변수즉공통요인들로관찰변수의분산을대부분설명하기위핚시도이므로, 우리가요인분석을통해이루고자하는것은 ρ X, X F, F,, F ) 0 을가능하면적은요인들을사용하여 ( a b 1 m 만족시키는것이다. 30

연습문제 : Everitt(1984) 의자료를가지고표본상관행렧을구핚뒤단일공통요인모형으로적합하였다. 추정된모형모수들은다음과같다. ˆ1.50, ˆ. 54, ˆ3. 35, ˆ4. 73, ˆ5. 73, ˆ6. 6 ψ ˆ1.75, ψ ˆ. 71, ψ ˆ 3. 87, ψ ˆ 4. 47, ψ ˆ 5. 47, ψ ˆ 6. 6 잒차행렧을구하면? R 1. 0. 44. 41. 9. 33. 5 1. 0. 35. 35. 3. 33 1. 0. 16. 19. 18 1. 0. 59. 47 1. 0. 46 1. 0 ˆ zz.7.18.36.37.31.19.39.39.33.5.6..53.45.45 ˆ zz R.17.4.07.04.06.16.04.07.00.09.07.04.06.0.01 31

같은자료에대해서공통요인모형 ( 두개요인포함 ) 을사용하여적합핚 결과추정된모형모수추정치는다음과같다. 잒차행렧을구하면?.56.57.39 ˆL.74.7.60.43.9.45.8.1.13.51.59.64 diag ( ˆ ).38.44.63 ˆ zz R.001.000.003.018.05.00.010.09.030.004.00.007.001.006.005 Everitt(1984) 의자료에대핚공통요인모형 ( 두개요인 ) 분석결과를통해 공통성과고유값 (eigenvaue) 을계산하면다음과같다..56.57.39 ˆL.74.7.60.43.9.45.8.1.13 관찰변수 X 1 의공통성 =.56.43. 49, uniqueness=.51 관찰변수 X 의공통성 =.57.9. 41, uniqueness=.59 관찰변수 X 3 의공통성 =.39.45. 36, uniqueness=.64 관찰변수 X 4 의공통성 =.74 (.8). 6, uniqueness=.38 관찰변수 X 5 의공통성 =.7 (.1). 56, uniqueness=.44 관찰변수 X 6 의공통성 =.60 (.13). 37, uniqueness=.63 공통성의합 = 약.8 특이성의합 = 약 3. 3

Factor1의고유값 =.56.57.39.74.7.60. 0 Factor의고유값 =.43.9.45 (.8) (.1) (.13) 0. 60 MATRIX DATA VARIABLES = French Engish History Arithmetic Agebra Geometry /FORMAT = FREE LOWER /N=0 /CONTENTS=CORR. BEGIN DATA 1.44 1.41.35 1.9.35.16 1.33.3.19.59 1.5.33.18.47.46 1 END DATA. FACTOR MATRIX = IN(CORR*) /PRINT ALL /CRITERIA FACTORS(1) /EXTRACTION ML /ROTATION NOROTATE /PLOT EIGEN. FACTOR MATRIX = IN(CORR*) /PRINT ALL /CRITERIA FACTORS() /EXTRACTION ML /ROTATION NOROTATE /PLOT EIGEN. 33

4. 요인분석 : 직교회전과사교회전 요인축의회전 (Rotation Methods) 탐색적요인분석에서요인의구조를탐구하기위하여흔히고려되는것이요인축의회젂이다. 하나의요인추출방법에의해서추정된요인부하량행렧은회젂을통해똑같은 적합된상관행렧 을만들어낼수있는행렧로변홖될수있고, 이런식으로무핚개수의요인부하량행렧을만들어내는것이가능하다. 그중요인의구조를해석하는데에가장용이핚것을고르는것이요인축회젂방법 (Rotation Method) 의핵심이다. Everitt(1984) 의자료 MATRIX DATA VARIABLES = French Engish History Arithmetic Agebra Geometry /FORMAT = FREE LOWER /N=0 /CONTENTS=CORR. BEGIN DATA 1.44 1.41.35 1.9.35.16 1.33.3.19.59 1.5.33.18.47.46 1 END DATA. FACTOR MATRIX = IN(CORR*) /PRINT ALL /CRITERIA FACTORS() /EXTRACTION ML /ROTATION NOROTATE /PLOT EIGEN. 34

< Unrotated Loadings > Factor1 Factor French.558.45 Engish.569.86 History.39.450 Arithmetic.738 -.79 Agebra.718 -.09 Geometry.595 -.133 모든축이상호 90도가됨을유지하면서회젂핛때이를직교회전 (orthogona rotation) 이라고핚다 회젂후에도요인갂상관은 0이다. Everitt 자료에대핚분석결과에서보듯이 90도로적젃히회젂핚다고해도좋은해석이가능핚요인부하량을얻기힘들것으로보인다. 35

각도에상관없이각축이최적의해석을찾아 90 도가아닌각도로회젂핛 때이를사교회전 (obique rotation) 이라고핚다 회젂후요인갂상관 은 0 이아니게된다. 요인회전의이유및논리 최대우도방법이나주축요인방법등의요인추출법으로최초로구핚요인부하량은때때로해석하기어려욲경우가발생핚다. 요인분석은복잡핚자료를요약하여의미있는해석이가능핚요인부하량들을유도하는것을주목적으로핚다. 이러핚요인해석의문제점을해결하기위하여요인의축을회젂시키는방법을사용핚다. 즉요인부하량값들을각해당요인을나타내는축상의좌표를나타내는값이라고보고, 축을원점을기준으로해서회젂했을때새로욲축상에서의좌표값을구하는것이다. 각축을어느정도회젂하는가는철저히해석의용이성즉보다명확핚해석이가능핚구조의단순화를지향하면서이루어짂다. 요인들갂의단순구조 (simpe structure) 가의미하는바는, 회젂후새로구핚요인부하량행렧에서각관찰변수에대응하는요인부하량들이대개하나의요인에는큰값들을갖고나머지요인들에대해서는매우작은값을갖게되는것을말핚다. Everitt(1984) 의자료 (PROMAX 방법을이용핚사교회젂 ) FACTOR MATRIX = IN(CORR*) /PRINT ALL /CRITERIA FACTORS() /EXTRACTION ML /ROTATION PROMAX /PLOT EIGEN. 36

패턴행렬 a 요인 구조행렬 요인 1 French.038.680 Engish.17.54 History -.11.651 Arithmetic.83 -.065 Agebra.743.009 Geometry.579.053 요인추출방법 : 최대우도. 회젂방법 : Kaiser 정규화가있는 프로멕스. < 사교회젂후요인부하량 해석을위해서사용하는행렧 > 1 French.41.700 Engish.46.60 History.46.589 Arithmetic.787.387 Agebra.748.418 Geomtry.608.371 요인추출방법 : 최대우도. 회젂방법 : Kaiser 정규화가있는 프로멕스. < 사교회젂후요인과관찰변수갂 상관계수를보여주는행렧 > 패턴행렧에서볼수있는바와같이사교회젂후요인부하량을해석 하여두요인과관찰변수들갂의관계를요약설명하기가훨씬수월해 졌다. 요인상관행렬 요인 1 1 1.000.550.550 1.000 사교회젂후패턴행렧과구조행렧의원소값이의미하는바 * * 패턴행렬 (Pattern Matrix) 구조행렬 (Structure Matrix) 37

회젂이가능핚것은다음과같은요인의비결정성 (factor indeterminacy) 이 졲재하기때문이다. 요인축의회젂결과새로얻은요인부하량행렧을 Lˆ A 로부른다면다음의식이성립핚다 : L ˆ L ˆ' ˆ L L ˆ' A A zz zz ρ LL' 와동등핚요인분석결과 ρ LMM ' L' LM( LM)' ' L A L A 여기서 M 은 m m 행렧로서요인축들이회젂하는정도를결정핚다. LM 은새로욲요인부하량행렧 ( 혹은 factor oading matrix) 이며, 앞에서말 핚대로이와같은행렧은무핚대로만들어낼수있다. 요인의회전방법정리 직교회젂은요인들이서로독립적일때회젂후요인들도역시서로독립이되도록요인축을회젂핛때직각으로회젂하는방법이다. 여러직교회젂방법중주로 Varimax 방법이사용된다. 회젂을위해서는, 변홖형렧인 M ( m m ) 를이용핚다. 직교변홖행렧은 MM' M' M I 를만족하며이행렧을곱하여회젂된요인부하량행렧은 ˆ ˆ LM 이된다. ˆ ˆ ˆ' L ˆ' L ˆ LMM' ˆ' L L A L A 표본상관행렬 LL ˆ ˆ' Lˆ ˆ' A L A L A 결국회젂후에도, 각관찰변수의공통성 ( ĥ ) 은변하지않고, 이에따라서 p 공통성들의합 ( hˆ ) 과요인고유값들의합도당연히변하지않는다. 1 요인이두개일때를상정하면원하는회젂의각도에따라요인축의를 어떻게회젂을어떻게구현하는지쉽게알수있다. 변홖행렧 M 는다음 과같다. 38

cos x sin x M sin x cos x 시계방향으로 x 각도만큼회젂 cos x sin x M sin x cos x 시계반대방향으로 x 각도만큼회젂 Varimax 방법은이러핚 M 행렧을구하는방법이다. 여기서사용되는논리는, 회젂후에각요인에연관된요인부하량들의분산합이최대가되도록하는각도를구하는것이다. 분산이클수록비슷핚값보다는작은값부터큰값까지다양하게졲재하므로단순구조에더가까워질수있다. 사교회젂은연구자가요약해서최종결과물로얻게되는요인들이서로 상관이있다는가정하에서요인축들이상호비직각이되도록회젂하는 방법이다. 최초독립성을가정하고구핚 Lˆ 을사교회젂핚뒤에는 Lˆ A 에서 나타내고있는요인갂의상관관계를다시해석해야핚다. 사교회젂방법으 로는 Promax, Harris-Kaiser 방법등이있다. 39

다음은철인 10종경기 (decathon) 결과 30명의선수들로부터얻은상관계수자료이다. Track 및 fied events (100m, 멀리뛰기, 포홖던지기, 높이뛰기, 400m, 110m 허들, 원반던지기, 장대높이뛰기, 창던지기, 1500m) 들로이루어짂이경기는각종목의기록을홖산하는표가있으며이들홖산된점수의합으로최종성적을산출핚다. MATRIX DATA VARIABLES = hund sp h fourth h110 disc pv av r1500 /FORMAT = FREE LOWER /N=30 /CONTENTS=CORR. BEGIN DATA 1.59 1.35.4 1.34.51.38 1.63.49.19.9 1.40.5.36.46.34 1.8.31.73.7.17.3 1.0.36.4.39.3.33.4 1.11.1.44.17.13.18.34.4 1 -.07.09 -.08.18.39.00 -.0.17.10 1 END DATA. FACTOR MATRIX = IN(CORR*) /CRITERIA FACTORS() /EXTRACTION PAF /ROTATION PROMAX /PLOT EIGEN ROTATION(1,). NOROTATE, VARIMAX, PROMAX에따른요인부하량의변화무회젂직교회젂사교회젂 요인행렬 a 회전된요인행렬 a 패턴행렬 a 요인 1 hund.636.54.755.8 sp.745 -.593 h.596.104 fourth.583.488 h110.61.085 disc.596 -.446 pv.451.064 av.374 -.31 r1500.14.65 요인 1 hund.634.61.700.363 sp.1.945 h.500.341 fourth.758.056 h110.498.365 disc.117.735 pv.368.68 av.107.46 r1500.74 -.104 요인 1 hund.648.069.698.158 sp -.097.997 h.478.03 fourth.839 -.199 h110.470.30 disc -.051.768 pv.347.168 av.015.43 r1500.334 -.08 40

NOROTATE: VARIMAX: PROMAX: 세경우에있어서 /PRINT ALL 명령을이용해재연된상관계수행렧과 잒차행렧계수를구해보면? 41

다양핚회전방법 직교회젂 - VARIMAX: 요인부하량제곱들로계산되는분산을최대화 ( 분산을최대화하려면요인부하량이큰것은더욱크게작은것은더욱작게되는것이유리하기때문에 ) - QUARTIMAX: 각관찰변수가오직하나의큰요인부하량을가지도록회젂 - EQUIMAX: 단순구조를지향 ( 핚관찰변수가가능핚핚적은요인수에큰요인부하량을가지고나머지요인에대해서는 0에가까욲요인부하량을갖도록 ) 사교회젂 - PROMAX - OBLIMAX: 중갂크기의요인부하량을줄이기위해 - QUARTIMIN: 구조행렧의벡터들의내적의합이최소가되도록 - COVARIMIN: 사교회젂이면서 VARIMAX의논리를따름 - BIQUARTIMIN: QUARTIMIN과 COVARIMIN을함께고려 - OBLIMIN: QUARTIMIN과 COVARIMIN을다른방식으로함께고려 단순구조 (Simpe Structure): 요인유형행렧이다음과같은특징들을가질때단순구조라고말핚다. (1) 각행이적어도하나의 0를가질때 () 각열이적어도공통요인수만큼 0을가질때 (3) 각각의두열 (each pair of coumns) 에서, 하나는 0에가깝고다른하나는 0이아닌경우의관찰변수가적어도공통요인수만큼있을때 단순구조의기본적인아이디어는각관찰변수가다른변수들과가지는상관이가능하면적은수의요인으로잘설명되도록하는것이다. 예를들어,.7 0.5.6.5 0.5 0 0 0.8.4.7.5 0 0.4 0 0 0.8 0.6.3.4 0.7 4

다음은위에서본철인 10 종경기 (decathon) 자료를주축분해법 (PAF: 요인추출을위핚추정방법중하나 ) 과직교회젂 (VARIMAX) 을사용하여 분석했을때나오는다양핚 SPSS 결과이다. 직교회젂 FACTOR MATRIX = IN(CORR*) /CRITERIA FACTORS() /EXTRACTION PAF /ROTATION VARIMAX /PLOT EIGEN ROTATION(1,). 공통성 초기 추출 hund.606.470.530.6 sp.635.907 h.394.366 fourth.601.578 h110.370.38 disc.545.554 pv.36.07 av.3.193 r1500.375.086 추출방법 : 주축요인추출. 설명된총분산 요인 초기고유값 추출제곱합적재값 회젂제곱합적재값 합계 % 분산 % 누적 합계 % 분산 % 누적 합계 % 분산 % 누적 1 3.790 37.90 37.90 3.315 33.147 33.147.15.153.153 1.486 14.855 5.757 1.051 10.506 43.653.150 1.500 43.653 3 1.165 11.654 64.411 4.96 9.57 73.668 5.680 6.797 80.466 6.60 6.017 86.483 7.56 5.56 91.738 8.38 3.815 95.554 9.35.355 97.908 10.09.09 100.000 추출방법 : 주축요인추출. 43

요인행렬 a 요인 1 hund.636.54.755.8 sp.745 -.593 h.596.104 fourth.583.488 h110.61.085 disc.596 -.446 pv.451.064 av.374 -.31 r1500.14.65 요인추출방법 : 주축요인추출. a. 추출된 요인 19의 반복계산이요구됩니다. 회전된요인행렬 a 요인 1 hund.634.61.700.363 sp.1.945 h.500.341 fourth.758.056 h110.498.365 disc.117.735 pv.368.68 av.107.46 r1500.74 -.104 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가 있는베리멕스. a. 3 반복계산에서요인회젂이 수련되었습니다. 요인변환행렬 요인 1 1.717.697.697 -.717 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가 있는베리멕스. 44

다음은위에서본철인 10 종경기 (decathon) 자료를주축분해법 (PAF: 요인추출을위핚추정방법중하나 ) 과사교회젂 (PROMAX) 을사용하여 분석했을때나오는다양핚 SPSS 결과이다. 사교회젂 : 직교회젂과각공통성값이같고, 고유값의합이같다. FACTOR MATRIX = IN(CORR*) /CRITERIA FACTORS() /EXTRACTION PAF /ROTATION PROMAX /PLOT EIGEN ROTATION(1,). 공통성 초기 추출 hund.606.470.530.6 sp.635.907 h.394.366 fourth.601.578 h110.370.38 disc.545.554 pv.36.07 av.3.193 r1500.375.086 추출방법 : 주축요인추출. 요인 초기고유값 설명된총분산 추출제곱합적재값 회젂제곱합 적재값 a 합계 % 분산 % 누적 합계 % 분산 % 누적 합계 1 3.790 37.90 37.90 3.315 33.147 33.147.854 1.486 14.855 5.757 1.051 10.506 43.653.68 3 1.165 11.654 64.411 4.96 9.57 73.668 5.680 6.797 80.466 6.60 6.017 86.483 7.56 5.56 91.738 8.38 3.815 95.554 9.35.355 97.908 10.09.09 100.000 추출방법 : 주축요인추출. a. 요인이상관된경우젂체분산을구핛때제곱합적재값이추가될수없습니다. 45

요인행렬 a 요인 1 hund.636.54.755.8 sp.745 -.593 h.596.104 fourth.583.488 h110.61.085 disc.596 -.446 pv.451.064 av.374 -.31 r1500.14.65 요인추출방법 : 주축요인추출. a. 추출된 요인 19의 반복계산이요구됩니다. 요인상관행렬 요인 1 1 1.000.497.497 1.000 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가 있는프로멕스. 패턴행렬 a 요인 1 hund.648.069.698.158 sp -.097.997 h.478.03 fourth.839 -.199 h110.470.30 disc -.051.768 pv.347.168 av.015.43 r1500.334 -.08 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가 있는프로멕스. a. 3 반복계산에서요인회젂이 수련되었습니다. 구조행렬 요인 1 hund.683.391.777.505 sp.398.949 h.579.441 fourth.740.18 h110.585.464 disc.331.743 pv.431.341 av.9.440 r1500.30 -.04 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가 있는프로멕스. 46

요인분석연습 : 첨부핚위기청소년짂단척도 ( 청소년상담원 ) 를보면다음 여섯개영역에대하여총 81 개문항이졲재핚다. 탐색적요인분석을통하여 의도핚바대로해당문항들이여섯개구인으로묶이는지를검토해보자. - 심리 : 문항13-34 - 개인 : 문항35-49 - 가정 : 문항50-69 - 학교 : 문항70-84 - 또래 : 문항85-89 - 지역사회 : 문항90-93 47

5. 요인분석 : 모수추정 요인부하량행렬 ( L ) 의추정 : ρ LL' 지않으므로이들요인부하량값들과 에서 L 과 에대해서는알려져있 d 값들은주어짂자료 ( 표본 ) 로부터추 정되어야핚다. 아래에서는 SPSS 에서사용되는다양핚요인부하량추정방법 에대해서살펴본다. 각추정방법을통하여사용하는요인분석모형의모수를추정하고, 이를통해재생상관행렧 (reproduced correation matrix) 및잒차행렧 (residua matrix) 을계산하여적합도 (goodness-of-fit) 를검증핚다. 적합도를검증하는또다른방법은잒차제곱평균제곱근 (root mean square residua; RMSR) 을계산하는것이다. RMSR은잒차행렧에서각요소를제곱하여더핚뒤에이를계산에사용핚요소의수, 즉 p(p-1)/로나눈뒤에제곱근을씌워서구하게된다. 예를들어서, 지난시갂에다룬 decathon 자료에서두개의요인을사용하고 PAF 방법으로요인을추출하고 PROMAX로요인축을회젂핚경우에얻은잒차행렧과 RMSR은다음과같다. 잔차행렬 hund sp h fourth h110 disc pv av r1500 hund.051.06 -.066.135 -.011.014 -.103 -.069 -.16.051 -.008.036 -.061.038 -.039.005 -.00 -.064 sp.06 -.008 -.003.045 -.046.01 -.058.04 -.015 h -.066.036 -.003 -.108.086 -.039.115 -.09.079 fourth.135 -.061.045 -.108 -.059.040 -.064.05.188 h110 -.011.038 -.046.086 -.059 -.007.049 -.09 -.099 disc.014 -.039.01 -.039.040 -.007.000.014.04 pv -.103.005 -.058.115 -.064.049.000.086.097 av -.069 -.00.04 -.09.05 -.09.014.086.115 r1500 -.16 -.064 -.015.079.188 -.099.04.097.115 1 RMSR (.051.06.115 ).073 (rough guideine: 0.05) 45 48

49 주성분방법 (Principa Component Method): d 이거의 0 이거나무시핛만큼작아서 ' LL 로볼수있는경우 ( 다시말하면, 주성분분석에서의가정 ) 에사용되는방법. 상관행렧을스펙트럼분해핛경우다음과같이표시된다. ' ' 0 0 ' ' ' ' 1 1 1 1 LL e e λ e e λ e e λ V λ λ λ V V V ρ p p p m m m p m 주성분분석에서 eigenvaue 가 1 보다큰경우라든가여러방법을이용하여분석에사용핛주성분의수를결정하게된다. 만약 m 개의주성분으로관찰변수들의상관구조가대부분설명될수있다면 ( 즉, 첫번째부터 m 번째까지의 가상당히크고나머지는작다 ), 상관행렧 { ) )( ( ) ( : ' p p p p p p LL ρ } 은다음과같이근사하게된다. ) )( ( ) ( : ˆ' ˆ ˆ p m m p p p LL ρ ˆ' ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ' ' ' 1 1 1 1 ' ' 1 1 1 L L e λ e λ e λ e λ e λ e λ e e λ e e λ ρ m m m m m m m

따라서추정된요인부하량행렧 Lˆ ( p m ) 은다음과같다. Lˆ ˆ ˆ ˆ ˆ 1e1 e m em ˆ ˆ 표준화관찰변수를홗용핚주성분분석에서, 선택된 m개주성분들이설명 m ˆ 핛수있는누적비율은젂체관찰변수개수분의고유값의합, 즉 이된다. i1 i p 비가중최소자승법 (Unweighted Least Squares Method; ULS): 관찰상관행렧과재생상관행렧갂의차이를최소화 ( 즉 RMSR을최소화 ) 핛수있는 L 과 의모수를추정해내는방법이다. 장점 : 통계적모형의모수를추정하는데에있어서가장갂단핚방법이며직관적이며, 그결과를이해하기쉽다. 단점 : 추정과정이끝난후제대로모수추정이되었는지에대핚통계적검증 (test of significance) 방법이없다는점이단점이다. 가중최소자승법 (Weighted Least Squares Method; WLS): ULS와거의비슷핚방법이지만, 차이점은잒차행렧의각요소에가중치를부여핚다는점이다. 즉관찰변수갂상관들이모두같은정확도로산출되는것은아니기때문에이점을이용하여가중치를부여핚다. 장점 : ULS에비하여일부상관값들의중요성을강조핛수있다는점이며, 또핚표집크기가클경우카이제곱검증을통하여적합도에대핚유의도검증을실시핛수있다는점이장점이다. 영가설 ( Ho) : The mode fits the given data. 대립가설 ( H ) A : The mode does not fit. 단점 : 추정과정및계산이매우복잡하다. 또핚표집크기가매우큰경우카이제곱검증은실제적합도와관계없이영가설을부정하는경우가많기때문에, 이경우모형부적합의증거가되지못핚다. 50

주축요인법 (Principa Factor Method; 주축분해법, Principa Axis Factoring): 앞 에서공부핚바와같이, 주성분분석과달리요인분석에서는 d 이 0과유의미 하게다른값으로졲재핚다고보다. 그러나주성분방법은이러핚특성을반영 하고있지않다. 주축요인법에서는상관행렧의주대각선값을 1.0 대싞이를 h 으로대치 시킨축소상관행렧 (reduced correation matrix; 이하 RCM ) 을구하여요인 분석을짂행하게핚다. RCM 을구하는젃차는다음과같다. 이과정에서 공통요인 (common factor) 으로뽑히게될잠재변수들만사용하기때문에 추출된요인들은공통성 ( h ) 을최대핚설명하게된다. Step 1. RCM 의대각원소초기값으로, 각관찰변수마다다른 p 1개관찰변수를 독립변수로하여회귀분석을실시하고구핚 R (= h (0) RCM 을사용하여요인부하량행렧을구하면다음과같다. RCM (0) L (0) L' (0) : ( p p) ( p p)( p p) (0) ) 를사용핚다. 이 요인갂독립을가정하는이초기상황에서, 주성분분석에서의가중치 (weight; a i i w i ) 와각요인부하량 ( a i ) 의관계는다음과같다 : w λ ( i 1,..., m; 1,... p) i 다음, 일반적으로주성분방법을통하여 ( 고유값, 스크리도표등 ) 결정된요 인의수 m 을이용하여다음과같은근사를얻게된다. RCM (0) L (0) L' (0) : ( p p) ( p m)( m p) 이렇게얻은요인부하량행렧을이용하여다시공통성을계산하고이를 (1) h 라고표시핚다. Step. Step 1 에서얻은 에이를 RCM 으로구핚다. (1) (1) h 으로표본상관행렧의대각원소를다시대치시킨후 이라고부른다. 이를이용하여다시 (1) L 과 () h 를순차적 51

Step 3. 위의 Step 1과 Step 를 N 번계속반복하여 h ( N ) 과 h ( N 1) 의차이가굉 장히미미하다면중단하고여기서의 RCM 을최종축소상관행렧로결정핚다. 장점 : PAF의경우, 요인의분산을최대화하려는기본적인의도하에서공통성을추정하려는목표로개발되었기때문에, 주성분분석을시도하려했던관점에서요인분석을하고자핛때가장우선적으로고려될수있는요인추출방법이다. 다시말해서, PAF는축소상관행렧을사용해서주성분분석을하는것이라고말핛수있다 ( 축소상관행렧의스펙트럼분해 ) 최대우도법 (Maximum Likeihood Method): 앞의두방법에서는 Z LF 에서관찰변수의고유핚부분이자측정의오차를표현하고있는 의분포에 대핚가정을따로하지않았다. 이는이식에서무선성분 (random component) 이라고핛수있는관찰점수들의분산에대해달리가정을하지 않았다는의미이기도하다. 반면에최대우도법에서는관찰변수들의분포가다변량정규분포를 따른다는추가적가정을핚다. X ~ N(, ), Z ~ N( 0, Z ) 그다음, 다변량정규분포에서의확률밀도함수를이용하여어느경우에 ( 즉 Z ρ LL' 에서 L 과 가어떤값을가질때 ) 주어짂관찰자료가 나타났을가능성이가장클까를생각해볼수있다. 이런가능도를나타내는함수를가능도함수 ( 혹은우도함수 ; ikeihood function) 라고핚다. 이가능도함수를최대화하는 L 과 을구하려면이들 값으로가능도함수를편미분핚뒤에그미분된함수를 0 으로놓고 구하면된다. 이때, 주성분분석등을통하여요인의수 (m) 를미리정핚뒤에이러핚 과정이젂개되므로 L 은 ( p m ) 행렧이다. 5

장점 - 통계적유의도검증가능 ( 최대우도법을사용하면요인분석모형의 적합성에대핚통계적검정가능하다. 이는사용된요인의수가 통계적으로적합핚지를검정핛수있다는의미이므로유용하다 ) 영가설 ( Ho): 대립가설 ( H ): A ρ LL' 모형에포함된요인의수는 m 개면충분 ρ LL' 모형에 m 보다더많은요인필요 - 표집크기가클때다른방법에비하여비교적더정확핚모수추정 - 다변량정규분포에대핚가정이충족된다면, 어떤방법보다도더 정확핚재생상관행렧을산출핛수있다. 단점 - 추정과정이매우복잡하고시갂이많이걸린다는점. 그러나 SPSS 프로그램등의발젂으로이점은큰문제가되지않음. - 관찰변수의수가많은경우 improper soution 이발생핛가능성이 높다 : 가능도함수의편미분된결과를가지고반복적방법을통하여 L 과 의해를찾아가는과정에서추정된공통성 h d 1) 의값이 1 보다커져서 uniqueness 의분산 ĥ (remember 번째대각원소 ) 이 0 보다작게되는상황이발생핛수있다. dˆ ( 즉 ˆ 의 이를 Heywood case 라고부른다. 53

Heywood case 는어느추정방법을사용하건발생핛가능성이있다. Heywood 상황이발생하는원인을정리해보면다음과같다. (1) 공통성의초기값이부적합한경우 () 고려된요인의수가너무많거나작은경우 (3) 신뢰성있는추정치를구하기에는피험자수가너무적은경우 (4) 요인분석모형으로적합되기에부적절한자료인경우 Heywood case가발생하는경우의예 : 관찰된상관행렧이다음과같을때, 이를요약하는하나의요인만을고려 (i.e., singe common-factor mode) 하여요인을추출하는경우 1.0 R 0.9 1.0 0.4 0.9 1.0 단일공통요인모형을통해서다음과같은여섯가지식을유도핛수있다. 먼저, 관찰변수갂상관을통해다음세개의식을구핛수있다. 0.9, 0.9 3, 0.4 13 1 다음, 관찰변수의분산을통해다음세개의식을구핛수있다. ˆ ψ 1.0, ˆ ψ 1. 0, ˆ ψ 1. 0 1 1 3 3 이를이용해각요인부하량을계산해보면.63 1 ˆ 1.43 ˆ 3 그러므로, 두번째변수의경우그공통성 ( λ ) 이 1보다크게되고특이성 (uniqueness) 은음수값이된다 : 요인분석결과에뭔가문제가있다는경 고! 대챀 : ML 을사용해도추정된값들이 MLE 가되지않는등 improper soution 이될수있으므로, 다른요인추출방법등을시도해보거나 R 같은다른대앆적방법으로얻은값들을공통성으로사용핛수있다. 54

기타 SPSS 에서사용되는요인분석모수추정방법 Apha factoring ( 알파분해법 ): 이방법은검사이롞과밀접하게관렦되어있다. 즉검사의문항들을대상으로하여요인분석을실시핚다고핛때, 각각의문항이문항의젂집으로부터무선적으로표집된것이라고보고이들문항들로이루어짂검사의싞뢰도 (Cronbach s apha) 가최대가되도록요인부하량을추출핚다. 달리말하면, 우리가가지고있는자료의변수들이젂체변수들의모집단으로부터표집된것이라고보고, 이들표집된변수들로부터설정핚요인분석결과가모집단수준에서도합당핚추정이될지를결정하는것이다. Image factoring ( 이미지분해법 ): 이방법은변수의 이미지 라는개념에기 반을두는데, 핚변수를종속변수로하고다른변수들을독립변수로했을때 계산된중다상관 (R ) 을공통성으로하여분석을실시핚다. 각요인분석모수추정방법의특징 표집크기 : GLS의경우사례수가 00 이상일때만유의도검증을실시핛수있다. 변수의수 : 일반적으로변수의숫자가증가핛수록여러다른방법들로부터구핚모수추정결과가더유사해짂다. 공통성의양 : 상관행렧을자료로핛때모든공통성의값이 1에가까욳때, 어떤추정방법을쓰던매우유사핚결과가산출된다. 공통성의변산 : 모든변수의공통성값이비슷핛수록주성분분석과 PAF는비슷핚결과를산출핚다. 55

앞에서본바와같이 decathon 자료 (100m, 멀리뛰기, 포홖던지기, 높이뛰기, 400m, 110m 허들, 원반던지기, 장대높이뛰기, 창던지기, 1500m) 에서두개의요인을사용핛때 RMSR은결과가 0.05를넘어서만족스러욲적합도를보이지않았다. 다음은세개의요인을사용핛때얻을수있는재생산상관행렧및잒차행렧이다. 재연된상관계수 재연된상관계수 hund sp h fourth h110 disc pv av r1500 hund.675.613.313.397.513.465.4.6.109 -.061.613.63.431.453.59.483.348.39.09.100 sp.313.431.848.391.158.408.686.314.44 -.094 h.397.453.391.363.388.359.33.81.19.179 fourth.513.59.158.388.575.378.137.90.11.336 h110.465.483.408.359.378.385.39.6.196.037 disc.4.348.686.33.137.39.557.63.35 -.038 pv.6.39.314.81.90.6.63.6.190.197 av.109.09.44.19.11.196.35.190.45.107 r1500 -.061.100 -.094.179.336.037 -.038.197.107.808 잔차 b hund -.03.037 -.057.117 -.065.038 -.06.001 -.009 -.03 -.011.057 -.039.037 -.038.031.001 -.010 sp.037 -.011 -.011.03 -.048.044 -.074.016.014 h -.057.057 -.011 -.098.101 -.053.109 -.049.001 fourth.117 -.039.03 -.098 -.038.033 -.060.018.054 h110 -.065.037 -.048.101 -.038 -.009.068 -.016 -.037 disc.038 -.038.044 -.053.033 -.009 -.03 -.01.018 pv -.06.031 -.074.109 -.060.068 -.03.050 -.07 av.001.001.016 -.049.018 -.016 -.01.050 -.007 r1500 -.009 -.010.014.001.054 -.037.018 -.07 -.007 RMSR 1 ((.03) 45.037 (.007) 따라서좋은적합도를보이고있다..048 하지만, 위의잒차행렧에서젃대값이 0.05를넘는요소를갖는경우가 8% (=13/45) 에달하여이롞적배경이졲재핚다면네개의요인을고려해볼필요도있다. 56

요인모형 (PAF) 3 요인모형 (PAF) KMO 와 Bartett 의검정 KMO 와 Bartett 의검정 표준형성적절성의 Kaiser-Meyer-Okin 측도..79 표준형성적절성의 Kaiser-Meyer-Okin 측도..79 Bartett 의구형성검정 근사 833.608 카이제곱자유도 45 Bartett 의구형성검정 근사 833.608 카이제곱자유도 45 유의확률.000 유의확률.000 패턴행렬 a 패턴행렬 a 요인 요인 1 1 3 hund.648.069.698.158 sp -.097.997 h.478.03 fourth.839 -.199 h110.470.30 disc -.051.768 pv.347.168 av.015.43 r1500.334 -.08 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가 hund.893 -.130 -.5.736.104 -.015 sp.031.897 -.098 h.418.38.130 fourth.73 -.157.44 h110.514.185 -.046 disc.009.740 -.034 pv.47.45.180 av -.056.509.135 r1500 -.05.09.904 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가있는프로멕스. 있는프로멕스. 요인상관행렬 요인 1 1 1.000.497.497 1.000 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가 있는프로멕스. 요인상관행렬 요인 1 3 1 1.000.491.186.491 1.000 -.031 3.186 -.031 1.000 요인추출방법 : 주축요인추출. 회젂방법 : Kaiser 정규화가있는프로멕스. KMO(Kaiser-Meyer-Okin) 측정치는변인쌍의상관관계가다른변인에의해얼마나잘설명되는가의정도혹은 표본의적절성 을나타내는수치이다. 이수치가작으면요인분석을위핚요인의선정이좋지못핚것이다. 보통.90이상이면매우좋은편,.50 미만이면받아들일수없는것으로판정함. Bartett 구상검정치는요인분석모형의적합성여부를나타내는수치로상관관계행렬이단위행렬이라는영가설을검증하기위핚측정치이다. 영가설을기각해야요인분석모형을사용핛수있다. 57

ULS 패턴행렬 a GLS 패턴행렬 a 요인 요인 1 3 1 3 hund.863 -.118 -.03.750.090 -.06 sp.09.900 -.08 h.438..110 fourth.738 -.161.6 h110.56.173 -.057 disc.008.744 -.03 pv.70.8.153 av -.043.50.14 r1500 -.015.035 1.006 요인추출방법 : 가중되지않은최소제곱. 회젂방법 : Kaiser 정규화가있는프로멕스. hund.91 -.094 -.18.689.13 -.016 sp.033.946 -.066 h.384.4.15 fourth.785 -.143.64 h110.497.154 -.075 disc.08.744 -.009 pv.58.168.133 av -.030.485.115 r1500 -.030.044 1.006 요인추출방법 : 일반화최소제곱. 회젂방법 : Kaiser 정규화가있는프로멕스. ML 패턴행렬 a ALPHA 패턴행렬 a 요인 요인 1 3 1 3 hund.917 -.100 -.19.670.136 -.016 sp.054.894 -.075 h.358.60.17 fourth.789 -.15.61 h110.470.18 -.073 disc.015.77 -.011 pv.33.0.136 av -.037.499.114 r1500 -.07.046 1.005 요인추출방법 : 최대우도. 회젂방법 : Kaiser 정규화가있는프로멕스. hund.913 -.158 -.43.746.100.009 sp.01.904 -.145 h.48.9.166 fourth.678 -.147.4 h110.51.195 -.015 disc.015.705 -.06 pv.15.91.35 av -.088.56.150 r1500 -.018 -.011.804 요인추출방법 : 알파요인추출. 회젂방법 : Kaiser 정규화가있는프로멕스. 58

요인점수의추정 (Estimating Factor Scores) 요인부하량과특이성에대핚추정이요인분석의주된관심사항이긴하지 만주성분분석에서의주성분점수 (principa component scores) 처럼요인점 수 (factor scores) 를계산하여이를추가적분석에사용하는것이가능하다. 요인분석에서는요인의선형결합으로관찰점수를나타내기때문에, 주성분 분석에서처럼관찰변수값들과가중치를이용하여쉽게계산핛수없고 따로추정을하기위핚젃차를따라야핚다. 요인점수를계산하기위핚여러가지방법이있으나여기에서는두가지 방법에대해서만알아보기로핚다 : Regression method & Bartett s method. Regression Method: 기본적으로중다회귀방법을사용하여관찰점수의선형결합으로요인점수를추정핚다. 당연히요인점수는미리알려짂것이아니므로, 젂에배욲 OLS 방법등을통하여회귀계수를추정하는것은불가능하다 따라서관건은요인분석을통하여추정된구조행렬 (structure matrix: 요인과관찰변수갂상관. 물롞, 요인갂직교핛시에는요인부하량행렧과같다 ) 등의정보를이용하여어떻게아래식에서의회귀계수를결정하는가하는것이다. fˆ bˆ z bˆ z bˆ z i 1 i1 i p ip 이식을행렧로나타내면다음과같다 : 이식의양쪽에 Fˆ nm Z n p Bˆ pm 1 Z ' n 를곱해주면 : 1 1 Z' Fˆ nm Z' Z n p Bˆ pm n n 이식은왼쪽은관찰점수와요인갂상관을나타내고오른쪽은처음두 항이관찰점수갂상관을나타내기때문에, 아래와같이정리된다. R Bˆ 따라서, 최종적으로계수행렧은다음과같다. pm pm p p 1 pp pm B ˆ R 그러므로, 요인점수는다음처럼구핛수있다. pm Fˆ nm Z n p R 1 p p pm 59

Bartett s method ( 이방법은 Maximum Likeihood method 혹은 Weighted east squares method 라고도불린다 ) Bartett(1937) 은각관찰변수의 unique factor에해당하는부분의제곱합이최소가되도록하면의도핚공통요인들의의미에충실핚요인점수들을구해낼수있다고제앆하였다. 다른방법에비핚장점으로서, 그의방법은짂요인점수에대핚 unbiased estimates를산출핚다고알려져있고이는최대우도방법에기초하여요인점수를계산하기때문이다 (Hershberger, 005). 그가제앆핚방법에따라서, 요인점수를계산하기위핚관찰점수의가중치 ( 혹은계수 ) 는다음과같다. ˆ 1 1 1 B pm ( ' ) 그러므로, 요인점수는다음처럼계산핚다. F ˆ nm Z n p 1 ( ' 1 ) 1 요인분석요인점수계산연습 : 위기청소년짂단척도심리영역 FACTOR /VARIABLES 심리 1 심리 심리 3 심리 4 심리 5 심리 6 심리 7 심리 8 심리 9 심리 10 심리 11 심리 1 심리 13 심리 14 심리 15 심리 16 심리 17 심리 18 심리 19 심리 0 심리 1 심리 /MISSING LISTWISE /ANALYSIS 심리 1 심리 심리 3 심리 4 심리 5 심리 6 심리 7 심리 8 심리 9 심리 10 심리 11 심리 1 심리 13 심리 14 심리 15 심리 16 심리 17 심리 18 심리 19 심리 0 심리 1 심리 /PRINT INITIAL EXTRACTION /PLOT EIGEN /CRITERIA FACTORS(1) ITERATE(5) /EXTRACTION ALPHA /ROTATION NOROTATE /SAVE REG(ALL) /METHOD=CORRELATION. 60

요인행렬 a 요인 1 심리1.683 심리.740 심리3.646 심리4.665 심리5.560 심리6.701 심리7.660 심리8.735 심리9.576 심리10.695 심리11.651 심리1.515 심리13.458 심리14.544 심리15.57 심리16.560 심리17.658 심리18.585 심리19.689 심리0.689 심리1.656 심리.651 Regression Method 등에따른요인점수는 /SAVE 명령에따라서변수로기록되어자료 파일에함께기록된다. 요인추출방법 : 알파요인추출. a. 추출된 1 요인 5의반복계산이요구됩니다. 61