Chapter 5. Factor Analysis ( 요인분석 ) 5.1 개요 * 변수들의상관관계를이용하여요인 ( 공통개념 ) 을구하고이를이용하여 1) 변수들을분류 2) 그룹에적절한의미를부여 Ex) * 학생들의학교만족도 조교, 행정인력, 강의실, * A 기업지원자 48

Similar documents
Microsoft Word - Chapter7.doc

Microsoft Word - SPSS_MDA_Ch6.doc

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx

슬라이드 1

4 장주성분분석 ( PCA: Principal Component Analysis) 예 1 ) 바지구입 - 우리몸의치수모두를알아야하는가? - 변수 : 허리둘레, 기장, 엉덩이둘레, 허벅지둘레, 무릎높이 - 허리둘레, 기장두변수면충분 ( 이것이주성분분석의개념 ) 즉, 원변

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

슬라이드 1

statistics

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

시스템경영과 구조방정식모형분석

Microsoft PowerPoint - IPYYUIHNPGFU

슬라이드 1

G Power

Microsoft PowerPoint - MDA DA pptx

(001~006)개념RPM3-2(부속)

R t-..

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정


Microsoft PowerPoint - LM 2014s_Ch4.pptx

Microsoft Word - SAS_Data Manipulate.docx

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

제 4 장회귀분석

Microsoft Word - skku_TS2.docx


Microsoft PowerPoint - 26.pptx

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

R

PowerPoint 프레젠테이션

설계란 무엇인가?

31. 을전개한식에서 의계수는? 를전개한식이 일 때, 의값은? 을전개했을때, 의계수와상수항의합을구하면? 을전개했을때, 의 계수는? 를전개했을때, 상수항을 구하여라. 37

LM_matrix.pages

Microsoft Word - ch8_influence.doc

= ``...(2011), , (.)''

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각

13. 다차원척도법 (MultiDimensional Scaling) 13.1 개념및목적 다차원척도법 (mds) 는다차원관측값또는개체들간의거리 (distance) 또는비유사성 (dissimilarity) 을이용하여개체들을원래의차원보다낮은차원 ( 보통 2차원 ) 의공간상에


자료의 이해 및 분석

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

에듀데이터_자료집_완성본.hwp

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

PowerPoint Presentation

01

MATLAB and Numerical Analysis

Microsoft PowerPoint - chap06-2pointer.ppt

PowerPoint Presentation

프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음

PowerPoint 프레젠테이션

체의원소를계수로가지는다항식환 Theorem 0.1. ( 나눗셈알고리듬 (Division Algorithm)) F 가체일때 F [x] 의두다항식 f(x) = a 0 + a 1 x + + a n x n, a n 0 F 와 g(x) = b 0 + b 1 x + + b m x

PowerPoint Presentation

Microsoft PowerPoint 상 교류 회로

Microsoft Word - ch4_multiple.doc

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

일반각과호도법 l 삼각함수와미분 1. 일반각 시초선 OX 로부터원점 O 를중심으로 만큼회전이동한위치에동경 OP 가있을때, XOP 의크기를나타내는각들을 ( 은정수 ) 로나타내고 OP 의일반각이라한다. 2. 라디안 rad 반지름과같은길이의호에대한중심각의 크기를 라디안이라한

Microsoft Word - Software_Ch2_FUNCTION.docx

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

CHU 통계교육 Workshop (DAY 7. MDA 군집분석 ) 1. 개념 Individual Directed Technique + 범주 ( 그룹 ) 에대한사전정보가없음 + 다변량측정치를동시에고려하여데이터개체분류 + 개체의유사성 (simila

PowerPoint 프레젠테이션

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint


adfasdfasfdasfasfadf

untitled

Microsoft PowerPoint Relations.pptx

Python과 함께 배우는 신호 해석 제 5 강. 복소수 연산 및 Python을 이용한 복소수 연산 (제 2 장. 복소수 기초)

½½¶óÀ̵å Á¦¸ñ ¾øÀ½

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )

Microsoft Word - LectureNote.doc

선형계수값이크거나선형계수값이작은것을기준으로취업현황, 직업만족도, 연령층 취업현황이라이름을지었습니다. 그이유로첫번째로주성분 1 인취업현황은취업률, 실업률, 여성취업률, 청년실업률을보았을때취업률이높을때와여성취업률이양의값 으로높을때취업현황은좋다고판단할수있고실업률과청년실업률이

슬라이드 1

수리영역 5. 서로다른두개의주사위를동시에던져서나온두눈의수의곱 이짝수일때, 나온두눈의수의합이 또는 일확률은? 5) 의전개식에서상수항이존재하도록하는모든자 연수 의값의합은? 7) 다음순서도에서인쇄되는 의값은? 6) 8. 어떤특산

실험 5

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

PowerPoint 프레젠테이션

MATLAB for C/C++ Programmers

PowerPoint Presentation

외국인투자유치성과평가기준개발

<B1B9BEEE412E687770>

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

Microsoft PowerPoint - chap06-1Array.ppt

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

슬라이드 제목 없음

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

- 89 -

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>


이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]

제 2 교시 2019 학년도 3 월고 1 전국연합학력평가문제지수학영역 1 5 지선다형 1. 의값은? [2점] 일차방정식 의해는? [2 점 ] 두수, 의최대공약수는? [2 점 ] 일차함수 의그래프에서

소성해석

Microsoft PowerPoint - LA_ch6_1 [호환 모드]

cat_data3.PDF

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

슬라이드 1

Transcription:

Chater 5. Factor Anaysis ( 요인분석 ) 5. 개요 * 변수들의상관관계를이용하여요인 ( 공통개념 ) 을구하고이를이용하여 ) 변수들을분류 ) 그룹에적절한의미를부여 Ex) * 학생들의학교만족도 조교, 행정인력, 강의실, * A 기업지원자 48 명의능력측정 5 개항목점수분류 * 기업관련지표 0 개항목 ( 매출액, 종업원수, 부채비율 ) Cassic French Engish Math Dis. Music Cassic 0.83 0.78 0.7 0.66 0.63 French 0.67 0.67 0.65 0.57 Engish 0.64 0.54 0.5 Math 0.45 0.5 Discovery 0.4 Music Searan 은변수간에내재된공통개념 (: 이를 actor 라함 ) 부분과랜덤부분 (ŋ) 으로나눌수있다고생각. 학생들의지적능력은일반적재능으로해석되는인자 (), 각과목에대한특별재능 (ŋ) 으로나눌수있다고믿음. ) 모형 5.. 개념 Searan(904) 6 개분야능력에의해학생들의 inteigence 측정 상관계수에의해 6 개분야를적절히그룹화가능? ( 언어, 수리능력 ) 그러나상관계수복잡하게얽혀있음 cassic rench engish ath discover usic λ λ λ λ λ λ 3 4 5 6 + η + η + η + η + η + η 3 4 5 6, actor actor Error Coon actors

) 도식화 actor 요인의부하 (oading) 값을구하는방법으로주성분을이용한방법을가장많이사용하므로주성분분석과유사하다. 주성분분석 요인분석 c r en a Di Mu 주성분은원변수의직교선형결합 인자들의직교선형결합으로원변 η 6 으로표현 수들을표현 η η η 3 η 4 4 η 5 YLX, L은선형계수행렬주성분은변수들의변동을설명 XLF+η, L 부하행렬, F 관측불가요인은변수들의분산-공분산구조설명 actor actor 5.. 주성분분석과비교 (.7) ) 주성분분석 : 개의원변수를 ~개로축약원변수들의선형결합으로만들어짐모든원변수의영향이있음 ) 요인분석 : 개의변수들간의상호관계 ( < ) 개의변수그룹으로나눔그룹내변수들간에는상관계수가높고다른그룹변수간에는상관관계가낮다. 요인분석이나주성분분석의 L을구하는방법유사하다. 공분산행렬, 상관행렬로부터고유치그에대응하는고유벡터를이용선형계수행렬 L은변수의개수축부하행렬 L은변수에내재된관계약하는데사용되며는주성분의이를알아보는데사용되며는변수들름을붙이는데사용을그룹화하는데사용 적절한인자의수를구하고이를 적절한주성분의수를구하고주이용하여변수들을그룹화하고그성분의이름을부여하고주성분점룹을이용하여변수에내재된관계수를계산한다. 를알아본다. 데이터스크린, 이상치발견, 개체 요인점수를주성분점수와유사하군집 / 판별등에이용게활용가능

5. 모형 5.. 목적 () 원변수에내재된관계를설명한공통개념탐색 () 공통개념 ( 요인 ) 의개수를선택 (3) 요인의부하값을이용하여원변수를그룹화하고절적한이름을부여한다. 5.. 모형및가정 ` x x, x,, ) 의평균벡터를 μ, ( 공분산행렬 x x x x ) 모형에대한설명 η η + η x i 는 i 번째원변수 x: 원변수벡터 x L + η (4) 그룹내변수들로새로운변수를만들어개체들을평가하고향후연구에활용한다.,, : 요인벡터 공통요인 (coon actor) 3 ij 는 i번째변수에 j번째요인이미치는영향 L: 부하행렬 (actor oading atrix) 4 η j 는 j 번째원변수에대한오차항, 특정요인 (seciic actor) 라함

) 모형에대한가정 k 는서로독립이고평균 0, 분산 인동일분포를따른다.( k,,3 ) ` E ( k ) 0, Cov( k ) E ( kk ) I iid ~ (0, I ) η j 서로독립이고평균 0, 분산 ψ i 인동일분포를따른다. (j,,,) E ( η) 0, Cov( η) ψ η ψ 0 0 ~ iid(0, ψ diag( ψ, ψ,.., ψ ψ 0 0 0 ψ 0 0 0 0 ) 즉, ψ 는대각행력이다. 3 i 와 η i 는서로독립이다 Cov( η, ) 0

5..3 모형해석 ) 공통요인은원변수공분산을완전히설명한다그러므로, 즉, 인자모형에서 개의분산과 (-)/ 개의공분산구조는 개의인자적재와 개의특정분산에의해생성. 왜냐하면 ψ 은대각행렬으므로대각원소를제외하면 0 이다. ψ ψ ) ( η) ( ) ( + + + Σ LL L LCov L Cov x Cov ),..,, ( (0, ~ diag ψ ψ ψ ψ η η η η η + + L x x x x 행렬로정리를하면다음과같다. ) i 번째원변수의변동 ( 분산 ) 은 - 공통성 (counaity)+ 특정분산 (seciic variance) 공분산행렬대신상관계수행렬을이용한다면대각원소가 이므로 i k ik i i i i ii i x Var ψ σ ) ( + + Ψ + + + + i k ik ψ + + + j j j j j j j j j ψ ψ σ σ σ σ σ σ σ j j j j j j j j j j j j j j j ψ σ σ ψ + Σ ' L L ij ψ i

(3) i 번째변수 x i (i 번째변수 ), 원변수 x j (j 번째변수 ) 의공분산 cov( x, x ) σ i ik jk k j ij i j + i j + + i j - 원변수 x j (j 번째변수 ), 요인변수 k (k 번째요인 ) 의공분산 5.3 요인구하기 5.3. 요인방정식풀기 상관계수행렬 (R) 을이용하여요인을구하는방법 () 상관계수행렬 R 에대해 RLL`+Ψ 을만족하는 요인부하행렬 L 과 ψ 가존재할때, 또다른직교행렬 P 에대해다음이성립하므로 RLIL`+ψ(LP)(LP)`+ψL * L *`+ψ 요인부하행렬은무수히존재한다. cov( x i, k ) ik () L,ψ 의미지수개수를보면 (+) 이고행렬 P 로부터추정할수있는값의개수는 (+)/ 이므로방정식수보다미지수개수가많아해가무수히많이존재한다. 만약 인경우는 LL` 로유일하게분해되고 ψ0 이다. ( 이경우는주성분분석방법이다 ) (3) (<) 인경우어떤 L 을이용할것인가? 얻어진요인을해석하는데용이하도록요인변환 (actor rotation) 을실시하여그값을이용 ( 예. SAS 에서 ROTATEVARIMAX 옵션사용 )

5.3. 해를구하는방법 () 종류 () 주성분방법 (Princia Coonent ethod) 원변수공분산행렬 ( 상관계수행렬 )R 로부터고유치고유벡터를구한다. ( 주성분과동일 ) 즉, i) 만일 λ λ λ, e, e,, Σ [ 즉, ii) 만일 < 인경우 λ e Σ λ e λ ' ' ' ee + λee + λ e e λ e ' λ e ' λ e ] ' λ e Ψ 0 + - 0 0 0 Ψ 0 LL + Ψ 0 Ψ 그러므로, i번째공통요인에의해원변수의설명변동크기는 λ i 이다. i번째공통요인의원변수에대한설명능력다음과같다. - - e 상관계수행렬 (R ) 로부터구한주성분 y y,,, λ λ y y,, 을정의하여, 요인의 L( ij ) 과주성분의 L( ij ) 관계 i y i λi 주성분방법을사용하여요인방정식의해를구하는경우요인분석과주성분분석은동일하다. 다른점 : 주성분점수 (YLX) 는원변수의선형결합이나요인점수는추정 (XLF) 해야한다 (6). () 최대우도추정방법 (Maxiu Likeihood Method) 원변수가다변량정규분포가정하에서 j 와 ŋ j 가서로독립이고, x j 가다변량정규분포를따른다는가정 최대우도추정법으로 L, ψ을구한다. L 의초기치로다중상관계수제곱을취하고큰공통성을가진변수에는큰가중치를주게되므로공통성의추정치가 이상이되는 Heywood 가발생한다. 이상황에서는 Ψ 의추정치가음이된다. ( 사용불가 ) y λ y

5.4 맛보기 (Aicant.txt) - 주성분분석 : 원변수의변동을잘설명하는주성분을찾는것으로단위차이가없다면공분산행렬 (S) 를이용 () SAS 프로그램 (7) - 요인분석 : 변수의내재된관계를이용하여변수를분류하는방법으로상관행렬이용 - 주성분에서상관계수행렬로고유치, 고유벡터를구하면, 요인분석의고유치, 고유벡터와동일하다. 예제 (3 장 ) 예제데이터의 5 개변수에대해서주성분분석 ( 상관계수행렬이용 ) 과요인분석결과를비교해보자. 지원자 48 명중우수지원자 6 명을선발하고자 5 개항목에대해평가 - 자료를 SAS 로불러옴. ID( 지원자번호 ). Letter( 이력서 X) 3. Aearance( 외모 X) 4. Acadeic Abaity( 학교성적 X3) 5. Likeabiity( 친밀감 X4) 6. Se-Conidence( 자신감 x5) 7. Lucidity( 명석 x6) 8. Honest ( 진실 x7) 9. Saesanshi( 마케팅능력 x8)... - 만약원변수들이다변량정규분포를따른다는가정이성립한다면최대우도추정방법을사용할수있다. 6. Suitabiity( 업무적합성 X5)

() 주성분분석결과 (Proc rinco ; ) (3) 요인분석결과 ( Proc Factor ;)

주성분방법에의해구한요인분석의고유치는주성분분석의고유치와동일하다. 두방법모두상관계수행렬로고유치구해서 i번째요인의 j 번째원변수에대한 oading( 부하 ) 값은 ij λi ij ( 주성분선형계수 ) 이다. Ex) 제일주성분 y 의원변수 AP 의계수에고유치 (λ ) 의제곱근을곱하면 ( 7.538 0.3) 요인 의 AP 부하값 ( 0.584) 와동일하다. 3 부하의의미는공통개념 ( 요인 ) 이원변수에미치는영향정도를나타내는값이므로부하가크다는의미는공통개념에의해원변수가잘설명되고있음을의미한다. 5 그룹화 * 요인 의경우부하값이상대적으로큰것을묶으면그변수들은같은그룹에속한다. (LC 명석, SM 마케팅, DR 추진력,AM 야망, GC 개념파악능력,PO 잠재력 ) 마케팅능력 마케팅능력 (LC+SM+DR+AM+GC+PO)/6 * 요인 에서부하값이큰것을묶는다. (L 이력서, EX 경험, SU 업무적합성 ) 회사경험 회사경험 (L+EX+SU)/3 * 요인 3 에서부하값이큰값을묶는다. (LI 친밀감, KJ 화합 ) 적응력 * 요인 4 (AA 학교성적 ) 4 요인부하값의크기는변수를그룹화하는데사용

5.5 요인개수결정 () 요인개수결정시고려사항 () 부하값의의미는각요인이원변수를설명하는정도 ( 크기 ) 를나타내며요인은변수들에내재된관계에서공통부분에해당한다. x x x 부하값의절대값이큰것들만 ( 음의부호는 동일개념의반대척도 ) 선택하여변수들을 그룹화하면된다. η η + η actor actor Error Coon actors 사소한요인은제외하자. - 원변수 - 개에만부하값이큰요인에의해묶을수있는변수는 - 개이므로변수그룹의의미가없다. Kaiser 판단 ( 가장많이이용, SAS 도활용 ) - 고유치가 이상인것만으로요인의개수정한다. 3 SCREE 그림활용 ( 주관적, 자주사용않음 ) - 주성분분산설명변동의크기가갑자기줄어들기바로전까지의개수로적절한인자개수사용 4 Large-sae Test( 카이제곱검정 ) - MLE 에의해요인방정식해를구하는경우요인개수를결정하기위한검정방법으로적합성검정을실시한다.

5.6 요인회전 예제 () 개념 요인부하값에의해원변수를그룹화한다, but 요인의복합성 : 하나의원변수에부하값이큰요인이 개이상존재하거나 인자의크기가 0 을중심으로 ± 의작은값이있는경우부하값으로변수를그룹화하는것은불가능하다. () 방법 VARIMAX 방법 각요인이상대적으로큰부하값을갖도록요인을회전 (rotate) 방법 : QUARTIMAX rotation, OBLIQUE rotation, PROMAX rotation, VARIMAX(*) VARIMAX 방법 : (Kaiser 제안 ) 간단한구조측정치로부하행렬의분산을최대화하는회전방법 (3) 조건 요인의개수 < 인경우, LL`+Ψ 을만족하는행렬 L 은무수히많이존재하기때문에요인회전이가능하다.

5.7 예제 5.7. 데이터설명 (POLICE.TXT) 경찰에지원한 50 명의신체적특성 5 개를측정한것이다. 5.7. SAS 프로그램 이프로그램은요인방정식해를구하는방법으로 rincia actoring 방법을사용하였고, 요인회전방법은 VARIMAX 방법을사용한예이다. 5 개의항목을공통개념 ( 요인 ) 으로분류 요인분석이용 5 개의항목을 ~ 개의축약된변수 주성분분석이용 Maxiu Likeihood 방법을사용할경우

5.7.3 요인개수 - 상관행렬을사용하면고유치가설명하는분산변동의합은변수개수 P(5) 이고, 각고유치의평균설명력은 이다. -Kaiser 제안방법을이용한다. 고유치가 이상인요인만출력. -MINEIGEN(iniu eigen vaue) 의의미는다른옵션이설정되지않았으므로디폴트로고유치가 이상인요인들만출력한다는의미이다. - 요인패턴 ( 요인부하값 ) 은특별한옵션이없으면크기가 이상인고유치개수만큼출력된다. 요인패턴을원하는만큼출력하려면 NFACTORS 옵션을사용하면된다.

5.7.4 부하값 : 요인이원변수를설명하는정도의크기 * 요인회전전결과 요인 : weight( 체중 ),chest( 가슴넓이 ), at( 비만 ) 적절한그룹이름부여 (5.7.6 에서 ) 요인 : recvr( 제자리달리고 5 분후맥박 )0.66, seed( 제자리달리기최대속력 )-0.76 두변수는반대개념, 즉맥박은속력과반비례한다고설명 3 요인 3: height( 키 ), use( 맥박 ), breath( 폐활량 ) 4 요인 4: diast( 심장혈압 ) 5 요인 5 : react( 반응시간 ) + x x x η η η

5.7.5 공통성 Var( xi ) ii i + i + + i + Ψi ik k * 공통성결과 σ + ψ i ENDUR 변수는 5 요인들에의해설명되는정도가낮다. 이변수는아마 5 개의변수그룹어디에도포함되지않을가능성이높다. * 이변수를가장잘설명할공통요인은요인 6~ 요인 5 중하나일것이다. 5.7.6 변수그룹 앞의요인회전전결과에서, 번째변수 REACT 의요인 ~ 요인 5 부하값의제곱이공통성을나타낸다. - 요인의부하가크다는것 그요인에의해영향을많이받는다는것 부하값이큰원변수묶음 - 요인회전을통해부하값의크기를쉽게비교 -VARIMAX 방법사용, REORDER 옵션 ( 크기순 ) 0.577 + 0.3649 + 0.76 + 0.0668 + 0.9008 0.9009 (00%) 에가까운값이면그변수의변동이선택된요인에의해거의모두설명된다는의미이고낮으면다른요인이존재한다는것.

() 요인회전된결과 3 그룹화 - 요인 : FAT( 비만도 ), THICHP( 허벅지두께 ), CHEST( 가슴둘레 ), CHNUP( 턱걸이 ) 몸집비대변수 (FAT+THICHP+CHEST+CHNUP)/4 비만도지수 - 요인 : HEIGHT( 키 ),SHLDR( 어깨넓이 ), PELVIC( 골반넓이 ), WEIGHT( 체중 ), BREATH( 폐활량 ) 신체골격구조변수 - 요인 3: PLUSE( 맥박 ), RECVR(5 분후맥박 ) 심장지구력 - 요인 4 : DIAST( 심장혈압 ) 직교변환된요인들을이용하여변수그룹을만들수있는데적절한이름을부여하기위해서변수에대한지식과경험이필요. REORDER 옵션은크기순으로정렬될뿐 아니라 각요인별로크로스체크하여가장 큰요인에 넣는다. EX) WEIGHT 의경우요인 에 0.65 인데, 요인 에서 0.68 로더크기때문에요인 에포함 - 요인 5: REACT( 반응시간 ) 이는하나씩분류되기때문에변수분류에의미가없다. - 즉 5 개의변수 개의그룹과개별변수로묶음

() 개그룹 ( 비만지수, 신체골격 ) 에대한평균 (CHNUP 의부하값은음이므로 를붙여준다 ) *FAT_INDEX 에의해정렬된결과 * Sas 프로그램

(3) 회전전요인과회전후요인비교 회전된요인에의해원변수의변동을설명하는부분이회전되지않은경우와다소다르다. 그러나선택된요인들에의해설명되는각변수의공통성은같다. 3 요인회전에따라부하값이다르다. 변수그룹및해석이요이한방법을사용 요인회전전부하값 4 다소주관적이라는단점은있으나최적의요인회전방법이존재하는것은아니므로여러방법을적용해보는것이바람직하다. 5 요인회전방법에의해다양한부하값이계산되므로하나의선형계수를산출하는주성분분석에비해요인분석이선호되는이유이다. 요인회전후부하값

5.7.7 부하값산점도그리기 () 요인분석의통계량값을 OUTSTAT 옵션에의해 F_STAT 이름의 SAS data 에저장하고출력한것이다. () UNROTATE 회전되지않은요인의부하값 - 결과 - PATTERN 회전된요인의부하값 -SAS 프로그램 -

(3) 필요한데이터를 SUBSET 하고전치를한다. _TYPE_ PATTERN 에의해 SAS 데이터 TEMP 를만들었다. - 회전된요인의부하값만출력 -SAS 프로그램 -

(4) 요인과요인의산점도요인3 원변수 개요인4,5 원변수 개변수가적기때문에요인을 개로만선택적당 -SAS 프로그램 ( 산점도 )- Factor Factor

5.8 요인점수 (actor score) : 각개체의요인값을요인점수라한다.( 주성분점수와유사 ) 개체이상치진단, 개체판별및군집과같은 차분석 주성분분석 : 선형결합이므로고유벡터에의해계산 요인분석 : 오차항 (ŋ) 이있어서바로계산될수없다. - 가지방법을사용 -Bartett s Method(Weighted Least Square Method) -Thoson s Method(Regression Method) SAS 이용하기 () SCORE 옵션을사용하면인자점수를구할때사용되는계수가출력된다. ) ( µ r x r z r r z L L L ˆ ˆ ˆ) ˆ ˆ ( ψ ψ I L' L P N z, 0 0 ~ L P z z E ' ) ( r r z R L ' η η η η + + L x x x x

() 요인개수를반드시지정해주어야한다. 요인의개수를 로지정하면요인 5 개를사용했을 때의부하값과동일하지않다. (3) 요인을 개만사용하였으므로그룹변수는다름 요인이 개일때 그러나각요인에의해설명되는원변수변동은고유치의크기와같으므로동일하다. 요인이 5 개일때 요인이 5 개일때 요인이 개일때

(4) 표준화점수계수 (6) 요인점수가필요한가? * 요인점수를주성분점수와동일한개념으로사용 * 요인분석의주목적은변수분류임으로요인점수를구할필요가없다. 주성분점수를사용하여 차분석 ( 회귀분석, 다중공선성해결, 판별분석등 ) 에사용하는것이보수적연구방법론이다. (5) SCORE 을출력한결과 ( 요인점수 ) * 요인점수는아래와같은분석에사용하기를권함. 속성과단위가동일한변수들분류, 그룹내변수들만평균을계산하여새로운지표로사용 속성이나단위가상이한변수, 요인점수계산하여요인점수의산점도를이용한이상치진단이나개체군집에활용

5.9 Coent SAS 이용하기 5.9. 요인개수검정 공통개념인요인은고유치가 이상인경우선택 각요인들의부하값에의해원변수들이분류된다. * 경찰데이터에서요인이 5 개가선택이됨 EDURE 변수의경우 5 개의요인어느것에도공통인자의역할을하지못함 더많은요인이필요한지검정 * 요인개수검정방법으로 x -검정방법을사용우도함수가정의될수있어야함으로다변량정규분포를따른다는가정하에 ML (Maxiu Likeihood) 방법에의해서만가능 HEYWOOD 옵션 공통성값이 이상인것을방지 ML 방법이용하여추정하는경우반드시함께사용

Ex) 가설검정 ) 가설설정 H0: 5 개요인이면충분하다 Ex) 요인의수를임으로줄이려할때 * 경찰데이터의경우요인 5 개가적정수준이지만 개로줄일수있는지에대한검정 ) 검정통계량 X 53.7839, -vaue0.074 3) 기각역및결과 유의수준 5% 하에서귀무가설을기각하지못함 즉, 귀무가설을기각하지못하므로 5 개요인으로충분하다 ) 가설설정 H0: 개요인이면충분하다

() 상관계수와요인분석관계 변수를그룹화하는것은결국변수들간의상관관계가높은것을묶는다는의미이다. 하지만겹치는부분이많아어려움 요인분석 ) 검정통계량 X 40.478, -vaue0.000 *SAS 프로그램 (POLICE 예제 ) 3) 기각역및결과 유의수준 5% 하에서귀무가설을기각한다. 즉, 개요인으로충분하지않다. *NAFACTOR3,4 기각 즉, 최적의요인개수는 5 개로 Kaiser 규칙과동일

FACTOR FACTOR

5.0 설문분석에활용 - 요인분석이언제설문분석에이용될수있을까? 리커트척도로조사된문항을그룹화하는데사용 즉, 유사한여러문항들을합쳐하나의지표점수로사용할수있느냐를알아볼때요인분석이사용됨. x x x 그룹의수 : 고유치가 이상인요인에따라결정 그룹에어떤문항이묶여지는가 : 부하값에의해 요인분석에의해변수가그룹이가능하려면 리커트척도문항이어야한다. η η + η ( 즉, 변수의속성과단위가모두동일해야한다 ) 여러문항들을몇개의그룹으로묶으려는목적에서실시되어야한다. 5.0. 설문예제대학생학교만족도설문조사중일부내용으로시설물만족도관련문항들이다 (Coding.txt) 요인분석을통해 9 개시설물문항의하위영역을구성하려고한다. () 시설물관련설문문항들 (9 문항 ) Q4. 경성대학건물안의공간은? 매우쾌적하다 7 6 5 4 3 매우답답하다 Q5. 경성대학건물안팎의휴식공간은? 매우청결하다 7 6 5 4 3 매우부족하다 Q6. 강의실공간은수업을하는데있어 ~ 매우여유있다 7 6 5 4 3 매우비좁다 Q7. 강의실안의시설및비품은수업을하기에 ~ 매우잘갖춰있다 7 6 5 4 3 매우부족하다 Q8. 강의시간에보조기자재를이용하는것은? 매우편리하다 7 6 5 4 3 매우불편하다 Q9. 경상대학내에외국어공부를하기위한시설은 매우적절하다 7 6 5 4 3 매우부족하다 Q0. 경상대학내에컴퓨터실습을위한시설은? 매우적절하다 7 6 5 4 3 매우부족하다 Q. 경상대학내에도서관시설은? 매우적절하다 7 6 5 4 3 매우부족하다 Q. 경상대학화장실시설은? 매우청결하다 7 6 5 4 3 매우불결하다

() SAS 프로그램 (3) 시설물에대한만족도를측정한 9 개문항이어떻게그룹화되어하위문항이구성되는지알아보자 - Q~Q35 전체문항

- 결과 -. 실험실데이터나측정데이터인경우 : 고유치가 이상인요인만을택해도누적설명비율이 80% 이다.. 리커트척도문항의경우 : 누적설명비율이낮다. 문항분류에요인분석을사용하는경우원변수의내재된관계를설명하는요인을찾는것이중요하므로요인의개수는중요하지않다. 요인 : 부하의값의크기가 0.6 이상을그룹 Q5~Q8을한그룹으로묶는다. 요인 : Q0, Q 요인 : 강의실만족도그룹 요인 : 정보시설만족도그룹 나머지문항들은개별문항으로간주하고분석 (Q4,Q) 요인의개수가많아지면변수 ( 문항 ) 그룹개수가많아져변수그룹의효과가미미해진다.

5.0. 내적일치도 (interna consistency) : 리커트척도문항들이요인분석에그룹화되면그룹내문항들이하나의개념을얼마나잘표현하는지를나타내는지표를내적일치도라한다. () SAS 프로그램 - 내적일치도의값을나타낸것을 Cronbach α 라한다. - 이값을문항의신뢰도계수값으로나타낼수있다. Cronbach α 0 과 사이의값이고, 에가까울수록내적일치도가높다. 기준값이적절하지않다. (0.6 이상?, 0.7 이상?) - 문항의수가많을수록, 응답자수가많을수록높아지는경향이있기때문이다. 3 값의크기가판단의근거가아니라, 한문항을제외했을때 Cronbach α 값이작아지느냐, 커지느냐를보고그문항을그대로두느냐제외하느냐를판단한다.

() Q5-Q8 의신뢰도계수 (3) Q0, Q 의신뢰도계수 4개문항모두사용시신뢰도계수 : 0.69 Q5를제거시신뢰도계수 : 0.60 3 Q6을제거시신뢰도계수 : 0.64 4 Q7을제거시신뢰도계수 : 0.58 5 Q8을제거시신뢰도계수 : 0.68 개문항의신뢰도계수 : 0.68 변수가 개인경우는제외신뢰도계수가계산될수없다.( 하나를제외하면변수가하나밖에남지않아 ) (4) 신뢰도계수에대한일반적가이드라인은응답자수 00 명, 그룹내문항이 5 개이면 0.7 이상이되어야한다. 문항제외시내적일치도가떨어지므로 4 개변수를하나의그룹으로묶는것이옳다.