Statistics Basic_ko_chapter_01

Similar documents
G Power

자료의 이해 및 분석

Microsoft PowerPoint - SPSS14_모듈별 구성소개

SPSS 공개강좌

슬라이드 1

R t-..

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

확률과통계 강의자료-1.hwp

시스템경영과 구조방정식모형분석

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

untitled

자료의 이해 및 분석

Microsoft Word - EDA_Univariate.docx

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

<4D F736F F F696E74202D20BBF3B0FCBAD0BCAE5FC0CCB7D0B0ADC0C72E BC0D0B1E220C0FCBFEB5D>

슬라이드 1

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

자료의 이해 및 분석

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

Microsoft PowerPoint - IPYYUIHNPGFU

모수검정과비모수검정 제 6 강 지리통계학

<B0A3C3DFB0E828C0DBBEF7292E687770>

methods.hwp

PowerPoint 프레젠테이션

Microsoft PowerPoint - SDA 2014s_Ch3.pptx


슬라이드 제목 없음

PowerPoint Presentation

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

PowerPoint 프레젠테이션

통계학입문

Microsoft Word - SPSS_MDA_Ch6.doc

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

PowerPoint 프레젠테이션

statistics

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - MDA DA pptx

IBM SPSS Statistics 제품 소개 (2017 Aug)

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

SPSS 구성모듈및 Package 모듈 Basic Regression Advanced Trends Categories Conjoint Exact Test Missing Value Classification Tree Complex Samples 주요통계분석 기초통계분석다

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

슬라이드 1

제 4 장회귀분석


자료분석론 - 국민건강영양조사 분석

표본재추출(resampling) 방법

슬라이드 1

Resampling Methods

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

외국인투자유치성과평가기준개발

R

Microsoft PowerPoint - e pptx

제 1 부 연구 개요

고객관계를 리드하는 서비스 리더십 전략

untitled

MATLAB for C/C++ Programmers

행정학석사학위논문 사회에대한공정성인식도가 행복에미치는영향 서울시주민을중심으로 년 월 서울대학교대학원 행정학과행정학전공 정영아

슬라이드 1

10. ..

<4D F736F F F696E74202D20342E20B1E8C1F6C7FC28BFACB1B8C0DAB8A620C0A7C7D120B1D7B7A1C7C120B1D7B8AEB1E2292E >


exp

<4D F736F F F696E74202D20C1A636C1D620C7A5BABBC3DFC3E2B9E6B9FD20B0ADC0C72E >

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

비선형으로의 확장

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차

통계학입문

한국정책학회학회보

통계분석가이드라인 통계 (Statisitcs) 란? Second Language in Science 전남대학교치의학전문대학원임회정 1 2 모집단 (Population) 과표본 (Sample) 통계분석단계 Sampling 추정 1. 귀무가설수립 2.

슬라이드 1

2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd

국가기술자격 재위탁 효율성 평가

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

untitled

Statistics Basic_ko_chapter_04

Chapter 분포와 도수분석

확률 및 분포

4 _ 한국지역정보화학회기획세미나발표논문집

Microsoft Word - LectureNote.doc

통계적 학습(statistical learning)

(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰

adfasdfasfdasfasfadf

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

슬라이드 1

Microsoft PowerPoint - chap06-2pointer.ppt

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - ANOVA pptx

슬라이드 1

통계적 표본조사론 소개

통계적 표본조사론 소개

Transcription:

1. 통계학이란? 통계학은주어진문제에대하여합리적인답을줄수있도록숫자로표시되는정보 ( 자료 : data) 를수집하고정리하며, 이를해석하여신뢰성있는결론을이끌어내는방법을연구하는과학의한분야이다. 1.1 통계학의분야 통계학은크게기술통계학 (descriptive statistics) 과추론통계학 (inference statistics) 으로나눌수있다. 1) 기술통계학 ; 자료를수집하고정리하여도표나표를만들거나자료를요약하여대표값이나변동의크기등을구하는방법을다루는분야를말한다. 2) 추론통계학 ; 자료에내포되어있는정보를분석하여불확실한사실에대한추론을하는분야를말한다. 1.2 통계학의기본용어 1) 모집단과표본 1 모집단 (population) : 관심의대상이되는모든개체의특성을나타내는관측값이나측정값의전체집합이다. 2 추출단위 (sampling unit) : 전체를구성하는각개체들. 3 특성값 (characteristic) : 각추출단위의특성을나타내는값. 4 표본 (sample) : 통계적분석을위하여실제로뽑힌추출단위들의집합. 5 관찰값 (observed values) : 표본의특성값, 관찰된측정값. 2) 통계조사의종류 1 전수조사 (census) : 관심있는모집단전체를조사하는경우로서주로모집단의규모가작은경우에실시한다. 2 표본조사 (sample survey) : 모집단에서추출된표본을가지고조사하는것을말한다. 3) 모수와통계량 1 모수 (parameter) : 모집단의특성을나타내는양적인측도로서주어진모집단을따르는고유의상수이다. 2 통계량 (statistic) : 표본의특성을나타내는양적인측도로서모집단의분포를따르는확률변수이다. 모집단의특성의예 : 모수 ( 상수 ) - 평균 ( ), 분산 ( ), 표준편차 ( ) 등

표본의특성의예 : 통계량 ( 확률변수 ) - 평균 ( ), 분산 ( ), 표준편차 ( ) 등 4) 모수통계학과비모수통계학 1 모수통계학 (parametric statistics) : 모집단의분포에대한가정을필요로하는통계적방법으로대체로연속형의수량적자료를분석할때사용한다. 2 비모수통계학 (non-parametric statistics) : 모집단의분포에대한가정을필요로하지않으며질적자료혹은비연속형의수량적자료를분석할때많이사용한다. 1.3 자료의형태와변수의종류 1) 변수 (Variable) 변수란조작화된개념으로성별이나연령, 교육수준등과같이둘이상의값 (value) 이나범주 (category) 를갖는개념을말한다. 이와반대로오직하나의값이나범주만을갖는개념을상수라고한다. 즉, 변수는관찰대상이갖는특성이다. 변수는크게질적변수와양적변수로나눌수있으며, 양적변수는다시이산형 (discrete) 변수와연속형 (continuous) 변수로나눌수있다. 질적변수는성별에서남자, 여자와같이단지구분하는변수로범주형변수라고도한다. 양적변수에서이산형변수는셀수있는 (countable) 자료인경우를말하며, 연속형변수는셀수없는 (non-countable) 자료를말한다. - 질적 (qualitative) 변수또는범주형변수변수 (variable) - 양적 (quantitative) 변수 - 이산형 (discrete) 변수 - 연속형 (continuous) 변수 2) 측정방식에따른자료구분 1 명목척도, 명명식 (nominal) : 성별에대한조사와같이측정값이 남자, 여자 등의이름으로명명될수있는자료를말한다. ( 예 : 성별, 지역, 종교, 혈액형등 ) 2 서열척도, 순서식 (ordinal) : 관심의대상이되는사물이나사건을순서에따라측정된자료를말한다. 즉, 한대상이다른것보다크거나작은것만구별하는자료를말한다. ( 예 : 학년, 성적, 소득 ( 상, 중, 하 ) 등 ) 3 간격척도, 구간 ( 등간 ) 식 (interval) : 순서식자료처럼한대상이다른것보다크거나작은것을구별할뿐만아니라얼마만큼크고작은지를측정할수있고절대영점은존재하지않는자료를말한다. ( 예 : 온도, 물가지수, 주가, IQ 지수등 ) 4 비율척도, 비율 (ratio) : 구간식자료처럼한대상이다른것보다얼마나크고작은지를구체적으로측정할뿐만아니라두측정된값의비율이의미를가지는자료로절대영점이존재하는자료이다. ( 예 : 체중, 소득, 시험점수등 )

예제 ) 컴퓨터회사선호도측정을위한네가지척도 1. 명목척도귀하가가장선호하는컴퓨터회사는다음중어느것입니까? 삼성전자 LG전자 SONY DELL APPLE 1. 서열척도다음의컴퓨터회사에대하여선호하는순서를표시하시오 ( 가장선호 =1) 삼성전자 LG전자 SONY DELL APPLE 3. 간격척도다음의컴퓨터회사에대한귀하의선호정도를표시하시오. 매우싫어한다 매우좋아한다 삼성전자 LG전자 SONY DELL APPLE 4. 비율척도다섯개의컴퓨터회사에대한상대적선호정도를합계가 100이되도록나타내시오. 삼성전자 LG전자 SONY DELL APPLE 100 3) 독립성을기준으로 1 독립변수 (independent variable) : 다른변수에영향을미치는변수로서설명변수라고도한다. 2 종속변수 (dependent variable) : 다른변수의영향을받는변수로서반응변수라고도한다. 자료에대한통계적분석에있어기본은자료에대해이자료가이산형형태의자료인지연속형형태의자료인지구분하는것이라고할수있다. 일반적으로통계적분석방법의결정은위에서설명한독립변수와종속변수가이산형자료또는연속형자료인지에따라통계적인분석절차가적용된다. 특히, 종속변수가이산형자료인지아니면연속형자료인지에따라분석방법이정해지는경우가많다. 예를들어, 설명변수가두개의범주를가지는이산형 ( 범주형 ) 자료이고, 종속변수가연속형자료인경우독립표본- 검정을적용하게된다. 또, 설명변수가세개이상의범주를가지는이산형 ( 범주형 ) 자료이고종속변수가연속형자료일때는분산분석 (ANOVA) 을이용하게된다. 이처럼주어진자료에대해서적절한통계적인분석방법의선택에있어서자료의형태를잘구분해야만올바른분석방법을적용할수있다.

분석기법및자료분류 종속변수의수 분석기법 독립변수 자료 ( 척도 ) 종속변수 평균차이검정 (t-test) 명목간격, 비율 분산분석 (ANOVA) 명목간격, 비율 회귀분석명목, 간격, 비율간격, 비율 한개 로지스틱회귀분석명목, 간격, 비율명목 판별분석 명목, 간격, 비율 명목 공분산분석 (ANCOVA) 명목, 간격, 비율 간격, 비율 반복측정분산분석 명목, 간격, 비율 간격, 비율 두개 MANOVA 명목 간격, 비율 분석기법자료 ( 척도 ) 분석기법자료 ( 척도 ) 독립성검정 명목 Kolmogorov-Smirnov 검정 ( 단일, 독립두표본 ) 간격, 비율 상관관계분석 명목, 서열, 간격, 비율 Mann-Whitney 검정 서열, 간격, 비율 요인분석 간격, 비율 Kruskal-Wallis 검정 서열, 간격, 비율 군집분석 명목, 서열, 간격, 비율 Wilcoxon 검정 서열, 간격, 비율 다차원척도법 (MDS) 서열, 간격 Friedman 검정 서열, 간격, 비율 신뢰성분석 간격, 비율 Kendall 검정 서열, 간격, 비율 비율 ( 차이 ) 검정 명목 RUN 검정 서열, 간격, 비율 적합도검정 명목

2. 설문조사의개요 통계학의응용분야중인문사회학분야에서는직업의만족도와생활만족도, 주거만족도등추정하고자하는주제가개념적인경우가많다. 이러한개념적인주제나사건의성질을나타내는주제는수량화되어야만통계적분석이가능하며, 수량화에가장많이쓰이는방법이설문조사이다. 2.1 오차의개념 - 표본오차 (Sampling Error) : 모집단을전수조사하는대신에일부만을조사하여모집단에대한정보를얻는과정에서일어나는오차 - 비표본오차 (Non-sampling Error) : 표본오차이외의모든오차 1) 표본오차표본오차는흔히표준오차 (standard error) 에의해서나타난다. 모비율을표본비율로추정하면표준오차는 로추정된다. 따라서 95% 신뢰수준에서오차한계는 에대한근사값을이용하여 을사용한다. 의최대값은 일때 이므로, 예를들어 개의표본을사용할경우에표본오차는 이다. 이경우에 95% 신뢰수준에서오차한계는 ± 라고표현한다. 2) 비표본오차비표본오차가발생하는요인은무수히많은경우가있을수있으나, 그중대표적인요인에대해알아보면다음과같다. - 설문의결함 : 설문지의질문내용이원래의도된내용을추정하지못하거나, 특정대답을유도하는식의질문으로왜곡된결과를줄수있다. - 무응답오차 : 응답을거부하는경우에이들은어떤특별한경향을띠고있는경우가많다. - 기타요인 : 조사원의미숙이나불성실한조사, 조사단위의누락, 자료의정리과정에서의오류 2.2 표본추출 표본추출방법은크게무작위추출 (random sampling) 과유의추출 (purposive sampling) 로나뉘어지는데여기에서는설문조사에서보편적으로사용되는무작위추출방법에대해서알아보자 - 단순임의추출 (simple random sampling) ; 모집단의명부를준비해서명부에일련번호를매기고, 제비뽑기로그중에필요한수만큼을표본으로추출하는방법

- 층화추출 (stratified random sampling) ; 미리모집단을그룹 ( 층 ) 으로나누어서 ( 층화해서 ) 각그룹으로부터무작위로표본을추출하는방법이다. 예를들어, 남자와여자로나눈다거나직업별로나누고, 같은그룹에는동질의사람이모이도록해야한다. - 계통추출 (systematic random sampling) ; 모집단의명부로부터개시번호를무작위로정하고그다음은일정한추출간격으로표본을뽑는방법이다. 여기서, 추출간격은 ( 모집단의크기 ) / ( 표본의크기 ) 으로구한다. 예를들어, 9,000명으로부터 1,000명을뽑는경우, 추출간격은 9이다. - 집락추출 (cluster random sampling) ; 미리모집단을그룹으로나누어놓고그룹을무작위로뽑는방법이다. 뽑힌그룹에대해서전원을조사하는것이집락추출이다. 그룹을나누는방법은층화추출과달리그룹내가동질이되도록하는것이아니라각그룹이비슷한것이되도록한다. - 다단추출 (multistage random sampling) ; 모집단으로부터의추출을몇단계로나누어서실시하는방법이다. 예를들어전국적인조사를한다고할때, 먼저시도를무작위로뽑은다음에뽑힌각각의시도로부터구 면 동을무작위로뽑고, 마지막으로구 면 동에서사람을뽑는식으로하는경우가이에해당된다. 2.3 조사방법 - 면접조사 (personal interviews) ; 면접조사는조사원이응답자를직접대면하여조사하는방법이다. 조사원에대한인건비가다른방법에비하여월등히높은단점이있지만다른방법보다응답률이높고비표본오차가적은장점이있다. - 전화조사 (telephone interviews) ; 조사원과응답자가전화를통하여서로질문을주고받는방법이다. 면접조사에비하여비용이아주적게드는장점이있으나, 여러가지비표본오차로인하여편의 (bias) 가심각해지는경우가있다. 특히정치적문제나개인의사생활과관련된문제등에서는솔직한답변을얻기가힘들다. - 우편조사 (mail interviews) ; 질문지를우편으로우송한후에반송용봉투를이용하여응답을받는방법이다. 우편조사는최소의비용과노력으로광범위한지역과대상을표본으로삼을수있는장점이있으나회수율이심각하게낮은단점이있다. - 기타 : 인터넷을이용한조사방법, 가두조사법, 집합조사법등이있다.

2.4 설문조사과정 전체적인설문조사과정을살펴보면다음과같다. 2.5 설문지의작성과검증 설문지는흔히응답자의인적사항을묻는부분과주제에대한응답자의의견을묻는본조사부분으로나뉠수있다. - 인적사항 ; 성별, 나이, 학력, 직업, 소득수준등을묻게된다. - 본조사 ; 조사를원하는주제에대하여설문조사의형식으로응답자의의견을수렴한다. 이때질문방법으로는선택형 ( 복수응답포함 ) 또는 5점척도 (4점척도, 리커트척도 ) 형식으로주로사용한다. 설문조사에있어표본추출, 조사방법과더불어가장중요한것중의하나가설문지작성이고, 설문지의형태, 문항순서, 질문형태에따라조사결과에영향을줄수있으므로올바른설문조사를위해서는설문지작성이매우중요하다고할수있다.

일반적인설문지작성의순서는다음과같이정리할수있다.

2.6 신뢰성분석의개요 척도의신뢰성 (reliability) 은한대상을유사한측정도구로여러번측정하거나한가지측정도구로반복측정했을때일관성있는결과 (consistent results) 를산출하는정도에관련된다. 즉, 일관성있는결과가산출될수록그척도 ( 혹은측정치 ) 의신뢰성은높다. 척도의신뢰성을평가하는방법에는내적일관성 (internal consistency), 반복측정신뢰성 (test-retest consistency), 대안항목신뢰성 (alternative-form reliability) 등이있는데, 이중가장많이사용되는방법은내적일관성에의한방법이다. 내적일관성은한항목을다항목으로측정했을때항목들이일관성 (consistency) 혹은동질성 (homogeneity) 을갖는가에관한것이다. 내적일관성은항목들간의상관관계로써평가되는데, 항목들간의상관관계가높을수록내적일관성이높다. 일반적으로가장많이쓰이는내적일관성에의한척도의신뢰성평가방법은 Cronbach's coefficient alpha( 줄여서 Cronbach's 계수 ) 를이용하는것이다. 그공식은다음과같다. 여기서, = 항목들의수 = 항목 의분산값 = 항목의전체분산값 = 항목들간평균상관계수 혹은 Cronbach's 계수는 0에서 1 사이의값을가지며, 높을수록바람직하나반드시몇점이상이어야한다는기준은없다. 흔히 0.8-0.9이상이면바람직하고, 0.6-0.7이면수용할만한것으로여겨진다. 그러나 0.6보다작으면내적일관성을결여한것으로받아들여진다. 이경우 Cronbach's 계수의크기를저해하는항목들을제거함으로써계수값을크게할수있다. 이러한항목들은그항목과전체항목들간의상관관계 (item-to-total correlation) 가낮은항목들이다.

3. SPSSWIN 이란? SPSS(Statistical Package for the Social Science) 는컴퓨터를이용하여복잡한자료를편리하고쉽게처리분석할수있도록만들어진통계분석전용소프트웨어이다. 특히 SPSSWIN은 SPSS의통계패키지의한분야로서개인용컴퓨터에서사용할수있도록만들어진우수한프로그램이다. 1969년사회과학분야의데이터분석을위한 National Opinion Research Center, Chicago University에서컴퓨터프로그램의모음집으로출발하게되었으며 SPSSWIN을이용하면연구자들은원하는통계결과를신속하고용이하게얻어낼수있다. 이통계프로그램은단순한기술통계로부터복잡한다변량통계분석까지원하는결과를비교적쉽게얻어낼수있게해준다. 현재 PASW(predictive analytics software) 로개명했으며 Ver 18 을판매중이다. 이후한글 SPSS(Ver 12.0K) 를기준으로설명한다. 3.1 SPSS 창의종류 SPSS 는 7 개의창 (Windows) 으로구성되어있으며, 각창은다음의설명을보여준다. 창 (Windows) 내용 데이터편집기 SPSS 뷰어 ( 출력항해사 ) 피벗테이블도표편집기텍스트출력결과편집기명령문편집기스크립트편집기 데이터입력하고저장, 파일을열어통계절차를수행하는창도표및분석결과를보여주는창으로결과물을수정 / 저장출력결과의피벗테이블을수정 / 편집하는창 SPSS 뷰어창에출력된도표 ( 그림 ) 를편집 / 저장텍스트출력결과를수정하는창으로글꼴등을변경 SPSS 수행내용에대한명령문을보관하고수행하는창 SPSS의작업을자동화시키기위한스크립트와 OLE 기능수행 3.2 SPSS 데이터편집기메뉴설명 메뉴내용 파일 (F) 편집 (E) 보기 (V) 데이터 (D) 변환 (T) 분석 (A) 그래스 (G) 유틸리티 (U) 창 (W) 도움말 (H) 새로운데이터작성및불러오고저장하는기능을수행데이터파일을복사, 붙이기등의편집하는기능을수행툴바나격자선, 글꼴등화면에표시하는기능을수행변수를정의하거나, 정렬및병합, 전치등의기능을수행새로운변수를만들거나변수값변환등의기능을수행선택된데이터에대한각종통계분석절차수행선택된자료에대한그림이나도표를작성할때사용파일이나변수의정보표시윈도우창간의전환및메뉴표시도움말정보표시

3.3 통계분석절차 SPSS 를이용한통계적자료분석과정은다음과같은절차를따라수행하게된다. 1) 데이터입력및출력 SPSS 데이터편집기창 을통하여분석할자료를직접입력하거나기존의데이터파일 (SPSS, Excel, ACSII, Acess, dbase 파일등 ) 을불러들인다. 2) 자료의변환및관리필요한경우주어진자료를이용해서원하는조건을만족하는자료만선택하거나기존의변수를이용하여새로운변수를생성하고분석할준비를한다. 3) 분석메뉴선택분석메뉴에서는분석자가정리및분석할자료에적절한통계적분석절차 ( 메뉴 ) 를선택한다. 4) 분석변수선택분석메뉴대화상자에서분석하고자하는변수를선택하여지정한다. 5) 분석수행및결과검토적절한분석메뉴와분석변수가선택되면분석메뉴를실행하고 SPSS 뷰어창 을통해출력된결과를확인하고검토한다. 이와같은과정을통해통계적인분석을진행하게되며, SPSS에서제공하는통계분석절차와그래프를메뉴별로정리하면다음과같다.

분 석 내 용 보고서 케이스요약, 요약보고서 기술통계량 빈도분석, 기술통계, 탐색적자료분석, 분할표, 교차분석등 통계표작성 통계표작성을위해이용 ( 기초적, 일반적통계표등 ) 평균비교 집단별평균분석, 일표본 t-검정, 이표본 t-검정, 일원배치분산분석 일반선형모형 분산분석, 다변량분산분석, 공분산분석, 반복측정분석, 분산성분측정 혼합모형 선형혼합모형 (Linear Mized Model) 상관분석 두변수간의상관분석, 편상관분석, 거리측도 회귀분석 선형회귀, 곡선회귀, 비선형회귀, 로지스틱, 프로빗, 가중회귀, 2-단계최소제곱 로그선형분석 일반로그선형분석, 로짓분석, 모형선택등을제공 분류분석 군집분석, 판별분석에대한절차를제공 데이터축소 요인분석, 대응일치분석, 최적화척도법 척도화분석 신뢰도분석, 다차원척도법 비모수검정 카이제곱, 이항검정, 런검정, 일표본 K-S 검정 시계열분석 지수평활, 자기회귀, ARIMA 모형 생존분석 생명표, Kaplan-Meier 생존분석, Cox 회귀모형 다중응답분석 다중으로응답된자료에대한분석절차제공 결측값분석 결측값처리에대한분석 그래프 내 용 그래프 내 용 막대도표 Bar chart 오차막대도표 Error bar 선도표 Line chart 산점도 Scatter plot 영역도표 Area chart 히스토그램 Histogram 원도표 Pie chart P-P 도표 P-P 도표 상한-하한도표 Hig-Low chart Q-Q 도표 Q-Q 도표 파레토도표 Pareto chart( 품질관리 ) 순차도표 Sequence plot 관리도 Control chart( 품질관리 ) ROC 곡선 ROC curve 상자도표 Box_Whisker plot 시계열도표 자기상관, 교차상관등