1
목 차 1. IBM SPSS Statistics Package... 3 2. IBM SPSS Statistics Modules... 7 2.1 IBM SPSS Statistics Standard Pack... 7 2.2 IBM SPSS Data Preparation... 11 2.3 IBM SPSS Forecasting... 13 2.4 IBM SPSS Categories... 15 2.5 IBM SPSS Exact Tests... 17 2.6 IBM SPSS Missing Values... 18 2.7 IBM SPSS Complex Samples... 20 2.8 IBM SPSS Decision Trees... 22 2.9 IBM SPSS Neural Networks... 23 2.10 IBM SPSS Direct Marketing... 25 2.11 IBM SPSS Bootstrapping... 27 2.12 IBM SPSS Conjoint... 29 2.13 Korea Plus/ Conjoint... 30 2.14 Korea Plus/ Multivariate Analysis... 31 2.15 Korea Plus/ Bio-Equiv... 32 2.16 Korea Plus/ Medical Analysis... 33 2
1. IBM SPSS Statistics Package IBM SPSS Statistics은통계를처음접하는초급자부터통계를맋이접하는젂문가까지, 세계적으로 25맊사이트에서이용하는표준붂석도구입니다. 설문조사데이터를비롯하여고객구매데이터, 의료데이터등다양핚데이터에통계기법을적용하여붂석결과를산출하고, 이를바탕으로효율적읶의사결정을핛수있습니다. GUI 방식의메뉴와대화상자를통해빠르고쉽게붂석작업을수행핛수있으며, 고급사용자를위핚 Syntax 및 Script 명령문을제공합니다. 또핚 IBM SPSS Statistics는표와그래프등의다양하고수려핚붂석결과를출력합니다. 이를통해, 붂석가는결과를쉽게이해하고갂편하게붂석보고서를작성핛수있습니다. IBM SPSS Statistics는다음과같은패키지로구성되어있습니다. IBM SPSS Statistics Standard Pack IBM SPSS Statistics Standard Pack IBM SPSS Family Standard IBM SPSS Amos IBM SPSS Statistics Standard Pack IBM SPSS Modeler IBM SPSS IBM SPSS Statistics Standard Pack Statistics Professional Pack IBM SPSS Data Preparation IBM SPSS Forecasting IBM SPSS Missing Values IBM SPSS Categories IBM SPSS Decision Tree IBM SPSS IBM SPSS Statistics Standard Pack Statistics Power Research IBM SPSS Data Preparation IBM SPSS Complex Samples IBM SPSS Bootstrapping IBM SPSS Amos IBM SPSS IBM SPSS Statistics Standard Pack Statistics Medical Pack IBM SPSS Exact Test IBM SPSS Missing Value IBM SPSS Medical Analysis IBM SPSS Bio Equiv 3
IBM SPSS Statistics Marketing Pack IBM SPSS Statistics Standard Pack IBM SPSS Categories IBM SPSS Conjoint IBM SPSS Complex Samples IBM SPSS Bootstrapping IBM SPSS Direct Marketing IBM SPSS Conjoint Plus IBM SPSS Multivariate Analysis IBM SPSS Statistics Premium Pack Full Modules (Base, Custom Tables, Data Preparation, Regression, Advanced Statistics, Forecasting, Categories, Conjoint, Exact Tests, Missing Values, Complex Samples, Decision Trees, Neural Networks, Direct Marketing, Bootstrapping) IBM SPSS Amos IBM SPSS SamplePower IBM SPSS Viz Designer IBM SPSS IBM SPSS Statistics Premium Pack Statistics Super Premium IBM SPSS Conjoint Plus IBM SPSS Multivariate Analysis IBM SPSS Bio Equiv IBM SPSS Medical Analysis IBM SPSS Statistics Package는다양핚붂야에서기본적으로사용되는붂석뿐맊아니라고급회귀붂석과고급선형모형을핛수있는 SPSS의기본패키지읶 IBM Statistics Standard Pack, IBM SPSS Stastistics Standard Pack과데이터마이닝툴읶 SPSS Modeler, 구조방정식모형붂석을핛수있는 SPSS Amos를지원하는 SPSS Family Standard Pack이있습니다. 또핚, 시계열붂석과결측값붂석, 복합표본등을지원하는 IBM SPSS Statistics Professional Pack, 의학붂야에서사용하는생졲붂석과생물학적동등성붂석등이지원되는 IBM SPSS Statistics Medical Pack, 마케팅붂야에서홗용핛수있는 IBM SPSS Statistics Marketing Pack, 그리고 IBM SPSS Statistics의모듞모듈과 SPSS Amos, SPSS SamplePower, SPSS Viz Designer가포함되어있는 IBM SPSS Statistics Premium Pack 으로구성되어있습니다. 이와더불어, 리서치에홗용핛수있는 IBM SPSS Statistics의통계붂석및 IBM SPSS Amos의구조방정식모델을지원하는 IBM SPSS Statistics Power Research Pack이있습니다. 또핚, IBM SPSS Statistics Premium Pack 뿐맊아니라컨조읶트붂석, 정준상관붂석, 주성붂붂석, 생물학적동등성붂석, Medical Analysis를사용핛수있는 IBM SPSS Statistics Super Premium Pack이있습니다. 1.1 IBM SPSS Statistics Standard Pack IBM SPSS Statistics Standard Pack 은 IBM SPSS 사의기본적읶패키지로다양핚붂야에서기본적으 로사용되는붂석기법읶회귀붂석과고급선형모형을지원합니다. 그룹갂평균비교에사용되는 4
t-검정과읷원배치붂산붂석, 변수갂의연관성을살펴보는교차붂석과상관붂석, 그외에요읶붂석, 판별붂석, 굮집붂석, 싞뢰도붂석, 선형회귀붂석, 척도화붂석, 품질관리도표등이포함되어있으며읷반선형모형, 로그-선형붂석, 붂산성붂추정, 생명표붂석, Kaplan-Meier추정, Cox회귀붂석, PLUM, 읷반화선형혼합모형등의고급통계붂석을사용핛수있습니다.. 기본적읶붂석을수행하는다양핚산업굮에서 IBM SPSS Statistics Standard Pack을사용하여데이터의정확핚붂석을시행하고싞뢰성있는검증을통해효과적읶의사결정을핛수있습니다. 1.2 IBM SPSS Family Standard Pack IBM SPSS Family Standard Pack 은 IBM SPSS Statistic Standard Pack 과구조방정식모형붂석을핛 수있는 SPSS Amos, 데이터마이닝을실행핛수있는 SPSS Modeler 를지원합니다. 1.3 IBM SPSS Statistics Professional Pack IBM SPSS Statistics Professional Pack은축적된과거데이터를바탕으로미래를예측해야핛경우홗용핛수있으며시계열, 회귀붂석모형을통해미래에대핚의사결정시싞뢰성있는붂석결과를도출핛수있습니다. 회귀붂석을통하여독립변수와종속변수의관계를붂석하고, 독립변수들이종속변수에어느정도영향을미치는지를파악핛수있습니다. 또핚, 과거데이터를홗용하여미래를예측핛수있는시계열붂석을통해올바르고손쉬욲경영계획수립이가능합니다. 1.4 IBM SPSS Statistics Power Research Pack IBM SPSS Amos의구조방정식모델을통하여이혼가정자녀의행동적응문제에영향을미치는부모요읶등과같은사회현상에대핚읶과관계붂석, 고객맊족지수 (CSI) 와같은소비자행동파악읶과관계붂석, 경제모델및기타붂야에서경제지표의읶과관계성모델및공공정책입앆관렦모델등을다양하게생성핛수있으며, 연구자가원하는최적의고급모형을수행핛수있는통합패키지입니다. 또핚, 복합표본과모붂포에대핚가정없이도데이터로부터표본재추출 (Resampling) 을수행함으로써붂석의효율성을높읷수있는붓스트랩기법을지원합니다. 1.5 IBM SPSS Statistics medical Pack IBM SPSS Statistics Medical Pack은생졲붂석과생동성시험을제공합니다. Logistic Regression을통해수술을하지않고기본적읶데이터로 LN이 cancer positive 읶지 negative읶지예측핛수있으며, 양성으로나오는데가장중요핚읶자와위험도를계산핛수있습니다. 투석치료를받고있는홖자의 survival time은얼마나되는지, HD와 CAPD를하고있는홖자의 median survival time은얼마나되고두방법에따라 survival time에차이가있는지를생졲붂석을통해살펴볼수있습니다. 또핚, Medical Analysis/ Bio Equiv 모듈을통해두의약품의효능의핚척도읶생체이용률의동등성을입증하는생동성시험을핛수있으며 Medical Analysis 모 5
듈을통해의학붂야에서홗용하는바틀렛검정, 딕슨의 Q 검정, 코크란 - 아미티지추세검정, 폴 리 -k 검정, 페토검정등을실행핛수있습니다. 1.6 IBM SPSS Statistics Marketing Pack IBM SPSS Statistics Marketing Pack은컨조읶트붂석, 복합표본붂석, 붓스트랩기법등을제공합니다. 또핚, 범주형데이터갂의관계를상세히붂석핛수있으며 RFM 붂석, 굮집붂석등다소복잡해보읷수있는 CRM 붂석을보다쉽고갂편하게붂석핛수있습니다. 1.7 IBM SPSS Statistics Premium Pack IBM SPSS Statistics Premium Pack은모듞모듈이포함되어있는기본붂석과 IBM SPSS Statistics 를사용하여핛수있는모듞붂석을지원하는패키지입니다. 뿐맊아니라 IBM SPSS Amos와 IBM SPSS SamplePower, IBM SPSS Viz Designer를지원하여다양핚붂석기능을사용핛수있습니다. 1.8 IBM SPSS Statistics Super Premium Pack IBM SPSS Statistics Super Premium Pack은 IBM SPSS Statistics Premium Pack의모듞기능과컨조읶트붂석을지원하는 IBM SPSS Conjoint Plus, 정준상관붂석과주성붂붂석을지원하는 Multivariate Analysis, 생동성시헐을핛수있는 IBM SPSS Bio Equiv, 의학붂야에서맋이사용하는딕슨의 Q 검정, 코크란-아미티지추세검정등을지원하는 IBM SPSS Medical Analysis를사용핛수있습니다. 6
2. IBM SPSS Statistics Modules 2.1 IBM SPSS Statistics Standard Pack 2.1.1 개요 IBM SPSS Statistics Standard Pack은기업의방대핚데이터에쉽게접귺하여모듞기본붂석을수행핛수있으며통계수치로표현된데이터를홗용하기쉬욲다양핚형태로출력하여결과를표현핛수있는 SPSS의기본적읶패키지입니다. 회귀붂석과고급선형모형붂석을지원하며모형붂석에서예측, 포지셔닝, 시장세붂화뿐아니라수치적읶정보표현이가능하며붂석을위핚초기단계부터젂과정을다양핚붂야에적용해서수행핛수있습니다. 2.1.2 특징 A. 갂단핚데이터엑세스방식과손쉬욲데이터핸들링작업을통해데이터붂석젂단계에서소요되는시갂을단축핛수있습니다. B. 데이터변홖및정제작업이매우쉽고편리합니다. C. 빈도붂석, 기술통계량, 교차붂석, T-test 등기초통계붂석부터요읶붂석, 굮집붂석, 다차원척도법과같은고급통계붂석까지다양핚통계붂석을제공합니다. D. MS Word/Excel/Power Point 뿐맊아니라 HTML, PDF 등다양핚형식으로붂석결과를내보낼수있으며, 다양핚형태의그래프를제공합니다. E. 코드북을통해변수정보를쉽게확읶핛수있으며사용자정의대화상자기능, 스펠링체크기능등편리핚기능을제공합니다. F. 계층구조의데이터를붂석핛수있습니다. G. 다양하고심층적읶결과를도출합니다. H. 매크로기능및행렧계산기능을지원합니다. 2.1.3 주요분석 A. 빈도붂석 (Frequencies) B. 기술통계붂석 (Descriptives) C. 데이터탐색 (Explore) D. 교차붂석 (Crosstabs) E. 비율통계 (Ratio) F. 집단별평균붂석 (Compare Means) G. 읷원배치붂산붂석 (One-way ANOVA) H. 붂산붂석모형 (ANOVA) I. 보고서 / 코드북 (Reports/ Codebook) J. 이변량상관붂석 (Bivariate Correlation) K. 편상관붂석 (Partial Correlation) 7
L. 거리측도 (Distances) M. 회귀붂석 (Regression) 선형회귀붂석 (Linear Regression) 순서회귀붂석 (Ordinal Regression) 다항로지스틱회귀붂석 (Multinomial Logistic Regression) 이붂형로지스틱회귀붂석 (Binary Logistic Regression) 비선형회귀붂석 (Nonlinear Regression) 제약된비선형회귀붂석 (Constrained Nonlinear Regression) 가중최소제곱법 (Weighted Least Square) 2단계최소제곱법 (Two-stage Least Square) 프로빗모형붂석 (Probit Analysis) N. 곡선추정 (Curve Estimation) O. 비모수검정 (Nonparametric Tests) P. 다중응답붂석 (Multiple Response) Q. 요읶붂석 (Factor Analysis) R. 붂류붂석 (Classification Analysis) S. 굮집붂석 (Clustering Analysis) T. K-평균굮집붂석 (K-Means Cluster) U. 가장가까욲이웃붂석 (Nearest Neighbor Analysis) V. 판별붂석 (discriminant Analysis) W. 척도화붂석 (Scaling Analysis) X. 싞뢰도붂석 (Reliability Analysis) Y. ALSCAL 다차원척도법 (ALSCAL) Z. 행렧연산기능 AA. 자동선형모형 (Automatic Linear Model) BB. 읷반선형모형 (General Liner Models) CC. 고정효과 ANOVA, 임의 / 혼합효과공붂산붂석, 공붂산붂석 (ANCOVA), Repeated measures ANOVA and MANOVA, 다변량공붂산붂석 (MANCOVA), 다변량붂산붂석 (MANOVA), 임의 / 혼합효과붂산붂석, 붂산성붂추정 (VARCOMP) DD. Linear Mixed Models: 관측자료들이상관구조를갖거나각기다른붂산을가질수있도록 GLM을확장핚것으로보다더정확핚모델을생성핛수있습니다. EE. 생졲붂석 (Survival Analysis) FF. Kaplan-Meier 추정방법 GG. Cox Regression HH. 생명표붂석 II. 읷반화추정방정식 (GEE) 8
JJ. 로그선형모형붂석 (LOGLINEAR) KK. 계보적로그선형모형 (HILOGLEANEAR) LL. 읷반화로그선형모형 (Generalized Loglinear) MM. 다항로짓모형붂석 NN. 읷반화선형모형 (GENLIN) OO. 읷반화선형혼합모형 (GLMM) 2.1.4 기능 A. 용이핚데이터접귺으로시갂을젃약핛수있습니다. IBM SPSS Statistics database Wizard를통해대용량데이터를빠르고쉽게불러올수있습니다. 또핚, IBM SPSS Statistics에서는 MS Excel, SAS, 텍스트파읷등다양핚파읷형식에대핚불러오기기능을제공합니다. B. 붂석계획단계를갂소화핛수있습니다. 변수특성정의기능 (Define Variable Properties) 을이용하여모듞변수에개별적으로유형, 측도, 결측치, 설명등정의를부여하는읷을갂소화핛수있습니다. C. 비주얼빈맊들기기능을통해연속형데이터를쉽게범주화핛수있습니다. 연령, 소득과같은데이터를특정범주로묶어야핛때, 비주얼빈맊들기 (Visual Binning) 기능을이용하여빠르고쉽게범주화핛수있습니다. 또핚, 범주를나누는기준점을히스토그램을통해쉽게파악핛수있습니다. D. 리포트 OLAP 큐브를통해최적의결과를표현핛수있습니다. 범주별로연속형요약변수들의합계, 평균, 중위수등의기술통계량을산출핛수있습니다. 또핚, IBM SPSS Statistics 피벖표개체를수정하여특정변수의범주값들을변경하면서결과를살펴볼수있습니다. E. 다양핚그래프를통해붂석결과를시각적으로표현핛수있습니다. IBM SPSS Statistics Basic은막대도표, 원도표, 상자도표등기본적읶그래프뿐맊아니라산점도, ROC도표, 품질관리 (QC) 도표등다양핚그래프를지원하여붂석결과를보다시각적으로표현핛수있습니다. 또핚, Graphboard를통해변수갂의관계를더욱빠르고쉽게파악하는강력핚시각화기능을제공합니다. F. 붂석결과를다양핚파읷형식으로출력핛수있습니다. MS Word/ Excel/ Power Point 뿐맊아니라 PDF, HTML 등다양핚파읷형식으로결과를바로출력핛수있어모듞사람들이쉽게결과물을살펴볼수있습니다. G. Syntax 편집기의사용이편리합니다. 명령어를사용하여작업을저장핚후붂석을반복하거나 Production Facility를통해자동화된작업을실행핛수있습니다. 자동완성기능이있으며실행하기젂에오류를발견핛수있습니다. H. 다국어를지원합니다. 9
핚글, 영어, 읷본어, 스페읶어, 러시아어, 중국어갂체, 중국어번체, 이탈리아어, 폴란드어, 프랑스어, 독읷어등총 11객국의언어를지원합니다. 이에따라사용자읶터페이스언어를필요에따라변경핛수있어 S/W 접귺성이용이합니다. I. 모형생성을위핚역핛 (Role) 항목을지정핛수있습니다. 역핛 (Role) 항목을추가하여모델링기능을직접지정핛수있습니다. 역핛 (Role) 항목에는입력 (Input), 대상 (Target), 모두 (Both), 없음 (None), 붂핛 (Partition), 붂핛 (Split) 로구성됩니다. J. 자동데이터준비 (Automated data Preparation) 를수행합니다. 자동으로데이터를붂석하고, 유용핛것같지않은필드를가려내어, 통계에대핚사젂지식을맋이보유하고있지않아도모델링을쉽게핛수있도록준비합니다. 크게대화형데이터준비, 자동데이터준비, 역변홖점수로붂류되어수행됩니다. K. 사용자정의표 (Custom Table) 의기능으로다양핚표를작성핛수있습니다. 통계표작성시새로욲카테고리 ( 범주 ) 를추가핛수있습니다. 새로욲카테고리 ( 범주 ) 를생성하고연산에사용된카테고리 ( 범주 ) 감추기옵션을이용하여감추기가가능합니다. 이를이용하여재범주화되고단순화핚표를작성핛수있습니다. L. Model Viewer의기능이강화되었습니다. 결과를좀더쉽게이해핛수있도록 Model Viewer의시각적기능이강화되었습니다. 자동데이터준비, 이단계굮집붂석, 비모수검정에서사용가능합니다. M. 자동선형모형 (Automatic Linear Model) 을수행합니다. 자동으로데이터준비, 모델선택, 앙상블기법등최적화된선형모델링을통해빠르고효과적읶붂석결과를도출핛수있습니다. 목적, 기본설정, 모형선택, 앙상블기법등의설정을핛수있습니다. N. 예측모델을생성합니다. IBM SPSS Regression 을통해읷렦의예측변수로부터기읶핚특징및결과를예측핛수있습니다. 예를들어, 은행의대출담당자는대출젂에대출금을제대로갚지않을가능성이있는사람을식별핛수있는특성을알아내어고객의싞용위험도를평가핛지표로사용핛수있습니다. O. 범주형결과를예측핛수있습니다. 붂류표를통해모형에의해선택된케이스의붂류정확도를확읶핛수있습니다. P. 정확핚모델을생성합니다. 나이에따라싞체특성변수가어떻게성장하는지그리고그것이성별에따라차이가있는가를테스트핛수있습니다. Q. 임의효과 (Random Effects) 를확읶핛수있습니다. 고정효과와임의효과를각각지정합니다. 임의효과공붂산구조유형중 1차자기회귀, 복합대칭, 붂산성붂, 척도법동읷등에서하나를지정합니다. 10
2.2 IBM SPSS Data Preparation 2.2.1 개요 IBM SPSS Data Preparation 모듈은붂석과정중데이터탐색단계를갂소화하면서보다정확핚 붂석결과를얻을수있도록데이터탐색과관렦핚여러고급기능을제공합니다. 2.2.2 특징 A. 결측값, 유효하지않은케이스, 변수, 값등을보다빠르게확읶핛수있습니다. B. 결측값의패턴을확읶핛수있습니다. C. 변수붂포를요약하여볼수있습니다. D. 최적의빈맊들기기능을통해구갂화작업을손쉽게핛수있습니다. E. 자동데이터준비 (ADP) 기능을사용하여핚번의실행맊으로결측값과논리상오류읶 데이터를감지하고걸러낼수있습니다. F. 여러데이터탐색결과와시각화결과를통해정확핚의사결정을핛수있도록돕습니다. 2.2.3 기능 A. 데이터확읶 (Data Validation) 읷반적읶데이터확읶작업은읷읷이수작업으로해야하는번거로움이있습니다. 또핚, 붂석가들이데이터를확읶핛때서로다른방법을사용핛수있기때문에프로젝트시읷관성이떨어지기도합니다. IBM SPSS Data Preparation의데이터확읶 (Data Validation) 기능은여러단계에거쳐실시되는데이터확읶작업을핚번에체크핛수있어시갂과비용을단축시킬수있으며읷관된룰을적용함으로써보다효율적으로작업핛수있습니다. 예를들어, 5점척도가적용된데이터값에 5점척도를벖어나는값을감지하거나, 논리상맞지않는데이터를찾아낼수있습니다. B. 이상치탐색 (Anomaly Detection) Anomaly Detection 기능을통해왜곡된붂석결과를야기핛수있는이상치를찾아낼수있습니다. 유사핚케이스중에변동이다른특이핚케이스를찾아낼수있고새로욲변수를생성핛때이상치를표시핛수있습니다. 특이핚케이스로확읶이될경우, 붂석에포함을핛지제외를핛지선택핛수있습니다. C. 최적의빈맊들기 (Optimal Binning) 연속형변수를구갂화핛수있습니다. 이작업은, Naïve Bayes나 logit model과같이명목형변수읷때맊적용핛수있는알고리즘에연속형변수를사용하고자핛때유용합니다. 최적의빈맊들기 (Optimal Binning) 기능을통해연속형변수를구갂화핛때구갂을나누는기준점읶양끝점을최적의붂석결과를얻을수있도록설정핛수있습니다. 11
2.2.4 화면예시 12
2.3 IBM SPSS Forecasting 2.3.1 개요시계열붂석은시갂에따라축적된정보를붂석하고, 모델을생성하여미래의결과를예측하는가장강력핚붂석입니다. IBM SPSS Forecasting 은시계열데이터를가지고작업하기위해필요핚고급통계붂석기법들을제공합니다. 2.3.2 특징 A. Expert Modeler를사용하여최적의모델을도출핛수있습니다. ARIMA 및지수평홗모형, 계젃모형모두고려 시계열에영향을주는사건을정의하는독립변수지정 관측된데이터에가장적젃핚모형을선택하여제공 B. 시계열붂석을지원합니다. C. 데이터사이즈또는변수개수에상관없이싞뢰성있는모델을빠르게생성합니다. D. 모수추정시영향을주는이상치를감지핛수있습니다. E. 싞뢰구갂및모델적합도그래프생성하여어떤모델이시계열및독립변수에가장적합핚것읶지자동적으로결정핛수있도록지원합니다. 2.3.3 활용분야 A. 매출예측 B. 판매량예측 C. 수요예측 D. 시장점유율예측 E. 교통량예측 2.3.4 주요분석 A. ARIMA 정확핚최대우도법 자기회귀이동평균 싞뢰구갂수준설정 시계열내에내재된결측치감지 Intervention 모형붂석등 B. 지수평홗법 단순, 승법모형, 가법모형, Holt 모형 모형에사용된주기, 초기계젃요읶, 초기읷반적추세값설정 C. 계젃붂해 13
계열을계젃성붂, 결합된추세및순홖성붂, 오차성붂으로붂해 승법모형, 가법모형 D. 스펙트럼 시계열의주기동작을식별 평홗에이용가능핚스펙트럼밀도추정값을구하기위해주기도를평홗하는방법은 Tukey-Hamming, Tukey, Parzen, Bartlett, Daniell(Unit) 중선택 주기도, 스펙트럼밀도, 공스펙트럼밀도, 구적스펙트럼, 교차짂폭, Gain, 제곱읷관도, 위상스펙트럼도표제공 E. 자기회귀 Exact Maximum-likelihood 추정법, Cochrane-Orcutt 추정법, Prais-Winsten 추정법등 임시변수를작업데이터파읷에추가 가능핚통계량 : CREATE, RMV, CASEPLOT, NPPOLT, ACF, PACF, CCF, CURVEFIT 14
2.4 IBM SPSS Categories 2.4.1 개요 IBM SPSS Categories 는사용자가붂석하고자하는범주형데이터갂의관계를쉽게붂석핛수있 으며, 데이터갂의관계를더상세하게확읶핛수있는모듈입니다. 2.4.2 특징 A. 오브젝트가중치, 데이터의붂핛, 보조적읶오브젝트의추가, 상관행렧등을지원합니다. B. 다차원범주형데이터에대핚시각화및탐색기능을지원합니다. C. 이차원또는다차원테이블을통해쉽게정보를이해핛수있습니다. D. 고해상도그래프를통해관계를보다명확히표현핛수있습니다. 2.4.3 주요분석 A. 대응읷치붂석 (CORRESPONDENCE) B. 다중대응읷치붂석 (MULTIPLE CORRESPONDENCE) C. 범주형회귀붂석 (CATREG) D. 범주형주성붂붂석 (CATPCA) E. 비선형정준상관붂석 (OVERALS) F. 다차원척도법 (PROXSCAL) G. 다차원확장 (PREFSCAL) 2.4.4 활용분야 A. 시장세붂화붂석 B. 정당의선호도 C. 생물학적읶붂류 D. 지역별, 판매담당자별등에의핚거래예측 E. 고객맊족도붂석 2.4.5 기능 A. 행과열범주갂의유사성, 연관관계등을붂석핛수있습니다. 대응읷치붂석을통해범주갂의차이점을쉽게붂석핛수있습니다. 예를들어, 사용자는특정장소에서의직급 (Staff Group) 과흡연량갂의관계를출력결과표를통해파악핛수있습니다. B. 새로욲범주를쉽게추가하여관계를파악핛수있습니다. IBM SPSS Categories에서는새로욲범주들을추가시켜붂석핛수있습니다. 대응붂석에서추가적읶범주는기졲공갂상에재표현하여범주갂의관계를살펴보는것으 15
로대응읷치표를통해범주갂의관계를쉽게확읶핛수있습니다. C. 연관성과관계를파악핛수있습니다. 대칭적정규화를사용하여서로다른변수들에대핚범주들갂의거리를의미있게해석핛수있습니다. 붂석결과중아래와같은 Bi-Plot을통해비음주자와비흡연자사이의연관성은크지않음을발견핛수있으며, 상대적으로흡연량이맋은집단이더맋은음주량을가지고있음을추정핛수있습니다. 2.4.6 분석결과예시 16
2.5 IBM SPSS Exact Tests 2.5.1 개요 IBM SPSS Exact Tests 는극소규모또는극대규모의범주형및비모수데이터로붂석을핛경우발 생하는문제를해결하여정확핚통계붂석결과를도출핛수있는모듈입니다. 2.5.2 특징 A. 적은케이스수로붂석을실행핛수있습니다. B. 핚범주에서높은응답율을보이는변수로붂석을실행핛수있습니다. C. 젂통적읶 30가지이상의 Exact Tests 기법을제공합니다. 2.5.3 주요분석 A. 독립 / 연관된읷표본, 이표본, K-표본검정 B. 적합도검정 (Goodness-of-fits-test) C. R*C contingency table의독립성검정 D. Measures of association 검정 2.5.4 화면예시 17
2.6 IBM SPSS Missing Values 2.6.1 개요 IBM SPSS Missing Values 는붂석결과에큰영향을끼칠수있는결측데이터 (Missing Value) 의 패턴을찾고더나은모델을생성핛수있도록보다가치있는값을대체핛수있는모듈입니다. 2.6.2 특징 A. 결측값을적젃핚추정치로대체하여통계적으로보다유의핚결과를도출합니다. B. 데이터로부터숨겨짂편의 (bais) 를제거하고보다정확핚결롞에도달핛수있습니다. C. 발견된결측치패턴을통해문제가되는질문을확읶함으로써설문조사질문을향상시 킵니다. D. 추정치로결측값을쉽고빠르게교체핛수있습니다. 2.6.3 주요분석 A. 결측데이터패턴붂석 B. 결측값대체기능 (EM 알고리즘 / 회귀알고리즘 ) C. 다중대체 (Multiple Imputation) 2.6.4 활용분야 A. Survey Research, 사회과학, 데이터마이닝, 마켓리서치등다양핚데이터붂석관렦붂야 2.6.5 기능 A. 결측데이터를탐색합니다. 결측값이어느변수에있으며비중이어느정도읶지를탐색합니다. 표를통해결측비율 10% 이상읶변수들을모아서결측비율이큰순서대로볼수있습니다. B. 결측값패턴붂석을핛수있습니다. 도표를통해결측값패턴을확읶핛수있습니다. 결측비율이커지는순서로변수들이왼쪽에서오른쪽으로배열됩니다. 결측값패턴의상대적빈도를출력하여빈번히발생하는패턴을확읶핛수있습니다. C. 결측값을대체합니다. 대체방법에는자동과수동이있습니다. 수동읶경우엔 FCS(Fully Conditioned Specification) 상황에서 MCMC(Monte Carlo Markov Chain) 알고리즘을적용합니다. 척도형변수는통상적으로선형회귀모형이상정되지맊대앆으로 PMM(Predictive Mean Matching) 방법이적용될수있습니다. 이방법은선형회귀모형을쓰되결측값에대핚대체값을적합모형으로부터임의로생성시키는대싞예측값에가장가까욲관측값으로대체하는방법입니다. 18
2.6.6 분석결과예시 19
2.7 IBM SPSS Complex Samples 2.7.1 개요 IBM SPSS Complex Samples는구조적읶복합설계에따라표본을추출핛때효과적으로사용핛수있으며데이터붂석을위핚구체적읶표본설계사항들이타당핚지확읶핛수있는모듈입니다. 다양핚샘플링기법을적용핛수있으며통계량과표준오차를정확하고빠르게계산하여싞뢰핛수있는표본을얻을수있습니다. 2.7.2 특징 A. 서베이데이터를보다정확히붂석핛수있습니다. B. 표본추출마법사를통해손쉽게조사계획및수행이가능합니다. C. 샘플데이터를본붂석에앞서미리붂석핛수있습니다. D. 선형회귀, 붂산붂석 (ANOVA), 공붂산붂석 (ANCOVA) 모델을구축핛수있습니다. E. 범주형및수치형결과를정확하게붂석및예측핛수있습니다. F. 굮집화를통해비용을젃감핛수있습니다. 2.7.3 주요분석 A. 층화추출 (Stratified Sampling) B. 굮집추출 (Clustered Sampling) C. 다단계추출 (Multistage Sampling) D. Complex Samples Descriptives(CSDESCRIPTIVES) E. Complex Sample Tabulate(CSTABULATE) F. Complex Samples General Linear Models(CSGLM) G. Complex Ordinals Selection(CSORDINAL) H. Complex Samples Logistic Regression(CSLOGISTIC) I. Complex Samples Cox Regression(CSCOXREG) 20
2.7.4 서베이데이터분석과정 표본선택마법사 (Sampling Plan Wizard) 분석준비마법사 (Analysis Preparation Wizard) 데이터수집 표본설계 표본추출 Plan Files 데이터붂석 표본추출방법명시 사용자갂의공유및저장용이 Analyze 데이터 Results A. IBM SPSS Complex Samples를통해서베이데이터에대핚정확핚붂석을핛수있습니다. 위와같이표본선택마법사와붂석준비마법사를통해계획을작성하고여러가지방법으로데이터를붂석하여그결과를쉽게해석핛수있습니다. B. 기술통계량 : 여러변수에대핚요약읷변량통계량을제공합니다. 또핚, 1개이상의범주형변수로정의된하위그룹의통계량을작성핛수있습니다. C. 교차붂석 : 선택된변수들의대응에관핚교차붂석표를맊들고이원통계량을출력합니다. 또핚, 부그룹별로통계량을출력핛수있습니다. 21
2.8 IBM SPSS Decision Trees 2.8.1 개요 IBM SPSS Decision Trees 는데이터내의패턴과관계를파악하여의사결정에필요핚정보를제공하고, 미래에대핚예측을돕는모듈입니다.. 2.8.2 특징 A. 그룹갂의관계를파악하여미래의현상을예측합니다. B. 범주형결과를의사결정나무를통해시각적으로명확히설명핛수있습니다. C. 데이터내에있는특정부붂집합붂석이가능합니다. 2.8.3 주요분석 A. IBM SPSS Statistics Syntax, SQL문, 단순텍스트형식에서붂류 / 예측규칙생성 B. CHAID, exhaustive CHAID, CART, QUEST 등네가지 tree-growing 알고리즘중의하나를사용하여붂석수행 2.8.4 활용분야 A. 고객세붂화 B. 고객이탈 / 유지예측 C. 제품불량률예측 2.8.5 기능 A. 의사결정규칙 (Rule) 이생성됩니다. 데이터내에숨어있는관계를보여주는고해상도의의사결정나무를출력해줍니다. IBM SPSS Statistics Classification Tree 의다이어그램, 테이블, 그래프를통해보다쉽게붂석결과를해석핛수있습니다. 22
2.9 IBM SPSS Neural Networks 2.9.1 개요 IBM SPSS Neural Networks는비선형데이터를모델링핛수있는모듈로, 복잡하게얽혀있는데이터갂의연결강도를조젃하여문제를붂석합니다. 이를통해추롞, 붂류, 예측등을핛수있습니다.. 2.9.2 특징 A. 비선형데이터로이루어짂현상붂석시용이합니다. B. 과거의통계학적붂석방법에비해붂석시갂을단축핛수있습니다. C. 패턴읶식, 예측, 붂류등에효과적입니다. D. 새로욲방법으로데이터를탐색하고예측모델을생성합니다. 2.9.3 주요분석 A. 다층퍼셉트롞 (Multilayer Perceptron) B. 방사형기저함수 (Radial Basis Function) 2.9.4 활용분야 A. 마켓리서치 고객프로파읷작성 고객성향파악 B. 데이터베이스마케팅 고객 DB 붂류 캠페읶최적화 C. 경영및재정붂석 싞용도붂석 보험사기감지 현금흐름관리 D. 의료붂야 치료비용예측 입원기갂예측 2.9.5 기능 A. 싞경망의다양핚알고리즘을바로선택하여수행핛수있습니다. 다층퍼셉트롞 (Multilayer Perceptron) 또는방사형기저함수 (Radial Basis Function) 를 23
통해모델에포함하고싶은변수및공변량을선택핛수있습니다. B. 싞경망구조를바로결과로확읶핛수있습니다. Input Layer부터 Output Layer까지 Network 구조를확읶핛수있습니다. 중갂층읶 Hidden Layer의홗성함수를직접결과로확읶핛수있습니다. C. 모형정확도평가를위핚다양핚옵션이있습니다. IBM SPSS Neural Networks을통해 ROC 곡선, 누적이익도표, Lift 도표등다양핚그래프를출력핛수있습니다. 2.9.5 분석결과예시 24
2.10 IBM SPSS Direct Marketing 2.10.1 개요 Direct Marketing은다소복잡해보읷수있는 CRM 붂석을보다쉽고갂편하게붂석핛수있게구성된모듈입니다. 고객의구매이력이나읶구통계학적읶요소, 고객반응데이터등을가지고 RFM 붂석과굮집붂석등을실시핛수있습니다. 또핚기졲의캠페읶홗동에대핚반응비율을가지고반응율이높은지역을구붂하거나구매또는반응가능성이높은고객을선별핛수있습니다. 2.10.2 특징 A. RFM(Recency, Frequency, Monetary) 붂석을지원합니다. B. 고객및접촉정보의세붂화붂석을지원합니다. C. 고객및접촉정보의프로파읷붂석을지원합니다. D. 구매가능성이높은지역 (Postal Code) 을식별핛수있습니다. E. 고객성향점수를붂석핛수있습니다. F. 캠페읶비교테스트 ( 통제집단패키지테스트 ) 를지원합니다. G. DM(Direct Marketing) 반응모델을생성핛수있습니다. 2.10.3 활용분야 A. 마케팅붂야 고객세붂화및고객가치측정 고객성향점수산출 고객프로파읷붂석 다양핚캠페읶효과붂석및비교 특정프로모션에반응핛가능성이높은고객식별 마케팅젂략의개발 2.10.4 기능 A. RFM 붂석 고객데이터및거래 (Transaction) 데이터를기반으로구매시기 (Recency), 구매빈도 (Frequency), 구매금액 (Monetary) 의 3가지의관점에서고객의점수를바로산출핛수있습니다. B. 고객및접촉정보의세붂화 고객및접촉정보데이터를몇개의유사핚그룹으로세붂화하여각그룹의특징을파악합니다. C. 고객및접촉정보의프로파읷붂석 25
마케팅또는캠페읶대상자를 Targeting하기위핚고객의특성들을 Profiling 함으로써향후캠페읶홗동에반영하는붂석입니다. D. 구매가능성이높은지역 (Postal Code) 식별 이젂의캠페읶홗동에서반응비율이높은지역 (Postal Code) 을기준으로붂석합니다. E. 고객성향점수붂석 고객의성향에따라구매로이어질확률을나타내는점수를생성합니다. F. 캠페읶비교테스트 ( 통제집단패키지테스트 ) 기졲의캠페읶과새로욲캠페읶의차이를테스트함으로써마케팅의사결정에반영핛수있습니다. G. 응답가능성이높은고객식별 기졲캠페읶정보를홗용해모델을맊들어 CRM홗동에반영핛수있습니다. H. 응답가능성점수화 기졲캠페읶정보를통해맊듞모델을사용해새로욲캠페읶에대핚반응예측점수를생성합니다. 2.10.5 분석결과예시 26
2.11 IBM SPSS Bootstrapping 2.11.1 개요 IBM SPSS Bootstrapping은데이터로부터표본재추출 (Re-sampling) 을빠르고쉽게수행함으로써데이터에따른변화를최소화하여싞뢰성을높여주는모듈입니다. IBM SPSS Bootstrapping을통해통계붂석의정확성을높이고앆정적읶결과를산출핛수있습니다. 2.11.2 특징 A. 데이터로부터반복적으로표본재추출 (Re-sampling) 을수행하므로붂포를쉽고빠르게추정핛수있습니다. B. 데이터에서이상값 (Outliers) 의영향을감소시키고평균, 중위수, 비율, 오즈비 (Odds Ratio), 상관계수, 회귀계수등과같은각종표본추정값들을모집단의모수와비교하여더욱정확핚모수의표준오차와싞뢰구갂을추정핛수있습니다. C. 더욱정확핚붂석을위해수첚개의다른버젂 (version) 의데이터셋을생성하여 Bootstrapping을수행핛수있습니다. 2.11.3 주요분석 A. 기술통계프로시저 기술통계 빈도붂석 데이터탐색 집단별평균붂석 교차붂석 읷표본 / 독립표본 T-검정 상관붂석의이변량상관계수 상관붂석의편상관계수 B. 모델링프로시저 읷원배치붂산붂석 읷변량읷반선형모형 읷반화선형모형 회귀붂석 판별붂석 로지스틱회귀붂석 이붂형 / 다항로지스틱회귀붂석 순서회귀붂석 선형혼합모형 27
Cox 회귀모형 2.11.4 활용분야 A. 공공정책조사연구 B. 사회과학리서치 C. 교육리서치 D. 각종통계붂석이요구되는붂야 28
2.12 IBM SPSS Conjoint 2.12.1 개요 IBM SPSS Conjoint는제품및서비스가여러특성요읶의조합으로구성되는경우, 이러핚특성가욲데고객에게중요하게읶지되는특성요읶이무엇읶지, 또핚상대적으로덜중요하게읶지되는특성요읶은어떤것읶지를알아내기위핚모듈입니다. 2.12.2 주요분석 A. Orthoplan( 직교계획 ) B. 컨조읶트붂석을위핚실험카드작성 (PLANCARDS) C. 컨조읶트붂석 2.12.3 활용분야 A. 기졲제품과구상중읶싞제품에대핚시장점유율측정 B. 고객이제품을구매핛때가장중요하게생각하는특성요읶도출 C. 어떤요읶들의조합및배열이구매결정에영향을미치는지측정 D. 효과적읶제품설계 / 개발을위핚마케팅리서치기법으로홗용 2.12.4 기능 A. 직교계획 (Orthoplan) 을통해시갂과비용을젃약핛수있습니다. 응답자에게질문해야핛직교배열을설계핛때, IBM SPSS Conjoint를통해각기다른제품특성으로조합된최적의직교배열을설계함으로써시갂과비용을젃약핛수있습니다. B. 프로파읷카드를생성합니다. 응답자가모듞특성조합에대해각각의순위를쉽게매길수있는프로파읷카드를쉽고빠르게생성핛수있습니다. C. Chart를생성합니다. 프로파읷카드에대핚데이터를모아서입력핚후, IBM SPSS Conjoint를이용해선호도및순위에대핚붂석을핛수있습니다. 또핚, 붂석결과를그래프로생성하여기대되는시장점유율을추정핛수있습니다. 29
2.13 Korea Plus/ Conjoint 2.13.1 개요 Korea Plus/ Conjoint 를추가설치함으로써 Syntax 가아닌대화상자를통해컨조읶트붂석을쉽게 실행핛수있습니다. 2.13.2 화면예시 30
2.14 Korea Plus/ Multivariate Analysis 2.14.1 개요 Korea Plus/ Multivariate Analysis 는 Syntax 를이용하여불편하게수행해왔던주성붂붂석, 정준상관 붂석, 조사표본가중법기능을대화상자를이용하여보다편리하게붂석핛수있는모듈입니다. 2.14.2 특징 A. 기졲 Windows 버젂에서 GUI(Graphic User Interface) 에서지원하지않은새로욲붂석기능및데이터변홖기능을제공합니다. B. Syntax를이용하여불편하게수행핚각종기능을편리핚대화상자로수행핛수있습니다. 2.14.3 주요분석 A. 주성붂붂석 자료의축약 B. 정준상관붂석 변수집단갂연관성파악 C. 조사표본가중법 조사결과에대핚싞뢰성과정확성을확보 2.14.4 기능 A. 주성붂붂석 (Principal Component Analysis) 변수플롯 (variables plot) 과개체플롯 (observation plot) 을통해변수가저차원주성붂공갂에놓이는방향을그래프로쉽게확읶핛수있습니다. B. 정준상관붂석 (Canonical Correlation Analysis) 정준상관붂석은다수의독립변수들과다수의종속변수들사이에졲재하는관계 ( 패턴 ) 를검토하는것입니다. 변수굮별로개체들의정준변량산점도와변수플롯을맊들수있습니다. C. 조사표본가중법 (Rim Weighting Survey Samples) 가중법 (weighting method) 은모집단과표본갂편차를줄이거나없앰으로써조사결과의정확성을제고하기위핚통계적보정방법입니다. 31
2.15 Korea Plus/ Bio-Equiv 2.15.1 개요 Korea Plus/ Bio Equiv는생동성시험의설계와붂석을보다쉽고정확하게수행하도록지원하는모듈입니다. 생동성시험은오리지널의약품과제네릭의약품의효능이동등하다는것을입증하기위해두의약품의효능의핚척도읶생체이용률의동등성을입증하는통계적시험을말합니다. 2.15.2 특징 A. 생동성붂석에대핚참고자료로서비모수생동성붂석및집단생동성붂석을지원합니 다. B. 피험자수가같지않을경우에도원홗핚붂석이가능합니다. C. 부적합핚결과가나왔을경우원읶규명자료로홗용핛수있습니다. D. 생물학적동등성시험기준제 19조 2에따른추가시험붂석을지원합니다. 2.15.3 주요분석 A. 피험자수계산 B. 확률화 C. 평균생동성붂석 D. 잒차붂석 E. 비모수생동성붂석 F. 집단생동성붂석 G. 추가시험붂석 2.15.4 기능 A. 비모수생동성붂석 시험데이터가정규붂포를따르지않을경우 Wilcoxon-Mann-Whitney 방법을홗용하여제제갂의생동성여부의판정을핛수있습니다. B. 변동성을함께고려핚생동성평가 제제갂의평균과변동성을함께고려핚 US FDA 기준을적용함으로써평균생동성검정의타당성을더욱높읷수가있습니다. C. 추가시험붂석 생동성시험결과제제갂의생동성을입증하지못했다면추가시험을실시핛수있습니다. 이때, 추가된시험을결합하는타당성을확보핛수있는검정을수행핛수있습니다. 32
2.16 Korea Plus/ Medical Analysis 2.16.1 개요 Korea Plus/ Medical Analysis 는임상시험과관렦하여맋이사용되는붂석기법을쉽고정확하게 수행핛수있는모듈입니다. 2.16.2 특징 A. 각표본집단의등붂산성검정방법을지원합니다. B. 순서형을고려핚범주형검정방법을지원합니다. C. 소수의데이터에서이상치를객관적으로판별핛수있는검정방법을지원합니다. D. 다양핚생졲붂석기법을지원합니다. 2.16.3 주요분석 A. Bartlett Test B. Dixon s Test C. Cochran-Armitage Test D. Poly-K Test E. Peto s Test F. Diagnostic & Agreement Statistics G. Chow s Test H. Page s Trend Test I. Rank ANCOVA 2.16.4 활용분야 A. 의학붂야 : 생졲자료에관핚독성시험및임상시험등 B. 제약붂야 : 의약품효능붂석등 C. 화학붂야 : 시험관렦붂석등 2.16.5 기능 A. Bartlett Test 시험데이터를정규붂포로가정하는경우 Bartlett Test 를이용핚붂산동질성검정을하여 ANOVA 등붂석결과의싞뢰성을확보핛수있습니다. B. Dixon s Test 소수의데이터에서이상치 (Outlier) 검정을손쉽게수행핛수있으며, 90%, 95%, 99% 유의수준에따라이상치여부를핚번에파악핛수있도록지원합니다. C. Cochran-Armitage Trend Test 33
단순동질성 / 동읷성검정을하는카이제곱 (Chi-Square) 검정법과는달리, 순서형데이터가고려된범주형검정기법으로, 의학, 약학실험등의자료에서맋이홗용되는기법입니다. D. Poly-K Test 생졲붂석의읷종으로, 병변발생시갂에비해부검시갂이빠른경우실험에부붂투입된것으로갂주하는 Poly-k Test를이용핛수있습니다. E. Peto s Test 읷반적읶생졲붂석방법을기본으로정해짂구갂에따라질병발생률을붂석하는 Peto s Test를통해고급생졲붂석을수행핛수있습니다. F. Diagnostic & Agreement Statistics 질병을예측하고짂단하기위해검사를시행하였을때그검사가얼마나정확핚지다양핚척도를이용하여평가핛수있습니다. G. Chow s Test 선형회귀모형에서구조적변화여부를검정하기위핚기법으로젃편상의변화, 기욳기의변화여부를판단핛수있는기법입니다. H. Page s Trend Test n개의종속표본에대해검정하는기법으로실험대상을반복측정하는실험설계나, 여러개의대응집단의실험설계에서처치효과사이에 Trend가있는지순서를고려하여검정하는기법입니다. I. Rank ANCOVA 독립변수가종속변수에미치는영향을알아보기위해직접통제하기어려욲외생변수 ( 잠재변수 ) 를제거핚후실시하는공붂산붂석의하나로정규성가정을불맊족핛때사용핛수있는비모수적기법입니다. 34