Microsoft PowerPoint - MDA DA pptx

Similar documents
Microsoft PowerPoint - MDA DA pptx


공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

G Power

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a


<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

Microsoft Word - SPSS_MDA_Ch6.doc

슬라이드 1

슬라이드 1


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

자료분석론 - 국민건강영양조사 분석

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

슬라이드 1

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

<B3EDB4DC28B1E8BCAEC7F6292E687770>

자료의 이해 및 분석

한국정책학회학회보

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

슬라이드 1

슬라이드 1

슬라이드 1

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라


슬라이드 1

Microsoft PowerPoint - LM 2014s_Ch4.pptx

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포


Microsoft Word - ch8_influence.doc

Microsoft Word - ch3_residual.doc

고객관계를 리드하는 서비스 리더십 전략

외국인투자유치성과평가기준개발

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론


제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

untitled

MATLAB for C/C++ Programmers

Microsoft Word - skku_TS2.docx

Microsoft PowerPoint - Info R(3) pptx

review hwp

Microsoft PowerPoint - ANOVA pptx

i

자료의 이해 및 분석

untitled

Sequences with Low Correlation

표본재추출(resampling) 방법

Resampling Methods

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차


2 출판 만화산업 실태조사 1 Ⅰ. 출판 만화산업 실태조사 3 출판 만화산업 실태조사 1. 콘텐츠업체 실태조사 개요 2. 출판 만화업체 실태조사 분석결과

제 4 장회귀분석

Microsoft Word - EDA_Univariate.docx

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

선형모형_LM.pdf

PowerPoint 프레젠테이션

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형


hwp

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D>

164

cat_data3.PDF

비선형으로의 확장

PowerPoint 프레젠테이션

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

statistics

1) 주거이동과관련된이론적배경및선행연구들에대한자세한사항은조성진 (2014), 문근식 이현석 (2016) 등참고. 특정주거지 ( 주택 ) 에서의거주기간이아닌이주여부 / 계획을종속변수로하여로짓 (Logit) 이나프로빗 (Probit) 모형등을이용하여분석한연구들도많이있다 (

R t-..

시스템경영과 구조방정식모형분석


642 또한통계적유의성은실제적유의성과더불어검토되어야할문제이므로통계적유의성만의지나친집착과확대해석은바람직하지않으며, 통계적유의성이검출되지않은연구결과도때로는그자체로휼륭한의미를지닐수있다는점과추후연구에기여할수있다는점에서발표될수있어야할것이다 [6]. 여기에서실제적유의성이란실제적인

통계적 학습(statistical learning)

시계열분석의개요 (the nature of time series analysis) 확률과정 (stochastic processes) 이란시간으로순서가매겨진확률변수들의집합임. 만일확률변수 y 가연속이라면 y(t) 라고표기하지만이산이라면 y t 라고표기함 ( 대부분의경제자


OCW_C언어 기초

Microsoft Word - SAS_Data Manipulate.docx

CHU 통계교육 Workshop (DAY 7. MDA 군집분석 ) 1. 개념 Individual Directed Technique + 범주 ( 그룹 ) 에대한사전정보가없음 + 다변량측정치를동시에고려하여데이터개체분류 + 개체의유사성 (simila

<BEE7C0FBBFACB1B820B0ADC1C2BCD2B0B32E687770>

통계분석가이드라인 통계 (Statisitcs) 란? Second Language in Science 전남대학교치의학전문대학원임회정 1 2 모집단 (Population) 과표본 (Sample) 통계분석단계 Sampling 추정 1. 귀무가설수립 2.

<B0A3C3DFB0E828C0DBBEF7292E687770>


한국색채학회 논문심사 및 편집일정

Tree 기반의 방법

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

歯

Microsoft PowerPoint - chap06-2pointer.ppt

°¡°Ç2¿ù-ÃÖÁ¾

2011년 제 9회 최우수상.hwp

BIS Solvency (RBC) Solvency. Solvency,. Solvency.

슬라이드 1

untitled

Microsoft PowerPoint - IPYYUIHNPGFU

지표3권1-265

PowerPoint Presentation

Transcription:

SPSS 2 집단 ( 데이터및준비 ) 데이터 TURKEY.SAV 미국 Kansas 주립대학 Dr. Michael Finnegan 교수는야생칠면조와사육칠면조를구별하기위하여수컷칠면조 82마리에대해 9개항목을조사하였다. ID: 칠면조 id HUM: 상완골길이 ULN: 척골길이 CAR: car metacarus 길이 COR: 오탁상길이 RAD: 요골길이 FEMUR: 대퇴골길이 TIN: 경골길이 SCA: 견갑골길이 D3P: 지골까지길이 TYPE: 칠면조종류야생 (WILD), 사육 (DOMESTIC) 판별변수모두사용 9 개판별변수측정치가모두있는개체만사용된다. 집단변수가문자열이면판별분석사용 50

SPSS 2 집단 ( 판별분석메뉴 ) 메뉴선택 모두진입옵션 : 전체사용 변수선택을하려면단계선택옵션설정 Fisher 방법을사용하자 표본의크기로사전확률적당 일반적으로표본비율은모집단의비율과동일하게하자. 개별 - 집단옵션을사용하는것이적절하다. 요약표는오분류결과출력 저장통계량 5

SPSS 2 집단 ( 판별분석결과 ) 사전확률 오분류결과 Fisher 선형계수 ( 결과제시의미없음 ) 오분류비율은 9.% 이다. (33 개개체사용 ) 분류집단과판별점수 얻는판별식에의해 개체 43 의판별점수 -2., 집단 (domestic) 소속확률은 0.999 이고집단 2 는 0.00 이다. 그러므로 domestic 으로분류 개체 45 의판별점수 0.247, 집단 (domestic) 소속확률은 0.499 이고집단 2 는 0.50 이다. 그러므로 wild 으로분류 52

SPSS 2 집단 ( 변수선택 ) 선택방법설정 진입및제거유의확률설정 방법은 Wilk 람다사용 오분류결과 9.8% 오분류 (42 개개체사용 ) Parsimony 법칙에의해 2 개판별변수만사용하는것이적절 저장결과일부 (Dis_2 는판별변수 2 개만사용한경우 ) 2 개변수진입 53

SPSS 2 집단 ( 판별내용보기 ) 분류집단의판별변수평균차이검정 Tin, Rad 만유의한판별변수 나머지는 2 개는비교를위하여 판별변수에의한집단그래프표현 2 개이상이면주성분변수활용 65.00 분석용예측집단 DOMESTIC WILD 60.00 55.00 50.00 Tin 45.00 40.00 35.00 30.00 26.00 29.00 32.00 35.00 Rad 38.00 4.00 44.00 54

SPSS 2 집단 ( 새로운개체분류 ) 새로운칠면조에 2마리왔는데야생칠면조인지사육칠면조인지알수없어판별하고자한다. 두마리의 (HUM, ULN) 을측정하였더니다음과같았다. (Tin, Rad) = (40, 50) (Tin, Rad) = (30, 40) 데이터마지막열에입력하고최종판별분석시행 (Tin, Rad) = (40, 50) 는 wild 로 (Tin, Rad) = (30, 40) 는 domestic 으로분류되었다. 55

Logistic 판별분석 개념 종속변수가이진형 (binary) 이거나순서형 (ordinal) 인경우사용되는회귀분석 종속변수 Binary: Logit 모형 종속변수측정치 Y i =0( 실패 ), ( 성공 ) =P(Y i =) y = f α +.. + β x + e i ( x) = + βxi + β 2 x2i ODDS ratio( 오즈비 )=/(-) ) Ln(odds) 를종속변수로사용하여일반회귀분석실시 Pr( Y = x) == i + e 회귀계수 B의의미 회귀계수의부호는성공확률 () 증감과일치 i i 장점 판별변수에대한유의성검정편리 판별에영향정도비교가능 판별변수로지시변수사용가능 종속변수 Ordinal: Logistic 모형 k 는종속변수집단최대값, 0,, 2,, k log it ( l( = β + β ) = ln( ) 0 X + 2 logit( β β + 2) = ln( ) = 0 + X y i 2 i = ln( ) = α + βx i + β2x2i +.. + β xi + ei i L + 2 +... + 2 = logit( = β + β X { α + βxi + β2x2i +.. + β x i } + 2 +... + 2) = ln( ) 0 ( + +... + ) EXP( 회귀계수 ) 는설명변수가한단위증가할때 odds ratio 에미치는영향 (multilication) 이된다. i i = ( e )( e ) ˆ xi α ˆ β ˆ β L( e ) x i 2 2 56

SPSS 2 집단 ( 로지스틱회귀분석 ) 변수선택하여유의한변수만사용하자. 전진 (forward) 범주형옵션에는분류형판별변수를지정할수있다. 소속집단및확률, 이상치와영향치판단 극단적인오분류개체와일치 57

SPSS 활용 ( 로지스틱회귀분석, 결과 ) P(Y=wild) 에대한예측. 판별유의변수 Tin, Fem B ( 회귀계수추정치 ) Tin 값이커지면 wild 칠면조가능성높음 Fem 값이커지면 domestic 일가능성높음 오즈비영향 TIN: Domestic 대비 Wild 에속할가능성이 29 배 FEM: Wild 대비 Domestic 에속할가능성이 4 배 오분류 3% 에불과 이상치나영향치 극단적인오분류결과와일치, 제거보다는이유찾기 개체표현및새로운개체분류 판별분석과동일한방법으로 Pr( Y = wild) == + e { 304+ 3.39Tin+.39Fem} 58

다른판별분석 정준 Cannonical 판별분석 Fisher에의해제안된방법으로 Fisher s between-within met hod라고불리는방법이다. 판별변수들의유용한정보를모두를포함한정준 (Canonical) 변수를이용하여판별분석을실시한다. 판별변수들의수가 () 너무많아판별결과에대한해석이곤란한경우 -차원공간에서의개체들의집단평균들을저차원공간으로변환시켜처리하는판별분석방법이다. 개체분류가목적이아니라개체분류해석을위해저차원 (BOX-PLOT이나산점도 ) 으로표현하는데있으므로엄밀히말하면판별분석은아니다. 새로운변수 ( 정준변수 ) 에대한해석이가능하든아니든집단들사이의실제거리를저차원으로축소하여시각화할수있다는장점이있다. 차원을줄인다는의미에서보면주성분분석과유사해보이지만계산방법은전혀다르다. 집단 Between and Within 변동을계산하여 B/(B+W) 최대화하는선형계수선택하여정분변수를만든다. K Nearest Neighbor 판별분석 모집단이정규분포를따르지않는경우사용하는비모수판별분석방법 () 분류하려는개체와 Mahalanobis 거리가가장가까운개체를구하고그개체가속한집단으로분류한다. (2) 만약거리가같은개체가 2 개인경우동일집단이면그집단에분류한다. (3)2개이면서그개체의집단이동일하지않으면그다음가까운개체의집단을조사하여 3개의개체중많이속한집단으로분류한다. 여기서 k nearest neighbor 의미는 Mahalanobis 거리가가장가까운개체 k개를고려하여그 k개개체의군집중가장많은수를차지하는군집에분류하게된다. 다음프로그램거리가가장가까운 3개의개체들의집단을조사하여가장많은집단으로분류하는방법이다. 새로운접근방법 판별변수 ( 측정변수 ) 가이산형, 순서형분류형, Binary인경우사용되는 Classification Trees 방법이있다. Breiman, Friedman, Olshen, Stone (984) 제안한방법으로그들의책제목은 CART(Classification And Regression Trees) 라고되어있다. 비슷한방법으로 J. A. Hartigan이개발한 CHAID(Chisquare Automatic Interaction Detector) 가있다. 이방법은현재 Data Mining i 기법으로가장많이이용되고있다. SPSS에는 ANSWER tree TOOL에속해있다. 59