untitled

Size: px
Start display at page:

Download "untitled"

Transcription

1 통계청 통계분석연구 제 4 권제 1 호 (99. 봄 ) 데이터마이닝의사결정나무의응용 최종후 * 서두성 ** 본논문의목적은최근국내에서활발하게논의되고있는데이터마이닝의주요한도구인의사결정나무를정리, 소개하는데에있다. 본논문에서는 1997에실시된체 15대대통령선거예측조사자료를이용한무응답의분류및예측문제와개인휴대통신의해지자분석에이를적용한결과를보인다. 끝으로효율적통계조사를위한전략수립에의사결정나무활용가능성을검토한다. < 차례 > 1. 서론 3. 개인휴대통신해지자분석 1.1 의사결정나무의소개 3.1 개요 1.2 의사결정나무의알고리즘 3.2 의사결정나무결과 3.3 고객점수화 2. 선거예측조사무응답의분류및예측 4. 토의 2.1 개요 2.2 의사결정나무결과 2.3 선거예측결과 * 고려대학교정보통계학과부교수, jchoi@tiger.korea.ac.kr ** 고려대학교정보통계학과석사과정

2 통계분석연구 제 4 권제 1 호 (99. 봄 ) 서론 1.1 의사결정나무의소개 의사결정나무는의사결정규칙 (decision rule) 을도표화하여관심대상이되는집단을몇개의소집단으로분류 (classification) 하거나예측 (prediction) 을수행하는분석방법이다. 분석과정이나무구조에의해서표현되기때문에판별분석 (Discriminant Analysis), 회귀분석 (Regression Analysis), 신경망 (Neural Networks) 등과같은방법들에비해연구자가분석과정을쉽게이해하고설명할수있다는장점을가지고있다. 의사결정나무는분류또는예측을목적으로하는어떤경우에도사용될수있으나분석의정확도보다는분석과정의설명이필요한경우에더유용하게사용된다. 의사결정나무분석이활용될수있는응용분야는다음과같다.( 최종후외 :1998) 세분화 (Segmentation) : 관측개체를비슷한특성을갖는몇개의그룹으로분할하여각그룹별특성을발견하고자하는경우 분류 (Classification) : 여러예측변수 (predicated variable) 에근거하여목표변수 (target variable) 의범주를몇개의등급으로분류하고자하는경우 예측 (Prediction) : 자료로부터규칙을찾아내고이를이용하여미래의사건을예측하고자하는경우 차원축소및변수선택 (Data reduction and variable screening) : 매우많은수의예측변수중에서목표변수에큰영향을미치는변수들을골라내고자하는경우 교호작용효과의파악 (Interaction effect identification) : 여러개의예측변수들이결합하여목표변수에작용하는교호작용을파악하고자하

3 데이터마이닝의사결정나무의응용 63 는경우 범주의 병합 또는 연속형 변수의 이산화 (Category merging and discretizing continuous variable) : 범주형목표변수의범주를소수의 몇개로병합하거나, 연속형목표변수를몇개의등급으로범주화하 고자하는경우 일반적으로의사결정나무분석은다음과같은단계를거친다 (Berry and Linoff:1997; 강현철, 서두성, 최종후 :1998) 의사결정나무의형성 : 분석의목적과자료구조에따라서적절한분리기준 (split criterion) 과정지규칙 (stopping rule) 을지정하여의사결정나무를얻는다. 가지치기 : 분류오류 (classification error) 를크게할위험 (risk) 이높거나부적절한규칙을가지고있는가지 (branch) 를제거한다. 타당성평가 : 이익도표 (gains chart) 나위험도표 (risk chart) 또는검정용자료 (test data) 에의한교차타당성 (cross validation) 등을이용하여의사결정나무를평가한다. 해석및예측 : 의사결정나무를해석하고분류및예측모형을설정한다. 이상과같은과정에서정지기준, 분리기준, 평가기준등을어떻게지정하느냐에따라서서로다른의사결정나무가형성된다. 1.2 의사결정나무의알고리즘 CHAID 알고리즘 CHAID(Chi-squared Automatic Interaction Detection : Kass(1980)) 는카이제곱검정 ( 범주형목표변수 ) 또는 F-검정 ( 연속형목표변수 ) 을이용하여다지분리 (multiway split) 를수행하는알고리즘이다.

4 통계분석연구 제 4 권제 1 호 (99. 봄 ) 64 CHAID 알고리즘은목표변수가범주형일때, Pearson의카이제곱통계량또는우도비카이제곱통계량 (likelihood ratio Chi-square statistic) 을분리기준으로사용한다. 여기서목표변수가순서형또는사전그룹화된연속형인경우에는우도비카이제콥통계량이사용된다. 카이제곱통계량은관측도수 ( fij ) 로이루어진 r c 분할표로부터계산된다. 분할표의구조는 < 표 1.1> 과같다. < 표 1.1> 분할표의구조 목표변수설명변수 범주 1 범주 2 범주 c 합계 범주 1 f 11 f 12 f lc f 1. 범주 2 f 21 f 22 f 2c f 2. 범주 r f rl f r2 f rc f r. 합계 f. 1 f. 2 f. c f.. < 표 1.1> 의분할표로부터, Person 의카이제곱통계량은 x 2 = i, j (f ij - e ij ) 2 e ij

5 데이터마이닝의사결정나무의응용 65 과같이정의되고, 우도비카이제곱통계량은 x 2 =2 i, j f i, j log e ( f ij e ij ) 으로정의된다. 이때두통계량의자유도 (degree of freedom) 는 ( r-1)( c -1) 로서동일하다. 여기서 e ij 는분포의동일성또는독립성의가설하에 서계산된기대도수 (expected frequency) 를말하며, 아래에주어진식 e ij = f i f j f.. 과같이계산된다. 카이제곱통계량이자유도에비해서매우작다는것은예측변수의각범주에따른목표변수의분포가서로동일하다는것을의미한다. 따라서예측변수가목표변수의분류에영향을주지않는다고결론지을수있다. 자유도에대한카이제곱통계량값의크고작음은 P-값으로표현될수있는데, 카이제곱통계량값이자유도에비해서작으면 P-값은커지게된다. 결국분리기준을카이제곱통계량값으로한다는것은 P-값이가장작은예측변수와그때의최적분리에의해서자식마디를형성시킨다는것을의미한다 CART 알고리즘 CART(Classification and Regression Trees, Breiman et al.(1984)) 는지니지수 ( 범주형목표변수인경우적용 ) 또는분산의감소량 ( 연속형목표변수인경우적용 ) 을이용하여이지분리 (,binary split) 를수행하는알고리즘이다 (Quinlan, 1993). 지니지수 (Gini Index) 는불순도 (impurity) 를측정하는하나의지수이다. 임의의한개체가목표변수의 i 번째범주로부터추출되었고, 그개체를

6 통계분석연구 제 4 권제 1 호 (99. 봄 ) 66 목표변수의 j 번째범주에속한다고오분류 (misclassification) 할확률은 P( i)p( j) 가된다. 여기에서 P( i) 는각마디에서한개체가목표변수의 I 번째범주에속할확률이다. 이러한오분류확률은모두더하여 G = c P(i)P(j) j =1 i j 를얻을수있고, 이는위와같은분류규칙하에서오분류확률의추정치가된다. 여기서 c는목표변수의범주의수를말한다. 일반적으로 CART는범주형목표변수에대해서는지니지수를분리기준으로사용한다. 지니지수는각마디에서의불순도또는다양도 (diversity) 를재는측도중의하나로써 G = c P(j)(1-P(j)) = 1- c j=1 j =1 P(j) 2 = 1- c j=1 (n j /n) 2 와같이표현될수있다. 여기에서 n은그마디에포함되어있는관찰치수를말하고, n i 는목표변수의 i번째범주에속하는관찰치수를말한다. 지니지수는 n개의원소중에서임의로 2개를추출하였을때, 추출된 2 개가서로다른그룹에속해있을확률을의미하며 Simpson의다양도지수 (diversity index) 로도알려져있다. 목표변수의범주가 2개인경우에는지니지수는다음과같이표현될수있으며, G = 2P(1)P(2) = 2( n 1 n )( n 2 n ) 이는카이제곱통계량을사용하는것과같은결과를갖는다. CART 알고리즘은지니지수를가장감소시켜주는예측변수와그변수

7 데이터마이닝의사결정나무의응용 67 의최적분리를자식마디로선택하는데, 지니계수의감소량은다음과같이계산된다. Δ G = G- n L n G L- n R n G R. 여기서 n은부모마디의관측치수를말하고, n R 과 n L 는각각자식마디의관측치수를의미한다. 즉, 자식마디로분리되었을때의불순도가가장작도록자식마디를형성하는것이다. 이는다음과같은자식마디에서의불순도가중합을최소화하는것과동일하다. P(L) G L + P(R) G R = n L n G L + n R n G R. 2. 선거예측조사무응답의분류및예측 2.1 개요 선거예측조사에서흔히발생하는문제로서지지후보에대한유권자의무응답현상을들수있다. 선거에임박한예측조사에서무응답이다수발생하는경우이러한무응답층에대한분석은선거예측조사의성패의관건이된다. 2장에서는 CHAID 알고리즘을이용하여선거자료에서흔히발생하는무응답자의패턴을분류하고이들의지지후보를예측한다, 자료설명 다음자료는리서치앤리서치社가 1997 년제 15 대대통령선거를앞두고

8 통계분석연구 제 4 권제 1 호 (99. 봄 ) 68 각후보의지지율조사를위해실시한전화조사에의해얻어졌다 1). 이중 투표유무 라는항목에대해 반드시투표할것이다, 아마투표할것이다 라고답한응답자에대해서만분석을시도하였는데이러한유효응답의수는총 979개이다. < 표 2.1> 은분석에사용되는변수에대한설명이다. < 표 2.1> 분석에사용된변수 변수이름 형태 변수값 거주지역 명목형 서울, 부산, 인천, 대구, 광주, 대전, 울산, 경기, 강원, 충북, 충남, 전북, 전남, 경북, 경남, 제주 나이 명목형 20대이하, 30대, 40대, 50대, 60대이상 성별 명목형 남자, 여자 투표유무 순서형 반드시투표할것이다, 아마투표할것이다아마투표하지않을것이다, 전혀투표할생각이없다. 지지후보 명목형 이회창, 김대중, 이인제, 기타후보, 무응답 지지정당 명목형 한나라당, 국민회의, 국민신당, 자민련 학력 순서형 국졸이하, 중졸, 고졸, 대재이상 직업 명목형 농 / 임 / 어업, 자영업, 판매 / 서비스직, 기능 / 숙련공, 일반작업직, 사무 / 기술직, 경영 / 관리직, 전문 / 자유직, 주부, 학생, 무직, 기타 월소득 순서형 70만원이하, 71~100만원, 101~150만원, 151~200만원, 201~250만원, 251~300만원, 301만원이상 원적지 명목형 서울, 부산, 인천, 대구, 광주, 대전, 울산, 경기, 강원, 충북, 충남, 전북, 전남, 경북, 경남, 제주 분석과정각후보의지지율을계산하는과정은다음과같다. 단계 1 : 먼저전체자료를변수 지지후보 에대해범주 무응답 인관측치들 ( 이하무응답층 ) 과그렇지않은관측치, 즉 지지후보 변수에대해응답한관측치들 ( 이하응답층 ) 로나눈다. 단계 2 : 응답층으로부터나무구조모형을구축한다. 1) 리서치앤리서치社는이자료를연구용으로공개한바있다.

9 데이터마이닝의사결정나무의응용 69 단계 3 : 구축된모형을무응답층에적용하고, 이를통해 지지후보 의범주별지지율을계산한다. 단계 4 : 응답층의실제지지율과단계 3에서얻은무응답층의비율을더하여전체지지율을예측한다. 2.2 의사결정나무결과 < 그림2.1> 은의사결정나무알고리즘을이용한다중나무구조 (Multi-Tree Structure) 의분류결과이다. 총 9개의최종마디로이루어진나무가형성되었다. 맨위에있는뿌리마디는 690개의관측치로, 지지후보에대한비율은각각 33.91%, 41.16%, 22.61%, 2.32% 로나타나고있음을볼수있다. < 그림 2.1> 지지후보에대한의사결정나무모형 지지후보를결정하는데제일중요한변수로는지지정당이며, 다음으로는소득및성으로구분된다.

10 통계분석연구 제 4 권제 1 호 (99. 봄 ) 70 < 그림 2.2> 의사결정나무마디의번호 의사결정나무에서이익도표 (gains chart) 는범주형목표변수 (target variable) 의특정범주가각마디에서획득한백분율을나타낸다. < 표 2.2>~< 표 2.4> 는각후보들의지지성향을보기위한이익도표이다. < 표 > 에나타나는통계량은다음과같다. Node : 마디의번호 Node(n) : 개체의수 Node(%) : ( 개체의수 )/( 전체개수의수 ) Resp(n) : 목표범주의개체의수 Resp(%) : ( 목표범주의개체의수 )/( 전체에서목표범주의개체의수 ) Gain(%) : ( 목표범주의개체의수 )/( 개체의수 ) Index(%) : ( 목표범주의비율 )/( 전체목표범주의비율 ) < 표 2.2>~< 표 2.4> 는각후보들의이익지수와관련된값들을정리한표이다. < 표 2.2> 이회창후보의이익도표

11 데이터마이닝의사결정나무의응용 71 Node Node: n Node: % Resp: n Resp: % Gain (%) Index (%) 이회창후보의경우 Gain이가장높은마디가마디 1임을알수있다. < 그림 2.2> 에서볼수있듯이마디 1은지지정당이 한나라당 임을알수있다. 다음으로높은 Gain을획득한마디는 13으로지지정당이 자민련 이거나 모름 / 무응답 인범주중에서성별이 여자 이면서소득이 만원 임을알수있다. 마디 1의 Index< 표 2.3> 김대중후보의이익도표는 이므로이는전국에서획득한지지율인 33.91% 보다마디 1에해당하는집단에대해서 2.69배나높은지지율을얻었다는것을보여준다. < 표 2.3> 김대중후보의이익도표 Node Node: n Node: % Resp: n Resp:(%) Gain (%) Index (%) 김대중후보의경우 Gain이가장높은마디가마디 5와 3임을알수있다. 마디 5는지지정당이 국민회의 이면서소득이 만원 이면서성

12 통계분석연구 제 4 권제 1 호 (99. 봄 ) 72 별이 남자 임을알수있으며, 마디 3은지지정당이 국민회의 이면서소득이 만원 임을알수있다. 마디 5와 3의 Index는 으로이는전국에서획득한지지율인 41.16% 보다마디 5와 3에해당하는집단에대행서 2.42배나높은지지율을얻었다는것을보여준다. < 표 2.4> 이인제후보의이익도표 Node Node: n Node: % Resp: n Resp: % Gain (%) Index(%) 이인제후보의경우 Gain이가장높은마디가마디 8임을알수있다. 마디 8은지지정당이 국민신당 임을알수있다. 다음으로높은 Gain을획득한마디는 12로지지정당이 자민련 이거나 모름 / 무응답 인범주중에서성별이 여자 이면서소득이 만원 임을알수있다. 마디 8의 Index는 이므로이는전국에서획득한지지율인 22.61% 보다마디 8 에해당하는집단에대해서 3.52배나높은지지율을얻었다는것을보여준다. < 표 2.5> 는의사결정나무모형의오분류테이블이다.

13 데이터마이닝의사결정나무의응용 73 < 표 2.5> 오분류테이블 실제결과 이회창 김대중 이인제 기타후보 total 이회창 김대중 예측결과 이인제 기타후보 total Risk Estimate SE of Risk Estimate 전체적인오분류율은약 24.6% 정도이며, 이에대한표준오차는 이다. 2.3 선거예측결과 이제까지응답층에대한지지후보의의사결정나무모형을구축하였다. 이렇게구축된나무모형결과를무응답층 ( 관찰치 289개 ) 에적용하여얻은예측빈도가 < 표 2.6> 이다 < 표 2.6> 무응답층의예측빈도 무응답층 예측빈도 이회창 김대중 이인제 기타후보 전 체 (50.9) (42.6) (6.6) (0) (100) < 표 2.7> 은응답층의실제빈도와무응답층의예측빈도를더해서지지율의추정치를얻은표이다. < 표 2.7> 지지후보에대한전체추정치

14 통계분석연구 제 4 권제 1 호 (99. 봄 ) 74 응답층의실제빈도무응답층예측빈도전체추정치 이회창 김대중 이인제 기타후보 전체 (33.9) (41.2) (22.6) (2.3) (100) (50.9) (42.6) (6.6) (0) (100) (38.92) (41.57) (17.87) (1.63) (100) 실제결과 (38.7) (40.3) (19.2) (1.8) (100) 지금까지의사결정나무알고리즘을이용하여응답층의나무구조를해석하고응답층에대한나무구조를이용하여무응답층의판별과분류를실시하였다. 선거무응답층의지지후보예측에관한기존의연구는주로판별분석에의존해왔다 ( 박무익, 1998) 2). 그런데이경우판별변수가되는인구속성변수들은주로범주형변수이기때문에판별분석에서요구되는가정 (assumption) 충족에서문제가발생한다.( 예컨대정규상의가정 ) 전술한이익도표는각후보의지지패턴분석이나선거운동전략에유용하게이용되리라생각된다. 3. 개인휴대통신해지자분석 3.1 개요 3장에서는개인휴대통신고객의해지특성이어떤가입자속성변인에의존하는지에대한해지패턴을분석하고해지가능성에대한점수화 2) 한국갤럽은 1997 년실시된 15 대대통령선거의선거예측조사에서무응답층의분석을위 하여판별분석을적용한바있는데이때고려했던판별변수는성, 연령, 교육수준, 원 적이었다.

15 데이터마이닝의사결정나무의응용 75 (scoring) 를시도한다. 고객의해지패턴을알아보기위하여의사결정나무 (decision tree) 분석을이용하였으며, 해지가능성에대한점수화는로지스틱회귀모형 (Logistic Regression Model) 을이용한다. 고객 DB(Data Base) 를이용한고객세분화 (segment) 로이동통신가입고객의해지특성이어떠한패턴을이루고있는지를알아보기위하여의사결정나무분석을실시하였다. 이러한분석은고객해지율 (defection rate) 을감소시키는고객유지마케팅 (retention marking) 의일환으로이용될수있다. 분석에사용된자료는이동통신회사의서울지역고객DB를이용하여랜텀추출로 2,500개의표본을획득한것이다. 분석표본의해지율은 13.2% 이다. 목표변수로는해지여부이며기타고객속성변수가설명변수이다. 변수의내용은 < 표 3.1> 과같다. < 표 3.1> 분석에사용된변수 변수명범주 해지여부 정상사용 / 일반해지 고객계정상태 개통사용중 / 최종청구 / 정상해지 없음 /1만5천원미만/1만5천원~2만7천원미만/2만7천원~4만원미만/ 최근 4 개월간 사용료 4 만원 ~5 만원천원미만 /5 만 5 천원 ~7 만 1 천원미만 /7 만 1 천원 ~9 만 2 천 원미만 /9 만 2 천원 ~11 만 8 천원미만 /11 만 8 천원 ~15 만 7 천원미만 /15 만 7 천원~2 2만8천원미만 /22만8천원이상 최근 1년간미납여부 없음 / 있음 납입방법 자동이체 / 카드이체 / 지로납부 / 중앙불 가입경력 6개월미만 /6~10개월/11~12개월/13개월/14~18개월/19~22개월/ 23~26개월 /27~33개월/34~46개월/47개월이상 디지털유무 아날로그 / 디지탈 총불만건수 없음 /1번/2번/3번이상 요금계획 일반요금 / 비지니스 / 일반요금 (VMS)/ 예치요금 / 예치요금 (VMS)/ 프리미엄 / 프리미엄 (VMS)/ 이코노미 / 이코노미 (VMS) 성별 남자 / 여자 연령 10대 /20대/30대/40대/50대/60대/70대이상

16 통계분석연구 제 4 권제 1 호 (99. 봄 ) 의사결정나무결과 의사결정나무분석의타당성을위하여자료를분석용자료 (training data) 와타당성평가용자료 (valication data) 로나누어분석하였다. < 그림 3.1> 해지유무에대한의사결정나무 3) < 그림 3.1> 은의사결정나무모형의다중나무구조의분류결과이다. 총 8 개의최종마디로이루어진나무구조가형성되었다. 맨위에있는뿌리마 3) 각마디의분석결과에서왼쪽은분석용자료에대한값이고, 오른쪽은타당성평가용 자료에대한값이다.

17 데이터마이닝의사결정나무의응용 77 디 (root node) 에서분석용자료와타당성평가용자료의해지율이각각 13.1%, 13.3% 로나타나고있다. 가입고객의해지를결정하는제일중요한변수로는고객계정상태이며, 두번째로는최근 4개월간사용료, 세번째로는가입경력과납입방법으로구분된다. 이중가입고객의고객계정상태가 최종청구 / 정상해지 인경우에해지율이 83.8%( 분석용 ),88.4%( 타당성평가용 ) 로높아짐을볼수있으며, 다음으로가입고객이고객계정상태가 개통사용중 이면서최근 4개월간사용료가 22만 8천원이상 인경우해지율이 22.4%, 22.0% 로높아짐을볼수있다. 특히, 가입고객의고객계정상태가 개통사용중 이면서최근 4개월간사용료가 22만 8천원이상 이면서가입경력이 13개월미만 의경우해지율이 42.4%( 분석용 ), 42.9%( 타당성평가용 ) 로높아짐을볼수있다. < 표 3.2> 의사결정나무분석의오분류테이블 예측일반해지정상 계 실제 일반해지 % 8.16% 330 정상 % 85.92% 2170 계 Error rate=0.0904, Accuracy= Sensitivity=0.3818, Specificity= < 표 3.2> 는의사결정나무분석의오분류테이블이다. 오분류율 (error rate) 과정확도 (accurany) 가각각 , 으로잘분류되어진것같으나민감도 (sensitivity) 4) 가 로떨어짐을볼수가있다. 4) 민감도는관심을둔사건을제대로예측할확률이다. 이경우에는해지가관심있는사 건이므로일반해지를일반해지로예측한확률이다. 여기서는 126/330.

18 통계분석연구 제 4 권제 1 호 (99. 봄 ) 고객점수화 개인휴대통신고개의해지가능성점수를사전에예측할수있는모형을구축하기위하여로지스틱회귀모형을이용한다. 로지스틱회귀분석은목표분석가명목척도로측정되어있는경우에목표변수와설명변수간의관계를분석하기위하여적용되는통계기법의하나이다. 로지스틱회귀분석의사용은판별분석을사용하는것과마찬가지로두집단으로구분된개체에대해각개체가속하는집단을예측하거나, 집단의구분에서는어느설명변수가중요한지를알아내는데사용된다. 일반적으로설명변수의수가 p, 목적변수 Y가 1 혹은 2인로지스틱회귀모형은다음과같다.( 허명회 :1995). log P(Y =1 x 1,,x p ) P(Y =2 X 1,,x p ) = β 0 +β 1 x 1 + +β p x p 또는 P(Y =1 x 1,,x p )= exp ( β 0 + β 1 x 1 + +β p x p ) 1+exp(β 0 + β 1 x 1 + +β p x p ) < 그림 3.1> 의의사결정나무에서해지율이 13.2% 보다높은마디에해당하는가지로, 고객계정상태가 최종청구 / 정상해지 이거나고객계정상태가 개통사용중 이면서사용료가 22만 8천원이상 인자료 ( 관찰치 400개 ) 만을이용하여로지스틱회귀모형을구축한다. 단계적로지스틱회귀모형 (Stepwise Logistic Regression Model) 로선택되어진변수로는연령, 디지털유무, 가입경력, 총불만건수, 최근 4개월간사용료, 성별이선택되었다. < 표 3.3> 은로지스틱회귀모형에의한오분류테이블이다. < 표 3.3> 로지스틱모형의오분류테이블

19 데이터마이닝의사결정나무의응용 79 예측계일반해지정상 일반해지 % 10.75% 실제 정상 % 49.00% 계 Error rate=0.1625, Accuracy= Sensitvity=0.7637, Specificity= < 표 3.3> 에서민감도가 로일반해지를일반해지로예측하는예측력이높으므로로지스틱회귀모형에서추정된확률값을이용하여해지가능성에대한점수화 5) 를실시한다. < 표 3.4> 는개인휴대통신가입고객의해지가능성에대한점수표중일부이다. 해지유무예측은해지점수가 50 점이상인경우를일반해지로예측한경우이다 6). 지금까지개인휴대통신고객이해지특성이어떤가입자속성변인에의존하는지에대한고객해지패턴을분석하였고해지점수를구하여고객의해지유무를알아보았다. 이러한해지점수를이용하여해지확신고객, 해지가능고객, 해지잠재고객, 유지가능고객, 유지확신고객과같이고객을그룹화하여목표마케팅 (target marketing) 전략을세울수있다. < 표 3.4> 해지가능성점수 ( 일부 ) 5) 해지가능성점수 = P(Y= 해지 ) 100 6) 해지점수가 50 점이상인경우를일반해지로예측한이유는일반해지고객과정상고객의 해지가능성점수의분포를그려보면 50 점근처에서교차가일어나기때문이다.

20 통계분석연구 제 4 권제 1 호 (99. 봄 ) 80 아날로그총연령해지 / 성별불만가입경력사용료대유무디지탈건수 아날로그여자 0 40대 23~26개월 1만5천원미만 일반해지 아날로그남자 1 20대 14~18개월 5만5천~7만1천원 일반해지 아날로그남자 0 10대 6개월미만 5만5천~7만1천 일반해지 아날로그남자 1 30대 19~22개월 11만8천~15만7천원일반해지 아날로그남자 0 30대 6개월미만 22만원8천원이상 일반해지 해지해지유무점수예측일반해지 일반해지 일반해지 일반해지 정상 아날로그남자 0 30 대 19~22 개월 22 만원 8 천원이상정상정상 아날로그남자 1 20 대 6~10 개월 22 만원 8 천원이상정상일반해지 디지털여자 0 20 대 6~10 개월 5 만 5 천 ~7 만 1 천원 디지털남자 0 30 대 14~18 개월 22 만원 8 천원이상 일반 해지일반 해지 일반해지 정상 5.65 디지털남자 0 20 대 11~12 개월 22 만원 8 천원이상정상정상 디지털여자 1 30 대 47 개월이상 22 만원 8 천원이상정상정상 토의 지금까지의사결정나무를통하여 2장에서는선거자료에서발생하는무응답자의패턴을분석하고이러한패턴을이용하여무응답자의지지율을예측하는예측모형의사례를보였다. 또한 3장에서는개인휴대통신고객의해지패턴을분석하고로지스틱을회귀모형을통하여고객의해지가능성점수를구하는사례를살펴보았다. 의사결정나무는판별분석, 분산분석, 회귀분석등과같은전통적인통계분석기법의구현에앞서탐색적절차에다각도로유용하게활용될수있다. 또한통계조사에서조사의성 패라는목표변수를피조사자의인구

21 데이터마이닝의사결정나무의응용 81 학적속성을통해분석해낸다면그결과는효율적통계조사잔략수립에도움을주게될것이다. 현재의사결정나무모형은데이터마이닝 (data mining) 의주요기법으로자리잡고있으며 SAS/EMINER 7), SPSS AnswerTree 8), CART 9) 등상용화된데이터마이닝솔루션등에서이를사용할수있다. < 참고문헌 > 7) 8) 9)

22 통계분석연구 제 4 권제 1 호 (99. 봄 ) 82 (1) 최종후, 한상태, 강현철, 김은석 (1998), AnswerTree 를이용한데이터 마이닝의삭결정나무분석, 서울 : SPSS 아카데미. (2) 강현철, 서두성, 최종후 (1998), Enterprise Minier 의의사결정나무분석 알고리즘, SAS 사용자컨퍼런스발표자료집, 서울 : SAS-Korea, pp.169~186. (3) 박무익 (1998), 한국의제 15 대대통령선거와선거예측조사, 한국통계 학회 1998 년춘계학술발표회논문집, pp.1-9. (4) 허명회 (1995), SAS 범주형데이타분석, 서울 : 자유아카데미. (5) Berry, M. J. A. and Linoff, G. S. (1997), Data Mining Techniques, New York : John Wiley & Sons, Inc.. (6) Breiman, L., J. H. Friedman, R. A. Olshen, and C. J. Stone. (1984), Classification and regression trees, Belmont : Wadsworth. (7) Kass, G. (1980), An exploratory technique for investigating large quantities of categorical data, Applied Statistics. 29:2, (8) Quinlan, J. R. (1993), C4.5 Programs for machine learning, San Mateo : Morgan Kaufmann.

23 데이터마이닝의사결정나무의응용 83 Decision Trees and Its Applications Jonghoo Choi, Doosung Seo Abstract In this paper, we introduce and investigate the decision trees. Decision trees are charts that illustrate decision rules. If we have data divided into classes (e.g. subscribers or nonsubscribers, voters versus nonvoters), we can use decision trees as a classifier old or new cases with maximum accuracy. We explore the applications of decision trees based on two real examples.

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 9 주차 예측모형에대한평가 Assessment of Predictive Model 최종후, 강현철 차례 6. 모형평가의기본개념 6.2 모델비교 (Model Comparison) 노드 6.3 임계치 (Cutoff) 노드 6.4 의사결정 (Decisions) 노드 6.5 기타모형화노드들

More information

untitled

untitled 통계청 통계분석연구 2001 년가을 ( 제 6 권제 2 호 ) 85-111 데이터마이닝기법을이용한도시가계소비성향분석 변루나 * 본논문에서는데이터마이닝과주요분석기법인로지스틱회귀분석, 신경망, 의사결정나무를소개하였다. 데이터마이닝적용사례로 2000년통계청에서실시한도시가계조사자료를데이터마이닝도구인 SAS Enterprise Miner를활용해분석하였다. 대량의통계조사결과자료에데이터마이닝기법을이용한분석을보임으로써지식기반사회에필요한새로운의미있는정보와지식을재생산할수있는가능성을제시하고검토하는데에본논문의의의가있다.

More information

Ⅰ. 조사목적 본조사는전국민을대상으로대통령국정수행지지도, 정당지지도등을 파악하여, 국민여론을파악하는기초자료수집에그목적을둠. Ⅱ. 조사설계 조사대상 전국거주만 19세이상성인남녀 표본수 총 1,035 명조사후, 지역, 성, 연령별사후보정 표본오차 95% 신뢰수준에서최대허용

Ⅰ. 조사목적 본조사는전국민을대상으로대통령국정수행지지도, 정당지지도등을 파악하여, 국민여론을파악하는기초자료수집에그목적을둠. Ⅱ. 조사설계 조사대상 전국거주만 19세이상성인남녀 표본수 총 1,035 명조사후, 지역, 성, 연령별사후보정 표본오차 95% 신뢰수준에서최대허용 101 차 리서치앤리서치일간조사통계편 ( 조사일: 20121104 ~ 1106) Beyond Research The Intelligence Company Ⅰ. 조사목적 본조사는전국민을대상으로대통령국정수행지지도, 정당지지도등을 파악하여, 국민여론을파악하는기초자료수집에그목적을둠. Ⅱ. 조사설계 조사대상 전국거주만 19세이상성인남녀 표본수 총 1,035 명조사후,

More information

2006

2006 20대 총선 결과 관련 여론조사 2016. 5. 차 제1장. 조사 개요 1. 조사 목적 4 2. 주요 조사 내용 4 3. 조사 설계 5 4. 응답자 특성 6 제2장. 요약 1. 노동개혁, 고용 문제 해결 도움 정도 8 2. 노동개혁 추진, 지지후보 및 정당 결정 영향 정도 9 3. 지지후보, 정당 선택 시 가장 도움을 받은 매체 9 4. KBS MBC 등 공영방송

More information

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은 2013 년도연구용역보고서 공공기관임금프리미엄추계 - 2013. 12.- 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한국노동연구원선임연구위원정진호 공공기관임금프리미엄추계 2013. 12. 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영

More information

한국정책학회학회보

한국정책학회학회보 한국정책학회보제 22 권 2 호 (2013.6): 181~206 정부신뢰에대한연구 - 대통령에대한신뢰와정부정책에대한평가비교를중심으로 * - 주제어 : 민주화이후정부신뢰, 대통령신뢰, 정부정책만족도 Ⅰ. 서론 182 한국정책학회보제 22 권 2 호 (2013.6) 정부신뢰에대한연구 183 Ⅱ Ⅲ Ⅳ Ⅴ Ⅱ. 정부신뢰에대한이론적논의 184 한국정책학회보제 22

More information

목차

목차 2017 년 4 월 MBC- 한국경제신문공동여론조사결과통계표 2017. 04. 08. 조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,500 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,500 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 86% + 유선전화면접 14%

More information

1. 조사설계 조사대상 2017 년 2 월현재, 전국만 19 세이상남녀 표본의크기 조사방법 1,021 명 ( 가중전 1,021 명, 가중후 1,000 명 ) - 가중치를 1,000 명기준으로부여했으나, 보도시표본크기는 1,021 명으로보도해야함. 구조화된설문지를이용한전

1. 조사설계 조사대상 2017 년 2 월현재, 전국만 19 세이상남녀 표본의크기 조사방법 1,021 명 ( 가중전 1,021 명, 가중후 1,000 명 ) - 가중치를 1,000 명기준으로부여했으나, 보도시표본크기는 1,021 명으로보도해야함. 구조화된설문지를이용한전 YTN 귀중 YTN 전국여론조사통계표 ( 반기문불출마선언후 ) 2017. 02. 02 1. 조사설계 조사대상 2017 년 2 월현재, 전국만 19 세이상남녀 표본의크기 조사방법 1,021 명 ( 가중전 1,021 명, 가중후 1,000 명 ) - 가중치를 1,000 명기준으로부여했으나, 보도시표본크기는 1,021 명으로보도해야함. 구조화된설문지를이용한전화면접조사

More information

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a 조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a) b) 조사연구 주제어 패널조사 횡단면가중치 종단면가중치 선형혼합모형 일반화선형혼 합모형

More information

<BFACB1B831382D31365FBAF2B5A5C0CCC5CD20BAD0BCAEBFA120C0C7C7D120BFE4C0B2BBEAC1A420B9E6B9FD20BAF1B1B35F33C2F7BCF6C1A E687770>

<BFACB1B831382D31365FBAF2B5A5C0CCC5CD20BAD0BCAEBFA120C0C7C7D120BFE4C0B2BBEAC1A420B9E6B9FD20BAF1B1B35F33C2F7BCF6C1A E687770> Ⅳ. 의사결정나무와 MARS 1. 실손의료보험자료를활용한 CART 분석 가. CART(Classification and Regression Tree) CART는데이터를가장잘분류해주는도구라고할수있는데데이터를잘분류해주는분리변수를선택하고분리지점을정해준다. 그리고가지치기를통해서분류의정도를결정할수있다. 데이터마이닝방법론들중가장널리쓰이는방법론으로반응변수가범주형또는연속형일때가능한의사결정나무의한알고리즘이다.

More information

untitled

untitled 像 氣 名 刹 希 望 曰 術 技 藝 道 技 年 月 日 0 5, 1 2 3 4 5 45,000 40,000 39,534 35,000 30,000

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

.. ...hwp

..      ...hwp 100 80 조선일보 대통령지지도 대북정책지지도 지지도(%) 60 40 20 0 96-12 97-06 98-01 98-07 99-02 99-08 00-03 00-10 01-04 01-11 날짜 지지도(%) 중앙일보 100 90 80 70 60 50 40 30 20 10 0 97-03 98-07 99-12 01-04 02-09 날짜 대통령지지도 대북정책지지도

More information

Microsoft PowerPoint - MDA DA pptx

Microsoft PowerPoint - MDA DA pptx SPSS 2 집단 ( 데이터및준비 ) 데이터 TURKEY.SAV 미국 Kansas 주립대학 Dr. Michael Finnegan 교수는야생칠면조와사육칠면조를구별하기위하여수컷칠면조 82마리에대해 9개항목을조사하였다. ID: 칠면조 id HUM: 상완골길이 ULN: 척골길이 CAR: car metacarus 길이 COR: 오탁상길이 RAD: 요골길이 FEMUR:

More information

Overview Decision Tree Director of TEAMLAB Sungchul Choi

Overview Decision Tree Director of TEAMLAB Sungchul Choi Overview Decision Tree Director of TEAMLAB Sungchul Choi 머신러닝의학습방법들 - Gradient descent based learning - Probability theory based learning - Information theory based learning - Distance similarity based

More information

G Power

G Power G Power 부산대학교통계학과조영석 1. G Power 란? 2. G Power 설치및실행 2.1 G Power 설치 2.2 G Power 실행 3. 검정 (Test) 3.1 가설검정 (Test of hypothesis) 3.2 검정력 (Power) 3.3 효과크기 (Effect size) 3.4 표본수산정 4. 분석 4.1 t- 검정 (t-test) 4.2

More information

[ 조사개요 ] 구분 내용 모집단 전국에거주하는만 19 세이상성인남녀 표집틀 유무선전화 RDD 표집방법 지역별, 성별, 연령별기준비례할당추출 표본크기 2,000 명 ( 유선 551 명 (27.55%), 무선 1,449 명 (72.45%)) 표본오차 무작위추출을전제할경우

[ 조사개요 ] 구분 내용 모집단 전국에거주하는만 19 세이상성인남녀 표집틀 유무선전화 RDD 표집방법 지역별, 성별, 연령별기준비례할당추출 표본크기 2,000 명 ( 유선 551 명 (27.55%), 무선 1,449 명 (72.45%)) 표본오차 무작위추출을전제할경우 KBS 貴中 KBS- 한국리서치 2018 년신년기획조사 교차분석표 2017. 12. 28 [ 조사개요 ] 구분 내용 모집단 전국에거주하는만 19 세이상성인남녀 표집틀 유무선전화 RDD 표집방법 지역별, 성별, 연령별기준비례할당추출 표본크기 2,000 명 ( 유선 551 명 (27.55%), 무선 1,449 명 (72.45%)) 표본오차 무작위추출을전제할경우,

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,008 명 ( 주의 : 통계보정으로 1,000 표본으로분석하였으며, 보도시에는조사실사례수 1,008 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 3.1% Point 조사방법 유선전화면접 49.7% + 무선전화

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,008 명 ( 주의 : 통계보정으로 1,000 표본으로분석하였으며, 보도시에는조사실사례수 1,008 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 3.1% Point 조사방법 유선전화면접 49.7% + 무선전화 MBC- 한국경제공동여론조사결과통계표 2016. 12. 31. 조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,008 명 ( 주의 : 통계보정으로 1,000 표본으로분석하였으며, 보도시에는조사실사례수 1,008 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 3.1% Point 조사방법 유선전화면접 49.7% + 무선전화면접 50.3% : CATI(Computer

More information

ad-200400012.hwp

ad-200400012.hwp 제17대 총선과 남녀유권자의 정치의식 및 투표행태에 관한 연구 - 여성후보 출마 선거구 조사를 중심으로 - 2004. 7 여 성 부 제17대 총선과 남녀유권자의 정치의식 및 투표행태에 관한 연구 - 여성후보 출마 선거구 조사를 중심으로 - 2004. 7 여 성 부 연구요약 표 주제 및 연도별 여성유권자 연구 현황 표 출마한 여성후보 인지시기 투표후보여성

More information

untitled

untitled 통계청 통계분석연구 제 3 권제 1 호 (98. 봄 ) 91-104 장기예측방법의비교 - 전도시소비자물가지수를중심으로 - 서두성 *, 최종후 ** 본논문의목적은소비자물가지수와같이시간의흐름에따라변동의폭이크지않은시계열자료의장기예측에있어서쉽고, 정확한예측모형을찾고자하는데에있다. 이를위하여네가지의장기예측방법 - 1회귀적방법 2Autoregressive error 방법

More information

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,514 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,514 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 79.1% + 유선전화

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,514 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,514 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 79.1% + 유선전화 MBC- 한국경제신문대선여론조사결과통계표 2017. 04. 22. 조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,514 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,514 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 79.1% + 유선전화면접 20.9% : CATI(Computer

More information

연구보고서 2009-05 일반화선형모형 (GLM) 을이용한 자동차보험요율상대도산출방법연구 Ⅰ. 요율상대도산출시일반화선형모형활용방법 1. 일반화선형모형 2 연구보고서 2009-05 2. 일반화선형모형의자동차보험요율산출에적용방법 요약 3 4 연구보고서 2009-05 Ⅱ. 일반화선형모형을이용한실증분석 1. 모형적용기준 < > = 요약 5 2. 통계자료및통계모형

More information

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr 조사연구 권 호 DOI http://dx.doi.org/10.20997/sr.19.3.1 연구논문 다수후보에대한선거예측의정확성과당선가능성 : 2017 년대통령선거의경우 * The Accuracy of Election Forecasts and the Chance of Winning for Multiple Candidates: In Case of the 2017

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 - 에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 - . - 2 - . 1. - 3 - [ 그림 1] 도시가스수요와실질 GDP 추이 - 4 - - 5 - - 6 - < 표 1>

More information

2011년_1분기_지역경제동향_보도자료.hwp

2011년_1분기_지역경제동향_보도자료.hwp < 목차 > 2011 년 1/4 분기지역경제동향 ( 요약 ) * 생산은광공업생산지수, 고용은취업자수이며, ( ) 의숫자는전년동분기대비증감률임 < 분기주요지역경제지표 1 > [ 전년동분기비, %] 시 도 ( 권역 1) ) 광공업생산지수 2) 대형소매점판매액지수 3) 취업자수 10.2/4 3/4 4/4 11.1/4 p 10.2/4 3/4 4/4 11.1/4 p

More information

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,507 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,507 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 80% + 유선전화면접

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,507 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,507 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 80% + 유선전화면접 MBC- 한국경제신문대선여론조사결과통계표 2017. 05. 02. 조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,507 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,507 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 80% + 유선전화면접 20% : CATI(Computer

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

지지정당별지방선거투표의향별국정수행평가별국무총리인선평가별정부개각범위의견별사전투표제인지별사전투표참여의향별지방선거성격공감별차기대선후보선호도별성 * 연령별 자영업 (102) 블루칼라 (96) 12.

지지정당별지방선거투표의향별국정수행평가별국무총리인선평가별정부개각범위의견별사전투표제인지별사전투표참여의향별지방선거성격공감별차기대선후보선호도별성 * 연령별 자영업 (102) 블루칼라 (96) 12. 표 0. 응답자특성 성별연령별권역별직업별지지정당별지방선거투표의향별국정수행평가별국무총리인선평가별정부개각범위의견별사전투표제인지별사전투표참여의향별지방선거성격공감별차기대선후보선호도별성 * 연령별 % (700) 100.0 남자 (345) 49.3 여자 (355) 50.7 19~29세 (127) 18.1 30대 (136) 19.4 40대 (151) 21.6 50대 (138)

More information

강의록

강의록 Analytic CRM 2006. 5. 11 tsshin@yonsei.ac.kr Analytic CRM Analytic CRM Data Mining Analytical CRM in CRM Ecosystem Operational CRM Business Operations Mgmt. Analytical CRM Business Performance Mgmt. Back

More information

목차

목차 조사설계 MBC- 한국경제공동여론조사결과통계표 조사대상 전국만 19 세이상남녀 조사규모 1,001 명 ( 주의 : 통계보정으로 1,000 표본으로분석하였으며, 보도시에는조사실사례수 1,001 명으로기재해야함 ) 2017. 01. 26. 표본오차 95% 신뢰수준에서 ± 3.1% Point 조사방법 유선전화면접 49% + 무선전화면접 51% : CATI(Computer

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 7 주차 회귀분석 Regression Analysis 최종후, 강현철 차례 4.1 선형회귀분석 (Linear Regression Analysis) 4.2 로지스틱회귀분석 (Logistic Regression Analysis) 4.3 회귀분석의특징과제약 4.4 분석사례 -

More information

응답자분포표 전 체 (1527) 남 자 (756) 49.5 여 자 (771) 세 (281) 대 (314) 대 (336) 대 (288) 세이상 (308) 20.1 졸이

응답자분포표 전 체 (1527) 남 자 (756) 49.5 여 자 (771) 세 (281) 대 (314) 대 (336) 대 (288) 세이상 (308) 20.1 졸이 [ 목차 ] 응답자분포표... 1 2012 총선대선패널조사 (4 차 ) [ 교차분석표 ] [ 표 1] 대통선거투표의... 3 [ 표 2] 대선에서투표할후보... 5 [ 표 3] 해당후보에게투표하는이유... 7 [ 표 4] 후보에대한지지강도... 9 [ 표 5] 대선후보지지변경이유... 11 [ 표 6] 대통이되어서는안된다생각하는후보... 13 [ 표 7] 가상대결

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월 지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., 2004 5 2009 12 KOSPI200.,. * 2009. 지능정보연구제 16 권제 1 호 2010 년 3 월 김선웅 안현철 社 1), 28 1, 2009, 4. 1. 지능정보연구제 16 권제 1 호 2010 년 3 월 Support

More information

목차

목차 동아일보여론조사결과통계표 2016. 12. 31. 조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,011 명 ( 주의 : 통계보정으로 1,000 표본으로분석하였으며, 보도시에는조사실사례수 1,011 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 3.1% Point 조사방법 유선전화면접 50.2% + 무선전화면접 49.8% : CATI(Computer

More information

1 제 26 장 사회간접자본의확충

1 제 26 장 사회간접자본의확충 삼성경제연구소 1 제 26 장 사회간접자본의확충 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 제 27 장 대형국책과제의추진 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63> 제 3 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

Problem New Case RETRIEVE Learned Case Retrieved Cases New Case RETAIN Tested/ Repaired Case Case-Base REVISE Solved Case REUSE Aamodt, A. and Plaza, E. (1994). Case-based reasoning; Foundational

More information

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월 지능정보연구제 17 권제 4 호 2011 년 12 월 (pp.241~254) Support vector machines(svm),, CRM. SVM,,., SVM,,.,,. SVM, SVM. SVM.. * 2009() (NRF-2009-327- B00212). 지능정보연구제 17 권제 4 호 2011 년 12 월 김경재 안현철 지능정보연구제 17 권제 4 호

More information

statistics

statistics 수치를이용한자료요약 statistics hmkang@hallym.ac.kr 한림대학교 통계학 강희모 ( 한림대학교 ) 수치를이용한자료요약 1 / 26 수치를 통한 자료의 요약 요약 방대한 자료를 몇 개의 의미있는 수치로 요약 자료의 분포상태를 알 수 있는 통계기법 사용 중심위치의 측도(measure of center) : 어떤 값을 중심으로 분포되어 있는지

More information

adfasdfasfdasfasfadf

adfasdfasfdasfasfadf C 4.5 Source code Pt.3 ISL / 강한솔 2019-04-10 Index Tree structure Build.h Tree.h St-thresh.h 2 Tree structure *Concpets : Node, Branch, Leaf, Subtree, Attribute, Attribute Value, Class Play, Don't Play.

More information

Chapter 7 – Classification and Regression Trees

Chapter 7 – Classification and Regression Trees 비선형분류모델링 의사결정나무 Decision Tree 교사학습패러다임 Plant 관측 계측 FDC + 계측치 교사학습패러다임 Plant 관측 계측 FDC + 계측치 학습 모델 ƒ Data (x, y) 교사학습패러다임 Plant 관측 계측 FDC χ FDC + 계측치 학습 모델 ƒ Data (x, y) 계측치 ; ˆy 예측 교사학습패러다임 Plant Data

More information

Microsoft PowerPoint - 26.pptx

Microsoft PowerPoint - 26.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2011년봄학기 강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

[ 표 33] -김문수... 3 [ 표 34] -문재인... 7 [ 표 35] -박근혜 [ 표 36] -손규 [ 표 37] -안철수 [ 표 38] -정몽준 [ 표 3] 지난 1년간가정살림변화 [ 표 40] 지

[ 표 33] -김문수... 3 [ 표 34] -문재인... 7 [ 표 35] -박근혜 [ 표 36] -손규 [ 표 37] -안철수 [ 표 38] -정몽준 [ 표 3] 지난 1년간가정살림변화 [ 표 40] 지 [ 목차 ] 응답자분포표... 1 [ 차분석표 ] [ 표 1]... 3 [ 표 2] 투표후보... 5 [ 표 3] 투표기준... 7 [ 표 4] 비례대표투표정당... [ 표 5] 지지후보결정시기... 11 [ 표 6] 투표하지못한이유... 13 [ 표 7] 새누리당승리이유... 15 [ 조사개요 ] 구분 내 용 모집단 전국에거주하는만 1세이상유권자 표본크기

More information

조사연구 sampling error of polling sites and the additional error which comes from non-response, early voting and second stage sampling error of voters in

조사연구 sampling error of polling sites and the additional error which comes from non-response, early voting and second stage sampling error of voters in 조사연구 권 호 DOI http://dx.doi.org/10.20997/sr.18.4.7 연구노트 2016 년국회의원선거출구조사오차분석 Analysis of Prediction Error of the Exit Polling for 2016 National Assembly Election in Korea 1) 3) a) b) c) 주제어 대국회의원선거 예측오차

More information

아시아연구 16(1), 2013 pp. 105-130 중국의경제성장과보험업발전간의 장기균형관계 Ⅰ. 서론 Ⅲ. 실증분석 1. 분석방법 < 그림 1> 중국의보험밀도와국민 1 인당명목 GNI 성장추이 보험밀도 국민 1 인당명목 GNI < 그림 2> 중국의주요거시경제지표변화추이 총저축액 금리, 물가, 실업률 < 표 1> 변수정의 변수명 정의 자료출처 LTP

More information

2011-67 차례 - iii - 표차례 - vii - 그림차례 - xi - 요약 - i - - ii - - iii - 제 1 장서론 대구 경북지역인력수급불일치현상진단과해소방안에대한연구 1) ( ) 574 208 366 263 103 75.6 77.9 74.3 73.0 77.7 19.3 19.2 19.4 20.5 16.5 3.0 1.0 4.1

More information

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포 생존분석의 추정과 비교 : 보충자료 이용희 December, 8 Cotets 생존함수와 위험함수. 생존함수와 위험함수....................................... 예제: 지수분포.......................................... 예제: 와이블분포.........................................

More information

2011년 제 9회 최우수상.hwp

2011년 제 9회 최우수상.hwp 1) 고려대학교교육학과석사과정 (nayoung725@yahoo.co.kr) 2) 고려대학교교육학과박사과정 (seo2jin@hanmail.net) 3) 고려대학교교육학과석사과정 (premier110@hanmail.net) 성별지역계열학업진행여부 총사례수 일주일평균아르바이트시간 ( 시간 ) 남 1510 8.9 여 1457 8.4 동지역 2573 8.5

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론 수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론 Ⅱ. 선행연구고찰 집적경제메커니즘의유형공유메커니즘매칭메커니즘학습메커니즘 내용기업이군집을형성하여분리불가능한생산요소, 중간재공급자, 노동력풀등을공유하는과정에서집적경제발생한지역에기업과노동력이군집을이뤄기업과노동력사이의매칭이촉진됨에따라집적경제발생군집이형성되면사람들사이의교류가촉진되어지식이확산되고새로운지식이창출됨에따라집적경제발생

More information

[ 표 34] 원하는차기대통상 [ 표 35] 안철수원장의출마에견해 [ 표 36] 안철수원장과야당후보와의단일화에대한견해 [ 표 37] 단일화할경우누가로단일화되어야하는지에대한견해 [ 표 38] 공천비리사건에대한박근혜후보의책임여부.

[ 표 34] 원하는차기대통상 [ 표 35] 안철수원장의출마에견해 [ 표 36] 안철수원장과야당후보와의단일화에대한견해 [ 표 37] 단일화할경우누가로단일화되어야하는지에대한견해 [ 표 38] 공천비리사건에대한박근혜후보의책임여부. [ 목차 ] 응답자분포표... 1 [ 차분석표 ] [ 표 1] 대통선거관심정도... 3 [ 표 2] 대선에서투표할후보... 5 [ 표 3] 해당후보에게투표하는이유... 7 [ 표 4] 대통이되어서는안된다생각하는후보... 9 [ 표 5] 민주통합당대통후보로가장적합한후보... 11 [ 표 6] 가상대결 : 박근혜 vs 문재인... 13 [ 표 7] 가상대결 :

More information

Tree 기반의 방법

Tree 기반의 방법 Tree 기반의방법 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) Tree 기반의방법 1 / 25 학습내용 의사결정나무 (decision tree) 회귀나무 (regresion tree) 분류나무 (classification tree) 비교앙상블알고리즘 (ensemble algorithm) 배깅 (bagging) 랜덤포레스트 (random

More information

Y 1 Y β α β Independence p qp pq q if X and Y are independent then E(XY)=E(X)*E(Y) so Cov(X,Y) = 0 Covariance can be a measure of departure from independence q Conditional Probability if A and B are

More information

Microsoft PowerPoint Relations.pptx

Microsoft PowerPoint Relations.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2010년봄학기강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

개회사 축 사

개회사 축 사 / 심포지엄회의자료집 / 목차 전시작전통제권전환이대로좋은가? 2010년 4월 29일 ( 목 ), 09:00~17:00 전쟁기념관뮤지엄웨딩홀 3층 주최 국회동북아평화안보포럼 ( 황진하대표의원 ) 한국국방연구원 ( 김구섭원장 ) 세종연구소 ( 송대성소장 ) 한국국방안보포럼 ( 김재창 / 김동성공동대표 ) 후원 개회사 [ 김동성 KODEF 공동대표 ] 1 축사 [

More information

exp

exp exp exp exp exp exp exp exp exp exp exp exp log 第 卷 第 號 39 4 2011 4 투영법을 이용한 터빈 블레이드의 크리프 특성 분석 329 성을 평가하였다 이를 위해 결정계수값인 값 을 비교하였으며 크리프 시험 결과를 곡선 접합 한 결과와 비선형 최소자승법으로 예측한 결과 사 이 결정계수간 정도의 오차가 발생하였고

More information

Resampling Methods

Resampling Methods Resampling Methds 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) Resampling Methds 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과 )

More information

한국건설산업연구원연구위원 김 현 아 연구위원 허 윤 경 연구원 엄 근 용

한국건설산업연구원연구위원 김 현 아 연구위원 허 윤 경 연구원 엄 근 용 한국건설산업연구원연구위원 김 현 아 연구위원 허 윤 경 연구원 엄 근 용 (%) 10.0 5.0 0.0-5.0-10.0 0.6 1.0 0.3 2.9 0.7 1.3 9.0 5.6 5.0 3.9 3.4 3.9 0.0 95 90-0.3 85 변동률 지수 65-15.0-13.6 60 '95 '96 '97 '98 '99 '00 '01 '02 '03 '04 '05 '06

More information

조사연구 권 호 연구노트 사전투표득표율예측에대한연구 The Study on the Advance Voting Forecasting 1) 이찬복 a) 주제어 지방선거 사전투표 출구조사 득표율예측 예측오차 Advance voting was held nationwide in

조사연구 권 호 연구노트 사전투표득표율예측에대한연구 The Study on the Advance Voting Forecasting 1) 이찬복 a) 주제어 지방선거 사전투표 출구조사 득표율예측 예측오차 Advance voting was held nationwide in 조사연구 권 호 연구노트 사전투표득표율예측에대한연구 The Study on the Advance Voting Forecasting 1) 이찬복 a) 주제어 지방선거 사전투표 출구조사 득표율예측 예측오차 Advance voting was held nationwide in 2014 local election. It made it possible for the electorate

More information

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š 솔루션 2006 454 2006 455 2006 456 2006 457 2006 458 2006 459 2006 460 솔루션 2006 462 2006 463 2006 464 2006 465 2006 466 솔루션 2006 468 2006 469 2006 470 2006 471 2006 472 2006 473 2006 474 2006 475 2006 476

More information

PowerPoint Presentation

PowerPoint Presentation http://pdd4.webnode.kr/ e-business ch. 9. Big data & IoT Ph.D. Young-Min, Kyoung contents 데이터마이닝 의개요 개요 기계학습 데이터마이닝기법 데이터마이닝 기법기초 개요 C4.5 알고리즘 엔트로피 결정나무규칙생성 Part. 데이터마이닝 Part. 의사결정나무 (Decision Tree)

More information

Microsoft PowerPoint - MDA DA pptx

Microsoft PowerPoint - MDA DA pptx 판별분석개념 Indvdual Drected Technque 측정변수 ( 항목 ) 에의한개체분류 분류되어있는집단간의차이를의미있게설명해줄수있는독립변수들을찾아내어 변수의선형결합으로판별식 (Dscrmnant functon) 을만들어낸다. 이판별식을이용하여분류하고자하는개체의집단을판별 데이터유형 집단변수 : 범주형혹은이진형 판별변수 : 측정형 ( 등간척도포함 ) 사례

More information

임정연 이영민 1) 주저자, 숙명여자대학교인력개발정책학박사과정, 2) 교신저자, 숙명여자대학교여성 HRD 대학원부교수,

임정연 이영민 1) 주저자, 숙명여자대학교인력개발정책학박사과정,   2) 교신저자, 숙명여자대학교여성 HRD 대학원부교수, 임정연 이영민 1) 주저자, 숙명여자대학교인력개발정책학박사과정, E-mail: jungyon82@naver.com 2) 교신저자, 숙명여자대학교여성 HRD 대학원부교수, E-mail: ymlee@sookmyung.ac.kr 규모 재직근로자대상교육훈련실시 ( 개소,%) 1 인당평균집체훈련시간 1 인당평균집체훈련비용 ( 천원 ) 전체수강료시설비기타비용 전체

More information

조사연구 aim of this study is to find main cause of the forecasting error and bias of telephone survey. We use the telephone survey paradata released by N

조사연구 aim of this study is to find main cause of the forecasting error and bias of telephone survey. We use the telephone survey paradata released by N 조사연구 권 호 DOI http://dx.doi.org/10.20997/sr.17.3.5 연구노트 2016 년국회의원선거전화여론조사정확성분석 Analysis of Accuracy of Telephone Survey for the 2016 National Assembly Elections 1)2) a) b) 주제어 선거여론조사 전화조사 예측오차 편향 대국회의원선거

More information

슬라이드 1

슬라이드 1 회귀분석 (Regression Analysis) 회귀분석은종속변수와독립변수들갂의관련성, 또는독립변수를 이용하여종속변수를예측하는데사용하며, 종속변수와독립변수 들의함수적관련성을이용하여분석한다. 회귀분석의목적 (1) 예측을목적 주어진독립변수를이용하여종속변수의평균값을추정할목적으로 기존의자료를이용하여회귀모형을세움 (2) 각독립변수가종속변수에미치는영향을평가 종속변수에어떤독립변수들이유의한영향을미치는지를알아보고

More information

(Hyunoo Shim) 1 / 24 (Discrete-time Markov Chain) * 그림 이산시간이다연쇄 (chain) 이다왜 Markov? (See below) ➀ 이산시간연쇄 (Discrete-time chain): : Y Y 의상태공간 = {0, 1, 2,..., n} Y n Y 의 n 시점상태 {Y n = j} Y 가 n 시점에상태 j 에있는사건

More information

II. 기존선행연구

II. 기존선행연구 수익용부동산의임대수익영향요인에관한연구 I. 서론 II. 기존선행연구 Ⅲ. 실증분석모형및자료 yit = a + b xit + ui + eit yit = ( a + ui ) + b xit + eit α α cov( it, i ) 0 x u = cov( x, ) 0 it u i ¹ H : cov( x, u ) = 0 0 H : cov( x, u ) ¹ 0 1 it

More information

딥러닝 첫걸음

딥러닝 첫걸음 딥러닝첫걸음 4. 신경망과분류 (MultiClass) 다범주분류신경망 Categorization( 분류 ): 예측대상 = 범주 이진분류 : 예측대상범주가 2 가지인경우 출력층 node 1 개다층신경망분석 (3 장의내용 ) 다범주분류 : 예측대상범주가 3 가지이상인경우 출력층 node 2 개이상다층신경망분석 비용함수 : Softmax 함수사용 다범주분류신경망

More information

빅데이터_DAY key

빅데이터_DAY key Big Data Near You 2016. 06. 16 Prof. Sehyug Kwon Dept. of Statistics 4V s of Big Data Volume Variety Velocity Veracity Value 대용량 다양한 유형 실시간 정보 (불)확실성 가치 tera(1,0004) - peta -exazetta(10007) bytes in 2020

More information

에너지경제연구 제13권 제1호

에너지경제연구 제13권 제1호 에너지경제연구 Korean Energy Economic Review Volume 13, Number 1, March 2014 : pp. 23~56 거시계량모형을이용한전력요금 파급효과분석 * 23 24 25 26 < 표 1> OECD 전력요금수준 ( 단위 : $/MWh) 27 28 < 표 2> 모형의구성 29 30 31 [ 그림 1] 연립방정식모형의개요 32

More information

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다.   우리나라경 KDI정책포럼제221호 (2010-01) (2010. 2. 10) 내용문의 : 이재준 (02-958-4079) 구독문의 : 발간자료담당자 (02-958-4312) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. http://www.kdi.re.kr 우리나라경기변동성에대한요인분석및시사점 이재준 (KDI 부연구위원 ) * 요 약,,, 1970. * (,

More information

14-X25-JSJ.hwp

14-X25-JSJ.hwp 지경택 송영호 * 정국삼 ** ( 주 ) 한라 * 충북대학교대학원안전공학과 ** 충북대학교안전공학과 (2001. 9. 12. 접수 / 2001. 10. 30. 채택 ) Categorical Analysis for the Factors of Industrial Accident Cases Kyung-Tek Jhee Young-Ho Song * Kook-Sam Chung

More information

표본재추출(resampling) 방법

표본재추출(resampling) 방법 표본재추출 (resampling) 방법 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 표본재추출 (resampling) 방법 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과

More information

Ⅰ. 지방의회기본현황 1 Ⅱ. 지방의회상임위원회현황 5 1. 총괄내역 8 가. 상임위설치의회수 8 나. 위원수별상임위원회수 10 2. 의회별내역 12 Ⅲ. 지방의회정당별등현황 37 1. 정당별및성별현황 41 2. 의원 1인당인구수 55 3. 직업별현황 69 Ⅳ. 지방의회의장협의회현황 83 1. 전국시 도의회의장협의회 일반현황 85 2. 전국시 도의회의장협의회

More information

출산전후근로및임금동학에관한연구 첫자녀출산과연계된경력단절및복귀를중심으로 I. 서론

출산전후근로및임금동학에관한연구 첫자녀출산과연계된경력단절및복귀를중심으로 I. 서론 출산전후근로및임금동학에관한연구 첫자녀출산과연계된경력단절및복귀를중심으로 I. 서론 II. 선행연구 Ⅲ. 실증분석 ln ln ln ln ln ln ln ln ln ln 경력단절경험 경력단절무경험 표본수 1,079 1,781 근로자수 ( 명 ) 173 223 시간당실질임금 ( 로그시간당 2005 년만원 ) -0.511-0.238 경력기간 ( 년 ) 9.945

More information

국립중앙의료원_대국민 응급의료서비스 인지도 및 만족도_보고서(최종).hwp

국립중앙의료원_대국민 응급의료서비스 인지도 및 만족도_보고서(최종).hwp 발 간 등 록 번 호 2014-중앙응급-008 2014년 대국민 응급의료서비스 인지도 및 만족도 조사 결과보고서 2014. 12. 이 보고서는 보건복지부에서 주관하는 응급의료기금에 의해 수행된 것이며 이 보고서에 수록된 내용은 연구자 개인적인 의견으로 보건복지부의 공식견해가 아님을 밝혀둡니다 2014년 대국민 응급의료서비스 인지도 및 만족도 조사 CONTENTS

More information

고객관계를 리드하는 서비스 리더십 전략

고객관계를 리드하는  서비스 리더십 전략 제 13 장분산분석 1 13.1 일원분산분석 13. 분산분석 - 무작위블럭디자인 13.3 이원분산분석 - 팩토리얼디자인 분산분석 (ANOVA) - 두개이상의집단들의평균값을비교하는데사용. 일원분산분석 - 처치변수가한개인분산분석. 1. 분산분석의원리 A 3.0 8.0 7.0 5.0 5.0 6.0 4.0 7.0 6.0 4.0 평균 5.0 6.0 B 3.0 9.0

More information

An Effective Sentence-Extraction Technique Using Contextual Information and Statistical Approaches for Text Summarization

An Effective Sentence-Extraction Technique Using Contextual Information and  Statistical Approaches for Text Summarization 한국 BI 데이터마이닝학회 2010 추계학술대회 Random Forests 기법을사용한 저수율반도체웨이퍼검출및혐의설비탐색 고태훈, 김동일, 박은정, 조성준 * Data Mining Lab., Seoul National University, hooni915@snu.ac.kr Introduction 반도체웨이퍼의수율 반도체공정과웨이퍼의수율 반도체공정은수백개의프로세스로이루어져있음

More information

Microsoft PowerPoint - IPYYUIHNPGFU

Microsoft PowerPoint - IPYYUIHNPGFU 분산분석 분산분석 (ANOVA: ANALYSIS OF VARIANCE) 두개이상의모집단의차이를검정 예 : 회사에서세종류의기계를설치하여동일한제품을생산하는경우, 각기계의생산량을조사하여평균생산량을비교 독립변수 : 다른변수에의해영향을주는변수 종속변수 : 다른변수에의해영향을받는변수 요인 (Factor): 독립변수 예에서의요인 : 기계의종류 (I, II, III) 요인수준

More information

에너지경제연구 Korean Energy Economic Review Volume 17, Number 1, March 2018 : pp. 37~65 가정부문전기수요의결정요인분석 : 동태적패널 FD GMM 기법을중심으로 37

에너지경제연구 Korean Energy Economic Review Volume 17, Number 1, March 2018 : pp. 37~65 가정부문전기수요의결정요인분석 : 동태적패널 FD GMM 기법을중심으로 37 에너지경제연구 Korean Energy Economic Review Volume 17, Number 1, March 2018 : pp. 37~65 가정부문전기수요의결정요인분석 : 동태적패널 FD GMM 기법을중심으로 37 38 39 40 41 ln ln ln ln ln ln ln 42 ln ln ln ln ln ln ln ln ln ln ln ln ln ln

More information

2002년 2학기 자료구조

2002년 2학기 자료구조 자료구조 (Data Structures) Chapter 1 Basic Concepts Overview : Data (1) Data vs Information (2) Data Linear list( 선형리스트 ) - Sequential list : - Linked list : Nonlinear list( 비선형리스트 ) - Tree : - Graph : (3)

More information

No Title

No Title 昤 昤 昤 ...43 ...45 ...45 ...59 (1-)...63 (1-)...63 ...68 (1)...71 [2-1] CRM... 11 [2-2] CRM...20 [2-3]...39 [3-1]...46 [3-2]...47 [3-3]...48 [3-4]...49 [3-5]...49

More information

<4D6963726F736F667420506F776572506F696E74202D20283135313132372931312EBCADBAF1BDBABDC3BCB3C0C720C0D4C1F6BCB1C1A4205BC8A3C8AF20B8F0B5E55D>

<4D6963726F736F667420506F776572506F696E74202D20283135313132372931312EBCADBAF1BDBABDC3BCB3C0C720C0D4C1F6BCB1C1A4205BC8A3C8AF20B8F0B5E55D> 서비스기업 운영관리론 Start Your Global Business With Asadal 1 서비스 시설의 입지선정 서강대학교 경영대학 경영전문대학원 교수 서창적 서비스 시설의 유형 Start Your Global Business With Asadal 2 준제조형 서비스 목표 : 네트워크의 물류비용의 최소화 예) 창고, 콜센터 배달 서비스 목표 : 지리적

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

외국인투자유치성과평가기준개발

외국인투자유치성과평가기준개발 2010 년도연구용역보고서 외국인투자유치의성과평가기준개발 - 2010. 10. - 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 책임연구원 국립부경대학교지역사회연구소권오혁 수신 : 대한민국국회예산정책처장귀하. 2010 10 : : : : 요약문 I. 서론 1.

More information

목차 제1절서론 1 1. 연구배경및목적 1 2. 이론적고찰 2 3. 연구내용및방법 10 제 2 절인구이동의요인분석 전국총이동규모의변동요인 지역별인구이동요인분석 22 제 3 절결론 요약 연구의한계 42 < 부록 > 45

목차 제1절서론 1 1. 연구배경및목적 1 2. 이론적고찰 2 3. 연구내용및방법 10 제 2 절인구이동의요인분석 전국총이동규모의변동요인 지역별인구이동요인분석 22 제 3 절결론 요약 연구의한계 42 < 부록 > 45 인구이동통계분석방안연구 김인식 목차 제1절서론 1 1. 연구배경및목적 1 2. 이론적고찰 2 3. 연구내용및방법 10 제 2 절인구이동의요인분석 12 1. 전국총이동규모의변동요인 12 2. 지역별인구이동요인분석 22 제 3 절결론 39 1. 요약 39 2. 연구의한계 42 < 부록 > 45 표목차 < 표 1> 지난 21년동안의전국연간총이동과주요관련지표현황 13

More information

<30362D303328B9DABFCFBCBA2CC0CCC7FCBCAE292E687770>

<30362D303328B9DABFCFBCBA2CC0CCC7FCBCAE292E687770> 대졸취업과관련된구직활동요인연구 박완성 1) ᆞ 이형석 2) Ⅰ. 서론 1. 연구의필요성및목적 2008년 2월실업률은 3.5% 로지난해같은기간에비해 0.2%P 하락한것으로나타났다. 또청년층실업률역시 7.3% 로 0.5%P 낮아졌다. 통계청에따르면 2월실업자는 81만 9천명으로지난해같은기간에비해 4만 3천명이줄었다. 아울러취업자수는 2288만 4천명으로 21만명이증가했다

More information

2018 삶의질여론조사보고서 01 조사개요

2018 삶의질여론조사보고서 01 조사개요 2018 삶의질여론조사보고서 제 1 장. 조사개요 1 Ⅰ. 조사의배경및목적 2 Ⅱ. 조사설계 3 Ⅲ. 조사내용 4 Ⅳ. 응답자구성 5 제 2 장. 조사결과요약 7 제 3 장. 조사결과분석 13 Ⅰ. 삶의질과만족도 14 1. 삶의질과만족도 14 2. 8대영역별삶의질만족도 16 3. 삶의걱정거리 27 4. 미래의삶의질전망 30 5. 우리사회삶의질방향성평가 33

More information

에듀데이터_자료집_완성본.hwp

에듀데이터_자료집_완성본.hwp 단위학교성과제고를위한 교육여건개선방안탐색 모시는글 2012 년도에듀데이터활용학술대회프로그램 목차 n n [ 주제 1] 교육지원청수준에서기초학력결정요인분석연구 천세영 이성은 3 [ 주제 2] 비용함수모형에의한국 공립중학교적정교육비및가중치산출연구 오범호 윤홍주 엄문영 37 n n [ 주제 1] 토론 김영애 67 [ 주제 2] 토론 김성식 73 n n [ 주제

More information

3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : /45

3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : /45 3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : 20049 0/45 Define ~ Analyze Define VOB KBI R 250 O 2 2.2% CBR Gas Dome 1290 CTQ KCI VOC Measure Process Data USL Target LSL Mean Sample N StDev (Within) StDev

More information

사회통계포럼

사회통계포럼 wcjang@snu.ac.kr Acknowledgements Dr. Roger Peng Coursera course. https://github.com/rdpeng/courses Creative Commons by Attribution /. 10 : SNS (twitter, facebook), (functional data) : (, ),, /Data Science

More information

???? 1

???? 1 The Korean Journal of Applied Statistics (2014) 27(1), 13 20 DOI: http://dx.doi.org/10.5351/kjas.2014.27.1.013 Maximum Tolerated Dose Estimation by Stopping Rule and SM3 Design in a Phase I Clinical Trial

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA 한국소음진동공학회 2015추계학술대회논문집년 Study of Noise Pattern and Psycho-acoustics Characteristic of Household Refrigerator * * ** ** Kyung-Soo Kong, Dae-Sik Shin, Weui-Bong Jeong, Tae-Hoon Kim and Se-Jin Ahn Key Words

More information