응용통계연구 (2012) 25(1), DOI: 유 무선 RDD 를결합한혼합조사설계 : 2011 서울시장보궐선거예측조사사례연구 이계오 1 장덕현 2 홍영택 3 1 한남대학교비즈

Similar documents
조사연구 aim of this study is to find main cause of the forecasting error and bias of telephone survey. We use the telephone survey paradata released by N

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr

조사연구 sampling error of polling sites and the additional error which comes from non-response, early voting and second stage sampling error of voters in

조사연구 권 호 연구노트 사전투표득표율예측에대한연구 The Study on the Advance Voting Forecasting 1) 이찬복 a) 주제어 지방선거 사전투표 출구조사 득표율예측 예측오차 Advance voting was held nationwide in

?? (N=800) ~5.1(%) (%) 1 반드시투표할것이다 (72.4%) 2 가능하면투표할것이다 (18.7%) 3 별로투표할생각이없다 ( 2.5%) 4 전혀투표할생각이없다 ( 1.6%) 9 결정못했다 / 모름 / 무응답 ( 4.8%)

지방선거투표의향 문 1. 선생님께서는올해 6 월 13 일치러지는지방선거에서투표하실생각이십니까? 투표하지않으실생각이십니까? 1 반드시투표할것이다 (70.8%) 2 가능하면투표할것이다 (21.3%) 3 별로투표할생각이없다 ( 2.1%) 적극적투표의향 : 70.8 소극적투표

???? 1

ad hwp

자료 : 방송통신위원회, 방송통신서비스가입자연도별추이 The Korea Institute of Public Administration < 그림 1> 전화및이동전화가입자비율 유선전화임의번호걸기 (Random Digit Dialing, RDD) >>> 불과 4,

목차

D-30의시정에서더민주당후보를선택한유권자중에서 80% 는실제로더민주당후보에게투표하였고, 11% 만이지지후보를바꾸어국민의당후보에게투표하였다. 반면국민의당후보를지지할의향이있었던유권자중에서는 63% 가국민의당후보에게투표하고 22% 는더민주당후보에게투표한것으로집계되었다. 투표

<5BC5EBB0E8C7A55D BFF920BFA9B7D0C1B6BBE75FC5EBB0E8C7A55FBCADBFEF2E687770>

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

대학생연수용교재 선거로본대한민국정치사

Ⅰ. 조사목적 본조사는전국민을대상으로대통령국정수행지지도, 정당지지도등을 파악하여, 국민여론을파악하는기초자료수집에그목적을둠. Ⅱ. 조사설계 조사대상 전국거주만 19세이상성인남녀 표본수 총 1,035 명조사후, 지역, 성, 연령별사후보정 표본오차 95% 신뢰수준에서최대허용

한국갤럽 데일리정치지표

1. 조사설계 조사대상 2017 년 2 월현재, 전국만 19 세이상남녀 표본의크기 조사방법 1,021 명 ( 가중전 1,021 명, 가중후 1,000 명 ) - 가중치를 1,000 명기준으로부여했으나, 보도시표본크기는 1,021 명으로보도해야함. 구조화된설문지를이용한전

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

조사연구 권 호 DOI 연구논문 몽골의가축통계조사를위한표본설계연구 A Study on Sampling Design for the Mongolian Livestock Statistics Survey 주제어

한국갤럽 데일리 오피니언

조사연구 권 호 연구노트 1) 가구방문조사에서무응답보정을위한파라데이터활용 * : 국제성인역량조사사례분석을중심으로 Using Paradata in Nonresponse Adjustment for a Household Interview Survey: Case Study o

조사연구 whether this expansive monitoring system might basically achieve the improvement in statistical quality capturing problems in survey research. Ba

한국갤럽 데일리 오피니언

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,514 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,514 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 79.1% + 유선전화

한국갤럽 데일리 오피니언

CC hwp

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,008 명 ( 주의 : 통계보정으로 1,000 표본으로분석하였으며, 보도시에는조사실사례수 1,008 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 3.1% Point 조사방법 유선전화면접 49.7% + 무선전화

한국갤럽 데일리 오피니언

< 차례 > Ⅰ. 조사개요 1 Ⅱ. 통계의작성목적및이용 6 Ⅲ. 조사설계 12 Ⅳ. 자료수집 50 Ⅴ. 행정자료활용 87 Ⅵ. 자료처리 91 Ⅶ. 통계추정및분석 99 Ⅷ. 통계공표관리및이용자서비스 115 Ⅸ. 통계기반및개선 132 Ⅹ. 참고문헌 141

<B0E6B3B2BDC5B9AE5FB1E8C7D8C0BBBCB1B0C5B1B820BFA9B7D0C1B6BBE720BAB8B0EDBCAD2E687770>

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,507 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,507 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 80% + 유선전화면접

한국갤럽 데일리 오피니언

제1장부산 18개선거구 ( 통합 ) 3 제2장중구 동구 8 제3장서구 13 제4장영도구 18 제5장부산진구 ( 갑 ) 23 제6장부산진구 ( 을 ) 28 제7장동래구 33 제8장남구 ( 갑 ) 38 제9장남구 ( 을 ) 43 제10장북구강서구 ( 갑 ) 48 제11장북

한국갤럽 데일리정치지표

제 1 장. 조사개요 1. 조사설계 4 2. 응답자특성 5 제 2 장. 조사결과 1. 문재인대통령국정수행평가 7 2. 서울시장가상대결 A : 박영선 김문수 안철수 인지연 신지예 9 3. 서울시장가상대결 B : 박원순 김문수 안철수 인지연 신지예 서울시장가상대


56 김영원, 배예영 조사에서의성향점수보정방법을정리한다. 우리나라여론조사에서이런기법의도입가능성을검토해보기위해 2007 년 12 월에실시된 17 대대통령선거를위한여론조사자료인 NI Korea 의인터넷패널조사와 MBMR 의대선패널전화조사를비교하고, 현재일반적으로선거예측에활

Kor. J. Aesthet. Cosmetol., 라이프스타일은 개인 생활에 있어 심리적 문화적 사회적 모든 측면의 생활방식과 차이 전체를 말한다. 이러한 라이프스 타일은 사람의 내재된 가치관이나 욕구, 행동 변화를 파악하여 소비행동과 심리를 추측할 수 있고, 개인의

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

2006

<B0E6B3B2BDC5B9AE5FC3A2BFF8BDC3BCBABBEAB1B8BCB1B0C5B1B820BFA9B7D0C1B6BBE720BAB8B0EDBCAD2E687770>

DBPIA-NURIMEDIA

2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd

한국갤럽 데일리 오피니언

<B3EBC6AE3120BCB1B0C5B0B3C7A5B9E6BCDB5FB9DAC1F8BFEC2E687770>

<B0E6B3B2BDC5B9AE5FB8B6BBEAC8B8BFF8BCB1B0C5B1B820BFA9B7D0C1B6BBE720BAB8B0EDBCAD2E687770>

목차

지지정당별지방선거투표의향별국정수행평가별국무총리인선평가별정부개각범위의견별사전투표제인지별사전투표참여의향별지방선거성격공감별차기대선후보선호도별성 * 연령별 자영업 (102) 블루칼라 (96) 12.

<B0E6B3B2BDC5B9AE5FB1E8C7D8B0A9BCB1B0C5B1B820BFA9B7D0C1B6BBE720BAB8B0EDBCAD2E687770>

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: * Strenghening the Cap

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

<5BBAB8B0EDBCAD5D4D424320C3D1BCB1C1B6BBE75FBCADBFEF20BFEBBBEAB1B828BFC0C3A2C8F1292E687770>

DBPIA-NURIMEDIA

한국갤럽 데일리정치지표 년 5월 통합

<B0E6B3B2BDC5B9AE5FBEE7BBEABDC320BFA9B7D0C1B6BBE720BAB8B0EDBCAD2E687770>

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: 3 * The Effect of H

응답자분포표 전 체 (1527) 남 자 (756) 49.5 여 자 (771) 세 (281) 대 (314) 대 (336) 대 (288) 세이상 (308) 20.1 졸이

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

DBPIA-NURIMEDIA

한국갤럽 Gallup Report 2012/12/24 2 박근혜후보선택이유는 신뢰와약속 22, 공약 / 정책 14, 최초의여성대통령 14 문재인후보는 정권교체 / 심판 2, 공약 / 정책 20, 상대후보가싫어서 15 한국갤럽이제 18 대대통령선거가끝난직후인 1 일저녁

Journal of Educational Innovation Research 2016, Vol. 26, No. 2, pp DOI: * The Mediating Eff

한국갤럽 데일리정치지표 년 6월 통합

한국갤럽데일리정치지표인사이드 No. 4 2 조사개요 1. 모집단 : 만 19세이상남녀 2. 조사지역과표본크기 : 전국 19,585명 ( 광주 / 전라 2,009명, 대구 / 경북 2,030명, 부산 / 울산 / 경남 3,109명 ) 3. 조사방법 : 휴대전화 RDD 조

공직선거법 제108조 ( 여론조사의결과공표금지등 ) 3 다음각호의어느하나에해당하는자를제외하고는누구든지선거일전 180일부터선거일의투표마감시각까지선거에관하여정당에대한지지도나당선인을예상하게하는여론조사 ( 공표 보도를목적으로하지아니하는여론조사를포함한다 ) 를실시하려면중앙선거관

[ 표 33] -김문수... 3 [ 표 34] -문재인... 7 [ 표 35] -박근혜 [ 표 36] -손규 [ 표 37] -안철수 [ 표 38] -정몽준 [ 표 3] 지난 1년간가정살림변화 [ 표 40] 지

<C1B6BBE7BFACB1B82031B1C72032C8A BFACB1B8B3EDB9AE29202D20B7F9C1A6BAB92E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

04김호걸(39~50)ok

DBPIA-NURIMEDIA

목 차 통계표요약... 1 응답자특성표... 4 표 1 이명박대통령국정수행평가... 5 표 2 18 대국회의정활동평가... 7 표 3 주요정당공천평가... 9 표 4 공천결과가후보선택에미친영향 표 5 19 대총선투표후보정당 표 6 민주통합당, 통합

untitled

한국갤럽 데일리 오피니언

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 25(3),

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: A study on Characte

목차

한국갤럽 데일리정치지표

<5BBAB8B0EDBCAD5D4D424320C3D1BCB1C1B6BBE75FBCADBFEF20B3EBBFF8B1B8BAB428BFC0C3A2C8F1292E687770>

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

한국갤럽 데일리 오피니언

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Analysis of

2244 황형태, 방미진 에서주목할만한점은대선을포함한다른선거에서는비교적정확한출구조사가이루어졌던반면에, 유독 3회에걸쳐서실시되었던총선에서만큼은출구조사의결과가실제선거결과와크게다르게나타났다는점이다. 2000년도에실시되었던 16대총선에서출구조사를실시했던각방송사들은민주당을제1당

손해보험 채널별 활용분석 123 다.세부 분석 손해보험 채널별 구성비 :성별 남성과 여성 모두 대면채널을 통한 가입이 90% 이상으로 월등히 높음. <표 Ⅱ-2> 손해보험 채널별 구성비 :성별 구 분 남성 여성 대면 직판 은행 0.2 1


Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: * A Study on Teache

.,,,,,,.,,,,.,,,,,, (, 2011)..,,, (, 2009)., (, 2000;, 1993;,,, 1994;, 1995), () 65, 4 51, (,, ). 33, 4 30, (, 201


학교교과교습학원 ( 예능계열 ) 및평생직업교육학원의시설 설비및교구기준적정성연구 A Study on the Curriculum, Facilities, and Equipment Analysis in Private Academy and It's Developmental Ta


<B0E6B3B2BDC5B9AE5FB0C5C1A6BDC320BFA9B7D0C1B6BBE720BAB8B0EDBCAD2E687770>

한국갤럽 데일리정치지표

Journal of Educational Innovation Research 2017, Vol. 27, No. 1, pp DOI: NCS : G * The Analy



서울시종로구사직동 208 전화 팩스 한국갤럽홈페이지 한국갤럽 Gallup Report 2012/09/13 싸이강남스타일열풍에대한여론조사 전세계에우리나라가수싸이의 강남스타일 열풍이

한국갤럽 데일리정치지표

< 목차 > 제 1 장 2010 년 6 ㆍ 2 지방선거쟁점지역여론조사결과비교 1) 경기도지사선거 ) 충남도지사선거 ) 강원도지사선거... 5 제 2 장 2011 년 4 ㆍ 27 재보궐선거쟁점지역여론조사결과비교 1) 강원도지사선거 ) 분당

[ 표 34] 원하는차기대통상 [ 표 35] 안철수원장의출마에견해 [ 표 36] 안철수원장과야당후보와의단일화에대한견해 [ 표 37] 단일화할경우누가로단일화되어야하는지에대한견해 [ 표 38] 공천비리사건에대한박근혜후보의책임여부.

<C1B6BBE7BFACB1B82032B1C72031C8A BFACB1B8B3EDB9AE29202D20C8ABB3BBB8AE2CC7E3B8EDC8B82E687770>

한국갤럽 데일리 오피니언

Transcription:

응용통계연구 (2012 25(1, 153 162 DOI: http://dx.doi.org/10.5351/kjas.2012.25.1.153 유 무선 RDD 를결합한혼합조사설계 : 2011 서울시장보궐선거예측조사사례연구 이계오 1 장덕현 2 홍영택 3 1 한남대학교비즈니스통계학과, 2 한국갤럽조사연구소, 3 한국갤럽조사연구소 (2012 년 1 월 16 일접수, 2012 년 1 월 31 일수정, 2012 년 2 월 16 일채택 요약 선거여론조사에서전화조사의문제점인모집단포함률, 젊은층재택률과투표자선정등의해결방안으로유선 RDD 와무선 RDD 의혼합조사를제안하였으며 2011 년 10 월 26 일서울시장보궐선거사전여론조사데이터를사용하여제안한결합조사의적용가능성을수치적으로검증하였다. 본연구를통해무선 RDD 표본은유선 RDD 표본에비해분산이컸지만상대표준오차는유사한결과를얻었다. 예측정확성측면에서유 무선결합의효과가통계적으로유의하지않았지만일반선거여론조사에적용할경우결합표본을통해모집단포함률을확대하고각조사방법의단점을보완함으로써선거예측조사의신뢰성을제고할수있는방안으로활용될수있을것으로기대된다. 주요용어 : 임의전화번호걸기, 혼합조사설계, 유사최대가능도추정량. 1. 서론 2010 년 KEP(Korea Election Pool 의선거당일출구조사는민주당이 7 개광역단체장선거에서승리 하여 6 개광역단체장당선에그친한나라당을앞서는것으로예측했다. 서울시장은오세훈 47.4%, 한 명숙 47.2% 의득표율로박빙의승부를예측했는데이는실제결과와거의같았다. 반면한국갤럽을비 롯한전화조사의예측에서는선거당일까지한나라당이 10 개시 / 도내외에서승리하고서울에서오세훈 후보가 50% 이상의득표율로무난히당선될것으로보았다. 최근전화조사는여당과대예측의악몽에시달리고있다. 2010 년지방선거는가장극단적인사례라할 수있다. 전화조사는선거한달전부터선거직전까지지속적인경향을보였으며전화조사를시도한조 사회사간차이도크지않아체계적인오차가발생했다할수있다. 이런전화조사의문제에대해여러논의중에서핵심적으로거론되는주제는 3 가지이다. 첫째는모집단 포함률 (coverage rate 이다. 그동안방치됐던문제중하나는일반집전화가입률이감소하고확인가능 한등재번호가축소될뿐아니라집전화에서휴대전화로통신생활의중심이이동한다는것이다. 둘째 는가구및응답자랜덤추출의문제다. 포함률을최대한확보한다하더라도높은부재률, 거절률로인 해랜덤추출의의미가퇴색된다. 셋째는투표자추출의문제이다. 선거결과는결국어느후보의지지 자가더적극적으로투표하는가에의해결정되는데전화조사는수집한데이터로부터이를예측한후추 정하여반영해야한다. 본논문은 2011 년도한남대학교교비학술연구조성비에의하여연구되었음. 1 교신저자 : (306-791 대전대덕구오정동 113, 한남대학교비즈니스통계학과, 교수. E-mail: kayolee@hnu.kr

154 이계오, 장덕현, 홍영택 표 1.1. 시간대별재택률 - 평일오후 3 시 9 시 ( 단위 : % 남자 여자 구분 PM 3 4 PM 4 5 PM 5 6 PM 6 7 PM 7 8 PM 8 9 전체 27.2 29.9 36.0 46.8 55.9 62.2 10대 13.0 23.8 32.7 38.4 41.0 46.0 20대 16.5 16.8 18.3 26.5 37.0 44.0 30대 11.3 12.2 13.7 22.2 35.1 46.0 40대 9.7 9.6 11.7 21.6 36.2 47.4 50대 15.6 16.7 20.4 32.0 50.3 58.6 60대이상 34.9 35.8 45.9 65.4 77.2 83.4 10대 11.5 23.6 29.9 34.8 40.9 47.3 20대 21.2 21.4 23.9 31.3 44.0 52.9 30대 35.5 37.0 44.0 57.5 68.1 72.6 40대 26.8 28.7 36.2 49.6 59.0 64.7 50대 28.6 33.4 42.4 58.4 67.7 69.5 60대이상 42.8 46.4 60.2 79.1 86.5 89.4 2009 년통계청의생활시간조사마이크로데이터분석 ( 전국기준 하지만랜덤추출과투표자추출이아무리중요하다하더라도이는모집단포함률문제를해소했다는전제하에서의미가있을뿐이다. 모집단포함률에대해서는임의번호걸기 (Random Digit Dialing; RDD 로미등재번호에접근하는시도가있었지만집전화이용률의감소, 그리고전화조사시간대에남자, 저연령, 직장인의낮은재택률을감안하면한계가있다. 2009년통계청의생활시간조사에서나타난시간대별재택률에의하면오후 3 6시까지재택률은 40% 에미치지못하고. 특히남자 20 40대는 10% 대에머물고있다. 또한전화조사가거의막바지인 8 9시에전체재택률은 62.2%, 남자 20 40대는 40% 대로나타나고있다. 결국 RDD를통해이시간대에최대한포함률을높인다하더라도재택률의문제점을극복하기에는한계가있을수밖에없다. 따라서집전화중심의표본추출틀구성의한계를극복하고자휴대전화를통한접근이부상하고있다. 2011년 10월무선통신서비스가입자는 5,220만명 ( 방송통신위원회 으로주민등록인구 5,059만명 ( 행정안전부 을넘는수준이다. 전화조사는개인미디어이기때문에가구내응답자선택이라는문제가없을뿐아니라어느시간대에서나, 어느공간에서든받을수있어재택률의영향과도관련없다. 더구나무선통신가입자수가말해주듯높은포함률을확보할수있다. 이런이유로현재다양한방식으로무선전화조사가시도되고있다. 여러시도들중에는단순히유 무선전화조사의병행을통해서로의차이를확인하는것, 그리고무선전화조사를단독실행하는것이외에어떤비율로든유선전화와무선전화표본을결합한접근들이있다. 특히유 무선결합접근은유선전화와무선전화표본각각의한계를보완하고전체적으로높은포함률을확보함으로모집단대표성을높일수있는방법이지만독립적으로추출된두표본이서로중복될수있기때문에결합방식과결합비율등추정의문제가발생한다. 또한전화번호발생에관해별도로확보한전화번호리스트를활용하거나무작위발생시킨번호를활용한케이스가존재한다. 전자는대표성있는충분한규모의리스트를확보한다면효율적이지만패널이나리스트의특성이혼입되어결과가왜곡될가능성이있고후자는패널특성의혼입없이전체휴대전화를포괄하는무선 RDD 접근이다. 앞서논의와같이무선전화조사의필요성이크고실제활용도늘고있지만무선전화조사방식과유 무선표본의결합에대한연구가아직부족한실정이다. 따라서본연구에서는 2011년 10월 25일서울시

유 무선 RDD 를결합한혼합조사설계 155 장보궐선거를통해유 무선 RDD 조사의결합을시도하고유 무선 RDD조사표본을어떻게결합할지, 유 무선결합을통해추정의오차를얼마나줄일수있는지를실제조사데이터를통해서확인하고자한다. 이를위해먼저 (1 조사방법과프레임의혼합설계방식에대한기존접근들을정리하고, (2 유 무선 RDD 결합조사의설계및결합방식에대한논의를전개하며, (3 2011년서울시장보궐선거에서실제추정결과와그오차에대해논의할것이다. 2. 조사방법과프레임의결합설계 유선전화조사는그동안선거여론조사에서가장많이사용했던조사방법이었으나최근에는추출틀로사 용한전화번호 DB 의낮은포함률과연령대별재택률의차이등으로그결과에대한신뢰도가저하되었 다. 반면에 19 세이상성인의무선전화의보급률은 90% 를상회하고무선전화를이용한선거여론조사 가실험적으로시도되고있다. 만일선거여론조사에서유선전화와무선전화를결합한다면유선전화에 서젊은층의낮은포함률을보완할수있고, 반면에무선전화에서의여자, 고연령대의낮은접촉률 ( 한국 갤럽자체결과기준 을보완할수있을것이다. 유선전화조사와무선전화조사를결합한조사는동일한내용을상이한조사방법을적용할경우에생길 수있는응답성향의차이가생길수있으나응답성향의차이를보정해주는방법으로성향가중치를적용 하는방법에대한연구는 Lee (2006, 이계오와장덕현 (2009, 2011 등의연구가있다. 또한유 무선결 합 RDD 와같이추출틀이 2 개이상인경우의결합추정에관한내용은 Cochran (1965, Skinner 와 Rao (1996 와 Lohr 와 Rao (2006 등이연구하였다. 유선 RDD 와무선 RDD 의결합조사에서사용되는 2 개의추출틀은독립적이고완벽하지않으며상호 보완적으로모집단을포괄할수있으므로이러한상황에서혼합설계의내용을살펴보고본과제에적용 할수있는방안을살펴보자. 유선 RDD 와무선 RDD 의추출틀을각각 A 와 B 라하고 A 와 B 의공통부분을 ab = A B 로표시하며 각추출틀에서겹치지않은부분을 a = A B c, b = A c B 로표기하자. 모총계 ( 선거여론조사에서지 지자수 의추정량에대한연구된내용을요약하면아래와같다. 먼저 Hartley (1962 가제안한추정량은 3 개부분추출틀 a, b 와 ab 에서산출한추정량들 (Ŷ a, Ŷ b, Ŷ ab 과 Ŷ ab 을결합하는형태로주어졌다. 단 β 는 Minimizing Var(ŶH. Ŷ H = Ŷ a + Ŷ b + βŷ ab + (1 βŷ ab, (2.1 Fuller 와 Burmeister (1972 는공통부분의크기를모를경우에이의추정으로보완하는모총계의추정 량을아래와같이제안하였다. 단 β 1 과 β 2 는 Minimizing Var(ŶF B. Ŷ F B = Ŷ a + Ŷ b + β 1 Ŷ ab + (1 β 1Ŷ ab + β 2 ( ˆN ab ˆN ab Skinner 와 Rao (1996 는유선 RDD 와무선 RDD 의표본을각각의추출틀에서단순비복원추출한경우 에모총계의일치추정량을유사최대가능도추정량 (Pseudo Maximum Likelihood Estimator; PML 의 형식으로아래와같이제안하였다. Ŷ P ML = (N A ˆN ab,p ML ˆµ a + (2.2 (N B ˆN ab,p ML ˆµ b + ˆN ab,p ML ˆµ ab, (2.3

156 이계오, 장덕현, 홍영택 표 3.1. 유 무선결합 RDD 설계 구분유선전화조사무선전화조사 조사대상 서울지역거주만 19세이상유권자 표집추출 유선전화 RDD 무선전화 RDD 표본크기 1, 2, 3차각각 965, 702, 600명 447, 483, 403명 재통화 최초통화포함총 3회 (25일은 1회 1회 응답자선정 우선순위적용 없음 할당 구별, 성 연령대유권자수기준할당 할당적용없음 여기서 ˆµ a 와 ˆµ b 는각각표본 s a 와 s b 에서계산한가중표본평균이며 ˆµ ab 는공통표본인 s ab 에서아래식으로산출한다. ˆµ ab = n A ˆN ab ˆµ ab + nb ˆN N A N B n A ˆN ab + n B ˆN ab N A N B ab ˆµ ab 또한 ˆN ab,p ML 은아래공통부분에서최대우도함수의 2차방정식의두근중에서최소근을나타낸다. (n A + n B x 2 + (n A N B + n B N A + n A ˆN ab + N B ˆN ab x + (n A ˆN abn B + N B ˆN abn A = 0. Skinner 와 Rao (1996 는위의 3 가지추정량중에서유사최대가능도추정량이가장유효하고분산추정 이간편함을수치적모의시뮬레이션을통해서예시하였다. 식 (2.3 의유사최대가능도추정량의분산 추정식을아래와같이제안하였다. Var (ŶP ML = ˆV A (ẑ Ai + ˆV (ẑ Bi, 여기서변수 ẑ Ai 와 ẑ Bi 는속하는표본에따라서아래와같이정의한다. { y i ˆµ a, i s a, ẑ Ai = θ(y i ˆµ ab + ˆλ ˆϕ, i s ab, { yi ˆµ a, i s b, ẑ Bi = (1 θ(y i ˆµ ab + ˆλ ( 1 ˆϕ, i s ab.. 3. 유 무선 RDD 결합혼합설계 3.1. 조사설계본연구에서는 2011년 10월 26일선거일을앞두고 3차례유무선결합 RDD 전화조사를계획했으며 10월 11 12일, 14 15일, 25일조사를진행했다. 여기서 14 15일의경우중앙일보가의뢰한조사다. 유 무선결합 RDD의구체적설계내용은표 3.1과같았다. 먼저한국갤럽자체유선전화데이터베이스에대한국번분석을실시했다. 한국갤럽의데이터베이스는 KTIS( 구한국인포서비스 에서공급했던전화번호리스트를기초로하여전국 9,452,413개가구번호로구성되며지역번호와국번을결합하여 4,344개국번으로구분하였다. 이중서울가구를하나라도포함한국번은 1,128개다. 각국번에대해가능한번호중상호를제외하고추출번호중 10% 미만성공률을가정하여목표유효표본수의 10배수이상을발생시켰다. 상호번호및결번은사전에제외했다. 무선전화번호에대해사전에 12,358개의유효국번을확인했다. 이중 010 국번이 56.6%, 011 국번

유 무선 RDD 를결합한혼합조사설계 157 14.5%, 016 국번 4.7% 등이었으며실제사전조사의응답자국번비율은 010이 80.6%, 011이 11.4% 로방송통신위원회의 2010년 2월가입자국번비율 (010 80.3%, 011 11.7% 과거의일치했다. 12,358개의국번당 0000부터 9999까지 10,000개번호가발생가능하여전체 123,580,000개번호중한국갤럽자체테스트의유효번호비율 45% 를가정하면대략 55,600,000 유효번호를추출한다고볼때무선통신가입자 5,220만 ( 방송통신위원회 2011년 10월 을거의포함할수있다. 무선전화번호의경우지역을모르는상태에서서울거주자를확인했으며추출번호중성공률 2.5% 를예상하여사전결번확인후목표표본 500명의 40배수번호를발생시켰다. 그러나사전유효로확인된번호중에도실제조사결과 20% 가량은결번으로확인됐다. 1, 2차유선전화의경우비수신, 통화중가구에대해서최초통화를포함해총 3회의재통화를시도했다. 평일진행된 1차조사는낮시간대, 저녁시간대, 익일저녁시간대, 금, 토로진행된 2차조사에서는저녁시간대, 익일즉토요일오전, 오후시간대를구분하여조사시간대또는조사일을달리했다. 가구내응답자의선정은재택가구원중우선순위를부여했다. 우선순위는생활시간조사에따라재택확률이가장낮은성, 연령특성순이었다. 최종적으로구별, 성 연령대별유권자수를할당기준으로삼았으며셀별최소 50% 가넘고, 최대 120% 가넘지않도록했다. 무작위추출한무선전화의경우낮시간대에통화를시도하고재통화를하지않았다. 개인미디어특성상반복적통화시도가프라이버시침해가될것을우려했다. 사전에전화번호의유효성이외에지역정보를알수없고성 연령기준할당도불가능했다. 단지전체적으로분석가능한수준이 400명이상의유효표본을확보하려했다. 할당기준을적용하지않았지만무선전화표본에대한 2가지가정을사전에설정했다. 첫째는집전화없는가구즉휴대전화만있는가구 ( 이하무선 Only 가구 의비율, 둘째는전화조사시간대의재택률이다. 무선 Only 가구는한국갤럽자체패널자료에기초해서울가구기준으로 30.5%, 20세이상가구구성원기준으로 25.7% 이다. 전화조사시간대서울지역 20대이상재택률은오후 5시대 31.0%, 6시대 41.3%, 7시대 52.4%, 8시대 61.6% 이다. 재택률기준에서오후 7시대를기준으로삼았다. 전화조사가 9시에종료된다볼때 7시대가유선전화조사가기대할수있는재택률이고, 따라서이시간대비재택자를무선전화조사가보완할수있다고가정하였다. 한편후보지지도는 님께서는이번선거에서누가서울시장이되는것이좋다고생각하십니까? 로묻고, 어느후보에조금이라도마음이가는지 한번더확인했다. 3.2. 유 무선 RDD 결합방식유 무선결합방식으로 4가지옵션을적용했다. 1 단순합, 2 분산역수, 3 무선 Only 가구기준, 4 재택률기준. 첫째, 단순합 ( 설계가중 으로각층별후보응답은유 무선조사응답을단순히합한것으로다음과같다. n t A(j = n f A(j + nm A(j, - n t A(j : j층에서후보 A의전체지지응답, - n f A(j : j층에서후보 A의유선전화지지응답, - n m A(j : j층에서후보 A의무선전화지지응답. 이를기본으로하여층별유선전화표본반영비율 λ (j 을통한가중합을다음과같이적용한다. λ (j (n f n t A(j + ( ( nm A(j 1 λ(j n f A(j A(j + nm A(j = +, n f A(j n m A(j

158 이계오, 장덕현, 홍영택 표 4.1. 유 무선 RDD 전화조사결과비교 - 설계가중 ( 단위 : % 구분 유선 무선 A후보 B후보 모름 / 무응답 A후보 B후보 모름 / 무응답 χ 2 df 유의확률 전체 42.3 42.7 14.2 41.3 42.3 16.1 2.047 3.563 19 29세 24.6 50.8 21.3 35.0 45.0 20.0 2.412 3.491 30대 31.3 56.7 11.9 23.9 60.9 15.2.833 2.659 남자 40대 25.8 61.3 12.9 27.9 60.5 11.6.078 2.962 50대 58.2 27.3 12.7 61.1 33.3 5.6 2.087 3.555 60세이상 63.3 26.5 10.2 63.6 18.2 15.2 2.474 3.480 19 29세 37.7 55.7 3.3 24.4 53.7 22.0 10.634 3.014 30대 24.6 66.2 9.2 37.2 53.5 9.3 2.065 2.356 여자 40대 45.2 38.7 16.1 40.5 45.2 14.3.440 2.802 50대 63.8 22.4 13.8 50.0 37.5 12.5 2.382 2.304 60세이상 59.0 14.8 26.2 59.6 10.6 29.8.469 2.791 권역 북서 48.1 39.4 12.5 38.6 38.6 21.4 4.420 3.219 북동 39.6 43.8 15.1 39.1 41.4 19.5 2.996 3.392 남서 38.3 48.3 13.3 36.4 50.4 13.2.139 2.933 남동 48.0 36.0 14.4 54.1 35.3 10.6 2.314 3.510 λ (j 는후보 A 지지도의분산역수, 또는무선 only 가구원비율, 재택률을기준으로산출한다. j 층에서 후보 A 지지도의유선전화분산을 V f A(j, 무선전화분산을 V m A(j 이라할때 λ (j 는다음과같다. V f A(j λ (j = V f A(j + V. m A(j 무선 Only 가구원비율은한국갤럽자체패널의서울지역무선 Only가구가구원비율 ( 전체 25.7% 을적용했으며, 재택률은저녁 7시대평균재택률 (52.7% 을기준으로했다. 또한성 ( 남, 여 연령대 (19 29세, 30대, 40대, 50대, 60세이상 10개층으로구분하여데이터를분석하였다. 4. 유 무선 RDD 결합추정결과와오차 이후분석은 10 월 25 일데이터를기준으로했다. D 1 일인 10 월 25 일이투표일과가장가까운결과이 기때문에실제선거결과와비교할때시간변화의영향이가장적다고할수있다. 4.1. 유 무선전화조사간차이검정분석의기초자료는유 무선전화조사각각사전에설정한지역, 성 연령대별유권자비율에일치시키기위해셀가중방식으로가중처리했다. 전체지지도는유선전화조사에서 A후보, B후보, 모름 무응답이각각 42.3%, 42.7%, 14.2%, 무선전화조사에서 41.3%, 42.3%, 16.1% 였다. 카이제곱검정결과전체지지도에서두조사방법간의차이는유의하지않았다. 성 연령대별, 권역별지지도차이를카이제곱검정한결과, 여자 19 29세를제외하고조사방법간의유의한차이를발견하지못했다. 여자 19 29세의경우도무응답자비율에서차이가컸다 ( 표 4.1. 4.2. 결합방안별정확성비교 지지도분산또는상대표준오차추정을위해모름 / 무응답자의각후보지지확률은무작위적이라가정

유 무선 RDD 를결합한혼합조사설계 159 표 4.2. 유 무선 RDD 전화조사결과비교 - 설계가중 ( 단위 : % 구분 지지도 (% 분산상대표준오차 (% 로그 A 후보 B 후보 A 후보 B 후보 A 후보 B 후보오즈비 선거결과 46.8 47.4 - - - - - 유선 49.4 49.8.042.042 1.59 1.80.136 무선 49.4 50.4.062.062 1.57 1.50.120 단순합 49.4 50.0.025.025 1.58 1.68.130 결합 분산역수 49.4 50.1.025.025 1.57 1.65.128 추정 무선 Only 49.5 49.9.025.025 1.61 1.75.134 재택률 49.3 50.4.025.025 1.52 1.54.120 A 후보지지도상대표준오차 = (S.D/A 100 로그오즈비 = log(ab/ba - A: A 후보실제득표율, a: A 후보예측지지도 - B: B 후보실제득표율, b: B 후보예측지지도 표 4.3. 유 무선결합결과비교 - A 후보분산 구분유선무선단순합분산역수무선 only 재택 전체 0.04 0.06 0.02 0.02 0.02 0.02 19 29세 0.55 0.67 0.30 0.31 0.30 0.31 30대 0.51 0.39 0.23 0.22 0.23 0.22 남자 40대 0.40 0.45 0.21 0.21 0.21 0.21 50대 0.31 0.40 0.17 0.17 0.17 0.17 60세이상 0.33 0.43 0.19 0.19 0.19 0.19 19 29세 0.50 0.58 0.27 0.27 0.27 0.27 30대 0.35 0.76 0.25 0.24 0.25 0.25 여자 40대 0.38 0.66 0.24 0.24 0.24 0.24 50대 0.28 1.07 0.23 0.23 0.23 0.23 60세이상 0.27 0.73 0.20 0.20 0.20 0.20 권역 북동 0.25 0.42 0.16 0.16 0.16 0.16 북서 0.13 0.19 0.08 0.08 0.08 0.08 남동 0.14 0.20 0.08 0.08 0.08 0.08 남서 0.20 0.27 0.11 0.11 0.11 0.11 하여두사람의유력후보에 50% 씩배분했다 (Lavrakas와 Traugott, 2000. 여자 19 29세처럼유 무선간무응답비율차이가후보간분산차이를발생시키는등분석결과에영향을주기때문에이점을통제하고자했다. 유 무선추정결과의차이가매우작았기때문에결합옵션에따른효과는거의없었다. 상대표준오차을기준으로보면미세한차이지만무선전화조사, 재택률기준결합추정치가실제결과와가장유사한것으로나타났다. 성 연령대, 권역별로분산크기를비교하면전반적으로무선전화조사표본의분산이컸고특히여자 50대이상에서무선전화조사표본분산이상대적으로컸다. 그러나유 무선결합결과로보면옵션에따른분산차이는거의없었다. 상대표준오차의경우도전반적으로통계적으로유의한차이가나타나지않았다. 각각유 무선상대표준오차의범위내에서북동, 남동에서재택률기준이, 남서에서는무선 Only 옵션의상대표준오차가가장작았다. 하지만예측지지도로보면 1% 포인트내의미세한차이였다.

160 이계오, 장덕현, 홍영택 표 4.4. 유 무선결합결과비교 - A 후보지지도 ( 단위 : % 권역 구분선거결과유선무선단순합분산역수무선 only 재택 전체 46.2 49.4 49.4 49.4 49.4 49.5 49.3 북동 44.6 54.3 49.3 52.3 52.3 52.0 51.2 북서 44.1 47.2 48.9 47.9 47.6 47.8 47.9 남동 43.0 45.0 43.1 44.2 44.7 45.0 44.2 남서 55.0 55.3 59.2 56.9 56.5 56.2 57.1 후보지지도는모름 / 무응답을 A, B 후보에 50% 씩배분한결과기준임 표 4.5. 유 무선결합결과비교 - A 후보상대표준오차 ( 단위 : % 권역 구분유선무선단순합분산역수무선 only 재택 전체 1.59 1.57 1.58 1.57 1.61 1.52 북동 5.30 2.34 4.05 4.05 3.86 3.42 북서 1.43 2.35 1.79 1.64 1.77 1.84 남동 0.90 0.04 0.55 0.75 0.92 0.53 남서 0.16 2.52 1.07 0.88 0.67 1.23 5. 결론및제언 5.1. 분석결과의요약기존전화번호 DB의제한성및낮은재택률등으로높은모집단포함률을확보할수있는무선전화조사의필요성이대두되었다. 무선전화조사는조사비용의상승을가져올뿐아니라상대적으로여자, 고연령에대한접근성이떨어지는한계를가지고있다. 따라서각조사방법의제한점을보완할수있는유 무선전화조사방법의결합이다양하게시도되고있다. 본연구는 2011 서울시장보궐선거여론조사데이터를이용해유 무선전화조사결합추정을시도했다. 임의번호걸기 (Random Digit Dialing; RDD 방식으로유 무선전화조사를실시하고단순합, 분산역수, 무선 Only 가구기준, 재택률기준에따라유 무선전화조사표본을결합했으며분산과상대표준오차를통해최적의결합방식을확인하고자했다. 성 연령대별표본간후보지지도차이에대해카이제곱검정결과전반적으로유의한차이를발견하지못했다. 결과적으로표본간결합의효과는미미했다고볼수있다. 결합결과분산은줄었으나상대표준오차는축소되지않았다. 또한재택률기준결합옵션의상대표준오차가가장작았지만옵션간오차의차이는통계적으로유의하지않았다. 본연구를통해무선 RDD 전화조사표본의가능성을확인할수있다. 무선 RDD 표본은유선 RDD 표본에비해분산이컸지만상대표준오차는유사한결과를얻었다. 비록 2011년 10월 26일서울시장보궐선거여론조사한사례로한정되며예측정확성측면에서유 무선결합의효과를발견하지못했으나일반선거여론조사에적용할경우에는결합표본을통해모집단포함률을확대하고각조사방법의단점을보완함으로써선거예측조사의신뢰성을제고할수있을것으로기대된다. 5.2. 연구방법및조사방법에대한제언유 무선 RDD 혼합설계는유 무선각각의모집단포함확률을극대화할수있는방법이다. 특히성, 연령, 직업등의특성에따라통신매체의활용도및의존도차이가있기때문에두프레임을동시에고려함으로써모집단대표성을높일수있다. 또한실무적으로두방법을혼용하면서조사시간을유연하게

유 무선 RDD 를결합한혼합조사설계 161 활용할수있다. 유선전화조사는낮은재택률로인해저녁시간대또는주말에조사를집중할필요가있다. 반면무선전화조사는시간적인제약이없기때문에오전또는낮시간대에조사를진행할수있으며, 두방법의시간을잘배분한다면효율적으로적절한표본수집이가능하다. 그러나무선전화조사는응답자특성정보 ( 지역, 성, 연령대등 를사전에알수없기때문에모집단특성이제한적이거나어떤특성에의해층을구분할수없다. 특히국회의원총선거와같은선거구단위로소지역에한정한조사를진행하려할때무선 RDD는거의불가능한상황이다. 또한무선 RDD 전화조사는아직초기적용단계이기때문에표본의특성을명확히알고있지않다. 무선 RDD 표본은연령대별비율이비교적고르지만남자가여자보다많은점, 화이트칼라직업군의비율이높은점등이특징이다. 그러나아직제한적으로적용했기때문에상황에따라유 무선표본이어떻게차이날지를계속지켜볼필요가있으며보다더많은사례연구가필요하다. 본사례의경우성 연령대별지지도차이가컸지만그특성내에서유 무선표본의차이가거의없었다. 그러나측정지표의특성이나조사상황에따라유 무선전화조사참여율이달라질경우오차가발생할수있다. 따라서전화조사를통해안정적으로예측하고추정하기위해서는유 무선결합의필요성이크다할수있다. 또한측정지표와조사상황에따라유 무선전화조사표본이어떻게달라지는지에대한다양한사례연구들이앞으로계속축적된다면전화조사와무선전화조사의결합조사의유용성이향상될것이다. 참고문헌 이계오, 장덕현 (2009. 인터넷선거조사에서성향가중모형적용사례, < 조사연구 >, 10, 21 36. 이계오, 장덕현 (2011. 사전태도및투표의향과실제투표행동간상관성연구, < 조사연구 >, 12, 1 30. Cochran, R. S. (1965. Theory and Application of Multiple Frame Surveys, Unpublished Ph.D. Thesis, Iowa State University. Fuller, W. A. and Burmeister, L. F. (1972. Estimators for samples selected from two overlapping frames, In Proceedings of the Social Statistics Section, American Statistical Association, 245 249. Hartley, H. O. (1962. Multiple frame surveys, In Proceedings of the Social Statistics Section, American Statistical Association, 203 206. Lavrakas, P. J. and Traugott, M. W. (2000. Election Polls, the News Media, and Democracy, Chatham House Publishers, New York. Lee, S. (2006. Propensity score adjustment as a weighting scheme for volunteer panel surveys, Journal of Official Statistics, 22, 329 349. Lohr, S. and Rao, J. N. K. (2006. Estimation in multiple-frame surveys, Journal of the American Statistical Association, 101, 1019 1030. Skinner, C. J. and Rao, J. N. K. (1996. Estimation in dual frame surveys with complex design, Journal of the American Statistical Association, 91, 349 356.

162 이계오, 장덕현, 홍영택 A Case Study of Mixed-Mode Design Incorporated Mobile RDD into Telephone RDD Kay-o, Lee 1 Duk-Hyun Jang 2 Young-Taek Hong 3 1 Department of Business Statistics, Hannam University; 2 Gallup Korea; 3 Gallup Korea (Received January 16, 2012; Revised January 31, 2012; Accepted February 16, 2012 Abstract We proposed a mixed-mode design with a landline survey and mobile survey as the solution for the problems of election opinion polls by the original telephone survey method, mostly with limited population coverage for young people not living at home and with lower efficiency in selecting valid voters. We numerically verified the applicability of the proposed dual frame survey by analyzing the preliminary opinion poll results of the Seoul mayor by-election of October 26 2011. This research achieved the result that relative standard errors were similar between a mobile RDD sample and landline RDD sample though the variance was bigger in the former. Though the combination of mobile RDD and landline RDD is not found to improve the forecast accuracy, it still is expected to have higher reliability for election polls by expanding the population coverage and compensating the weakness of each survey method. Keywords: RDD, Mixed mode design, PMLE. This paper was supported by Hannam University. 1 Corresponding author: Professor, Department of Business statistics, Hannam University, 133 Ohjung-Dong, Deaduk-Gu, Daejun 306-791, Korea. E-mail: kayolee@hnu.kr