<B3EBC6AE3120BCB1B0C5B0B3C7A5B9E6BCDB5FB9DAC1F8BFEC2E687770>



Similar documents
ad hwp

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr

조사연구 sampling error of polling sites and the additional error which comes from non-response, early voting and second stage sampling error of voters in

조사연구 권 호 연구노트 사전투표득표율예측에대한연구 The Study on the Advance Voting Forecasting 1) 이찬복 a) 주제어 지방선거 사전투표 출구조사 득표율예측 예측오차 Advance voting was held nationwide in


hwp

대학생연수용교재 선거로본대한민국정치사

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

조사연구 aim of this study is to find main cause of the forecasting error and bias of telephone survey. We use the telephone survey paradata released by N

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

A plan for managing exhibition & education programs in presidential archives 143

71호 한소리.indd

<4D F736F F D20C3A520BCD2B0B32DC0DABFACBDC4C0C720C8B2B1DDBAF1C0B2322E646F63>

자료1 분기별 시청률 추이 (%) 사분기 2사분기 3사분기 4사분기 1사분기 2사분기 3사분기 4

12È«±â¼±¿Ü339~370

01Àå

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

(001~006)개념RPM3-2(부속)

歯3이화진

<B3EDB9AE3320B1E8BFB5BFF820BFDC2E687770>

hwp

04 Çмú_±â¼ú±â»ç

8표지 앉기

와플-4년-2호-본문-15.ps

서울도시연구_13권4호.hwp

조사연구 Key words: exit poll, sample size, primary sampling unit, secondary sampling unit, cluster, design effect, coefficient of variation Ⅰ. 서론 년 월의지방선

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

2 조선 동아 `대통령 선거 개입' 두둔 중앙일보의 < 새누리 150석은 건지겠나 청와대 참모들 한숨뿐>(3/14, 6면) 보도 역시 집권 4년차에 접어든 박근혜 대통령이 국정 운영에 주도권을 쥐려면 4 13 총선에서 새누리 당의 과반 의석 확보가 필수적 이라는 분석과

¾ç¼ºÄÀ-2

DDCAWEAACYAG.hwp

12¾ÈÇö°æ 1-155T304®¶ó

<4D F736F F D20BACEB1B3C0E75FB5F0C1F6C5D0B6F3C0CCC7C15F3232C2F7BDC32E646F63>

96부산연주문화\(김창욱\)

<38BFF93232C0CF28BFF92920C0E7B3ADB0FCB8AE20C1BEC7D5BBF3C8B BDC320C7F6C0E7292E687770>

이용석 박환용 - 베이비부머의 특성에 따른 주택유형 선택 변화 연구.hwp

2244 황형태, 방미진 에서주목할만한점은대선을포함한다른선거에서는비교적정확한출구조사가이루어졌던반면에, 유독 3회에걸쳐서실시되었던총선에서만큼은출구조사의결과가실제선거결과와크게다르게나타났다는점이다. 2000년도에실시되었던 16대총선에서출구조사를실시했던각방송사들은민주당을제1당

<33B1C7C3D6C1BEBABB28BCF6C1A42D E687770>

2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd

성도

정치컴 23호-최종.hwp


Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

<B9CCB5F0BEEEB0E6C1A6BFCDB9AEC8AD5F31322D32C8A35FBABBB9AE5FC3CAC6C731BCE25F6F6B5F E687770>

¿©±âÀÚ-À¥¿ë.PDF

......

Journal of Educational Innovation Research 2017, Vol. 27, No. 3, pp DOI: (NCS) Method of Con

- 2 -

음주측정을 위한 긴급강제채혈의 절차와 법리, A Study on the Urgent Compulsory Blood

DBPIA-NURIMEDIA

확률과통계6

statistics

A Time Series and Spatial Analysis of Factors Affecting Housing Prices in Seoul Ha Yeon Hong* Joo Hyung Lee** 요약 주제어 ABSTRACT:This study recognizes th

197

Drucker Innovation_CEO과정

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

194

정치

황금부자만들기 - 부동산투자성공스토리 2

목 차 1. 서론 1.1. 문제 제기 및 연구 목적 1.2. 연구 대상 및 연구 방법 2. 교양 다큐 프로그램 이해 3. 롤랑바르트 신화론에 대한 이해 3.1. 기호학과 그 에 대하여 3.2. 롤랑바르트 신화 이론 고찰 4. 분석 내용 4.1. 세계테마기행 에 대한 기

exp

152*220

01¸é¼öÁ¤

<C7D1B1B9C4DCC5D9C3F7C1F8C8EFBFF82D C4DCC5D9C3F7BBEABEF7B9E9BCAD5FB3BBC1F E687770>

2 드라마가 그린 전통시장, 우리의 삶과 희로애락을 담아 주인공 삶의 공간됐던 한약방ㆍ짜장면 가게ㆍ야채가게의 현재 모습은? TV 드라마에는 종종 전통시장이 등장한다. 주인공의 삶의 터전이 되기도 하고 주요한 만남이 이뤄지는 장소로도 쓰인다. 전통시장을 오가는 사람들만

연구노트

회원번호 대표자 공동자 KR000****1 권 * 영 KR000****1 박 * 순 KR000****1 박 * 애 이 * 홍 KR000****2 김 * 근 하 * 희 KR000****2 박 * 순 KR000****3 최 * 정 KR000****4 박 * 희 조 * 제

2. 박주민.hwp

<C1B6BBE7BFACB1B82031B1C72032C8A BFACB1B8B3EDB9AE29202D20B7F9C1A6BAB92E687770>

언론중재01-119

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의

Á¤´çÇÐȸǥÁö

2 조중동 `친노 운동권 배제' 종용 조선일보와 동아일보는 정청래 의원 등 구체적 인물을 특정 하며 노골적 낙천여론을 조장해왔다. 그러나 이들의 주장은 그저 감정적인 이유만을 들이대며 악의적 주장을 퍼부은 것 에 불과하다. 이들이 제시하는 기준이 친노 운동권, 막말,

No Title

슬라이드 1

(095-99)미디어포럼4(법을 알고).indd

<C1B6BBE7BFACB1B82034B1C72031C8A BFACB1B8B3EDB9AE292DB7F9C1A6BAB92E687770>




= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan ,

814 (Page 1)

주지스님의 이 달의 법문 성철 큰스님 기념관 불사를 회향하면서 20여 년 전 성철 큰스님 사리탑을 건립하려고 중국 석굴답사 연구팀을 따라 중국 불교성지를 탐방하였습 니다. 대동의 운강석굴, 용문석굴, 공의석굴, 맥적산석 굴, 대족석굴, 티벳 라싸의 포탈라궁과 주변의 큰


한국성인에서초기황반변성질환과 연관된위험요인연구

= " (2014), `` ,'' .." " (2011), `` ,'' (.)"

µðÇÃ24-Ç¥Áö´Ü¸é

歯1.PDF

<C3D6C1BE2DBDC4C7B0C0AFC5EBC7D0C8B8C1F D32C8A3292E687770>

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

기획과 편성의 롤러코스터 파탄 드라마 희비극 MBC는 9시 시간대에 교양 예능 프로그램 대신 일일 드라마를 36년 만에 편성했다. 하지만 구암 허준 의 시청률이 낮았기 때문에 8시 뉴스데스크 의 시청률 상 승은 기대할 수 없었다. 시사 예능 토크쇼 컬투의 베란 다쇼 도

CC hwp

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

DBPIA-NURIMEDIA

목차

2003report hwp

< C3E2C6C7BEF7B5EEC3D6C1BEBAB8B0EDBCADC0CEBCE2BFEB312E687770>

#³óÃÌ°æÁ¦ 64È£-Ä®¶ó¸é

¾Èµ¿±³È¸º¸ÃÖÁ¾

Transcription:

조사연구(2011. 03) 12권 1호: 143-154 143 연구노트 1)선거 개표방송에서 출구조사 자료를 활용한 중간 득표율 추정에 관한 연구* Estimating the Interim Rate of Votes Earned Based on the Exit Poll Results during the Coverage of Ballot Results by Broadcasters 2)3)이윤동 ** 박진우 *** Yoon Dong Lee Jinwoo Park 지상파 방송 3사에서 선거 개표방송을 할 때 사용하는 현재의 개표 집계방식은 각 개표 소에서 집계된 개표결과를 단순 합산하여 발표하는 방식이다. 그런데 이 방식은 투표소별 개표 진도의 차이를 무시하는 방식이어서 불필요한 혼선을 초래할 여지가 있다. 방송사 입 장에서는 이미 출구조사를 통해 얻은 지역별 데이터가 있는데도 불구하고 이 정보를 오후 6시 예측결과를 발표할 때에만 사용할 뿐이고, 이후 개표가 진행되는 동안에는 전혀 이용하 지 않은 채 개표결과만을 단순 집계하여 발표한다. 본 논문에서는 베이지안(Bayesian) 기법 을 도입하여 출구조사 자료와 개표결과를 통합하여 발표하는 방법을 제시하고자 한다. 이 방법을 사용함으로써 투표소별 개표 진도의 차이에서 생기는 혼선을 피할 수 있을 것으로 기대한다. 주제어 : 출구조사, 득표수, 득표율, 초기하분포, 다항분포, 사후분포 During major elections, three terrestrial broadcasting stations in Korea have covered the progresses of election results by announcing the simple sum of ballot counts of all ballot counting stations. The current approach, however, does not properly reflect the actual ballot count differences by ballot counting location, leading to cause unnecessary but possible confusions. In addition, the current coverage approach restricts the broadcasters from using regional poll data gained through exit polls by * 본 논문은 일부 2009학년도 서강대학교 교내연구비의 지원에 의하여 수행되었음. ** 서강대학교 경영학부 교수 *** 교신저자(corresponding author): 수원대학교 통계정보학과 교수 박진우. E-mail : jwpark@suwon.ac.kr

144 조사연구 letting them to use the significant information on a one-off purpose to announce the initial prediction of the poll results and to fully disregard the exit poll results during the ballot counting process. Based on the understanding, this paper is designed to suggest a Bayesian approach to consolidate the exit poll results with the progressive ballot counting results and announce them as such. The suggested consolidation approach is expected to mitigate or avoid the possible confusions that may arise in connection with the different ballot counting paces by ballot counting station. Keywords : exit poll, ballot counts, rate of votes earned, hyper-geometric distribution, multinomial distribution, posterior distribution Ⅰ. 머리말 2010년 6월의 지방선거에서는 유례없이 치열한 박빙의 경쟁을 보인 지역들이 많았을 뿐 아니라, 사상 처음으로 도지사와 교육감 선거가 동시에 치러져서 방송 3사의 예측조 사 결과에 대해 시민들의 이목이 많이 쏠렸다. 2010년 지방선거 예측을 위해 한국방송협 회가 주관하고 KBS, MBC, SBS 지상파 방송 3사가 참여하는 방송사 공동 예측조사위 원회(Korea Election Pool: KEP)를 구성한 바 있다(한국방송협회 2010). KEP에서 주관 하고 방송 3사에 의해 발표된 출구조사 결과는 YTN이나 MBN의 전화조사를 기반으로 한 선거예측 조사결과와 많은 차이를 보였다. 방송 3사의 출구조사 결과는 실제 개표결 과와 거의 차이가 없었고, 더 나아가 박빙지역의 당선자 예측에도 성공하는 개가를 이루 었다. 가장 경합이 치열했던 서울시장 선거의 경우 실제개표의 결과가 오세훈 후보 47.4%, 한명숙 후보 46.8%의 득표율인 것으로 나타났는데, 출구조사의 예측 득표율은 오세훈 후보 47.4%, 한명숙 후보 47.2%로 개표결과와 거의 비슷하게 나왔다. 반면, 전화조사 에 기초한 YTN이나 MBN의 예측은 실제개표의 결과와 차이가 나서 많은 비판을 받았 고, 급기야 잘못된 예측에 대해 방송사 측에서 사과를 하는 지경에 이르게 되었다(김대 영 2010). 출구조사의 화려한 성공에 묻혀 거의 관심 밖으로 밀려나긴 했지만, 2010년 지방선거 예측방송의 과정에서 통계학적 화두로 떠오를 수 있는 다른 주제가 있다. 그것은 다름

선거 개표방송에서 출구조사 자료를 활용한 중간 득표율 추정에 관한 연구 145 아닌 개표과정에서 있었던 혼선의 문제이다. 서울의 경우가 가장 대표적인 사례였는데, 출구조사에서는 오세훈 후보의 예상 득표율이 한명숙 후보에 비해 0.2%p 높은 것으로 예측되었다. 그러나 개표의 진행과정에서는 상당 시간 동안 한명숙 후보가 오세훈 후보 를 앞지르는 상황이 전개되어 한명숙 후보 측에서는 한때 선거의 승리를 선언하는 일이 벌어지기도 하였다. 이러한 혼선이 생기게 된 근본 원인으로는 서울의 구별 개표 진도가 달랐던 것을 들 수 있다. 개표 초반에는 상대적으로 한명숙 후보 지지율이 높은 구들에 대한 개표가 빠르게 진행된 반면, 후반으로 갈수록 오세훈 후보 지지율이 높은 구들의 개표가 많이 이루어졌기 때문이다. 구별 개표 진도의 차이로 인해 일어나는 이러한 혼란 을 사전에 방지할 수는 없었을까? 통계학적 관점에서 보면 현재의 개표 집계 방식은 문제가 있다. 현재의 방식은 각 개 표소에서 집계된 개표결과의 단순 합계를 발표하는 방식인데, 이것은 투표소별 개표 진 도의 차이를 무시하는 방식이다. 방송사 입장에서는 이미 출구조사를 통해 얻은 지역별 데이터가 있음에도 불구하고 이 정보를 오후 6시 예측결과 발표 시에만 이용할 뿐 이후 에는 제대로 활용하지 못하는 것으로 생각된다. 김희연(2008)에 의하면, 2008년 대통령 선거 당시 SBS는 개표방송에서 분 단위의 집계정보를 이용하여 후보자별 당선확률을 계 산한 바가 있다. KBS의 경우도 방송사가 자체 개발한 디시전-K(Decision-K)라는 선 거예측시스템을 사용한 바 있다고 한다. 그러나 이런 문제가 공론화되어 적절한 이론적 방법론이 제시된 적은 없다. 본 논문에서는 베이지안(Bayesian) 기법을 도입하여 출구조사 자료와 개표결과를 통 합하여 발표하는 방법을 제시하고자 한다. 이러한 연구는 선거의 개표과정에서 기존의 단순 집계방식을 보완하기 위한 이론적 대안을 제시하는 한편, 실제 투표소별 개표 진도 의 차이에서 생기는 혼선을 피하는 데 도움을 줄 것으로 기대한다. Ⅱ. 새로운 득표율 추정법 A, B, C 세 명의 후보가 한 선거구에 출마하는 경우를 가정한다. 선거구 내 특정 번째 투표소(혹은 지역)에서 전체 명의 유권자가 투표에 참여하며, 각 후보자별 득 표수는 라고 표기한다. 논의를 단순화하기 위해 투표에서 무효 는 없는 것으로 가정한다. 즉, 이다. 한편, 전체 명의 표본을

146 조사연구 대상으로 출구조사를 실시하였는데, 표본 응답자들 중 각 후보자에 대한 지지자수는 인 것으로 가정한다. 개표가 진행되는 특정 시점 에서의 각 후보별 득표수를 로 나타내기로 하자. 개표개시 시점인 일 때 이 되며, 개표가 완료되는 시점 즉, t=t 일 때 가 성립된다. 시점 에서의 득표수 와 득표율 는 각각 통계적으로 두 가지 특성을 갖 는다. 하나는, 각각 최종득표수 또는 최종득표율 (혹은 시점 이후의 득표수와 득표율)에 대한 추정량으로서의 의미를 지닌다. 이때 각각의 통계 량은 확률적 성격을 갖는다. 다른 하나는, 시점까지 공개된 정보에 의하여 설명되는 집 합에 대한 모수(parameter)로서의 의미를 갖는다. 번째 투표소에 대한 출구조사 결과는 각 후보별 득표율이 인 것으로 발표될 것 이고, 이후 개표진행에 대한 보도는 매 집계시간별로 각 후보별 득표수, 혹은 이를 해당 시점에서의 개표수 로 나눈 득표율 형태로 이루어지게 될 것이다. 또한 각 후보별 전체 지역 에서의 득표수 합계는 로 집계되어 발표될 것이다. 그러나 이와 같이 단순한 방법에 의하여 집계되는 현행의 득표율과 득표수 계산방법은 앞 절에서 언급한 바와 같이, 특수한 경우에서는 득표율과 득표수에 대한 바른 정보를 제공하지 못할 우려가 있다. 특히 이와 같은 득표율과 득표 수에 대한 집계방법은 출구조사에 의하여 얻은 정보와 개표 정보를 통합하지 못한 채 개 표 정보만을 이용하고 만다는 문제점을 안고 있다. 이러한 문제점을 개선하기 위해 다양한 형태의 득표율 추정방법과 득표수 집계방법이 고려될 수 있다. 가령, 에 대한 추정량 의 대안으로 다음과 같은 추정량들을 생각해 보자.

선거 개표방송에서 출구조사 자료를 활용한 중간 득표율 추정에 관한 연구 147 여기서 은 어떤 적당한 상수이다. 위의 세 가지 추정량은 모두 개표 개시시점(즉, )에서는 출구조사에서 얻은 득 표율과 동일한 값을 가지며, 점차 개표가 진행됨에 따라 값이 모수인 에 근접하게 된 다. 한편 개표가 종료되는 시점에 이를 경우, 와 는 모수인 와 동일한 값을 갖게 되는데 반해, 는 모수값과 일치하지 않는다. 에 비해 가 매우 작아서 이 되는 경우, 개표가 종료되는 시점에 이르면 세 추정값은 거의 같은 값이 된다. 다만 후보자별 최종 득표수 집계는 단 한 표의 오차도 없이 매우 정확해야 하므로, 를 이용 하는 추정량을 사용할 경우 자칫 문제가 생길 수도 있다. Ⅲ. 추정량의 통계적 특성 이 절에서는 관심 지역 가 특정 지역으로 고정되어 있는 경우만을 고려하여 모든 표 기법에서 첨자 를 생략하기로 한다. 또한 후보자를 A, B, C 세 명의 경우로 한정하지 않고 와 같이 명의 후보자가 출마했다고 가정하기로 한다. 아울러 각 후보자별로 출구조사 결과 얻은 표본 지지자수는 로 나타내기로 한다. 또한 관심시점 가 특정시점으로 고정되어 있다고 보아 시점을 의미하는 첨자 t 를 굳이 표현할 필요가 없는 경우에는 나 대신에 나 로 표기하기로 한다. 모집단은 명의 투표자로 구성되고, 각 투표자가 투표한 후보자는 이다. 이때 선거와 그에 따른 개표의 목적은 각 후보자별 최종득표수를 알아내는 것인 데 식으로 표현하면 다음과 같다.

148 조사연구 여기서 이며, 이다. 한편, 최종득표율 또한 관심 있는 모수로 서, 로 나타낼 수 있다. 출구조사와 개표의 목적은 최종득표수 또는 최종득표율 을 알아내는 것이다. 출구조사에 의하여 얻은 표본의 정보 와 개표가 시작된 지 일정 시간이 경과된 후의 후보별 득표수 는 다변량 초기하분포 (multivariate hyper-geometric distribution)나 다항분포(multinomial distribution) 모형 으로 설명될 수 있다. 다변량 초기하분포의 공액사전분포는 통합 다변량 초기하분포 (unified multivariate hyper-geometric distribution)나 폴리야분포(Pólya distribution) 인 반면, 다항분포의 공액사전분포는 디리쉬리분포(Dirichlet distribution)이다. 다변량 초기하분포와 다항분포에 대한 자세한 사항은 Steck & Zimmer(1968)과 Janardan(1976) 를 참조하면 된다. 다변량 초기하분포 모형과 다항분포 모형 각각에서 얻은 사후분포의 유사성에 대해서는 Tuly et al.(2009)가 다룬 바 있다. 먼저 추정량 를 살펴보자. 이 추정량은 베이지안 추론법 관 점에서 디리쉬리분포를 사전분포로 갖는 다항분포 모형 아래에서 사후분포의 평균이 된 다. 아울러 는 다항분포 모형에서 모수 의 최대우도추정량(maximum likelihood estimator)이기도 하다. 복원표본을 가정하는 다항분포 아래에서나 비복원표본을 가정하 는 초기하분포 아래에서나 모비율 에 대한 최대우도추정량은 동일하게 이다. 먼저 모수 에 대한 사전분포로, 를 모수로 갖는 디 리쉬리분포 를 가정하자. 다음으로 출구조사에서 조사된 후보자별 표본 득표수 와 개표에 의하여 얻게 되는 후보자별 득표수 를 각각 다항분포로 가정하자. 이 경우 개표직전 출구조사에 의한 정보가 통합된 상태에서의 사 후분포는 가 되고, 개표가 이루어진 이후의 사후분포는 가 된다. 즉,,,

선거 개표방송에서 출구조사 자료를 활용한 중간 득표율 추정에 관한 연구 149 라고 가정하면, 그 사후분포는 가 된다. 따라서 사후분포의 평균은 가 된다. 여기 에서 이다. 사전분포 를 가정할 때는 분포에 의하여 정의된 확률의 합이 1이 되는 정상적 인 분포가 되기 위하여, 가 만족되어야 하나, 사후분포가 정상 적인 분포가 되도록 하는 조건만을 고려하는 경우, 이 기만 하면 충분하다. 만일 이라고 하면 이다. 실제 개표과정이 유한모집단에 대한 비복원 추출과정이라는 점을 고려하여 이번에는 출구조사에서의 표본 득표수 와 개표에 의한 득표수 의 분포를 다항분포가 아닌 다변량 초기하분포로 가정하는 경우를 생각해 보자. 이때의 사 후분포는 다음과 같이 나타낼 수 있다. 이고 라 하면, 이 경우 j 번째 후보자의 득표수에 대한 사후추정량을 계산하면 다음과 같다. 여기서 이다. 또한 인 경우 이 되고 (개표가 거의 완료)이면 이 된다. 사후추정량 은 사전정보(출구조사)와 표본정보(개표 결과)의 가중평균의 형태로 전통적인 베이지안 추론의 결과와 일치한다. 여기서 가 0에 접근하면 사후추정량은 출구조사의 결과와 일치하게 되고, 가 1에 근사하면 개표 결과와 일치하게 된다. 한편 사후추정량의 분산을 유도하면 다음과 같다.

150 조사연구 여기서,, 이다. 만일 ( ) 라 하면, 는 출구조사에서 얻은 비율에 따라 과 같다., 즉 인 경우, 으로 개표에 의해 얻은 결 과가 전혀 반영되지 않고 출구조사의 결과만을 계속 집계하는 경우가 된다. 반면 가 매우 커지면 커질수록 는 에 수렴하고 결국, 이 된다. 개표된 부분에 대하여는 개표결과를 반영하되 개표되지 않은 부분에 대하여는 출구조사의 결과가 나타날 것으로 예측하는 방법이다. 인 경우 은 0이 되는 반면, 가 매우 커짐에 따라 증가하여 로 수렴한다. 라 할 때, 인 경우 인 것은 사전확률에 대한 믿음이 너무 강하여 개표결과가 추정값에 반영되지 않는 경우에 해당하는 것으로, 바람직하지 않은 사전확률이 주어진 경우라고 할 수 있다. 사전확률의 영향은 가능한 배제하는 방향 으로 사전확률이 설정되어야 하므로 는 가능한 한 크게 잡는 것이 바람직하다. 또한 위의 결과는 가 일단 한번 결정되면 바뀔 수 없다는 가정 하에서 사전확률분 포의 모수를 라고 설정하고 득표수와 득표율 예측을 집계하는 방법이다. 그러 나 본 연구에서 논의되고 있는 선거개표에서 득표수 집계 문제는 득표수가 집계되어 감 에 따라 개표에 의하여 증가된 정보를 근거로 사전정보를 설정하고 위의 과정을 반복할 수 있는 경우에 해당한다. 그러므로 위에서 얻은 결과를 단순하게 그냥 사용하는 것보다 는 개표된 정보에 의하여 사전확률분포를 바꿀 수 있게 한 후 이 사전확률에 의해 득표수 와 득표율을 예측하게 하는 것이 더욱 합리적이다. 출구조사에 의한 정보 과 개표에 의한 득표수 정보 가 주어지는 경우 나머지 미개 표 투표함에서의 득표율에 대한 추정은, 앞서 언급한 바와 같이 다항분포를 가정한 베이

선거 개표방송에서 출구조사 자료를 활용한 중간 득표율 추정에 관한 연구 151 지안 추론법이나 최대우도추정법에서 동일하게 로 주어지는 점 에 착안하여, 사전확률모수를 가 이라고 하기보다, 혹은 이를 일반화 하여 적당한 상수 에 대하여 라고 설정하여 하는 것 이 바람직하다. 즉 매우 큰 에 대하여 라 하자. 그러면 예상득표수는 (1) 이 되고, 특정 지역 에서의 득표율 는 가 된다. 앞서 언급한 바와 같이 베이지안 통계량은 출구조사(사전정보)와 개표결과(표 본정보)의 가중평균 형태를 띤다. 즉 (1)식의 둘째 항은 일 때 출구조사와 개표결과 가 혼합된 형태가 되므로, 추정량은 가중평균의 형태가 되는 것이다. 지역 에 각각 표가 개표된 경우, 전체 득표수 추정량은 다음과 같이 표현된다. 위와 같은 설정에서 이 매우 크면 단순집계방식과 동일해지고, 이 0인 경우는 앞서 언급한 사후분포의 평균과 정확하게 일치한다. 값을 어떻게 선정하는 것이 좋은지에 대 해 검토해 보았으나 특별한 기준을 발견하기 어려웠다. 다만 이 큰 경우 개표되는 값에 영향을 많이 받아 짧은 주기의 변동이 반영되는 반면, 이 작은 경우는 곡선의 변동이 보다 부드러운 형태를 보인다는 것을 관찰할 수 있다. Ⅳ. 모의 실험 2010년 6월2일 실시된 서울시장선거에서의 최종 개표결과를 이용하여 모의실험을 수 행하였다. 실제 6.2 서울지방선거 개표상황과 비슷하도록 25개 각 구별 개표진행 속도를

152 조사연구 다르게 한 후, 출구조사 정보와 개표정보를 통합하여 득표수와 득표율을 집계하는 방법 들을 비교하기로 한다. 이 모의실험에서는 단순집계방식과 을 이용한 집계 방법을 시 간의 진행에 따라 비교한다. 실험의 단순화를 위하여, 오세훈과 한명숙 후보 이외의 후 보자들에게 투표된 표는 모두 기타로 분류하였다. 실제 개표진행 상황에 대한 자세한 자료가 없는 까닭에 최종 득표수 결과를 근거로 시뮬레이션에 의하여 개표진행 모습을 재현하고, 그때 집계방법에 따라 그 차이가 어떻 게 나타나는지를 확인하였다. 서울 25개 각 구에서 확률적으로 약간의 차이를 갖는 속도 로 개표가 진행된다고 가정하였고, 서초 강남 지역의 개표가 개표개시 2시간 후에 1시 간 동안 일시 정지된 상황을 가정하였다. 지난 6월 2일 실제 이와 같은 개표 지체가 발생 하였다. 출구조사에 대한 정보를 참고하여, 출구조사 전체 응답자 약 13만 명에 대한 응답을 가상적으로 생성한 이후, 단순비례추출방법에 따라 투표자가 많은 지역에 많은 출구조사 표본을 할당하고, 최종득표율을 모수로 갖는 다항분포를 가정하여 모의 출구조사 표본을 생성하였다. <그림 1> 개표 집계 방법에 따른, 선두 후보간 표차이 집계 모의실험 결과

선거 개표방송에서 출구조사 자료를 활용한 중간 득표율 추정에 관한 연구 153 <그림 1>은 개표진행 경과에 따라 을 계산한 후 이로부터 득표수를 집계하는 경우 의 진행과정을 보여 주고 있다. 그림에서 실선은 실제 득표수에서 1위 후보와 2위 후보 의 득표수 차이를 보여 주고 있다. 반면 점선은 인 경우와 인 경우 각각 에 대한 을 계산한 후, 그로부터 득표수를 계산한 값을 나타낸다. 인 경우는 굵 은 점선으로 나타나 있고, 인 경우는 가는 점선으로 나타나 있다. <그림 1>에서 두 점선 간에는 큰 차이가 나타나지 않으나, 두 점선과 실선 사이에는 상당한 차이가 나타나고 있다. 단순 집계방식을 나타내는 실선을 보면, 개표개시 후 200 분 경과 시점부터 300분에 이르는 시기에 1위 후보가 2위 후보에 비하여 5,000표 이상 뒤지는 것으로 나타났으나, 베이지안 추정방식에 의해 계산된 점선에서는 180분이 경과 된 시점에서 잠시 동안만 1위 후보가 2위 후보에 비하여 약간 뒤지다가 이내 1위를 달리 는 것을 관찰할 수 있다. 이는 개표 결과뿐 아니라 출구조사 결과를 동시에 고려하여 추 정하는 베이지안 추정법이 단순 집계방식보다 개표과정에서 생기는 혼란을 줄이는 데 유 용하다는 것을 나타낸다. Ⅴ. 맺음말 동일한 선거구에서 투표소별로 후보자들에 대한 지지 양상이 극명하게 다를 경우, 개 표방송에서 시간대별 득표율 순위는 투표소별 개표 진도에 민감한 영향을 받는다. 실제 2010년 서울시장선거 개표방송에서 이런 상황이 나타나 혼란을 겪은 바 있다. 본 연구에 서는 개표가 진행되는 상황에서 보다 정확한 득표수 집계를 하기 위해 출구조사 정보를 사전분포로 활용하는 베이지안 추정법을 제시하였으며, 모의실험을 통해 새로운 추정법 의 효용성을 보이기도 했다. 일부 방송사에서는 구체적인 방법론은 다를지언정 본 연구에서 제기하는 문제를 인식 하고 나름의 검토를 한 것으로 보인다. 하지만 이 문제를 공론화하여 보다 이론적이고 체계적인 해결책을 모색하고자 하는 시도는 부족하였다. 개표가 진행되는 상황에서 개표 결과와 출구조사 결과를 결합하는 문제를 통계적인 이론의 틀로 담아 공론화하였다는 점 이 본 연구가 지니는 의의라고 할 것이다.

154 조사연구 본 연구에서는 순수하게 통계이론적인 입장에서 보다 효과적인 추정법을 제시하는 데 관심을 두었다. 그러나 선거 개표방송에서 득표수 추정의 문제는 단순히 통계적인 문제 의 틀을 벗어나 정치적으로 민감한 영향을 끼칠 수 있는 문제일 수 있다. 또한 방송사에 서 충분한 사전 설명 없이 이 방법을 사용할 경우 기존의 개표방식에 익숙한 개표방송 시청자들에게 오히려 또 다른 혼선을 불러일으킬 수도 있다. 그러므로 본 연구에서 제안 한 방법을 실제로 적용하기 위해서는 충분한 현장 시험과 시청자 홍보를 거쳐야 할 것이 다. 참고문헌 김대영. 2010. KEP(Korea Election Pool) 평가와 과제. 방송문화 2010년 6월호: 28-33. 한국방송협회. 2010. 2010 지방선거 방송사 공동 예측조사위원회 백서. 김희연. 2008. 선거개표방송을 위한 당선 확률 예측. 고려대학교 석사학위논문. Steck, G.P. and W.J. Zimmer. 1968. The Relationship Between Neyman and Bayes Confidence Intervals for the Hypergeometric Parameter. Technometrics 10: 199-203. Janardan, K.G. 1976. Certain Estimation Problems for Multivariate Hypergeometric Models. Annals of Institute of Statistical Mathematics 28(Part A): 429-444. Tuyl, F., R. Gerlach and K. Mengersen. 2009. Posterior Predictive Arguments in Favor of the Bayes-Laplace Prior as the Consensus Prior for Binomial and Multinomial Parameters. Bayesian Analysis 4: 151-158. <접수 2011/1/31, 수정 2011/2/25, 게재확정 2011/2/28>