CHAPTER 3 조사방법및표본추출방법 설문조사방법과 2 장의설문지작성방법은밀접한관계가있다. 우편조사의경우문항설명이다소길고전문적인내용이포함되어있어도무방하나전화조사의경우문항개수, 지문길이, 보기수등은짧아야한다. 적절한표본을추출방법 (SRS, Systematic, Clustering, Stratified) 과설문조사방법은밀접한관계가있다. 예를들어, 전화조사 (poll) 는층화-계통추출법을사용하게되고방문조사를실시한다면층화추출방법을사용하게된다. 또다른예를살펴보자. ΟΟ 백화점고객만족도조사를위하여일대일면접조사를실시한다면계통추출방법 ( 예상일일고객수를표본수로나누어찾는고객순번과일치하는사람들을선택, 예상고객 =1,000 명, 표본수 =100 인경우 3 번째고객, 13 번째고객, 23 번째고객 ) 을사용하고고객리스트를표본프레임으로이용한다면연령, 직업을이용하여층화추출법을이용해표본을뽑은후우편조사를실시하면된다. 3.1. 설문조사방법 설문자료수집방법으로는면접조사, 전화조사, 우편조사, 면접조사, 응답자설문기입법, 온라인조사등이있다. 어떤방법을사용할것인지는연구목적, 조사내용, 조사대상, 소요시간및비용, 응답률, 응답민감도등을고려하여결정하여야한다.
38 Chapter 3. 조사방법및표본추출방법 3.1.1. 누가설문지를기입하느냐에따른분류 (1) 응답자자기기입방식 (self administrated survey) 대부분의설문조사는응답자가자기의견을직접기입하는응답자자기기입방식을채택하고있다. 응답자가혼자스스로설문지에응답하는방법으로조사원이옆에있을수는있으나응답자의조사과정을관리감독할뿐이지설문응답에는관여하지않는다. 그러므로응답자의응답능력이높은경우사용하게되며응답대상자들이문맹, 문항에대한이해능력이떨어지거나응답기입능력이낮은노인이나어린이들에게는사용할수없다. 1일대일감독 (one-to-one supervision): ( 예 )Computer Assist Personal Interview, Computer Assist Self-administrated Interview 등컴퓨터이용설문조사 ( 한번에한명의응답자 ), IQ 검사 2그룹감독 (group administration): ( 예 ) 학기말에실시하는강의평가, CAPI, CASI 등컴퓨터이용설문조사 ( 한번에여러응답자동시에 ) 이외에도 ARS 이용한여론조사, 인터넷조사, 우편조사도자기기입식설문에해당된다. (2) 조사원기입 (interviewer survey) 조사원이응답자를도와설문지에응답을직접적어주는방법으로조사원의외모, 말씨, 태도등이응답결과에큰영향을미친다. 1전화조사 (telephone survey) 조사원이전화를통해응답자의의견을들은후설문조사지에적어넣는다. 2조사원기입면접조사 (personal interview) 조사원이응답자를직접방문하여일대일로만나응답자의답변을설문지에옮겨적는방법이다. 3.1.2. 조사방법에따른분류 (1) 면접조사 조사자가직접응답자를방문하여조사하는것으로조사원의영향이크다. 설문지는조사 자가작성할수도있고응답자가직접응답할수도있다. 조사원은 1 응답할수있는분
3.1. 설문조사방법 39 위기를조성하고 ( 사용하는언어, 복장, 외모 ) 2응답자가의견을솔직히밝힐수있는환경을조성하고 3설문지내용을완벽하게이해하고있어야하며 4응답환경을기록하는등성실성이있어야한다. 면접조사의장점은다음과같다. 1응답률이높다. 2응답자가이해하지못하는문항에대한묻는경우즉각적인설명이가능하여신뢰성높은응답을얻어낸다. 3조사자가응답자의신뢰도, 응답환경등을관찰할수있다. 면접조사의단점은다음과같다. 1조사원영향이크다. 2시간및비용면에서비효율적이다. 면접조사가운데응답자를한곳에모아놓고한번에조사하는집단조사가있다. 비용및시간을절약하는장점은있으나집단상황이응답을왜곡시킬수있고 ( 평에있는사람들과의견이나생각교환 ) 설문조사과정을통제하는데어려움이있다. (2) 전화조사여론조사와같이응답자표본프레임이매우큰경우주로사용한다. 주로전화와조사원에의해실시되고있으나요즈음컴퓨터가모든과정을관리하는 CATI (Computer Assisted Telephone Interview) 가이용되기도한다. RDD(Random Digital Dialing) 시스템에의해전화가걸리면교육받은조사원들이설문을하게된다. 전화조사의장점은다음과같다. 1신속성및조사비용절약 2넓은지역조사가능 3조사자관리가쉽다.
40 Chapter 3. 조사방법및표본추출방법 전화조사의단점은다음과같다. 1질문길이와내용의제한 ( 응답자신분노출로인하여 ) 2표본의대표성유지가어렵다. ( 인구학적변수비율을맞추기어렵다 ) 3우편조사보다다소높지만응답률이낮다. 4그림이나시각적도표가들어간설문문항은물을수없다. (3) 우편조사패널이구성되어있거나학회와같이주소리스트가있는집단이나대규모아파트단지입주자대상설문조사에이용된다. 질문지를반송봉투와함께넣어우편으로보내거나아파트와같은주거밀집지역에서는직접방문하여우편함에넣는다. 우편조사의장점은다음과같다. 1최소의비용과노력으로광범위조사가능 2문항이많거나전문적인문항이포함된설문조사가능 3응답자가충분한시간을가지고응답할수있고자발적응답이라응답의신뢰성이높다. 단점은다음과같다. 1회수율 ( 응답률 ) 이낮고 (25%) 2응답자가문항에대한의문이생길경우질문할곳이없다는것이다. 우편조사의가장큰문제는응답률을높이는것이다. 우편조사의응답률은조사기관의신뢰도, 설문지양식및우송방법, 그리고응답자가집단성향 ( 예 : 전문가집단 ) 에의존한다. Dillman & Christenson(1974) 연구에의하면다음절차를따르면우편조사응답률을높일수있다. 1일주일전에설문조사발송을알리는엽서보냄 2반송봉투와함께설문지발송 3일주일후설문조사환기우편발송
3.1. 설문조사방법 41 43 주일후응답하지않은응답자에게설문재발송 57 주후응답하지않은사람들대상으로재조사. (4) 온라인조사전자메일 (e-mail) 이나인터넷 (Web-based) 을이용한설문조사를의미한다. 단기간에저렴한비용으로조사할수있다는장점은있으나조사모집단규정 ( 표본프레임, 컴퓨터사용자, 웹사용자만모집단 ) 및표본의대표성 ( 관심집단만설문에응한다 ) 문제, 한사람이여러번응답 (IP 체크에도한계가있다 ) 로인하여신뢰할만한조사는아니다. 온라인조사는포탈사이트사용자 DB 를이용하거나패널을구성하여운영하면온라인조사의신뢰성을높일수있을것이다. 또한설문조사할때마다점수를부여하여누적점수에의해선물을제공하게되면응답률도높일수있다. 요즈음방송국에서도자주이용하는 ARS (Advanced Record System) 조사도온라인조사의일종인데문항이한개, 흥미위주조사 ( 가요순위, 토론중여론조사 ) 에주로이용된다. 방법내용비용시간회수 설문 내용 응답자 속성 Comment 일대일 면접조사 조사원이응답자를 직접방문하여조사 X O 주관식 객관식 호의적 조사과정발생하는모든 상황에대처가능하나조 사원의영향이크다. 전화조사 전화조사 ( 주로 RDD 방법 ) O 문항수가 적고 객관식 호의적 넓은지역응답가능하나 신분노출에대한거부감 우편조사 패널이나주소리스 트가가능한집단 대상 X X 주관식 전문적 내용 전문가 회수율을높일수있는 방안이있어야한다. 온라인 인터넷이나전자메 일시스템이용 O O 주관식 객관식 관심 패널이나고객 DB 사용 관심집단만응답해왜곡
42 Chapter 3. 조사방법및표본추출방법 3.2. 표본추출방법 대부분조사연구는모집단전체에대한전수조사 (census) 보다는시간적, 경제면에서유리한표본조사 (sampling survey) 를실시한다. 모집단 ( 표본프레임 ) 구성원중실제설문에응답하는사람들을표본이라하고, 표본을추출하는과정을표본추출 (sampling) 이라한다. 전수조사가표본조사보다모집단의참값 ( 모수 ) 을항상더정확하게알수있는것은아니다. 전수조사의경우표본오차는발생하지않으나시간이오래걸려응답성향의변화가생길수있고많은조사원이필요하므로조사원이영향이커지므로비확률오차가커지게된다. 표본조사에서가장중요한것은모집단을잘대표할수있는표본을추출하는적절한방법을선택하는것이다. 다음은잘못된표본조사의예이다. 네티즌 55% 미국영화안볼것 <2002.03.13( 수 )21:12> 동계올림픽쇼트트랙편파판정시비이후미국영화를보지않겠다는네티즌들이절반을넘는것으로조사됐다. 티켓예매사이트티켓링크가지난달 28일부터 9일까지이용자 1994명에게미국영화관람의사를물어본결과전체응답자의 55% 가미국영화관람에부정적인태도를나타냈다. 이가운데 724명 (36.3%) 은 이번기회에확실한의지를보여줘야한다 면서미국영화관람거부운동에적극동참할뜻을비쳤고 391명 (19.6%) 은 미국이정신차릴때까지당분간미국영화를보지않겠다 고대답했다. 반면에 663명 (33.3%) 은 영화는영화일뿐평소처럼보겠다 는입장을보였다. 이런온라인조사에서는관심집단만주로응답하게되어표본이모집단의속성을제대로반영할수없으므로 ( 국민전체의의견이라보기어렵다 ) 조사가왜곡될가능성이매우높다. 즉설문에참여한응답자 ( 표본 ) 는전체사람들의축소판이라고보기어렵다. 이런표본을편기 (bias) 있는표본이라한다. 다음은그기사의끝부분이다. 한편서울극장가에서는쇼트트랙 1500M 결승경기직후인 2월 23일 ~24일미국영화 뷰티풀마인드 가박스오피스 1위에올랐으며그뒤로도할리우드스타가대거출연한 오션스일레븐 이정상을질주하고있다.
3.2. 표본추출방법 43 3.2.1. 통계용어 (glossary) 모집단 (population) 조사자가정보를얻기원하는대상전체를의미한다. 대통령후보지지율에대한여론조사의경우모집단은대한민국유권자전체이다. 대학교학생학교만족도조사의경우모집단은 2004 년현재등록학생이모집단이다. 표본프레임 (sampling frame) 모집단전체응답자와그것을구별할수있는 ID 리스트를표본프레임이라한다. 학생명부, 주민등록명부가그예이다. 표본프레임이갖추어야할요소는다음과같다. 1포괄성표본프레임이조사가능대상을대부분포함하고있어야한다. 2추출확률모집단구성원이표본으로추출될확률이동일해야한다. 3효율성조사자가조사되길원하는사람들만으로표본프레임을구성한다. 모수 (parameter) 모집단의특성을나타내는값을모수라한다. 여론조사에서유권자전체후보자지지율이모수이다. 표본 (sample) 모집단의일부로설문을위해선택된응답자를말한다. 여론조사에서전체유권자중전화조사에선택된 1,500 명응답자가표본이다. 대학교학생학교만족도조사를위하여 200 명을뽑았다면이들이표본이다. 통계량 (statistic) 모수를추정하기위하여표본으로부터계산된값을통계량이라한다. 정책에대한지지율을알아보기위하여전화여론조사를실시하였다고하자. 이런경우에는 정책의지지율이모수가되고 1600 명응답자중 600 명이정책을지지하였다고가정하면 0.4 가통계량이된다. 통계량은모수를추정하기위하여사용된다.
44 Chapter 3. 조사방법및표본추출방법 (1) 표본프레임 (sampling frame) 표본프레임은설문조사대상이되는전체응답자와그응답자를구별할수있는 ID 리스트를표본프레임이라한다. 목표모집단이라고불리는표본프레임은 연구자가잠정적으로그의연구에적용하기위하여가정한이론적집단 이다. (Sjoberg&Nett; 1968). 표본프레임은연구자의조사계획에따라정의되며 ID 와응답자와는일대일대응관계가있어야한다. 대학교학생들을대상으로만족도조사를하는경우 2004 년 1학기등록한학생들의이름과그들의학번이 ( 혹은주민번호 ) 있는리스트나학생이름과일련번호가매겨진리스트가표본프레임이된다. 성폭력피해자실태조사와같이모집단규정이불가능하여표본프레임이존재하지않거나표본프레임이존재하더라도실제조사에서표본응답자들을선택할때표본프레임으로이용하는것은여러이유로어려움이있는경우가빈번히발생한다. 1여론조사의경우어떤표본프레임을사용할것인가? 주민등록대장사용 : 공공기관의조사가아니면사생활보호차원에서얻기어렵고얻을수있더라도표본으로추출된사람에한정하면조사비용시간이많이소요된다. 전화나전기사용자 : 전화번호나 ( 전화보급률이거의 100% 이고조사가간편하다 ) 전기사용명부를이용할수있으나하나의번호 (ID) 에다수의사람들이있으므로조사기관마다자체선택기준이있다. 인터넷조사 : 표본프레임이특정집단에한정되는문제가발생한다. 2한남대학교학생들의학교만족도조사 학생이름과 ID 가있는리스트를표본프레임으로한다. 적절한표본추출방법에의해통계학과 9733001 학생이표본추출되었다고하자. 그학생을찾아가설문을받는것은시간적, 경제적으로효율적이지못하다. 단과대학별로 1~2 개학과를선택하고각학과전공수업시간을이용하거나학생들의출입이많은정문에서설문조사를하면된다. 도서관이나휴게실같은공간은대표성있는표본을추출하지못할가능성이높으므로피하는것이좋다.
3.2. 표본추출방법 45 (2) 전수조사와 (census) 표본조사모집단전체를조사하는 ( 설문 ) 조사를 census( 전수조사, 총조사 ) 라한다. 전수조사는비용이많이들고시간이오래걸리므로정부가국가적인차원에서주로실시한다. 인구센서스, 광공업총조사가그예이다. 우리나라에서는 5년마다한번씩실시한다. 정부이외의다른기관에서는모집단전체를조사하는것은비용이나시간면에서효율적인방법이아니므로모집단의일부만을조사하는표본조사를실시한다. 표본조사를실시하기위해서는모집단전체에대한정보가있어야하는데이를표본프레임이라한다. 이표본프레임으로부터원하는수의표본응답자를선택하는방법을표본추출방법이라한다. 3.2.2. 표본조사오차 모수와표본으로부터계산된추정치가차이 ( 편차 ) 가발생하는이유는 1잘못된표본추출방법 2표본오차 3비표본오차때문이다. 2와 3을표본조사오차라한다. (1)random sampling error ( 확률표본오차 ): 실제계산가능모집단전체를조사하지않고일부만조사하기때문에표본으로부터얻은추정치와모집단의참값사이에발생하는차이를확률표본오차라한다. 이를허용오차, 혹은오차한계라고도한다. 모집단의일부인표본으로부터얻은결과와모집단의정보와차이를넓은의미의표본오차라한다. 이오차는모집단의응답자가표본프레임작성시 ( 혹은모집단고려시 ) 제외되어표본에포함될가능성이없어짐으로써발생하는오류도이에해당되지만이는계산불가능하다. 그러므로표본오차라함은계산가능한확률표본오차를의미한다. 표본오차는표본의크기 n 을크게하면줄어든다. 다음은 SRS 방법사용한경우확률 표본오차는 1.96 0.5 2 / n ( 신뢰수준 95%, n = 표본응답자 ) 이다. 표본오차는표본의크기를늘리면줄일수있으나비용과시간이증가하고조사업무의과중으로인하여비표본오차가발생할가능성이커진다. 비표본오차를줄이려면조사자가조사전과정을스크린하면서오류가발생하지않고정확한조사가되도록하는노력이필요하다.
46 Chapter 3. 조사방법및표본추출방법 (2)non-sampling error ( 비표본오차 ) 비표본오차가발생하는이유는다양하다. 1절차오차 (processing error): 조사원들의불성실이나외형적인영향, 응답자의무성의한응답, 적절하지못한조사방법 ( 예 : 일대일면접, 우편조사, 전화조사 ) 선택이나조사과정의고의적비고의적실수, 자료컴퓨터입력시발생하는오류등조사과정에서발생하는오류이다. 절차오차는조사자가충분히조심한다면줄일수있다. 2무응답 (non-response) 이문제이다. 응답하는자체를싫어하는지답하기꺼려하지않았는지알방법이없다. 그러므로유사한인구학적특성을가진응답자들의응답결과를이용하여보정한다. 여론조사기관은이에대한 know-how 를가지고있다. 3응답오차 : 타인에게드러나기꺼려하는문항에 ( 예 : IQ, 소득 ) 대해서는높여응답할가능성이있는데이를응답오차라한다. 응답오차를줄이기위해서는조사과정에서응답자가비밀을보장받는다고느낄수있도록조사원이멀리떨어져있거나설문지를본인이직접박스함에넣게하는방법이있을이용한다. 3.2.3. 표본의크기결정 국민전체대상전화조사경우와같이모집단의크기가매우큰경우설문조사의표본 크기결정공식은다음과같다. 표본 오차 = z.5 / n (SRS 표본추출시표본오차 ) 로부터 α / 2 0 2 n = ( 표본 2 2 z α / 2 0.5 2 오차) 신뢰수준이 90% 이면 z α / 2= 1. 645, 95% 이면 z α / 2= 1. 96, 99% 이면 zα / 2= 2. 54 이다. 신뢰수준 95% 하에서표본오차가 2.5% 정도가되려면 ( 대부분여론조사기관이이를사용 ) 표본의크기는 1,500 명 ~1,600 명수준이다. 모집단의크기가아주크지않은경우표본의크기는얼마로하는것이좋은가? 모집단전 체의크기를 N이라하면적절한표본의크기는이공식 n = ( 표본 z 2 α / 2 2 오차) 0.5 + z 2 2 α / 2 (0.5) 2 에 / N 의해결정된다. 일반적으로모집단크기의 10% 나 200~300 을표본의크기로사용한다. 만 약여론조사가아닌경우에는 0.5 대신모집단의표준편차 ( σ : 알고있다고가정하면 ) 나 분포가균일분포인경우에는 0.29R ( R 은범위 ), 좌우대칭이면 0.24R, 치우친분포인경우
3.2. 표본추출방법 47 에는 0.21R 을사용하면된다. 즉일반선택문항선택분포가균일하면 2 2 / 2 (0.29R) 2 표본오차) z n = α, 만족도문항과같이좌우대칭인문항은 ( 면된다. 2 2 / 2 (0.24R) 2 표본오차) z n = α 을사용하 ( 다음은모집단의크기, 신뢰수준, 표본오차에따른표본크기를정리한표이다. 모집단의크기 (N) 표본의크기 95% 신뢰수준 99% 신뢰수준 ± 3% ± 5% ± 10% ± 3% ± 5% ± 10% 500 250 218 81 250 250 125 1,000 500 278 88 500 399 143 1,500 624 306 91 750 460 150 2,000 696 323 92 959 498 154 3,000 788 341 94 1,142 544 158 5,000 880 357 95 1,347 586 161 10,000 965 370 96 1,556 622 164 20,000 1,014 377 96 1,687 642 165 50,000 1,045 382 96 1,777 655 166 100,000 1,058 383 96 1,809 659 166 3.2.4. 표본추출방법 ( 확률적추출방법 ) 모집단전체를조사하는것은일반적으로시간적, 경제적인면에서비효율적일뿐아니라 불가능하므로모집단의일부, 즉표본에 (sample) 대한자료를수집하여모집단전체의정 보를얻게된다. 그럼어떤방법으로모집단과유사한표본을얻을수있을까?
48 Chapter 3. 조사방법및표본추출방법 대학교학생학교만족도조사를위하여 200 명의응답자를뽑으려한다고하자. 학적부를표본프레임으로하고각학생들이표본으로선택될확률이동일한바방법을사용하면좋은표본을뽑게될것이다. 이를확률적표본추출방법이라 (probabilistic sampling method) 하며 SRS, Systematic, Clustering, Stratified 방법등이있다. 학적부를이용할수없어표본응답자를얻기위하여도서관이나오정못근처에서조사를한다면한남대학교학생을대표하는표본을얻을수없을것이고많은학생들이표본으로추출될가능성이없게 ( 그러므로각학생의추출확률이동일하지않다 ) 된다. 이런추출방법을비확률추출법 (non-probabilistic) 이라하고편리추출방법 (convenience sampling method), Snowball 추출방법, 할당 (Quota) 추출방법, 목적 (purposive) 추출방법등이있다. (1)SRS (Simple Random Sampling: 단순임의추출 ) 표본프레임에임의의수를부여하고난수표를이용하여표본을뽑는방법이다. 난수표는 0-9 까지의숫자를늘어놓은것으로 1) 표의어떤위치든 0-9 가있을확률은같고 2) 한위치의숫자가다른위치의숫자에영향을미치지않도록만든표로형태는다음과같다. Random digits 19223 95034 05756 28713 96409 12531 42544 73676 47150 99400 01927 27754 42648 82425 45467 71709 77558 00095 32863 29485 82226 52711 38889 93074 60227 40011 85848 48767 95592 94007 69971 91481 60779 53791 17297 68417 55013 15529 72765 85089 57067 50211 82739 57890 20807 47511 81676 55300 94383 60940 72024 17868 24943 61790 90656 87964 36009 19365 15412 39638 85453 46816 83485 표본프레임의총응답자수가 2 자리이면표의아무곳이나시작하여두자리씩끊어차 례로읽으면된다. 총가능응답자가 900 명이면세자리씩읽으면된다. 만약표의끝에 도달하면표의 1 행 1 열부터시작하거나다음페이지의표로넘어가면된다. SRS 방법은
3.2. 표본추출방법 49 모집단의각개체 ( 응답자가 ) 가선택될가능성이모두같다는가정하에서표본을추출하는방법이므로가장이상적인방법이다. 대학교학생 (12,000 명 ) 고객만족도조사를위하여 200 명을 SRS 방법으로뽑는다고하자. 표본프레임은학생들의이름과각학생에게는 1-12000 ID 가부여된리스트가있다고하자. 난수표에서임의의곳을지정한후 ID 가 12000 까지있으니 5 자리숫자씩읽으면된다. 예를들어 5 행 3 열부터시작한다면 59294( 없으니뛰어넘기 ), 00769 (769 학생선택 ), 97191( 뛰어넘기 ), 48160( 뛰어넘기 ) [ 참고 ] 엑셀을이용한난수생성 200: 표본의크기 12000: 모집단크기 Seed: 임의의수
50 Chapter 3. 조사방법및표본추출방법 ID 708, 5090, 10671 학생을선택하면된다. 장점모집단을대표하는표본을뽑을수있다. 가장 ideal 한방법이다. 단점 1실제표본프레임을구하는것이불가능한경우가많다. 2표본응답자에게반드시해야하므로시간과비용이많이든다. 가장이상적인방법이지만표본프레임리스트가필요하므로현실적이지못해설문조사에서는거의이용되지않고실험계획법이나모집단크기가적어추출단위에일련번호부여가쉬운조사에이용된다. (2)Systematic sampling ( 계통추출법 ) SRS 방법과유사하지만 SRS 와는달리난수표를한번만이용한다. 1) 모집단전체에대한표본프레임이필요하고 2) 각응답자가표본으로뽑힐가능성이모두동일하다는점에서 SRS 방법과동일하지만난수를한번만이용한다는점에서다르다. 계통추출방법은표본추출방법은다음과같다. 1모집단전체응답자에일련번호를부여한다. 물론꼭연속번호일필요는없다. 2모집단의수를표본의수로나눈다. 그값을 K라하자. ( K = N / n ) 31 부터 K 까지의응답자중난수를이용하여한명을뽑고그다음부터는그난수에 K 씩더해가면서해당되는일련번호를뽑으면된다. 대학교학생 (12,000 명 ) 만족도조사를위하여표본을 200 명을계통추출방법으로뽑는다고하자. 12000/200=60 이므로 1-60 사이의임의의숫자를하나난수표로부터선택한다. 5 행 3열이라면 59 이므로 ID 59, 119(59+60), 179, -- 학생을표본추출하면된다.
3.2. 표본추출방법 51 장점 1모집단을대표하는표본을뽑을수있다. 2매번난수를찾는번거로움이없다. 단점 1실제표본프레임을구하는것이불가능한경우가많다. 2표본응답자에게반드시해야하므로시간과비용이많이든다. 3일련번호에따른체계적차이가존재하면조사가왜곡된다. 계통추출방법이이용되는예를들어보자. 백화점고객만족도백화점고객을대상으로만족도를조사하는경우백화점고객리스트 ( 카드회원 ) 를이용하여표본을얻을수있으나백화점앞에서조사하는경우표본을뽑을때이방법을사용한다. 조사일에예상고객인원은 5,000 명이고표본수를 200 명이라하면 25 번째, 50 번째, 75 번째, 고객을조사하면된다. 물론응답거절이나무응답으로인하여한-두번호오차는있을수있다. 전화조사전화번호선택시일정번호를건너뛰면한다. 예를들면 629-7622 이선택되면 (Random Digit Dialing) 629-7722, 629-7822, 이런식이다. 가정전화와회사전화번호가어느정도그룹화되어있는미국에서는이런방법이가능하다. 물론전화여론조사는층화추출 ( 지역적차이고려 )+ 계통추출방법이다. (3)Stratified sampling ( 층화추출법 ) 모집단을인구학적특성 ( 예 : 성별, 학년별, 직업별, 지역별 ) 에의해그룹화한후각그룹에서일정한크기의표본을선택하여전체표본을구성하는방법으로이그룹을층 (strata) 이라한다. 설문성향은차이가있으므로각그룹내의응답자들이일정한수만큼표본으로추출되어야한다. 1모집단을인구학적특성에의해분류한다. 모집단을응답성향이서로다를것이라생각되는인구학적변인을이용하여모집단을그룹 ( 층 ) 으로나눈다. 2각층에서표본을몇개나뽑을지는층을구성하는크기에따라결정한다. 3각그룹에배당된표본을추출하는데 SRS 방법이나계통추출방법을사용한다.
52 Chapter 3. 조사방법및표본추출방법 대학교학생 (12,000 명 ) 만족도조사를위하여 200 명을층화추출방법으로뽑는다고하자. 학교에대한학생만족도는학년별차이가있을것이라생각할수있으므로층을학년으로구성하면된다. 대학교학생들의학년별비율을조사하니 3:3:2:2 이다. 그러므로 1학년, 2 학년은 60 명, 3, 4 학년은각각 40 명을뽑으면된다. 각층 ( 학년 ) 에배당된표본의크기를뽑을때는 SRS 방법을사용한다. 1 학년이 360 명이므로 1학년에일련번호를부여한후난수를이용하여 60 명을선출하면된다. 다른학년들도동일한방법으로표본응답자를추출하면된다. 학교만족도에성별차이가있다고판단되면 대학교성비를조사한다. 55%( 남자 ): 45%( 여자 ) 라면 6,600 명남자중 110 명을, 5,400 명의여자중 90 명을선출하면된다. 물론각성에서표본을뽑을때는 SRS 방법이나계통추출방법을사용한다. 모집단을그룹화할때그룹을나누는변수를하나만사용할필요는없다. 그룹을나누는특성변수가 2개인경우 Two-stage(2 단계 ) 층화추출, 3 개이상인경우 Multi-stage ( 다단계 ) 층화추출이라한다. 예를들어성과학년모두를이용하여모집단을그룹화한다면우선성별에의해그룹을나누고각그룹을학년에의해다시그룹화하여 8개의그룹에대해표본을추출하면된다. 장점표본추출비용과시간을절약할수있다. 단점그룹화를위하여고려한특성에따라그룹간응답의차이가없다면조사비용이증가한다. ΟΟ기업에서사내직원만족도를조사한다고하자. 사원 ID 를이용하여 SRS 방법을사용할수있으나회사에대한만족도가직급별차이가존재할것이므로직급을층 ( 그룹 ) 으로하여층화추출방법을사용하는것이적절하다. 기업의규모가크면성별혹은입사연수를또다른층으로사용하여 Multi-stage 층화추출방법을사용하면된다. 전화여론조사의경우응답자들을지역에의해층화하고전화번호선택은계통추출방법을이용하게되므로층화-계통추출방법을이용하게된다. (4) Cluster sampling ( 군집추출법 ) 모집단을그룹화한다는면에서는층화추출방법과동일하지만그룹간에는응답의차이가없다는점이다르다. 군집추출법에서그룹은군집이라한다. 그룹간응답의차이는
3.2. 표본추출방법 53 없으므로한그룹이임의로선택되면 (SRS 방법 ) 그그룹에속한사람만을대상으로표본크기만큼추출하면된다. 1모집단을인구학적특성에의하여군집으로나눈다. 2난수에의해군집을임의로선택한다. 선택된군집에속한모든응답자를표본으로선택한다. 3만약그룹에속한응답자를모두뽑으면표본보다많은경우는 SRS 방법에의해군집에속한일부응답자만선택하면된다. 대학교학생 (12,000 명 ) 가족에대한의식조사를위하여표본을 200 명을군집추출방법으로뽑는다고하자. 가족에대한인식은단과대학별차이는없다는가정이적절하다면대학에 1-8 번번호를부여하고난수표를이용하여 8 개단과대학중한개를선택한다. 대학이 8개밖에안되므로종이에대학이름을적고그중하나를뽑아도된다. 경상대학이추출되었다면경상대학학생중 200 을 SRS 방법으로뽑으면된다. 장점 1추출비용과시간을절약할수있다. 2층화추출방법보다비용과시간을더줄일수있다. 단점나눈그룹간응답성향의차이가있다면조사결과가왜곡된다. ΟΟ 기업에서사내식당에대한만족도조사를위하여부서별식당이용의차이가없을거라는가설하에부서를임의로선택하여그부서직원전체를대상으로조사한다. (5) 어느방법을선택할것인가? SRS 방법은가장이상적인방법이지만표본프레임의작성이어렵고조사과정에서비용과시간이너무많이든다. 군집추출방법은비용이나시간면에서효율적인방법이지만응답성향의차이가없는군집을얻는것은현실적으로불가능한경우가많다. 현실적으로가장많이사용하는방법은층화추출방법이다. 각층 ( 그룹 ) 에할당된표본을뽑는경우 SRS 방법이나계통추출방법을사용하므로하나의추출법이단독으로사용되는것이아니라여러방법이결합되어사용된다.
54 Chapter 3. 조사방법및표본추출방법 (6) 한국갤럽연구소표본조사방법규모비례확률방법을사용하여전국 200 개지역을층화하고 ( 층화추출 ) 일련의계통추출방법으로가구내응답자를선택한다. 좀더상세히살펴보면표본추출은 4 단계로이루어진다. 16 개도시 ( 서울, 부산, 대구, 인천, 대전, 광주 ), 8 개도 ( 경기, 강원, 충남 북, 경남 북, 전남 북 ) 12 개층으로나누고도는시, 읍, 면으로나눈다. 26 개도시, 시, 읍, 면의모집단을배열한후동 ( 면은리 ) 을뽑는다. ( 계통추출 ) 이것이 1 차표본지역 (primary sampling location) 이다. 표본지역수는표본수에따라달라지나표본의크기가 1,500 이면 200 정도를얻는다. 3실질최종표본지역 (actual final sampling location) 인반 ( 부락 ) 이선택될때까지계통표본추출을반복한다. 반은 20 가구, 부락은 20-80 가구로구성한다. 4조사자가선정지역을직접방문하여주민명부에서 8 가구를임의선정한다. 응답자가 18 세이상인사람중생일이가장빠른사람을조사한다. 1 차방문시그사람을만나지못하는경우재방문한다. 전화조사의경우에는 2~3 단계를 RDD 가담당한다. 전화번호선택시계통추출방법이사용된다. 3.2.5. 비확률표본추출방법 (non-probabilistic sampling method) 앞절에서언급한확률적표본방법을적용하여표본을추출하려면다음이유로현실적인어려움에봉착하게된다. 표본프레임을작성할수없는경우 : 성폭력피해자실태조사 표본프레임을얻을수있어도조사비용이많이드는경우 : 표본으로추출된특정학생들의 ID 와이름리스트가일일이찾아다니며조사하는경우. 이런어려움을해결하는방법으로비확률적표본추출방법을사용하게된다. 비확률표본추출방법을사용할때는표본오차계산이불가능하다. (1)Convenience sampling ( 편리추출방법 ) 조사자가자신의편리한방법으로표본을얻는것을편리표본추출방법 (convenience sampling) 이라한다. 때로는우연추출방법 (incidental sampling) 이라고도한다. 편리추출
3.2. 표본추출방법 55 방법에서가장중요한것은객관적타당성을유지하는것이다. 예를들어 대학교학생학교만족도조사를위하여도서관에서만표본을추출하는경우보다는각단대입구에서조사한다면이조사는객관적타당성을갖는다. 편리추출방법은객관성만유지할수있다면가장유용한방법이다, (2)Snow-ball 방법성폭력피해자의실태조사, 에이즈환자의의식조사와같이어떤사람들이응답대상인지모르는경우해당사람들이생길때마다조사하는표본추출방법이다. 성폭력피해자가경찰에신고하거나상담소를찾는경우그사람을대상으로설문조사를실시하면된다. (3) 할당추출법 (quota sampling) 할당법 (quota) 이란특정변수 ( 주로인구학적변인 ) 의구성비에의해표본을선택하는방법입니다. 예를들어표본응답자구성을남자 51%, 여자 49% 로한다면조사원이조사과정에서그비율을맞추어나가는방법으로비확률적 (non-probabilistic) 표본추출방법입니다. 장점 1응답자비율만맞추면되므로조사가간편하고비용이나시간적측면에서효율적이다. 2모집단과유사한비율로표본을구성하면신뢰도높은조사가된다. 그러나비율맞추는데급급하여조사자의편리성으로인하여조사과정에서편의가발생할가능성이높고비율구성을위한변수 ( 예 : 성별 ) 선택이잘못되면조사의신뢰성이떨어진다. (4) 판단추출방법 (judgmental sampling) 연구자가모집단에대한사전지식이있는경우이를이용하여표본을추출하는방법이다. 저소득층의식조사를하고자할때저소득층인사람들의표본프레임작성은거의불가능하므로조사자가저소득층밀집지역인 OO 달동네를표본프레임으로규정하고 ( 가상모집단의일부 ) 그들중일부를표본추출하여조사를실시한다. 이방법역시표본프레임규정에대한객관성유지가중요하다.
56 Chapter 3. 조사방법및표본추출방법 3.2.6. Comments (1)Panel 구성동일조사를여러시점에계속하는경우첫번째조사에선택된표본을계속이용하는조사방법이다. 여론조사나기업의고객만족도조사를여러시점에서성향, 변화추이를보고자하는경우주로사용한다. 현재시청률조사가패널조사방법에의존한다. 동일응답자를사용하므로응답자의성향의변화를알아보는방법이지만 1 패널을유지하는데비용이많이들거나현실적인어려움이있고 2 처음표본추출이잘못되면조사는계속왜곡되는문제로인하여자주사용되지않는다. 시청률조사의경우는 set-up box 라는장치를이용하므로계속표본을바꾸면재설치, 이용방법설명등조사비용이증가하므로패널조사방법을사용한다. 한번잘못추출하면패널을유지하기힘들거나조사가계속왜곡되므로조사기관은자체패널들을스크린하여불성실한패널은대체하여간다. (2)Voluntary response sampling 온라인조사와같이설문에관심이있는사람들만응답하거나선물을받고싶어하는사람들만설문에응답하게되는조사방법의표본을자원응답표본 (voluntary response sampling) 이라한다. 이방법은조사의신뢰성이현저히떨어지므로모집단을대표할수있는방법을찾아야한다. 예를들어사용자가가장많은포탈사이트의사용자 DB 를표본프레임으로이용하면된다. 선물은응답회수율높이는것이지조사의신뢰성을높이지는못한다. (3) 출구조사와표본추출방법출구조사 (exit poll) 은선거결과를사전에예측하기위하여선거당일투표를마치고나오는유권자를대상으로실시한다. 1997 년경기도안양시만안구국회의원보궐선거에서최초로사용되었고 2000 년 4 월 13 일제 16 대총선에서본격적으로사용되기시작하였다. 16 대총선에서는선거구는 227 개, 각선거구는 50-60 개정도의투표구가있었다. 이중 6 개정도를임의로선택하여 (SRS) n 번째사람 ( 투표자수를예상하여표본의크기로나누어 ) 을택하는계통추출방법을사용한다. 다음은선거구선택방법을정리한것이다.
3.3. 척도 57 1 최소자승법 지난번선거를이용한다. j- 번째후보 i- 번째선거구득표율 p ij, j-번째후보의득표율을 p 라면 ( p ij p j ) 을최소화하는 6 개지역을선택한다. 당이바뀐경우, 새로운선거 j j 2 구에는적용불가능하다. 2층화법유사투표구를층화하여각층에서 1-2 개씩임의로뽑아투표구를 6개얻는다. 3순환식시간대별로조사투표구를바꾼다. 투표구별시간대투표성향이다른투표구가혼재된경우조사가왜곡될가능성이높다. 4대표지역선정법선거구의특성을잘나타낼것같은투표구를조사자가선택한다. 3.3. 척도 일정한규칙에의해보가문항들에수치를부여하는도구를척도 (scale) 라한다. 척도를얻을수있는문항보기예는 1매우불만족, 2불만족, 3보통, 4만족, 5매우만족 이다. 하나의문항으로응답자들의만족정도를측정하는경우단일척도 ( 문항 ) 이라하고여러개척도문항들의합으로임의의개념을측정하는경우이를복합척도 ( 문항 ) 라한다. 복합척도에의해하나의개념을측정하는경우복합척도를구성하는단일척도문항들의신뢰도 (reliability) 혹은단일차원성 ( 내적일치도 : internal consistency) 을측정하게된다. 복합척도는단일척도로제대로측정할수없는개념을측정할수있고복합척도를구성하고단일척도문항점수의합으로지표의척도값으로사용한다. 척도는질적인의견을양적인값으로변화시킴으로다양한통계분석방법적용이가능하다. 즉분류형변수 ( 보기문항 ) 가측정형변수로변환되는것으로각문항보기에대해비율만계산할수있으나척도문항은평균과같은하나의대표값으로요약될수있다.
58 Chapter 3. 조사방법및표본추출방법 단일척도에비해복합척도는측정의신뢰도를높여준다. 또한단일척도의경우 1, 2, 3, 4, 5 점이라면 2 개단일척도문항으로구성된복합척도는 1, 2, 3,, 10 이되므로 보다측정형변수의성질에가까워진다. 개개인을등급화시키는방법으로등급간의간격이거의동일하도록조정하는데사용되는 Thurston scale ( 서스톤척도, differential rating: 차이평가 ), 총합평가 (summation rating technique) 이라불리는리커드척도 (Likert scale), 척도를구성하는과정에서문항들의단일차원성을경험적으로검정하도록설계된거트만척도가 (Guttman scale, cumulative rating: 누적평가 ) 흔히사용된다. 리커드척도가가장널리사용되며리커드척도는설문조사전에점수 ( 척도 ) 가정해지나거트만척도는설문조사결과를이용하여척도가정해진다. 리커드척도문항의신뢰도혹은내적일치도는 Cronbach α 값에의해판단되며척도문항의그룹화는요인분석에의한다. 이는 6장에서다룬다. 3.3.1. 서스톤척도 L. L. Turston 에의해제안된척도로각척도문항이척도상어디에위치할것인가평가자로하여금판단케한다음대표적인문항들로척도문항을구성하는방법이다. 각문항에대한응답자의평가간불일치도가높으면그문항은제외시키고척도상의각점수를대표할수있는문항을고른다. 척도를구성하는단계를요약하면다음과같다. 1측정하고자하는항목 ( 개념 ) 를명확히규정한다. 2항목과관련된의견을광범위하게수집하고의견을 100 개정도압축하고카드에간결하게적는다. 350-100 명의평가자에게제시하여 100 개카드를 11 개그룹으로배열하되 5 개부정적인견해 (1 그룹이가장부정적 ), 1 개중립적인그룹, 5 개긍정적인그룹 (11 그룹이가장긍정적 ) 으로나누게한다. 4평가자의판단에근거하여 100 개카드의척도점수를계산한다. 카드의척도점수는평가자의점수의중앙값을포함한그룹의값이다. 예를들어 A 카드진술에대해 50 명의평가자가 3그룹 (3 점 ) 에 10 명, 4 그룹 (4 점 ) 10 명, 5 그룹 (5 점 ) 에 20 명, 6 그룹에 20 명이었다면 A 카드척도값은 5점이다.
3.3. 척도 59 5 평가자들간척도값의차이가심하거나평가자들이측정하려는개념과무관하다고진 술한카드는제외하고각값들이등간격이되도록 20-30 개의진술카드를선택하여 최종설문지에포함시킨다. 서스톤척도는문항평가를위하여많은시간과노력이필요해거의사용하지않는다. 3.3.2. 리커드척도 Rensis Likert 에의해제안된척도로다른신뢰할만한조사자들이사용하였던척도문항이나자신의경험이나다양한형태의정보 ( 신문, 서적, 발표자료 ) 를이용하여문항보기를구성한다. 척도문항은사실에대한판단보다는가치를묻는것으로간결하게하며 5 점척도 (1, 2, 3, 4, 5 점등간척도 ) 로평가될수있도록선택보기가구성된다. 측정하고자하는항목 ( 개념 ) 를명확히규정한다. 각문항에대해 5점척도로구성된응답범주를결정한다. ( 예제 ) 귀하는 OO 법안에대해어떤의견을가지고계십니까? 1적극반대 2반대 3중간입장 4찬성 5적극찬성 ( 예제 ) 당신은교양세미나과목에대해어떻게생각하십니까? 1전혀유익하지않다 2유익하지않다 3보통 4유익하다 5매우유익하다 문항내적일치도 ( 신뢰도 ) 가높은유사척도문항을합하여하나의척도개념으로판단한다. OO 대학시설만족도조사를위하여여러교내시설에대해아래척도문항을물은후유사문항 ( 내적일치도높은 ) 끼리묶어하나의개념을측정하게된다. ( 예제 ) 귀하는 OO 시설에대해얼마나만족하십니까? 1매우불만족 2불만족 3보통 4만족 5매우만족 장점으로는서스톤척도와는달리평가자를필요로하지않기때문에척도구성이간단하 고편리하다. 또한한항목에대한응답의범위에따라측정의정밀성을확보할수있다. 단점으로는극단 (1 점, 5 점 ) 을택하지않는응답자들이있으면마치 3 점척도처럼조사된다.
60 Chapter 3. 조사방법및표본추출방법 그리고합계점수가뜻하는바가개념적으로분명치못하다. 즉, 점수의단순한합계에는각항목에표현한응답자의태도의강도가묻혀버리기때문이다. 예를들어교수능력만족도를알아보기위하여강의능력만족도를묻는문항과연구능력만족도를묻는문항을구성했다고가정하자. 강의능력 3 점, 연구능력 3 점을응답한사람과강의능력 5 점, 연구능력 1 점을응답한사람은각각교수능력에대한만족도는 6 점으로동일하게되는문제가발생한다. 3.3.3. 거트만척도 Louis Guttman 에의해제안된척도로응답자태도의강도에대한연속적증가유형을측정하고자하는척도로전제조건은측정의대상이되는척도가단일차원성을지녀야한다. 거트만척도는반응중심접근방법으로문항과응답자를동시에척도화한다. 척도를구성하는과정에서문항들의단일차원성이경험적으로검증되도록설계된척도로단일차원적이고누적적인데이는척도를구성하는여러문항과응답자가갖는총평점의관계가누적되고있기때문이다. 구성절차를정리하면 (1) 척도구성항목을선정하고 (2) 응답자의응답을 scalogram 용지에기입한후 (3) 재생계수 (CR: coefficient of reproducibility) 를구한다. (4) 그리고구성항목을조정하여척도를구성하면된다, scalogram 은연구자가거트만척도의절차에따라서만든척도가완벽한거트만척도와일치하는정도, 즉단일차원성, 누적성의가정에얼마나부합하는지를재생계수 (coefficient of reproducibility) 를통하여그정도를파악한다. 재생계수=1-응답의오차수 /( 문항수 응답자수 ) 이다. 재생계수가 1 일때완벽한척도구성가능성 (scalability) 을갖는다. 보통재생계수가최소한 0.90 는되어야바람직한거트만척도이다. 예를들어보자. 유사개념을측정하는하는문항 3 개가있다고하자. 단순성을위하여문 항보기는 예, 아니오 로구성되었다고하자. 응답자 400 명을선정하여응답한결과 예 의비율이가장높은문항을순서대로배열한다.
3.3. 척도 61 제일높은 문항 그다음 문항 제일낮은 문항 지수점수척도점수빈도 척도유형 + + + 3 3 60 + + - 2 2 150 + - - 1 1 130 - - - 0 0 0 혼합유형 - + - 1 2 15 + - + 2 3 20 - - + 1 0 15 - + + 2 3 10 혼합유형에대해서는지수점수와다른척도점수를배정하고재생계수를구한다. 재생계수가 0.9 이상이면배정한척도점수를사용한다. CR = ( 1200 60)/1200 = 0.95 일단문항이척도화되면응답자를서열화한다. 장점으로는 (1) 주로질문이나투표에의한개인의태도를측정하는데유용하다. 다른척도와는달리응답자개인을서열화하기때문에개인차에대한연구를수행할때특히유용하다. 단점으로는 (1) 현실적으로재생계수가높으면서위계적으로구성된문항을만들고배열하기가매우어려워많은문항을척도화할수없다. (2) 단일차원의측정에는문제가없으나다양한특성을포함하는다차원적인조사를수행하기위한척도로는구성이불가능하다.
62 Chapter 3. 조사방법및표본추출방법 [ 연습문제 ] (1) 지역성인남녀를대상으로영화보는회수, 장르, 함께보는사람등에대한실태와영화관만족도설문조사를위하여표본 200 명을뽑으려고한다. 아래각방법을사용한다고할때, 표본추출과정을기술하시오. 1SRS 방법 2계통추출방법 3층화추출법 4군집추출법 51~4의문제점이있으면적고현실적인방법 ( 비확률적방법도포함 ) 중가장좋은추출방법을적으시오. (2)80 개원의면적을계산하기위하여 4개만추출하여원의면적을추정하려고한다. ( 페이지 63) 1SRS 방법에의해표본을추출하고원의면적을추정하시오. 2계통추출방법에의해표본을추출하고원의면적을추정하시오. 3층화추출방법에의해표본을추출하고원의면적을추정하시오. 4군집추출방법에의해표본을추출하고원의면적을추정하시오. 5SRS 방법에의해표본 8 개를추출하고원의면적을추정하시오. 1 의결과와비교하시오. (3) 팀프로젝트설문조사에가장이상적인표본추출방법과현실적인방법을제시하시오.
Exercise 63