1. 표본조사 전수조사 census 관심의대상이되는집단을이루는모든개체들을조사하여모집단 ( 조사하고자하는대상이되는집단전체 ) 의특성을측정하는방법 전수조사는모집단을파악하게하고국가정책수립의기초자료를제공한다는점에서필요하지만, 집단내모든개체를다조사한다는것은현실적인어려움이따르고너무많은조사비용이필요 전수조사는비용이많이들고시간이오래걸리므로정부가국가적인차원에서주로실시한다. 인구센서스, 광공업총조사 ( 우리나라매5년 ) 향후인구총조사는행정통계, 대체통계활용 ( 미국 10년, 유럽 X) 표본조사 관심의대상이되는전체모집단중일부 ( 표본 ) 를선택하고조사를실시하여이로부터전체모집단의특성을추정 표본조사는전수조사에비해시간과비용이절감되고심도있는조사가가능하다는점등에서장점이있다. 표본조사를실시하기위해서는모집단전체에대한정보가있어야하는데이를표본프레임이라한다. 이표본프레임으로부터원하는수의표본응답자를선택하는방법을표본추출방법이라한다. ( 예 ) 매월발표하는경제활동인구조사, 도소매물가지수, 매년실시하는도소매업조사, 농작물생산조사 (30)
-1. 표본용어 (1) 모집단 (population) 조사자가정보를얻기원하는대상전체 대통령후보지지율에대한여론조사의경우모집단은대한민국유권자전체 H대학교학생학교만족도조사의경우모집단은 014년 1학기현재등록학생 목표모집단 target population 조사대상이되는모집단전체 ( 예 ) 유권자, 한남대학생 조사모집단 survey population 조사방법에따른조사가능모집단 ( 예 ) 전화소유자 / 한남대학생 모수 parameter 모집단구성원으로부터알고자특성 ( 예 ) A 후보의지지율, H 대학생의만족도수준 표본프레임 (sampling frame) 표본틀 모집단전체응답자와그것을구별할수있는 ID 리스트를표본프레임이라한다. 학생명부, 주민등록명부가그예이다. 표본프레임이갖추어야할요소는다음과같다. 1 포괄성 : 표본프레임이조사가능대상을대부분포함하고있어야한다. 추출확률 : 모집단구성원이표본으로추출될확률이동일해야한다. 3 효율성 : 조사자가조사되길원하는사람들만으로표본프레임을구성한다. 설문조사대상이되는전체응답자와그응답자를구별할수있는 ID 리스트 목표모집단이라고불리는표본프레임은 연구자가잠정적으로그의연구에적용하기위하여가정한이론적집단 (Sjoberg&Nett; 1968) 표본프레임은연구자의조사계획에따라정의되며 ID와응답자와는일대일대응관계 (31)
-. 표본용어 () 표본 (sample) 모집단의일부로설문을위해선택된조사대상응답자 표본은확률방법을활용하여추출하여야표본오차를계산할수있음. 표본응답자수를표본크기라하며표본오차 ( 허용오차 ) 와조사신뢰수준 ( 일반적으로 95%) 에의해결정됨. 여론조사에서전체유권자중전화조사에선택된 1,500명응답자가표본크기 H대학생학교만족도조사를위하여 00명표본크기선택. 통계량 statistic 표본데이터로부턴계산된값 추정치, 검정통계량 : ( 예 ) A 후보의지지율 45.3%(.5%), H 대학생의만족도수준 4.5 점 (SD=0.6 점 ) 표본 ( 조사 ) 오차 sampling error 모수와표본의계산된추정치의차이 ( 편차 ) 편차 (bias) 발생하는이유는 1잘못된표본추출방법 표본오차 3비표본오차 확률표본오차 : 실제계산가능 모집단전체를조사하지않고일부만조사하기때문에표본으로부터얻은추정치와모집단의참값사이에발생하는차이 표본크기를결정할때표본오차는허용오차, 혹은오차한계라고함 모집단의일부인표본으로부터얻은결과와모집단의정보와차이를넓은의미의표본오차 모집단의응답자가표본프레임작성시 ( 혹은모집단고려시 ) 제외되어표본에포함될가능성이없어짐으로써발생하는오류도이에해당되지만이는계산불가능하므로표본오차라함은계산가능한확률표본오차를의미 (3)
-3. 표본용어 (3) 표본오차계산공식 여론조사 (SRS 방법비율추정 ) / 신뢰수준 95% 인경우 / 1.96.. 표본오차는표본크기가커지면, 신뢰수준이높아지면커진다. 비표본오차 non-sampling error 1절차오차 (processing error): 조사원들의불성실이나외형적인영향, 응답자의무성의한응답, 적절하지못한조사방법 ( 예 : 일대일면접, 우편조사, 전화조사 ) 선택이나조사과정의고의적비고의적실수, 자료컴퓨터입력시발생하는오류등조사과정에서발생하는오류이다. 절차오차는조사자가충분히조심한다면줄일수있다. 무응답 (non-response) 이문제이다. 응답하는자체를싫어하는지답하기꺼려하지않았는지알방법이없다. 그러므로유사한인구학적특성을가진응답자들의응답결과를이용하여보정한다. 여론조사기관은이에대한 knowhow를가지고있다. 사회조사방법 3 응답오차 : 타인에게드러나기꺼려하는문항에 ( 예 : IQ, 소득 ) 대해서는높여응답할가능성이있는데이를응답오차라한다. 응답오차를줄이기위해서는조사과정에서응답자가비밀을보장받는다고느낄수있도록조사원이멀리떨어져있거나설문지를본인이직접박스함에넣게하는방법이있을이용한다. 표본크기결정 SRS 방법 ( 무한모집단 ) SRS 유한모집단 (N) 객관식선택문항 리커트척도문항 zα/ 0.5 n ( 허용오차) z 0.5 α/ ( 허용오차) z n zα/ (0.9R) n ( 허용오차) zα/ (0.4R) n ( 허용오차) 비교연구 : 모집단크기 10% 혹은 100~00 명 α/ (0.5) /N (33)
3-1. 표본추출방법 확률적방법 (1) 표본추출방법 확률적방법 모집단의개체가표본으로선정될가능성이모두동일한표본추출방법 equally likely 표본오차계산이가능 비확률적방법 조사기획자가편의를위하여표본대상자를임의로선정하는방법 객관타당성이제시되어야함 장점 모집단을대표하는표본을뽑을수있음 가장 ideal한방법 단점 실제표본프레임을구하는것이불가능한경우가많고표본응답자에게반드시해야하므로시간과비용이많이든다. 가장이상적인방법이지만표본프레임리스트가필요하므로현실적이지못해설문조사에서는거의이용되지않음 SRS simple random 단순임의추출 ( 방법 ) 표본프레임개체에일련번호를부여 난수를이용하여원하는표본크기만큼추출 난수생성은엑셀에서가능 (34)
3-. 표본추출방법 확률적방법 () Systematic sampling ( 계통추출 ) ( 방법 ) 모집단전체응답자에일련번호를부여한다. 물론꼭연속번호일필요는없다. 모집단의수 (N) 를표본의수 (K) 로나눈다. 난수를이용하여 1~(N/K) 숫자를하나임의로선택한다. 예를들어 c라면, c, c+k, c+k, 번째개체를표본으로선택 모집단전체일련번호가있는표본프레임이필요하고난수를이용하지만한번만이용한다는점이다름 장점 모집단을대표하는표본을뽑을수있다. 매번난수를찾는번거로움이없다. 단점 실제표본프레임을구하는것이불가능한경우가많다. 표본응답자에게반드시해야하므로시간과비용이많이든다. 일련번호에따른체계적차이가존재하면조사가왜곡된다. 활용 백화점고객을대상으로만족도를조사하는경우백화점고객리스트 ( 카드회원 ) 를이용하여표본을얻을수있으나백화점앞에서조사하는경우표본을뽑을때이방법을사용한다. 조사일에예상고객인원은 5,000명이고표본수를 00명이라하면5번째, 50번째, 75번째, 고객을조사하면된다. 전화번호선택시일정번호를건너뛰면한다. 예를들면 69-76이선택되면 (Random Digit Dialing) 69-77, 69-78, (35)
3-3. 표본추출방법 확률적방법 (3) 층화추출법 stratified sampling ( 방법 ) 모집단을인구학적특성 ( 예 : 성별, 학년별, 직업별, 지역별 ) 에의해그룹화한후각그룹 ( 이를층 ) 에서일정한크기의표본을선택 확률비례추출 1모집단을인구학적특성에의해분류한다. 모집단을응답성향이서로다를것이라생각되는인구학적변인을이용하여모집단을그룹 ( 층 ) 으로나눈다. 각층에서표본을몇개나뽑을지는층을구성하는크기에따라결정한다. 3각그룹에배당된표본을추출하는데 SRS 방법이나계통추출방법을사용한다. 장점 표본추출비용과시간을절약할수있다. 단점 그룹화를위하여고려한특성에따라그룹간응답의차이가없다면조사비용이증가한다. 활용 그룹을나누는특성변수가 개인경우 Twostage(단계 ) 층화추출, 3개이상인경우 Multistage ( 다단계 ) 층화추출이라한다. 예를들어성과학년모두를이용하여모집단을그룹화한다면우선성별에의해그룹을나누고각그룹을학년에의해다시그룹화하여 8개의그룹에대해표본을추출하면된다. 전화여론조사의경우응답자들을지역에의해층화하고전화번호선택은계통추출방법을이용하게되므로층화-계통추출방법을이용하게된다. (36)
3-4. 표본추출방법 확률적방법 (4) 집락추출법 clustering sampling ( 방법 ) 모집단을그룹화한다는면에서는층화추출방법과동일하지만그룹 ( 군집 ) 간에는응답의차이가없다는점이다르다. 그룹간응답의차이는없으므로한그룹이임의로선택되면 (SRS 방법 ) 그그룹에속한사람만을대상으로표본크기만큼추출하면된다. 1모집단을인구학적특성에의하여군집으로나눈다. 난수에의해군집을임의로선택한다. 선택된군집에속한모든응답자를표본으로선택한다. 3만약그룹에속한응답자를모두뽑으면표본보다많은경우는 SRS 방법에의해군집에속한일부응답자만선택하면된다. 장점 추출비용과시간을절약할수있다. 층화추출방법보다비용과시간을더줄일수있다. 단점 나눈그룹간응답성향의차이가있다면조사결과가왜곡된다. 일반적으로자주사용하지않음 활용 가구대상전국조사의경우조사구선택은층화추출방법을이용하고조사구내읍면동을선택할경우에는집락추출방법을, 읍면동내의최종가구를선택할경우에는번지번호는주택위치에따른계통추출방법을사용한다. (37)
3-5. 표본추출방법 방법선택 & 전국방문조사 SRS 방법은가장이상적인방법이지만표본프레임의작성이어렵고조사과정에서비용과시간이너무많이든다. 군집추출방법은비용이나시간면에서효율적인방법이지만응답성향의차이가없는군집을얻는것은현실적으로불가능한경우가많다. 현실적으로가장많이사용하는방법은층화추출방법이다. 각층 ( 그룹 ) 에할당된표본을뽑는경우 SRS 방법이나계통추출방법을사용하므로하나의추출법이단독으로사용되는것이아니라여러방법이결합되어사용된다. 16 개도시 ( 서울, 부산, 대구, 인천, 대전, 광주 ), 8 개도 ( 경기, 강원, 충남 북, 경남 북, 전남 북 ) 1 개층으로나누고도는시, 읍, 면으로나눈다. 6 개도시, 시, 읍, 면의모집단을배열한후동 ( 면은리 ) 을뽑는다. ( 계통추출 ) 이것이 1 차표본지역 (primary sampling location) 이다. 표본지역수는표본수에따라달라지나표본의크기가 1,500 이면 00 정도를얻는다. 3 실질최종표본지역 (actual final sampling location) 인반 ( 부락 ) 이선택될때까지계통표본추출을반복한다. 반은 0 가구, 부락은 0-80 가구로구성한다. 4 조사자가선정지역을직접방문하여주민명부에서 8 가구를임의선정한다. 전화조사의경우에는 ~3 단계를 RDD 가담당한다. 전화번호선택시계통추출방법 (38)
4. 표본추출방법 비확률적방법 필요이유 표본프레임을작성할수없는경우 ( 성폭력피해자 ) 표본프레임을얻을수있어도조사비용이많이드는경우 : 표본으로추출된특정학생들의 ID 와이름리스트가일일이찾아다닌다? Convenience sampling ( 편의추출방법 ) 조사자가자신의편리한방법으로표본을얻는방법, 우연추출방법 (incidental sampling) 가장중요한것은객관적타당성을유지 ( 예 ) H대학만족도조사시학술정보관, 수업후강의실에서조사 판단추출방법 (judgmental sampling) 연구자가모집단에대한사전지식이있는경우이를이용하여표본을추출하는방법이다. 저소득층의식조사를하고자할때저소득층인사람들의표본프레임작성은거의불가능하므로조사자가저소득층밀집지역인 OO 달동네를표본프레임으로규정하고 ( 가상모집단의일부 ) 그들중일부를표본추출하여조사 Snow-ball 방법 성폭력피해자의실태조사, 에이즈환자의의식조사와같이어떤사람들이응답대상인지모르는경우해당사람들이생길때마다조사하는표본추출방법이다. 성폭력피해자가경찰에신고하거나상담소를찾는경우그사람을대상으로설문조사를실시하면된다. 할당추출법 (quota sampling) 할당법 (quota) 이란특정변수 ( 주로인구학적변인 ) 의구성비에의해표본을선택하는방법으로표본응답자구성을남자 51%, 여자 49% 로한다면조사원이조사과정에서그비율을맞춤 응답자비율만맞추면되므로조사가간편하고비용이나시간적측면에서효율적이고모집단과유사한비율로표본을구성하면신뢰도높은조사가된다. (39)
5. 패널및출구조사 패널 Panel 동일조사를여러시점에계속하는경우첫번째조사에선택된표본을계속이용하는조사방법 동일응답자를사용하므로응답자의성향의변화를알아보는방법이지만 1) 패널을유지하는데비용이많이들거나현실적인어려움이있고 ) 처음표본추출이잘못되면조사는계속왜곡되는문제로인하여시청률조사나마케팅조사, 심층조사정도사용 시청률조사 : set-up box라는장치를이용하므로계속표본을바꾸면재설치, 이용방법설명등조사비용이증가하므로패널조사방법을사용한다. 한번잘못추출하면패널을유지하기힘들거나조사가계속왜곡되므로조사기관은자체패널들을스크린하여불성실한패널은대체하여간다. 출구조사 (exit poll) 선거결과를사전에예측하기위하여선거당일투표를마치고나오는유권자를대상으로실시한다. 1997년경기도안양시만안구국회의원보궐선거에서최초로사용되었고 000년 4 월 13일제 16대총선에서본격적으로사용되기시작하였다. 16대총선에서는선거구는 7개, 각선거구는 50-60개정도의투표구가있었다. 이중 6개정도를임의로선택하여 (SRS) n번째사람 ( 투표자수를예상하여표본의크기로나누어 ) 을택하는계통추출방법을사용한다. 최소자승법, 층화법, 순환식방법에의해선거구를선택함. rolling sampling, rotation sampling (40)
연습문제 다음방법에의해원의넓이총면적을구하시오. 전수조사방법 표본추출방법 표본크기 10개 SRS 방법 계통추출방법 층화추출방법 집락추출방법 (41)