표본추출방법 * 실제표본조사 다단계집락표집법, 다단계층화집락표집법 1
확률표본추출방법 1. 단순임의추출법 2. 층화추출법 3. 집락추출법 4. 계통추출법 2
예 ) 원광대학생을대상 (500 명 ) 으로건강조사실시 전수조사 모집단 : 10,000 명 표본조사 : 500 명을어떻게뽑을것인가? 3
1. 단순임의추출법 Simple Random Sampling(SRS ) 개념 모집단전체의일련번호를부여해서표본조사틀을만든후, 난수표등을이용하여각개체가뽑힐가능성이동일하게되게끔표본을추출하는방법. 4
단순임의추출법 모집단 : 10,000 명 500 명 5
단순임의추출법 모집단 : 10,000 명 500 명 1 조사대상자전체에일련번호를부여한다. 2 난수표또는컴퓨터를이용하여필요한표본수만큼난수를생성한다 3 생성된난수에해당하는일련번호를가진자를표본으로선정한다. 6
장점 1. 모집단에대한사전지식이불필요. 2. 추출기회가동등하고독립적이기때문에추출된표본의대표성이높다. 3. 자료의분류에있어오차의개입이적다. 단점 1. 모집단에대해가지고있는지식을활용할수없다. 2. 비교적표본의규모가커야한다. 3. 표본프레임의작성이어렵다. 7
2. 층화추출법 Stratified Sampling 개념 모집단을먼저서로겹치지않는여러개의층으로분할한후, 각층에서단순임의추출법에따라배정된표본을추출하는방법. 8
층화추출법 n1 모집단 : 10,000 명 n2 N=n1+.nk nk 9
층화추출법 10
층화추출법 1 모집단의 L 개의층으로층화한다. 2 각층에서표본크기를결정하고, 단순무작위추출법에따라표본을추출한다. 비례층화추출 비비례층화추출 11
모집단을특성에의해몇개의그룹 (strata) 으로나눈다. 그룹간에는차이가존재한다. 그러므로각 strata에서골고루개체를선택해야한다. 각그룹에서 SRS방법에이해일정수만큼개체를임의로선택한다. 일정수? ( 그룹에속한개체수 ) 모집단개체수비율 ( 예 ) 학생들의 IQ조사위해 500명추출한다면? 원광대학교 : (10,000)= 경상대 (5,000)+ 이과대 (2,000)+ 공과대 (3,000) 단과대학별로그룹 (strata) 화 경상대 : 500*0.5=250 명 / 이과대 =100 명 / 공과대 =150 명 Multi-stage 층화추출 전과동일 => 그룹을여러단계로나눔 ( 대학별, 학년별, 성별 ) 12
장점 1. 중요집단은빼놓지않고표본에포함시킬수있음. 2. 동질적대상은표본의수가적어도대표성이높음. 3. 각층의특성에대한추정과비교가가능. 단점 1. 원형으로복귀하기어렵다. 2. 층화시시간과노력이소요. 3. 모집단에대한지식이필요. 13
3. 계통추출법 (Systematic Sampling) 개념 추출틀에서처음 k개단위들중에서랜덤하게하나의단위를추출하고그이후매 k번째간격마다하나씩의단위를표본으로추출하는표본추출방법. 14
계통추출 모집단 : 10,000 명 #61 #81 #101.. N=500 15
계통추출법 1 추출틀에서처음 k 개단위중에서랜덤하게하나 r(1 r k ) 를선택한다. 이때을출발점 (starting point) 이라고한다. 2 이후들을표본으로추출한다. 30 명으로구성된모집단에서 5 명을뽑고자하는경우추출간격 K 는 6 이된다. 30 명을 6 명씩묶고, 첫번째 6 명에서단순무작위추출에의해 1 명을뽑고, 같은순서에배치된 ( 이번예에서는세번째 ) 대상자를차례로뽑아간다. 16
SRS방법과같이모집단의개체에일련번호를부여한다. 1번부터 ( 모집단수 / 표본수 ) 번까지개체중난수를이용하여하나를선택한다. 그개체에부여된일련번호에일정수만큼 (k) 더해그번호의개체를선택한다 단순임의추출법과유사 모집단을잘대표하는표본을추출할수있고 SRS에비해간편하다. SRS와동일한문제점모집단이큰경우일련번호부여에문제가있다. 17
장점 1. 표본추출이간편. 2. 단순임의추출법의대용으로사용. 3. 일반적으로표본이모집단전체를잘반영. 단점 1. 모집단추출틀에대한추가적인가정이필요. 2. 표본의대표성이저해 ( 주기성, 특정경향성을보일땐피한다.) 18
4. 집락추출법 (Clustering Sampling) 개념모집단을서로인접한기본단위들을묶어집락을구성하여먼저집락을추출하고추출된집락내의일부또는전체를조사하는방법. 19
집락추출법 모집단 : 10,000 명 N 20
집락추출법 21
모집단을특성에의해몇개의그룹 (cluster) 으로나누고그룹에번호를부여한다. 반드시그룹간에는차이가없어야한다 차이가있다면조사에오류 SRS방법과같이난수를이용하여그룹중하나를임의로선택한다. 선택된그룹에있는개체를모두선택한다. 원하는표본수를얻을때까지계속한다. 마지막그룹처리문제 : 남은표본수가 500개인데선택된그룹안에 600명이있다면 500명만단순임의추출하면된다. 표본선택시간과비용을줄일수있다. 그룹간에차이가있다면조사결과가왜곡될수있다. 22
장점 1. 모집단의목록이없을때이용. 2. 현지조사비용을절감. 3. 각군집의속성으로모집단의속성을추측. 단점 1. 각군집의이질성을확보하기위한분류의기준설정이어려움. 2. 따라서, 다른확률표본추출에비해표본오차가더커질가능성 이있다. 23
표본추출방법정리 표본추출방법에는여러방법들이있다. 표본추출론에관한어느교과서들에서도기본적으로 단순랜덤추출 ( 단순무작위추출 ; simple random sampling) 또는계통추출 (systematic sampling) 층화추출 (stratified sampling) 집락추출 (cluster sampling) 등의서너방법을다루고있는데, 실제로는이들방법들이개별적으로사용되는것이아니라서로결합된방식으로사용된다. 대표적으로층화집락무작위추출 (stratified cluster random sampling) 이쓰이고, 이때집락추출의단계수에따라그것이 3단이면층화 3단집락추출 (stratified three stage cluster sampling) 라고한다. 24
예제 1 어느사립대학에서학생들은다음과같은체계에따라구별되어졌다. 분류 학생수 4 학년 150 3 학년 163 2 학년 195 1 학년 220 25
여기서, 우리가 n=40 크기의층화확률표본을추출하기위하여비례배분을사용한다면, 각층으로부터우리가추출해야할표본의크기는얼마인가? 26
-> 풀이 n=40, N1=150, N2=163, N3=195, N4=220, N=728 이다. n1=(150/728)40=8, n2=(163/728)40=9, n3=(195/728)40=11, n4=(220/728)40=12 27
따라서, 분류 학생수 4학년 8 3학년 9 2학년 11 1학년 12 28
비확률표본추출방법 편의표본추출 (convenience sampling ; 대표적 ) : 조사자난면접원이편리한장소와시간에접촉하기편리한대상들을표본으로추출하는것으로표적모집단구성원들은동질적 (homogeneous) 이어서어떤구성원을대상으로조사하더라도마찬가지라는것을가정. 장점 : 조사대상을적은비용과시간으로확보할수있으며, construct 개발, 설문지개발후사전조사 (pretest) 등에사용될수있고편의표본으로부터엄격한분석결과를획득하지는못하지만조사대상들의특성에대한개괄적정보를획득할수있다. 한계점 : 표본의모집단대표성이매우낮다. 할당표본추출 (quota sampling) : 인구통계적특성 ( 나이, 성별, 소득수준등 ), 거주지등의측면에서사전에정해진비율에따라모집단구성원들을할당하는방법 ( 층화표본추출과구별필요 ). 층화표본추출 : 조사하고자하는특성면에서모집이여러가지다른집단들로구성된경우각집단에서일부씩추출하는방식 ( 사전에그룹화가능 ). 할당표본추출 : 인구통계적특성이나거주지를중심으로조사자가표본의크기를할당 ( 사전에그룹화정보없이모집단을구분 ). 장점 : 모집단에대한대표성이단순무작위표본에비해높다. 한계점 : 할당표본추출을하기위해서모집단의특성에대한사전지식에필요하며이를전혀모르는경우할당표본추출은불가능. 29
판단표본추출 (judgment sampling) : 조사자가조사목적에적합하다고판단되는구성원들을표본으로추출하는것으로해당분야의전문가들의의견이표적모집단의대표성을갖는다고가정. 장점 : 해당분야의전문가로판단되어선정된표본이실제로유용한정보를제공할수있다면판단표본추출법은매우유용. 한계점 : 판단표본이편의표본보다더대표성을가질것이라는것은가정이나기대일뿐, 실제로모집단의대표성정도는평가할수없다. 눈덩이표본추출 (snowball sampling) : 조사자가적절하다고판단되는조사대상자들을선정한다음그들로하여금또다른조사대상자들을추천하도록하는방법으로처음에는조사자의판단에따라조사대상자들이선정되므로판단표본추출법의일종이라할수있다. 장점 : 조사자가표적모집단구성원들중극소수이외에는누가표본으로적절한지를판단할수없는경우사용될수있다 (FGI 같은비계량적조사에서흔히사용 ). 한계점 : 연속적추천에의해선정된조사대상자들에는동질성이높을수있으나표적모집단과는매우유리된특성을가질수있다. 30
표본추출법결정시고려할요인들 가장효율적인, 적합한추출법을선택할것 조사의목적 : 표적모집단의특성을정확히추정하는것이매우중요하다면표본의모집단대표성이높도록확률표본추출을해야하나표적모집단의특성에대한개괄적인아이디어를얻고자한다면편의표본을이용할수도있다. 표적모집단에대한사전지식 : 체계적표본추출, 층화표본추출, 할당표본추출을하기위해서는표적모집단에대한사전지식이필요하며, 판단표본과눈덩이표본추출의경우도표적모집단에대한사전지식이요구됨 ( 사전지식이전무하다면단순무작위혹은편의표본추출을할수밖에없음 ) 조사의용이성, 조사비용등을함께고려할것 가능한한단순한추출법을사용할것 시간 : 시간적제약이큰경우비확률표본추출을함으로써시간절약을할수있다. 예산 : 예산이한정적인경우정확한정보획득을포기하더라도비확률표본추출을할수밖에없다. 31