untitled

Similar documents
조사연구 권 호 DOI 연구논문 몽골의가축통계조사를위한표본설계연구 A Study on Sampling Design for the Mongolian Livestock Statistics Survey 주제어

자료의 이해 및 분석

<4D F736F F F696E74202D20C1A636C1D620C7A5BABBC3DFC3E2B9E6B9FD20B0ADC0C72E >

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

통계적 표본조사론 소개

슬라이드 1

ePapyrus PDF Document

통계적 표본조사론 소개

10. ..

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

슬라이드 1

Microsoft PowerPoint - SDA 2014s_Ch3.pptx

... 수시연구 국가물류비산정및추이분석 Korean Macroeconomic Logistics Costs in 권혁구ㆍ서상범...

statistics

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

조사연구 sampling error of polling sites and the additional error which comes from non-response, early voting and second stage sampling error of voters in

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Crt114( ).hwp

확률과통계 강의자료-1.hwp

조사연구 whether this expansive monitoring system might basically achieve the improvement in statistical quality capturing problems in survey research. Ba

R t-..

2002report hwp

조사연구 aim of this study is to find main cause of the forecasting error and bias of telephone survey. We use the telephone survey paradata released by N

(001~006)개념RPM3-2(부속)

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr

< 차례 > Ⅰ. 조사개요 1 Ⅱ. 통계의작성목적및이용 6 Ⅲ. 조사설계 12 Ⅳ. 자료수집 50 Ⅴ. 행정자료활용 87 Ⅵ. 자료처리 91 Ⅶ. 통계추정및분석 99 Ⅷ. 통계공표관리및이용자서비스 115 Ⅸ. 통계기반및개선 132 Ⅹ. 참고문헌 141

손해보험 채널별 활용분석 123 다.세부 분석 손해보험 채널별 구성비 :성별 남성과 여성 모두 대면채널을 통한 가입이 90% 이상으로 월등히 높음. <표 Ⅱ-2> 손해보험 채널별 구성비 :성별 구 분 남성 여성 대면 직판 은행 0.2 1

09구자용(489~500)

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

ISSN 제 3 호 치안정책연구 The Journal of Police Policies ( 제29권제3호 ) 치안정책연구소 POLICE SCIENCE INSTITUTE

슬라이드 제목 없음

<28BCF6BDC D B0E6B1E2B5B520C1F6BFAABAB020BFA9BCBAC0CFC0DAB8AE20C1A4C3A520C3DFC1F8C0FCB7AB5FC3D6C1BE E E687770>

- 1 -

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - 26.pptx

27 2, 1-16, * **,,,,. KS,,,., PC,.,,.,,. :,,, : 2009/08/12 : 2009/09/03 : 2009/09/30 * ** ( :

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

외국인투자유치성과평가기준개발


서울도시연구_13권4호.hwp

hwp

methods.hwp


2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

레이아웃 1

KJME-2003-h.hwp

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


조사연구 Key words: exit poll, sample size, primary sampling unit, secondary sampling unit, cluster, design effect, coefficient of variation Ⅰ. 서론 년 월의지방선

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

09김정식.PDF

1)2) 1

발간등록번호

DBPIA-NURIMEDIA

Microsoft PowerPoint - SBE univariate5.pptx

부문별 에너지원 수요의 변동특성 및 공통변동에 미치는 거시적 요인들의 영향력 분석

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

목차 I. 조사개요 1 II. 모바일인터넷이용현황 2 1. 모바일인터넷단말기이용빈도및시간 2 2. 모바일인터넷단말기보유현황 3 3. 모바일인터넷단말기이용현황 3 4. 모바일인터넷접속방법 4 5. 모바일인터넷이용장소 4 6. 모바일인터넷이용목적 5 7. 모바일인터넷이용만

14.531~539(08-037).fm

교육정책연구 2005-지정-52 공무원 채용시험이 대학교육, 노동시장에 미치는 영향분석 및 공무원 채용제도 개선방안 연구책임자 : 오 호 영 (한국직업능력개발원 부연구위원) 이 정책연구는 2005년도 교육인적자원부 인적자원개발 정책연구비 지원에 의 한

Ⅱ 모집단및표본추출틀 모집단정의 목표모집단 조사시점기준전국의만 세이상모든가구원 조사모집단 조사하기어려운기숙시설 특수사회시설 외국인거주 표본추출틀작성 지역에거주하는사람을제외한일반가구의가구원 년인총 표본조사구및 년세종시특별센서스의보통조사구 아파트조사구 와 년 월까지의신축아


G Power

행정학석사학위논문 공공기관기관장의전문성이 조직의성과에미치는영향 년 월 서울대학교행정대학원 행정학과행정학전공 유진아

<C1B6BBE7B5BFC7E B9DAB9CEB1D45F B3E2BCADBFEFBCADBAA3C0CC2E687770>

04-다시_고속철도61~80p

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

Microsoft PowerPoint - IPYYUIHNPGFU

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

Microsoft PowerPoint Relations.pptx

유해중금속안정동위원소의 분석정밀 / 정확도향상연구 (I) 환경기반연구부환경측정분석센터,,,,,,,, 2012


Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

PowerPoint Presentation

확률과통계6

<C1B6BBE7BFACB1B82032B1C72031C8A BFACB1B8B3EDB9AE29202D20C0CCB1E2C0E72E687770>

012임수진

환경중잔류의약물질대사체분석방법확립에 관한연구 (Ⅱ) - 테트라사이클린계항생제 - 환경건강연구부화학물질연구과,,,,,, Ⅱ 2010

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 95~118 학술 탄소은행제의가정용전력수요절감효과 분석 1) 2) 3) * ** *** 95

untitled

Microsoft Word - EDA_Univariate.docx

공휴일 전력 수요에 관한 산업별 분석

PowerPoint 프레젠테이션

[ReadyToCameral]RUF¹öÆÛ(CSTA02-29).hwp

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

제 3강 역함수의 미분과 로피탈의 정리

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은


발간등록번호 정책연구용역사업최종결과보고서 청소년건강행태온라인조사 2017 년표본설계 Sample Design for 2017 Youth Health Behavior Online Survey 주관연구기관 : 한국조사연구학회 질병관리본

i

나하나로 5호

용역보고서

2

저작자표시 - 동일조건변경허락 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 이저작물을영리목적으로이용할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

_1.hwp

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed


Transcription:

통계청 통계분석연구 제 3 권 2 호 (98. 가을 ) 77 네이만배분법과수정절사법의효율성비교 진영 * 표본설계의목적은가능한한적은비용으로될수있는한작은분산을갖는추정량을찾아내어표본조사의정확도를높이고자하는데있다. 일반적으로사업체부문표본조사와같은대규모표본조사에서는네이만배분법과수정절사법을사용하는데, 1997년 3월의 통계분석연구 에운수업과서비스업통계자료를이용해서두방법의효율성을비교한논문을게재하였다. 하지만시간제약으로인해표본크기에따른비용측면만비교를하고추정치의효율성에대해서는연구를하지못했다. 따라서본논문에서는이전의연구를보완하여층별분산과왜도에따른 4가지유형의임의모집단에대한모의실험을통하여두방법의효율성을비교해보았다. 연구방법은허용오차를일정수준으로고정한상태에서각방법으로추출된표본크기를비교하여비용측면의효율성을알아보고, 각방법에의해동일한표본크기를추출했을때의허용오차와변이계수를비교하여추정치의효율성을알아보았다. < 차례 > Ⅰ. 서론 Ⅱ. 네이만배분법 Ⅲ. 수정절사법 Ⅳ. 모의실험 Ⅴ. 결론 * 통계연수원교육연구과본연구에유익한논평을해주신동국대학교김종호교수임에게감사드리고, 연구과정에서많은격려와도움을주신강상목사무관과경기대학교이상은교수님에게감사드린다.

78 Ⅰ. 서론 우리는일상생활에서통계조사의예를흔히볼수있다. 어느신문사의여론조사에서우리나라학생들의 75% 가 내가가장존경하는인물은부모님이라고생각한다 라든가 기상청발표에의하면내일서울에비가올확률은 40% 이다 라는것이그예이다. 통계조사는대부분표본조사로실시되며, 표본조사는우리생활속에서사회적또는자연적집단에대한정보를얻는효과적인수단중하나이다. 표본조사는경제성, 신속성, 정확성을고려하여, 최소의비용으로정확도 (accuracy) 를최대한높이는조사라야한다. 표본설계시가장고려해야할사항은표본크기와추정치에대한정도 ( 정도, precision) 이다. 표본크기가필요이상으로크면추정의정도는높아지나과다한비용이요구되며, 반대로표본의크기가너무작으면비용은감소하나추정의정도가작아진다. 따라서, 표본크기만고려한결과추정치의정도가높지않다면바람직한표본조사라고할수없으므로, 표본설계의목적은가능한한적은비용으로될수있는작은분산을갖는추정량을찾아내고자하는데있다. 따라서, 바람직한표본설계의기준으로는최소비용으로요구하는정도를얻거나또는주어진비용으로어떤특성치의추정치가최대정도를가진것이라고할수있다. 또한, 표본설계는적절한표본크기의결정과이표본들의적절한추출방법을고려하여야하며, 모집단의성격과조사의목적을고려하여추출방법과배분방법을생각해야한다. 대표적인표본추출방법과배분방법을생각해야한다. 대표적인표본추출방법으로는단순임의추출법 (simple random sampling method), 층화추출방법 (stratified sampling method), 계통추출방법 (systematic sampling method), 집락추출방법 (cluster sampling method) 등을들수있다. 일반적으로사업체부문표본조사의표본설계시에는네이만배분법 (Neyman allocation method) 과수정절차법 (modified cut-off sampling method) 을주로사용하는데, 이방법들을사용하는것이현실적으로타당

네이만배분법과수정절사법의효율성비교 79 성이있는지에대한검정과두방법에대한효율성을비교해보는것이본연구의목적이다. 우선네이만배분법과수정절사법에대해기술하고, 층별분산과왜도에따른 4가지유형의모집단에대한모의실험을통하여두방법의효율성을비교하였다. 허용오차를일정수준으로고정한상태에서네이만배분법과수정절사법의표본크기를비교하여비용측면의효율성을알아보고, 동일한표본크기를각방법으로추출했을때허용오차와변이계수 (coefficient of variation, CV) 를비교하여두방법에의한추정치의효율성을알아보았다. Ⅱ. 네이만배분법 층화추출에서는모집단을유사한특성을가진여러개의중복되지않는부분집단을층 (stratum) 으로나눈다. 층을형성하는것을층화 (stratification) 라하며, 층화를한다음각층에서표본을추출하여모집단의특성치를추정하는것을층화추출이라고한다. 층화추출에서의표본배정방법은표본크기 ( n) 를각층에합리적으로배정하는방법을가리키는데, 표본의배분은각층의크기와층내변동에따라결정된다. 대표적인방법으로는비례배분방법 (proportional allocation method) 과최적배분방법 (optimum allocation method) 을들수있다. 비례배분방법은각층의크기 ( N h ) 는알수있지만층내변동에관하여전혀알수없는경우에표본크기 ( n) 를모집단에대한각층의크기에비례하여배정하는방법으로시행하기쉽고집계하는데간편하며크기가작은층이크기가큰층보다층내변동이작다는가정을전제로한다. 최적배분방법은표본의크기 ( n) 를각층에배분하는데있어서, 일정한비용하에서분산 V(y st )? 을최소로하여각층에배정하거나, 일정한분산 V(y st )? 하에서비용을최소로하는각층의표본크기 ( n h ) 를결정하는방법이다.( 박홍래 1992).

80 네이만배분법은최적배분방법의특수한경우로표본의크기 ( n) 를일정하게정하게하고추정량의분산을보다작게하여정도를높인배분법 으로총표본크기 ( n) 와각층에대한최적의표본크기 ( n h ) 는다음과같다. n = ( W h S h ) 2 E 2 + W h S 2 h/n (1-1) n h =n ( N h S h N h S h ) (1-2) 여기서 N 는모집단크기를나타내고, N h 는 h 층의모집단크기이며, E(=d/k) 는허용오차이다. k는신뢰수준을, d(=x-xˆ) 는정도를의미하며, W h (=N h /N) 는 h층의가중치를나타낸다. 또한네이만배분법에의한 모집단총계의추정량 ( τˆ ney ) 및그추정량의분산 ( ˆV( τˆ ney )) 그리고변이계수 ((CV( ˆ τˆ ney )) 는다음과같다. τˆ ney = L h =1 ( N h n h n h y hi ) (1-3) i=1 ˆV( τˆ ney )= L N 2 (N h - n h ) h s h (1-4) h N h n h ˆCV( τˆ ˆ ney )= V( τˆ ney ) 100 τˆ ney 2 (1-5) 여기서 y hi 는 h 층내 i 번째단위의특성치이다. s h 2 는 h 층의표본분산 이고, y h 는 h 층의표본평균을나타내며, 이의수식은다음과같다.

네이만배분법과수정절사법의효율성비교 81 s h 2 = n h (y hi - y h ) 2 i n h -1 (1-6) n h y h = i y hi n h (1-7) 네이만배분법은층별분산을고려하여표본을추출하는것으로일반적으로비례배분법에비해상대효율이크다. 특히층별분산이매우상이한층이적어도 2개이상있고, 그층의크기가모집단에서상대적으로그다지작지않을경우에매우효과적이다. 그러나이와같은조건이충족되지못할경우에는큰효과를기대할수없으며, 층별분산의근사치를사용한다면그효과가반감될수도있다. 여러가지항목을조사할경우에각항목마다층별분산이다른데특정항목에만초점을맞추어최적배분시키면, 다른항목에대해서는최적배분이되지않을뿐만아니라비례배분방법보다효율이떨어질수도있다 ( 박재수 1989). Ⅲ. 수정절사법 모집단을특성치의크기에의해다음과같이두개의층으로층화해보자. 모집단의추정에 90% 이상기여를하지만추출단위수는전체모집단의일부분에해당하는대규모층과모집단추정에미미한부분을차지하지만추출단위수는전체모집단의대부분을차지하는소규모층으로층화를한다. 이때, 모집단추정에큰영향이없는소규모층은조사를하지않고, 대규모층만조사를하여전체모집단에대한추정을하는방법을절사법 ( 切사법, the cut-off sampling method) 이라한다. 이방법은모집단의특성치의분포가한쪽으로편중되어있고, 소규모추출단위의표본틀에대해신뢰성이없는경우에주로사용한다. 그러나, 급성장하여특성치의크기가상당히커진추출단위가절사된소규모층에포함됐을경우에는좋은추정치를얻을수없으므로, 변화가심한모집단의경우에는

82 주의하여야한다. 일반적으로대규모층이전체모집단의추정에미치는영향이 90% 이하일경우에는절사법이적합하지않다 (Hansen, Hurwits and Madow 1953). 이러한절사법을보완한것으로수정절사법이있다. 이방법은전체추정에상당한기여를하는대규모층은전수조사를하고, 모집단추정에큰영향이없는소규모층 ( 표본층 ) 에서는표본을추출하여대규모층 ( 전수층 ) 의부족한범위 (coverage) 를보완하도록하는표본설계방법이다.(Hidiroglou 1986). 이는원래의절사법을약간변형시킨것으로모집단추정에도무리가없고, 표본크기를축소하는효과를가져오며, 소규모추출단위의표본틀에대해신뢰성이있는경우에사용하면절사법보다효율적이다. 수정절사법에의한표본설계는동일한허용오차범위내에서최소가되는표본크기를찾을수있으며, 대규모층에포함되는추출단위가전체모집단에기여하는비중이커서표본관리를집중적으로할수있고, 최소의표본크기이므로조사업무의부담이줄어비표본오차를줄이는효과가있다 ( 통계청 1991). 수정절사법에의한표본층의표본크기 ( n s ) 공식은다음과같다. n s = k 2 (Q m CV m ) 2 E 2 1+ k 2 (Q m CV m ) 2 N s E 2 (2-1) 여기서 N s 는표본층의모집단크기를나타내며, Q m 는 m 번째특성치총 계중표본층이차지하는비 ( 比 ), CV m 는표본층의 m 번째특성치의변이 계수로 m = 1,,N 이며, 수식으로나타내면다음과같다. Q m =1-P m (2-2)

네이만배분법과수정절사법의효율성비교 83 (2-3) P m = m -1 x i i=1 N x i i=1 CV m = VAR m MEAN m = 표준편차평균 (2-4) 여기서, P m 은 m 번째특성치총계중전, 수층이차지하는비 ( 比 ) 이고, x 는특성치를의미한다. MEAN m = N i= m x i N s 은표본층의 m 번째특성치평균 이며, VAR m = 1 (N s -1) 성치의분산을나타낸다. N x 2 i - i = m ( N i = m N s x i ) 2 는표본층의 m 번째특 수정절사법에의한총표본크기는전수층의표본크기와표본층의표본크기를합하여구한다. n=n c +n s (2-5) 여기서 n c (=N c =N-N s ) 는전수층의표본크기이다. 수정절사법의표본추출방법은다음과같다. 추출단위를특성치의크기순으로나열한다음, 주어진표본오차 ( 허용오차 ) 와신뢰수준하에서표본층의표본크기 ( n s ) 를구한후, 표본크기인 n(=n c +n s ) 이최소가되는절사점 (cut-off point) 을정한다. 이절사점을중심으로전수층표본층 ( N s ) 으로구별하여, 절사점상위의전수층에속하는추출단위는모두표본에포함시키고, 절사점이하의표본층에서는비복원으로표본을계통추출한다. 이때, 모집단의총계의추정량 ( τˆ cut ) 및그추정량의분산 ( Vˆ( τˆ cut )) 그리 고변이계수 ( CV ˆ( τˆ cut )) 의수식은다음과같다.

84 τˆ cut = L h =1 Xˆ h = c X h + s X h cn h ˆ = i=1 x hi +( sn h sn h cn h ) x hi (2-6) i=1 Vˆ( τˆ cut) = h L s N 2 h ( s N h -sn h sn h ) ss2 h ss h (2-7) ˆCV( τˆ ˆ cut )= V( τˆ cut ) 100 (2-8) τˆ cut 여기서 sx hi 는 h층내표본층에서 I번째의특성치이고, ss 2 h 는 h층내표본층의표본분산을의미하며, s x h 은 h층내표본층의표본평균을나타낸다 (Glasser 1962; 통계청 1991). ss h 2 = sn k ( s x hi - s x hi ) 2 i sn h -1 (2-9) sn k sx h = i sx hi sn h (2-10) 수정절사법은특성치가작은추출단위가특성치가큰추출단위보다상대적으로많으며, 왜도 (skewness) 가상당히큰양수인모집단에많이적용된다. 그러나층화된모집단의인식부족으로인해모집단의특성에대해과대추정할수도있으며, 전수층 ( 또는표본층 ) 크기의급속한변동으로인해현상태의역현상을추정치에반영할수도있음을유의하여야한다 (Hansen, Hurwits and Madow 1953). Ⅳ. 모의실험각표본추출방법의효율성을알아보기위해임의의모집단에대한모의실험을통하여네이만배분법과수정절사법의효율성을비교해보자. 앞에서언급한바와같이, 네이만배분법은층별분산의차이가큰경우에사용하고, 수정절사법은왜도가상당히큰양수인경우에주로사용한다. 그러므로층별분산과왜도에의해다음과같이 4가지경우의모집단을

네이만배분법과수정절사법의효율성비교 85 가정하고, 각각의모집단에네이만배분법과수정절사법을적용하여두방법의효율성을비교해보기로한다. 첫번째모집단은층별분산의차이가나며모집단의분포형태가종모양인경우이고, 두번째모집단은층별분산의차이가나며모집단의분포형태가왼쪽으로치우친모양의경우이며, 세번째모집단은층별분산의차이가없으며모집단의분포형태가종모양인경우이고, 네번째모집단은층별분산의차이가없으며모집단의분포형태가왼쪽으로치우친경우이다. 이러한조건에맞게모집단규모를 2000개 4개층으로층화하여자료를임의로발생시킨다음, 허용오차를일정한수준으로고정한상태에서네이만배분법과수정절사법을각모집단에적용하여구한표본크기를비교하여비용측면의효율성을알아보았다. 또한, 각모집단에서두가지방법으로표본크기가같게 300개에서 500개까지 50개간격으로표본을 100 번추출했을때의허용오차 ( 조사의정도 ) 와총계에대한 100개변이계수의평균을비교하여추정치의효율성을알아보았다. 위와같은모의실험은각모집단의모든층에서표본추출에따른단위비용이일정하다는가정아래실행하였으며, 각모집단에대한실행결과는다음과같다. 첫번째, 층별분산의차이가있고, 모집단의분포형태가종모양인경우이다. < 표 3.1> 는각층별모집단의특성치및분포형태를나타내며, 두가지방법에의한허용오차에따른표본크기는 < 표 3.2> 와같고, 동일한표본크기에대대두방법으로표본을추출했을경우에각방법에대한허용오차와총계에대한변이계수는 < 표 3.3> 과같다. < 표 3.1 > 층별모집단특성치및분포형태

86 < 표 3.2> 에서허용오차가 1% 일때, 수정절사법에의한표본크기가네이만배분법에의한표본크기보다약간크지만, 허용오차가증가할수록두방법의표본크기의차이가점점커지는것을알수있다. < 표 3.2> 에서허용오차가 1% 일때네이만배분법과수정절사법에의한표본크기는모집단의약 65%, 약 74% 로차이가그다지크지않다. 또한허용오차가 1% 에서 9% 까지증가함에따라네이만배분법에의해필요한표본크기는모집단의약 65% 에서약 3% 로감소하였고 ( 62%, 표본수는 1247개 ), 수정절사법의경우는약 74% 에서약 11% 로감소하여 ( 63%, 표본수는 1256개 ), 허용오차가증가함에따라표본크기의감소비율및표본수는비슷하게나타난다. 그렇지만, 요구하는표본크기의차이는점점커져, 허용오차가 9% 일때네이만배분법은단지 52개의표본만을필요로하는반면에수정절사법은네이만배분법보다약 4배많은 216개의표본을필요로한다. 또한, 허용오차가증가함에따라네이만배분법의경우는표본크기가급격히감소하는반면에수정절사법의경우는서서히감소한다. 그러므로네이만배분법에의해표본설계하는것이수정절사법에의해표본설계하는것보다비용절감의효과가더있다고할수있다.

네이만배분법과수정절사법의효율성비교 87 < 표 3.3> 에서수정절사법에대한네이만배분법의상대효율인 ˆRE ney = CV( τˆ cut ) cut ˆCV( τˆ 의평균은약 1.5로네이만배분법이수정절사법보 cut ) 다효율성이약 1.5배높게나타난다. 또한동일한표본크기를수정절사법으로추출했을때의허용오차가네이만배분법으로추출했을때의허용오차보다평균적으로약 2배정도높다. 이는동일한표본크기를추출했을때, 네이만배분법에의한추정치의정도가수정절사법에의한추정치정도보다약 2배정도더높다는의미로해석할수있다. 그러므로층별분산의차이가있고종모양의분포형태를나타내는모집단의경우에는네이만배분법에의해표본설계하는것이수정절사법에의해표본설계하는것모다비용절감의효과도크고, 추정치에대한효율성도높다.

88 < 표 3.3> 표본크기에따른허용오차및변이계수 (N=2000, k=1.96) 항목 네이만배분법 수정절사법 크기 허용오차 (%) 변이계수 (%) 허용오차 (%) 변이계수 (%) 300 3.52 4.69 7.30 7.51 350 3.20 3.95 6.57 6.07 400 2.95 3.40 5.97 5.08 450 2.73 3.00 5.45 4.38 500 2.54 2.65 5.00 3.76 두번째, 층별분산의차이가있고, 모집단의분포형태가왼쪽으로치우친경우이다. < 표 3.4> 은각층별특성치및분포형태를나타내며, 두가지방법에의한허용오차에따른표본크기는 < 표 3.5> 와같고, 동일한표본크기에대해두방법으로표본을추출했을경우, 각방법에대한허용오차와총계에대한변이계수는 < 표 3.6> 과같다.

네이만배분법과수정절사법의효율성비교 89 < 표 3.5> 에서허용오차가 1% 일때네이만배분법이수정절사법보다약 3배정도많은표본을요구한다. 이는모든층의단위비용이일정하다고가정했을때, 네이만배분법에의한표본설계가수정절사법에의한표본설계보다약 3배정도비용이더소요된다는것을의미한다. < 표 3.5> 에서허용오차가 1% 일때, 네이만배분법은모집단의약 86% 의표본을필요로하는반면에수정절사법은단지전체의약 27% 의표본만을필요로한다. 허용오차가증가함에따라두방법모두표본크기가점차감소하여, 허용오차가 9% 일때네이만배분법의경우는 392개의표본이감소했고수정절사법은 211개표본이감소했다. 단순하게표본크기의감소만을비교하면, 네이만배분법이수정절사법보다더많이감소했지만, 표본크기는네이만배분법이수정절사법보다평균적으로약 4배정도많다. 그러므로, 수정절사법에의해표본설계하는것이네이만배분법에의해표본설계하는것보다비용절감의효과가크게나타난다.

90 < 표 3.6> 에서동일한표본크기를두방법으로추출하였을때의허용오차및총계에대한변이계수는네이만배분법보다수정절사법이훨씬작아수정절사법이네이만배분법보다효율성이높게나타난다. 그러므로, 층별분산의차이가있고모집단의형태가왼쪽으로치우친경우에는수정절사법으로표본설계를하는것이비용절감효과가크고, 효율성도높다. < 표 3.6 > 표본크기에따른허용오차및변이계수 (N=2000, k=1.96) 크기 항목 네이만배분법 수정절사법 허용오차 (%) 변이계수 (%) 허용오차 (%) 변이계수 (%) 300 32.5 43.11 11.00 19.19 350 29.6 37.18 6.65 11.45 400 27.2 30.53 4.00 6.64 450 25.2 27.81 2.30 4.33 500 23.5 24.32 1.35 1.93 세번째, 층별분산의차이가없고, 모집단의분포형태가종모양인경우이다. < 표 3.7> 은각층별특성치및분포형태를나타내며, 두가지방법에의한허용오차에따른표본크기는 < 표 3.8> 와같고, 동일한표본크기에대해두방법으로표본을추출했을경우각방법에대한허용오차와총계에대한변이계수는 < 표 3.9> 과같다.

네이만배분법과수정절사법의효율성비교 91 < 표 3.8> 에서허용오차가 1% 일때수정절사법에의한표본크기가네이만배분법에의한표본크기보다약 1.3배크며, 허용오차가커질수록두방법이요구하는표본크기의차이가점점커지게된다. 허용오차가 1% 에서 9% 로증가함에따라네이만배분법에의한표본크기는모집단의약 58% 에서약 2% 로감소하였고 ( 56%, 표본수는 1120 개 ), 수정절사법에의한표본크기는모집단의 74% 에서약 6% 로감소하여 ( 68%, 표본수는 1341개 ), 수정절사법에네이만배분법보다감소한느정도가크다. 그렇지만동일한허용오차에서필요한표본크기는네이만배분법이수정절사법보다작아, 허용오차가 9% 일때네이만배분법은단지 34 개의표본만을필요로하고, 수정절사법은네이만배분법보다약 3.6배많은 124개의표본을필요로한다. 그러므로네이만배분법에의한표본설계가수정절사법에의한표본설계보다비용절감의효과가크다고할수있다.

92 < 표 3.8 > 허용오차에따른표본크기 (N=2000, k=1.96) < 표 3.9.1> 에서수정절사법에대한네이만배붑의상대효율인 ˆRE( ney cut )= CV( τˆ cut ) ˆCV( τˆ 의평균은약 1.1로네이만배분법이수정절사법 ney ) 보다효율성이높으며, 수정절사법으로추출했을때의허용오차가네이만배분법으로추출했을때의허용오차보다평균적으로약 1.9배높게나타난다. 이는동일한표본크기에의해추정했을때, 네이만배분법으로추정된추정치가수정절사법에의한추정치보다신뢰도가약 1.9배높다라는의미로해석할수있다. 그러므로, 네이만배분법이수정된절사법보다효율성이좋다고할수있다. 그런데모집단크기가 1000개미만인경우에는수정절사법이네이만배분법보다효율성이약간높은경우가발생하여변이계수만으로는어느방법이효율성이높은지판정하기가어려운경우가있다. 하지만동일한표본크기를추출하기위한허용오차는모집단크기에관계없이수정절사법이네이만배분법보다높게나타난다. < 표 3.9.2> 는표본규모를 200개 4 개층으로하여, 각모집단에서두가지방법으로표본크기가같게 100번

네이만배분법과수정절사법의효율성비교 93 추출했을때의허용오차 ( 조사의정도 ) 와총계에대한 100개변이계수의평균을비교한표이다. < 표 3.9.2> 에서표본규모를 130,,160개로 10개씩증가했을때두방법에대한상대효율을비교해보면, 수정된절사법에대한네이만배분법의상대효율인ˆRE( ney cut )= CV( τˆ cut ) ˆCV( τˆ ney ) 의평균은약 0.84로네이만배분법이수정된절사법보다효율성이낮게나타난다. 하지만동일한표본규모를추출하기위한허용오차는수정된절사법으로추출했을경우의허용오차가네이만배분법으로추출했을때의허용오차보다평균적으로약 1.5배정도높아네이만배분법이수정된절사법보다효율성이높게나타난다. 그러므로층별분산의차이가없고모집단분포형태가종모양인경우에는네이만배분법에의해표본설계하는것이수정절사법에의해표본설계하는것보다비용절감의효과도크고추정치에대한효율성도높다. 그렇지만, 층별분산의차이가있고분포형태가종모양인모집단보다는그효과가작게나타남을알수있었다. < 표 3.9.1 > 표본크기에따른허용오차및변이계수 (N=2000, k=1.96) 항목 네이만배분법 수정된절사법 크기 허용오차 (%) 변이계수 (%) 허용오차 (%) 변이계수 (%) 300 2.77 3.68 5.35 4.19 350 2.53 3.09 4.85 3.51 400 2.33 2.67 4.40 2.98 450 2.17 2.35 4.05 2.62 500 2.02 2.07 3.73 2.28

94 < 표 3.9.2. > 표본크기에따른허용오차및변이계수 (N=200, k=1.96) 항목 네이만배분법 수정된절사법 크기 허용오차 (%) 변이계수 (%) 허용오차 (%) 변이계수 (%) 130 3.15 1.98 4.85 1.75 140 2.80 1.72 4.30 1.48 150 2.45 1.48 3.50 1.19 160 2.12 1.24 2.95 0.99 네번째, 층별분산차이가없고모집단의분포형태가왼쪽으로치우친경우이다. < 표 3.10> 은각층별특성치및분포형태를나타내며, 두가지방법에의한허용오차에따른표본크기는 < 표 3.11> 와같고, 동일한표본크기에대해두방법으로표본을추출했을경우, 각방법에대한허용오차와총계에대한변이계수는 < 표 3.12> 과같다.

네이만배분법과수정절사법의효율성비교 95 < 표 3.11> 에서네이만배분법에의한표본크기가수정절사법에의한표본크기보다평균적으로약 4.5배크다. 이는모든층의단위비용이일정할때, 네이만배분법에의한표본설계가수정절사법에의한표본설계보다약 4.5배비용이더소요된다는것을의미한다. < 표 3.12> 를보면수정절사법에의한허용오차와총계에대한변이계수가네이만배분법보다훨씬작아수정절사법이네이만배분법보다효율성이높다. 그러므로층별분산의차이가없고분포형태가왼쪽으로치우친모집단의경우에는수정절사법에의해표본을추출하는것이네이만배분법에의해표본을추출하는것보다훨씬비용절감의효과가크고, 효율성도높다.

96 < 표 3.12 > 표본크기에따른허용오차및변이계수 (N=2000, k=1.96) 항목 네이만배분법 수정된절사법 크기 허용오차 (%) 변이계수 (%) 허용오차 (%) 변이계수 (%) 300 34.5 44.32 11.00 17.67 350 31.5 38.27 6.70 11.11 400 29.0 33.85 4.10 7.33 450 27.0 29.28 2.30 4.75 500 23.5 24.72 1.35 2.16 V. 결론 층별분산과왜도에따른 4가지유형의모집단에대해모의실험을해본결과, 모집단의분포형태에따라네이만배분법과수정절사법의효율성이다르게나타났으며, 통계조사의모집단의유형에따라그에적합한표본추출기법을적용하려는노력이보다적은비용과정도가높은추정치의도출을유도할수있음을알수있다. 모집단의분포형태가종모양인경우에는수정절사법보다네이만배분법을적용하는것이비용절감의효과가더컸지만, 추정치의효율성은층별분산에따라차이를보였다. 층별분산의차이가있는경우에는네이만배분법에의한추정치가효율성이높았으나, 층별분산의차이가없는경우에는어느방법에의한추정치가효율성이높은지판단하기가어려웠다. 하지만추정치의신뢰도를볼수있는허용오차는층별분산과관계없이네이만배분법이수정절사법보다작아, 결과적으로는네이만배분법에의한추정치가수정절사법에의한추정치보다효율성이높다고할수있다.

네이만배분법과수정절사법의효율성비교 97 그러므로모집단의분포형태가종모양인경우에는네이만배분법으로표본설계를하고, 모집단이왼쪽으로치우친분포형태인경우에는수정절사법을표본설계를하는것이효과적이라고할수있다. 특히대규모표본조사의표본설계시에는모집단의유형을감안하여신중하게표본선정기법을적용하여야할것이다.

98 < 참고문헌 > [1] 박재수 (1989), 표본조사법, 박영사. [2] 박홍래 (1992), 통계조사론, 영지문화사. [3] 통계청 (1991), 절사법표본설계응용. [4] 이상은 진영 (1997), 비용면에서 본 Modified Cut-off 방법과 Neyman 배분법의효 율성비교, 통계분석연구 제2권제1 호, 1-22, 통계청. [5] Cochran, W.G.(1963), Sample Tecniques, New York : John Wiely. [6] Glasser, G.J.(1962)," On the Complete Coverage of Large Units in a Statistical Study," The International Statistical Institute 30, 28-32. [7] Hansen, M.H., W.N. Hurwiz, and W.G. Madow(1953), Sample Survey Methods & Theory Vol.2, New York: John Wiley. [8] Hidiroglou,M.A.(1986)," The Construction of a Self-Representing Stratum of Large Units in Survey," The American Statistician 40, 27-31.

네이만배분법과수정절사법의효율성비교 99 Comparison of Efficiency between the Neyman Allocation and Modified Cut-off Methods Young Jin <Abstract> In sample design, the goremost issues are determining sample size and improving the precision of estimators. However, the costs of conducting a survey can comprise the integrity of those important issues. If each sample unit of the survey incurs the same cost, we can tell the cost of the survey from the sample size and measure the precision of the estimators with relative efficiency. Thus, determining the proper sample size can satisfy the one of the main purposes of sample survey, cost-efficiency. Minimizing the errors of estimators and variances of unbiased estimators from a sample survey will increase their precision. The Neyman allocation and modified cut-off methods are most commonly used for designing large-scale sample surveys such as establishment survey.