슬라이드 1

Similar documents
<4D F736F F F696E74202D20C1A636C1D620C7A5BABBC3DFC3E2B9E6B9FD20B0ADC0C72E >

자료의 이해 및 분석

10. ..

슬라이드 1

Microsoft PowerPoint - SDA 2014s_Ch3.pptx

ePapyrus PDF Document

대학생연수용교재 선거로본대한민국정치사

조사연구 권 호 DOI 연구논문 몽골의가축통계조사를위한표본설계연구 A Study on Sampling Design for the Mongolian Livestock Statistics Survey 주제어

statistics

조사연구 sampling error of polling sites and the additional error which comes from non-response, early voting and second stage sampling error of voters in

< 차례 > Ⅰ. 조사개요 1 Ⅱ. 통계의작성목적및이용 6 Ⅲ. 조사설계 12 Ⅳ. 자료수집 50 Ⅴ. 행정자료활용 87 Ⅵ. 자료처리 91 Ⅶ. 통계추정및분석 99 Ⅷ. 통계공표관리및이용자서비스 115 Ⅸ. 통계기반및개선 132 Ⅹ. 참고문헌 141

ad hwp

Ⅰ. 조사목적 본조사는전국민을대상으로대통령국정수행지지도, 정당지지도등을 파악하여, 국민여론을파악하는기초자료수집에그목적을둠. Ⅱ. 조사설계 조사대상 전국거주만 19세이상성인남녀 표본수 총 1,035 명조사후, 지역, 성, 연령별사후보정 표본오차 95% 신뢰수준에서최대허용

Microsoft Word - EDA_Univariate.docx

(001~006)개념RPM3-2(부속)

untitled

확률과통계6

1. 조사설계 조사대상 2017 년 2 월현재, 전국만 19 세이상남녀 표본의크기 조사방법 1,021 명 ( 가중전 1,021 명, 가중후 1,000 명 ) - 가중치를 1,000 명기준으로부여했으나, 보도시표본크기는 1,021 명으로보도해야함. 구조화된설문지를이용한전

조사연구 Key words: exit poll, sample size, primary sampling unit, secondary sampling unit, cluster, design effect, coefficient of variation Ⅰ. 서론 년 월의지방선

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

통계적 표본조사론 소개

조사연구 aim of this study is to find main cause of the forecasting error and bias of telephone survey. We use the telephone survey paradata released by N

통계적 표본조사론 소개

R t-..

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

목차

발간등록번호

Resampling Methods

한국정책학회학회보

지지정당별지방선거투표의향별국정수행평가별국무총리인선평가별정부개각범위의견별사전투표제인지별사전투표참여의향별지방선거성격공감별차기대선후보선호도별성 * 연령별 자영업 (102) 블루칼라 (96) 12.

표본재추출(resampling) 방법

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

확률과통계 강의자료-1.hwp

발간등록번호

한국갤럽 데일리정치지표 년 6월 통합

< 차례 > Ⅰ. 조사개요 1 Ⅱ. 통계의작성목적및이용 4 Ⅲ. 조사설계 9 Ⅳ. 자료수집 25 Ⅴ. 자료처리 46 Ⅵ. 통계추정및분석 52 Ⅶ. 통계공표, 관리및이용자서비스 58 Ⅷ. 통계기반및개선 72 Ⅸ. 참고문헌 76

<C1B6BBE7B5BFC7E B9DAB9CEB1D45F B3E2BCADBFEFBCADBAA3C0CC2E687770>

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

용역보고서

[ 표 01] 응답자특성 성별 조사완료 목표할당 가중치 사례수 % 사례수 % 1, , 남성 여성

<C1B6BBE7BFACB1B82032B1C72031C8A BFACB1B8B3EDB9AE29202D20C0CCB1E2C0E72E687770>

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

Microsoft PowerPoint - IPYYUIHNPGFU


Ⅱ 모집단및표본추출틀 모집단정의 목표모집단 조사시점기준전국의만 세이상모든가구원 조사모집단 조사하기어려운기숙시설 특수사회시설 외국인거주 표본추출틀작성 지역에거주하는사람을제외한일반가구의가구원 년인총 표본조사구및 년세종시특별센서스의보통조사구 아파트조사구 와 년 월까지의신축아

공직선거법 제108조 ( 여론조사의결과공표금지등 ) 3 다음각호의어느하나에해당하는자를제외하고는누구든지선거일전 180일부터선거일의투표마감시각까지선거에관하여정당에대한지지도나당선인을예상하게하는여론조사 ( 공표 보도를목적으로하지아니하는여론조사를포함한다 ) 를실시하려면중앙선거관

한국갤럽 데일리정치지표 년 5월 통합

<B0E6B3B2BDC5B9AE5FB1E8C7D8C0BBBCB1B0C5B1B820BFA9B7D0C1B6BBE720BAB8B0EDBCAD2E687770>

조사연구 권 호 연구노트 사전투표득표율예측에대한연구 The Study on the Advance Voting Forecasting 1) 이찬복 a) 주제어 지방선거 사전투표 출구조사 득표율예측 예측오차 Advance voting was held nationwide in

= ``...(2011), , (.)''

자료의 이해 및 분석

[ 표 34] 원하는차기대통상 [ 표 35] 안철수원장의출마에견해 [ 표 36] 안철수원장과야당후보와의단일화에대한견해 [ 표 37] 단일화할경우누가로단일화되어야하는지에대한견해 [ 표 38] 공천비리사건에대한박근혜후보의책임여부.

슬라이드 1

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,514 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,514 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 79.1% + 유선전화

핵 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (14) 27 (29) 2

G Power

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

untitled

Microsoft PowerPoint - e pptx

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

... —....—

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

목차

한국갤럽 데일리정치지표

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

제 12강 함수수열의 평등수렴

한국갤럽 데일리 오피니언

행정학석사학위논문 공공기관기관장의전문성이 조직의성과에미치는영향 년 월 서울대학교행정대학원 행정학과행정학전공 유진아

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

Microsoft PowerPoint - SBE univariate5.pptx

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,008 명 ( 주의 : 통계보정으로 1,000 표본으로분석하였으며, 보도시에는조사실사례수 1,008 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 3.1% Point 조사방법 유선전화면접 49.7% + 무선전화

슬라이드 제목 없음

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>


목차

조사설계 조사대상 전국만 19 세이상남녀 조사규모 1,507 명 ( 주의 : 통계보정으로 1,500 표본으로분석하였으며, 보도시에는조사실사례수 1,507 명으로기재해야함 ) 표본오차 95% 신뢰수준에서 ± 2.5% Point 조사방법 무선전화면접 80% + 유선전화면접

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

A 목차


한국갤럽 데일리 오피니언

교육정책연구 2005-지정-52 공무원 채용시험이 대학교육, 노동시장에 미치는 영향분석 및 공무원 채용제도 개선방안 연구책임자 : 오 호 영 (한국직업능력개발원 부연구위원) 이 정책연구는 2005년도 교육인적자원부 인적자원개발 정책연구비 지원에 의 한

응답자분포표 전 체 (1527) 남 자 (756) 49.5 여 자 (771) 세 (281) 대 (314) 대 (336) 대 (288) 세이상 (308) 20.1 졸이

한국갤럽 데일리정치지표

제 1 부 연구 개요


[ 표 33] -김문수... 3 [ 표 34] -문재인... 7 [ 표 35] -박근혜 [ 표 36] -손규 [ 표 37] -안철수 [ 표 38] -정몽준 [ 표 3] 지난 1년간가정살림변화 [ 표 40] 지

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표


<C1B6BBE7BFACB1B835B1C732C8A328312EC1B6BCBAB0E2292E687770>

뉴스평가지수의개발과적용

메타분석: 통계적 방법의 기초

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

... —... ..—

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft Word - Chapter3.doc

약관

<B0E6B3B2BDC5B9AE5FC3A2BFF8BDC3BCBABBEAB1B8BCB1B0C5B1B820BFA9B7D0C1B6BBE720BAB8B0EDBCAD2E687770>

[ 조사개요 ] 구분 내용 모집단 전국에거주하는만 19 세이상성인남녀 표집틀 유무선전화 RDD 표집방법 지역별, 성별, 연령별기준비례할당추출 표본크기 2,000 명 ( 유선 551 명 (27.55%), 무선 1,449 명 (72.45%)) 표본오차 무작위추출을전제할경우

Transcription:

1 강 통계조사개요 정보통계학과이기재교수 Copyright c 2013 한국방송통신대학교 All Rights Reserved.

학 / 습 / 목 / 차 1. 통계의영광과좌절 2. 통계조사 3. 표본조사의특성 4. 표본조사의기본용어 5. 표본추출법

영광 : 2012 년 12 월제 18 대대통령선거예측조사 여론조사결과 실제개표결과 박근혜 ( 새누리당 ) 경합 박근혜 ( 새누리당 ) 당선 득표율 50.10% 득표수 15,691,777 (51.6%) 문재인 ( 민주당 ) 경합 문재인 ( 민주당 ) 득표율 48.90% 득표수 14,605,743 (48.0%)

좌절 : 2012 년 4 월제 19 대국회의원선거예측조사 정당별실제의석수 새누리당 민주당 통합진보당 KBS 131-147 131-146 12-18 MBC 130-153 128-148 11-17 SBS 126-151 128-150 10-21 실제의석수 152 127 13

정보화시대의통계 생활속의통계예들여론조사, 물가지수, 주가지수, TV 시청률, 부동산가격정보, 일기예보, 야구기록등 통계 사회나집단의현상들을수량화한정보 통계의이용 통계학적개념에의거하여정보를체계적으로수집, 정리하고그결과에따라합리적인의사결정을내림

학 / 습 / 목 / 차 1. 통계의영광과좌절 2. 통계조사 3. 표본조사의특성 4. 표본조사의기본용어 5. 표본추출법

통계조사 (survey) 와실험 (experiment) 통계조사복잡한사회또는집단의어떤현상을수량화함으로써객관적이고, 구체적인특징을파악하기위한일련의과정 실험 연구자가실험환경을통제하고조작을가함으로써특정처리의 효과를파악하는과정

통계조사 (survey) 와실험 (experiment) 예제 : 흡연이폐암에미치는영향 실험 처리그룹 대조그룹 매일일정한수준의흡연 일정시간경과후폐의상태점검 금연 조사 : 폐암환자들의흡연정도조사 통계조사전수조사 표본조사

우리나라의대표적인통계조사예들 < 예 1.1> 인구주택총조사 출처 : 통계청사회통계국인구조사과

우리나라의대표적인통계조사예들 < 예 1.2> 대통령선거여론조사 후보자개표결과여론조사출처 13 대 (1987) 노태우김영삼김대중 36.6% 28.0% 27.1% 34.5% 28.9% 27.9% 한국갤럽 14 대 (1992) 15 대 (1997) 16 대 (2002) 김영삼김대중정주영김대중이회창이인제노무현이회창권영길 42.0% 33.8% 16.3% 40.3% 38.7% 19.2% 48.9% 46.6% 3.9% 39.6% 31.1% 15.7% 39.9% 38.9% 19.7% 49.1% 46.8% 3.5% 한국갤럽 MBC KBS 제 17 대 (2007 년 ) 이명박정동영이회창 48.7% 26.1% 15.07% 50.3% 26.0% 13.5% KBS-MBC 공동 제 18 대 (2012 년 ) 박근혜문재인 51.6% 48.0% 50.1% 48.9% 방송 3 사공동

통계조사의역사 고대 ~ 현대에이르기까지의역사 고대 징병, 징세목적의호구, 호적조사 ( 예 ) BC 15 세기, 구약성경민수기의인구조사 근대적조사의 기원 19 세기 현대표본이론의 기초 1930 년대 최초의선거여론조사 1936 년미국대통령선거

전수조사 (complete enumeration survey) 일명센서스 (Census) 조사대상으로하는집단의모든개개의단위를조사하는방법 예인구주택총조사, 농업총조사, 사업체총조사등 사용목적어떤정책결정의중요한기초자료로사용 다른표본조사의기초자료로활용 ( 전수조사자료는다른표본조사의추출틀로사용됨 ) 전수조사의어려운점 엄청난조사비용및시간소요 숙련된많은수의조사원필요

표본조사 (sample survey) 전체모집단중에서과학적인추출방법에따라추출된일부분을대상으로조사하여얻어진정보를토대로전체모집단에대한특성을추정하는방법

학 / 습 / 목 / 차 1. 통계의영광과좌절 2. 통계조사 3. 표본조사의특성 4. 표본조사의기본용어 5. 표본추출법

표본조사의장점 1 경제성 2 3 신속성 심도있는조사가가능하다는측면 4 조사의정확성 5 숙명적필요성

표본조사의단점 1 모집단을제대로대표하지못하는표본을사용할경우잘못된통계를만들게됨 사례 : 1936 년 Literary Digest 사의미국대통령선거여론조사 - 전화번호부와자동차등록대장을사용하여 1000만여명우편조사 : 230여명만응답 - 랜돈 : 루즈벨트 = 55 : 45로랜돈승리예측 - 실제결과 : 루즈벨트후보의압도적승리 서민층이과소추출된결과 2 희소한부차모집단 ( 소지역별자료 ) 의특성까지알기는힘듦

전수조사의표본조사에대한역할 1 모집단상황에대한기초자료와추출틀로사용됨 2 전수조사자료는모수추정과정에서중요한자료로이용됨

학 / 습 / 목 / 차 1. 통계의영광과좌절 2. 통계조사 3. 표본조사의특성 4. 표본조사의기본용어 5. 표본추출법

기본단위 (elementary unit : 조사단위, 단위 ) 필요한정보를얻기위해조사를할때조사대상이되는최소의요소 명확하게정의되어야하고, 구체적으로확인할수있어야함 여론조사 : 개인 가계조사 : 가구 작물생산량조사 : 일정면적의경지

모집단 (population) 조사목적에의하여규정되는모든기본단위들의모임 유한모집단, 무한모집단 명확한정의가필요 예 ) 농가 300 평이상의경지에농사를짓는가구 목표모집단, 조사가능모집단 목표모집단 : 조사목적에의해개념상규정된모집단조사가능모집단 : 표본을추출하기위해규정된모집단

추출단위 (sampling unit) 표본추출을위해설정한기본단위들의모임 모든기본단위가누락, 중복되지않고추출단위에포함되게해야함 예 ) 여론조사 개인을추출하는경우 : 추출단위 = 기본단위 = 가구 가구를추출하는경우 : 추출단위 = 가구, 기본단위 = 유권

추출틀 (sampling frame) 모집단에속하는모든추출단위의목록 개인, 가구, 사업체등의명부, 문서철, 지도등모집단의모든추출단위를누락없이그리고중복없이포함예 ) 1936년미국의여론조사실패 : 불완전한추출틀이주요원인추출틀의작성가능성을염두에두고추출틀결정 < 예 1.4> 경북지역사과나무한그루당평균수확량조사 기본단위목표모집단조사가능모집단추출단위추출틀 사과나무그루경북에있는모든사과나무들경북의등록된과수원에있는사과나무들과수원경북지역과수원목록

학 / 습 / 목 / 차 1. 통계의영광과좌절 2. 통계조사 3. 표본조사의특성 4. 표본조사의기본용어 5. 표본추출법

표본 (sample) 모집단의특성치를알아보기위하여모집단의기본단위중에서추출된부분집합 표본설계 (design of sample survey) 시의고려사항 모집단특성에대한대표성지니면서도경제적추출법 표본오차를목표수준이내로유지하면서비용을최소화하는표본크기결정 효율적인추정방식

확률추출법 (probability sampling) 추출단위에대하여사전에정해진추출확률에따라표본을추출하는방법 단순임의추출법, 층화추출법, 계통추출법, 집락추출법 표본이모집단의특성이나구조를잘반영하여조사결과를모집단으로일반화가능 추정량의통계적오차를확률적으로계산가능함

비확률추출법 (non-probability sampling) 추출단위들이표본으로추출될확률을객관적으로나타낼수없음대부분조사자의주관적판단에의해표본을추출전형법 (typical sampling method), 할당법 (quota sampling method) 한계 : 추정값의정확성평가불가, 과학적인조사방법이아님 < 예 1.5> 예이츠 (Yates) 의실험 실제 1200 개돌의무게 = 54.15 그램 비확률추출법적용 : 추정평균 = 66.34 그램 - 12 명에게모집단을잘대표한다고생각하는크기 20 개의 표본을전형법으로뽑는시행을 3 번씩반복하도록함 각각의조사자가얻은표본평균의평균을구함

비확률추출법 (non-probability sampling) < 예 1.6> 미국대통령선거여론조사의예 연도 여론조사결과 실제선거결과 1936 1940 1944 1948 1952 1956 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004 2008 2012 루우즈벨트 (55.7%) 루우즈벨트 (52.0%) 루우즈벨트 (51.5%) 듀이 (49.5%) 아이젠아워 (51.0%) 아이젠아워 (59.5%) 케네디 (51.0%) 존슨 (64.0%) 닉슨 (43.0%) 닉슨 (62.0%) 카터 (48.0%) 레이건 (47.0%) 레이건 (59.0%) 부시 (56.0%) 클린턴 (49.0%) 클린턴 (48.0%) W. 부시 (47.0%) W. 부시 (49.0%) 오바마 (53.0%) 오바마 (49.0%) 루우즈벨트 (62.5%) 루우즈벨트 (55.0%) 루우즈벨트 (52.3%) 트루먼 (49.5%) 아이젠아워 (55.4%) 아이젠아워 (57.8%) 케네디 (50.1%) 존슨 (61.3%) 닉슨 (43.5%) 닉슨 (61.8%) 카터 (50.0%) 레이건 (50.8%) 레이건 (59.2%) 부시 (53.4%) 클린턴 (43.0%) 클린턴 (49.2%) W. 부시 (47.9%) W. 부시 (50.7%) 오바마 (52.9%) 오바마 (51.0%) 출처 : 한국갤럽조사연구소

2 강 표본조사의기본개념 정보통계학과이기재교수 Copyright c 2013 한국방송통신대학교 All Rights Reserved.

학 / 습 / 목 / 차 1. 모집단분포 2. 표본분포 3. 추정 4. 엑셀을활용한실습

가상의모집단예 1. 모수모집단의특성값 ( 예 ) 모평균, 모분산, 모비율, 모총계등 2. 모평균 모집단의중심위치의척도 3. 모분산모집단에서각단위들이모평균으로부터흩어진정도

가상의모집단예 예제

모수추정 표본조사의목적은표본의데이터로모수 ( 모집단특성치 ) 를추론하는것 모수 추정량 모평균 ( ) 모분산 ( ) 표본평균 ( ) 표본분산 ( )

모수추정 예제 1-1 6 개의표본데이터 : 3 0 9 8 5 2 표본평균 : 표본분산 :

학 / 습 / 목 / 차 1. 모집단분포 2. 표본분포 3. 추정 4. 엑셀을활용한실습

표본분포 1. 표본추출변동 동일한모집단에서같은표본추출방법으로같은크기의표본을 추출할지라도각표본에서계산된추정량의값은표본마다달라지는것 2. 표본분포같은크기의확률표본을무한반복해서추출할때각표본으로부터 계산되는추정량이이루는분포 [ 표본평균의표본분포 ] 가능한모든표본으로부터표본평균 ( ) 을계산하여 구한표본평균 ( ) 의분포 < 참고 > 중심극한정리 (central limit theorem)

표본분포 < 참고 > 중심극한정리 (central limit theorem) 표본크기가커지면표본평균은근사적으로정규분포를따름 무한집단에서표본평균의분포

학 / 습 / 목 / 차 1. 모집단분포 2. 표본분포 3. 추정 4. 엑셀을활용한실습

추정의핵심내용 추정량유도 추정량의정도 (precision) 파악을위한추정량분산계산

표본추출과추정량 모집단 (population) 표본 (sample) 모수 (parameter) 통계량 (statistic) 통계값 우리가관심을갖고있는조사변수에대한모집단전체의특성치를요약한수치 표본자료를조사하여모수를추정하기위해만든식

바람직한추정량의성질 1. 비편향성 (unbiasedness) 반복해서표본을추출할때표본으로부터계산된통계치가 모수를과대또는과소추정하는경향이없는것 편향 비편향 2. 효율성 (efficiency) 추정량을비교할때만약의분산이의 분산보다작다면이보다효율적이라고함 ( 추정량의정확도평가척도 ) 효율적 비효율적

바람직한추정량의성질 1 일반적으로두추정량이모두비편향추정량이거나편향을무시할수있는경우에는두추정량중에서분산이작은추정량을사용해야함 2 어떤추정량의분산이작다는의미는같은크기의표본을다시반복해서추출하여통계치를구한다고할때구해진통계치는현재구한통계치와유사한값을나타낼것이라는확률적보증이라고할수있음

표본오차 (sampling error) 표본에서구한결과와센서스의결과 ( 모수 ) 의차이 표본오차 = 모집단의참값 ( 모수 ) - 모수에대한추정치 = 모집단의일부를표본추출하여조사하여추정함으로써발생하는우연적오차

표본오차의통계적표현 추정량의표준오차 (standard error) 추정량의 100(1- )% 신뢰구간 (confidence interval) 오차의한계 (bound of error) 추정량의상대표준오차 : 추정량의정도 ( 精度 ) 를나타내는상대적기준 < 참고 > 추정량의변동계수 (coefficient of variation : CV) 라고도함

표본오차의통계적표현 예제 1-1 2 명조사하여 1 명지지한경우와 2,000 명조사하여 1,000 명지지한경우모두지지율은 50% 인가? 2 명조사 : 오차의한계 50%, 오차가너무커서현재추정값은정보로서가치없음 2,000 명조사 : 오차의한계 2%, 현재추정값은가치있는정보라고할수있음 오차의한계계산 : 여론조사정확도에대한통계학적근거

표본오차의통계적표현 예제 1-2 도시가구들의월평균소득액추정을위한표본조사 표본수 목표정도 (target precision) 표본조사를기획할때설정하는오차의수준 달성정도 (attained precision) 표본조사결과얻어진데이터로부터계산한오차의수준

3 강 단순임의추출법 (1) 정보통계학과이기재교수 Copyright c 2013 한국방송통신대학교 All Rights Reserved.

학 / 습 / 목 / 차 1. 개요 2. 단순임의표본의추출 3. 모수의추정 4. 엑셀을활용한실습

복원 vs 비복원 1. 복원추출 (sampling with replacement) 동일한추출단위가표본에반복적으로추출되는것이 가능한경우 2. 비복원추출 (sampling without replacement) 동일한추출단위는표본에한번이상추출되지않는경우 < 참고 > 무한모집단 : 복원추출 비복원추출

단순임의추출법의특징 가장단순한방법의확률추출법으로다른표본추출법의이론적인기초가됨소규모조사나예비조사 (pilot survey) 에서주로사용됨모집단의어느부분도과대하게또는과소하게반영하지않음 예비조사는소규모로실시하여조사표가잘작성되었는가? 조사방법과조사과정은적절한가? 등을검토하기위하여실시됨. 표본크기를정하고자할때과거조사결과나비슷한조사가없어모분산을모르는경우에이를추정하기위해서예비조사를실시되기도함

비복원단순임의추출법 (simple random sampling without replacement: SRSWOR) 크기가인모집단에서크기가인표본을추출하고자한다 면가지의추출가능한표본들이존재하게된다. 이들 가지의표본에대해추출확률을모두동일하게해주는 표본추출방법을단순임의추출법이라고한다. 예제 2-1 모집단 U = {1,2,3,4} 에서크기 2인표본을단순임의추출할경우가능한표본 {1, 2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {3, 4} 위의 6 가지표본각각이추출될확률은 1/6 로동일

단순임의추출법의예 1. 정부의어떤정책에대한여론조사각지역별로단순임의추출 2. 선거여론조사를위한전화조사단순임의추출에의해전화번호선정 3. 시장조사 (marketing research) 자동차의색상에대한잠재고객들이선호도조사 4. 생산제품의불량률조사생산제품중일부를단순임의추출하여조사

단순임의추출법의예 < 참고 > 임의 ( 任意, random) 추출이란? 아무렇게나추출한다는뜻이아님추출시일체의작위 ( 作爲 ) 를배제한다는뜻추출자의선택편향을제거하기위한수단

학 / 습 / 목 / 차 1. 개요 2. 단순임의표본의추출 3. 모수의추정 4. 엑셀을활용한실습

표본추출방법 1 모든추출단위들에대해 1 에서 N 까지의일련번호부여 2 1에서 N까지의값이나올확률이 1/N로동일하게하는하나의난수 (random number) 를추출 3 추출된난수의번호에해당하는추출단위를표본으로선택 < 참고 > 난수발생장치 (randomizing device) < 난수표 > < 회전판 > < 구슬상자 > 등

표본추출방법 예제 2-1 N = 450 명중 n = 20 명을단순임의추출 ( 난수표활용 ) 행 열 (1) (2) (3) (4) 1 10480 15011 01536 02011 2 22368 46573 25593 85393 3 24130 48360 22527 97265 4 42167 93093 06243 61680 5 37570 39975 81837 16656 6 77921 06907 11008 42751 7 99562 72905 56420 69994 8 96301 91977 05463 07972 9 89579 14342 63661 10281 10 85475 36857 53342 53988

학 / 습 / 목 / 차 1. 개요 2. 단순임의표본의추출 3. 모수의추정 4. 엑셀을활용한실습

모수의추정 1. 모집단 로표시 2. 모수 모평균 : 모총계 : 모분산 :

모평균의추정 단순임의표본의데이터 : 모평균추정량 = 표본평균 : 정리 2-1 1 크기의모집단에서크기인단순임의표본 ( 비복원 ) 을 추출하는경우에표본평균는모평균의비편향추정량임 2 모평균의추정량인표본평균의분산은

모평균의추정 예제 2-3 ㅊ모집단 : { 1, 2, 3, 4 } ( 단위 : 백만원 ) 의확률분포 표본 { 1, 2 } { 1, 3 } { 1, 4 } { 2, 3 } { 2, 4 } { 3, 4 } 1.5 2.0 2.5 2.5 3.0 3.5 ㅊ 1/6 1/6 1/6 1/6 1/6 1/6

분산의추정 단, 표본의크기 (n) 이커질수록분산추정값은줄어듦 유한모집단수정항 (finite population correction: fpc) : fpc 를무시하면기초통계학에서의추정량 과동일 1. 모평균에대한 100(1-α)% 신뢰구간 2. 100(1-α)% 신뢰도에서의오차한계

분산의추정 예제 2-4 표본데이터 3 4 3 3 5 3 4 4 3 5 6 3 4 3 4 3 3 4 4 3 평균가족수에대한 95% 신뢰구간

4 강 단순임의추출법 (2) 정보통계학과이기재교수 Copyright c 2013 한국방송통신대학교 All Rights Reserved.

학 / 습 / 목 / 차 1. 모총계의추정 2. 모비율의추정 3. 표본의크기결정 4. 엑셀을활용한실습

모총계의추정 1. 모총계 ( 모평균의함수 ) ( 예 ) 전국의쌀생산량, 가구의연간총전기소비량 2. 모총계의추정량 ( 모총계추정량은모총계에대한비편향추정량임 ) 모총계추정량에대한분산 : 분산의추정량 : 모총계의신뢰구간 :

모총계의추정 예제 2-5 어느지역의인구수추정 구획중구획을단순임의추출 모총계추정값 : 추정분산의값 : 총인구수에대한 95% 신뢰구간

학 / 습 / 목 / 차 1. 모총계의추정 2. 모비율의추정 3. 표본의크기결정 4. 엑셀을활용한실습

모비율의추정 1. 모비율 ( 예 ) 후보의지지율, 제품의시장점유율, TV 프로그램의시청률, 제품불량률 2. 모비율의추정량 ( 모비율추정량은비편향추정량임 ) 모비율추정량에대한분산 : 분산의추정량 : 모비율의신뢰구간 :

표본비율의분산추정식유도 모비율추정량인표본비율은각표본단위에서관측한값이 0 또는 1인경우에대한표본평균과동일함추정량의분산식은에서유도됨 각표본단위에서관측한이 0 이나 1 의값을갖는경우에해당함 대입

모비율의추정 예제 2-6 단순임의표본 1500명중 936명이지지하는후보자의 지지율추정 모비율추정값 : 분산추정값 : 95% 신뢰구간 :

학 / 습 / 목 / 차 1. 모총계의추정 2. 모비율의추정 3. 표본의크기결정 4. 엑셀을활용한실습

표본의크기결정 기본원칙 목표정도 ( 허용오차 ) 의범위내에서가능한한표본크기작게함 목표정도 (target precision) : 표본조사에서목표하는허용오차의한계 목표정도의형태절대오차의한계 : 추정량의오차한계가일정값이내상대오차의한계 : 추정량의변동계수가일정비율이내 표본의크기 추정의정확성 조사비용

절대오차의한계 B 가주어진경우 1. 모평균추정 의파악 과거자료에서얻은을이용하는방법 작은규모의예비조사를통해 을추정하는방법

절대오차의한계 B 가주어진경우 예제 2-7 이며,

절대오차의한계 B 가주어진경우 2. 모비율추정

절대오차의한계 B 가주어진경우 예제 2-8, 예비조사흡연률

절대오차의한계 B 가주어진경우 3. 모총계추정

절대오차의한계 B 가주어진경우 예제 2-9

상대오차의한계 D 가주어진경우 1. 모평균추정 상대오차의한계 : 추정량의상대표준오차 (relative standard error) 이고, 임

상대오차의한계 D 가주어진경우 예제 2-10

6 강 층화임의추출법 (1) 정보통계학과이기재교수 Copyright c 2013 한국방송통신대학교 All Rights Reserved.

학 / 습 / 목 / 차 1. 층화임의추출법의개요 2. 층화 3. 모평균추정 4. 엑셀을활용한실습

층화임의추출법의개요 예 전국서점에서의월간도서판매량조사 전국서점 35,050 개중 300 개의표본을추출 소규모서점 ( 매장 30 평미만 ) 중규모서점 (30 평이상 ~ 100 평미만 ) 대규모서점 (100 평이상 ) 서점수 30,000 서점수 5,000 서점수 50 단순임의추출법의문제점 대규모서점이표본에전혀뽑히지않을가능성높음 해결책 서점을규모별로구분한후각규모별로표본을추출

층화임의추출법의정의 층화 (stratification) 모집단을서로겹쳐지지않게몇개의부분군으로나누는일 층화는층화임의추출법의효율을결정하는가장중요한작업 층 (stratum) 모집단을겹치지않게몇개의부분군으로나누었을때각각의부분군 층화임의추출법 (stratified random sampling) sampling) 모집단을먼저서로겹치지않도록여러개의층으로분할한 후, 각층별로단순임의추출법을적용시켜표본을얻는방법

층화임의추출방법이널리사용되는이유 1 단순임의추출법에비해추정의정도를높일수있음 같은층에속한단위들이동질적 (homogeneous) 일수록효과적 2 전체추정뿐아니라각층별로도추정도가능 지역별, 특성별통계작성이가능 3 표본의대표성제고및조사관리편리, 조사비용절감

학 / 습 / 목 / 차 1. 층화임의추출법의개요 2. 층화 3. 모평균추정 4. 엑셀을활용한실습

층화변수 (1) 층화변수 (stratification variable) 모집단을몇개의층으로나누려고할때각추출단위가어느층에속하는지를구분하기위해기준으로사용되는변수 층화변수의선택시고려사항주변수와의관련성활용가능한보조정보의종류통계의작성단위 : 전국 or 시도별 or 시군별

층화변수 (2) 좋은층화변수 사전에모집단단위들의정보를쉽게알수있으면서도조사하고자하는주변수와밀접한관련이있는보조변수 층화변수선택의예 도서판매량조사여론조사사업체조사농작물생산량조사 서점의매장면적유권자의지역, 성별, 연령, 학력전년도매출액, 종업원수해당경지에서재배하는작물의종류

층화변수 (3) 예제 4-1 층화변수결정사례 어느대학교학생들의주당평균학습시간조사 층화변수 : 학습시간과밀접한관련을지니면서도쉽게구할수있는변수 성별 : 남, 여 전공 : 인문, 이공, 예체능 학년 : 저학년 (1-2 학년 ), 고학년 (3-4 학년 ) 층의수 : 2 3 2 = 12 개

층의최적경계점결정 질적층화변수와양적층화변수 질적층화변수 : 변수값에따라층구분 양적층화변수 : 층의경계점을나누는방법필요 층의최적경계점 (optimum point of stratification) 층화변수가양적변수모집단을개의층으로나누려면개의경계점을결정해야함주어진여건하에서추정값의분산을최소화시킬수있도록경계점결정 Dalenius & Hodges의누적도수제곱근법

누적도수제곱근법의사용예 예제 4-2 13,435 개미국은행들의기업대출금비율 (%) 자료 층의개수 : 경계점간격

학 / 습 / 목 / 차 1. 층화임의추출법의개요 2. 층화 3. 모평균추정 4. 엑셀을활용한실습

기호 모집단의전체층의수 번째층내추출단위의수, 모집단의전체추출단위의수번째층에서뽑히는표본의크기, 전체표본의크기번째층에속한번째추출단위에서의관찰값,

모집단의특성값 h 번째층의모총계 h 번째층의모평균 모집단의모총계 모집단의모평균

모평균의추정 (1) 1. h 번째층의추정량 (h = 1, 2,, H ) h 번째층의데이터 h 번째층의평균추정량 h 번째층의분산추정량

모평균의추정 (2) 2. 모집단전체에대한모평균 ( ) 에대한추정 모평균추정량 분산추정 신뢰구간

모평균의추정 (3) 예제 4-3 모평균추정사례 도시 2,000 1,200 1,500 1,000 900 1,300 3,000 1,500 1,000 1,800 농촌 600 450 200 300 1,200 900 600 750 1,000 300

7 강 층화임의추출법 (2) 정보통계학과이기재교수 Copyright c 2013 한국방송통신대학교 All Rights Reserved.

학 / 습 / 목 / 차 1. 모수추정 - 모총계, 모비율 2. 표본크기의결정 3. 표본배분법 - 비례배분법 4. 엑셀을활용한실습

모총계의추정 1. h 번째층의추정 2. 모총계의추정량 3. 신뢰구간추정

모총계의추정 예제 4-4 모총계추정사례 층 1 20 5 1.6 3.3 2 9 3 2.8 4.0 3 12 4 0.6 2.2

모비율에대한추정 1. 모비율 p 에대한수학적표현, 여기서는 h 번째층의모비율을뜻함 2. 모비율 p 의추정량과분산의추정량

모비율에대한추정 예제 4-5 모비율추정사례 층모집단크기표본수지지자수 남자 336 만 500 200 여자 364 만 500 400 1. 남자와여자의지지율과분산추정

모비율에대한추정 예제 4-5 모비율추정사례 층모집단크기표본수지지자수 남자 336 만 500 200 여자 364 만 500 400 2. 대통령에대한지지율과지지율의 95% 신뢰구간을추정

학 / 습 / 목 / 차 1. 모수추정 - 모총계, 모비율 2. 표본크기의결정 3. 표본배분법 - 비례배분법 4. 엑셀을활용한실습

표본크기의결정 전체표본의크기 오차의한계 라고가정

표본크기의결정 예제 4-6 표본크기결정사례 : 대학생주당 TV 시청시간조사 층별표본의수 :

학 / 습 / 목 / 차 1. 모수추정 - 모총계, 모비율 2. 표본크기의결정 3. 표본배분법 - 비례배분법 4. 엑셀을활용한실습

표본의배분 표본배분에영향을미치는요인 각층내의추출단위들의수 : 각층내에서변동의정도 : 각층에서추출단위를조사하는데드는비용 : 표본배분의일반적인원칙 층내의추출단위수가많을수록표본을많이배분층내의단위들이이질적이어서이클수록표본을많이배분조사비용이많이드는층에대해서는가능하면표본을적게배분 표본배분법의종류 비례배분법, 네이만배분법, 최적배분법

(1) 비례배분법 각층내의추출단위수 ( ) 에비례하여표본크기를배분하는방법 층내의변동과조사비용은고려하지않고층의크기만을고려한방법 층별변동에차이가없고층별로조사비용이비슷한경우에알맞음 일반적으로여론조사, 의식조사등에많이활용됨 배분공식 : 비례배분일때의표본크기결정공식 :

(1) 비례배분법 예제 4-7 비례배분법적용예제 층 규모 ( 종업원수 ) 제조업체의수 1 49 인이하 18,000 2 50 99 인 4,000 3 100 249 인 2,000 4 250 인이상 500 층화임의추출법에의해 500개표본추출을위한비례배분법 층 1 : 층 3 : 층 2 : 층 4 :

8 강 층화임의추출법 (3) 정보통계학과이기재교수 Copyright c 2013 한국방송통신대학교 All Rights Reserved.

학 / 습 / 목 / 차 1. 표본배분 - 네이만배분법, 최적배분법 2. 사후층화 3. 층화임의추출법과단순임의추출법의비교 4. 엑셀을활용한실습

(1) 네이만배분법 각층의크기와층별변동의정도를동시에고려한표본배정방법 변동이큰층에대해서는상대적으로많은표본을배정 층별조사비용은별차이가없고, 변동의정도가많이나는경우에적당 배분공식 : 네이만배분일때의표본크기결정공식 :

(1) 네이만배분법 예제 4-8 네이만배분법적용예제 층 규모 ( 종업원수 ) 제조업체의수 ( ) 표본분산 ( ) 1 49인이하 18,000 80 2 2 50 99인 4,000 200 2 3 100 249인 2,000 600 2 4 250인이상 500 1,900 2 층 1 : 층 3 : 층 2 : 층 4 :

(2) 최적배분법 주어진비용하에서추정량의분산을최소화시키거나주어진분산의범위하에서비용을최소화시키는방법 층별로단위당조사비용에차이가있는경우에쓰이는방법 배분공식 : 네이만배분일때의표본크기결정공식 :

(2) 최적배분법 예제 4-9 최적배분법적용예제 층규모 ( 종업원수 ) 제조업체의수 ( ) 표본분산 ( ) 조사비용 ( ) 1 49 인이하 18,000 80 2 1 2 50 99 인 4,000 200 2 1 3 100 249 인 2,000 600 2 2 4 250 인이상 500 1,900 2 3 층 1 : 층 3 : 층 2 : 층 4 :

학 / 습 / 목 / 차 1. 표본배분 - 네이만배분법, 최적배분법 2. 사후층화 3. 층화임의추출법과단순임의추출법의비교 4. 엑셀을활용한실습

사후층화의필요성을나타내는예 : 평균몸무게추정 남자 : 800 여자 : 200 남자 : 5 만 여자 : 5 만 남자표본평균 = 55kg, 여자표본평균 = 45kg 남자가표본에과다하게반영 과다추정의가능성

사후층화 (post-stratification) 의개념 단순임의표본을이용할경우는이미알고있는모집단특성비율을반영못함 단순임의추출을이용했지만추정단계에서모집단의사전정보를이용 층화임의추출 : 표본설계단계에서층화변수를기준으로하여층화사후층화 : 표본추출이이루어지고난이후표본의데이터를층화 예 도시시민들의평균몸무게추정 평균의사후층화추정량 = ( 남자의평균 0.5) + ( 여자의평균 0.5) = (55 0.5) +(45 0.5) = 50kg < 참고 > 단순표본평균 = 53kg

모평균에대한사후층화추정량 표본데이터 사후층화 : 사후층화추정량 분산추정량

모평균에대한사후층화추정량 예제 4-10 사후층화적용예제 모집단 - 도매계정 :40%, 소매계정 : 60% 표본 - 도매계정 :70%, 소매계정 : 30% 도매계정 소매계정 평균에대한사후층화추정값 : 분산추정 : 신뢰구간 :

학 / 습 / 목 / 차 1. 표본배분 - 네이만배분법, 최적배분법 2. 사후층화 3. 층화임의추출법과단순임의추출법의비교 4. 엑셀을활용한실습

층화추출은반드시단순임의추출보다더효과적인가? 적절한층화변수선택 ( 층화변수와조사변수의상관관계가높을때 ) 예제 4-11 부적절한층화의예 - 체인망으로층화 층 표본데이터 1 30 5 92 88 100 108 96 96.8 59.2 2 42 7 89 97 91 103 109 99 98 98.0 46.3 3 36 6 106 94 98 91 91 94 95.7 32.3 4 36 6 90 108 92 89 111 92 97.0 96.0 합계 144 24 1. 층화추출일때의평균판매량추정

층화추출은반드시단순임의추출보다더효과적인가? 적절한층화변수선택 ( 층화변수와조사변수의상관관계가높을때 ) 예제 4-11 부적절한층화의예 - 체인망으로층화 층 표본데이터 1 30 5 92 88 100 108 96 96.8 59.2 2 42 7 89 97 91 103 109 99 98 98.0 46.3 3 36 6 106 94 98 91 91 94 95.7 32.3 4 36 6 90 108 92 89 111 92 97.0 96.0 합계 144 24 2. 단순임의추출법일때의추정

층화추출은반드시단순임의추출보다더효과적인가? 적절한층화변수선택 ( 층화변수와조사변수의상관관계가높을때 ) 예제 4-11 부적절한층화의예 - 체인망으로층화 층 표본데이터 1 30 5 92 88 100 108 96 96.8 59.2 2 42 7 89 97 91 103 109 99 98 98.0 46.3 3 36 6 106 94 98 91 91 94 95.7 32.3 4 36 6 90 108 92 89 111 92 97.0 96.0 합계 144 24 3. 두추정값의비교 단순임의추출에서의추정분산 = 1.77 < 층화추출에서의추정분산 = 2.01 체인망을층화기준으로삼은것은부적절 < 참고 > 좋은층화 : 층내동질적, 층간이질적

층화추출은반드시단순임의추출보다더효과적인가? 적절한층화변수선택 ( 층화변수와조사변수의상관관계가높을때 ) 예제 4-12 적절한층화의예 - 각점포의전년판매량기준층화 층 표본데이터 1( 대 ) 41 7 100 109 108 111 106 103 96 104.7 28.6 2( 중 ) 43 7 94 98 91 97 91 108 98 96.7 33.9 3( 소 ) 60 10 92 88 89 99 90 92 91 89 94 92 91.6 10.0 합계 144 24

층화추출은반드시단순임의추출보다더효과적인가? 적절한층화변수선택 ( 층화변수와조사변수의상관관계가높을때 ) 예제 4-12 적절한층화의예 - 각점포의전년판매량기준층화 1. 층화추출일때의평균판매량추정

층화추출은반드시단순임의추출보다더효과적인가? 적절한층화변수선택 ( 층화변수와조사변수의상관관계가높을때 ) 예제 4-12 적절한층화의예 - 각점포의전년판매량기준층화 2. 단순임의추출법일때의추정 3. 두추정값의비교 단순임의추출에서의추정분산 = 1.77 > 층화추출에서의추정분산 = 0.78 적절한층화로인해효율을 2.3 배 (= 1.77/0.78) 높인사례

9 강 계통추출법 정보통계학과이기재교수 Copyright c 2013 한국방송통신대학교 All Rights Reserved.

학 / 습 / 목 / 차 1. 계통추출법의개념과장단점 2. 모평균과모총계에대한추정 3. 모집단의유형 4. 엑셀을활용한실습

계통추출법적용사례 1 자동차회사에서지난해자동차구매자를대상으로사용상불만사항을조사한사례 자동차구매자 6만명중 1,000명을표본으로추출하여조사할예정 단순임의추출법에의한표본추출법고객들에게 1~ 60000번사이의고유번호지정난수표에서 1~ 60000번사이의 1000개난수를뽑아이에대응하는표본추출 실제표본추출작업에무척번거로움

계통추출법적용사례 2 계통추출법에의한표본추출법 주어진표본크기 1,000명은 60명중 1명을뽑는셈 1에서 60사이의숫자중에서임의의난수를난수표에서선택 선택된난수로부터매 60번째되는단위들을선택하여 1,000개의표본추출 예를들어 1에서 60사이의난수로 38이뽑힌경우 38 98 158 218 278 338... 59,978

계통추출법적용사례 3 사례 : 어느백화점의입구에서쇼핑을마친 100명을대상으로조사하 는경우 전체쇼핑객수적용하기곤란함 을알수없기때문에단순임의추출법을 일정한간격 ( 예 : 50 명중의 1 명 ) 으로쇼핑객을조사할수있음 사례 : 생산현장에서품질관리를위한샘플링검사 어떤조립라인에서생산된제품중에서매 50 개째되는제품만을검사하는경우 1/50 계통표본

1/k 계통추출법 (1-in-k systematic sampling) 정의 모집단의추출틀에서처음의개단위들중에서랜덤하게하나의단위를추출하고, 그이후매번째간격마다하나씩의단위를표본으로추출하는표본추출방법

계통표본추출방법 1 추출틀에서처음개중에서하나의난수선택 랜덤출발점 (starting point) : 이후들을표본으로추출 추출간격 (sampling interval) :

계통표본추출방법 2 인경우 랜덤출발점 :, 추출간격 : 임의출발점 1 2 모집단 단위 계통추출은 개의집단 ( 표의열에해당 ) 에서하나의집단을 뽑는것과동일함

계통표본추출사례 1 52 명의학생중에서 6 명의학생을계통추출법으로추출하는경우 52 명의학생에게 1 부터 52 까지의일련번호부여 추출간격을 이고, 이므로추출간격 로정하고 1 에서 9 사이의난수를하나선택 난수로 3 이뽑혔다면다음학생들이표본으로선택 3, 12, 21, 30, 39, 48

계통표본추출사례 2 : 분수간격법 52 명의학생중에서 6 명의학생을계통추출법으로추출하는경우 난수표에서 난수표의세자리숫자에서 의난수를선택 가선택되었다면

계통추출법의장점 1 표본추출이간편함 표본추출과정의선택오차 (selection error) 를줄일수있음 2 단순임의추출법의대용으로사용할수있음 3 일반적으로모집단의전체를잘반영함

계통추출법의단점 1 조사된표본자료로부터추정량의표준오차를계산할수없음 단순임의표본으로가정하여표본오차추정 모집단의유형에따라실제보다과대또는 과소평가될수있음 2 계통표본은추출틀의형태에따라그정도 ( 精度 ) 에차이가생김 추출틀이주기성을갖고있을때는계통추출법을 사용하면곤란함

학 / 습 / 목 / 차 1. 계통추출법의개념과장단점 2. 모평균과모총계에대한추정 3. 모집단의유형 4. 엑셀을활용한실습

모평균의추정 1 모평균의추정량 : 모평균추정량의분산 : 여기서 : 급내상관계수 급내상관계수 : 계통표본내표본단위들의동질성의정도를나타냄 이론적인값으로실제문제에서추정할수없음 < 참고 > 단순임의추출법의경우 :

모평균의추정 2 모집단의조사단위들이랜덤하게배열되어있다고가정할수있다면 계통추출법은단순임의추출법의대용으로사용될수있음 얻어진계통표본을단순임의표본으로간주함 모평균에대한 신뢰구간

모평균의추정사례 1 어느제약회사에서생산되는드링크류의정량 (120ml) 확인목적의조사 매 100 번째생산되는병을표본으로선택하는 1/100 계통추출법적용 120.0 119.7 120.1 120.3 119.1 119.8 120.3 119.8 118.7 120.1 119.8 118.7 120.5 118.7 119.1 119.3 117.5 119.3 119.5 119.7

모평균의추정사례 2 여기서, 모평균의 95% 신뢰구간 :

모총계의추정 모총계의수학적표현 : 모총계의추정량 : 모총계에대한 신뢰구간

모비율추정 : 랜덤모집단가정 모비율에대한 신뢰구간

모비율추정예 (1) 어느후보자에대한유권자의지지율파악목적 어떤지역의총유권자수 명 유권자명부에서 1/6 계통표본추출 ( 명 ) 962 명의표본중 652 명이지지한다고응답 지지율의 95% 신뢰구간은?

모비율추정예 (2) 지지율의추정값 유권자명부에나열순서와지지여부와는서로독립적 지지율에대한 95% 신뢰구간

표본의크기결정 : 랜덤모집단가정 모평균추정의경우 신뢰도에서오차의한계가 이내 모비율추정의경우

학 / 습 / 목 / 차 1. 계통추출법의개념과장단점 2. 모평균과모총계에대한추정 3. 모집단의유형 4. 엑셀을활용한실습

모집단의유형 모집단의유형 랜덤모집단 (random population) 순서모집단 (ordered population) 순환모집단 (periodic population) 모집단유형에따라서추정의정확도가달라짐

랜덤모집단 추출단위가관심변수값과아무관련없이랜덤하게 배열된경우 대부분의모집단은랜덤모집단으로간주할수있음 급내상관계수 값을 0 으로간주할수있음 단순임의추출법에서와같은추정방법사용 단순임의추출법과계통추출법은동등 (equivalent) 하다고말함

랜덤모집단의예 일련번호 추출단위 특성치 일련번호 추출단위 특성치 1 27 9 18 2 3 10 24 3 9 11 2 4 10 12 29 5 7 13 12 6 21 14 20 7 2 15 28 8 22 16 4

순서모집단 추출단위가관심변수값의크기순으로나열되어있는 경우 예 소득을추정할때과거소득자료크기순으로 모집단을나열한경우 계통표본내의단위들이이질적이어서급내상관계수 값이음수로나타남 단순임의추출법에비해효율적임

순서모집단의예 일련번호 추출단위 특성치 일련번호 추출단위 특성치 1 2 9 18 2 2 10 21 3 3 11 22 4 4 12 24 5 7 13 20 6 9 14 27 7 10 15 28 8 12 16 29

순환모집단 조사단위의배열이관심변수값을기준으로주기적으로변동하는경우계통표본내단위들이동질적이어서급내상관계수가 0보다큼 단순임의추출법에비해효율이떨어짐 계통추출법을사용하는것은피해야함 계통추출법을적용하기에앞서모집단에대한충분한검토가필요함

순환모집단의예 일련번호 추출단위 특성치 일련번호 추출단위 특성치 1 2 9 3 2 7 10 10 3 18 11 22 4 20 12 28 5 2 13 4 6 9 14 12 7 21 15 24 8 27 16 29

반복계통추출법 ( 참고 ) 여러개의임의출발점을택하여여러개의계통표본을뽑는방법 모집단에대한가정없이추정량의분산계산가능 의분산추정 개의독립적인계통표본 모평균추정량 : 추정량의분산 :

계통추출법에서추정량의분산추정 추출된계통표본을단순임의표본으로간주하여계산 단순임의추출법의분산추정식이용 랜덤모집단인경우에사용됨 반복계통추출법이용 모집단에대한가정없이추정량의분산계산가능