10. ..

Similar documents
슬라이드 1

statistics

Microsoft Word - EDA_Univariate.docx

(001~006)개념RPM3-2(부속)

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

R t-..

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

G Power

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

Microsoft PowerPoint - IPYYUIHNPGFU

... —....—

Microsoft PowerPoint - SBE univariate5.pptx

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

제 8 장. 통계적추정 개요 : 통계적추정 ( 추론 ) 은모집단에서추출된표본의정보로모집단에대한값의추측또는그값에대한확신을결정하는과정이며다음의두단계가있다. 2 통계적추정 (statistical estimation): 모수인평균 ( m), 분산 ( s ), 표준편차 ( s

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

모수검정과비모수검정 제 6 강 지리통계학

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

... —... ..—


1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

Microsoft PowerPoint - PDF3 SBE pptx

슬라이드 1

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

untitled

메타분석: 통계적 방법의 기초

표본재추출(resampling) 방법

<4D F736F F F696E74202D20C1A636C1D620C7A5BABBC3DFC3E2B9E6B9FD20B0ADC0C72E >

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

Microsoft PowerPoint - LN05 [호환 모드]

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>


(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

스무살, 마음껏날아오르기위해, 일년만꾹참자! 2014학년도대학수학능력시험 9월모의평가 18번두이차정사각행렬 가 를만족시킬때, 옳은것만을 < 보기 > 에서있는대로고른것은? ( 단, 는단위행렬이다.) [4점] < 보기 > ㄱ. ㄴ. ㄷ. 2013학년도대학수학능력시험 16번

01

슬라이드 1

Resampling Methods

마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다.

용역보고서

..(..) (..) - statistics

제 12강 함수수열의 평등수렴

한국보건사회연구원통계학및계량경제학의기초및응용 강의노트 2017 년 4 월 5 월 통계학 : 통계적추론 (Statistical Inference) I. 들어가며 이제통계학에서가장중요한토픽이라고할수있는통계적추론에대해서본격적으로공부를해보도록하겠습니다. 통계적추론을통해연구와관

자료의 이해 및 분석

슬라이드 제목 없음

= ``...(2011), , (.)''

Microsoft Word - SAS_Data Manipulate.docx

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

03-1영역형( )

목 록( 目 錄 )

02-1기록도전( )

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는


v 사례연구 오염노출된아기들 2005년 7월 28일자시드니모닝해럴드에 1998년에서 2000년사이에태어난아기 138,000명모두에대한연구결과를인용하였다. 뉴사우스웨일즈주보건부환경보건과에있는Vicky Sheppeard 박사는출생전에최고수준의오염에노출된아기는가장요염수준낮은

BOX

고객관계를 리드하는 서비스 리더십 전략

2020 학년도랑데뷰실전모의고사문제지 - 시즌 3 제 1 회 제 2 교시 수학영역 ( 나형 ) 1 5 지선다형 3. 그림은함수 를나타낸것이다 학년도 9월모의평가나형과싱크로율 99% 학년도수학영역대비랑데뷰실전모의고사가형-시즌1~ 시즌6, 나형-시즌

<B1B3C0B0B0FAC1A45FC3E2B7C22E687770>

통계적 표본조사론 소개

<C3D1C1A4B8AE B0E6BFECC0C720BCF B9AE2E687770>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE202D20BDC3B0E8BFADC0DAB7E1BAD0BCAE E646F63>

전자회로 실험

통계적 표본조사론 소개

untitled


슬라이드 1

3. 다음은카르노맵의표이다. 논리식을간략화한것은? < 나 > 4. 다음카르노맵을간략화시킨결과는? < >

제 장확률의기초 같이정리할수있다.. n 30 일때크기 n 의표본이평균 µ, 표준편차 σ 를갖는모집단으로부터추출되었다면표본평균의표본분포는근사적으로정규분포를따른다.. 모집단이정규분포를따르면표본평균의표본분포는임의의표본크기에대하여정규분포를따른다. 즉, 중심극한정리는모집단이무슨

함수공간 함수공간, 점열린위상 Definition 0.1. X와 Y 는임의의집합이고 F(X, Y ) 를 X에서 Y 로의모든함수족이라하자. 집합 F(X, Y ) 에위상을정의할때이것을함수공간 (function space) 이라한다. F(X, Y ) 는다음과같이적당한적집합과

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

Communications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])


(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의


저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

hwp

31. 을전개한식에서 의계수는? 를전개한식이 일 때, 의값은? 을전개했을때, 의계수와상수항의합을구하면? 을전개했을때, 의 계수는? 를전개했을때, 상수항을 구하여라. 37

<BCF6B8AEBFB5BFAA28B0A1C7FC295FC2A6BCF62E687770>

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

완비거리공간 완비거리공간 Definition 0.1. (X, d) 는거리공간일때 X의점렬 < a n > 이모든 ɛ > 0에대해 n o N such that n, m > n o = d(a n, a m ) < ɛ 을만족하면이점렬을코시열 (Cauchy sequence) 이라

... — —

<C1B6BBE7BFACB1B82032B1C72031C8A BFACB1B8B3EDB9AE29202D20C0CCB1E2C0E72E687770>


제 4 장회귀분석

Poison null byte Excuse the ads! We need some help to keep our site up. List 1 Conditions 2 Exploit plan 2.1 chunksize(p)!= prev_size (next_chunk(p) 3

Survey Analyst 2012 년하반기사회조사분석사 2 급필기 제 1 과목조사방법론 1 1. 다음중일반적으로가장높은응답률을확보할수있는조사방법은? 2. 다음중우편조사의특성과가장거리가먼것은? 3. 연구방법으로서의연역적접근법과귀납적접근법에관한설명으로틀린것은? 4. 참여

포천시시설관리공단 내규 제 24호 포천시시설관리공단 인사규정 시행내규 일부개정(안) 포천시시설관리공단 인사규정 시행내규 일부를 다음과 같이 개정 한다. 제17조(기간제근로자의 무기계약직 임용) 1 기간제근로자 관리규정 제16조 를 제19조 로 한다. 제20조(인사기록)

PowerPoint 프레젠테이션

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2

untitled

자료의 이해 및 분석

슬라이드 1

Microsoft PowerPoint Relations.pptx

Ⅰ 경우의수 개념 1 경우의수와순열 004 개념 2 여러가지순열 008 개념 3 조합과중복조합 012 개념 4 이항정리 020 Ⅱ 확률 개념 1 확률의정의및계산 024 개념 2 조건부확률 027 개념 3 독립과종속 028 Ⅲ 통계 개념 1 이산확률변수와확률분포 034

PowerPoint 프레젠테이션

Transcription:

점추정구간추정표본크기

차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기

추정의종류 점추정구간추정표본크기 점추정 (point estimation): 모수를어떤하나의값으로추측하는것 구간추정 (interval estimation): 모수를어떤구간으로추측하는것 예 ) 피그미족 (Pygmytribe) 의평균키는모수 µ 표본을추출하여평균을구해보니 135cm 였을때, 모수 µ 에대한점추정값은 135cm 이다. ˆµ = X = 135cm 피그미족의키는평균이 120cm 에서 150cm 사이이다 라고표현하는것은구간추정이다. ˆµ = (120cm, 150cm)

모수의추정 점추정구간추정표본크기 모수 (parameter): 모집단의특성을나타내는상수 = 주로사용하는모수는모평균 µ, 모분산 σ 2 그리고모비율 p 모평균추정의예 : 어느할인매장의연간매출액, 새로개발된자동차의연비, 서울에서대전까지자동차로걸리는시간모분산추정의예 : 특정주가의유동성 ( 변동성 ) 모비율추정의예 : 등록된벤처기업중파산하는비율 추정 (estimation): N 개의원소로된모집단에서크기가 n 인표본을추출한후, 이를토대로모집단의모수의값을추측하는것

차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기

점추정구간추정표본크기점추정 (point estimation) 점추정 (point estimation) : 추출된표본자료의값을선정된추정량에대입하여얻은단일추정값에의하여모수를추정하는방법 점추정량 (point estimator) : 점추정에사용된통계량, 예 ) ˆµ = X, ˆσ 2 = S 2 추정값 (estimate) : 실제표본에서계산된값, 예 ) x, s 2 표본오차 (sampling error) : 모집단전체를관측하지않고, 부분집합인표본에서만관측함으로써생기는오차

점추정구간추정표본크기점추정 (point estimation) 모집단의관심모수 θ 에대한추정량을 ˆθ 이라하면, 추정량의표본오차는 ˆθ θ 로정의되고이는변동 (variation) 과편향 (bias) 으로분해될수있음추정량 ˆθ 의표본오차 = 변동 + 편향변동 = ˆθ E( ˆθ) 편향 = E( ˆθ) θ 불편추정량 : 편향이 0 인추정량

점추정구간추정표본크기점추정량의바람직한성질 1 불편성 (unbiasedness) : 추정량의기대값이모수와같아짐 2 효율성 (efficiency) : 추정량의분산이작음 3 일치성 (consistency) : 표본크기가점차커짐에따라점추정량의값이모수에근접합 ( 확률적수렴 ) 위의세가지가대표적인기준이며이외에다른기준도있음

불편성 (unbiasedness) 점추정구간추정표본크기 불편성 (unbiasedness) 추정량의기대값이모수와같음 E( ˆθ) = θ 이면, ˆθ 은 θ 에대한불편추정량임편향이없는추정량주어진표본추출방법으로표본을뽑고그추정량의값을표본으로부터계산하는작업을무한히반복하였을경우, 그렇게해서얻어지는추정량값들이평균적으로는모수와일치하게됨을의미 편향 (bias) = E( ˆθ) θ

불편성 (unbiasedness) 점추정구간추정표본크기 예 ) 점추정량 X 는모수 µ 에대해불편성을만족하는가? ( 풀이 ) 표본평균 X 의기대값을구하면모수 µ 와일치. 불편성만족!!! E( X) = E( X 1 + + X n ) = 1 (µ + + µ) = µ n n 표본중위수 X med : 모평균 µ 에대한불편추정량 표본비율 ˆp: 모비율 p 의불편추정량 표본분산 S 2 : 모분산 σ 2 의불편추정량

효율성 (efficiency) 점추정구간추정표본크기 효율성 (efficiency) : 추정량의분산 ( 추정량변동의제곱의기대값 ) 이적은통계량은 상대적으로더효율적 (relative efficient) 예 ) 두추정량모두비편향추정량으로좋은추정량이지만, X 1 의경우 X 2 보다안정적으로모평균에가까운값이나올가능성이있음 = X 1 의표본분포가 X 2 의표본분포보다실제모수에가까이조밀하게몰려있으므로 ( 분산이작으므로 ) 더좋은추정량

효율성 (efficiency) 점추정구간추정표본크기 분산이최소가되는것중편향을최소로하는추정량을찾게되면, 극단적인경우분산이 0 이되어좋은추정값을찾지못하게되므로, 비편향추정량중에서분산을최소로하는추정량을찾는전략을쓰게된다 최소분산불편추정량 (minimum variance unbiased estimator): 같은표본에서도출된불편추정량중에서분산이최소가되는추정량

일치성 (consistency) 점추정구간추정표본크기 일치성 (consistency) : 표본크기가점차커짐에따라점추정량의값이모수에근접해지는경우 ( 무한모집단가정 ) 예 ) 표본평균 X 표본평균의분산은표본크기가커지면 0 으로수렴함. 따라서, 표본평균 ( 추정량 ) 의표본추출로인한변동이줄어들고결국모평균으로수렴 대수의법칙 (Law of large numbrs) : X 가모평균에서조금이라도벗어날확률은표본크기가커짐에따라점차 0 으로작아진다. 즉, X 는모평균으로확률적수렴 (convergence in probability) 함

일치성 (consistency) 점추정구간추정표본크기 확률변수의수렴 X 가 µ 로확률적수렴 (convergence in probability) : 임의의양수 ε 에대하여 점추정량 (point estimator) lim P( X µ > ε ) = 0 n 모수 점추정량 µ X σ 2 S 2 σ p = 모평균, 모분산, 모표준편차, 모비율에대한추정량은비편향성, 효율성, 일치성등을종합적으로고려하였을때, 위와같은점추정량을선택하는것이일반적 S ˆp

차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기

점추정구간추정표본크기구간추정 (interval estimation) 모집단평균추정하기

점추정구간추정표본크기구간추정 (interval estimation) 구간추정 (interval estimation): 모수를하나의값으로추정하는것이아니라표본오차의크기를반영한구간으로나타내는것 신뢰구간 (confidence interval): 구간추정을통하여얻어지는구간을의미하며신뢰수준과구간의크기가중요 신뢰수준 (confidence level): 여러번구한신뢰구간중추정하고자하는모수를포함하는신뢰구간의비율 신뢰구간및신뢰수준의의미 모평균 µ 에대한 95% 신뢰구간이 (a,b) = 똑같은방법으로 100 차례표본을추출하여신뢰구간을구하였을때, 그 100 개의신뢰구간중 95 개가모수 µ 를포함하게됨을의미신뢰구간이모수를포함할확률, 즉 95% 를구간추정의신뢰수준이라함

점추정구간추정표본크기구간추정 (interval estimation) 모수는모르는숫자이지만불변의값인반면, 신뢰구간은표본에따라달라질수있으므로, 모수가신뢰구간에포함될비율 이아니라, 여러번표본을뽑아신뢰구간을구하였을때 신뢰구간이모수를포함할비율 을고려하는것 = 그비율이신뢰수준

점추정구간추정표본크기구간추정 (interval estimation) 구간의크기 (interval size): 신뢰구간의폭을의미 ˆµ = (a,b) = b a = 2d 오차한계 (error bound): 신뢰구간폭의절반인 d 를의미 신뢰수준과구간의크기 신뢰수준은높을수록, 구간의크기는작을수록바람직신뢰수준과구간의크기는서로상충됨 = 신뢰수준을높이고자하면구간이커지게되고, 반대로정교한구간추정을위하여구간의크기를작게하면신뢰수준이떨어지는문제발생일반적으로문제에따라신뢰수준을고정, 신뢰수준을만족하면서구간의크기를가장작게하는신뢰구간을도출일정신뢰수준하에서신뢰구간의크기는점추정량의분산과관련, 분산은표본수에의해좌우 = 신뢰구간을작게하기위해서는표본수를늘려야함

점추정구간추정표본크기구간추정 (interval estimation) 모집단의분포가대칭인경우모평균에대한신뢰구간은 ( X ± d) 의형태로표본평균을중심으로같은거리만큼가감하는것이효율적 ( 최소거리 ) 신뢰구간 (a,b) 도신뢰수준은만족하나, 구간의크기가 ( X ± d) 의경우보다크다 = 같은신뢰수준에서구간의크기를최소화하는것은 ( X ± d)

점추정구간추정표본크기모평균 µ 에대한구간추정 모평균의점추정량은표본평균 X 모평균의구간추정량은일반적으로 ˆµ = ( X ± d), d: 오차한계 µ 에대한 100(1 α)% 신뢰구간 오차한계 d 를구할때모표준편차 σ 를알면표준정규분포의 z 값을사용모표준편차 S 로대체하면, t 분포의 t 값을사용

점추정구간추정표본크기모평균 µ 에대한구간추정 µ 에대한 100(1 α)% 신뢰구간 σ 를알고있는경우 : σ 를모르는경우 : ( X z α/2 σ n, X + z α/2 σ n ) ( X t α/2,n 1 S n, X + t α/2,n 1 S n ) n: 표본크기, 표본표준편차 S = n i=1 (X i X) 2 /(n 1) 가정사항 1. 모집단은정규분포이다 2. 모집단이정규분포가아니라면표본의수가충분히크다. n 30

점추정구간추정표본크기모평균 µ 에대한구간추정

t 분포 점추정구간추정표본크기 표준정규분포와유사한모양, 단꼬리부분이표준정규분포보다두꺼움 0 을중심으로좌우대칭 자유도 (degree of freedom) 는분포가퍼져있는정도를결정, 자유도가클수록가운데로모이고, 표준정규분포로수렴

t 분포 점추정구간추정표본크기 자유도 =20

점추정구간추정표본크기모평균 µ 에대한구간추정 예 ) 베어링의평균직경을알아보고자 9 개의베어링표본을조사한것으로평균직경에대한 95% 신뢰구간을구하시오 ( 베어링의직경에대한모집단은정규분포를가정 ) 3.4 3.3 4.2 4.4 3.7 4.5 4.6 3.8 4.1 과거자료로부터 σ = 0.4 로알려져있다면 95% 신뢰구간은 ˆµ = X ± z 0.025 σ n = 4.0 ± 1.96 0.4 9 = 4.0 ± 0.26 만약 σ 가알려지지않있다면 S 를이용한 95% 신뢰구간은 ˆµ = X ± t 0.025,8 S n = 4.0 ± 2.31 0.4743 9 = 4.0 ± 0.37 S 2 = n i=1 (X i X) 2 /(n 1) = 0.225

점추정구간추정표본크기모평균 µ 에대한구간추정 유의사항 신뢰구간에서 σ 를모르는경우의 t 값은 t 분포표에서찾는데, 이때자유도는 n 1, α/2 는확률값을나타냄 σ 를모르더라도표본크기 n 이커지면 S 가 σ 에근접하고, 또 t 분포는 Z 분포로수렴한다. 따라서표본크기가크면 ( 일반적으로 n 30), σ 를모르는경우의신뢰구간은 σ 를아는경우의신뢰구간과비슷해짐 모집단이정규분포를따를때, 위의결과는정확함 그러나 X i 가정규분포를따르지않더라도표본크기가크면, 중심극한정리에의하여 X 의분포는정규분포에근접함. 따라서표본크기가클때에는 X i 의분포에민감하지않으나표본크기가작을때에는 X i 의분포가최소한대칭에가까워야하고, 특히표본크기가 15 보다작을때에는 X i 의분포가정규분포에근접해야함

점추정구간추정표본크기모평균 µ 에대한구간추정 유의사항 σ 를아는경우란일반적으로과거의데이터나연구결과에의하여 σ 에대한믿을만한정보다있다는뜻 신뢰구간공식에서표본크기 n 이커지면, 구간이좁아지는것을알수있음. 다라서오차한계의크기를어떤범위안에들도록해야되는경우라면표본수 n 을필요한만큼늘릴수있음 신뢰구간에서많이사용되는 Z 값

점추정구간추정표본크기모비율 p 에대한구간추정 모비율 p 를추정하기위하여 n 개의표본을추출하여조사한결과, 성공 의수가 X 라면, = 모비율의점추정량표본비율 (sample proportion) ˆp = X n, X = 0,1,...,n 표본크기 n 이커진다면확률변수 X 는평균 np, 분산 np(1 p) 인정규분포로근사 np 5, n(1 p) 5 따라서, 표본비율 ˆp 은근사적으로다음의정규분포를따름 ( ) p(1 p) ˆp N p, n

점추정구간추정표본크기모비율 p 에대한구간추정 모비율 p 에대한 100(1 α)% 신뢰구간 ˆp ± z α/2 ˆp(1 ˆp) n 모비율에대한신뢰구간은표본의크기가충분히클때즉 np 5 와 n(1 p) 5 를동시에만족할때에만의미있음 하지만 p 를추정하려고하는상황이므로, p 의추정값인표본비율 ˆp 을이용하여표본크기의조건을점검 nˆp 5, n(1 ˆp) 5

점추정구간추정표본크기모비율 p 에대한구간추정 예 ) 소형자동차생산을계획하는데소비자들의반응을알아보려고표본조사를하였다. 1,000 명의표본을추출하여, 향후 5 년내에소형자동차구매의사를조사한결과 40 명이소형자동차를살의사가있는것으로판단되었다. 향후 5 년간소형자동차를구매하려는고객의비율 p 에대한 95% 신뢰구간을구하라구매비율의추정값 ˆp = X n = 40 1000 = 0.04 표본크기의조건 nˆp = 1000 0.04 = 40 5 n(1 ˆp) = 1000 0.96 = 960 5 p 의 95% 신뢰구간 ˆp ± z 0.025 ˆp(1 ˆp) n 0.04(1 0.04) = 0.04 ± 1.96 = 0.04 ± 0.012 1000

차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기

표본크기결정 점추정구간추정표본크기 오차한계 d 는표본크기 n 이증가할수록줄어듬 σ 를알때모평균에대한 100(1 α)% 신뢰구간 X ± z α/2 σ n 이때, 오차한계 d d = z α/2 σ n n 이커지면 d 는 1 n 배가됨 n = (z α/2 σ d )2

표본크기결정 점추정구간추정표본크기 오차한계 d 를만족시키는표본크기 n 추정모수및조건 오차한계 (d) 표본수 (n) σ를알경우의 µ σ d = z α/2 n σ n = (z α/2 d ) 2 S σ를모를경우의 µ d = t α/2,n 1 n S n = (t α/2,n 1 d ) 2 p(1 p) 모비율 p d = z α/2 n n = z 2 p(1 p) α/2 d 2 표본크기계산시, 아직표본을추출하지않은상태이므로, S 나 p 등을모른다. 따라서근사값을활용하여대략적인 n 값을구하는데, 요령은다음과같음 S, σ 또는 p 는과거의경험이나연구결과, 또는파일럿연구로부터얻어지거나대략짐작되는값을이용. p 의경우사전정보가전혀없다면 0.5 를이용 σ 를모르는경우에서표본크기 n 을모르면 t α/2,n 1 을구할수없다. 이때는개략적인 n 값을이용하여새로운 n 을구하고, 반복하면 t α/2,n 1 에사용되어진 n 값과새로구한 n 값을접근시킬수있음

점추정구간추정표본크기