점추정구간추정표본크기
차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기
추정의종류 점추정구간추정표본크기 점추정 (point estimation): 모수를어떤하나의값으로추측하는것 구간추정 (interval estimation): 모수를어떤구간으로추측하는것 예 ) 피그미족 (Pygmytribe) 의평균키는모수 µ 표본을추출하여평균을구해보니 135cm 였을때, 모수 µ 에대한점추정값은 135cm 이다. ˆµ = X = 135cm 피그미족의키는평균이 120cm 에서 150cm 사이이다 라고표현하는것은구간추정이다. ˆµ = (120cm, 150cm)
모수의추정 점추정구간추정표본크기 모수 (parameter): 모집단의특성을나타내는상수 = 주로사용하는모수는모평균 µ, 모분산 σ 2 그리고모비율 p 모평균추정의예 : 어느할인매장의연간매출액, 새로개발된자동차의연비, 서울에서대전까지자동차로걸리는시간모분산추정의예 : 특정주가의유동성 ( 변동성 ) 모비율추정의예 : 등록된벤처기업중파산하는비율 추정 (estimation): N 개의원소로된모집단에서크기가 n 인표본을추출한후, 이를토대로모집단의모수의값을추측하는것
차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기
점추정구간추정표본크기점추정 (point estimation) 점추정 (point estimation) : 추출된표본자료의값을선정된추정량에대입하여얻은단일추정값에의하여모수를추정하는방법 점추정량 (point estimator) : 점추정에사용된통계량, 예 ) ˆµ = X, ˆσ 2 = S 2 추정값 (estimate) : 실제표본에서계산된값, 예 ) x, s 2 표본오차 (sampling error) : 모집단전체를관측하지않고, 부분집합인표본에서만관측함으로써생기는오차
점추정구간추정표본크기점추정 (point estimation) 모집단의관심모수 θ 에대한추정량을 ˆθ 이라하면, 추정량의표본오차는 ˆθ θ 로정의되고이는변동 (variation) 과편향 (bias) 으로분해될수있음추정량 ˆθ 의표본오차 = 변동 + 편향변동 = ˆθ E( ˆθ) 편향 = E( ˆθ) θ 불편추정량 : 편향이 0 인추정량
점추정구간추정표본크기점추정량의바람직한성질 1 불편성 (unbiasedness) : 추정량의기대값이모수와같아짐 2 효율성 (efficiency) : 추정량의분산이작음 3 일치성 (consistency) : 표본크기가점차커짐에따라점추정량의값이모수에근접합 ( 확률적수렴 ) 위의세가지가대표적인기준이며이외에다른기준도있음
불편성 (unbiasedness) 점추정구간추정표본크기 불편성 (unbiasedness) 추정량의기대값이모수와같음 E( ˆθ) = θ 이면, ˆθ 은 θ 에대한불편추정량임편향이없는추정량주어진표본추출방법으로표본을뽑고그추정량의값을표본으로부터계산하는작업을무한히반복하였을경우, 그렇게해서얻어지는추정량값들이평균적으로는모수와일치하게됨을의미 편향 (bias) = E( ˆθ) θ
불편성 (unbiasedness) 점추정구간추정표본크기 예 ) 점추정량 X 는모수 µ 에대해불편성을만족하는가? ( 풀이 ) 표본평균 X 의기대값을구하면모수 µ 와일치. 불편성만족!!! E( X) = E( X 1 + + X n ) = 1 (µ + + µ) = µ n n 표본중위수 X med : 모평균 µ 에대한불편추정량 표본비율 ˆp: 모비율 p 의불편추정량 표본분산 S 2 : 모분산 σ 2 의불편추정량
효율성 (efficiency) 점추정구간추정표본크기 효율성 (efficiency) : 추정량의분산 ( 추정량변동의제곱의기대값 ) 이적은통계량은 상대적으로더효율적 (relative efficient) 예 ) 두추정량모두비편향추정량으로좋은추정량이지만, X 1 의경우 X 2 보다안정적으로모평균에가까운값이나올가능성이있음 = X 1 의표본분포가 X 2 의표본분포보다실제모수에가까이조밀하게몰려있으므로 ( 분산이작으므로 ) 더좋은추정량
효율성 (efficiency) 점추정구간추정표본크기 분산이최소가되는것중편향을최소로하는추정량을찾게되면, 극단적인경우분산이 0 이되어좋은추정값을찾지못하게되므로, 비편향추정량중에서분산을최소로하는추정량을찾는전략을쓰게된다 최소분산불편추정량 (minimum variance unbiased estimator): 같은표본에서도출된불편추정량중에서분산이최소가되는추정량
일치성 (consistency) 점추정구간추정표본크기 일치성 (consistency) : 표본크기가점차커짐에따라점추정량의값이모수에근접해지는경우 ( 무한모집단가정 ) 예 ) 표본평균 X 표본평균의분산은표본크기가커지면 0 으로수렴함. 따라서, 표본평균 ( 추정량 ) 의표본추출로인한변동이줄어들고결국모평균으로수렴 대수의법칙 (Law of large numbrs) : X 가모평균에서조금이라도벗어날확률은표본크기가커짐에따라점차 0 으로작아진다. 즉, X 는모평균으로확률적수렴 (convergence in probability) 함
일치성 (consistency) 점추정구간추정표본크기 확률변수의수렴 X 가 µ 로확률적수렴 (convergence in probability) : 임의의양수 ε 에대하여 점추정량 (point estimator) lim P( X µ > ε ) = 0 n 모수 점추정량 µ X σ 2 S 2 σ p = 모평균, 모분산, 모표준편차, 모비율에대한추정량은비편향성, 효율성, 일치성등을종합적으로고려하였을때, 위와같은점추정량을선택하는것이일반적 S ˆp
차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기
점추정구간추정표본크기구간추정 (interval estimation) 모집단평균추정하기
점추정구간추정표본크기구간추정 (interval estimation) 구간추정 (interval estimation): 모수를하나의값으로추정하는것이아니라표본오차의크기를반영한구간으로나타내는것 신뢰구간 (confidence interval): 구간추정을통하여얻어지는구간을의미하며신뢰수준과구간의크기가중요 신뢰수준 (confidence level): 여러번구한신뢰구간중추정하고자하는모수를포함하는신뢰구간의비율 신뢰구간및신뢰수준의의미 모평균 µ 에대한 95% 신뢰구간이 (a,b) = 똑같은방법으로 100 차례표본을추출하여신뢰구간을구하였을때, 그 100 개의신뢰구간중 95 개가모수 µ 를포함하게됨을의미신뢰구간이모수를포함할확률, 즉 95% 를구간추정의신뢰수준이라함
점추정구간추정표본크기구간추정 (interval estimation) 모수는모르는숫자이지만불변의값인반면, 신뢰구간은표본에따라달라질수있으므로, 모수가신뢰구간에포함될비율 이아니라, 여러번표본을뽑아신뢰구간을구하였을때 신뢰구간이모수를포함할비율 을고려하는것 = 그비율이신뢰수준
점추정구간추정표본크기구간추정 (interval estimation) 구간의크기 (interval size): 신뢰구간의폭을의미 ˆµ = (a,b) = b a = 2d 오차한계 (error bound): 신뢰구간폭의절반인 d 를의미 신뢰수준과구간의크기 신뢰수준은높을수록, 구간의크기는작을수록바람직신뢰수준과구간의크기는서로상충됨 = 신뢰수준을높이고자하면구간이커지게되고, 반대로정교한구간추정을위하여구간의크기를작게하면신뢰수준이떨어지는문제발생일반적으로문제에따라신뢰수준을고정, 신뢰수준을만족하면서구간의크기를가장작게하는신뢰구간을도출일정신뢰수준하에서신뢰구간의크기는점추정량의분산과관련, 분산은표본수에의해좌우 = 신뢰구간을작게하기위해서는표본수를늘려야함
점추정구간추정표본크기구간추정 (interval estimation) 모집단의분포가대칭인경우모평균에대한신뢰구간은 ( X ± d) 의형태로표본평균을중심으로같은거리만큼가감하는것이효율적 ( 최소거리 ) 신뢰구간 (a,b) 도신뢰수준은만족하나, 구간의크기가 ( X ± d) 의경우보다크다 = 같은신뢰수준에서구간의크기를최소화하는것은 ( X ± d)
점추정구간추정표본크기모평균 µ 에대한구간추정 모평균의점추정량은표본평균 X 모평균의구간추정량은일반적으로 ˆµ = ( X ± d), d: 오차한계 µ 에대한 100(1 α)% 신뢰구간 오차한계 d 를구할때모표준편차 σ 를알면표준정규분포의 z 값을사용모표준편차 S 로대체하면, t 분포의 t 값을사용
점추정구간추정표본크기모평균 µ 에대한구간추정 µ 에대한 100(1 α)% 신뢰구간 σ 를알고있는경우 : σ 를모르는경우 : ( X z α/2 σ n, X + z α/2 σ n ) ( X t α/2,n 1 S n, X + t α/2,n 1 S n ) n: 표본크기, 표본표준편차 S = n i=1 (X i X) 2 /(n 1) 가정사항 1. 모집단은정규분포이다 2. 모집단이정규분포가아니라면표본의수가충분히크다. n 30
점추정구간추정표본크기모평균 µ 에대한구간추정
t 분포 점추정구간추정표본크기 표준정규분포와유사한모양, 단꼬리부분이표준정규분포보다두꺼움 0 을중심으로좌우대칭 자유도 (degree of freedom) 는분포가퍼져있는정도를결정, 자유도가클수록가운데로모이고, 표준정규분포로수렴
t 분포 점추정구간추정표본크기 자유도 =20
점추정구간추정표본크기모평균 µ 에대한구간추정 예 ) 베어링의평균직경을알아보고자 9 개의베어링표본을조사한것으로평균직경에대한 95% 신뢰구간을구하시오 ( 베어링의직경에대한모집단은정규분포를가정 ) 3.4 3.3 4.2 4.4 3.7 4.5 4.6 3.8 4.1 과거자료로부터 σ = 0.4 로알려져있다면 95% 신뢰구간은 ˆµ = X ± z 0.025 σ n = 4.0 ± 1.96 0.4 9 = 4.0 ± 0.26 만약 σ 가알려지지않있다면 S 를이용한 95% 신뢰구간은 ˆµ = X ± t 0.025,8 S n = 4.0 ± 2.31 0.4743 9 = 4.0 ± 0.37 S 2 = n i=1 (X i X) 2 /(n 1) = 0.225
점추정구간추정표본크기모평균 µ 에대한구간추정 유의사항 신뢰구간에서 σ 를모르는경우의 t 값은 t 분포표에서찾는데, 이때자유도는 n 1, α/2 는확률값을나타냄 σ 를모르더라도표본크기 n 이커지면 S 가 σ 에근접하고, 또 t 분포는 Z 분포로수렴한다. 따라서표본크기가크면 ( 일반적으로 n 30), σ 를모르는경우의신뢰구간은 σ 를아는경우의신뢰구간과비슷해짐 모집단이정규분포를따를때, 위의결과는정확함 그러나 X i 가정규분포를따르지않더라도표본크기가크면, 중심극한정리에의하여 X 의분포는정규분포에근접함. 따라서표본크기가클때에는 X i 의분포에민감하지않으나표본크기가작을때에는 X i 의분포가최소한대칭에가까워야하고, 특히표본크기가 15 보다작을때에는 X i 의분포가정규분포에근접해야함
점추정구간추정표본크기모평균 µ 에대한구간추정 유의사항 σ 를아는경우란일반적으로과거의데이터나연구결과에의하여 σ 에대한믿을만한정보다있다는뜻 신뢰구간공식에서표본크기 n 이커지면, 구간이좁아지는것을알수있음. 다라서오차한계의크기를어떤범위안에들도록해야되는경우라면표본수 n 을필요한만큼늘릴수있음 신뢰구간에서많이사용되는 Z 값
점추정구간추정표본크기모비율 p 에대한구간추정 모비율 p 를추정하기위하여 n 개의표본을추출하여조사한결과, 성공 의수가 X 라면, = 모비율의점추정량표본비율 (sample proportion) ˆp = X n, X = 0,1,...,n 표본크기 n 이커진다면확률변수 X 는평균 np, 분산 np(1 p) 인정규분포로근사 np 5, n(1 p) 5 따라서, 표본비율 ˆp 은근사적으로다음의정규분포를따름 ( ) p(1 p) ˆp N p, n
점추정구간추정표본크기모비율 p 에대한구간추정 모비율 p 에대한 100(1 α)% 신뢰구간 ˆp ± z α/2 ˆp(1 ˆp) n 모비율에대한신뢰구간은표본의크기가충분히클때즉 np 5 와 n(1 p) 5 를동시에만족할때에만의미있음 하지만 p 를추정하려고하는상황이므로, p 의추정값인표본비율 ˆp 을이용하여표본크기의조건을점검 nˆp 5, n(1 ˆp) 5
점추정구간추정표본크기모비율 p 에대한구간추정 예 ) 소형자동차생산을계획하는데소비자들의반응을알아보려고표본조사를하였다. 1,000 명의표본을추출하여, 향후 5 년내에소형자동차구매의사를조사한결과 40 명이소형자동차를살의사가있는것으로판단되었다. 향후 5 년간소형자동차를구매하려는고객의비율 p 에대한 95% 신뢰구간을구하라구매비율의추정값 ˆp = X n = 40 1000 = 0.04 표본크기의조건 nˆp = 1000 0.04 = 40 5 n(1 ˆp) = 1000 0.96 = 960 5 p 의 95% 신뢰구간 ˆp ± z 0.025 ˆp(1 ˆp) n 0.04(1 0.04) = 0.04 ± 1.96 = 0.04 ± 0.012 1000
차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기
표본크기결정 점추정구간추정표본크기 오차한계 d 는표본크기 n 이증가할수록줄어듬 σ 를알때모평균에대한 100(1 α)% 신뢰구간 X ± z α/2 σ n 이때, 오차한계 d d = z α/2 σ n n 이커지면 d 는 1 n 배가됨 n = (z α/2 σ d )2
표본크기결정 점추정구간추정표본크기 오차한계 d 를만족시키는표본크기 n 추정모수및조건 오차한계 (d) 표본수 (n) σ를알경우의 µ σ d = z α/2 n σ n = (z α/2 d ) 2 S σ를모를경우의 µ d = t α/2,n 1 n S n = (t α/2,n 1 d ) 2 p(1 p) 모비율 p d = z α/2 n n = z 2 p(1 p) α/2 d 2 표본크기계산시, 아직표본을추출하지않은상태이므로, S 나 p 등을모른다. 따라서근사값을활용하여대략적인 n 값을구하는데, 요령은다음과같음 S, σ 또는 p 는과거의경험이나연구결과, 또는파일럿연구로부터얻어지거나대략짐작되는값을이용. p 의경우사전정보가전혀없다면 0.5 를이용 σ 를모르는경우에서표본크기 n 을모르면 t α/2,n 1 을구할수없다. 이때는개략적인 n 값을이용하여새로운 n 을구하고, 반복하면 t α/2,n 1 에사용되어진 n 값과새로구한 n 값을접근시킬수있음
점추정구간추정표본크기