제 8 장. 통계적추정 개요 : 통계적추정 ( 추론 ) 은모집단에서추출된표본의정보로모집단에대한값의추측또는그값에대한확신을결정하는과정이며다음의두단계가있다. 통계적추정 (statistical estimati): 모수인평균 ( m), 분산 ( s ), 표준편차 ( s ), 상관계수 ( r ) 가갖 는값과범위를추정. 가설검정 (hypthesis testig): 모수에대한통계적추정값의옳고그름을판단. 모집단의전수조사는거의불가능하므로모집단으로부터일정한표본을추출하여모집단의평균 ( ), 분산 ( ), 표준편차 ( ), 비율 ( p ), 상관계수 ( ) 등을추정하고검정을통해모수에대한 특징을알아낸다. 이러한모수에대한추정과가설검정은표본통계량에의해이루어진다. [ 예제 ] 모제약회사에서약품성분의변동이모표준편차로 0mg 이하가되는새로운제조방법을연구하였다. 그러나새로운제조방법은비용이많이들어약품성분의변동이 7mg 이하가되지않으면채산이맞지않는다. 실제제조실험을 0 회한결과자료는다음과같다. 단모집단은정규분포이다. 5.78, 5.7, 5.77, 5.78, 5.73, 5.73, 5.79, 5.74, 5.76, 5.7 () 만일모표준편차가 7mg 이하라고하면모표준편차는얼마라고기대할수있는가? () 새로운제조방법은약품성분의모표준편차가 7mg 이하라고생각할수있는가? 이경우질문 () 은추정이고, () 는가설검정의문제이다.() 의추정은 8 장, () 의검정은 9 장에 서각각공부한다. 모집단의특성을추정하는방법점추정 (pit estimati): 모표준편차는 5.73mg 처럼모수 를단일값으로추정하는것. 구간추정 (iterval estimati): 모표준편차가신뢰률 95% 로5.74 에서 5.776 의구간에존재 처럼모수를포함할확률을명확하게해서모수를포함하는구간의하한과상한을표시하는방법. 8. 점추정 8.. 추정량과추정값 모수 (,,, p, ) 를예측하기위하여점추정량 를추정한다. 추정량과추정값 : 표본데이터로부터미지의모수 를추정하기위하여이용되는통계량. ( X, X,, X ) 을 의추정량이라하고, 의측정값 ( x, x,, x ) 를 의추정값이라한다. 모수를점추정하는판단기준은다음과같다. 점추정의판단기준 99
() 불편추정량 : 통계량중에서기대치가모수와일치. () 유효추정량 : 불편추정량중에서분포의표준편차가가장작은추정량. [ 예제 ] 표본의평균 x 와중앙값 x 은모두불편추정량을만족하지만유효추정량은같지않다. 각각의분포표준오차 (Stadard Errr: SE) 는아래와같이서로다르다. 앞으로 Stadard Errr는 SE 대신에 D 로표기하도록한다. SE( x) D( x) SE( x) D( x) m3 m 이므로 D( x) D( x). 3 따라서유효추정량의조건때문에점추정량으로표본평균 x 를사용한다. 여기서 x 는모평균 에대한최소분산불편추정량이다. 8.. 점추정의성질 모수를추정하는방법은여러가지가있다. 예를들면모평균 를추정하고자한다면이것은산 술평균 ( ), 중앙값 ( ), 최빈값 ( ), 기하평균 ( ) 등이있다. 모수추정량의좋고나쁨은추 정량의표본분포가모수 의조건으로다음과같은것이있다. ) 불편성 x x M G 불편추정량 (ubiased estimatr) 일때, 즉 E( ) 이면편의추정량 (biased estimatr) 주위에어떤형태로분포되어있는가에달려있다. 바람직한추정량 E( ) 불편추정량과편의추정량분포상태를아래그림과같이나타낼수있다. ) 유효성 가가장바람직하려면모수 에집중되어있어야한다. 즉모든불편추정량중에서분산이가 장작아야하고, 모수 에관한추정량 의분산을평방평균오차 (MSE: mea square errr) 이 어야한다. MSE E( ) 추정량들사이의상대적유효성 (Relative Effectiveess): MSE RE MSE ( ) ( ) 00
위의그림모수와통계량의분포에서 과는같은불편추정량이지만 이 에집중되어있기때문에 이보다더바랍직하다. 유효추정량 : 다음의관계가성립하면 은 보다유효하다. Var D ( ) Var( ) ( ) D( ) 보다모수 [ 보기 8_] 모평균 를추정하고자모집단에서추출한확률표본을 ( X, X, X3) 라할때다음 과같은두가지추정량을생각하자. X X X 3 X 3X 5X 3 3 3 () 관측값이 x 3, x 4, x3 5가얻어졌다면각각의추정량에의한추정값은얼마인가? () 두추정량, 가모평균 의불편추정량임을보여라. (3), 에대한유효추정량은어느것인지를보여라. 345 33(4) 5(5) ( 풀이 ) () 4 4.44 3 3 X X X3 () E( ) E( ) [ E( X) E( X ) E( X 3)] (3 ) 3 3 3 X 3X 5X 3 E( ) E( ) [ E( X) 3 E( X ) 5 E( X3)] (9 ) 9 9 3 (3) 표준오차 (Stadard Errr): 9 5 D( ) 0.657 8 따라서 이 보다유효한추정량이다. D( ) 0.577 9 3) 일치성 표본의크기가매우크다면추정값은참값에가까워진다. 이것을일치추정량이라한다. 다음의관계가있으면일치추정량이다. lim P( ) r lim P( ) 0 Var( X ) 일치추정량이다. 이므로 이면 Var( X ) 0, 즉 X 와 는일치하며, 이경우 X 는 의 추정량의일치성을밝히는데체비셰프부등식이유용하게쓰인다. 체비셰프부등식 : 임의의양수에대해 P[ X k ] r P[ X k ] k k k 0
[ 보기 8_] 구간이 [ X 3, X 3 ] 로주어질때, k 4 라면측정치가이구간에속할확률을구하여라. 5 ( 풀이 ) P 4 6 [ 보기 8_3] 표본이 36 이고 P[ 0.4 x 0.4] 일때 k 3이라면체비셰프부등식을이용하여모분산을구하여라. ( 풀이 ) P[ k x k ] k 3 k 3: 0.4 0.8 0.64 36 8. 구간추정 구간이모수의참값을포함시킬확률을신뢰수준 (cfidece level) 또는신뢰율이라하고보통 95% 로정하며이것을유의수준 와 의관계에있다. 보증된신뢰율 ( ) 로모수 를 포함하는구간을신뢰구간 (cfidece iterval) 이라하며신뢰구간의상한과하한을신뢰한계 (cfidece limit) 라부른다. 신뢰구간을구하려면모수의점추정량을통계량으로정하고이통 계량의분포를생각하여신뢰율을정해서모수를포함하도록한다. 신뢰수준 ( 신뢰율 : cfidece level): 구간이모수를포함할확률. 신뢰구간 (cfidece iterval): 신뢰수준으로모수를포함하는구간. 신뢰구간결정방법 : 모수의점추정량을통계량으로정하고신뢰율을정해서모수를포함시킴. 8.3 모평균의추정 8.3. 모평균의점추정 () 추정량 : xi i x () 를알때추정량의표준오차 (Stadard Errr): Dx ( ) 0
(3) 를모를때추정량의표준오차 : Dx ( ) s 8.3. 모평균에관한구간추정 ) 모분산 을아는경우 표본크기가 이면 표본평균 : x~ N(, ) x 표준화변수 : z ~ N(0,) / 확률 ( 유의수준 ) 에대해신뢰구간의확률은. 예를들면 0.05 0.95(95%) 이다. 모분산 x P[ z/ z/ ] / 을알고있는경우, 구간확률 ( 신뢰수준 ) 은 라면신뢰구간확률은 위의확률속의부등식을다시쓰면다음과같다. P[ x z x z ] [ x z x z ] 구간확률 ( 신뢰수준 ): / / 모평균의구간추정 : / / 구간추정에서자주사용하는대표적인 z 값 ( 신뢰수준확률 0.90 ): z /.645 () 0. () 0.05 ( 신뢰수준확률 0.95): z /.960 (3) 0.0 ( 신뢰수준확률 0.99 ): z /.580 [ 보기 8_4] 어떤전구공장에서생산되는전구수명시간의표준편차는시간이다. 임의로 00 개를추출하여재었더니전구의평균수명은 000 시간이었다. 전구의평균수명에대한 구간을구하여라. [ x z x z ] ( 풀이 ) 모평균의구간추정 : / / 03 0 95% 신뢰
0 0 000.96 000.96 00 00 976.48 03.5 ) 모분산 을모르는경우 N(, ) 인정규모집단으로부터추출한표본크기 의표본평균은 x, 표본분산은 것은자유도 s 일때이 인 t -분포를따른다. 만일 이크다면 t -분포는정규분포인 z -분포를사 용하여도아무런문제가없다. X ~ t( ) s/ x 에대한신뢰구간의확률 : P[ t(, ) t(, )] s/ 확률속의부등식을다시쓰면다음과같다. s s 구간확률 ( 신뢰수준 ): P[ x t(, )( ) x t(, )( )] s s 모평균의구간추정 : x t(, )( ) x t(, )( ) SPSS 통계처리문제 [ 보기 8_5] 시금치통조림에포함된비타민의양은정규분포를따른다.7 개의통조림을임의로 추출하여비타민양 (mg) 을재었더니다음과같았다. 평균함유량 에대한 하여라. x i : 6 0 3 9 5 3 3 7 0 9 8 6 5 ( 풀이 ) 평균 : 7 xi (330) 9.4 i 7 x 자유도 (degree f freedm): 7 6 7 분산 (variati): s ( x x) (88.) 8.00 6 i 95% 신뢰구간을구 04
표준편차 (stadard deviati): s 8.00 4.435 s 4.435 평균의표준오차 (Stdard Errr f mea): Dx ( ).09 7 x 신뢰수준 95%( 0.05) 일때 t 분포의확률 : P[ t(, ) t(, )] s/ 6, 0.05 일때 t(, ) 의값 : t(, ) t(6,0.05).0 t - 분포 :http://www.statdistributis.cm/t/ 이 iteret site 는검정통계량으로 rmal( 정규 ), t, F -, -분포의확률을계산하거나또는 역으로확률을검정통계량으로환산시킬수있는 calculatr를갖고있다. t(, ) t(6,0.05) 의 t 값찾는법. (a) [p-value] bx 에 0.05 입력. (b) [d.f.]bx 에 9 입력. [d.f.: degree f freedm] (c) [tw tails] 를선택. [t-value] bx 에. 가나온것을확인할수있다.. 의의미는자유도 6 인 t -분포에서 0.05 일때이값을기준으로양단의면적이전체 면적의 5% 가되는지점이라는뜻이다. www.ggle.cm 의검색창에 t-distributicalculatr 또는 F-distributicalculatr 로검색하면 다양한 site 에서여러분포의확률이나검정값을계산할수있다. s 모평균의범위 : x t(, ) x t(, ) 9.4.0(.09) 9.4.0(.09) 7.30.594 s SPSS 통계처리 [8_5_ 신뢰구간.sav] 분석 > 평균비교 > 일표본 T 검정 보조창이뜨면변수이름 [ 비타민양 ] 을검정변수로옮기고, 옵션을눌러신뢰구간을로한다. 계속 > 확인 95% T- 검정결과 05
일표본통계량 비타민양 평균의표 N 평균 표준편차 준오차 7 9.4 4.44.09 일표본검정 검정값 = 0 비타민양 유의확률 차이의 95% 신뢰구간 t 자유도 ( 양쪽 ) 평균차 하한 상한 8.86 6.000 9.4 7.3.59 SPSS 통계처리문제 [ 보기 8_6] 어느연구원이새로운제품을개발하였다고한다. 이제품의평균강도는 80kg / cm 보다크다고한다. 평균강도 를측정하기위하여임의로 0 개를추출하여측정한결과가 다음과같다. 새로운제품의평균강도에대한 95% 신뢰구간을구하여라. 평균강도 [ x ]: 8 75 9 70 85 73 83 65 88 67 ( 풀이 ) 평균을먼저구한다음아래표를완성한다. 이표에의거필요한값들을계산하고 SPSS 를 돌려비교하자. 0 평균 : x xi (779) 77.9 0 i id x x x x x ( x x) 8 4. 4. 6.8 75 -.9.9 8.4 3 9 3. 3. 7.6 4 70-7.9 7.9 6.4 5 85 7. 7. 50.4 6 73-4.9 4.9 4.0 7 83 5. 5. 6.0 8 65 -.9.9 66.4 9 88 0. 0. 0.0 0 67-0.9 0.9 8.8 합계 779 0 79 746.9 평균편차 (Mea Deviati): MD xi x (79) 7.9 0 i 자유도 (degree f freedm): 0 9 06
분산 (variati): 7 s ( x x) (746.9) 8.9889 9 표준편차 : s 8.9889 9.098 평균의표준오차 (Stadard Errr f mea): i s 9.098 Dx ( ).8808 0 x 신뢰수준 95%( 0.05) 일때 t 분포의확률 : P[ t(, ) t(, )] s/ 9, 0.05 일때 t(, ) 의값 : t(, ) t(9,0.05).6 s s 모평균의범위 : x t(, )( ) x t(, )( ) 77.9 (.63)(.8808) 77.9 (.63)(.8808) 7.38 84.4 T 검정값 : T x 77.9 80 0.79 s/.8808 t -분포:http://www.statdistributis.cm/t/ () t(, ) t(9,0.05) 의 t 임계값구하기. (a) [p-value] bx 에 0.05 입력. (b)[d.f.]bx 에 9 입력. (c)[tw tails] 를선택. d.f.: degree f freedm. [t-value] bx 에.63 이나온것을확인할수있다..63 의의미는자유도 9 인 t - 분포에서이값을기준으로양단의면적이전체면적의 5% 가되 는지점이라는뜻이다. () 검정값 T 0.79 의확률 ( 유의확률 ) 구하기 (a) [t-value] bx 에 0.79 입력. (b) [d.f.]bx 에 9 입력. (c) [tw tails] 를선택. [p-value] bx 에 0.485 가나온것을확인할수있다. 0.485 의의미는자유도가 9 인 t -분포에서 T 0.79 의양단의면적이전체면적의 48.5% 가된 다는뜻이다. SPSS 통계처리 [8_6_ 평균강도.sav] 분석 > 평균비교 > 일표본 T 검정 07
보조창이뜨면변수이름 [ 평균강도 ] 를검정변수로옮기고, 검정값에 80 을입력. 옵션을눌러신뢰 구간을 95% 로한후, 계속 > 확인 T- 검정결과 일표본통계량 N 평균표준편차 평균의표준오차 평균강도 0 77.90 9.0.88 T 자유도 일표본검정 검정값 = 80 유의확률 ( 양쪽 ) 평균차 차이의 95% 신뢰구간 평균강도 -.79 9.485 -.00-8.6 4.4 하한 상한 SPSS 통계처리결과는계산으로얻어진값과동일함을볼수있다. 모평균 의범위 : 차이의 95% 신뢰구간하한과상한을주어진검정값 80 에합한값. 80 8.6 80 4.4 7.38 84.4 3) 표본크기가충분히큰경우표본크기 이충분히크면표준편차 대신에 s 를사용하는표준정규분포를이용하여확률이나신뢰구간을정하여도무방하다. 즉 [ s s x z/ x z/ ] [ 보기 8_7] 어느제품을임의로 00 개를추출하여무게를측정하였더니 x 5.0, s 4.99 었다. 모평균 에대한 95% 신뢰구간을구하여라. z -분포:http://www.statdistributis.cm/rmal/ z z / 0.05 의양쪽값. (a) [p-value] bx에 0.05 입력 (b) [mea] bx에 0 입력 (c) [std dev:] bx에 입력 (d) [tw tails] 선택 [z-value] bx에서.96을얻을것이다. 이 ( 풀이 ) 95% 신뢰구간 : x z s / x z/ z / z0.05/ z0.05.96 s 08
평균의표준오차 : s 4.99 0.499 00 [ s s x z x z ] 모평균의신뢰구간 : / / 5.0.96(0.499) 5.0.96(0.499) 4.0 5.978 8.4 모분산의추정 8.4. 모분산의점추정 자유도 : () 모분산의추정량 : () 모표준편차추정량 : s s ( xi x) i 8.4. 모분산에관한구간추정 자유도를 로표기하도록하고정규모집단에서크기 인확률표본을추출할때모분산 에대한추정량은표본분산 s ~ ( ) 즉자유도가 의확률은 확률 : 신뢰구간 : s 에대하여다음과같다. 인 -분포를따른다. 자유도가 P / / ( ) s s s / / / / 이고, 신뢰수준 에대한 -분포 [ 보기 8_8] 플라스틱부품의인장강도를알아보기위해부품 0 개를추출하여측정한결과평균 은 47.kg / mm 이고분산은 3.4 였다. 모분산 에대한의신뢰구간을구하여라. 09 95%
-분포: http://www.statdistributis.cm/chisquare/ 와 / 0.05 / 0.975 의양쪽값. (a) [p-value] bx 에 0.05 또는 0.975 입력 (b) [d.f.] bx 에 9 입력 (c) right tail 선택 [ value] bx에서 0.05 9.0, / 0.975.70 을얻을것이다. ( 풀이 ) 자유도 : 0 9 자유도 9 인 분포값 : / 0.05 9.08 / 0.975.7004 s s / / ( ) ( ) 9(3.4) 9(3.4) 9.0.70.6086.337 8.5 독립표본인두모집단의모평균차의추정 8.5. 두모분산 과 을아는경우 과 로추출한독립표본의평균분포 : x~ N(, ), y~ N(, ) x, y 는서로독립이므로 E( x y) E( x) E( y) Var( x y) Var( x) Var( y) 로놓으면 x y의표준화통계량 : Z ( xy) ( / ) ( / ) ~ N(0,) ( xy) 신뢰수준 ( 구간확률 ): P[ z/ z / ] ( / ) ( / ) 두모평균의차 의신뢰수준 에대한신뢰구간 : ( x y) z ( x y) z / / [ 보기 8_9] AB, 두제품을임의로 5 개씩추출하여평균수명을조사한결과표본평균이 A 는 480 시간, B 는 45 시간이었다. 두제품의평균수명은모평균편차가각각 34, 5 정규분포를따른다. 두제품의평균수명시간차 에대한 95% 신뢰구간을구하여라. 인 0
z - 분포 :http://www.statdistributis.cm/rmal/ z z / 0.05 의양쪽값. (a) [p-value] bx에 0.05 입력 (b) [mea] bx에 0 입력 (c) [std dev:] bx에 입력 (d) [tw tails] 선택 [z-value] bx에서.96 을얻을것이다. ( 풀이 ) 5 (34 5 ) 0.8965 평균차 : x y 480 45 8 z / z0.05.96 두모평균의차인 의신뢰수준 에대한신뢰구간 : ( x y) z ( x y) z / / 8 (.96)(0.8965) 8 (.96)(0.8965) 6.643 ( ) 49.357 8.5. 두모분산 과 xi 는모분산 인정규모집단 을모르는경우 N(, ) 에서추출한 개의확률표본이고, yi 는모분산 인정 규모집단 N(, ) 에서추출한 개의확률표본이며둘은독립일때모평균차인 의신 뢰구간을구하면다음과같다. x y는정규분포를따르며평균과분산은각각 E( x y) Var( x y) ( ) 여기서등분산 의합동추정량 s p 은 s [ ( x x) ( y y) ] [( ) s ( ) s ] p i i i i 자유도 :, 또한, 위의합동추정량분산을자유도를포함하는수식으로간략화하면 합동추정량분산 : sp ( s s )
x y의표준화통계량 : Z ( xy) (/ ) (/ ) ~ N(0,) () s p 의분포 : s p 인 -분포를따른다. 즉 ~ ( ) Z () 는자유도가 인 t -분포를따른다. 즉 / ( x y) ( ) ~ t ( ) T s (/ ) (/ ) p 두모분산이 의 으로같고미지인경우에 ( x y) t(, ) s ( x y) t(, ) s p p 의신뢰구간은다음과같다. [ 보기 8_0] 임의의 명의학생에게방법 의방식으로한학기수업을가르치고다른임의의 0 명의학생에게방법 의방식으로한학기를가르친후에같은시험을실시하였다. 방법 의 평균점수는 85 점, 표준편차는 4 점이며방법 의평균점수는 8 점, 표준편차는 5 점이다. 두모 집단은동일한분산을갖는정규분포를따른다고할때평균차 에대한 90% 신뢰구 간을구하여라. t -분포:http://www.statdistributis.cm/t/ () t(, ) t(0,0.05) 의 t 임계값구하기. (a) [p-value] bx 에 0.0 입력. (b) [d.f.]bx 에 0 입력. (c) [tw tails] 를선택. [t-value] bx 에서.75 를얻을것이다. d.f.: degree f freedm. ( 풀이 ) 자유도 : 0 0,, 0 9 합동추정량분산 : sp ( s s ) [()(4 ) (9)(5 )] 0.05 0 합동추정량의표준편차 : sp 0.05 4.4777 t(, / ) t(0,0.05).75 신뢰구간 : ( x y) t(, ) s ( x y) t(, ) s p p
4 (.75)(4.4777) 4 (.75)(4.4777) 0 0 0.69 7.3 0.69 7.3 8.5.3 표본의크기가큰경우 두표본의크기가크면모집단의분포에관계없이중심극한정리에의하여 x 와 y 는근사적으로 N(, / ), N(, / ) 을따르므로표준화하면 Z ( xy) ( / ) ( / ) ~ N(0,) 표본이큰두모평균차에대한신뢰구간 : ( x y) z ( / ) ( / ) ( x y) z ( / ) ( / ) / / [ 보기 8_] 어느고등학교에서임의로남학생 75 명, 여학생 50 명을추출하여영어시험을친 결과남학생과여학생의평균은각각 8 점과점이고, 표준편차는각각점, 점이다. 평균 의차에대한신뢰구간을구하여라. ( 풀이 ) x y 8 76 6 95% 8 6.543 75 50 신뢰구간 : 6 (.96)(.543) 6 (.96)(.543) 3.545 8.4584 8.6 대응표본의추정 8.6. 대응표본차의추정 대응표본은동질의대응쌍으로이루어진자료이다. 임의로한조로이루어진한쌍의실험단위를 추출하여대응표본의 x 는처리, y 는처리 로하고, 각쌍 ( x, y ) 은서로독립일때차 d x y 에대한평균과분산은다음과같다. d, sd ( di d) i i i di i z / z0.05.96 di 분포는정규분포 i N 를따르고서로독립일때모평균차 에대한 (, d ) 뢰구간은다음과같다. 자유도는 이다. 76 8 6 3 i i 신
sd d t(, ) d t(, ) s d 여기서 s d 는차에대한평균의표준오차이다. SPSS 통계처리문제 [ 보기 8_] 어느기업에서판매원에대한직업교육을실시한후에능률향상이있는지를조사하 였다. 임의로판매원 0 명을추출하여조사한결과가아래와같다. 여기서단위는백만원이다 3 4 5 6 7 8 9 0 실시전 ( x ) 실시후 ( y ) 3 45 35 8 7 9 5 30 4 33 7 43 3 4 34 38 30 37 36 44 교육실시전과실시후의판매능력차 력차의분포는정규분포를따른다고가정한다. 에대한 95% 신뢰구간을구하여라. 단판매능 ( 풀이 ) 아래표에의거필요한계산을한다. id x x x ( x ) x y y y ( y ) y d x y ( d d) 3-8.6 73.96 7-9. 84.64-4 0.36 45 3.4 79.56 43 6.8 46.4 43.56 3 35 3.4.56 3-5. 7.04 4 73.96 4 8-3.6.96 4 5.8 33.64-4 88.36 5 7-4.6.6 34 -. 4.84-7 5.76 6 9 -.6 6.76 38.8 3.4-9 9.36 7 5-6.6 43.56 30-6. 38.44-5 0.6 8 30 -.6.56 37 0.8 0.64-7 5.76 9 4 9.4 88.36 36-0. 0.04 5 9.6 0 33.4.96 44 7.8 60.84-40.96 합계 36 0 44.4 36 0 99.6-46 370.4 3,6 36 두자료의평균 : x 3.60, y 36.0 0 0 두자료의분산및표준편차 : s ( x x) (44.4) 49.556 x 49.556 7.0 9 s 0 x i i s ( y y) (99.6) 33.89 y 33.889 5.770 9 s 0 y i i 두자료의평균표준오차 : 4
s x 7.0 Dx ( ).7 0 s y 5.770 Dy ( ).85 0 두대응표본의차 : di xi yi 차의평균 : d di ( 46) 4.6 0 i 자유도 : 0 9 차의분산 : s ( d d) (370.4) 4.556 9 d i i 차의표준편차 : sd 4.556 6.453 차평균의표준오차 : sd 6.453 Dd ( d).087 0 d 신뢰수준 95%( 0.05) 일때 t 분포의확률 : P[ t(, ) t(, )] s / 9, 0.05 일때 t(, ) 의값 : t(, ) t(9,0.05).67 sd sd 95% 신뢰구간의모평균차의범위 : d t(, )( ) x t(, )( ) ( 4.6) (.6)(.087) ( 4.6) (.6)(.087) 9.89 0.0 T 검정값 : d 4.6 0 T.675 s/.087 여기서 0 로놓은이유는모평균이실시전이나실시후에모두같을것이라는 가정하에표본을뽑았기때문이다. t -분포:http://www.statdistributis.cm/t/ () t(, ) t(9,0.05) 의 t 임계값구하기. (a) [p-value] bx 에 0.05 입력. (b) [d.f.]bx 에 9 입력. d.f.: degree f freedm. (c) [tw tails] 를선택. [t-value] bx 에.63 이나온것을확인할수있다. () 검정값 T.675 의확률 ( 유의확률 ) 구하기 5 d
(a) [t-value] bx에.675 입력. (b) [d.f.]bx에 9 입력. (c) [tw tails] 를선택. [p-value] bx에 0.05 가나온것을확인할수있다. SPSS 통계처리 [8 직업교육.sav]Data의변수명을 [ x ] 와 [ y ] 로하고, 변수보기의설명에 [ x ] 행에는 실시전 [ y ] 행에는 실시후 를입력. 분석 > 평균비교 > 대응표본 T 검정 보조창이뜨면변수이름 [ x ] 와 [ y ] 를대응변수로이동. 옵션을눌러신뢰구간을 95% 로한다. 계속 > 확인 T- 검정결과 대응표본통계량 대응 실시전실시후 평균의표 평균 N 표준편차 준오차 3.60 0 7.0.7 36.0 0 5.770.85 대응표본상관계수 대응 실시전 & 실시후 N 상관계수유의확률 0.50.3 대응표본검정 대응 실시전 - 실시후 대응차 차이의 95% 표준 평균의 신뢰구간 자유 유의확률 평균 편차 표준오차 하한 상한 t 도 ( 양쪽 ) -4.600 6.45.09-9. -.0 -.67 9.050 결과를위에계산한값들과비교하라. 그리고이러한값들이어떤절차에의해서얻어질수있는지그이론을숙지하도록한다. 9.89 0.0 차이의신뢰구간 : 8.6. 두대응표본모분산의비에대한추정 두모집단의산포도를비교하고자할때, 표본분산은 s x x ( i ) i s y y ( i ) i 6
분산비 : s / s F ( )( ) ~ F(, ) s / s 여기서각자료의자유도는, 이다. / 에대한신뢰구간의확률 : 두모분산비 s P[ F (, ; ) ( )( ) (, ; )] F s / 에대한 00( ) % 에대한신뢰구간 : s s F(, ; )( ) ( ) (, ; )( ) F s s 이것의좌측은다음과같이표현된다. s s ( ) ( ) F (, ; )( ) F (, ; ) s s [ 보기 8_3] 감기약에들어있는어떤성분의양을두가지측정법에의하여조사하고자한다. 임의로각각 0 개씩측정한결과 의방법은분산이 s s 0.076 이다. 두모분산비 / 대한 95% 신뢰구간을구하여라. ( 풀이 ) 9, 9, F(9,9,0.05) 4.06 s s ( ) ( ) F (, ; )( ) : F (, ; ) s s 0.05 0.05 ( ) ( ) (4.06)( ) 0.933 ( ) 3.393 4.06 0.076 0.076 F -분포:http://www.statdistributis.cm/f/ F(, ) F(9,9; 0.05) 의 F 임계값구하기. (a) [p-value] bx 에 0.05 입력. 0.05 이고 의방법은분산이 7
(b)[umeratr d.f.]bx 에 9 입력. (c) [demiatr d.f.]bx 에 9 입력. d.f.: degree f freedm. (d)[right tail] 을선택. [F-value] bx 에서 4.06 을얻을것이다. 8.7 표본크기의결정 표본수에따라추론결과의정밀도가달라지기때문에주어진신뢰수준하에표본크기 의결정은매우중요하다. 이클수록신뢰구간은짧아지고작을수록신뢰구간은길어진다. 모집단이정규분포를이루고모분산이알려져있는경우 신뢰율에대한 의신뢰구간은 x z/ x z/ 오차의한계 : e z / 오차의한계 e 이하로하는표본의크기 z / e z / ( ) e 유한모집단 N 이대략정규분포를따를때표본크기 ( e / z /) ( / N) 제 종의오류를범할확률 가주어질때표본크기 z z [ ] ( ) / [ 보기 8_4] 전구의수명시간의표준편차는 0 시간이고전구의수명은 000 시간이다. 95% 신 뢰수준에서오차한계를 50 시간이내로하려면필요한표본크기는얼마로하여야하는가? ( 풀이 ) 0.05, 0, 50 z / (.96)(0) ( ) [ ].3 e 50 e, z /.96 [ 보기 8_5] 화학원료를생산하는공정이 N (00,4 ) 인정규분포이다. 다른원료를사용하여시 료를 0 개를추출하여평균치를구하니 97.6kg 을얻었다. 이원료를사용하면공정평균이종래보다 3.0kg 만큼작을때이것을적어도확률 90% 로검출하는데필요한표본크기를구하라. ( 풀이 ) 0.05, 0.0, 4, 3.0 z z.645.8 [ ] ( ) 5.3 ( ) / 3.0 / 4 8
연습문제. 전구를생산하는회사의전구수명시간은표준편차가 300 시간이다. 생산한전구 00 개를임 의로추출하여조사하였더니평균수명이 4500 시간이었다. 이회사에서생산된전구의평균수명에대한 95% 신뢰구간을구하여라.. 생산된부품의무게에대한표준편차는 8g 이다. 모평균을신뢰도 95% 확신을갖고추정하 고자할때추정오차를 3g 이내로하려면표본의크기는어느정도하면좋은가? 3. 다음자료는어느가정에서한달동안사용한도시가스 ( 단위 3 m ) 의양이다. () 평균과표준 편차 () 모평균 95% 신뢰구간 (3) 95% 확신을갖고 추정치가 0. 이하를가지기위한표본크 기를각각구하여라..9 4.3 5.4 3.4 5.5 3.4 5.3 4.7 5. 4.6 4.4 9.6 6.3 3.6 5. 5.3 4.6 4. 5.6 4.5 4. 어느농장에서젖소에서얻은우유의양은평균이.9 라고한다. 어떤사료를먹인후부터 우유의양이증가하는것같아이를알아보기위해젖소 0 마리를조사하였더니다음과같은결 과를얻었다. [ 우유양 ] 3.7 5.8 5.3 0.0. 4. 3.8 3..7 5.8 () 표준편차. 로가정하고평균 의 95% 신뢰구간을구하여라. () 를모르는경우에평균 의 95% 신뢰구간을구하여라. (3) 모집단의분산 의 90% 신뢰구간을구하여라. 5. 다음은식이요법전과후를 5 명에대하여얻은체중이다. 식이요법전과후에대한차의 95% 신뢰구간을구하여라. 3 4 5 식이요법전 식이요법후 87.5 84 70 65 75 85 84.5 66.5 66 7.5 6. 전구를만드는회사가생산한전구의수명은평균이 800 시간이고분산이 (50) 인어떤분포 를따른다고한다. () 전구수명을모를경우하나의전구수명이 700 ~ 900 시간일최소확률을구하여라. () 5 개의확률표본을추출했을때표본평균이 770 ~ 830 시간일최소확률을구하여라. (3) 전구수명분포를모를경우표본평균의 95% 오차한계가 0 이하가되려면최소필요한표본크 기는얼마인가? (4) 정규분포일경우질문 () 의근사율은얼마인가? (5) 정규분포의경우질문 (3) 에서으표본크기는얼마인가? 9
(6) 정규분포일경우 5 개의표본결과가다음과같을때모평균에대한 95% 신뢰구간을구하 여라. xi 0500 x 6848400 (7) 질문 (6) 에서모분산에대한 95% 신뢰구간을구하여라. i 7. 한화학약품제조회사가다른두종류의원료를사용하여생산하고있다. 각원료에서주성 분 A 의함량은다음과같다. 단함량들은정규분포를따르고모분산이같다고가정한다. 상표 과상표의주성분 A 의함량을각각, 라고할때다음물음에답하라. 주성분 A 의함량 ( 단위 %) 상표 80.4 78. 80. 77. 79.6 80.4 8.6 79.9 84.4 80.9 83. 상표 80.0 8. 79.5 78.0 76. 77.0 80. 79.9 78.8 80.8 의 95% 신로구간을구하여라. () () (3) / 의비율에관한 95% 신뢰구간을구하여라. 이라가정하고 의 90% 신뢰구간을구하여라. 8. 제품에철분함유량을조사하는두가지방법은화학분석과 X- 선분석이있다. 이두가지방법 에차이가있는지조사하고자한다. 5 개의표본을추출하여두가지방법에의하여조사한결과는 다음과같다. 두방법의차에대한 95% 신뢰구간을구하여라. 3 4 5 X- 선 화학.0.0.3..4..9.5.3.4 9. 모제약회사에서감기에대한새로운신약을개발하여약의효능이 80% 이상이라고믿으나, 당국에서조사를하여본결과 80% 이하라고판단하고있다. 감기에걸린 400 명을임의로추출하 여 80 명이이약에의해치료되었다면치료비율에대한 95% 신뢰구간을구하여라. 0. 어떤도시에서과거에는 0% 로알려진기름을이용한난방을피하기위해 000가구를대상으로조사하였다. () 과거의자료가옳다면 000가구중에서 300가구이상이기름을이용하여난방을하는확률을정규분포에의해구하여라. () 만약 50가구가기름을이용한다면기름을이용한난방률의 95% 신뢰구간을구하여라. (3) 95% 오차한계가 0.0 이하가되려면추가로필요한표본크기는얼마인가? 0