제 7 장 기대값과표준오차 기대값하나의확률과정에의해결정되는숫자는하나의값주위로분포한다. 이분포의중심이되는값을기대값 (expected value) 이라고한다. 표준오차기대값과차이가나는정도를표준오차 (standard error) 라고부른다. 확률과정에의해결정되는숫자는기대값주위에분포하며, 기대값과표준오차정도의차이가난다. 예제 Ex) 가한장, 이세장들어있는상자로부터 회무작위복원추출을한다. 추출한숫자들의합에대하여 상자에서 가나올확률 /4, 이나올확률 3/4 회추출하면 가 회, 이 7회나올것을기대 + 7 = 기대값은 이다. 좀더엄밀하게풀면
증가감소앞면이나오는횟수던진횟수의절반 + 확률오차 예제 표준오차와제곱근법칙 + + + 3 상자의평평균 = = + = 4 4 4 추출횟수 = 합의기대값 = = 상자로부터무작위복원추출한숫자들을합치면, 그합의기대값은다음과같다. 합의기대값 = 추출횟수 상자의평균 추출한숫자들의합 = 합의기대값 + 합에든확률오차 대체적인크기 : 표준오차 (SE) 제곱근법칙 (square root law): 상자에서무작위복원추출할경우합의표준오차계산 ( 합의표준오차 ) = 추출회수 ( 상자의표준편차 ) 추출회수가 인경우합의표준오차는바로상자의표준편차와같다. 제곱근법칙 케리히의실험 ( 합의표준오차 ) = 추출회수 ( 상자의표준편차 ) 앞면이나오는횟수 = 던진횟수의절반 + 확률오차 상자안에든숫자들이서로다를수록예측하기어렵다. 표준오차 = 던진횟수 던진횟수가증가하면서 표준오차의절대적인크기는 표준편차가커지면표준오차도커진다. 표준오차의상대적인크기는 상자로부터카드를뽑을때어떤숫자를뽑을지알수없기때문에, 추출회수를늘리면그합을예측하기는점점더어려워진다. 그러나그난이도가추출회수에비례하여증가하지는않는다. 난이도를측정하는표준오차는추출회수의제곱근에비례하여증가한다. 앞면이나오는횟수의비율 = 앞면이나오는횟수 / 던진횟수 제곱근법칙은평균의법칙을수학적으로설명
,, 3, 4, 6 카드에대한복원추출실험,, 3, 4, 6의카드가한장씩들어있는상자로부터 회무작위복원추출하는경우합의표준오차를구해보자. 상자의평균 = 3 상자의표준편차 ( 모표준편차 ) = ( 3) + ( ) + + + 3 = 합의표준오차 = = 9 + + + + 9 = = 관측된합은그기대값인 7 주위에그표준오차인 정도의차이를두고분포한다. 회씩추출을 번반복시행한결과 반복 관측된 반복 관측된 반복 관측된 반복 관측된 반복 관측된 시행 합 시행 합 시행 합 시행 합 시행 합 74 7 4 93 6 67 8 66 7 76 4 7 6 87 8 67 3 8 3 74 43 7 63 7 83 83 4 7 4 99 44 79 64 68 84 8 7 8 4 74 6 7 8 7 6 9 6 74 46 8 66 79 86 7 7 89 7 79 47 67 67 9 87 76 8 89 8 64 48 77 68 8 88 8 9 8 9 73 49 8 69 7 89 77 74 3 8 7 7 84 9 76 69 3 7 7 7 9 9 86 67 3 49 77 7 77 9 78 3 76 33 8 3 69 73 63 93 74 4 7 34 67 4 7 74 74 94 6 77 3 78 69 7 8 9 94 6 7 36 6 6 76 84 96 8 7 6 37 8 7 7 77 9 97 8 8 69 38 83 8 7 78 8 98 8 9 7 39 74 9 9 79 73 99 8 원칙적으로합은 에서합 까지가능. 그러나왼쪽관측치들은그대부분인 99 개가 과 사이, 즉기대값 ±.SE 이내에위치. 하나의관측치가그기대값으로부터 ±SE 혹은 ±3SE 이상떨어질가능성은매우희박하다. 8 4 84 6 7 8 74 6 정규분포곡선이용 앞의예에서합이 에서 9 사이에있을확률을구해보자. 기대값 :7 표준오차 : 이므로 9는 +SE, 는 SE로나타낼수있다. 보기 카지노에서한달동안룰렛게임이, 번이루어진다 고하자. 한번의룰렛게임에서카지노가돈을딸확률은 7 9 관측된합 정규분포이용 -.. /38 이고고객이돈을딸확률은 8/38 이다. 카지노를이 용하는고객은게임당, 원씩걸며매게임은독립이라 고하자. 카지노측이한달간 만원이상딸확률은? 에서 9 사이구간은기대값주위로 ±SE 이내에들어오는구간이다. 따라서 68-9 규칙을이용하면관측치의 9% 가 (, 9) 구간에속할것으로짐작된다. 3
보기 +,원카드 장 -, 원카드 8 장 보기 카지노게임은공정한게임이아니다. ( 참고로기대값이 인게임을공정한게임이라한다.) 만원 만원 평균 : 표준편차 : 기대값 =, =,( 원 ) 변동성 =, = 배로커짐순이득의표준오차 =,( 원 ) 8 ( +, ) + (, ) = 38 38 ( +, ) + (, ) 38 8 38, -. -.. 카지노가한달동안 만원이상딸확률은 99% 나된다. 카지노에룰렛판이많고, 한달간게임횟수가많으며, 한번거는금액이, 원이상이라면? 참고 상자안에두종류의카드만있는경우상자의표준편차를쉽게구할수있다. ( 상자의표준편차 ) = ( 큰수 작은수 ) ( 큰수의비율 ) ( 작은수의비율 ) [ 보기 ] 의경우 8 (, (,)), 38 38 보기 3 주사위하나를 6 번던졌다. () 6 이나올횟수는대략 ( ) 이고, ( ) 정도차이가날수있다. (/6) 6 = 대략 번정도나온다. 두번째괄호에들어갈숫자를구하려면새로운상자모형을만들어야한다. ( ) / 6 / 6 6 3 상자의표준편차 3 4 6 ±3 정도의오차가존재한다. 4
보기 4 동전하나를백번던질때, 앞면이나온횟수에대한기대값과표준오차를구하라. 또앞면이나온횟수가 4 에서 6 사이에있을확률도구하라. 기대값 : (/) = 표준오차 : = 앞면이나온횟수가대략 정도이며, 정도의차이가날수있다. (4, 6) 의범위는 ±SE 범위를의미한다. 따라서 (4, 6) 사이에있을확률은 9% 가된다. 실험을반복하면전체반복횟수의 9% 가 4 에서 6 사이가나올것이다. 보기 3 주사위하나를 6 번던졌다. () 6 이나올횟수는대략 ( ) 이고, ( ) 정도차이가날수있다. (/6) 6 = 대략 번정도나온다. 두번째괄호에들어갈숫자를구하려면새로운상자모형을만들어야한다. ( ) / 6 / 6 6 3 상자의표준편차 3 4 6 ±3 정도의오차가존재한다. 보기 4 동전하나를백번던질때, 앞면이나온횟수에대한기대값과표준오차를구하라. 또앞면이나온횟수가 4 에서 6 사이에있을확률도구하라. 기대값 : (/) = 표준오차 : = 앞면이나온횟수가대략 정도이며, 정도의차이가날수있다. (4, 6) 의범위는 ±SE 범위를의미한다. 따라서 (4, 6) 사이에있을확률은 9% 가된다. 실험을반복하면전체반복횟수의 9% 가 4 에서 6 사이가나올것이다.
이항실험의예 동전한개를 회던지기 : 각시행에서나타나는두가지의결과는앞면과뒷면임 ( 성공과실패의용어는임의로선택한것임 ) 마지막으로한시행에서동전을던져서나타나는결과는다른시행에서동전을던져서나타나는결과에영향을줄수없기때문에시행들은독립임. 섞어정리된카드 벌에서 장의카드를뽑기 : 우리가찾고자하는카드를성공이라고표시하는경우, 장의클럽을받을확률을알기원한다면, 클럽 장은성공이됨 첫번째뽑기에서클럽 장을받을확률은 3/=.임 첫번째카드를복원시키기않고다시정리한후두번째카드를뽑는다면, 이시행은독립이아님 but, 복원시키고다시뽑는다면이항실험이됨 ( 대부분의카드에서는카드를복원시키지않기때문에이실험은이항실험이아님 ) 3. 차기선거에서누구에게찬성투표할의사가있는가를, 명의유권자에게묻는정치여론조사 : 미국같이 명의후보 ( 공화당, 민주당 ) 의경우 개의결과가존재함. 한유권자의선택이다른유권자의선택에영향을미치지않기때문에이시행들은독립임. [ 이항확률변수 ] 이항실험의 n회시행에서나타나는성공횟수 (n=,,,3,4, 의값을지닐수있음 ) 확률나무를활용하면, 각단계는 n회시행의각시행에서해당하는결과를나타냄 n회시행에서 x번성공할확률을계산하기위해서는일련의사건발생순서상에있는각성공에대해서 p를곱해야함. (x 번의성공이존재하면, n-x 번의실패가존재함 ) x 번의성공과 n-x 번의실패를나타내는나무줄기의발생할확률은 x n x p ( p) x 번의성공과 (n-x) 번의실패를나타내는나무줄기의수를계산하기위한조합공식은다음과같음 n n! Cx = x! n x! ( ) 시행 [ 이항실험을위한나무확률 ] S F 시행 S F F 시행3 S F 시행 n F S 6
[ 예제 ] 나운빨 는통계학과목을수강하는학생이다. 불행히도그는좋은학생이아니라수업전에교과서를읽지도않고, 숙제도하지않으며, 정기적으로수업에결석한다. 나운빨 이는다음퀴즈시험을운에맡기려고한다. 퀴즈시험은 개의선다형문제로되어잇다. 각질문은개의보기가있는데이중한개만정답이다. 그가찍기로결심한경우다음물음에답하여라. () 나운빨 이가한문제도정확하게맞추지못할확률은? () 두개의질문에만정확하게답할확률은? [ 답 ] () 번의성공이발생할확률은이항확률분포 n=, p=. x= 따라서 p() =()(.8) =.74 n! x px ( ) = p ( p ) x! n x! ( ) n x [ 누적확률 (cumulative probability)] 확률변수가하나의특정한값이하일확률을구하기원하는경우에적용 PX ( x) [ 예제 ] 나운빨 이퀴즈시험을통과하지못할확률을구하여라. 점수가 % 미만이면실패이다. PX ( 4) = P () + P () + P () + P (3) + P (4) () 두개의정확한답을할확률은이항확률분포에서 n=, p=. x= 를대입하는경우임! x p() = (.) (.)!! ( ) 7
X 값을입력시행수 n갑을입력성공확률 p의값입력누적확률을원하면 true, 개별확률을원하면 false를입력함 이것을클릭하고범주선택 (category) 에서통계 (statistical) 와함수 (function) 선택에서 BINOMDIST 를선택 [ 연습문제 ].X가 n=, p=.를가진이항확률변수라고하자. 다음의확률을구하기위해서엑셀을사용하라. () P (X=4) () P(X 가 보다작거나같음 ) (3) P(X가 보다크거나같음 ). 한주유소체인에있는주유펌프에고객이엔진오일을확인할것을권고하는광고가있다. 이광고는 4대의자동차중에서 대는엔진오일을추가하여야할필요가있다고주장한다. 만일이것이사실이라면, 다음사건의확률은얼마인가? () 주유소에들어오는 4대의자동차중에서 대가엔진오일을추가하여야할필요가있다. () 주유소에들어오는 8대의자동차중에서 대가엔진오일을추가하여야할필요가있다. (3) 주유소에들어오는 4대의자동차중에서 대가엔진오일을추가하여야할필요가있다. [ 연습문제 ]. 메이저리그의야구게임에서일하는한통계전문가가한타자가땅볼로아웃카운트가될확률은.7라고결정하였다. 개의땅볼이있는한게임에서모두아웃카운트가될확률은얼마인가? 6. 지난센서스에의하면 6 년에직업여성의 4% 는풀타임의직업을가지고있었다. 여명의직업여성으로구성된확률표본에서 9 명이상이풀타임의직업을가지고있을확률은얼마인가? 7. 가장최근에조사에의하면, 대학에등록한 명의남학생당 명의여학생이대학에등록하고있다. 명의대학생으로구성된확률표본이추출되었다고하자. 명이상이여학생일확률을구하여라. 3. 한식기세척기의선두브랜드는 3% 의시장점유율을가지고있다. 명의식기세척기고객들로부터구성된표본이추출되었다. 표본의고객중에서 이하의고객이선두브랜드를선택하였을확률은얼마인가? 4. 회계학을전공하는한학생은취업지원서를제출하여야하는회사의수를결정하려고한다. 그는그의연수경험과학점을고려하여취업지원서를제출한회사들의 7% 로부터취업제안을받을것으로예상하고있다. 이학생은 4개의회사에만취업지원서를제출하기로결정하였다. 그가취업제안을전혀받지못할확률은얼마인가? 8
초기하분포 초기하분포 초기하분포 9
[ 포아송실험 ] () 임의의일정한시간구간 ( 또는임의의일정한공간 ) 에서발생하는성공횟수는다른시간구간 ( 다른구간 ) 에서발생하는성공횟수와독립적임 () 한일정한시간구간 ( 일정한공간 ) 에서한번의성공이발생할확률은모든동일한시간구간 ( 모든동일한공간 ) 의경우에같다. (3) 한일정한시간구간 ( 한일정한구간 ) 에서한번의성공이발생할확률은시간구간 ( 공간 ) 의크기에비례한다. (4) 한일정한시간구간 ( 일정한공간 ) 에서한번이상의성공이발생할확률은시간구간 ( 공간 ) 이점점작아짐에따라서 으로접근한다. [ 예제 ]. 교과서에서발견되는오타수의확률 한경영학교수는교과서들의새버전에서발견되는오타수는교과서마다크게다르다는것을관찰하였다. 그는약간의분석을한후에 페이지당평균오타수는.인를가진다고결론을내렸다. 이교수는새교과서의 페이지를임의로선택하였다. 오타가전혀없을확률은얼마인가? [ 답 ] 평균이.인포아송확률변수가 의값을가질확률.. e. (.788) () P() = = =.3!. 4 페이지에서발견되는오타수의확률 시간구간과공간이일치하지않은경우에사건발생의확률을계산하는방법위의 번문제에이어서이통계학교수는방금새로운통계학교과서 권을받았다. 그는이책이 4 페이지라는것을알았다. () 이책에오타가전혀없을확률은? () 이책에 개이하의오타가있을확률은얼마인가?
누적을원하면 true, 개별확률을원하면 false [ 연습문제 ]. 서울에서강설은겨울동안임의로그리고독립적으로내린다. 강설은평균적으로매3일마다한번만내린다. ()주일동안 번의강설이내릴확률은얼마인가? () 오늘한번의강설이내릴확률을구하라.. 한개인의웹사이트의방문은매우드물게이루어진다. 이개인웹사이트의방문은일주일당평균이 회이고, 임의로그리고독립적으로이루어진다. () 이사이트에서일주일에 회이상의방문이발생할확률을구하여라. () 이사이트에서 주일에 회이상의방문이발생할확률을구하여라. 3. 한장의카펫에흠집은매 제곱피트 (fit ) 당평균한개고, 임의로그리고독립적으로발생하는경향이있다. 8피트 *피트인카펫한장에흠집이전혀없을확률은얼마인가? 4. 인터넷중개회사에대한불만은 일당평균적으로 건이발생한다. 불만의수는를따른다. () 이회사가하루에 건이상의불만을받을확률을구하여라. () 이회사가 일동안에 건의불만을받을확률을구하여라.