[ 도입사례 ] 17 세기의프랑스철학자인파스칼은파스칼의정리혹은파스칼의원리등을남긴뛰어난수학자이며근대확률이론에도큰영향을미친바있습니다. 파스칼의책팡세 (Pensees) 에는 ' 파스칼의내기 (Pascal's Wager)' 라고하는흥미있는내용이수록되어있습니다. 파스칼은특히종교의문제에있어서는우리가이성에만의존할수없다는입장이었는데, 파스칼이신의존재와관련하여설명한내용은불확실성하의결정 (decision under uncertainty) 이라고하는입장에서다음과같은표 (2 by 2 matrix) 로정리할수있겠습니다. 신의존재 신의부재 신의존재를인정하는삶천국 ( 혹은무한한 + 행복 ) 약간의 - 행복 신의존재를부정하는삶 명시하지는않았으나추측컨대연옥혹은지옥 ( 혹은무한한 - 행복 ) 약간의 + 행복 위의표만을놓고판단할때, 신의존재가능성즉존재확률이 0 보다크다면신의존재를 인정하는삶의기대가치 ( 아래의관련부분에서설명합니다 ) 만이무한한 + 가되겠지요. 출처 : 신민철저 경영경제통계학의기초, 창민출판사, 2010 년, 일부수정
위의내용은파스칼이신의존재를증명하기위한목적으로기술한것은아니었지만, 그가로마카톨릭이외의다른종교의가능성을고려하지않았다든지, 신자에게우호적인 (benevolent) 신뿐만아니라비우호적 (malevolent) 인신의가능성을고려하지않았다는등여러가지반론을불러일으키기도했습니다. 물론근래에도도킨스같은진화생물학자는그의저서 ' 만들어진신 ' 에서 ' 반파스칼내기 (anti-pascal wager)' 를제시하기도했지요. [www.wikipedia.org; 도킨스 (2007)] 생각해볼문제 1 독자여러분은신이존재할확률이얼마나된다고생각하시나요? 2 독자들이생각하는신의존재확률은주관적인가요객관적인가요? 3 신의존재확률, 동전던지기때의앞이나올확률, 주사위던지기때의특정수 (1,2,3,4,5,6) 가나올확률혹은복권당첨확률및비가올확률등에서의경우와같이, 일상적으로자주사용하는용어이기도한확률이란과연어떠한의미를가지고있을 까요? 4 확률을이해하는것이어떻게 ( 우연히발생하는 / 불확실한 ) 현상에대한이해를높이 고의사결정에도움을줄수있을까요?
제 1 절확률과통계학 확률과통계학의관계? 확률이론은기술통계분석과추리통계분석을연결하는역할수행 [ 그림 7-1] 추리통계의오류가능성 ( 표본오차 ) 과확률간의관계 오류가능성 ( 표본오차 ) 추정 확률분포 확률변수 확률이론 cf. 확률이론 vs. 통계학 : 논리적추론의기초가상이 ( 연역적추론에주로기초 <-> 귀납적추론에주로의존 ) ( 경험적자료 (data) 로이론적모형 (model) 을예측 <-> 이론 (model) 에서경험적결과를설명 )
제 1 절확률과통계학 우연 (chance 혹은 randomness) 정의상 법칙 (law) 의부재 를의미 ( 미래 ) 현상의불확실성을확률로표현가능 확률이론을통해개별적으로는우연히발생하는사건 (random event) 이라도발생가능성 (= 확률 ) 을집합적 / 총량적으로예측가능 ( 집합적 / 총량적으로는규칙적으로발생함을학자들이밝힘 ) 예 ) 동전던지기를시행할때동전의앞면이나올확률? 불확실한환경에서의사결정에도움 과학자는 ' 우연이라는무질서 ' 에서 ' 과학적설명이라는질서 ' 를찾아내는 일을수행
제 2 절확률이론 1. 확률의정의 확률 (probability) 어떤사건 / 사상 (event) 이발생할가능성 사건 / 사상 (event) 발생가능한특정상황 (1) 빈도를이용한접근 (frequency approach) 객관적확률 => 사전적확률, 사후적확률 2 종류가있음 ( 상호배타적이기보다보완적 )
제 2 절확률이론 (1-1) 사전적확률 (a priori probability) 고전적확률 (the classical definition) 논리적추론에의한확률 ( 구성 ) 개념적인정의 (constituitive definition) -> 각사건의발생가능성은동등하다고하는기본가정에의지하는확률개념 -> 수리확률이론의근거가되는정의임 -> 확률에대한개념적정의 * 개념 : 경험적현상을대변하는추상적표현 * 구성개념 (construct): 관찰 / 측정이가능하도록정의된개념 -> 조작적정의와관련깊음 예 ) 동전의앞면이나올확률 (=1/2); 주사위의하나의수가나올확률 (=1/6) 사건 Ε 가발생할확률 P (E ) = 사건 Ε 의경우의수 / 전체경우의수 ( 식 7-1)
제 2 절확률이론 (1-2) 사후적확률 (posteriori probability) : 실제실험회수대비특정사건의발생비율 = 장기적상대빈도확률 (relative long-run frequency definition) = 경험에근거한확률 = 조작적정의 (operational definition of probability) -> 확률에대한경험적정의 -> 사회과학분야에서가장널리사용됨예 ) 생명보험료결정시특정연령대의생존가능성 ( 즉, 확률 ) -> 경영현상의경우사전적확률계산이어려운경우가다수발생사건 Ε 가발생할확률 P (E ) ( 식 7-2) = 사건 Ε 의실제발생회수 / 총실험 ( 시행 ) 회수 (2) 빈도를이용하지않은접근 (non-frequency approach) 주관적확률과관계깊음 ( 확률과확률에대응하는가중치를동시에고려 ) => 통계학분야에서일반적으로사용되는것은아님, ( 역설을설명해주기도함 )
제 2 절확률이론 2. 확률의기본적연산법칙 0 P (Ε ) 1 ( 공리 7-1) 단, P (Ε ) = 사건 Ε 의발생확률 P (Ε ) = 1- P (Ε ) ( 공리 7-2) 단, P (Ε )= 사건 Ε 가발생하지않을확률
제 2 절확률이론 확률의덧셈법칙 (addition rule) P (X Y ) = P (X ) + P (Y ) P (X Y ) ( 식 7-3) 단, P (X ) = 사건 X 가발생할확률 P (Y ) = 사건 Y 가발생할확률 [ 예제 7-1] P ( 경영학원론 경제학원론 ) = P ( 경영학원론 ) + P ( 경제학원론 ) - P ( 경영학원론 경제학원론 ) = 30/80+30/80-15/80 = 45/80 = 9/16
제2절확률이론 P (X Y) = P (X ) + P (Y ) ( 식 7-4) 단, P (X Y ) = 0 [ 사건 X 와 Y 가상호독립적으로발생하는경우 ] [ 예제 7-2] P ( 경영학원론 경제학원론 ) = P ( 경영학원론 ) + P ( 경제학원론 ) = 30/80 + 30/80 = 60/80 = 3/4 where P ( 경영학원론 경제학원론 ) = 0 * 한번의실험혹은시도를할경우의사건의발생가능성 vs. 두단계이상의실험혹은시도를거쳐서확률을계산해야하는경우 조건부확률 (conditional probability) = 사건 Y 의발생시에사건 X 가발생할가능성 = P (XlY ) = P (X Y )/P (Y ) ( 식 7-5) [ 예제 7-3] P ( 경영학원론 l 경제학원론 ) = P ( 경영학원론 경제학원론 ) / P ( 경제학원론 ) = (15/80)/(30/80) =1/2
제2절확률이론 확률의곱셈법칙 (multiplication rule) P (X Y ) = P (XlY ) P (Y ) ( 식 7-6) = P (XlY ) P (X ) [ 예제 7-4] P ( 경영학원론 경제학원론 ) = P ( 경영학원론l경제학원론 ) * P ( 경제학원론 ) = (1/2)(30/80) = 15/80 =3/16 P (X Y ) = P (X ) P (Y ) ( 식 7-7) 단, 사건 X 와 Y 가독립 [ 예제 7-5] P (A 동전앞면 B 동전앞면 ) = P (A 동전앞면 ) * P (B 동전앞면 ) = (1/2) (1/2) = 1/4
3. 순열과조합 제 2 절확률이론 특정사건의확률을구하는문제 결국가능한전체경우의수를구하는순열 / 조합의계산에귀착되는경우가다수 확률, 통계학의이해를위해순열, 조합개념이해필요 순열 (permutation) 서로다른 n개에서 k개를선택하여순서를고려하여 k개를나열할수있는경우의수 np k = n! / (n k )! ( 식 7-8) 예 ) 1,2,3 3개의정수중 2개를뽑아만들수있는 2자리정수의개수 [ 예제 7-6] 3P 2 = 3!/(3-2)! =3! =(3*2*1)/1=6
제 2 절확률이론 조합 (combination) 서로다른 n 개에서순서를고려하지않고 k 개를선택하는경우의수 nc k = n! / (n k )! k! ( 식 7-9) 예 ) A, B, C 3 개의요소로구성된모집단에서크기 2 의표본을뽑을수있는경우의 수 [ 예제 7-7] 3C 2 = 3!/(3-2)!2! = 3*2*1/(1)*(2*1)=3
확률변수 (random variable) 음 ) 제 3 절확률변수 * 변수 (variable): 값이부여되는대상 / 기호 ( 부여되는값이확실한경우도있고불확실한경우도있 부여되는값이불확실한변수 ( 미래에 ) 부여되는값이확률적으로결정되는대상 일정한발생확률을가지는사건에값을부여한것 ( 미래의 ) 값이확실하지않고우연 (chance) 의영향을받는변수예1) 주식투자의수익률, 수익률의변화폭예2) 표본통계량예3) 동전던지기에서앞면혹은뒷면이나타나는회수 표본공간 (sample space) 발생가능한모든사건 (event) 의집합 예 ) 2 회동전던지기의표본공간 (=S) S={HH, HT, TH, TT} ( 식 7-10)
제 3 절확률변수 표본공간과확률 확률이란표본공간내에서의특정사건의발생가능성예 ) 동전던지기 2회시행시앞면이나타날회수를확률변수 X 라하고, 이확률변수 (=X ) 값 ( =0, 1, 2) 에대응하는확률 [=P (X )] 은각각다음과같이표현가능 : P (X=0) = 1/4 P (X=1) =2/4=1/2 P (X=2) =1/4 표본공간과함수개념을이용한확률변수의정의 (definition) 정의역이표본공간이고치역이실수값인함수
제 3 절확률변수 < 표 7-1> 3 회동전던지기와 3 개의확률변수 동전던지기결과 * 해당확률 X Y Z HHH 1/8 3 9 10,000 HHT HTH 1/8 1/8 2 2 4 4 10,000 10,000 HTT THH 1/8 1/8 1 2 1 4 10,000 10,000 THT 1/8 1 1 10,000 TTH 1/8 1 1 10,000 TTT 1/8 0 0-50,000 * 단, H= head( 앞면 ), T= tail( 뒷면 ) 출처 : 신민철저 경영경제통계학의기초, 창민출판사, 2010 년. 일부수정