고등학교 수학 요약노트 확률과 통계 Sooji Shin soojishin@live.com 이 노트에서는 고등학교에서 배우는 수학의 내용 중 확률과 통 계에 관련된 개념과 공식을 정리하고 그에 따른 예제와 풀이를 소개합니다. 필요한 경우 중학교 과정의 내용도 포함하고 있습 니다. 이 노트에서 포함하고 있는 내용은 다음과 같습니다. 경우의 수 대푯값과 산포도 확률의 뜻과 성질 이산확률분포와 연속확률분포 이항분포와 정규분포 통계적 추정 이 노트가 수학을 공부하는 분들께 도움이 되기를 바랍니다. 1 순열과 조합 같은 조건에서 여러 번 반복할 수 있고, 그 결과가 우연에 의하 여 결정되는 실험이나 관찰을 시행이라고 부른다. 또한 어떤 시 행에서 얻어지는 결과를 사건이라고 부른다. (통계학적으로는 어 떤 시행에서 일어날 수 있는 모든 경우의 집합을 라고 할 때, 의 부분집합을 사건이라고 부른다.) 그리고 어떤 사건이 일어 날 수 있는 가짓수를 경우의 수라고 부른다. 경우의 수의 합의 법칙 한 번의 시행에서 두 사건, 가 동시에 일어나지 않고 사건, 가 일어나는 경우의 수가 각각, 이면, 한 번의 시행에서 사건 또는 사건 가 일어날 경우의 수는 이다. 참고 사건 라고 할 때에 는 사건 자체를 의미하기도 하 고 동시에 사건의 집합을 의미하기도 한다. 예제 1. 서로 다른 두 개의 주사위를 던질 때, 나오는 눈의 수 의 합이 또는 가 되는 경우의 수를 구하여라. 풀이 두 개의 주사위를 던지므로 두 번의 시행처럼 보이지만, 그 합을 구하는 것이므로 결국 두 번 던지는 것을 묶어 한 번의 시행으로 보아야 한다. 눈의 수의 합이 이 되는 경우와 가 되는 경우는 동시에 존재 할 수 없으므로 합의 법칙을 이용한다. 합이 이 되는 경우는 가지, 합이 가 되는 경우는 가지이므로 구하는 경우의 수는 이다. 참고 두 사건, 가 동시에 일어나는 경우가 있는 경우 사 건의 집합을,, 으로 나눈다. 그러면 또는 가 일어날 경우의 수는 또는 또는 가 일어날 경우의 수가 된다. 예제 2. 학생 수가 명인 어느 학급에서 한 명의 학생에게 수 학 문제를 풀게 하려고 한다. 번부터 번까지의 학생들 중에 서 문제를 푸는 학생의 번호가 의 배수 또는 의 배수인 경우 의 수를 구하여라. 풀이 의 배수인 학생의 경우를, 의 배수인 학생의 경우를 라고 하자. 그러면 와 는 동시에 일어날 수도 있으므로 합의 법칙을 그냥 사용할 수가 없다. 이때 라고 하고 [즉, 는 의 배수이면서 의 배수인 사건이다.], 라고 하자. 그러면 은 의 배수이면서 의 배수가 아닌 경우이므로 이 일어날 경우의 수는 이다. 같은 방법으로 이 일 어날 경우의 수는 이다. 또한 가 일어날 경우의 수는 이다. 따라서 구하는 경우의 수는 이다. 예제 3. 음이 아닌 정수, 에 대하여 을 만족시키 는 순서쌍 의 개수를 구하여라. 해설 라고 하고,,,,, 인 각 경우에 대하여 경우의 수를 구한 뒤 더한다. 경우의 수의 곱의 법칙 사건 가 일어나는 경우의 수가 이고, 그 각각에 대하여 사건 가 일어나는 경우의 수가 일 때, 두 번의 시행에서 두 사건, 가 연속으로 이어서 일어나는 경우의 수는 이다. 예제 4. 다음 수의 양의 약수의 개수를 구하여라. (1) (2) 풀이 (1) 이다. 따라서 의 약수는 의 꼴이고 과 은 각각, 인 정수이다. 이때 을 택할 수 있는 경우의 수는, 을 택할 수 있는 경 우의 수는 이므로, 과 을 동시에 택할 수 있는 경우의 수 는 이다. 따라서 약수의 개수는 개다. (2) 이므로 약수의 개수는. 예제 5. 식 를 전개하였을 때, 항의 개수를 구하여라. 풀이. 부터 까지의 자연수를 차례로 곱한 것을 의 계승 또는 차 례곱이라고 부르며 로 표기하고 팩토리얼 이라고 읽는다. 예컨대 이다. 특히 로 정의한다. 1
순열의 계산 서로 다른 개의 물건 중 개를 택하여 일렬로 나열하는 순 열의 수는 P 개 조합의 계산 서로 다른 개의 물건 중 순서를 생각하지 않고 개를 택하 는 조합의 수는 개 C P 참고 순열의 정의에 의하여 P, P 이 성립한다. 예제 6. 다섯 개의 숫자,,,, 에서 서로 다른 세 개의 숫자를 사용하여 만들 수 있는 세 자리의 자연수의 개수를 구하 여라. 풀이 개 중 개를 택하여 일렬로 나열하는 순열이므로, 구하 는 자연수의 개수는 P 개다. 예제 7. 할아버지, 할머니, 아버지, 어머니, 두 딸로 구성된 명의 가족이 박물관에 입장하려고 한다. 한 줄로 입장한다고 할 때, 다음에 답하여라. (1) 두 딸이 연이어 입장하지 않는 방법의 수를 구하여라. (2) 맨 앞과 맨 뒤에 여자가 입장하는 방법의 수를 구하여라. 풀이 고려해야 할 조건이 여러 가지인 경우 경우의 수를 계산 하기 쉽도록 조건의 고려 순서를 정한다. (1) 두 딸이 연이어 입장하지 않으려면 다른 사람들을 먼저 세 우고 양 끝 및 사이사이 중 2자리를 택하여 딸 둘을 세우면 된 다. 딸 둘을 제외한 나머지 식구 4명을 일렬로 세우는 방법의 수는, 딸 둘을 일렬로 세우는 방법의 수는 P 이다. 따라서 구하는 방법의 수는 P 이다. (2) 맨 앞과 맨 뒤에 여자를 세우는 방법은 여자 4명 중 2명을 뽑아 일렬로 세우는 방법이므로 P, 가운데 네 자리에 나머지 4명을 일렬로 세우는 방법의 수는 이다. 따라서 구하는 방법 의 수는 P 이다. 참고 순열은 택할 때 순서가 다르면 서로 다른 것이라고 생각 하지만, 조합은 택할 때 순서가 중요하지 않다. 예제 9. 다음을 구하여라. (1) 명의 학생 중에서 임원 명을 뽑는 방법의 수 (2) 명의 배구 선수 중에서 명을 뽑아 선발 선수로 출전시 킬 때, 특정한 두 선수를 포함하여 뽑는 방법의 수 풀이 (1) 명 중 순서를 고려하지 않고 명을 뽑으므로 C. (2) 두 선수가 이미 정해졌으므로 명 중 명을 뽑는 방법의 수는 C. 예제 10. 주머니 속에 크기가 서로 다른 개의 빨간 공과 개 의 노란 공이 들어 있다. 다음을 구하여라. (1) 주머니에서 개의 공을 뽑는 경우의 수 (2) 주머니에서 빨간 공 개와 노란 공 개를 뽑는 경우의 수 풀이 (1) 서로 다른 개의 공 중 개의 공을 뽑으므로 C. (2) 개의 빨간 공에서 개의 공을 뽑는 경우의 수는 C 이고 개의 노란 공에서 개의 공을 뽑는 경우의 수는 C 이므로 구하는 경우의 수는 C C. 예제 8. 다음 등식이 성립함을 증명하여라. (1) P P (단, ) (2) P P P (단, ) 풀이 순열의 정의를 이용한다. P P P P P. 예제 11. 다음 등식이 성립함을 증명하여라. (1) C C C (단, ) (2) C C (단, ) 풀이 (1) C C C. (2) C C. 2
참고 조합이 도형에 응용되는 예 임의의 세 점이 일직선 위에 있지 않은 서로 다른 개의 점에서 두 점을 이어 만든 직선의 개수 : C 임의의 세 점이 일직선 위에 있지 않은 서로 다른 개의 점에서 세 점을 이어 만든 삼각형의 개수 : C 개의 평행선과 개의 평행선이 만날 때 생기는 평행사변 형의 개수 : C C 참고 이 외에 자주 사용되는 순열에는 다음과 같은 것들이 있다. (1) 서로 다른 개를 원형으로 배열하는 원순열 : (2) 서로 다른 개에서 개를 택하는 중복순열 : (3) 개에서 서로 같은 것이 각각,,, 개씩 있을 때, 이들을 모두 택하여 일렬로 나열하는 순열 : (단, ) 보기 12. 개의 문자,,,,,, 를 일렬로 나열하는 경우의 수는 이다. 예제 13. 오른쪽 그림에서 점 A 에서 출발하여 선을 따라 점 B에 이르는 최단경로의 수를 구하여라. 풀이 A에서 출발하여 B에 이르는 B 최단경로는 8번을 이동하되 5번은 오른쪽으로, 3번은 아래로 이 동하는 것이다. 8번의 이동 중 아래로 이동하는 3번을 뽑는 경우의 수와 같다. 따라서 구하는 경우의 수는 C 이다. 참고로, 8번의 이동 중 아래로 이동하는 5번을 뽑는 경우 의 수와 같다고 생각하여 C 로 계산하여도 된다. A 중복조합의 계산 서로 다른 개에서 개를 택하는 중복조합의 수 예제 14. 다음을 구하여라. H C (1) 10명의 학생 중에서 회장 1명, 부회장 1명을 택하는 경우의 수 (2) 12명의 수영 선수 중에서 시합에 나갈 3명의 선수를 선발하 는 경우의 수 (3) 4개의 문자,,, 에서 중복을 허락하여 7개의 문자를 택하는 경우의 수 (4) 1부터 8까지의 자연수 중에서 중복을 허락하여 5개의 숫자 를 택하는 경우의 수 풀이 (1) P. (2) C. (3) 서로 다른 4개에서 7개를 택하는 중복조합의 수이므로 C C C. (4) 서로 다른 8개에서 5개를 택하는 중복조합의 수이므로 C C. 예제 15. 방정식 에 대하여 다음을 구하여라. (1) 음이 아닌 정수해 의 개수 (2) 양의 정수해 의 개수 풀이 (1) 음이 아닌 정수해의 개수는,, 의 3개의 문자에 서 9개를 택하는 중복조합의 수와 같으므로 C C C. (2),, 로 치환하면 이므로 이다. 이 방정식의 음이 아닌 정수해 의 개수를 구하면 C C C. 참고 위와 같은 문제에서 가로 칸, 세로 칸일 때, 최단거 리로 이동하는 경우의 수는 이다. 조합의 성질 와 이 이상인 정수일 때 다음이 성립한다. (1) C, C (2) C C (단, ) (3) C C C (단, ) 서로 다른 개에서 중복을 허락하여 개를 택하는 조합을 중복 조합이라고 부르며 예제 16. 두 집합, 에 대하 여, 일 때, 다음을 구하여라. (1) 를 만족시키는 함수 의 개수 (2) 를 만족시키는 함수 의 개수 풀이 (1) 주어진 조건을 만족시키려면 5개의 숫자 1, 2, 3, 4, 5 중에서 3개를 택한 후 작은 수부터 차례로 정의역의 원소 1, 2, 3에 대응시키면 된다. 즉 함수 의 개수는 공역의 원소 5개 중에서 3개를 택하는 조 합의 수와 같으므로 C. (2) 주어진 조건을 만족시키려면 5개의 숫자 1, 2, 3, 4, 5 중에 서 중복을 허락하여 3개를 택한 후 작은 수부터 차례로 정의역 의 원소 1, 2, 3에 대응시키면 된다. 로 나타낸다. H 즉 함수 의 개수는 공역의 원소 5개 중에서 3개를 택하는 중 복조합의 수와 같으므로 C C. 3
예제 17. 을 전개할 때 생기는 서로 다른 항의 개 수를 구하여라. 풀이 주어진 식은 이므로 을 전개할 때 생기는 서로 다른 항은,,,,,, 등으로 모두 4차항이다. 따라서 구하는 항의 개수는 3개의 문자,, 중 4개를 택하는 중복조합의 수와 같으므로 H C C C. 주어진 집합을 공집합이 아닌 몇 개의 서로소인 부분집합으로 나누는 것을 집합의 분할이라고 부른다. 또한 원소의 개수가 인 집합을 개의 집합으로 분할하는 방법의 수를 기호로 로 나타낸다. 예제 18. 의 값을 구하여라. 풀이 원소의 개수가 1, 3인 두 개의 집합으로 분할하는 경우, 4개의 원소 중 1개를 택하여 하나의 집합을 만들고, 남은 3개의 원소 중 3개를 택하여 다른 한 집합을 만들면 되므로 그 경우의 수는 다음과 같다. C C 원소의 개수가 2, 2인 두 개의 집합으로 분할하는 경우, 4개의 원소 중 2개를 택하여 하나의 집합을 만들고 남은 2개의 원소 중 2개를 택하여 다른 한 집합을 만든다. 그런데 두 집합의 원 소의 개수가 같은 경우에는 중복되는 경우가 개씩 나타나므로 그 경우의 수는 다음과 같다. C C 따라서 이다. 자연수 을 다음과 같이 나타내는 것을 자연수의 분할이라고 부른다. (단, ) 한편 자연수 을 개의 자연수의 합으로 나타내는 방법의 수를 기호로 다음과 같이 나타낸다. 예제 20. 의 값을 구하여라. 풀이 자연수 을 개의 자연수의 합으로 나타내면 이므로 이다. 예제 21. 같은 종류의 사탕 개를 같은 종류의 봉지 개에 빈 봉지가 없도록 넣는 방법의 수를 구하여라. 풀이 이므로 이다. 따라서 같은 종류의 사탕 개를 같은 종류의 봉지 개에 빈 봉지가 없도록 넣는 방법의 수는 이다. 다른 풀이 빈 봉지가 없도록 넣어야 하므로 모든 봉지에 사탕 을 하나씩 넣는다. 이때 구하는 방법의 수는 남은 개의 사탕을 개의 봉지에 분할하여 넣는 방법의 수와 같다. 에서 에서 따라수 구하는 방법의 수는. 이항정리 이고 이 자연수일 때 C 예제 19. 서로 다른 종류의 꽃 5송이를 두 묶음으로 나누는 방 법의 수를 구하여라. 풀이 5송이에서 1송이를 택하고, 남은 4송이에서 4송이를 택하 여 두 묶음으로 나누는 방법의 수는 C C. 5송이에서 2송이를 택하고, 남은 3송이에서 3송이를 택하여 두 묶음으로 나누는 방법의 수는 C C. 따라서 구하는 방법의 수는. 참고 일반적으로 원소의 개수가 인 집합을 서로소인 개의 집합으로 분할하는 방법의 수 는 개의 원소를 서로소인 개의 집합으로 나누고 특별한 원소를 하나의 집합으로 만드는 방법의 수가 이고, 특정한 한 개의 원소를 제외한 개의 원소를 서로소인 개의 집합으 로 나눈 후 특정한 원소를 포함시키는 방법의 수가 이므로 다음을 얻는다. 예제 22. 다음을 구하여라. (1) 의 전개식에서 상수항과 의 계수 (2) 의 전개식에서 의 계수 풀이 (1) 의 전개식의 일반항은 C C. 상수항은 일 때이므로. 따라서 상수항은 C. 이차항은 일 때이므로. 따라서 이차항의 계수는 C. (2) 의 전개식의 일반항은 C C 이다. 항은 일 때이므로. 따라서 의 계 수는 C. 4
이항계수의 성질 (1) C C C C (2) C C C C (3) C C C C C C (4) C C C C 예제 23. 다음 값을 구하여라. (1) C C C C C C (2) C C C C 풀이 (1) (2) 예제 25. 다음 자료에서 분산을 구하여라. (1) 1, 3, 5, 7, 9 (2) 101, 103, 105, 107, 109 풀이 (1) 평균이 임은 한눈에 알 수 있다. 분산은 이다. (2) 자료가 흩어진 정도가 (1)과 같으므로 분산은 이다. 도수분포표에서의 평균과 분산 계급값,,, 의 도수가 순서대로,,, 이 고 도수의 총 합이 일 때 1 2 대푯값과 산포도 수로 나타난 자료가 있을 때, 자료 전체의 중심적인 경향이나 특성을 하나의 수로 나타내어 자료 전체를 대표하는 값을 대푯 값이라고 부른다. [대푯값으로는 평균, 중앙값, 최빈값 등이 있 다.] 또한 자료 전체가 대푯값을 중심으로 흩어져 있는 정도를 산포도라고 부른다. [산포도에는 평균편차, 표준편차 등이 있 다.] 평균, 분산, 표준편차 개의 자료,,,, 에 대하여 1 평균 : 2 분산 : 3 표준편차 : 참고 평균과 표준편차는 자료(변량)의 단위와 동일한 단위를 사용한다. 그러나 분산은 제곱을 하였기 때문에 단위를 사용하 지 않는다. 예제 24. 다음 자료는 달걀 10개의 무게를 재서 얻은 것이다. 달걀 무게의 평균, 분산, 표준편차를 구하여라. (단위 g) 59 61 48 59 58 60 53 65 60 57 풀이 정의를 이용하여 계산하면 다음과 같다. (평균) (g) (분산) (표준편차) 분산 (g) 참고 변량,,,, 의 평균이 일 때, 분산 는 다음과 같은 공식으로도 구할 수 있다. 2 예제 26. 다음은 어느 고등학교 1학년 학생 50명의 키를 조사 한 도수분포표이다. 계급(cm) 도수(명) 계급(cm) 도수(명) 이상 미만 이상 미만 155 ~ 160 2 170 ~ 175 21 160 ~ 165 4 175 ~ 180 8 165 ~ 170 13 180 ~ 185 2 합 계 50 이 학생들의 키의 평균, 분산, 표준편차를 구하여라. 풀이 표를 만들면 다음과 같다. 계급값 도수 (계급값) (도수) {(계급값)-(평균)} 2 (도수) 157.5 2 315 364.5 162.5 4 650 289 167.5 13 2177.5 159.25 172.5 21 3622.5 47.25 177.5 8 1420 338 182.5 2 365 264.5 합계 50 8550 1462.5 따라서 평균, 분산, 표준편차는 다음과 같다. (평균) (cm) (분산) (표준편차) (cm) 참고 대푯값에는 다음과 같은 것들도 있다. (1) 중앙값 : 변량을 작은 것부터 큰 것 순으로 나열했을 때 중 앙에 위치하는 값. 단 변량의 개수가 짝수인 경우에는 중앙 에 있는 두 값의 중간값을 구한다. (2) 최빈값 : 변량 중에서 가장 많이 등장하는 값. 예를 들어 자료 1, 2, 2, 2, 3, 4, 4, 5에 대하여 중앙값은 2와 3의 중간값인 2.5이고, 최빈값은 2이다. 5
참고 산포도에는 다음과 같은 것도 있다. (평균편차) 평균편차는 절댓값 때문에 수리적 전개가 어려워 실제로 많이 사용되지 않는다. 3 확률의 뜻과 기본 성질 같은 조건에서 여러 번 반복할 수 있고, 그 결과가 우연에 의하 여 결정되는 실험이나 관찰을 시행이라고 부른다. 어떤 시행에서 일어날 수 있는 모든 가능한 결과의 집합을 표본 공간이라고 부른다. 어떤 시행에서 얻어지는 결과를 사건이라고 부른다. 즉 사건이란 표본공간의 부분집합이다. 표본공간의 부분집합 중에서 한 개의 원소로 이루어진 사건을 근원사건이라고 부른다. 반드시 일어나는 사건을 전사건이라고 부른다. 즉 전사건이란 표본공간 자신의 집합이다. 절대로 일어 나지 않는 사건을 공사건이라고 부른다. 공사건을 으로 나타 낸다. 예제 27. 서로 다른 두 개의 동전을 던지는 시행에서 동전의 앞면을 H, 뒷면을 T로 나타내고, 시행의 결과를 (H, T)와 같이 순서쌍으로 나타내기로 할 때 다음을 구하여라. (1) 표본공간 (2) 서로 다른 면이 나오는 사건 (3) 모두 앞면이 나오는 사건 (4) 뒷면이 적어도 한 번 나오는 사건 풀이 (1) H H H T T H T T (2) H T T H (3) H H (4) H T T H T T 표본공간 의 임의의 두 사건, 가 주어졌다고 하자. 또는 가 일어나는 사건을 와 의 합사건이라고 부르고 로 나타낸다. 와 가 동시에 일어나는 사건을 와 의 곱사건이라고 부 르고 로 나타낸다. 와 가 동시에 일어나지 않을 때, 즉 와 가 서로소일 때 와 를 서로 배반이라고 하고, 서로 배반인 두 사건을 배반 사건이라고 부른다. 가 일어나지 않는 사건을 의 여사건이라고 부르고 로 나 타낸다. 예제 28. 한 개의 주사위를 던지는 시행에서 홀수의 눈이 나오 는 사건을, 이상의 눈이 나오는 사건을 라 하자. 이때 다음을 구하여라. (1) 와 의 합사건 (2) 와 의 곱사건 (3) 의 여사건 (4) 와 배반사건의 개수 풀이, (1) (2) (3) (4) 와 배반사건이려면 와 서로소가 되어야 한다. 와 서로 소가 되려면 의 부분집합이면 된다. 그런데 의 원소의 개 수가 이므로 의 부분집합의 개수는 이다. 따라서 구 하는 사건의 개수는 이다. 어떤 시행에서 사건 가 일어날 가능성을 수로 나타낸 것을 가 일어날 확률이라고 부르고 P로 나타낸다. 보통 확률은 수학적 확률, 통계적 확률, 기하적 확률로 나눈다. 수학적 확률 어떤 시행에서 표본공간 가 개의 근원사건으로 이루어져 있고, 각 근원사건이 일어날 가능성이 모두 같은 정도로 기 대될 때, 사건 가 개의 근원사건으로 이루어져 있으면 사 건 가 일어날 확률은 P 이다. 예제 29. 부터 까지의 숫자가 각각 하나씩 적힌 장의 카드 를 일렬로 나열할 때, 다음을 구하여라. (1),, 이 적힌 장의 카드가 이웃할 확률 (2) 이 적인 카드와 가 적힌 카드가 양 끝에 올 확률 풀이 장의 카드를 일렬로 나열하는 경우의 수는. (1),, 이 적힌 장의 카드를 한 묶음으로 생각하여 장의 카드를 일렬로 나열하는 방법의 수는 이다. 이때,, 이 적힌 장의 카드가 이웃하도록 나열하는 방법의 수는 이다. 따라서 구하는 확률은. (2) 과 가 적힌 카드를 제외한 나머지 장의 카드를 일렬로 나열하는 방법의 수는 이다. 이때 과 가 적힌 카드가 양 끝에서 서로 자리를 바꾸는 방법의 수는 이다. 따라서 과 가 적힌 카드가 양 끝에 오는 방법의 수는 이다. 이로써 구하는 확률은. 예제 30. 하양 공 5개, 빨강 공 3개, 검정 공 2개가 들어 있는 상자에서 3개의 공을 꺼낼 때, 다음을 구하여라. (1) 꺼낸 공이 모두 하양 공일 확률 (2) 꺼낸 공이 빨강 공 2개, 검정 공 1개일 확률 (3) 꺼낸 공 중 하양 공이 2개일 확률 풀이 10개의 공 중에서 3개의 공을 꺼내는 방법의 수는 C 이다. 6
(1) 하양 공 5개 중에서 3개를 꺼내는 방법의 수는 C 이 다. 따라서 구하는 확률은. (2) 빨강 공 3개 중에서 2개, 검정 공 2개 중에서 1개를 꺼내는 방법의 수는 C C 이다. 따라서 구하는 확률은. (3) 하양 공 5개 중에서 2개, 나머지 5개의 공 중에서 1개를 꺼 내는 방법의 수는 C C 이다. 따라서 구하는 확률은. 통계적 확률 같은 시행을 번 반복하여 사건 가 일어날 횟수를 이라 하면 Plim. 이때 를 사건 의 통계적 확률이라고 부른다. 따라서 10개의 구슬 중 3개의 구슬을 꺼낼 때 모두 하양 구슬 일 확률은 C C 이다. 이 시행에서 6번에 1번 꼴로 3개 모두 하양 구슬을 꺼냈 으므로 이다. 이것을 풀면 을 얻는다. 그러므로 이 주머니 안에는 6개의 하양 구슬이 들어 있을 것으 로 기대할 수 있다. 기하학적 확률 연속적인 변량을 크기로 갖는 표본공간의 영역 안에서 각 각의 점을 잡을 가능성이 같은 정도로 기대될 때, 영역 에 포함되어 있는 영역 에 대하여 영역 에서 임의로 잡은 점 이 영역 에 속학 확률은 영역 의 크기 P 영역 의 크기 이다. 참고 실제 통계에서는 시행을 무한히 여러 번 반복할 수 없으 므로 주어진 자료의 양이 충분히 많으면 통계적 확률의 근거 자 료로 사용한다. 통계적 확률은 자료의 양이 많을수록 신뢰도가 높아진다. 예제 31. 오른쪽 표는 실험용 기간(일) 생존한 쥐의 수(마리) 쥐 100마리에게 담배 연기 농 10 80 축물을 매일 일정량씩 투여하였 11 60 을 때, 농축물을 투여한 기간에 12 48 따라 생존한 쥐의 수를 나타낸 13 36 것이다. 이때 농축물을 투여한 14 20 후 11일 동안 생존한 쥐가 앞으 15 12 로 3일 이내에 사망할 확률을 구하여라. 풀이 농축물을 투여하기 시작한 후 11일 동안 생존한 쥐는 60 예제 33. 오른쪽 그림과 같이 정사각형 ABCD가 있다. 사각형 ABCD 내부에 한 점 P를 잡을 때, 삼각형 PBC가 둔각삼각 형이 될 확률을 구하여라. 풀이 정사각형의 한 변의 길이를 라고 하자. 그러면 정사각형의 넓이는 이다. 선분 BC를 지름으로 하는 반원에서 점 P 가 BC 위에 있을 때 PBC는 직각삼각 형이므로 이 반원의 내부에 점 P를 잡으면 PBC는 둔각삼각형이 된다. 이때 오른 쪽 그림에서 색칠한 부분의 넓이는 이다. 따라서 구하는 확률은 A B A B P P D C D C 마리이고, 3일 후인 14일 동안 생존한 쥐는 20마리이므로 11일 로부터 3일 이내에 사망한 쥐는 40마리이다. 따라서 구하는 확 색칠한 부분의 넓이 ABCD의 넓이. 률은 이다. 예제 32. 주머니 안에 하양 구슬과 검정 구슬을 합하여 10개의 구슬이 들어 있다. 이 주머니에서 3개의 구슬을 동시에 꺼내어 색깔을 확인하고 다시 넣는 시행을 여러 번 반복하였더니 6번에 1번 꼴로 3개 모두 하양 구슬이었다. 이때 이 주머니 안에 들어 있는 하양 구슬의 개수는 몇 개인 것으로 기대할 수 있는지 구 하여라. 풀이 10개의 구슬 중 3개를 꺼내는 방법의 수는 C. 주머니 안의 하양 구슬의 개수를 이라 하면, 개의 구슬 중 3 개의 하양 구슬을 꺼내는 방법의 수는 다음과 같다. C 7 확률의 성질 (1) 기본성질 1 임의의 사건 에 대하여 P 2 전사건 에 대하여 P 3 공사건 에 대하여 P (2) 확률의 덧셈정리 1 두 사건, 에 대하여 또는 가 일어날 확률은 P PPP 2 특히 두 사건, 가 배반사건이면 P PP (3) 여사건의 확률 : P P.
확률의 성질의 증명, 가 표본공간을 의 두 부분집합이라 고 하자. (1) 1 이므로. 2 P 3 P. (2) 1 P PPP 2 P P 이므로 P PPP PP. (3) P P P. 예제 34. 1부터 20까지의 자연수가 각각 하나씩 적힌 20개의 구슬 중에서 한 개를 뽑을 때, 3 또는 4의 배수가 적힌 구슬이 나올 확률을 구하여라. 풀이 구슬에 적힌 수가 3의 배수인 사건을, 구슬에 적힌 수 가 4의 배수인 사건을 라 하면 P, P, P 따라서 구하는 확률은 P PPP 예제 36. 두 개의 주사위를 동시에 던질 때, 나오는 두 눈의 수의 곱이 짝수일 확률을 구하여라. 풀이 두 눈의 수의 곱이 짝수인 사건을 라고 하면 두 눈의 수의 곱이 홀수인 사건은 이고 P 이므로 구하는 확률은 P P. 적어도 ~인 사건, ~ 이상인 사건, ~ 이하인 사건, ~가 아 닌 사건 을 구할 때 여사건을 사용하면 편리하다. 예제 37. 1부터 10까지의 자연수가 각각 하나씩 적힌 10장의 카드에서 3장의 카드를 택할 때, 적어도 한 장의 카드에 적힌 수가 소수일 확률을 구하여라. 풀이 3장의 카드 모두 소수가 아닌 사건의 여사건을 이용하자. 10장의 카드 중에서 3장의 카드를 택하는 방법의 수는 C 이다. 적어도 한 장의 카드에 적힌 수가 소수인 사건을 라고 하면 3장의 카드에 적힌 수가 모두 소수가 아닌 사건은 이 다. 1부터 10까지의 자연수 중에서 소수의 개수는 2, 3, 5, 7로서 4 개이므로 소수가 아닌 자연수의 개수는 6이다. 따라서 3장의 카 드를 택할 때 3장의 카드에 적힌 수가 모두 소수가 아닐 확률은 P C C 이다. 그러므로 구하는 확률은. P P. 예제 35. 수학경시대회에 출전할 학교 대표 2명을 선발하는 시 험에 2학년 학생이 5명, 3학년 학생이 7명 참가하였다. 이때 대 표로 뽑힌 두 학생이 모두 같은 학년일 확률을 구하여라. 풀이 12명의 학생 중 2명을 대표로 뽑는 경우의 수는 C 이다. 한편 대표로 뽑힌 두 학생이 모두 2학년인 사건과 모두 3 학년인 사건은 동시에 일어날 수 없으므로 배반사건이다. 2명의 대표가 모두 2학년인 사건을 라고 하고, 모두 3학년인 사건을 라고 하면 P C C C, P C. 그런데 두 사건, 는 서로 배반사건이므로 구하는 확률은 P PP. 참고 사건 의 여사건이 일 때 와 는 서로 배반사건이 다. 왜냐하면 일 때 이기 때문이다. 그러나 역은 성립하지 않는다. 즉 두 사건, 가 서로 배반사건일지라도 는 의 여사건이 아닐 수도 있다. 8 4 사건의 독립과 종속 어떠한 사건이 일어났다는 가정 하에 또다른 사건이 일어날 확 률을 조건부 확률이라고 부른다. 예제 38. 어느 등산 동호회에서 산행지 결정을 위하여 40명의 회원을 대상으로 설악산과 지리산의 선호도를 조사하였더니 다 음과 같았다. 산 성별 설악산() 지리산( ) 합계 남() 7 17 24 여( ) 11 5 16 합계 18 22 40 40명의 회원 중 임의로 뽑은 한 명의 회원이 남자였을 때, 그 회원이 설악산을 선호하는 회원일 확률을 구하여라. 풀이 40명의 회원 중 임의로 한 명을 뽑는 사건을, 남자가 뽑히는 사건을, 설악산을 선호하는 사람이 뽑히는 사건을 라고 하자.
뽑힌 한 명의 회원이 남자였을 때 그 회원이 설악산을 선호할 확률은 이다. 따라서 P 이다. P P P. 위 문제를 통해 다음과 같은 조건부 확률 공식을 얻는다. 확률의 곱셈 정리 조건부 확률 확률이 이 아닌 사건 에 대하여, 사건 가 일어났을 때 사건 가 일어날 확률을 사건 가 일어났을 때의 사건 의 조건부 확률이라고 하고 P 로 나타낸다. P P P (단, P) 예제 39. 한 개의 주사위를 던져서 짝수의 눈이 나왔을 때, 그 것이 소수일 확률을 구하여라. 풀이 짝수의 눈이 나오는 사건을, 소수의 눈이 나오는 사건 을 라고 하면 P, P 이다. 따라서 구하는 확률은 P P P. 예제 40. 아래 표는 어느 학급 학생 50명에 대하여 어떤 영화 의 관람 여부에 따른 남녀 학생 수를 조사하여 나타낸 것이다. 학생 관람 남학생 여학생 합계 관람 12 18 20 미관람 8 12 20 합계 20 30 50 두 사건, 가 동시에 일어날 확률은 다음과 같다. 1 P P P (단, P) 2 P P P (단, P) 예제 42. 10장의 복권 중 4장의 당첨 복권이 들어 있는 상자 에서 갑, 을의 순서로 각각 1장씩 뽑을 때, 다음을 구하여라. (단, 뽑은 복권은 다시 넣지 않는다.) (1) 갑, 을이 모두 당첨 복권을 뽑을 확률 (2) 을이 당첨 복권을 뽑을 확률 풀이 갑, 을이 당첨 복권을 뽑는 사건을 각각, 라 하자. (1) 갑이 당첨 복권을 뽑을 확률은 P. 갑이 당첨 복권을 뽑았을 때 을도 당첨 복권을 뽑을 확률은 P. 따라서 구하는 확률은 P P P. (2) 갑이 당첨 복권을 뽑고 을도 당첨 복권을 뽑을 확률은 P. 갑이 당첨 복권을 뽑지 않고 을이 당첨 복권을 뽑을 확률은 P P P. 사건 와 사건 는 서로 배반사건이므로 구하는 확 률은 이 중에서 임의로 뽑은 한 명이 여학생이었을 때, 그 학생이 영 화를 관람한 학생일 확률을 구하여라. PP P. 풀이 임의로 뽑은 학생이 여학생인 사건을, 영화를 관람한 학생인 사건을 라고 하면 P, P. 따라서 구하는 확률은 P P P. 예제 41. 두 사건, 에 대하여 P, P, P 일 때, P 의 값을 구하여라. 풀이 P P P 이므로 예제 43. 주머니 A에는 흰 바둑돌 4개, 검은 바둑돌 3개가 들 어 있고, 주머니 B에는 흰 바둑돌 2개, 검은 바둑돌 4개가 들어 있다 A, B 두 주머니 중에서 한 주머니를 임의로 택하여 2개의 바둑돌을 동시에 꺼냈더니 흰 바둑돌과 검은 바둑돌이 각각 한 개씩 나왔을 때, 이 바둑돌 2개가 모두 주머니 A에서 나왔을 확 률을 구하여라. 풀이 주머니 A를 택하는 사건을, 주머니 B를 택하는 사건 을, 흰 바둑돌과 검은 바둑돌이 각각 한 개씩 나오는 사건을 라 하면 P P P C C C, P P P C C C P 이다. P PPP 이므로 다음을 얻 는다. P 이므로 PP P 이다. 따라서 구하는 확률은 P P P. 9
사건의 독립과 종속 두 사건, 에 대하여 사건 가 일어나거나 일어나지 않 는 것이 사건 가 일어날 확률에 영향을 미치지 않을 때, 즉 P P P 일 때 두 사건 와 는 서로 독립이라고 말하고, 서로 독립 인 두 사건을 독립사건이라고 부른다. 두 사건, 가 서로 독립이 아닐 때, 즉 P P 또는 P P 일 때, 두 사건 와 는 서로 종속이라고 말하고, 서로 종 속인 두 사건을 종속사건이라고 부른다. 예제 44. 두 사건, 가 서로 독립이고 P, P 일 때 다음을 구하여라. (1) P (2) P 풀이 (1) P P (2) P P 참고 두 사건이 배반사건이면 두 사건은 동시에 일어나지 않 으므로 한 사건이 일어나면 다른 사건은 일어날 수 없다. 이것 은 두 사건이 서로 일어날 확률에 영향을 미치므로 두 사건은 서로 종속임을 뜻한다. 한편 두 사건이 서로 독립이면 한 사건이 일어나는 것이 다른 사건이 일어날 확률에 영향을 주지 않으므로 두 사건은 동시에 일어날 수 있다. 이것은 두 사건이 서로 배반사건이 아님을 뜻 한다. 독립의 조건 P, P일 때, 두 사건, 가 서로 독립이기 위한 필요충분조건은 P P P. 증명, 가 서로 독립이면 P P이므로 P P P P P 이다. 역으로 P P P이면 다음이 성립한다. P P P P P P P 예제 45. 다음을 만족시키는 두 사건, 가 서로 독립인지 종속인지 조사하여라. (1) P, P, P (2) P, P, P 풀이 (1) P P P 이므로 두 사건, 는 서로 종속이다. (2) P P P 이므로 두 사건, 는 서로 독립이다. 참고 두 사건, 가 서로 독립일 때 1 와 도 서로 독립이다. 2 와 도 서로 독립이다. 3 와 도 서로 독립이다. 증명 1 P P P 임을 보이면 된다. PP P P PP 이므로 이항하여 정리하면 P PP P P P 이다. 이때 PP 이므로 다음을 얻는다. P P P 3 P P P 임을 보이면 된다. P P P, P PPP 이므로 다음을 얻는다. P P PPP PPP PPP P P P P P 예제 46. 승부차기의 성공률이 각각, 인 두 선수 A, B 가 차례로 승부차기를 할 때, 다음을 구하여라. (1) A, B 모두 승부차기에 성공할 확률 (2) A는 승부차기에 성공하고 B는 성공하지 못할 확률 (3) A, B 중 적어도 한 명이 승부차기에 성공할 확률 풀이 두 선수 A, B가 승부차기에 성공하는 사건을 각각, 라 하면 와 는 서로 독립이다. 이때 와, 와, 와 도 각각 서로 독립인 사건들이다. (1) P P P. (2) P P P. (3) P P P. 예제 47. A, B 두 사람이 번갈아가며 한 개의 주사위를 던져 서 먼저 6의 눈이 나오는 사람이 이기기로 하였다. A부터 시작 하여 승부가 날 때까지 주사위를 던진다고 할 때, A가 이길 확 률을 구하여라. 풀이 A가 1회에 이길 확률은, A가 3회에 이길 확률은 A가 5회에 이길 확률은, A가 7회에 이길 확률은, 각각의 사건은 서로 배반사건이므로 구하는 확률은. 10
독립시행의 확률 동일한 시행을 여러 번 반복할 때, 각 시행에서 일어나는 사 건이 서로 독립인 경우 이러한 시행을 독립시행이라고 부른 다. 회의 시행에서 사건 가 일어날 확률이 일 때, 회의 독립시행에서 사건 가 회 일어날 확률은 C (단, ) 예제 48. 한 개의 주사위를 4번 던져서 1의 눈이 3번 나올 확 률을 구하여라. 풀이 C. 예제 49. 한 개의 동전을 5번 던질 때, 다음을 구하여라. (1) 앞면이 3번 나올 확률 (2) 앞면이 4번 이상 나올 확률 (3) 앞면이 적어도 2번 나올 확률 풀이 (1) C. (2) 앞면이 4번 나올 확률은 C, 앞면이 5번 나올 확률은 C. 따라서 구하는 확률은. (3) 앞면이 0번 나올 확률은 C, 이산확률변수 이산확률변수 의 확률질량함수가 P 일 때 (1) 확률질량함수의 성질 1 2 3 P P (단, ) (2) 평균(기댓값) : E (3) 분산 : VE E E (4) 표준편차 : V 증명 (3) 평균을 이라고 하면 V E E 예제 50. 확률변수 의 확률분포를 표로 나타내면 아래와 같다. 합계 P 앞면이 1번 나올 확률은 C. 따라서 구하는 확률은. 5 이산확률변수와 확률분포 이때 다음에 답하여라. (1) 상수 의 값을 구하여라. (2) P 또는 의 값을 구하여라. (3) P 의 값을 구하여라. 풀이 이산확률변수의 확률분포표는 상대도수분포표와 같은 것 이라고 생각하면 쉽다. 어떤 시행의 결과에 따라 표본공간의 각 원소에 하나의 실숫값 을 대응시키고, 그 값에 확률이 각각 주어지는 변수를 확률변수 라고 한다. 확률변수 가 어떤 값 를 취할 확률을 기호로 P 로 나타낸다. 확률변수 가 취하는 값과 그 값을 취할 확률 사이의 대응 관 계를 의 확률분포라고 부른다. 확률변수 가 취할 수 있는 값이 유한개이거나 자연수와 같이 셀 수 있을 때, 를 이산확률변수라고 부른다. 이산확률변수 가 취할 수 있는 값이,,,, 일 때, 의 각 값에 가 그 값을 취할 확률,,,, 을 대응시키는 함수 P 를 이산확률변수 의 확률질량함수라고 부른다. (1) 이므로. (2) P 또는 P P. (3) P P P. 예제 51. 확률변수 의 확률질량함수가 P ( ) 일 때, 다음에 답하여라. (1) 상수 를 구하여라. (2) P 의 값을 구하여라. 풀이 (1) 이므로. (2) P P P P. 11
예제 52. 확률변수 의 확률분포가 아래 표와 같을 때, 의 기댓값을 구하여라. 합계 P 풀이 E. 이항분포 한 번의 시행에서 사건 가 일어날 확률이 로 일정할 때, 번의 독립시행에서 사건 가 일어나는 횟수를 확률변수 라 하면 의 확률질량함수는 P C 이다. (단, ) 이와 같은 확률분포를 이항분포라고 부 르고 기호로 B 로 나타낸다. 이때 평균, 분산, 표준편차는 다음과 같다. 평균, 분산, 표준편차의 성질, 가 상수일 때 1 평균 : E E 2 분산 : V V 3 표준편차 : 증명 확률변수 의 평균을 이라고 하고 라고 하 자. 1 E E 2 V V 1 평균 : E 2 분산 : V 3 표준편차 : 증명 1 E C C C C C C 2 VE E C 3 V V. C 예제 53. 확률변수 의 확률분포를 표로 나타내면 아래와 같다. 합계 P 이때 다음을 구하여라. (1) E (2) V (3) 풀이 E VE E, V. (1) E E. (2) V V. (3). C C C C 다른 방법의 증명 1 이항정리에서 양변을 에 대하여 미분하면 양변에 를 곱하면 양변에 를 대입하면 C C C C 여기서 우변은 E와 같고, 이므로 E. 4 12
2 위 4의 양변을 에 대하여 미분하면 C 양변에 를 곱하면 C 를 대입하면 E C 6 연속확률변수와 확률분포 강수량, 시험 점수, 신생아의 체중 등과 같은 자연 현상이나 사 회 현상을 관찰하여 얻은 자료의 상대도수를 계급의 크기를 작 게 하여 히스토그램으로 나타내면 자료의 개수가 커질수록 오른 쪽 그림과 같이 어떤 값을 중심으로 대칭적으로 분포하며 중심 에서 멀어질수록 도수가 작아지는 종 모양의 곡선에 가까워진 다. 그런데 VE E 이므로 V. 예제 54. 확률변수 가 이항분포 B 을 따를 때 다음을 구하여라. (1) P (2) P 풀이 (1) P C. (2) P C. 예제 55. 발아율이 90%인 씨앗을 100개 심었을 때, 발아되는 씨앗의 개수를 확률변수 라고 하자. 이때 의 평균과 분산을 구하여라. 풀이 는 이항분포 B 를 따른다. 따라서 E, V. 이러한 분포를 정규분포라고 부른다. 정규분포의 개념을 알기 위하여 먼저 연속확률변수에 대하여 살펴보자. 확률변수 가 어떤 구간에 속하는 모든 실숫값을 취할 때, 를 연속확률변수라고 부른다. 구간 에서 정의된 연속확률변수 에 대하여 세 조건 1 2 3 P (단, ) 를 모두 만족시키는 연속함수 를 의 확률밀도함수라고 부른다. ( ) 참고 연속확률변수의 확률밀도함수의 정의는 이산확률변수의 확률밀도함수의 정의에서 합기호(시그마)를 적분으로 바꾼 것이 라고 생각하면 된다. 예제 56. 치료율이 60%인 약을 명의 환자에게 투여하였을 때 치료된 환자의 수를 확률변수 라 하면 E이라고 한다. 다음에 답하여라. 의 값과 V의 값을 구하여라. 풀이 는 이항분포 B 을 따른다. 이때 E이 므로 즉 이다. 또한 V 이다. 큰 수의 법칙 어떤 시행에서 사건 가 일어날 확률이 일 때, 번의 독립 시행에서 사건 가 일어나는 횟수를 라 하면 임의의 양수 에 대하여 이다. lim P 예제 57. 연속확률변수 의 확률밀도함수가 ( ) 일 때, P 의 값을 구하여라. 풀이 P. 예제 58. 연속확률변수 의 확률밀도함수가 ( ) 일 때 다음에 답하여라. (1) 상수 의 값을 구하여라. (2) P 의 값을 구하여라. 풀이 (1) 확률밀도함수의 정의에 따라 의 값이 이 되어야 하므로 이다. 참고 큰 수의 법칙에 의하면 시행 횟수가 충분히 클 때 통계 적 확률은 수학적 확률에 가까워짐을 알 수 있다. 따라서 수학 적 확률을 구하기 어려운 경우에 시행 횟수가 충분히 크면 통계 적 확률을 대신 사용할 수 있다. (2) 이므로 P. 13
연속확률변수의 평균, 분산, 표준편차 구간 에서 정의된 연속확률변수 의 확률밀도함수가 일 때 평균, 분산, 표준편차는 다음과 같다. 1 평균 : E 2 분산 : VE 연속확률변수 의 확률밀도함수 가 일 때, 의 확률분포를 정규분포라고 부르고, 의 그래프를 정규분포곡선이라고 부른다. (, 는 상수이고.) E E 3 표준편차 : V 증명 2 위와 같이 정의된 정규분포의 평균은 이고 표준편차는 이다. 이러한 정규분포를 N 으로 나타낸다. 참고 정규분포의 확률은 다음과 같이 구한다. P E E 예제 59. 연속확률변수 의 확률밀도함수가 ( ) 일 때, 의 평균, 분산, 표준편차를 구하여라. 풀이 E. V E. 정규분포곡선의 성질 정규분포 N 을 따르는 확률변수 의 정규분포곡선 에는 다음과 같은 성질이 있다. 1직선 에 대하여 대칭인 종 모양이고, 축이 점근 선이다. 2곡선과 축 사이의 넓이는 이다. 3 의 값이 일정할 때, 의 값이 클수록 곡선의 가운데 부분이 낮아지고 옆으로 퍼진 모양이 된다. 4 의 값이 일정할 때, 의 값이 변하면 대칭축의 위치는 바뀌지만 곡선의 모양은 변하지 않는다. V. 평균, 분산, 표준편차의 성질, 가 상수일 때 1 평균 : E E 2 분산 : V V 3 표준편차 : 정규분포를 정의하기 위해서는 오일러 상수를 사용한다. 극한 lim 은 무리수 에 수렴한다. 이 값을 오일러 상수라고 부르고 로 나타낸다. 즉 우리가 실제로 살고 있는 세상에서 일어나는 일들은 정규분포를 따르는 경우가 많다. 그러나 정규분포의 정의가 상당히 복잡하 여서 확률을 구하기가 어렵다. 따라서 정규분포를 평균이 0이고 표준편차가 1인 표준정규분포로 변환하여 사용한다. 평균이, 표준편차가 인 정규분포 N 을 표준정규분포라 고 부른다. 확률변수 가 표준정규분포를 따를 때, 의 확률밀 도함수는 다음과 같다. 이다. [오일러 상수를 네이피어 상수라고 부르기도 한다.] [참고 로 오일러 상수 중에서는 로 나타내는 값도 있는데, 이것은 고 등학교 범위에서 벗어나므로 여기서 다루지 않는다.] 14
일반적인 정규분포를 표준정규분포로 바꾸는 방법은 다음과 같다. 정규분포의 표준화 가 정규분포 N 을 따를 때, 확률변수 은 표준정규분포 N 을 따른다. 이와 같이 정규분포 N 을 따르는 확률변수 를 표 준정규분포 N 을 따르는 확률변수 로 바꾸는 것을 표준화한다고 말한다. 이때 다음이 성립한다. P P P P P P P 예제 62. 어느 과수원에서 수확한 포도 한 송이의 무게는 평균 이 g이고 표준편차가 g인 정규분포를 따른다고 한다. 포 도 한 송이를 택할 때, 무게가 g이상일 확률을 구하여라. 풀이 포도 한 송이의 무게를 라고 하면 확률변수 는 정규 분포 N 을 따르므로 임의의 양수 에 대하여 일 확률 P 는 오른쪽 그림에 서 색칠한 부분의 넓이와 같고, 그 값 은 표준정규분포표에서 찾을 수 있다. 은 표준정규분포 N 을 따른다. 따라서 무게가 g 이상일 확률은 P P P P P 이를테면 위의 표준정규분포표에서 P 임을 알 수 있다. 한편 표준정규분포의 확률밀도함수 의 그래프는 축에 대 하여 대칭이므로 다음이 성립함을 알 수 있다. P P (단, ) 한편 정규분포 N 을 따르는 확률변수 에 대하여 다음 이 성립한다. P P P P P P 즉 는 평균에서,, 범위 내에 있을 확률이 각각,, 이다. 예제 60. 확률변수 가 표준정규분포 N 을 따를 때, 표 준정규분포표를 이용하여 다음 확률을 구하여라. (1) P (2) P 풀이 (1) P P P (2) P P P P P 일반적인 정규분포의 확률을 구할 때에는 표준화하여 표준정규 분포의 확률을 구하면 된다. 예제 63. 어느 고등학교 남학생 500명의 키는 평균 170cm, 표준편차 5cm인 정규분포를 따른다고 한다. 키가 165cm 이상 180cm 이하인 남학생은 약 몇 명인지 구하여라. 풀이 남학생의 키를 라 하면 확률변수 는 평균이 170, 표 준편차가 5인 정규분포 N 을 따르므로 라고 하면 는 표준정규분포 N 을 따른다. P P 예제 61. 확률변수 가 정규분포 N 을 따를 때, 확 률 P 을 구하여라. 풀이 확률변수 가 정규분포 N 을 따르므로 이것을 표준화하면 은 표준정규분포 N 을 따른다. P P P 따라서 구하는 남학생 수는 (명). 15
,, 일 때의 이항분포 B 의 그래프는 아래 그림과 같다. 예제 65. 은정이네 학교 학생들을 대상으로 선호하는 여름 휴 가 장소를 조사하였더니 학생들의 %는 바다를 선호하였다. 이 학교 학생 명을 임의로 골라 선호하는 여름 휴가 장소를 조사하였을 때, 바다를 선호하는 학생의 수가 명 이상일 확률 을 구하여라. 풀이 바다를 선호하는 학생의 수를 라고 하면 확률변수 는 이항분포 B 를 따르므로 의 평균과 표준편차는 E, 이때 이항분포는 의 값이 커질수록 점차 정규분포에 가까워짐 을 알 수 있다. 실제로 확률변수 가 이항분포 B 를 따 를 때, 이 충분히 크면 는 평균이 이고 분산이 인 정 규분포 N 에 가까워진다는 사실이 알려져 있다. 따라서 확률변수 가 이항분포 B 를 따를 때, 이 충분 히 크면 확률변수 는 표준정규분포 N 을 따른다. 이항분포와 정규분포의 관계 확률변수 가 이항분포 B 를 따를 때, 이 충분히 크 면 는 근사적으로 정규분포 N 를 따른다. 참고 이 충분히 크다는 것은 일반적으로 이고 일 때를 뜻한다. 참고 확률변수 가 이항분포 B 를 따를 때, 의 값이 크면 가 근사적으로 정규분포 N 를 따르므로 로 표준화하여 확률을 구한다. 예제 64. 확률변수 가 이항분포 B 을 따를 때, 확률 P 를 구하여라. 풀이 는 이항분포 B 을 따르므로 이때 은 충분히 큰 수이므로 확률변수 는 근사적으로 정규분포 N 을 따른다. 따라서 구하는 확률은 P P P P 7 모평균의 추정 통계 조사헤어 조사 대상 전체를 조사하는 것을 전수조사라고 부르 고, 일부분만 택하여 조사하는 것 을 표본조사라고 부른다. 표본조 사에서 조사 대상 전체를 모집단 이라고 부르고, 조사하기 위하여 뽑은 모집단의 일부분을 표본이라고 부른다. 또 표본에 포함된 대상의 개수를 표본의 크기라고 부른다. 모집단에 속하는 각 대상을 같은 확률로 추출하는 방법을 임의 추출이라고 부른다. 또 한 개의 자료를 추출한 후 추출한 것을 되돌려 놓고 다시 추출하는 것을 복원추출이라고 부르며, 되돌 려 놓지 않고 계속하여 추출하거나 동시에 여러 개를 추출하는 것을 비복원추출이라고 부른다. 모집단에서 조사하고자 하는 특성을 나타내는 확률변수를 라 할 때, 의 평균, 분산, 표준편차를 각각 모평균, 모분산, 모표 준편차라고 부르고 이것을 기호로,, 로 나타낸다. 모집단에서 임의추출한 크기가 인 표본을 각각,,, 이라 할 때, 이들의 평균, 분산, 표준편차를 각각 표본평균, 표본분산, 표본표준편차라고 부르고 기호로,, 로 나타낸 다. E, 이때 은 충분히 큰 수이므로 확률변수 는 근사적으로 정규분포 N 을 따른다. 따라서 구하는 확률은 P P P P P 표본의 평균, 분산 모집단에서 임의추출한 크기가 인 표본이,, 일 때 1 2 16
참고 표본분산은 모분산과의 차이를 줄이기 위해 편차의 제곱 의 합을 이 아닌 로 나눈다. 일반적으로 평균이 이고 분산이 인 어떤 모집단에서 복원 추출로 크기 인 표본,,,, 을 독립시행으로 추 출하였을 때,,,,, 은 각각 와 같은 확률분포 를 가진다. 따라서 이므로 이 성립한다. E E E, V V E E E V V V 표본평균의 평균, 분산, 표준편차 모평균이, 모표준편차가 인 모집단에서 크기가 인 표 본을 임의로 복원추출할 때, 표본평균 의 평균, 분산, 표준 편차는 다음과 같다. E, V, 예제 66. 모집단의 확률변수 의 확률분포를 표로 나타내면 다음과 같다. 합계 P 이 모집단에서 크기가 5인 표본을 복원추출할 때, 표본평균 의 평균과 분산을 구하여라. 풀이 주어진 의 확률분포에서 예제 67. 정규분포 N 을 따르는 모집단에서 크기가 100인 표본을 임의추출할 때, 표본평균 에 대하여 다음을 구 하여라. (1) E, V (2) P 풀이 (1) E, V. (2) 표본평균 는 정규분포 N 을 따르므로 으로 놓으면 확률변수 는 표준정규분포 N 을 따른다. P P P P. 예제 68. 어느 회사에서 생산하는 핸 드크림의 무게는 평균 50g, 표준편차 16g인 정규분포를 따른다고 한다. 이 회사에서 생산되는 핸드크림 중 임의추 출한 제품 64개의 무게의 평균이 48g 이상 54g 이하일 확률을 오른쪽 표준정 규분포표를 이용하여 구하여라. P 1.0 0.3413 1.5 0.4332 2.0 0.4772 2.5 0.4938 풀이 모집단이 정규분포 N 을 따르고, 표본의 크기가 이므로 표본평균 는 정규분포 N 즉 N 을 따른다. 따라서 으로 놓으면 확률변수 는 표준정규분포 N 을 따르므로 구하는 확률은 P P P P P. E V 이때 표본의 크기가 이므로 E, V. 모집단의 성질을 알려고 할 때, 전수조사가 어려운 경우에는 모 집단의 일부인 표본을 조사하여 얻은 정보를 이용하여 모집단의 성질을 추측할 수 있다. 이대 표본에서 얻은 자료를 근거로 모 집단의 특성을 나타내는 값을 추측하는 것을 추정이라고 부른 다. 표본평균을 이용하여 모평균을 추정하는 방법을 알아보자. 표본평균의 분포 모평균이, 모분산이 인 모집단에서 크기가 인 표본을 임의추출할 때, 다음이 성립한다. 1 모집단이 정규분포 N 을 따르면 표본평균 는 정규분포 N 을 따른다. 2 모집단이 정규분포를 따르지 않더라도 표본의 크기 이 충분히 크면 표본평균 는 근사적으로 정규분포 N 을 따른다. 정규분포 N 을 따르는 모 집단에서 크기가 인 표본을 임의 추출했을 때, 표본평균 는 정규분 포 N 을 따른다. 따라서 를 표준화한 확률변수 는 표준정규분포 N 을 따른다. 한편 표준정규분포의 성질에 의하여 이다. P 17
그러므로 다음 결과를 얻을 수 있다. P P 위의 식은 구간 에 모평균 이 포함될 확률이 임을 나타내므로 이 구간을 모평균 의 신뢰도 %의 신뢰구간이라고 부른다. 모평균의 추정 정규분포 N 을 따르는 모집단에서 크기가 표본을 임의추출할 때, 표본평균을 라 하면 신뢰도에 따른 모평균 의 신뢰구간은 다음과 같다. 1 신뢰도 95%의 신뢰구간 : 2 신뢰도 99%의 신뢰구간 : 참고 정규분포 N 을 따르는 모집단에서 크기가 표 본을 임의추출할 때, 표본평균을 라 하면 신뢰도에 따른 모평 균 의 신뢰구간의 길이는 다음과 같다. 1 신뢰도 95%의 신뢰구간의 길이 : 2 신뢰도 99%의 신뢰구간의 길이 : 표본의 크기가 일정할 때 신뢰도가 높아지면 신뢰구간의 길이는 길어진다. 한편 신뢰도가 일정할 때 표본의 크기가 커지면 신뢰 구간의 길이는 짧아진다. 예제 70. 표준편차가 15인 정규분포를 따르는 모집단에서 표본 을 임의추출하여 모평균을 신뢰도 95%로 추정할 때, 신뢰구간 의 길이가 2 이하가 되도록 하는 표본의 크기의 최솟값을 구하 여라. 풀이 표본의 크기를 이라 하자. 신뢰도 95%로 추정한 모평균 의 신뢰구간의 길이가 이하가 되어야 하므로,, 이다. 따라서 표본의 크기의 최솟값은 이다. 참고 표본의 크기 이 충분히 크면 모표준편차 와 표본표준 편차 가 거의 같아지므로 대신 를 사용하면 된다. 참고 표본평균 는 확률변수이므 로 추출되는 표본에 따라 그 값이 달라지고 신뢰구간도 달라진다. 신 뢰도 %의 신뢰구간이란 크기가 인 표본을 여러 번 추출하여 신뢰 구간을 만들 때, 모평균 을 포함 하는 구간이 약 %라는 뜻이다. 예제 71. 정규분포를 따르는 어느 모집단에서 크기가 4인 표본 을 임의추출하여 모평균을 신뢰도 로 추정하였더니 신뢰구 간의 길이가 이었다. 동일한 신뢰도로 추정한 신뢰구간의 길이 가 가 되도록 하려면 표본의 크기를 얼마로 해야 하는지 구 하여라. 풀이 모표준편차를, 표본의 크기를, P 라고 하면 모평균의 신뢰도 의 신뢰구간의 길이는. 일 때 신뢰구간의 길이가 이므로 예제 69. 대학수학능력시험 수리영역 나형에 응시한 수험생 중 임의추출한 2500명의 수험생의 점수는 평균이 65점, 표준편차 가 15점이었다. 수리영역 나형에 응시한 전체 수험생의 점수가 정규분포를 따른다고 할 때, 수리영역 나형의 평균 점수 에 대하여 다음에 답하여라. (1) 신뢰도 95%의 신뢰구간을 구하여라. (2) 신뢰도 99%의 신뢰구간을 구하여라.. 이때 신뢰구간의 길이가 가 되도록 하려면 이므로 이다. 풀이 (1) 표본평균은 65이고, 표본의 크기 2500이 충분히 크 므로 모표준편차 대신 표본표준편차 15를 사용할 수 있다. (1). (2). 8 모비율의 추정 모집단에서의 어떤 사건에 대한 비율을 고려할 때, 그 비율을 그 사건에 대한 모비율이라고 하며, 이것을 기호로 와 같이 나 타낸다. 일반적으로 모비율 의 값을 추정하기 위해서는 모집단에서 임 의추출한 표본을 이용할 수 있다. 모집단에서 임의추출한 표본 에서의 비율을 그 사건에 대한 표본비율이라고 하며, 이것을 기 호로 로 나타낸다. 18
표본비율 크기가 인 표본에서 어떤 사건이 일어나는 횟수를 라고 할 때, 이 사건에 대한 표본비율 은 보기 72. 어느 도시에는 명의 고등학생이 있으며 이 중에 서 명이 여학생이라고 한다. 이 도시에 살고 있는 고등학생 을 모집단으로 했을 때 모집단에서 여학생의 비율, 즉 모비율 는 한편 모집단에서 임의추출한 명의 고등학생 중에서 여학생 이 명이면 표본비율 는 표본비율 에서 확률변수 는 크기가 인 표본에서 어떤 사건이 일어나는 횟수이므로 확률변수 가 취할 수 있는 값은,,, 이며, 모집단에서 이 사건이 일어날 확률은 이다. 그러므로 확률변수 는 어떤 사건이 일어날 확률이 인 시행을 번하였을 때 그 사건이 일어난 횟수이므로 이항분포 B 를 따른다. 따라서 확률변수 의 평균과 분산은 각각 E, V 이고, 표본비율 의 평균과 분산 및 표준편차는 다음과 같다. EE E VV V V 일반적으로 표본의 크기 이 충분히 클 때, 이항분포 B 를 따르는 확률변수 는 근사적으로 정규분포 N ㄹ 르 따르고, E, V 이므로 도 근사적으로 정규분포 N 를 따른다. 따라서 다음을 얻는다. 표본비율 의 분포 모비율이 이고 표본의 크기 이 충분히 클 때, 표본비율 의 분포는 정규분포 N 에 가까워진다. 따라서 는 근사적으로 표준정규분포 N 을 따른다. ( ) 참고 표본의 크기 이 크다는 것은 보통 이고 일 때를 뜻한다. 예제 73. 어느 회사의 직원 중에서 %는 정기적으로 운동을 한다고 한다. 이 회사에서 임의로 추출한 명 중에서 정기적으 로 운동을 하는 사람의 비율이 % 이상이고 % 이하일 확 률을 구하여라. 풀이 명 중에서 정기적으로 운동을 하는 사람의 비율을 이 라고 하면 구하는 확률은 P )이다. 한편 표본의 크기는 이고 모비율은 이므로 는 근사적으로 표준정규분포 N 을 따른다. 따라서 구하는 확률은 어떤 사건 가 일어날 확률, 즉 모비율이 인 모집단에서 크기 가 인 표본을 임의추출할 때, 표본비율 에서 확률변수 는 회의 독립시행에서 사건 가 일어난 횟수이다. 즉 확률변수 는 이항분포 B 를 따른다. P P P 따라서 이항분포 B 를 따르는 확률변수 의 평균과 분산 이 E, V이므로 표본비율 의 평균, 분산, 표준편차는 다음과 같다. E E E, V V V 모비율의 신뢰구간 표본비율을 이라고 할 때, 표본의 크기 이 충분히 크면 모비율 의 신뢰구간은 다음과 같다. (단, ) 1 신뢰도 %의 신뢰구간 2 신뢰도 %의 신뢰구간 19
참고 표본의 크기 이 충분히 크다는 것은 보통 이고 일 때를 뜻한다. 예제 74. 어느 가전제품 회사에서는 새로운 디자인에 대한 선 호도를 알아보기 위하여 명을 임의추출하여 조사하였더니 이들 중에서 명이 새로운 디자인을 선호하였다. 이때 전체 국 민 중에서 새로운 디자인을 선호하는 비율의 신뢰도 %의 신 뢰구간을 구하여라. 풀이 새로운 디자인을 선호하는 표본비율은 이 다. 이때 이고 이므로 는 근사적으로 표준정규분포 N 을 따른다. 모비율 의 신뢰도 % 신뢰구간의 양 끝값은, 따라서 구하는 신뢰구간은 이다. 세상에서 가장 불행한 사람은 완벽해지려 애쓰는 사람이다. 완벽을 겨루는 경기에는 끝이 없다. 나는 오늘도 나를 응원한다. 마리사 피어 고등학교 수학 요약노트 - 확률과 통계 만든이 : Sooji Shin 펴낸곳 : http://www.soojishin.com 최종수정일 : 2014년 8월 11일 (2판) 이 노트를 개인 학습용 또는 수업 준비용으로만 사용하고, 상업적 용도로 사용하지 마십시오. 20