Calculus is the mathematics of motion and change. 운동과변화의수학인선형대수는 (Calculus) 함수의순간변화율에 ( 기울기 ) 대한미분 (Differentiation), 함수의특정구간의면적의합에관한적분과 (Integral) 함수의수렴값에대한극한에 (limiting value) 관해다루게된다. 선형대수는 7 세기과학자들의수학적요구에의해시작되었다. 천문학자 Johannes Kepler (97-630) 0 년간의천문관측을통해다음사실을알아내었다. () 행성은궤도는타원이다. () 같은시간동안움직인면적 ( 회색부분 ) 은같다 (3) 행성의주기 T 와궤도의 반지름 (semi major) 의길이 a 라하면 T / a 3 는일정하다. 그러나이사실은선형대수에의하면반나절이면알아낼수있다. 이처럼과학의필요에의해선형대수는태동되었고발전하게되었다... 좌표와직선방정식.. 좌표와사분면 (coordinate, quadrant) 평면에 ( 이차원공간 ) 있는모든점들은숫자좌표에 (numerical coordinate) 의해표현되며평면의점들의모임인선이나곡선은좌표방정식에 (coordinate equation) 의해표현된다. 이차원공간 ( 평면 ) 의점들을표시하기위하여 -축 (-ais) 이라는수평선과 (horizontal) y- 축이라는 (y-ais) 수직선 (vertical) 이그려져있고두직선은원점 (origin) 에서직각으로만난다. 원점을기준으로 축에서 a 만큼, y 축에서 b 만큼떨어진점의좌표는 ( a, b) 이다. 이를데카르트좌표라 (Cartesian Coordinate, Rene Descartes) 정의한다. 좌표 a, b는실수이다 (real number). 3
이사분면 X -, Y+ y- 축 X +, Y+ 일사분면 (First Quadrant) b 점 P=(a,b) 삼사분면 원점 (0,0) a 사사분면 - 축 X -, Y- X +, Y-.. 직선과증가두점을가장가까운거리로연결할때만들어지는선을직선이라 (line) 한다. 직선위의점은무수히많이존재한다. 두점의증가 (increment) 는두점의순변화를 (net change) 의미하며좌표 P = (, y ) 으로부터 Q = (, y ) 까지움직였을때좌표의증가는 Δ = ( ), Δy = ( y y) 이다. 증가의부호와크기는두대응좌표의크기가 결정한다. Q = (, y ) Δ P = (, y ) Δ y..3 기울기 rise Δy y y 수직선, 수평선이아닌직선의기울기 (slope) 는 m = = = 라정의한다. run Δ 직선의기울기는선상어느좌표에서나동일하다. 그러므로점 P 에서나 Q 에서나기울기는동일하다. 수평선의기울기는 0 이고 (rise=0) 수직선의기울기는무한대이나 (infinity, ) 정의되지않는다. 33
..4 거리 좌표에서두점 P = (, y ), Q = (, y ) 사이의거리 (distance) 는다음과같이정의한다. 이를 Euclidean 거리라한다. PQ = ( ) + ( y y) 기울기, 거리좌표에서임의의두점 P = (,), Q = (,0 ) 을지나는직선의기울기와두점사이의거리를구하시오. 기울기 0 m = ( ) = 거리 PQ = ( ( )) + (0 ) = 8..5 경사각 직선의경사각 (angle of inclination) 은다음과정의된다. 이직선의기울기 m = tan(θ ) 이다. θ θ..6 평행과수직 두직선의기울기가동일하면두직선은서로평행 (parallel) 이라한다. 반면, 두직선의기울기의곱이 이면두직선은서로수직 (perpendicular) 이라한다. 직선 L 과 L 는평행이고, 직선 L3 는직선 L, L 와수직이다. 직선 L 의기울기는 h / a 이므로직선 L 의기울기는 h / a, 직선 L3 의기울기는 a / h 이다. 34
L L h a L3..7 직선방정식 직선방정식 직선방정식은 (linear equation) 직선의모든점의좌표에의해만족되고직선이외의점좌표에서는만족하지않는다. 직선방정식은 y-축과만나는절편과증가랑으로이루어지며 y = a + b 으로표현된다. 상수 a 는절편 (intercept), 상수 b 는기울기 (slope) 한다. 기울기 b = 0 인직선 y = a 는수평선 (vertical line) 이라하며 -축과평행이며 y- 축에는 a 를지난다. y-축과평행인직선 = c 는 -축과는 c 에서만난다. =- y=.5 직선방정식그래프그리기 () =0일때 y값을구한다. 즉절편 a를구한다. () y=0 일때 값을구한다. (3) 두좌표를이으면직선방정식그래프가완성된다. 35
점 - 기울기방정식 직선의기울기가 m 이고절편이 a 인직선방정식은 y = a + m 이다. 직선그래프그리기 y = 3 + 그래프를그리시오. 수작업 () =0 일때값 y=3 ( 절편 ) 좌표 (0, 3) In R () y=0 일때 =-3/ 좌표 (-.5, 0) 직선방정식 8 + 5y = 0 의기울기와절편을구하시오. 8 8 5 y = 8 + 0 y = + 4 그러므로기울기 이고절편 4 이다. 5 5 36
점-기울기방정식직선의기울기가 m 이고직선의한좌표가 (, y) 이면직선의방정식은 y y = m( ) 이다. 직선방정식 기울기 3/ 이고직선이좌표 (,3) 을지날때직선방정식을구하시오. 3 3 y 3 = ( ), 이를정리하면 y = + 6 점 - 점방정식 () 두점을이용하여기울기를구한다. () 기울기와한점을이용해직선방정식을구한다. 직선방정식 두점 (-, -), (3,4) 지나는직선의방정식을구하시오. 기울기 4 m = = 3 점-기울기 y 4 = ( 3), 정리하면 y = + 직선방정식 () 기울기가 m 이고점 P 를통과하는직선방정식을구하시오. P = (,), m = P = (,), m = / 3 P = ( 0, b), m = 4 P = ( a,0), m = () 두점 P, Q 를통과하는직선방정식을구하시오. P = (,), Q = (,) P = (,0), Q = (, ) 3 P = ( 0,0), Q = (,3) 4 P = (,), Q = (, ) (3) 다음직선의그래프를그리시오. (R 을이용하여그리시오.) 3 + 4y = + y = 4 3 3y = 6 4.5 y = 3 37
(4) + y = 과 + ky = 3 은수직이라한다. k 를구하시오. (5) + y = 3 와 3y = 의교차점 (intersection) 과 P = (, ) 을지나는직선방정식을구하시오. R 에서 3 개그래프를한화면에그리시오. 직선방정식응용 빛은직선 + y = 따라들어와지면에들어온각도대로반사된다고한다. 반사되는빛의경로에대한직선방정식은 θ 의각도는 45 o 이고두직선은수직이다. 그러므로반사직선방정식의기울기는 이다. 또한 (,0) 을지나므로반사되는빛의경로직선방정식은 y = 이다. θ y=- 직선방정식응용 () 경사각이 0% 인도로가있다. 지상에서차가출발하여 5km 올라갔다. 지상으로부터얼마높이에있는가? sin0=/5 이므로 =5sin0=0.868 이다. θ=0 o 5 38
. 함수와그래프.. 함수 function 함수 가가질수있는값의집합인정의역혹은영역 (Domain) 집합으로부터치역혹은범위 (range) 인 y 가가질수있는값의집합으로의함수 (function) 는정의역각원소 ( 값 ) 에단하나 (single) 치역원소 ( 값 ) 를할당하는규칙을의미한다. y = f () 라쓰고 y 는 의함수이다 (y is a function of ) 라고읽는다. *) 하나 (single) 의의미는정의역값에는치역의값이하나만대응된다는것이다. 아래그림에서치역의값에는두개의정의역값과대응되어있으나정의역원소 ( 값 ) 에서보면단하나의치역값과대응되어있다. Domain ( 정의역 ) INPUT X f y or f() Range ( 치역 ) OUTPUT 이처럼정의역값에단하나의치역값이대응되는모든관계를함수라한다. 아래그래프중 () 를제외하고는모두함수로정의된다. f () () () (3) (4) (5) 39
정의역과치역 정의역과치역은일반적으로구간 (Interval) 으로되어있으며가질수있는가능한모든 값들의모임이다. 구간의양끝값을경계값 (boundary point) 이라하고구간내의값은 내부값 (interior point) 이라한다. Open interval ( 열린구간 ) ( a, b) 구간의양끝값을모두포함하지않는다. Closed interval ( 닫힌구간 ) [ a, b] 구간의양끝값을모두포함한다. Half-open interval ( 반열린구간 ) [ a, b), ( a, b] 한쪽값만포함한다. 함수 Domain Range y = (, ) [ 0, ) y = / (,0) (0, ) (,0) (0, ) y = [ 0, ) [ 0, ) 함수예제 화씨온도를 (Fahrenheit) 섭씨온도로 (Centigrade) 바꾸는식? 이것역시 5 함수이다. C = ( F 3) ( C = f (F) ) 정의역은 D = { ; < < } 으로 F( 화씨 9 온도 ) 가가질수있는온도값이고치역은 C 가가질수있는온도값으로 R = { y = f ( ); < y < } 이다. 아이 IQ(Y) 는엄마 IQ(X) 에의존할가능성이있다. 만약 y 의값이전적으로 에의해서만결정된다면 y 는 의함수이라 (function) 한다. 그러나아이 IQ 는전적으로엄마 IQ 에만의존하는것은아니므로이를다루는회귀분석에서는 y = f ( ) + error 관계를다룬다. 함수 f 의가장흔한형태는선형 (linear) 반지름이 r 인원의면적구하는식도함수이다. A( r) = πr ( π = 3.459... ) 만약반지름이 이면면적은 4π 가된다. ( 이차함수 ) 정의역은 r > 0 이고 치역은 A > 0 이다. 40
.. 확률변수와확률분포함수 확률변수 (random variable) 표본공간의각결과 ( 원소 ) 에실수 (real number) 값을대응시키는규칙 ( 함수 ) 을확률변수라한다. 표본공간이 S 인확률실험에서각표본공간원소에오직하나의실수값을대응하는함수 X 를확률변수라한다. 기호로는 X ( w) = 이다. 확률변수 X 의정의역은표본공간 S = { w : w S} 이고치역은 { : X ( w), w S} 이다. + 이산형 (discrete) 확률변수, 연속형 (continuous) 확률변수표본공간이셀수있는경우 (finite) 정의된확률변수를이산형, 셀수없는경우 (infinite) 정의된확률변수를연속형확률변수라한다. 제품불량개수, 교통사고발생수, 주사위눈금은이산형확률변수이다. 제품수명, 강수량, 정격전압등은연속형확률변수이다. 이상형과연속형에대한다른정의로는임의의구간을설정하여도구간내의값이측정될수있으면연속형, 그렇지않으면이산형이라한다. + 확률분포함수 (probability distribution function) 확률변수가가질수있는값들을정의역 (domain), 각값들의확률 (probability) 을치역 (range) 으로한함수를 ( 확률 ) 분포함수 ( 혹은확률밀도함수, prob. density function) 라하고 f () 로 ( 이산형변수일경우는구별하여 p() 을사용하기도한다 ) 나타낸다. + 확률분포함수조건 ) 확률변수 X 의임의의값 의확률값은 0 이상이다. f ( ) 0 for all ) 확률변수 X 의모든값 의확률을더하면 이다. f ( ) d =, p ( ) = + 기대값 epected value 기대값확률변수 X 의기대값은다음과같이정의된다. ( 이산형 ) E ( X ) = p( ), 모집단기호 μ, 표본데이터기호 X ( 연속형 ) E ( X ) = f ( ) d 4
기대값은평균으로불리어지며, 함수 ( X μ) 의기대값을분산이라정의한다. 즉분산은 σ = E( X μ) 이다. 주사위를던지는실험에서나타나는눈금의기대값은 3.5 이다. 나타나는눈금을확률변수 X 라하자. 확률밀도함수는 p ( ) = / 6, =,, K, 6 이다. 이를균일분포라 (uniform dist.) 한다. 그러므로기대값 ( 평균 ) 과분산은다름과같다. E ( X ) = p( ) = + + K + 6 = 3. 5 6 6 6 = E( X ) = ( X 3.5) p( ) σ μ = ( 3.5) 6 + ( 3.5) 6 + K + (6 3.5) 6 =.9 R 에서기대값계산..3 이산형확률밀도함수 + 베르누이분포 (Bernoulli distribution) X ~ B( p) () 모든시행이서로독립이고 () 시행 (trial) 결과가성공 (success, 관심을갖는결과 ), 실패 (failure, 반대결과 ) 두가지만발생하고 (3) 매시행성공확률이 p 로일정한경우이를베르누이시행 (Bernoulli trial) 이라한다. 시행의성공일확률이 p 이라하고성공이면확률변수 X=, 실패면 X=0 이라하면확률분포함수는다음과같다. p( p) = p ( p), = 0, ( 평균 = p, 분산 = pq ) + 이항분포 (Binomial distribution) X ~ B( n, p) n 번의독립적인베르누이시행에서성공의회수를확률변수 X 라하자. 독립적 이란각시행이다른시행의결과에영향을미치지않음을의미한다. 이때확률변수 X 는모수가 (n, p) 인이항분포를따른다고하고 X ~ B( n, p) 확률분포함수는다음과같다. n p( n, p) = p ( p) n, = 0,,,..., n ( 평균 = np, 분산 = npq ) 4
이항분포함수그리기 B (0,0.), B (0,0.5), B (0,0.9) 확률밀도함수를동일그래프에그리시오. R 에서이항확률밀도함수 dbinom() 이용하면된다. 옵션중 h 는 histogram 의미, main 은그래프제목, ylab 은 y-축이름, ylim 는 y-축서식을지정한다. (In Script Window) 43
+ 포아송분포 (Poisson distribution) X ~ Poisson( λ) 단위시간 ( 예를들어일주일 ) 을같은크기로 n 등분하면각서브구간에사건발생 ( 예 : 성공 ) 이많아야한번일어나게한다고하자. 즉 P( 서브구간에성공발생하지않음 )=-p, P( 서브구간에성공한번발생 )=p, P( 서브구간에성공한번이상발생 )=0 이라가정한다. 일주일동안성공의회수는이항분포를따를것이다. 이경우서브구간을몇개로나누어야할지모르므로 (n, p) 의값을모른다. 그러므로 n 을매우크게하여 p 의매우작게하는것이합리적일것이다. 그리하여 λ = np 라하고 n 을 로근사하면 n λ p p n = e λ lim ( ) ( ) n λ ( 참고 ) lim ( + ) = e, lim ( ) n = e λ n! n n n n 이처럼발생확률이매우낮은사건의성공확률이매우낮은시행에서성공회수를확률변수 X 라하면이는 Poisson 분포를따르고 X ~ Poisson( λ) 라표시한다. 확률분포함수는다음과같다. e λ λ f ( λ) =, = 0,,,..., 0 λ < ( 참고 ) λ = np ( 평균 = λ, 분산 = λ )! 포아송분포는일정단위당관심사건발생회수를정의한다. 예를들어, 페이지당페이지오류개수, 시간당은행을찾는고객수, 은행콜센터에매 30 분당걸려오는전화수, 아프리카초원 0ha 당표범수등은포아송분포를따르게된다. n 이커지고 p 가매우작아 np 가일정해지면이항분포 B( n, p) 는 Poisson ( λ = np) 에근사한다 (approimate). 포아송분포함수그리기 다음은 Wikipedia 의 Poisson 분포그래프이다. R 을이용하여그리시오. 그래프옵션에서 h 대신 b 를사용하면된다. 확률밀도함수에서범위는 ( 평균 ± 4 표준편차 ) 정도잡아주면된다. λ = 0가평균, 분산이므로 0 ± 4 0 을확률변수 의범위로잡아주면된다. 실제계산범위는 (-.6,.6) 인데표아송확률변수는음의값을가지지못하고우측값은다소작은값을잡아그림처럼 (0, 0) 이용하시오. ylim 은 (0, 0,4) 를이용하고 ylab= P(X=) 이용하시오. 44
이항분포포아송분포 근사 B(0,0.5), B(0,0. 5 ), B(50, 0.), Poisson (5) 확률밀도함수를하나의그래프화면을 4 등분하여하나씩그리시오. 함수 windows() 는새로운그래프창을만든다. c(,) 는화면을 행, 열로나눔을의미한다. 함수 abline() 은참조선 (referencee line) 긋는다. 45
+ 초기하분포 (Hyper-geometric Distribution) X ~ HG( N, D, n) N 개개체가있는유한모집단이있다고가정하자. ( 예를들면주머니안에구슬이 00, 생산된제품이 500 개 ) 우리가관심이있는개체들의개수가 D( D N, 예, 빨간색 30, 불량품이 5 개 ) 라고하자. 이런모집단으로부터 n 개의개체를뽑을때 (without replacement, 비복원추출 ) 관심의개체수를확률변수 X 라할때 X 는초기하분포를따른다고하고 X ~ HG( N, D, n) 확률분포함수는다음과같다. D N D n p ( N, D, n) =, = 0,,,..., min( n, D) ( 평균 = N N n N 이커지면초기하분포 HG( N, D, n) 는이항분포 B( n, D / N ) 에근사한다. nd, 분산 = 복잡 ) 이항분포그리기 초기하분포가이항분포에근사함을보이시오. N=0, 50, 00 그리고 p=0., 0. 이용하여보이시오. 46
+ 기하분포 (Geometric distribution) 성공확률이 p 인시행에서첫번째성공이발생할때까지소요되는시행회수를 X 라하면 X는기하분포를따르고 X ~ G ( p) 확률분포함수는다음과같다. f ( ) = q p, =,,3,... ( 평균 = / p, 분산 = q / p ) 기하분포는이산형시간확률분포함수에 ( 예 ; 제품수명, 고객을기다리는시간, 관심사고가 발생할때까지걸리는시간, 이경우단위시간개념이적용된다.) 활용된다. 연속형확률변수의경우지수분포를가정하게된다. 다음고객이은행을찾아오는시간이적어도 5분이상일확률을구하는문제에서기하분포를적용하면분혹은 0 초등이단위시간으로정의되어야한다. 기하확률분포함수그리기 다음은 Wikipedia 의 기하분포 그래프이다. R 을이용하여그리시오. + 음이항분포 (Negative Binomial distribution) [optional] 성공확률이 p 인시행에서 r 번째성공이발생할때까지소요되는시행회수를 X 라하면 X는음이항분포를따르고 X ~ NB( p,r) 확률분포함수는다음과같다. f ( ) = q r p r, = r, ( r + ),( r + ),... ( 평균 = r / p, 분산 = rq / p ) r 음이항분포는성공회수 r 이정수일필요는없는데 r 인정수인경우를구별하여 Pascal( 파스칼 ) 분포라고도한다. 그러나음이항분포라함은 r 이정수인경우를일컫는경우가대부분이다. 음이항 의미? 이항분포의경우 n번시행중성공의회수 (X) 에관한분포라면음이항분포는 r 번성공했을때시행회수 (X) 에관한분포이므로이런이름을갖게 되었다. 47
+ 이산형분포함수관계..4 연속형확률밀도함수 + 균일분포함수 continuous uniform distribution) 연속형확률변수가일정구간내 ( θ θ ) 에서어느값이든일어날가능성이동일할때 균일분포를따른다고하고확률분포함수는다음과같다. f = a + b ( b a) ( ), a < < b ( 평균 =, 분산 = ) b a 48
+ 정규분포함수 (Normal Distribution) X ~ N ( μ, σ ) 천문학관련측정오차들에대한확률분포함수로 Gauss 가발견하여 Gaussian 분포라고도하는정규분포는통계학에서가장중요한확률분포이다. 정규 (normal) 의의미는이분포를따르지않는오차의분포는 abnormal 하다고하였고그에대응하여 normal 을사용하게되었다. 확률변수가평균 μ, 표준편차가 σ 인정규분포를따를때확률밀도함수는다음과같다. ( μ) f ( ) = e σ, < < ( 평균 = μ, 분산 = σ ) πσ μ 평균 0, 표준편차 인표준정규분포 z = ~ N(0,) 확률밀도함수는다음과같다. σ z f ( z) = e, < z < π 정규확률분포함수그리기 N (0,), N (, ), N (, ) 확률밀도함수를한그래프에그리시오. N(, ) 우측범위는 + 3 = 5. 4 에서 5 까지만정해주었다. 좌우대칭인분포는 ±3* 표준편차를범위로지정해주면된다. 연속함수그래프를그려줄때는눈금을 0. 정도로해주는것이그래프를 smoothing 하게만든다. 49
+ 표준화 standardization 단위가다른두집단의관측치정보를상호비교하기위하여표준화 (standardization) 개념을도입하였다. 수능점수의원점수를표준화한표준화점수를이용하여수능과목간등급을산정하는것이사례이다. 정규분포확률밀도함수는평균과표준편차에따라그래프의모양이변하므로확률표는무한히많이존재하므로평균 0, 표준편차 인표준정규분포를이용하는것도한사례이다. 원관측치확률변수를 라하고평균을 μ, 표준편차를 σ라하면표준화는다음과같다. 확률변수 z 의평균은 0, 표준편차는 이다. z = μ σ + 지수분포 Eponential distribution X ~ Ep( β ) 비행기엔진이고장나는데걸리는시간의길이, 고객이도착하는데소요되는시간의길이, 자동차검사에걸리는시간의길이에대한확률분포함수는우측으로치우친 (skewed to the right) 형태를가지며 0 에주로가까운사건이발생한다. 단위시간당 ( 주어진구간 ) 변화 ( 성공, 발생 ) 회수가 Poisson( λ = 평균 ) 분포를따른다고하자. 변화가발생하는사이시간 X 에대해생각해보자. 즉첫성공이일어날때까지의시간 X 에대한누적분포함수 (cumulative distribution function, 5 장적분에서자세히다룬다 ) 는다음과같이구할수있다. F( X ) = Pr( X ) = Pr( X > ) = Pr( no change in [0,]) = - e -λ, 0 < 50
확률변수 X 가모수 λ 인지수분포 (eponential distribution) 를따른다면 X ~ Ep( λ) 확률밀도함수는다음과같다. ( 미분 4 장참고, f ( ) = F'( ) ) f ( ) = λe λ, 0 < ( 평균 =, 분산 = ) λ λ λ = 일경우지수분포함수는 f ( ) = e / θ 라정의되고, 평균은 θ, 분산은 θ 이다. θ θ θ 는사건이 ( 고장, 방문, 사고 ) 일어나는데걸리는평균시간이므로지수확률분포함수로이형태가주로사용된다. 지수분포의모수는 λ는비율 (rate) 모수라한다. + 와이블 Weibull 분포 X ~ Weibull ( γ, β ) 기다리는시간에대한분포로는문제가없으나수명으로서지수분포는문제가있다. 언제어디서나 failure rate( 실패율 λ ) 는항상동일하다는것이다 (memory-less 성질 ). 그러나실제는시간이증가할수록실패율은증가한다. 이런경우수명에대한분포로주로사용되는분포가와이블 X ~ Weibull ( γ, β ) 분포이며, 와이블확률밀도함수는다음과같다. γ는형상 (shape) 모수, β는크기 (scale) 모수라한다. γ γ f ( γ, β ) = γ e / β, > 0 ( 평균 = β Γ ( + ), 분산 = β Γ ( + ) μ ) β γ = 인경우와이블분포는지수분포와동일하다. γ γ + Gamma Distribution ( 감마분포 ) X ~ Gamma( α, β ) 감마분포는지수분포와유사한분포로포아송분포를따르는사건이 α 번일어나는동안 소요되는시간에대한분포이다. 모수 (, λ) 만약 (,,..., α ) α 에서 α 는형상모수, λ 는크기모수라한다. α 가서로독립이고모수가 λ 인지수분포를따른다면 Y = i i= ( α, λ 인감마분포 Gamma ( α, λ) 따른다. 모수가 ) 는 다음은포아송분포와감마분포의관계를나타낸것이다. X ~ Gamma( α, λ), Y ~ Poisson( / λ) P ( X ) = P( Y α ) 시간 (time) 5
확률변수 X 가다음과같다. 모수 ( α, λ ) 인감마분포를따를때 Gammaa ( α, λ) 확률밀도함수는 λ α f ( ) = α e λ α α, 0 ( 평균 =, 분산 = Γ( α) λ λ ) ( 참고 ) Γ( n) = ( n )! ( 참고 ) 모수가 θ = 이면확률밀도함수 f () = 분산은 αθ 이다. λ α e /θ, 평균은 αθ 이고 Γ (α)θ α 감마확률분포함수그리기 다음은 Wikipedia 의 감마분포그래프이다. R 을이용하여그리시오. + Chi-Square Distribution ( 카이제곱분포 ) X ~ Chi Square(rr ) r 서로독립인 r 개의표준정규분포 ( z i ) 확률변수제곱합이 ( z i ) 갖는확률밀도함수이다. i= f ( ) = r / e /, 0 ( 평균 = r, 분산 = r ) r / Γ( r / ) 카이제곱분포는감마분포 X ~ Gammaa ( α = r /, β = ) 의특수한형태이다. 모수 r 을 자유도라 (degreee of freedom) 한다. 5
+ t-distribution (t-분포) X ~ t( k) 서로독립인표준정규분포 Z, 모수 r 인카이제곱분포 V 의관계식 W Z = 이갖는 V / r 확률밀도함수이다. 필명이 (pen name) Student 인 W. S. Gosset 에의해제안되어 ( 독일 Dublin 의맥주공장장으로데이터의크기가적은경우관측치가정규분포에따르지않음 ) 이를 Student t-분포라불린다. t-분포의모수 k 도자유도라하며분포함수의형태는표준정규분포유사하다. 표준정규분포와같이좌우대칭이며양쪽꼬리가표준정규분포에비해두꺼운형태를갖는다. 그리고모수 k 가커지면표준정규분포에근사한다. f ( ) = Γ( k / + ) ( + / ) ( k + ) / k k, < < ( 평균 =0, 분산 = ) kπ Γ( k / ) k 표준정규분포와 t- 분포관게 표준정규분포 N (0,), t (0), t (0) 확률분포함수그래프를한그래프에그려보자. 53
+ F-Distribution (F-분포) X ~ F ( r, r ) V 서로독립인두카이제곱분포의 ( V i ~ Chi Square ( r i ) ) 관계식 / r W = 이갖는 V / r 확률밀도함수이다. F-분포의모수는 ( r = 분모자유도, r = 분자자유도 ) 이다. 분포함수와분산식을복잡하여생략하였다. F-분포의평균은 r /( r + r ) 이다. + Beta ( 베타분포 ) X ~ Beta ( α, β) 서로독립인두감마분포의 ( X ~ Gamma ( α, θ ) ), X ~ Gammaa ( β, θ ) ) 의관계식 W = 이갖는확률밀도함수이다. Beta 분포의모수 α, β α /(αα + β), 분산은 αβ /{(αα + β) ( α + β +)} 이다 다. X X + Y 모두는형상 (shape) 모수이다. 평균은 54
+ 이항분포의포아송분포근사 Poisson Approimation to Normal 이항분포모수 n 가무한히커질때 B( n, p) 는포아송분포에근사한다. P ( X k X ~ B( n, p)) P( X k X ~ Pisson( λ = np)) 포아송분포근사 + 이항분포의정규분포근사 Binomial Approimation to Normal 이항분포모수 n 가무한히커질때 ( n ) 이항분포 B( n, p) 는정규분포에 Normal ( np, npq) 근사한다. 컴퓨터가발달하지않을때는 n 이커지면 C( n, ) 을계산하는것이불가능하여근사규칙을이용하여이항분포의확률값을계산하였다. 이항분포확률을정규분포에근사하여확률값을구할때는연속보정 (continuity correction) 고려해야한다. 이는이산형의경우임의의한값에서확률은확률막대높이이므로값이존재하지만연속형인경우확률은면적이므로한값의확률은 0 이되므로이를보정해주는역할을연속보정이한다. 연속보정의부등식의바깥쪽으로 0.5 만큼넓혀주게된다. P ( m X n X ~ B( n, p)) P( m 0.5 X n + 0.5 X ~ N ( np, npq)) 포아송분포도모수 λ 가커지면정규분포에근사한다. 이항분포정규분포근사 P( X 3 X ~ B(50,0.)), P( X 6 X ~ B(00,0.)) P( 5 X 8 X ~ B(50,0.4)) 확률을이항분포로구하고정규분포근사로구하여비교하시오. P 가 0.5 에가까울수록빨리근사한다. 55
+ 분포관계식 56
..5 함수그래프그리기함수 y = f () 의관계를 차원공간 (-축, y-축 ) 좌표에표현한것을그래프라하는데정의역값을 X-축에그에대응하는값을 Y-축에나타낸좌표점들을연결하여놓은것이다. 직선방정식함수그리기는페이지 36 을참고하기바란다. 함수그리기 함수 y =, (Domain ) 그래프를그리시오. ( 이차함수 ) [STEP] 계산이용이한 값을선택하여 y 값을구한다. [STEP] 차원공간에좌표를표시한다. [STEP3] 좌표를연결하여그래프를그린다. y = 함수그리기 () 함수 y = 4 그래프를그리시오. [STEP] 함수의 Domain 을결정해야 한다. Root 안의값은 0 보다커야하므로 4 0 이함수 Domain 은 4 이다. [STEP] 계산이용이한 값을선택하여 y 값을구한다. y = 4 57
[STEP3] 좌표를연결하여그래프를그린다. 함수그리기 (3) 함수 y = ( ) 그래프를그리시오. = 에서는함수값이정의되지않는다. 를중심으로멀어질수록함수값은 0 에수렴하게된다. X 의범위를 (-8, ) 으로하였다. 58
다음함수그래프를수작업으로그리고 R 을이용하여확인하시오. () y = + 3 () y = 9 3 (3) y = (4) y = + 직선그리기..6 삼각함수 trigonometric function 각에 (angle) 대한함수로 circular 함수라고도하며, 주기에대한함수로사용된다. 각 C 가직각이고나머지각들이 A, B 인삼각형을다음과같이정의하자. 각 A 의수평선길이를 a, 삼각형높이를 b, 사면길이를 h 라하자. hypotenus B h a Opposite A Adjacent b C () sin( A ) = a / h (sine A) () cos( A ) = b / h (cosine A) (3) tan( A ) = a / b (tangent A) 삼각함수 (4) sec( A ) = / cos( A) (secant A) (5) csc( A ) = / sin( A) (cosecant A) (6) cot( A ) = / tan( A) (cotangent A) 그러므로 sin A tan( A) = 가성립한다. 다음항등식은본저서에서는증명하지않는다. cos A 59
삼각함수항등식 () sin ( A ) + cos ( A) = () sin( A ± B) = sin( A) cos( B) ± sin( A) cos( B) (3) cos( A ± B) = cos( A) cos( B) m sin( A)sin( B) π π (4) sin( A ) = cos( A), cos( A ) = sin( A), tan( A ) = cot( A) (5) sin( A) = sin( A), cos( A ) = cos( A), tan( A) = tan( A) π 삼각함수값 각 degree 원주율 radius Sin() Cos() Tan() 0 0 0 0 5 o π/ 3 30 o π/6 / 45 o π/4 3 + 3 3 3 60 o π/3 3 / 3 75 o 5π/ 3 + 3 3 90 o π/ 0 정의불가 60
삼각함수값 in R Radius π는 R 에서 pi 로내장되어있음. 6 -.44e-6.44 *0-0.00000000000000044 와동일 삼각함수그리기 R 을이용하여다음그래프를그리시오., < < y, < < y < <, ± π /, ± 3π / < y < 6
..7 우함수와기함수만약 f ( ) = f ( ) 이면함수 f () 는우함수라 (even function) 한다, 우함수는 y-축을기준으로반을접으면왼쪽그래프가일치하만약 f ( ) = f ( ) 이면함수 f () 는기함수라 (odd function) 정의한다. 다음함수가우함수, 기함수, 일반함수인지구별하시오. 함수형태함수형태 y = 우함수 y = cos 우함수 y = + 우함수 y = sin 기함수 y = 기함수 y = tan 기함수 y = + 아무것도아님 y = sec 우함수 함수구별 다음함수형태가우함수, 기함수, 일반함수인지보이시오. 3 () y = + () y = + (3) y = (4) y = (5) y = 확률밀도함수구별 다음함수형태가우함수, 기함수, 일반함수인지보이시오. 3 () y = + () y = + (3) y = (4) y = (5) y = 6
..8 특수한함수 구간함수 (function defined in pieces) 정의역의구간에 따라함수 형태가다른경우이를구간함수라한다. 구간함수예 for < 0 y = f () = for 0 for > 통계학에서구간함수의전형적인예제는이산형누적확률분포함수 (cumulative PDF) 이다. 오른쪽은 Wikipedia 에서얻은포아송 CDF 함수이다. + 누적분포함수 (cumulative probability density function) 확률변수 X 이고확률밀도함수가 (PDF) p() 인경우, - 으로부터임의의의 까지확률을누적시킨함수를누적확률분포함수라한다. 기호는 F() 이다. F ( ) = P( X ) 확률은음수일수없으므로증가함수 (increasing function) 이다. 연속형누적확률분포함수는임의의점까지의적분값이다. ( 적분참고 ) 63
구간함수예 다음합성함수를 R 에서그리기 if 0 y = if < y-축의값이두함수차이가있으면, ylim 옵션을사용하시오. 합성함수그리기 다음합성함수의그래플 R 에서그리시오. if 0 / y = y = if > 0 if < 0 if 0 합성함수 (Composite function) 함수 g 와 f 의합성함수는함수 g() 가함수 f () f ( g( )) 로나타낸다. fog ( ) = f ( g( )) 의투입 ( ) 으로사용되는함수이며 합성함수 g ( ) =, f ( ) = 7 일경우 f ( g( )) 함수를구하고 f (g()) 계산하시오. f ( g ( )) = g ( ) 7 = 7 f ( g ()) = 7 = 3 합성함수 g ( ) =, f ( ) = 7 일경우 g ( f ( )) 함수를구하고 g ( f () 계산하시오. g ( f ( )) = f ( ) = ( 7) g ( f ()) = ( 7) = 5 64
정수함수 (integer function) f ) = ( 는 를넘지않는최대정수를의미한다. ( 예제 ). =,.6 =, 0 = 0, 0.5 =,.7 = 3 정수함수그리기 f ( ) =, 3 < 3 함수의그래프를 R 에서그리시오...9 함수사칙연산 함수간사칙연산은숫자사칙연산과동일하다. 함수연산 연산내용 f f ( +) g f ± g f g = +, f + g = + + o g = g o f f o g = ( + ) = ( + ) = g o f g f g f =, ( + ) f f ( + ) =, 0 g g f ( g( )) f ( g ( )) = ( + ) g ( f ( )) g ( f ( )) = ( + ) 함수연산 () f ( ) = +, g( ) = 일때다음을구하시오. f (g(0)) g ( f (0)) 3 f (g()) 4 g ( f ()) () f ( ) = 4, g ( ) = + 일경우다음을구하시오. f (g(0)) g ( f (0)) 3 f ( f ()) g (g()) 65
y =, 을그리시오. (3) 함수 for - 3 3 (4) 다음마술을함수로나타내보시오. 마음으로숫자 () 를생각하시오. 그숫자에 5 를더하고 를곱하시오. 결과에 6 을빼고 로나눈후 을다시빼시오. 이제숫자를말하시오. 이마술에서숫자를어떻게맞출수있을까? (5) f () 기함수, f () 우함수일경우 () 두함수의곱은어떤함수일까? () 두함수의합은? (6) f () 기함수, f () 기함수일경우 () 두함수의곱은어떤함수일까? () 두함수의합은?.3 절대값 absolute value.3. 개념 숫자 의절대값 는 (absolute value of ) 다음과같이정의된다. 즉, 결과는양의값이다. if 0 = if < 0 다음은절대값계산의예제이다. () 3 = 3 () 0 = 0 (3) = (4).5 =. 5 3 = 7 의해를구하시오. 3 = ± 7 은방정식 3 = 7 과 3 = 7 의해를구하는것이다. = 5, = 절대값 + 절대값수식 () a = a () ab = a b (3) a / b = a / b 절대값수식 66
() sin = sin () 0 = ( + 5) = + 5 (3) 3 / = 3 /.3. 삼각부등식 다음을삼각부등식 (triangle inequality) 이라한다. a + b a + b [ 참고 ] a 와 b 의부호가다르면 < 이성립하고그렇지않으면 = 이성립한다. 삼각부등식 () 3 + 5 = = 3 + 5 = 8 () 3 + 5 = 8 = 3 + 5 = 8 (3) 3 5 = 8 = 8 = 3 + 5 = 8 [ 참고 ] a b = b a ( 증명 ) a b = ( b a) = b a = b a.3.3 절대값과두점사이의거리 y y 피타고라스정리 (Pythagorean Theorem) 에의해두점 d = ( y 이다. ) + ( y ) P, Q 사이의거리는 삼각부등식 두점 P(,), Q(3,4) 의거리? 67
(3 ( )) + (4 ) = 6 + 4 = 0 = 5.3.4 절대값과구간 만약 D 가양수이면다음이성립한다. () a < D D < a < D, a D D a D () a > D a > D, a < D, a D a D, a D 삼각부등식 다음부등식을 (inequality) 만족하는 값을구하시오. () 5 < 9 9 < 5 < 9 9 + 5 < < 9 + 5 4 < < 4 (), 3/, 3/ 3 3 3 (3) 5 < < 5 < 6 < < 4 6 > > 4 3 > > / 3 < < /.3.5 부등식성질 () a < b a + c < b + c () a < b a c < b c (3) a < b and c > 0 ac < bc (4) a < b and c > 0 a / c < b / c (5) a < b b < a (6) a < b / a > / b ( 단 a, b 의부호동일 ) 부등식성질 () 다음방정식의해를구하시오. s s = + = 9 () 다음부등식에서 에대한구간을구하시오. + 3 < 3 3 7 68