Microsoft Word - Chapter4.doc

Size: px
Start display at page:

Download "Microsoft Word - Chapter4.doc"

Transcription

1 CHAPTER 4. SAS 함수 SAS는변수에대한함수값계산이나계산에필요한함수가내장되어있다. 수학적계산을위한절대값, 제곱근과승 (power), 로그, 지수함수, 통계계산을위한평균, 분산, CV 등많은함수들이있다. 이함수를사용하는방법은다음과같다. 수식처럼오른쪽함수결과가왼쪽변수에저장된다. 함수는변수의각관측치에적용되므로결과는변수의관측치수만큼계산된다. 즉함수의계산은데이터에서행으로이루어진다. 변수이름 = 함수이름 ( 변수, 다른함수, 숫자등 ) 변수 X의자연로그 (natural LOG) 값이변수 Y에저장 변수이름 = 함수이름 ( 변수, 변수, ) 변수 X, Z, W의합이변수 Y에저장 변수이름 = 함수이름 (of 연속된변수이름 ) 변수 X, X,, X0 0개변수의평균이변수 Y에저장 PROC MEAMS 사용하면변수의평균, 표준편차등을얻을수있는데이는 MEAN 함수와달리설정된변수에대해통계값이출력되게된다. PROC 단계는데이터의열 ( 변수 ) 에대한계산결과를얻는다.

2 0 Chapter 4. SAS 함수 4. 맛보기 다음프로그램을실행해결과를보자. 각함수의의미는다음과같다. ⑴EXP 함수는 () 안의변수관측치의지수값을구하는함수이다. ⑵RANNOR(seed) 는평균이 0이고표준편차가 인정규분포함수를따르는관측치를생성하는함수이다. SEED( 시드 ) 는값을생성할때시작하는위치를나타내는값으로 ~( 3 -) 사이의정수값이나 0을사용할수있다. 0을사용하면프로그램실행되는시각이시드값으로설정된다. 변수 ENG는평균이 90이고표준편차가 0인정규분포를따르며, 변수 MATH는평균이 80, 표준편차가 0인정규분포를따르는분포에서얻는 ( 생성, generating) 관측치변수이다. ⑶MEAN 함수는 () 에지정된변수들의평균을내는함수이다.

3 4. 함수 () 다음은수학, 통계, 연산에관련된함수를예제와함께정리한것이다. 각변수에대한기초통계량계산혹은변수들간의관계를보려면적절한 PROC을사용하며함수, 수식에의해변수생성 ( 변수명 = 함수이름 (argument)) 을할수있다. argument 부분에는변수, 숫자를사용할수있다. V, A, B,, X 등은변수이름이다. 수학계산관련함수 함수형태내용예제 ARCOS(argument) COS(argument) ARSIN(argument) SIN(argument) TAN(argument) COS의 inverse 값을계산 - argument COS 값을계산 argument 은실수나 Radian 값 SIN의 inverse 값을계산 argument 은실수나 Radian 값 SIN 값을계산 - argument TAN 값을계산, - argument V=arcos(a); V=arcos(0.3); V=cos(a); V=cos(3.459/3); V=arsin(a); V=arsin(0.3); V=sin(a); V=sin(3*3.459); V=tan(a); V=tan(); EXP( 변수명 ) 지수함수로지수값을계산한다. V=EXP(X); V=EXP(3.); SQRT( 변수명 ) LOG( 변수명 ) LOGN( 변수명 ) 제곱근값을계산한다. () 안의수는 0보다커야한다. 제곱은 x**, 세제곱근 x**3 자연로그 (natural log) 값을계산한다. Log X e = Ln(X ) 로그의밑이 n인로그값을계산한다. N=0 이면상용로그값 V=SQRT(X); V=SQRT(3.); V=LOG(X); V=LOG(3.); V=LOG(X); V=LOG(3.); V=LOG0(3.);

4 Chapter 4. SAS 함수 EXAMPLE: 수학함수사용예제 정수및절대값얻기관련함수 함수형태내용예제 ABS(argument) CEIL(argument) 절대값을계산 argument 값이상이면서가장작은정수 V=abs(-.4); V=abs(a); V=ceil(a); V=ceil(-.4); INT(argument) 정수값을출력한다. V=int(a); FLOOR(arguments) argument 값이하이면서가장큰정수 V=floor(a);

5 3 SIGN(argument) 값의부호를출력한다. 양수면, 음수면 -, 0 이면 0 의값이저장된다. V=sign(a); V=sign(name- 90); MOD( 숫자, 숫자 ) 숫자 을숫자 로나눈나머지계산. V=mod(4,3); EXAMPLE: 수학함수사용예제 통계계산관련함수 함수형태내용예제 FACT(n) COMB(n,r) PERM(n,r) Factorial 값을구한다. () 안은반드시정수값이어야한다. n! combination 값을구한다. n, r 은 정수이어야한다. n! ncr = r!( n r)! Permutation 값을구한다. n, r 은 정수이어야한다. n! n Pr = ( n r)! V=FACT(a); V=FACT(6); V=COMB(5,); V=COMB(a,b); V=PERM(5,); V=PERM(a,b);

6 4 Chapter 4. SAS 함수 MAX(arguments) 최대값을구한다. V=max(x,x,x3,x4); 연속일때 V=max(of x-x4); 이형식은아래함수에도적용 V=max(a,b,c); V=max(,5,-,7); MIN(arguments) 변수관측치중최소값을구한다. V=min(a,b,c); N(arguments) 변수관측치개수 ( 결측치제외 ) 계산 V=n(a,b,c); SUM(arguments) 변수관측치들의합을구한다. V=sum(x,y,z); MEAN(arguments) 변수관측치들의평균을구한다. V=mean(x,y,z); RANGE(arguments) 변수관측치들의범위를구한다. V=range(x,y,z); STD(arguments) 변수관측치들의표준편차를구한다. V=std(x,y,z); STDERR(arguments) 변수관측치들의표준오차를구한다. V=stderr(x,y,z); VAR(arguments) 변수관측치들의분산을구한다. V=var(x,y,z); [ 참고 ] 변동계수와표준오차 s 변동계수 : CV = 00(%) 집단간분산을비교하기위하여사용되는통계량 x 표준오차 : s / n 표준편차를표본개수의제곱근으로나눈값으로표본평균의표준편차

7 5 [ 참고 ] E3 의의미는 3 0 이다. 그러므로 3.55E4=355,000,000,000,000이다. 차분 (difference) 관련함수 함수형태내용예제 LAG( 변수명 ) 이전관측치를가져온다. V=LAG(X); LAGN( 변수명 ) n 번째이전관측치를가져온다. V=LAG(X); V=DIF( 변수명 ) V=DIFN( 변수명 ) 현재관측치와이전관측치의차이를구한다. 그러므로 DIF=X-LAG(X); 이다. 현재관측치와이전관측치의차이를구한다. 그러므로 DIFN=X-LAGN(X); 이다. V=DIF(X); V=DIF(X);

8 6 Chapter 4. SAS 함수 관측치변환함수 함수형태내용예제 LENGTH( 변수명 ); 문자변수문자열 (string) 길이 출력한다. LEFT( 변수명 ); 문자열의왼쪽정렬한다. RIGHT( 변수명 ); 문자열의오른쪽정렬한다. SUBSTR(argument, 문자열관측치의일부를얻는데 시작, 길이 ); 사용된다. 시작은문자열시작위치, 길이는문자개수를지정한다. TRIM( 변수명 ); 문자열뒤쪽공백없앤다. UPCASE( 변수명 ); 문자열을대문자로변환한다. V=length(z); V=length( se ); V=left(z); V=left( se ); V=right(z); V=right( se ); V=substr(z,,3); V=substr( hi,,); V=trim(z); V=trim( hi ); V=upcase(z); V=upcase ( hi ); 문자변수지정하는 $ 뒤에 - 의의미는첫열부터 번째열까지변수 X 의관측치로 읽어들이라는의미이다. 프로그램에서 3 번째행부터는프로그램이길어지는것을피하기

9 7 위하여두개문장을한라인에적었다. 한라인에적었더라도세미콜론으로문장의끝을 알렸으므로각각다른문장으로실행된다. EXAMPLE: 함수사용하기 IQ.TXT 데이터를 SAS 데이터 ONE으로만들고, IQ, IQ, IQ3 중가장높은값을 IQ_MAX, 가장낮은값을 IQ_MIN으로만들어보자. 그리고평균은 IQ_MEAN으로하고, 함수를사용하여자료를만들어보자. SAS 데이터이름은 TWO로하자.

10 8 Chapter 4. SAS 함수 EXAMPLE: 함수사용하기 () SAS 데이터 TWO에서남자 ( 여자 ) 는 IQ_MEAN가 00(0) 보다크면, 작으면 -, 같으면 0이되는변수 W를만들고, SAS 데이터이름은 THREE로하자. EXAMPLE: 함수사용하기 (3)

11 9 SAS 데이터 ONE 에서 IQ 이 4 의배수이면 0 그렇지않으면나머지가되는변수 V 를만 들고, SAS 데이터이름은 FOUR 로하자. EXAMPLE: 함수사용하기 (4) 확률분포함수그리기 평균이 0 이고분산이 인정규분포확률분포함수 (probability density function) 를그려보자. ( x μ) ( ) σ f x = πσ exp, < x < 확률분포함수의 X-축은확률변수 ( X ) 가가질수있는값이며 Y-축은확률 ( f (x) ) 이다. 이론적으로는정규분포를따르는확률변수가 (, ) 사이지만실제데이터는 μ ± 3σ 안에대부분다포함된다. ( 경험적규칙 : empirical rule) 여기서 μ =, σ = 이므로 (-4.4, 4.4) 이다. 그래서그래프를위한최소값 -4.5, 최대값 4.5을사용하였다. DO문은 X-축의값을설정하기사용하였고증가분 BY는그래프를 smooth하게그리기위하여 0.0로작게잡았다. 그래서 X=-4.5, -4.49, -.48,, 4.49, 4.5 이런값들이연속적으로

12 30 Chapter 4. SAS 함수 사용된다. 그러므로관측치개수는 90개이다. X-축구간을매우작게잡았기때문에 PROC GPLOT에서 I(interpolation) 옵션을 JOIN( 점들을연결 ) 으로사용해도그래프가 smooth 하다. 만약 X-축의구간을 0.5로잡았으면 I=SPLINE을사용하면그래프가곡선화된다. 컴퓨터속도의발달로관측치가많아도실행되므로구간을작게설정해도된다. TITLE 문은그래프의제목을붙이기위해사용되었으며 H 는글자크기 (height) 를설정한 것이고 F(font) 옵션은글꼴을설정한옵션이다. PROC GPLOT 에서 SYMBOL 문장은그래프 의점들을정의하는것으로 I 는점들을연결하는옵션이고 V(value) 는점들의형태를설정

13 3 (triangle, dot, square, a, o 등을사용할수있다 ) 하는옵션이다. 자세한내용은 5장을참고하기바란다. 만약위프로그램에서 0.0대신 0.5를사용하였다면어떻게될까? 점들이너무떨어져있어직선연결하면 smooth하지못하다. 이런경우 I=SPLINE을사용하면이런문제는해결된다.

14 3 Chapter 4. SAS 함수 EXAMPLE: 함수사용하기 (4) 모수 (parameter) ( α, β ) = (4,3) 인감마분포의확률밀도함수를그려보자. α x / β f ( x) = x e, 0 < x < α Γ( α) β 모수는확률분포함수의형태를결정하는것으로모수값을알면확률밀도함수를그릴수 있다. 정규확률분포함수의모수는평균 ( μ ) 과표준편차 ( σ ) 이다. 감마분포는우측으로치우 친 (skewed to the right, positive skewed) 형태이므로평균 αβ =, 표준편차 αβ 6 이나 최대값을 30 대신 40 을사용하였다. =

15 33 EXAMPLE: 함수사용하기 (5) 이항분포그리기 이산형확률밀도함수인이항분포를함수를이용하여그려보자. 모수가 ( n = 0, p = 0.) 인이항분포확률분포함수는다음과같다. n x p( x) = p q x n x 0 = 0. x x x, x = 0,,,...,0 Combination 계산을위하여 COMB 함수를사용하였다. 모수 ( n = 0, p = 0.) 인이항분포를따르는이상형확률변수가가질수있는값이 0,,, 0이므로이를 DO문에초기값과말기값으로설정하였다. 증가분은디폴트인 (BY ) 을사용하였다. 이산형의확률은막대높이로표시되므로 I 옵션에는 NEEDLE 옵션을사용하였다. CI는막대안의색깔을지정하는옵션이고 W(weight) 는막대의넓이를설정하는옵션이다.

16 34 Chapter 4. SAS 함수 4.3 함수 확률밀도함수의확률값을얻거나그래프를그리기위하여 4.절의방법을사용할수있으나함수형태를적어주는것이번거롭다. 그래서통계소프트웨어인 SAS는통계학에서가장많이사용하는확률분포함수 (PDF), 누적확률분포함수 (CDF), 백분위 (percentile), 그리고임의의분포를따르는확률변수를생성 (generating) 하는방법을함수화하여내장하고있다.

17 확률밀도함수 확률밀도함수 (PDF, probability density function) 는 input(x- 축 ) 은확률변수가가지는값이고, output( f (x), Y-축 ) 은확률인함수이다. 그리고확률이갖추어야할조건 () 확률 f (x) 상 0보다크고 () 확률변수전영역의 f (x) 적분값은 이다. ( 모든확률을더하면 이다 ) 은항 이처럼 X-축은확률변수이고 Y-축은확률 f (x) ( 이산형일경우에는 p (x) ) 는확률밀도함 수이다. 화살표의높이는확률이다. 이산형인경우확률변수한값에대해확률이존재하나 연속형인경우는 0 이다. 이산형확률밀도함수인경우확률은높이이고연속형확률밀도함 수의확률은면적이다. 확률이므로짙은부분면적의합 ( 전체확률의합 ) 은 이다. 확률변수 X 가가지는값의범위는 ( a, b) 이다. SAS 에서확률밀도함수를얻는함수는 PDF 이다. PDF( 분포이름, x, arguments) X 는확률변수가가질수있는영역 ( 구간 ) 안에임의의값이고 argument 는확률변수의모 수들이다. 모수는확률변수함수 f (x) μ, 분산 σ 이다. 지수분포의모수는평균인 β 이다. 을결정하는값으로정규분포확률밀도함수는평균과 이산형확률밀도함수 분포확률분포함수모수 SAS 함수 베르누이분포 (Bernoulli) p( x) = p x x q x = 0, 평균 : p 분산 : pq p PDF('BERNOULLI',x,p)

18 36 Chapter 4. SAS 함수 이항분포 (Binomial) n x n x p( x) = p q x x = 0,,,..., n 평균 : np 분산 : npq n, p PDF('BINOMIAL',x,p,n) 기하분포 (Geometric) 평균 : x p( x) = q p x =,,... q / p 분산 : q / p p PDF('GEOMETRIC',x,p) 음이항분포 (Negative binomial) x r x r p( x) = p q p r x = r, r +,... 평균 : rq / p 분산 : rq / p r, p PDF('NEGB',x,p,r) λ x e λ p( x) = 포아송분포 x! (Poisson) x = 0,,... 평균 : λ 분산 : λ λ PDF('POISSON',x, λ ) 초기하분포 (Hypergeometric) K M K x n x p( x) = M n M =,..., K = 0,,,..., M n =,,..., M ( M, K, n) PDF('HYPER',x,M,K,n) K 평균 : n ( ) 분산 : 복잡 M 연속형확률밀도함수 분포확률분포함수모수 SAS 함수 정규분포 (Normal) ( x μ) f ( x) = exp σ πσ < x < 평균 : μ, 분산 : σ μ, σ PDF('NORMAL',x, μ,σ )

19 37 감마분포 (Gamma) 베타분포 (Beta) 지수분포 (Exponential) 카이제곱분포 (Chisquared) T-분포 α x / β f ( x) = x e α Γ( α ) β 0 < x < 평균 : αβ, 분산 : f ( x) = x B( a, b) 분산 : a ( x) αβ b 평균 : a /( a + b) ab ( a + b) ( a + b + ) α = 인감마분포. x / β f ( x) = e β 평균 : β, 분산 : β 0 < x < α = r /, β = 감마분포. f ( x) = Γ( r / ) r / x 평균 : r, 분산 : r / r / x / T = W / V / r, 0 < x < f (x) 복잡, 자유도 r W ~ Normal (0,), V ~ χ ( e r 평균 : 0, 분산 : r /( r ) ) α, β PDF('GAMMA',x,α, β ) a, b PDF('BETA',x,a,b) β PDF('EXPO',x, β ) 자유도 r 자유도 PDF('CHISQ',x,r) r PDF('T',x, 자유도 ) F- 분포 / U r F =, 0 < x < V / r f (x) 복잡, 자유도 r, ) ( r W ~ V ~ χ ( r ), V ~ χ ( r ) 평균 : n /( n ), 분산 : 복잡 분자, 분모자유도 ( r, r ) PDF('F',x, 분자 자유도, 분모자유도 ) 균일분포 (Uniform) f ( x) = b a, a x b 평균 : ( a + b) /, 분산 : ( b a) / 영역최소값, 최대값 PDF('UNIFORM',x,a,b)

20 38 Chapter 4. SAS 함수 EXAMPLE: PDF 함수사용하기, 정규분포 ( 평균 =0, 분산 =) 평균이 0이고분산이 인정규분포확률분포함수 (probability density function) 를그려보자. 앞에서는함수식을이용하였지만이제 PDF 함수를이용해보자. ( x μ) ( x) = σ f exp, < x < πσ

21 39 EXAMPLE: PDF 함수사용하기 () 모수 (parameter) ( α, β ) = (4,3) 인감마분포의확률밀도함수와평균이 이고표준편차가 6인정규분포의확률밀도함수그래프를하나의그래프에그려보자. 정규분포는좌우대칭인반면감마분포는우측으로치우친형태를갖는다. 지금그리려는두분포의평균과분산은동일하다. SYMBOL, SYMBOL는그려지는그래프에대한설정이다. C(color) 는선의색을 L은라인의속성을나타내는것으로 L=( 디폴트 ) 은연속, 값이커질수록선이많이끊어진다. X-축의값을 단위로얻었으므로 SPLINE을사용하여선들을매끄럽게 (smooth) 하였다. OVERLAY 옵션은두개이상의그래프를하나의산점도에그리라는옵션이다.

22 40 Chapter 4. SAS 함수 EXAMPLE: PDF 함수사용하기 (3) 이항분포그리기 이항분포 ( n = 0, p = 0.) 인확률분포함수를 PDF 함수를이용하여그려보자.

23 4 0 x 0 x P( x) = x , x = 0,,,..., 0 막대의색깔은빨간, 막대의넓이는 로설정하였다. 막대높이 ( 확률 ) 는이전것과동일하다. 그래프에관련된모든옵션을 reset하려면 GOPTIONS; 문장을한번사용해주면된다. 제목을 RESET하는 TITLE; 문장과사용방법은동일하다.

24 4 Chapter 4. SAS 함수 EXAMPLE: PDF 함수사용하기 (4) 포아송분포그리기 λ = 인포아송분포의확률밀도함수를그리시오. X- 축최대값을얼마로설정하는것이 좋은가? 실제이론적으로는무한대 ( ) 의값을갖지만평균이 인경우 0 이상이면확률 이 0 이므로 0 까지만고려하였다.

25 43 EXAMPLE: PDF 함수사용하기 (5) 이항분포의포아송분포근사 이항분포의 n이크고 p가매우작은경우이항분포 ( n, p) 는모수 λ = np 인포아송분포 에근사한다. 이를 PDF 함수를이용하여살펴보기로하자. 모수 ( n = 30, p = 0.) 인이항분 포 (cyan 색, 굵은막대 ) 와모수 λ = 3 인포아송분포 (blue 색, 얇은막대 ) 를한그래프에그 렸다. GOPTIONS; 문장은모든그래프관련설정을 RESET 하는문장이다.

26 44 Chapter 4. SAS 함수 EXAMPLE: PDF 함수사용하기 (6) 이항분포의정규분포근사 n이큰경우모수 ( n, p) 인이항분포는평균 np, 분산이 npq 인정규분포에근사한다. 모수 λ = np 인포아송분포에근사한다. 이를 PDF 함수를이용하여살펴보기로하자. 모수 ( n = 30, p = 0.) 인이항분포와평균 3, 분산.7인정규분포를함께그려보자.

27 45 EXAMPLE: PDF 함수사용하기 (7) 정규분포와 T- 분포 표준정규분포 ( 평균 =0, 분산 =), 자유도 0인 t분포 ( 평균 =0, 분산 =0/8=.5), 자유도 50인 t-분포 ( 평균 =0, 분산 =.04) 하나의그래프에그려보자. t-분포는표준정규분포처럼좌우대

28 46 Chapter 4. SAS 함수 칭이나분산 ( 자유도가 n인경우 n /( n ) ) 이약간크므로표준정규분포에비해좌우꼬리부분이두껍다. T-분포의자유도가커질수록표준정규분포에근사한다.

29 누적확률분포함수 누적분포함수 (CDF, Cumulative Density Function, 분포함수라한다 ) 는확률분포함수의가장 왼쪽 으로부터임의의점 x 까지적분한값을의미한다. 초록색부분의면적이 F(x) 다. F ( ) = 0, F( ) = 이다. 누적분포함수값을얻으려면확률분포함수를적분하여야한 다. SAS 는이를 CDF 함수로내장하고있다. CDF 함수는사용방법, 옵션등이 PDF 함수와 동일하다. 이 EXAMPLE: CDF 함수사용하기, 지수분포의누적분포함수 평균이 β 인지수분포의누적분포함수는 지수분포의누적분포함수를그려보자. x t / β x / β F( x) = e dt = e 이다. 평균이 인 β

30 48 Chapter 4. SAS 함수 다음과같이 CDF 함수를이용하여동일한결과를얻는다. EXAMPLE: CDF 함수사용하기 () 포아송분포 모수 λ = 인포아송분포의확률분포함수와누적분포함수하나의그래프에그리시오. CDF 그릴때는 Interpolate 옵션을 STEP으로하면된다. X 값이증가할때마다막대의높이만큼증가한다. 즉 X=의누적값은 0, 의막대높이합이다.

31 49 EXAMPLE: CDF 함수사용하기 (3) 정규분포 평균이 5이고표준편차가 인정규분포확률분포함수와누적확률분포함수를하나의그래프에그리시오. 한동안 CDF 함수가 PDF 함수보다작다? 맞나? 그렇다. 누적확률분포함수

32 50 Chapter 4. SAS 함수 는거기까지의확률밀도함수면적임을상기하기바란다. 누적확률밀도함수에대한 SAS 함수로 CDF 대신다음을사용하기도한다. 그러나 CDF 를사용하는것이정형화된형태라편리하다. 분포 포아송분포 누적분포함수 POISSON

33 5 베타분포 이항분포 카이제곱분포 PROBBETA PROBBNML PROBCHI F- 분포 PROBF 감마분포초기하분포음이항분포정규분포 PROBGAM PROBHYPR PROBNEGB PROBNORM T- 분포 PROBT 백분위 데이터를크기순으로배열했을때데이터의 p % 가어떤임의의값보다작고 ( 00 p)% 가그값보다큰경우그임의의값을 p th 백분위 (percentile) 값이라한다. 50% 백분위값을중앙값 (median), 5% 백분위값을일사분위 (first quartile), 75% 백분위값 을삼사분위 (third quartile) 이라한다. 중앙값을이사분위 (second quartile) 이라고도한다. 데이터의백분위값을계산하기위하여데이터의순서통계량 (order statistics) 을구해야 한다. 관측치를크기순으로정렬한후제일작은값부터 x( ), x(), K, x( n) 으로표기하고이를 순서통계량 (order statistics) 이라한다. 순서통계량 : x( ) x()... x( n) 최소값 (min): x (), 최대값 (max): x (n) 범위 (range): x( n ) x() 백분위값이나사분위값을구하려면자료의깊이 (depth) 개념을이용하면편리하다. (Tukey 가제안 ) 관측치를크기순으로정렬한후각양쪽끝에서 부터번호를매겨그번 호를자료의깊이라정의한다. 즉최대값, 최소값의깊이는각 이다. 중앙값의깊이는 ( n +) / 이고사분위깊이는 q=( 중앙값의깊이의정수함수 +)/ 이다. 즉중앙값은 x(( n+) / ) 이고일사분위는 x(q) 이고삼사분위는 x( n q+) 이다. 표본의크기 6 인표본관측치 (, 4, 6, 5, 6, ) 의중앙값길이는 (6+)/=3.5 이고, 사분위 길이는 ([3.5]+)/=(3+)/=이다. 그러므로중앙값은 x (3.5) = x 이고삼사분위는 x 6 이다. ( ) = ( 6 + ) = (4+5)/=4.5 이고일사분위는

34 5 Chapter 4. SAS 함수 확률분포함수에서백분위값의개념을알아보자. 초록색부분의확률이 p 인 x 값을찾으 면이것이 p % 백분위값이다. 표준정규분포인경우 95% 백분위값을찾으면.645 이다. 이처럼백분위는누적분포함수의역함수형태가된다. 일반적으로이산형확률밀도함수의경우정확한 p % 백분위값을구할수없다. 예를들어모수가 ( n = 0, p = 0.) 인경우 95% 백분위값을구해보자. 95% 백분위값은 3과 4 사이의값이다? 이처럼이산형확률분포함수의경우백분위값을구할수없으므로 SAS도함수를제공하지않고있다. 연속형확률분포함수의경우확률변수이름첫글자와 INV(inverse, 이이름을사용한이 유는백분위값과누적분포함수는역함수관계이므로 ) 를결합하여함수로내장하고있다. 단표준정규분포의경우에는 PROBIT 함수로되어있다. 분포함수 SAS 함수사용예제

35 53 표준정규분포 (Standard Normal) 감마분포 (Gamma) PROBIT( 확률 ) 평균 μ 이고표준편차 σ 인정규분포의 백분위값을어떻게구하나? z = x μ 이므로 σ μ + PROBIT( 확률 )* σ GAMINV( 확률,α ) 만약 GAMINV( 확률,α, β ) 인경우에는 β * GAMINV( 확률,α ) X Q X ~ Gamma( α,) => ~ Gamma( α, β ) β 지수분포 (Exponential) β * GAMINV( 확률, ) Q X ~ Gamma( α =, β ) = Exppnential( β ) 카이제곱 분포 (Chi-squared) CINV( 확률, 자유도 ) T- 분포 TINV( 확률, 자유도 ) F- 분포 FINV( 확률, 분자자유도, 분모자유도 )

36 54 Chapter 4. SAS 함수 EXAMPLE: 백분위함수사용하기, 표준정규분포 표준정규분포의경우예를들어보자. x =. 96 까지누적분포함수값 ( 확률 ) 을구하려면다음프로그램을실행하면된다. x.96 exp π dx =? 누적확률이 0.975( 즉 97.5% 백분위 ) 인확률변수값을구하려면다음과같이하면된다. x? exp π dx = 백분위함수의대표적인사용예제는통계적가설검정을위한검정통계량으로부터유의확률을계산할때이다. 전체데이터를가진경우데이터분석은 PROC 단계를이용하여관련통계량과유의확률을모두얻을수있으나통계학원론에서자주등장하는수작업문제는원데이터를주는것이아니라필요한통계량만주고가설검정하라는경우함수가사용된다.

37 55 EXAMPLE: PROC 와함수이용구별하기 대학생들의평균 IQ 0이라고한다. 우리대학학생들의 IQ가전체대학생평균 IQ와같은지알아보기위하여 0명을무작위추출하여 IQ를측정하였다. 학생들의 IQ 분포는정규분포를따른다고가정하자. 표본데이터 : 0, 5, 30, 5, 35, 0, 0, 5, 30, 40 귀무가설 : μ = 0, 대립가설 μ 0, μ 는모집단평균 검정통계량 =.5, 유의확률 (p-값) 은 0.05이므로귀무가설을기각하지못한다. 우리대학학생들의 IQ는 0과같다고할수있다. ( 자세한내용은 4.4절참고 ) PROC TTEST(PROC 단계 ) 를이용하면검정통계량과유의확률을얻는다. 원데이터가주어진것이아니라표본평균 6, 표본표준편차 8.433만주어졌다면가설검정을위하여 PROC 단계를사용할수없다. 수작업에의해검정통계량을계산하고확률분포표에의해주어진유의수준에대응하는임계치를찾아비교하여귀무가설채택여부를결정한다. 수작업계산대신함수를이용하여통계량과유의확률을구할수있다. 이는다음절의예제를참고하기바란다.

38 56 Chapter 4. SAS 함수 4.4 통계적가설검정 4.4. 기본개념 모수와통계량 모집단은알고자하는대상이되는집단의미한다. 모집단을통계학에서표현할때는확 률분포함수 f ( x; θ ) 으로정의한다. θ 는모수이다. 그러므로모집단에서우리가알지못하 는것은확률분포함수 f 와모집단특성의요약값인모수 θ 이다. 그러나실제모집단의 확률밀도함수 f (x) 을추정하기는불가능할뿐아리나실제관심의대상은모수이다. 즉, 우리의관심은모수 (parameter) 값에대한정보이다. 이것들을표본데이터를이용하여추 정하게된다. 표본데이터로부터계산된값들을통계량 (statistic) 이라한다. 표본으로부터계산된통계량이모수추정에사용되면추정치 (estimate) 라하고가설검정 에사용되면검정통계량 (test statistic) 이라한다. 추정 (estimation) 표본데이터 ( x, x,..., xn) 으로부터계산된통계량을이용하여모수의값에대한정보를얻는것을추정치를얻는다고한다. 모수추정에는모수를하나의값으로추정하는점추정

39 57 과구간으로추정하는구간추정이있다. 모수를어떤통계량으로추정하는것이좋은가? 통계학에서는좋은추정치를 Best Linear Unbiased Estimator( 혹은최소분산추정치 Minimum Variance Unbiased Estimator) 라한다. 모수중가장많은관심의대상은모집단평균 (μ), 모집단분산 ( σ ), 모집단비율 ( p) 이 x 다. 이에대한좋은점추정치 (MVUE) 는표본평균 x = i ( x X ), 표본분산 s = i, 그 n n 리고표본비율 p ˆ = # of성공/ n 이다. 점추정치와점추정치의확률분포함수를이용하여모수에대한구간추정치 (interval estimation) 를얻을수있다. 다음그림은점추정치와구간추정치를나타낸것이다. 확률분포함수는점추정치 ( 통계량 ) 의확률분포함수이다. 모평균에대한 MVUE는표본평균이다. 대표본인경우표본평균의정규분포에근사하므로이를이용하여신뢰구간을구한다. 가설검정 통계적가설검정은 () 서로배반인두개의가설 ( 귀무가설, 대립가설 ) 을설정하고 () 표본데이터로부터적절한검정통계량값을계산하고 (3) 이를이용하여두가설중하나를선택하는순서로진행된다. 예를들어모집단의평균에관심이있다고하자. 모수는 θ = μ 이다. 모집단평균에대한 MVUE는표본평균 x 이다. 그러므로 ˆ θ = x 는모수 μ 의점추정치 (point estimate) 이다. 그 x μ 리고우리는 ~ tn ( ) 사실을알고있으므로모평균에대한 00( α)% 신뢰구간을 s/ n 구하면 s x ± t( n ; α / ) 이다. n T x μ 0 = 는통계적가설 H0 : μ = μ0 에대한검정을위 s / n 해사용되는검정통계량이다.

40 58 Chapter 4. SAS 함수 통계적가설 (statistical hypothesis) 통계적가설검정이란 서로배반인두개의통계적가설 ( 귀무가설, 대립가설 ) 을설정하고 적절한검정통계량값을계산하고 3이를이용하여두가설중하나를선택한다. 연구하고자하는내용을표본데이터로부터계산한통계량을이용하여사실여부를판단할수있도록설정한내용을통계적가설이라한다. 가설종류 () 귀무가설 (Null Hypothesis) 원래그대로의상태 (state quo) 를의미하며표본에의해거짓임이판명되지않으면기각되지않는다. 귀무가설은상태그대로를의미하여 null=nothing 이라이름붙였으며 ~ 같다, 영향을미치지않는다, 차이가없다 식으로정의된다. 귀무가설은모수에대한하나의값을설정한다. () 대립가설 (Alternative Hypothesis) 귀무가설과대립되는가설로얻고자희망하는모수의조건이나변수들간의관계에대한문장 (statement) 으로연구가설 (research hypothesis) 이라한다. 보다크다, 같지않다, 영향을미친다 등으로설정된다. 연구자가원하는내용이대립가설에있으므로이를연구가설 (research hypothesis) 이라한다. 대립가설은모수에대한영역으로설정된다. 가설종류 () 대립가설은형태에따라단측가설 (one-sided) 과양측 (two-sided) 가설로나눈다. 단측가 설은모수에대한한쪽영역만설정한것이고양측검정에서는귀무가설에설정한모수 이외영역이설정된다. 양측검정은 ~ 와같지않다, 단측검정은 < 혹은 > 으로표현된다. 검정오류 귀무가설이사실인데귀무가설을기각할 ( 대립가설채택 ) 확률을 종오류 (type I error) 라

41 59 하고귀무가설이거짓인데도 ( 대립가설이사실 ) 귀무가설을기각하지않을 ( 대립가설채택 ) 확률을 종오류 (type II error) 라한다. 검정결과 실제상황 귀무가설진실 대립가설진실 귀무가설기각 종오류 α 옳은판단 귀무가설채택옳은판단 종오류 β 유의수준 (significant level) 가설검정방법중두오류를모두줄일수있는방법은존재하지않으므로두오류중 하나를고정하고다른오류를줄일수있는방법을찾는다. 어느오류를고정할것인가? 우리의관심은대립가설에있으므로귀무가설을기각할확률을고정하고 ( 사용될통계적 방법은이정도는희생은감수한다.) 대립가설이사실인경우대립가설을채택할검정력 ( β ) 을최대화할수있는통계적가설검정방법을찾는다. 가설검정을위하여설정한 종오류를유의확률이라하며일반적으로 0%, 5%( 가장일반적 ), % 를사용한다. 검정통계량 (Test Statistics), 기각역, 기각치 (Reject region and Value) 귀무가설의사실여부를판단하기위하여사용되는통계량을검정통계량이라한다. 검정통계량은표본데이터로부터계산되면가설검정하려면검정통계량의분포를알아야한다. 검정통계량의분포는귀무가설이진실이라가정하에구하게된다. 이래그림에서귀무가설진실하에서구한분포이므로양쪽극단 ( 초록부분 ) 도일어날수있으나이런극단이발생하면귀무가설을기각한다. 그러므로검정오류이다. 이것을 종오류라하고미리설정된 종오류를유의수준이라한다. 설정된유의수준하에서귀무가설을기각하게되는검정통계량값들의영역 ( 초록부분 ) 을기각역 ( 짙은직선영역 ) 이라하고영역의시작점을기각치혹은임계치 (critical region) 라한다. 대립가설양측가설이면임계영역이양쪽영역이고양쪽초록부분의합이유의수준이다.

42 60 Chapter 4. SAS 함수 신뢰구간 (Confidence interval) 임의의모수에대해두통계량 ( 하한 (L), 상한 (U)) 이존재하며다음과같이쓸수있다면 ( L, U ) 을모수 (θ ) 에대한 00( α)% 신뢰구간이라한다. P ( L( x, x,... xn) < θ < U ( x, x,... xn)) = α 00( α)% 을신뢰수준 (confidence level), L( x, x,... xn) 을하한 (lower bound), U ( x, x,... xn) 을상한 (upper bound) 라한다. 95% 신뢰구간의실제의미는모수 ( 모집단인장강도평균 ) 가신뢰구간에포함될가능성 ( 확률 ) 이 95% 를의미하는것이아니다. 모집단으로부터표본의크기 0인표본을뽑아신뢰구간을구하고, 또표본의크기 0의표본을뽑아신뢰구간을구하고, 이런과정을 00번반복하면그중 95개의신뢰구간은모수를포함하고있다는것이다. 00(-α)% 신뢰구간과유의수준 α 인가설검정 ( 양측검정 ) 일대일대응관계가존재한다. 95% 신뢰구간에포함되지않은 ( 포함되는 ) 모수값이유의

43 6 수준 5% 하에서검정되는귀무가설에설정되면그귀무가설은기각 ( 채택 ) 된다. 이관계를 그림으로나타내면다음과같다. 모수 귀무가설에설정된모수값이이 구간에포함되면유의수준 α 에서 귀무가설은채택된다. 00(-α)% 신뢰구간 검정통계량 표본으로부터계산된검정통계량값 유의확률 (significant probability), p- 값 (p-value) 귀무가설을기각할최소의유의확률을의미한다. 즉귀무가설을기각하려면유의수준을 p-값으로설정하면된다. p-값은확률로검정통계량값이계산되었을때이값보다클확률 ( 극한상황발생 ) 을의미한다. 그러므로 p-값이 0.05보다크다면귀무가설을기각할수없고작다면귀무가설을기각한다. P-값이 0.06이라면유의수준을 0.06으로해야귀무가설을기각할수있다는것이므로유의수준이 0.05(5%) 이면귀무가설이기각되지않는다. 다음그림은유의확률을그림으로나타낸것이다. 그림에서초록부분은대립가설이 > 귀무가설에설정된모수값 인단측가설의경우유의확률이다. 대립가설이 < 귀무가설에서설정된모수값 형태이면왼쪽꼬리부분이유의확률이다. 대립가설이양측가설일경우에는한쪽에서얻어진유의확률 ( 초록색부분 ) 을 배하면된다.

44 6 Chapter 4. SAS 함수 유의확률이설정된유의수준하에서기각역을제시하는것보다다많은정보를우리에게 주므로통계소프트웨어는검정통계량과유의확률 ( 대립가설이양측가설인경우 ) 을출력한다 공식정리 단일집단모평균추론 H 0 : μ = μ0 x μ0 검정통계량 : T = ~ t( n )[ 소표본] or N(0,)[ 대표본] s / n 소표본인경우에는모집단정규분포가정이필요하다. 만약모집단이정규분포를따른다는확신이없는소표본인경우비모수방법 (Sign검정, Wilcoxon Ranks Sum) 을실시한다. 신뢰구간 : s x ± t( n ; α / ) ( 표본의크기가커지면 T-분포는정규분포에근사하므 n 로수작업시에는표본의크기가 0~30 이상인대표본의경우에는정규분포표이용한다.) 단일집단모비율추론 H 0 : p = p0 검정통계량 : T = pˆ p0 p0q0 ~ N(0,) ( 대표본 ) n 소표본인경우에는유의확률개념을이용하여가설검정한다.

45 63 신뢰구간 : n pq z p ˆ ˆ ˆ α / ± ( 대표본 ) 두집단모평균추론 0 : μ μ = H 검정통계량 : ] (0,)[ ] )[ ( ~ 0 ) ( 대표본소표본 N or n n t n n s x x T p + + = = μ μ, 통합분산 (pooled variance) ) ( ) ( + + = n n s n s n s p 소표본인경우에는두모집단정규분포가정이필요하다. 만약두모집단이정규분포를따른다는확신이없는소표본경우비모수방법 (Median 검정,. Mann-Whitney Test) 을사용하여가설검정한다. 신뢰구간 : ) / ; ( ) ( n n s n n t x x p + + ± α 두집단모비율추론 0 : p p H = 검정통계량 : ) (0, ~ ˆ ˆ ˆ ˆ 0 ) ( ˆ ˆ N n q p n q p p p p p T + = = ( 대표본 ) 신뢰구간 : / ˆ ˆ ˆ ˆ ) ˆ ˆ ( n q p n q p z p p + ± α ( 대표본 )

46 64 Chapter 4. SAS 함수 사용예제 원데이터기주어진경우에는 PROC 단계를이용하여통계량을구하거나가설검정을 할수있다. 그러나주요통계량의값만주어진경우에는함수를이용하여검정통계량과유 의확률을계산해야가설검정이가능하다. EXAMPLE: 모비율검정 ( 대표본 ) 성인의흡연비율은 0.라고한다. 우리대학학생들의흡연성인흡연비율 0.보다낮은지알아보기위하여 50명을임의추출하여 8명이흡연하고있음을알았다. 유의수준 0.05으로가설검정하고 95% 신뢰구간을구하시오. ⑴귀무가설 : 한남대학생흡연비율은 0.이다. p = 0. 대립가설 : 비율은 0.미만이다. p < 0. ⑵검정통계량 : T = *( 0.) = ~ Normal(0,) 50 대립가설이단측가설 ( 왼쪽 ) 이므로유의수준 5% 를왼쪽부분에만설정한다. 검정통계량이표준정규분포를따르므로기각치는 -.645이다. 표본으로부터계산된검정통계량 이 -.645보다작지않기때문에귀무가설은기각되지않는다. 흡연비율은 0.라할수있다.

47 65 표준정규분포 pq ˆ ˆ 0.* 0.8 ⑶신뢰구간 pˆ ± z α / = 0.6 ±.96 (0.058,0.6) 신뢰구간은대립가설이 n 50 양측인경우구하는것이므로양쪽에.5% 씩할당하게된다. 위의과정을 SAS에서함수를이용하여구하면다음과같다. ABS(T) 의의미는검정통계량을 +( 확률의우측부분고려 ) 로하기위함이다. 이는 CV( 기각치 ) 의오른쪽극한을구했기때문이다. CV는단측검정의기각치 ( 임계치 ) 를계산하기위한것이다. 검정통계량의분포가정규분포를따르므로누적확률이 0.05가되는백분위값을구하면그것이왼쪽부분기각역이된다. 양측이면우측에 0.05, 왼쪽에 0.05 배정하면된다. 검정통계량 T와기각역 RC가비교하여 T가 RC보다작으면 ( 귀무가설의모수값에서멀어짐 ) 귀무가설을기각하고크면귀무가설을채택한다. 대립가설이단측이고귀무가설보다작은쪽만고려하므로유의확률은검정통계량값보다작을확률을계산하면된다. 출력결과유의확률은 0.3이므로유의수준 0.05보다크므로귀무가설은채택된다. 신뢰구간은양측신뢰구간을구하는것이므로 PROBIT 함수에는 0.975를사용한다. 하한구간 ( 변수 LOW) 구할때만약 0.975대신 0.05를사용하기원하면앞에 대신 + 을사용해야한다. 정규

48 66 Chapter 4. SAS 함수 분포가좌우대칭임을유의하기바란다. 만약상한신뢰구간을구하려면 사용하면된다. 을 EXAMPLE: 백분위함수사용하기, 모평균검정 ( 소표본 ) 대학생평균 IQ가 0이라한다. 한남대학교학생들의평균 IQ가 0인지알아보기 5명을조사하였더니평균 5, 분산 0이었다. 가설검정하고 ( 유의수준 =0.05) 95% 신뢰구간을구하시오. IQ 데이터는정규분포를따른다고가정하자. ⑴귀무가설 : 우리대학생 IQ 평균은 0이다. μ = 0 대립가설 : μ ⑵검정통계량 : T = = 5 ~ t( n = 4) 0 /5 검정통계량 T=5 이고기각치는.5 이다. 검정통계량이기각역에속하므로귀무가설이기

49 67 각된다. 양측검정이지만일단기각치 RC는오른쪽영역에서구했다. 이는 T의부호가양이므로 ( 표본평균이귀무가설에설정한모집단평균보다크므로 ) 일단오른쪽만고려하면된다. 그러나단측검정과는달리기각역을계산할때는유의수준의 /인 0.05을사용해야한다. 양측검정을위한유의확률을계산할때는한쪽부분을계산한후 배를하면된다. 은검정통계량보다큰부분의확률을계산한것이므로이것을 배하면양측검정을위한유의확률이된다. 95% 신뢰구간에는귀무가설에설정된값 0 이포함되어있지않으므로유의수준 5% 에 서귀무가설을기각할수있다. 가설검정결과와일치한다. 이는앞에서설명하였듯이신 뢰구간과가설검정간에는일대일대응관계가있다.

50 68 Chapter 4. SAS 함수 EXAMPLE: 백분위함수사용하기, 모평균검정 ( 대표본 ) 대학생평균키는 70이라한다. 대학교학생들의평균키가 70인지알아보기 5명을조사하였더니평균 65, 분산 400이었다. 유의수준 5% 에서가설검정하시오. ⑴귀무가설 : 우리대학생 IQ 평균은 70이다. μ = 70 대립가설 : μ ⑵검정통계량 : T = =.5 ~ t(4) 혹은Normal(0,) 0 / 5 검정통계량의부호가음이므로왼쪽영역만고려하여기각역 ( 유의수준의 / 설정 ) 을구하다. 검정통계량 -.5, 기각치 -.064이므로귀무가설이채택된다. 검정통계량 -.5보다작은영역이유의확률계산에사용된다. 양측검정이므로 0.의 배가유의확률이다. 유의확률이 0.4로유의수준보가크므로귀무가설이채택된다.

51 69 대표본의경우수작업시에는 t-분포를사용하는것이아니라정규분포 ( 중심극한정리이용 ) 를이용하게된다. 위와는달리정규분포를이용할경우결과를얻어보자. T-분포가표준정규분포에비해꼬리가두터우므로 t-분포이용할경우기각역값이중심으로부터정규분포에비해멀고유의확률도약간크다. 통계소프트웨어는모두 t-분포이용하여유의확률을계산한다 절 PROC TTEST의경우에도 t-통계량과유의확률이출력됨을볼수있다.

52 70 Chapter 4. SAS 함수 EXAMPLE: 모분산검정 품질공정에서분산이 0.인제품이있다고한다. 새로운생산공정이제품의분산을낮추는지알아보고자한다. 제품 30개를임의추출하여표본분산을계산하였더니 0.7이었다. 새로운공정이분산을낮추었다고할수있나? 유의수준 0.05에서가설검정하고 95% 상한신뢰구간을구하시오. ⑴귀무가설 : 모집단분산은 0.이다. σ = 0. 대립가설 : σ < 0. ( n ) s 9* 0.7 ⑵검정통계량 : T = = = 4.65 ~ χ ( n ) σ 0. 0 ( n ) s 신뢰구간 : χ ( n ) s σ α /, n χ α /, n 대립검정통계량이 보다작으므로카이제곱분포에서왼쪽부분이집중하면된다. 그러므로기각역도왼쪽부분만보면된다. 단측검정이므로기각역을구할때 0.05 사용하면되고유의확률도검정통계량보다작은영역의확률을사용하면된다. 검정통계량 4.65가임계치보다크므로귀무가설이채택된다. 유의확률면에서도귀무가 설은채택된다. 상한신뢰구간을구할때는양측신뢰구간의우측분모에 χ α = 0.05 ( df = 9) 을사용하면된다.

53 7 EXAMPLE: 두모집단평균차이검정 나무해충발생을억제하는치료제가개발되었다. 효과가있는지알아보기위하여나무 4개를임의추출하여 7개는치료제를투여하고나머지개는아무처리도하지않았다. 일정기간이지난후나무의해충수를조사하여다음을얻었다. 치료제가효과가있는지유의수준 5% 에서가설검정하시오. 치료제투여그룹 : n=7, 표본평균 =8.57, 표본분산 =98.6 치료제투여않은그룹 : n=7, 표본평균 =40, 표본분산 =5.33 ⑴귀무가설 : 두집단의평균해충수는같다. μ = μ 대립가설 : μ ( 치료제투여 ) < μ x x ( μ μ ) = ⑵검정통계량 : T = = =.486 ~ t( n + n ), 4.39 / 7 + / 7 s p + n n

54 7 Chapter 4. SAS 함수 ( n ) s + ( n ) s 6*98 + 6*5 통합분산 (pooled variance) s p = = = n + n 대표본인경우 ( 표본의크기가 0~30) 검정통계량의분포는표준정규분포를따르므로위 의프로그램에서 TINV 대신 PROBIT, T 대신 NORMAL 을사용하면된다. 위의예제에서 치료제투여그룹의표본의크기 0, 투여하지않은그룹표본의크기는 30 이었다면?

55 73 EXAMPLE: 두모집단분산차이검정 두생산공정의분산의차이가있는지알아보기위하여생산공정에서크기 0인표본을추출하여계산하였더니 0.5이었고생산공정의표본분산 0.058( 표본크기 =) 이었다. 생산공정의분산차이가있는지유의수준 5% 에서검정하시오. ⑴ 귀무가설 : 두생산공정의분산은같다. σ σ = 대립가설 : σ σ max( s, s ) 0.05 ⑵검정통계량 : T = = =.8 ~ F( n = 9( 분자 ), n = ( 분모)) min( s, ) s 검정통계량계산할때항상큰표본분산을분자에사용하므로검정통계량값은항상 보다크므로분포의오른쪽영역만고려하면된다. 그러나여전히양측검정이므로유의수준의 /을사용한다. 즉 0.95가아니라 사용해야한다.

56 74 Chapter 4. SAS 함수 4.5 확률변수생성 임의의분포를따르는확률변수를만드는 ( 생성, generate) 방법을살펴보자. 생성된데이 터를이용하여사회현상, 자연현상을컴퓨터에서실현하여결과를미리예측해보는것을 시뮬레이션 (simulation) 이라한다. SAS 에서임의분포를따르는확률변수데이터를생성하는함수는 RAN* 이다. 난수를생 성할때는난수표 (random number table) 의어디서시작하느냐에대한 seed 값을지정하게 된다. seed 값은 0이나 ( 3 ) 보다적은양의정수값을사용하면된다. seed를 0을사용 한경우에는컴퓨터가실행된시각이 seed 로들어간다. SEED 번호에 이상의정수를사 용하면프로그램실행할때마다생성되는데이터는매번동일하다 이산형변수 분포함수확률분포함수 SAS 함수 이항분포 (Binomial) n x n x p( x) = p q x x = 0,,,..., n 평균 : np 분산 : npq X=RANBIN(seed,n,p); n 이 이면 Bernoulli 분포이다. λ x e λ p( x) = 포아송분포 x! (Poisson) x = 0,,... 표확률분포 (Tabled Probability) 평균 : λ 분산 : λ p( x = i) = pi, i =,,..., n p = i i X=RANPOI(seed, λ ); X=RANTBL(seed,p,p,...,pn); 이나올확률은 p, 나올확률은 p,, 정수 n 이나올확률이 p n. X = RANTBL(,/,/ ) 는 이나올 확률이 0.5, 가 0.5( 즉동전던지는 실험 ) 인확률변수이다.

57 75 EXAMPLE: 이항분포 0개의사지선다형문제를찍을때맞는개수데이터를 0개뽑아보자 ( 생성 ). seed는 로하자. 사지선다형문제를찍을때맞을확률은 /4, 틀린확률은 3/4이고결과는맞거나 () 혹은틀리거나 (0) 이다. 그러므로모수 ( n = 0, p = / 4 ) 이항분포에서데이터를 0개뽑으면된다. 생성한데이터의평균과분산은얼마일까? 이론적으로는 np = 0 *0.5 = 5, npq = 이나생성결과는평균 5., 분산은 7.이다. 평균은비슷하나분산은상당히높다. 시드를 3으로사용하면 ( ) 다음과같이다른결과를얻는다. 이처럼시드에따라결과가다를수있다. 그러나시뮬레이션할때는생성되는데이터의개수가상당히많으므로이런문제는해결된다.

58 76 Chapter 4. SAS 함수 EXAMPLE: 포아송분포생성 연못에서작업을시도하는회수는조사하였더니 ( 오전 9시부터오후 5시 ) 시간당평균 4 회이고포아송분포를따른다고하자. 매 30분조사하였을때작업회수데이터 0개를생성하시오. seed는 3으로하시오. 시간당평균 4이므로포아송분포의성질에의해 30분에는평균 이다. EXAMPLE: 주사위눈금 주사위던지는게임을한다. 열번던질때나오는수를생성해보자. 눈금은 부터 6까지의정수이고각눈금이나올가능성이동일하므로표확률분포를생성하는함수를이용하면된다. 시드는 3을사용하였다. 주사위각면이나타날확률은 /6로동일하다. 그러나 0번던지면각면의상대빈도 (relative frequency) 값은 /6이되지않는다.

59 77 EXAMPLE: 주사위눈금상대빈도 주사위를 000번던져각눈금의상대빈도를구해보자. 데이터의상대빈도를구하는 PROC 단계는 FREQ이다. NOCUM 옵션은누적빈도값을출력하지말라는옵션이다. 000번던졌을때는각눈금의상대빈도는 /6=6.7(%) 와다소차이는있다. 그러나더많이 0,000번쯤던지면? 상대빈도가 /6에근사한다.

60 78 Chapter 4. SAS 함수 EXAMPLE: 기대수익계산 주사위눈금에,000원을곱해상금을준다. 한번게임을할때게임참가비로 3,000원이다. 이게임의기대값 (expected value) 을계산하시오. 이게임을할때기대되는상금은 3500원 ( = ( )*000 / 6 ) 이고참가비가 3000원이므로기대수익은 500원이다. 정말기대수익이 500원일까? 게임을 0번할때매게임얼마를따는지 ( 잃는지 ) 알아보자. 그리고 PROC MEANS를사용하여게임의기대값을구해보자.

61 79 0 번게임했을때기대수익이 050 원이다. 그러나 000 번게임했다면? 아래와같이 5 원으로이론적기대수익에근사한다.

62 80 Chapter 4. SAS 함수 4.5. 연속형변수 분포함수확률분포함수 SAS 함수 표준정규분포 (Standard Normal) 감마분포 (Gamma) ( x μ) f ( x) = exp σ πσ < x < 평균 : μ, 분산 : σ α x / β f ( x) = x e α Γ( α ) β 0 < x < 평균 : αβ, 분산 : αβ X=RANNOR(seed); 평균이 μ, 분산이 σ 인 정규분포를따르는확률변수생성 X = μ + RANNOR(seed) *σ X=RANGAM(seed, α ); β = X ~ RANGAM ( α, β ) 인경우는 X= β * RANGAM(seed,α ); X ~ χ ( df = α ) 인경우는 X= * RANGAM(seed,α ); 베타분포 (Beta) 지수분포 (Exponential) 카이제곱분포 (Chi-squared) T-분포 F-분포 Γ( α + β ) α β f ( x) = x ( x) Γ( α) Γ( β ) 0 < x < 평균 : α /( α + β ), 분산 : α = 인감마분포. x / β f ( x) = e β 평균 : β, 분산 : β αβ α = r /, β = 감마분포. f ( x) = Γ( r / ) r / x 평균 : r, 분산 : r / r / x / T = W / V / r, 0 < x < f (x) 복잡, 자유도 r W ~ Normal (0,), V ~ χ ( r ) 평균 : 0, 분산 : r /( r ) U / r F =, 0 < x < V / r f (x) 복잡, 자유도 ( r, r ) W ~ χ ( r ), V ~ χ ( r ) e X=RANGAM(seed,α ); X=RANGAM(seed, β ); Y=X/(X+x); X=RANGAM(seed,); β = X ~ Exponential( β ) 인경우는 X=RANGAM(seed,) * β ; X= * RANGAM(seed, r / ); Y=RANNOR(seed); Y= * RANGAM(seed, r / ); X=Y/SQRT(Y/R); Y= * RANGAM(seed, r / ); Y= * RANGAM(seed, r / ); X=(Y/R)/(Y/R);

63 8 평균 : n /( n ), 분산 : 복잡 EXAMPLE: 정규분포생성 평균이 80, 분산이 7 인정규분포를따르는확률변수데이터 0 개를생성해보자. EXAMPLE: T- 분포생성 자유도 0 인 t- 분포를따르는확률변수데이터 0 개를생성하시오. 변수명은 T 로하자.

64 8 Chapter 4. SAS 함수 EXAMPLE: F- 분포생성 자유도 ( 5,7) F-분포를따르는확률변수데이터 0개를생성하시오. 변수명은 F 로하자. EXAMPLE: 백분위함수사용하기, 모비율검정 평균이 인 ( β = ) 지수분포를생성하고히스토그램을그려보자. MIDPOINT 옵션은막

65 83 대눈금은중간크기이다. CFILL 는막대안의색깔지정옵션이다. EXPONENTIAL 은이론 적지수분포의확률밀도함수를그리라는옵션이다. 모수 β 는데이터 00 개로부터추정된 평균으로추정된다.

Microsoft Word - SAS_Data Manipulate.docx

Microsoft Word - SAS_Data Manipulate.docx 수학계산관련 함수 함수 형태 내용 SIN(argument) TAN(argument) EXP( 변수명 ) SIN 값을계산 -1 argument 1 TAN 값을계산, -1 argument 1 지수함수로지수값을계산한다 SQRT( 변수명 ) 제곱근값을계산한다 제곱은 x**(1/3) = 3 x x 1/ 3 x**2, 세제곱근 LOG( 변수명 ) LOGN( 변수명 )

More information

Microsoft Word - Software_Ch2_FUNCTION.docx

Microsoft Word - Software_Ch2_FUNCTION.docx Chapter 2 SAS 함수 SAS 함수는소프트웨어에내장되어작업자가손쉽게연산을할수있게데이터값은로그값을계산하려면 LOG() 함수를사용하면된다. 한다. 예를들어 맛보기 EXP() 함수 : () 안의관측치의지수값을구하는함수 RANNOR(seed) 함수 : 평균이 0 이고표준편차가 1인정규분포함수를따르는관측치를생성하는함수, SEED ( 시드 ) 는값을생성할때시작하는위치를나타내는는값으로

More information

Microsoft PowerPoint - SBE univariate5.pptx

Microsoft PowerPoint - SBE univariate5.pptx 이상치 (outlier) 진단및해결 Homework 데이터 ( Option.XLS) 결과해석 치우침? 평균이중앙값에비해다소크다. 그러나이상치때문이지치우친것같지않음. Toys us 스톡옵션비율이이상치 해결방법 : Log 변환? 아니다치우쳐있지않기때문에제거 제거후 : 평균 :.74, 중위수 :.7 31 치우침과이상치 데이터 : 노트북평가점수 우로치우침과이상치가존재

More information

statistics

statistics 수치를이용한자료요약 statistics hmkang@hallym.ac.kr 한림대학교 통계학 강희모 ( 한림대학교 ) 수치를이용한자료요약 1 / 26 수치를 통한 자료의 요약 요약 방대한 자료를 몇 개의 의미있는 수치로 요약 자료의 분포상태를 알 수 있는 통계기법 사용 중심위치의 측도(measure of center) : 어떤 값을 중심으로 분포되어 있는지

More information

G Power

G Power G Power 부산대학교통계학과조영석 1. G Power 란? 2. G Power 설치및실행 2.1 G Power 설치 2.2 G Power 실행 3. 검정 (Test) 3.1 가설검정 (Test of hypothesis) 3.2 검정력 (Power) 3.3 효과크기 (Effect size) 3.4 표본수산정 4. 분석 4.1 t- 검정 (t-test) 4.2

More information

R t-..

R t-.. R 과데이터분석 집단의차이비교 t- 검정 양창모 청주교육대학교컴퓨터교육과 2015 년겨울 t- 검정 변수의값이연속적이고정규분포를따른다고할때사용 t.test() 는모평균과모평균의 95% 신뢰구간을추청함과동시에가설검증을수행한다. 모평균의구간추정 - 일표본 t- 검정 이가설검정의귀무가설은 모평균이 0 이다 라는귀무가설이다. > x t.test(x)

More information

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포 생존분석의 추정과 비교 : 보충자료 이용희 December, 8 Cotets 생존함수와 위험함수. 생존함수와 위험함수....................................... 예제: 지수분포.......................................... 예제: 와이블분포.........................................

More information

Microsoft Word - EDA_Univariate.docx

Microsoft Word - EDA_Univariate.docx 일변량분석개념 일변량분석은개체의특성을 측정한변수가하나인 통계분석 방법 변수의 종류 ( 수리 통계 ) 이산형 (discrete): 측정결과를셀수있는경우이다. 성별, 직업, 교통량, 나이등이여기해당된다. 연속형 (continuous): 측정결과가무한이 (infinite) 많은변수를연속형형변수라한다. 즉변수의범위 (range) 중어떤구간을설정하더라도측정치가발생할할수있는경우로키,

More information

Microsoft PowerPoint - PDF3 SBE 20080417.pptx

Microsoft PowerPoint - PDF3 SBE 20080417.pptx 연속형 확률밀도함수 연속형 확률분포함수? 데이터 히스토그램의 정상을 연결하면 확률분포함수가 된다. 이를 이용하여 데이터(표본)의 분포(이는 모집단의 분포와 동일)를 구 하게 된다. 그러나 함수를 구하는 것은 불가능해 보인다. 그래서 현실에서는 확률분포를 가정하게 된다. (예)기다리는 시간: 지수분포, 측정 오 차: 정규분포 Gauss(천문학자): 행성들간 거리

More information

10. ..

10. .. 점추정구간추정표본크기 차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기 추정의종류 점추정구간추정표본크기 점추정 (point estimation): 모수를어떤하나의값으로추측하는것 구간추정 (interval estimation): 모수를어떤구간으로추측하는것 예 ) 피그미족 (Pygmytribe) 의평균키는모수 µ 표본을추출하여평균을구해보니 135cm

More information

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt 수명분포및신뢰도의 통계적추정 포항공과대학교산업공학과전치혁.. 수명및수명분포 수명 - 고장 까지의시간 - 확률변수로간주 - 통상잘알려진분포를따른다고가정 수명분포 - 확률밀도함수또는 누적 분포함수로표현 - 신뢰도, 고장률, MTTF 등신뢰성지표는수명분포로부터도출 - 수명분포추정은분포함수관련모수의추정 누적분포함수및확률밀도함수 누적분포함수 cumulav dsbuo

More information

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63> 제 3 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

확률과통계6

확률과통계6 확률과통계 6. 이산형확률분포 건국대학교스마트 ICT 융합공학과윤경로 (yoonk@konkuk.ac.kr) 6. 이산형확률분포 6.1 이산균일분포 6.2 이항분포 6.3 초기하분포 6.4 포아송분포 6.5 기하분포 6.6 음이항분포 * ( 제외 ) 6.7 다항분포 * ( 제외 ) 6.1 이산균일분포 [ 정의 6-1] 이산균일분포 (discrete uniform

More information

Microsoft PowerPoint - IPYYUIHNPGFU

Microsoft PowerPoint - IPYYUIHNPGFU 분산분석 분산분석 (ANOVA: ANALYSIS OF VARIANCE) 두개이상의모집단의차이를검정 예 : 회사에서세종류의기계를설치하여동일한제품을생산하는경우, 각기계의생산량을조사하여평균생산량을비교 독립변수 : 다른변수에의해영향을주는변수 종속변수 : 다른변수에의해영향을받는변수 요인 (Factor): 독립변수 예에서의요인 : 기계의종류 (I, II, III) 요인수준

More information

Microsoft PowerPoint - LN05 [호환 모드]

Microsoft PowerPoint - LN05 [호환 모드] 계량재무분석 I Chapter 6 & 7 Probability Distribution II 경영대학재무금융학과 윤선중 0 Objectives 확률변수 이산확률분포 (Discrete Random Variables): 셀수있는확률변수 연속확률분포 (Continuous Random Variables): 셀수없는경우의수 이산확률변수 분포의대표값 기대치 (Expected

More information

확률 및 분포

확률 및 분포 확률및분포 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 확률및분포 1 / 15 학습내용 조건부확률막대그래프히스토그램선그래프산점도참고 박창이 ( 서울시립대학교통계학과 ) 확률및분포 2 / 15 조건부확률 I 첫째가딸일때두아이모두딸일확률 (1/2) 과둘중의하나가딸일때둘다딸일확률 (1/3) 에대한모의실험 >>> from collections import

More information

untitled

untitled R 과함께하는통계학의이해 빅북이라명명된이책은지식공유의세계적인흐름에동참하고지적인업적들이세상과인류의지식이되도록하며, 누구나쉽게접근하고활용할수있는환경을만들고자한다. 이책의저작권은빅북 (www.bigbook.or.kr) 에있으며모든용도로활용할수있다. 다만상업용출판을하고자하는경우에는사전에문서로된허락을받아야한다. 공유와협력의교과서만들기운동본부 R 과함께하는 통계학의이해

More information

(001~006)개념RPM3-2(부속)

(001~006)개념RPM3-2(부속) www.imth.tv - (~9)개념RPM-(본문).. : PM RPM - 대푯값 페이지 다민 PI LPI 알피엠 대푯값과산포도 유형 ⑴ 대푯값 자료 전체의 중심적인 경향이나 특징을 하나의 수로 나타낸 값 ⑵ 평균 (평균)= Ⅰ 통계 (변량)의 총합 (변량의 개수) 개념플러스 대푯값에는 평균, 중앙값, 최 빈값 등이 있다. ⑶ 중앙값 자료를 작은 값부터 크기순으로

More information

01

01 2019 학년도대학수학능력시험 9 월모의평가문제및정답 2019 학년도대학수학능력시험 9 월모의평가문제지 1 제 2 교시 5 지선다형 1. 두벡터, 모든성분의합은? [2 점 ] 에대하여벡터 의 3. 좌표공간의두점 A, B 에대하여선분 AB 를 로외분하는점의좌표가 일때, 의값은? [2점] 1 2 3 4 5 1 2 3 4 5 2. lim 의값은? [2점] 4. 두사건,

More information

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut 경영학을 위한 수학 Fial Eam 5//(토) :-5: 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오.. (각 6점) 다음 적분을 구하시오 4 ( ) (a) ( )4 8 8 (b) d이 성립한다. d C C log log (c) 이다. 양변에 적분을 취하면 log C (d) 라 하자. 그러면 d 4이다. 9 9 4 / si (e) cos si

More information

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료 3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료 분포형태, 상대적위치, 극단값 분포형태 z-값 체비셰프의원리 경험법칙 극단값찾기 분포형태 : 왜도 (skewness) 분포형태를측정하는중요한척도중하나를 왜도 라고한다. 자료집합의왜도를구하는계산식은조금복잡하다. 통계프로그램을사용하여왜도를쉽게계산할수있다.

More information

nonpara1.PDF

nonpara1.PDF Chapter 1 Introduction 1 Introduction (parameter) (assumption) (rank), (median) p-value distribution free, assumption free, statistical inference based on ranks 11 Nonparametric? John Arbuthnot (1710)

More information

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770> 삼각함수. 삼각함수의덧셈정리 삼각함수의덧셈정리 삼각함수 sin (α + β ), cos (α + β ), tan (α + β ) 등을 α 또는 β 의삼각함수로나 타낼수있다. 각 α 와각 β 에대하여 α >0, β >0이고 0 α - β < β 를만족한다고가정하 자. 다른경우에도같은방법으로증명할수있다. 각 α 와각 β 에대하여 θ = α - β 라고놓자. 위의그림에서원점에서거리가

More information

자료의 이해 및 분석

자료의 이해 및 분석 어떤실험이나치료의효과를측정할때독립이아닌표본으로부터관찰치를얻었을때처리하는방법 - 동일한개체에어떤처리를하기전과후의자료를얻을때 - 가능한동일한특성을갖는두개의개체에서로다른처리를하여그처리의효과를비교하는방법 (matching) 1 예제 : 혈청 cholesterol 치를줄이기위해서 12 명을대상으로운동과함께식이요법의효과를 측정하기위한실험실시 2 식이요법 - 운동실험전과후의

More information

모수검정과비모수검정 제 6 강 지리통계학

모수검정과비모수검정 제 6 강 지리통계학 모수검정과비모수검정 제 6 강 지리통계학 통계적추정의목적 연구자가주장하는연구가설을입증하기위한것 1 연구목적에맞는연구가설을설정 2 연구목적과수집된자료에부합되는적절한통계적검정방법을선택 3 귀무가설과연구가설 ( 대립가설 ) 을진술 4 유의수준을결정한후각분포유형에따라분포표를이용하여임계치를구하고기각역을설정 5 통계적검정유형에필요한통계량을각검정유형의공식을이용하여계산 6

More information

Microsoft PowerPoint - 26.pptx

Microsoft PowerPoint - 26.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2011년봄학기 강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

Microsoft Word - Ch2_Function_math.docx

Microsoft Word - Ch2_Function_math.docx Calculus is the mathematics of motion and change. 운동과변화의수학인선형대수는 (Calculus) 함수의순간변화율에 ( 기울기 ) 대한미분 (Differentiation), 함수의특정구간의면적의합에관한적분과 (Integral) 함수의수렴값에대한극한에 (limiting value) 관해다루게된다. 선형대수는 7 세기과학자들의수학적요구에의해시작되었다.

More information

cat_data3.PDF

cat_data3.PDF ( ) IxJ ( 5 0% ) Pearson Fsher s exact test χ, LR Ch-square( G ) x, Odds Rato θ, Ch-square Ch-square (Goodness of ft) Pearson cross moment ( Mantel-Haenszel ), Ph-coeffcent, Gamma (γ ), Kendall τ (bnary)

More information

= ``...(2011), , (.)''

= ``...(2011), , (.)'' Finance Lecture Note Series 사회과학과 수학 제2강. 미분 조 승 모2 영남대학교 경제금융학부 학습목표. 미분의 개념: 미분과 도함수의 개념에 대해 알아본다. : 실제로 미분을 어떻게 하는지 알아본다. : 극값의 개념을 알아보고 미분을 통해 어떻게 구하는지 알아본다. 4. 미분과 극한: 미분을 이용하여 극한값을 구하는 방법에 대해 알아본다.

More information

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행 Ch4 one-way ANOVA ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행 One-way ANOVA 란? Group Sex pvas NSAID

More information

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2 비트연산자 1 1 비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2 진수법! 2, 10, 16, 8! 2 : 0~1 ( )! 10 : 0~9 ( )! 16 : 0~9, 9 a, b,

More information

... —... ..—

...   —... ..— 통계학 통계적추론 한국보건사회연구원 2017 년 5 월 29 일 ( 월요일 ) 강의슬라이드 7-1 1/ 72 목차 1 서론 2 신뢰구간을이용한통계적추론 3 통계적유의성검정 4 유의성검정과관련해서유의해야할점 2/ 72 지난시간복습 왜 x 가 µ 와완벽하게일치하지않고또어떤표본을추출했냐에따라 x 값이달라지는데이 x 를이용해서모집단 µ 를추정할까? 두가지사실때문 :

More information

Microsoft PowerPoint Relations.pptx

Microsoft PowerPoint Relations.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2010년봄학기강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

고객관계를 리드하는 서비스 리더십 전략

고객관계를 리드하는  서비스 리더십 전략 제 13 장분산분석 1 13.1 일원분산분석 13. 분산분석 - 무작위블럭디자인 13.3 이원분산분석 - 팩토리얼디자인 분산분석 (ANOVA) - 두개이상의집단들의평균값을비교하는데사용. 일원분산분석 - 처치변수가한개인분산분석. 1. 분산분석의원리 A 3.0 8.0 7.0 5.0 5.0 6.0 4.0 7.0 6.0 4.0 평균 5.0 6.0 B 3.0 9.0

More information

1 1 Department of Statistics University of Seoul August 28, 2017 확률분포 누적분포함수 확률공간이정의되었다고가정하자. 즉, 어떤사건 A 에대해서 P(A) 를항상생각할수있다고가정하자. 어떤확률변수 X 주어졌을때 Pr(X x) = P(X (, x]) 로정의하면 Pr(X x) 의값을모든 x 에대해생각할수있다. F

More information

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드] 제 강.1 통계적기초 확률변수 (Radom Variable). 확률변수 (r.v.): 관측되기전까지는그값이알려지지않은변수. 확률변수의값은확률적실험으로부터결과된다. 확률적실험은실제수행할수있는실험뿐아니라가상적실험도포함함 (ex. 주사위던지기, [0,1] 실선에점던지기 ) 확률변수는그변수의모든가능한값들의집합에대해정의된알려지거나알려지지않은어떤확률분포의존재가연계됨 반면에,

More information

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표 Vector Differential: 벡터 미분 Yonhee Lee October 7, 08 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표기법을 정의하는 방법이다 보통 스칼라(scalar)에 대한 미분은 일분수 함수 f : < < 또는 다변수 함수(function

More information

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은 2013 년도연구용역보고서 공공기관임금프리미엄추계 - 2013. 12.- 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한국노동연구원선임연구위원정진호 공공기관임금프리미엄추계 2013. 12. 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영

More information

Microsoft PowerPoint - chap06-2pointer.ppt

Microsoft PowerPoint - chap06-2pointer.ppt 2010-1 학기프로그래밍입문 (1) chapter 06-2 참고자료 포인터 박종혁 Tel: 970-6702 Email: jhpark1@snut.ac.kr 한빛미디어 출처 : 뇌를자극하는 C프로그래밍, 한빛미디어 -1- 포인터의정의와사용 변수를선언하는것은메모리에기억공간을할당하는것이며할당된이후에는변수명으로그기억공간을사용한다. 할당된기억공간을사용하는방법에는변수명외에메모리의실제주소값을사용하는것이다.

More information

Microsoft Word - ch2_smoothing.doc

Microsoft Word - ch2_smoothing.doc FORECASTING / 2 장. 지수평활법 14 Chaer 2. 지수평활법 시계열자료는시간에따라관측되며자료의수가많다는특징을갖는다. 시계열자료는시간에따른변화를 (rend, cycle, seasonaliy) 가지고있으므로과거관측치를이용하여미래값을예측할수있을것이다. 이를모형화하는방법이 ARMA 에서살펴보았다. ARMA 모형은시계열데이터의주기 (cycle) 을모형화하는것이다.

More information

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는 제 12 강분산분석 분산분석 (ANOVA) (1) 1. 개요 비교하는집단의수가 3개이상일경우에사용되는통계기법이분산분석이다. 두표본 t검증에서는문제의단순성때문에야기되지않는문제들이다수의표본으로확대됨에따라문제들이야기되기도한다. 다음과같은 r개의모집단이있다고가정하자..... ~ N( μ σ ) ~ N( μ σ ).... ~ N ( μ σ )...... 위의그림과같이여러번에걸쳐두표본의

More information

Microsoft Word - SPSS_MDA_Ch6.doc

Microsoft Word - SPSS_MDA_Ch6.doc Chapter 6. 정준상관분석 6.1 정준상관분석 정준상관분석 (Canonical Correlation Analysis) 은변수들의군집간선형상관관계를파악하는분석방법이다. 예를들어신체적조건 ( 키, 몸무게, 가슴둘레 ) 과운동력 ( 달리기, 윗몸일으키기, 턱걸이 ) 사이의선형상관관계가있는지알아보고, 관계가있다면어떤관계가있는지분석하는것이다. 정준상관분석은 (

More information

untitled

untitled Mathematics 4 Statistics / 6. 89 Chapter 6 ( ), ( /) (Euclid geometry ( ), (( + )* /).? Archimedes,... (standard normal distriution, Gaussian distriution) X (..) (a, ). = ep{ } π σ a 6. f ( F ( = F( f

More information

설계란 무엇인가?

설계란 무엇인가? 금오공과대학교 C++ 프로그래밍 jhhwang@kumoh.ac.kr 컴퓨터공학과 황준하 6 강. 함수와배열, 포인터, 참조목차 함수와포인터 주소값의매개변수전달 주소의반환 함수와배열 배열의매개변수전달 함수와참조 참조에의한매개변수전달 참조의반환 프로그래밍연습 1 /15 6 강. 함수와배열, 포인터, 참조함수와포인터 C++ 매개변수전달방법 값에의한전달 : 변수값,

More information

Microsoft Word - Chapter6.doc

Microsoft Word - Chapter6.doc CHAPTER 6 기초통계량분석 분류형 ( 범주형 ) 변수데이터에대한정리방법으로는숫자요약인빈도분석과그래프요약인파이차트, 바차트가이용된다. 측정형변수에대한숫자요약은일반적으로자료의중앙위치와자료의흩어진정도를나타내는두개의값으로축약된다. 즉, 크기 n 개의데이터의가진정보가 2 개숫자요약으로축약 (data reduction) 된다. 데이터의중앙위치에대한통계량평균 (mean)

More information

Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2

Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2 통계학 - CAS0001 7 주차 이산확률분포 이석준 Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2 학습목표 확률변수가연속적인지이산적인지구분한다. 이항분포, 초기하분포,

More information

1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속

1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속 1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속 2 1.1 함수를표현하는네가지방법 함수 f : D E 는집합 D 의각원소 x 에집합 E 에속하는단하나의원소 f(x) 를 대응시키는규칙이다.

More information

수리통계학

수리통계학 제 강통계학 Revew Part I. 확률론 (Probablty Theory) I. 확률변수 (Radom Varable) 와확률분포 A. 확률변수 는표본공간 Ω 상에서정의되는 real valued fucto 임. 어떤확률적실험의결과로나올수있는모든가능한결과에대해어떤. 실수값이대응되어야함 하나의실험에대해여러가지의확률변수가정의될수있음. 주사위던지는실험 : 던진결과나오는값을대응시켜주는확률변수

More information

... —....—

...   —....— 통계학 추출분포 한국보건사회연구원 2017 년 5 월 22 일 ( 월요일 ) 강의슬라이드 6 1/ 36 목차 1 들어가며 2 표본평균의추출분포 3 추출분포결론 2/ 36 추출분포와통계적추론 통계량의추출분포모집단분포 통계적추론이어떤표본을토대로모집단에대한결론을내리게끔해줌 어떤표본을토대로모집단에대한결론을내릴때, 이표본이모집단을잘대표해야한다는것은이제두말하면잔소리 =

More information

제 3강 역함수의 미분과 로피탈의 정리

제 3강 역함수의 미분과 로피탈의 정리 제 3 강역함수의미분과로피탈의정리 역함수의미분 : 두실수 a b 와폐구갂 [ ab, ] 에서 -이고연속인함수 f 가 ( a, b) 미분가능하다고가정하자. 만일 f '( ) 0 이면역함수 f 은실수 f( ) 에서미분가능하고 ( f )'( f ( )) 이다. f '( ) 에서 증명 : 폐구갂 [ ab, ] 에서 -이고연속인함수 f 는증가함수이거나감소함수이다 (

More information

MS_적분.pages

MS_적분.pages 고대수학자들은사각형의면적 밑변 높이, 삼각형면적 밑변 높이 평행사변형의면적 Euclid gomtry 밑면 높이, 사다리꼴의면적 윗변 + 아래변 * 높이 를이용하여구하였다. 이를이용하여왼쪽의다각형면적은구할수있으나오른쪽의곡선의면적은어떻게구할것인가? Archimds 는곡선의면적을이미알려진다각형, 삼각형의면적으로근사시켜구하는방법을생각하였다. 이것이면적에대한현재정의의근간이된다.

More information

OCW_C언어 기초

OCW_C언어 기초 초보프로그래머를위한 C 언어기초 4 장 : 연산자 2012 년 이은주 학습목표 수식의개념과연산자및피연산자에대한학습 C 의알아보기 연산자의우선순위와결합방향에대하여알아보기 2 목차 연산자의기본개념 수식 연산자와피연산자 산술연산자 / 증감연산자 관계연산자 / 논리연산자 비트연산자 / 대입연산자연산자의우선순위와결합방향 조건연산자 / 형변환연산자 연산자의우선순위 연산자의결합방향

More information

(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰

(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰 제 3 장. 비모수적방법 (Dstrbuto-free Method) 모수적방법 (parametrc method): 관측값이어느특정한확률분포, 예를들면정규분포, 이항분 포등을따른다고전제한후그분포의모수 (parameter) 에대한검정을실시하는방법이다. 비모수적방법 (oparametrc method): 관측값이어느특정한확률분포를따른다고전제할수 없거나또는모집단에대한아무런정보가없는경우에실시하는검정방법으로모수에대한언급이없으며분포무관방법이라고도한다.

More information

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed 중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed mean), 가중평균 (weighted mean), 기하평균 (geometric mean),

More information

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 (   ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각 JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( http://java.sun.com/javase/6/docs/api ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각선의길이를계산하는메소드들을작성하라. 직사각형의가로와세로의길이는주어진다. 대각선의길이는 Math클래스의적절한메소드를이용하여구하라.

More information

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770> 25 강. 수열의극한참거짓 2 두수열 { }, {b n } 의극한에대한 < 보기 > 의설명중옳은것을모두고르면? Ⅰ. < b n 이고 lim = 이면 lim b n =이다. Ⅱ. 두수열 { }, {b n } 이수렴할때 < b n 이면 lim < lim b n 이다. Ⅲ. lim b n =0이면 lim =0또는 lim b n =0이다. Ⅰ 2Ⅱ 3Ⅲ 4Ⅰ,Ⅱ 5Ⅰ,Ⅲ

More information

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선 Point Operation Histogram Modification 김성영교수 금오공과대학교 컴퓨터공학과 학습내용 HISTOGRAM HISTOGRAM MODIFICATION DETERMINING THRESHOLD IN THRESHOLDING 2 HISTOGRAM A simple datum that gives the number of pixels that a

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 13 장상관분석 1. 상관계수 2. 상관분석의가정과특성 3. 모상관계수의검정과신뢰한계 4. 순위상관 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 - 실습 - 상관분석 지금까지한가지확률변수에의한현상을검정하였다.

More information

<C5EBB0E8C0FBB0A1BCB3B0CBC1F5C0C7C0FDC2F7BFCDB9AEC1A6C1A1B1D7B8AEB0EDB4EBBEC E687770>

<C5EBB0E8C0FBB0A1BCB3B0CBC1F5C0C7C0FDC2F7BFCDB9AEC1A6C1A1B1D7B8AEB0EDB4EBBEC E687770> 통계적가설검증의절차와문제점그리고대안 서울대학교심리학과, 인지과학협동과정교수조사연구편집위원장조사연구학회이사서울대사회과학대학교무부학장역임 주요연구 : Self-efficacy in information security : Its influence on end users information security practice behavior When fit indices

More information

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0) FGB-P8-3 8 학번수학과권혁준 8 년 5 월 9 일 Lemma p 를 C[, ] 에속하는음수가되지않는함수라하자. 이때 y C, C[, ] 가미분방정식 y t + ptyt, t,, y y 을만족하는해라고하면, y 는, 에서연속적인이계도함수를가지게확 장될수있다. Proof y 은 y 의도함수이므로미적분학의기본정리에의하여, y 은 y 의어떤원시 함수와적분상수의합으로표시될수있다.

More information

Chapter4.hwp

Chapter4.hwp Ch. 4. Spectral Density & Correlation 4.1 Energy Spectral Density 4.2 Power Spectral Density 4.3 Time-Averaged Noise Representation 4.4 Correlation Functions 4.5 Properties of Correlation Functions 4.6

More information

금오공대 컴퓨터공학전공 강의자료

금오공대 컴퓨터공학전공 강의자료 C 프로그래밍프로젝트 Chap 14. 포인터와함수에대한이해 2013.10.09. 오병우 컴퓨터공학과 14-1 함수의인자로배열전달 기본적인인자의전달방식 값의복사에의한전달 val 10 a 10 11 Department of Computer Engineering 2 14-1 함수의인자로배열전달 배열의함수인자전달방식 배열이름 ( 배열주소, 포인터 ) 에의한전달 #include

More information

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞 줄기잎그림 stem and leaf + 진단내용 1) 분포의개략적인형태를알수있다. (1) 좌우대칭인가? 아니면 skewed 되었는가? (2) 봉우리 (modal) 는하나인가? 아니면여러개인가? 2) 이상치의존재여부를쉽게파악할수있다. + 데이터 ( 정렬 ) ( 정렬않음 ) + 그리는순서 자료를크기순으로정리한다. 자료의수가많을때는자료정렬을수작업하기어려움으로이단계는무시해도되지만자료를크기순으로정렬해놓으면

More information

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에대하여 AB=BA 1 가성립한다 2 3 (4) 이면 1 곱셈공식및변형공식성립 ± ± ( 복호동순 ), 2 지수법칙성립 (은자연수 ) < 거짓인명제 >

More information

제 12강 함수수열의 평등수렴

제 12강 함수수열의 평등수렴 제 강함수수열의평등수렴 함수의수열과극한 정의 ( 점별수렴 ): 주어진집합 과각각의자연수 에대하여함수 f : 이있다고가정하자. 이때 을집합 에서로가는함수의수열이라고한다. 모든 x 에대하여 f 수열 f ( x) lim f ( x) 가성립할때함수수열 { f } 이집합 에서함수 f 로수렴한다고한다. 또 함수 f 을집합 에서의함수수열 { f } 의극한 ( 함수 ) 이라고한다.

More information

Microsoft Word - Lab.4

Microsoft Word - Lab.4 Lab. 1. I-V Lab. 4. 연산증폭기 Characterist 비 tics of a Dio 비교기 ode 응용 회로 1. 실험목표 연산증폭기를이용한비교기비교기응용회로를이해 응용회로를구성, 측정및평가해서연산증폭기 2. 실험회로 A. 연산증폭기비교기응용회로 (a) 기본비교기 (b) 출력제한 비교기 (c) 슈미트트리거 (d) 포화반파정류회로그림 4.1. 연산증폭기비교기응용회로

More information

고차원에서의 유의성 검정

고차원에서의 유의성 검정 고차원에서의유의성검정 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 고차원에서의유의성검정 1 / 15 학습내용 FDR(false discovery rate) SAM(significance analysis of microarray) FDR 에대한베이지안해석 박창이 ( 서울시립대학교통계학과 ) 고차원에서의유의성검정 2 / 15 서론 I 고차원데이터에서변수들에대한유의성검정

More information

chap 5: Trees

chap 5: Trees 5. Threaded Binary Tree 기본개념 n 개의노드를갖는이진트리에는 2n 개의링크가존재 2n 개의링크중에 n + 1 개의링크값은 null Null 링크를다른노드에대한포인터로대체 Threads Thread 의이용 ptr left_child = NULL 일경우, ptr left_child 를 ptr 의 inorder predecessor 를가리키도록변경

More information

<B1B3C0B0B0FAC1A45FC3E2B7C22E687770>

<B1B3C0B0B0FAC1A45FC3E2B7C22E687770> 확률및통계 확률및통계 1 성격 본과정은과학기술특성화대학의 확률및통계 ( 또는 기초통계학 ) 과목에해당하는내용을다룬다. 이과정을통하여학생들은대학과정이수에필요한정성적 / 정량적자료분석을위한통계적사고의기초를습득하게된다. 또한수학, 통계학, 또는계량적분석을많이요구하는학문을전공하고자하는학생들에게는과학적분석방법의수리적토대를갖추도록하여상위교과목을수강할수있는능력을기르도록한다.

More information

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint 제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Winters의계절지수평활법 이동평균법 (moving average method) 평활에의해계절성분또는불규칙성분을제거하여전반적인추세를뚜렷하게파악

More information

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS 제장 비모수 검정(nonparametric analysis) 모집단의 분포를 알 수 없거나 모집단이 정규분포를 따른다고 가정할 수 없는 경우에는 모수적 검정을 사용할 수 없다. 이 경우에 자료의 부호나 순위로 가설 검정을 실시하며 이러한 검정 방법을 비모수 검정이라고 한다. 제절 적합도 검정(goodness of fit test) 주어진 자료가 어떠한 통계적

More information

제 2 교시 2019 학년도 3 월고 1 전국연합학력평가문제지수학영역 1 5 지선다형 1. 의값은? [2점] 일차방정식 의해는? [2 점 ] 두수, 의최대공약수는? [2 점 ] 일차함수 의그래프에서

제 2 교시 2019 학년도 3 월고 1 전국연합학력평가문제지수학영역 1 5 지선다형 1. 의값은? [2점] 일차방정식 의해는? [2 점 ] 두수, 의최대공약수는? [2 점 ] 일차함수 의그래프에서 제 2 교시 2019 학년도 3 월고 1 전국연합학력평가문제지 1 5 지선다형 1. 의값은? [2점] 1 2 3 4 5 3. 일차방정식 의해는? [2 점 ] 1 2 3 4 5 2. 두수, 의최대공약수는? [2 점 ] 1 2 3 4 5 4. 일차함수 의그래프에서 절편과 절편의합은? [3 점 ] 1 2 3 4 5 1 12 2 5. 함수 의그래프가두점, 를지날때,

More information

Y 1 Y β α β Independence p qp pq q if X and Y are independent then E(XY)=E(X)*E(Y) so Cov(X,Y) = 0 Covariance can be a measure of departure from independence q Conditional Probability if A and B are

More information

용역보고서

용역보고서 신뢰성샘플링검사의설계방법 ( 정수관측중단시험 ) 9.. ( 주 ) 한국신뢰성기술서비스 목차 신뢰성샘플링검사의설계방법 ( 정수관측중단시험 ).... 개요.... 기호및용어정의.... 샘플링검사의설계방법... 3. 정수중단시샘플링검사설계방법...4 4. 신뢰성샘플링시험계획예제...5 hp://www.kors.co.kr 신뢰성샘플링검사의설계방법 ( 정수관측중단시험

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 실습 1 배효철 th1g@nate.com 1 목차 조건문 반복문 System.out 구구단 모양만들기 Up & Down 2 조건문 조건문의종류 If, switch If 문 조건식결과따라중괄호 { 블록을실행할지여부결정할때사용 조건식 true 또는 false값을산출할수있는연산식 boolean 변수 조건식이 true이면블록실행하고 false 이면블록실행하지않음 3

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 System Software Experiment 1 Lecture 5 - Array Spring 2019 Hwansoo Han (hhan@skku.edu) Advanced Research on Compilers and Systems, ARCS LAB Sungkyunkwan University http://arcs.skku.edu/ 1 배열 (Array) 동일한타입의데이터가여러개저장되어있는저장장소

More information

Microsoft PowerPoint - ch02-1.ppt

Microsoft PowerPoint - ch02-1.ppt 2. Coodinte Sstems nd Tnsfomtion 20 20 2.2 Ctesin Coodintes (,, ) () (b) Figue 1.1 () Unit vectos,, nd, (b) components of long,, nd. 직각좌표계에서각변수 (,, ) 들의범위 < < < < < < (2.1) 직각좌표계에서임의의벡터 는,, 가그림 1.1 에서와같이,,

More information

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드] 제 11 강 111 자기상관 Autocorrelation 자기상관의본질 11 유효성 (efficiency, accurate estimation/prediction) 을위해서는모든체계적인정보가회귀모형에체화되어있어야함 표본의무작위성 (randomness) 은서로다른관측치들에대한오차항들이상관되어있지말아야함을의미함 자기상관 (Autocorrelation) 은이러한표본의무작위성을위반하게만드는오차항에있는체계적패턴임

More information

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다 이장에서사용되는 MATLAB 명령어들은비교적복잡하므로 MATLAB 창에서명령어를직접입력하지않고확장자가 m 인 text 파일을작성하여실행을한다. 즉, test.m 과같은 text 파일을만들어서 MATLAB 프로그램을작성한후실행을한다. 이와같이하면길고복잡한 MATLAB 프로그램을작성하여실행할수있고, 오류가발생하거나수정이필요한경우손쉽게수정하여실행할수있는장점이있으며,

More information

Microsoft PowerPoint - chap03-변수와데이터형.pptx

Microsoft PowerPoint - chap03-변수와데이터형.pptx #include int main(void) { int num; printf( Please enter an integer: "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num %d\n", num); return 0; } 1 학습목표 의 개념에 대해 알아본다.

More information

Microsoft PowerPoint - chap02-C프로그램시작하기.pptx

Microsoft PowerPoint - chap02-C프로그램시작하기.pptx #include int main(void) { int num; printf( Please enter an integer "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num = %d\n", num); return 0; } 1 학습목표 을 작성하면서 C 프로그램의

More information

PowerPoint Presentation

PowerPoint Presentation 09 th Week Correlation Analysis 상관관계분석 Jongseok Lee Business Administration Hallym University 변수형태와통계적분석방법 H 0 : X ㅗ Y H 1 : X ~ Y X Categorical Y Categorical Chi-square Test X Categorical Y Numerical

More information

31. 을전개한식에서 의계수는? 를전개한식이 일 때, 의값은? 을전개했을때, 의계수와상수항의합을구하면? 을전개했을때, 의 계수는? 를전개했을때, 상수항을 구하여라. 37

31. 을전개한식에서 의계수는? 를전개한식이 일 때, 의값은? 을전개했을때, 의계수와상수항의합을구하면? 을전개했을때, 의 계수는? 를전개했을때, 상수항을 구하여라. 37 21. 다음식의값이유리수가되도록유리수 의값을 정하면? 1 4 2 5 3 26. 을전개하면상수항을 제외한각항의계수의총합이 이다. 이때, 의값은? 1 2 3 4 5 22. 일때, 의값은? 1 2 3 4 5 27. 를전개하여간단히 하였을때, 의계수는? 1 2 3 4 5 23. 를전개하여 간단히하였을때, 상수항은? 1 2 3 4 5 28. 두자연수 와 를 로나누면나머지가각각

More information

fx-82EX_fx-85EX_fx-350EX

fx-82EX_fx-85EX_fx-350EX KO fx-82ex fx-85ex fx-350ex http://edu.casio.com RJA532550-001V01 ...2... 2... 2... 3... 4...5...5...6... 8... 9...10... 10... 11... 13... 16...17...17... 17... 18... 20 CASIO Computer Co., Ltd.,,, CASIO

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Chapter Radar Cross Section ( R C S ) 엄효준교수 한국과학기술원 Contents.1. RCS Definition.. RCS Prediction Methods.3. RCS Dependency on Aspect Angle and Frequency.4. RCS Dependency on Polarization.5. RCS of Simple

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 15 장공분산분석 1. 공분산분석의통계적모형 2. 공분산분석에의한처리효과검정 3. 공분산분석과정 - 실습 - 회귀분석 두확률변수간에관계가있는지검정

More information

슬라이드 1

슬라이드 1 Principles of Economerics (3e) Ch. 4 예측, 적합도, 모형화 013 년 1 학기 윤성민 4.1 OLS 예측 (1) 점예측 x0 y0 - 설명변수일때, 종속변수의값을예측하고자함 y ˆ = b + 0 1 b x 0 Ch. 4 예측, 적합도, 모형화 /60 4.1 OLS 예측 예측오차 (forecas error), f 예측오차의기대값

More information

untitled

untitled 5.8 PROC UNIVARIATE (hitogram, tem and leaf plot, box-whiker plot), (p- ). Univariate( ).. NORMAL (Shapiro- Wilk Kolmogorov-Smirno D- OUTPUT( SAS ). PROC MEANS PROC MEANS. (moment) E( X ). k Sehyug Kwon,

More information

Microsoft Word - skku_TS2.docx

Microsoft Word - skku_TS2.docx Statistical Package & Statistics Univariate : Time Series Data () ARMA 개념 ARIMA(Auto-Regressive Integrated Moving-Average) 모형은시계열데이터 { Y t } 의과거치 (previous observation Y t 1,,... ) 들이설명변수인 AR 과과거의오차항 (

More information

메타분석: 통계적 방법의 기초

메타분석: 통계적 방법의 기초 메타분석: 통계적 방법의 기초 서울시립대학교 통계학과 이용희 209년 4월 23일 Contents 하나의 실험과 효과의 크기 관심있는 모수: 효과의 크기 2 모수의 추정량 3 추정량에 대한 믿음 4 추정량의 분산과 표준오차 5 추정량의 분산과 모집단의 분산 6 통계적 효과의 크기 7 신뢰구간 8 일반적인 관심 모수 2 2 2 3 개의 실험의 비교 실험들의 이질성

More information

untitled

untitled Math. Statistics: Statistics? 1 What is Statistics? 1. (collection), (summarization), (analyzing), (presentation) (information) (statistics).., Survey, :, : : QC, 6-sigma, Data Mining(CRM) (Econometrics)

More information

Resampling Methods

Resampling Methods Resampling Methds 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) Resampling Methds 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과 )

More information

제 5강 리만적분

제 5강 리만적분 제 5 강리만적분 리만적분 정의 : 두실수, 가 을만족핚다고가정하자.. 만일 P [, ] 이고 P 가두끝점, 을모두포함하는유핚집합일때, P 을 [, ] 의분핛 (prtitio) 이라고핚다. 주로 P { x x x } 로나타낸다.. 분핛 P { x x x } 의노름을다음과같이정의핚다. P x x x. 3. [, ] 의두분핛 P 와 Q 에대하여만일 P Q이면 Q

More information

집합 집합 오른쪽 l 3. (1) 집합 X 의각원소에대응하는집합 Y 의원소가단하나만인대응을 라할때, 이대응 를 X 에서 Y 로의라고하고이것을기호로 X Y 와같이나타낸다. (2) 정의역과공역정의역 : X Y 에서집합 X, 공역 : X Y 에서집합 Y (3) 의개수 X Y

집합 집합 오른쪽 l 3. (1) 집합 X 의각원소에대응하는집합 Y 의원소가단하나만인대응을 라할때, 이대응 를 X 에서 Y 로의라고하고이것을기호로 X Y 와같이나타낸다. (2) 정의역과공역정의역 : X Y 에서집합 X, 공역 : X Y 에서집합 Y (3) 의개수 X Y 어떤 다음 X 대응 1. 대응 (1) 어떤주어진관계에의하여집합 X 의원소에집합 Y 의원소를짝지어주는것을집합 X 에서집합 Y 로의대응이라고한다. l (2) 집합 X 의원소 에집합 Y 의원소 가짝지어지면 에 가대응한다고하며이것을기호로 와같이나타낸다. 2. 일대일대응 (1) 집합 A 의모든원소와집합 B 의모든원소가하나도빠짐없이꼭한개씩서로대응되는것을집합 A 에서집합

More information

[INPUT] 뒤에는변수와관련된정보를표기한다. [CARDS;] 뒤에는각각의변수가가지는관측값들을표기한다. >> 위의프로그램에서데이터셋명은 wghtclub 이고, 변수는 idno, name, team, strtwght, endwght 이다. 이중 name 과 team 은

[INPUT] 뒤에는변수와관련된정보를표기한다. [CARDS;] 뒤에는각각의변수가가지는관측값들을표기한다. >> 위의프로그램에서데이터셋명은 wghtclub 이고, 변수는 idno, name, team, strtwght, endwght 이다. 이중 name 과 team 은 SAS 의기본형식 1. INPUT 문 DATA wghtclub; INPUT idno 1-4 name $ 6-24 team $ strtwght endwght; loss=strtwght -endwght; CARDS; 1023 David Shaw red 189 165 1049 Amelia Serrno yellow 145 124 1219 Alan Nance red

More information

Microsoft PowerPoint - ch07 - 포인터 pm0415

Microsoft PowerPoint - ch07 - 포인터 pm0415 2015-1 프로그래밍언어 7. 포인터 (Pointer), 동적메모리할당 2015 년 4 월 4 일 교수김영탁 영남대학교공과대학정보통신공학과 (Tel : +82-53-810-2497; Fax : +82-53-810-4742 http://antl.yu.ac.kr/; E-mail : ytkim@yu.ac.kr) Outline 포인터 (pointer) 란? 간접참조연산자

More information

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

LaTeX. [width=1em]Rlogo.jpg Sublime Text. .. L A TEX 과 을결합한문서작성 Sublime Text 의활용 2015. 01. 31. 차례 1 L A TEX 과활용에유용한 Sublime text 2 LaTeXing 과 Extend 3 LaTeXing 의 Snippet 을활용한 L A TEX 편집 4 L A TEX 과을결합한문서작성 5 Reproducible Research 의응용 활용에 유용한 Sublime

More information

표본재추출(resampling) 방법

표본재추출(resampling) 방법 표본재추출 (resampling) 방법 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 표본재추출 (resampling) 방법 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과

More information