Chapter 2 SAS 함수 SAS 함수는소프트웨어에내장되어작업자가손쉽게연산을할수있게데이터값은로그값을계산하려면 LOG() 함수를사용하면된다. 한다. 예를들어 맛보기 EXP() 함수 : () 안의관측치의지수값을구하는함수 RANNOR(seed) 함수 : 평균이 0 이고표준편차가 1인정규분포함수를따르는관측치를생성하는함수, SEED ( 시드 ) 는값을생성할때시작하는위치를나타내는는값으로 1~ ~(2 31-1) 사이의정수값이나 0 을사용할수있다. 0 을사용하면프로그램실행되는시각이시드값으로설정된다. 2 X ~ ( E( X ), V ( X )) 일때 ax a + b ~ ( ae ( X ) + b, a V ( X )) : 그러므로변수수 ENG는평균이 90 이고표준편차가 10 인정규분포를따르며, 변수 MATH는평균이 80,, 표준편차가 10인정규분포를따르는분포에서얻는 ( 생성, generating) 관측치데이터이다. MEAN 함수는 () 에지정된변수들의 평균을내는함수이다. 통계학과 40 명의중간고사성적과기말고사성적의랜덤생성하여라. 그리고기말고사는 60% 반영, 중간고사는 40% 반영하여총점 (total) 을구하시오. SAS 데이터터이름 : FN1 중간고사 ~ Normal ( 평균=40, 표준편차 =10), seed= 학번 4 자리기말고사 ~ Normal ( 평균=60, 표준편차 =15), seed= 학번 4 자리 17
함수 ( 수학 ) 수학, 통계, 연산에관련된함수를와함께정리 argument 부분에는변수, 숫자를사용할수있다. V, A, B,, X 등은변수수이름이다. ARCOS(argument) COS(argument) ARSIN(argument) SIN(argument) TAN(argument) TAN 값을계산, -1 argument 1 EXP( 변수명 ) SQRT( 변수명 ) LOG( 변수명 ) LOGN( 변수명 ) 내용 COS 의 inversee 값을계산 -1 argument 1 COS 값을계산 argument 은실수나 Radian 값 SIN 의 inverse 값을계산 argument 은실수나 Radian 값 SIN 값을계산 -1 argument 1 지수함수로지수값을계산한다. 제곱근값을계산한다. () 안의수는 0 보다커야한다. 제곱은 x**2, 세제곱 x** 3 자연로그 (natural log) 값을 계산한다. Log X e X e = Ln(X ) 로그의밑이 n 인로그값을계산한다. N=100 이면상용로그값 V=arcos( a); V=arcos( 0.3); V=cos(a) ; V=cos(3. 14159/3); V=arsin( a); V=arsin( 0.3); V=sin(a) ; V=sin(3* 3.14159); V=tan(a) ; V=tan(2) ; V=EXP(X) ; V=EXP(3. 2); V=SQRT(X); V=SQRT(3.2); V=LOG(X) ; V=LOG(3. 2); V=LOG(X) ; V=LOG2(3.2); V=LOG10( 3.2); SASHELP.CLASS 에서 WEIGHT( 단위 : 파운드 ) 관측치를사용하여상용로그변환하여 WEIGHT0 에저장하고 HEIGHT( 단위 : 인치 ) 는세제곱근을구하여 HEIGHT0 에저장하시오. SAS 데이터이름 : FN2 18
0도부터 360 도 ( 2 π ) 까지 0.1π 씩증가하면서 SIN 값을구하는프로그램을완성하시오. 정수, 절대값함수 내용 ABS( argument) 절대값을계산 CEIL(argument) argument 값 이상이면서 가장작은 정수 INT( argument) 정수값을출력한다. FLOOR(arguments) SIGN(argument) MOD( 숫자 1, 숫자 2) argument 값정수 이하이면서 가장큰 값의부호를출력한다. 양수면 1, 음수면 -1, 0 이면 0 의값이 저장된다. 숫자 1을숫자 2로나눈 나머지 계산. V=abs(-2.4); V=abs(a); V=ceil( (a); V=ceil( (-2.4); V=int(a); V=floor(a); V=sign( (a); V=sign( (name-90); V=mod(14,3); SASHELP.CLASSFIT 변수이름 predict 를소수점 2자리에서반올림한값을 PRED1, 버린값을 PRED2, 올림값을 PRED3 로하여저장하시오. SAS 데이터이름 : FN3 19
통계계산함수 함수 형태 내용 FACT(n) COMB(n,r) PERM(n,r) MAX( arguments) Factorial 값을구한다. () 안은반드시정수값이어야한다. n! combination 값을구한다. n, r 은 n! 정수이어야한다. ncr = r!( n r)! Permutation 값을구한다. n, r 은 정수이어야한다. n! n Pr = ( n r)! 최대값을구한다. V= =max(x1,x2,x3,x4); 연속일때 V= max(of x1-x4); 이형식은아래함수에도적용 V=FACT(a); V=FACT(6); V=COMB(5,2); V=COMB(a,b); V=PERM(5,2); V=PERM(a,b); V=max(a,b,c); V=max(1,5,-1,7); MIN( arguments) 변수관측치중최소값을구한다. V=min(a,b,c); N(arguments) 변수관측치개수 ( 결측치제외 ) V=n(a,b,c); SUM( arguments) 변수관측치들의합계산 V=sum(x,y,z); MEAN(arguments) RANGE(arguments) 변수관측치들의평균계산변수관측치들의범위계산 V=mean(x,y,z); V=range(x,y,z); STD( arguments) 변수관측치들의표준편차계산 STDERR(arguments) 변수관측치들의표준오차계산 VAR( arguments) 변수관측치들의분산계산 V=std(x,y,z); V=stderr(x,y,z); V=var(x,y,z); [ 참고 ] 변동계수와표준오차 변동계수 : CV = s = 100(%) x 집단간분산을비교하기위하여사용되는통계량 표준오차 : s / n 표준편차를표본개수의제곱근으로나눈값으로로표본평균의 표준편차 20
통계학과 40 명학생이시험을 5 번보았다. 각시험점수 (S1, S2,, S5) 평균이 50, 표준편차가 10 인 (T-점수화하였음 ) 정규분포를따른다고한다. 각학생점수중가장큰값을 MAX, 작은값을 MIN, 합을 SUM,, 평균을 AVG 에저장하시오. SAS 데이터이름 : FN4 차분 (difference) 함수 LAG( 변수명 ) LAGN( 변수명 ) V=DIF( 변수명 ) V=DIFN( 변수명 ) 내용이전관측치를가져온다. n번째이전관측치를가져온다. 현재관측치와이전관측치의차이를구한다. 그러므로 DIF=X- LAG( X); 이다. 현재관측치와이전관측치의차이를구한다. 그러므로 DIFN=X- LAGN(X); 이다. V=LAG(X); V=LAG2( (X); V=DIF(X); V=DIF2( (X); SASHELP.CLASS WIEGHT 에시차 1 을 WEIGHT1 로하시오. 시차변수를를이용하여전학생대비몸무게증가율 ( 현재학생몸무게 전학생몸무게 )/ 전학생몸무게 *1000 구하고이를 RATIO 에저장하시오. 데이터이름 : FN5 21
관측치 변환함수 LENGTH( 변수명 ); LEFT( 변수명 ); RIGHT( 변수명 ); SUBSTR(argument, 시작, 길이 ); TRIM( 변수명 ); UPCASE( 변수명 ); 문자열 문자열 내용문자변수문자열 (string) 길이 출력한다. 문자열의왼쪽정렬한다. 문자열의오른쪽정렬한다. 문자열관측치의일부를얻는데 사용된다. 시작은문자열시작 위치, 길이는문자개수를 지정한다. 문자열뒤쪽공백없앤다. 문자열을대문자로변환한다. 두문자열합치기 V=length(z); ; V=length( se ); V=left(z); V=left( se ); V=right(z); V=right( see ); V=substr(z,1,3); V=substr( hii,1,2); V=trim(z); V=trim( hi ); V=upcase(z); ; V=upcase ( hi ); V= 1 오른쪽아래결과와같이출력되도록빈칸을메우시오. 22