<52B1E2C3CAB9D7C5EBB0E8BAD0BCAE2E687770>

Size: px
Start display at page:

Download "<52B1E2C3CAB9D7C5EBB0E8BAD0BCAE2E687770>"

Transcription

1 R 기초및통계분석 도서출판신아문화사

2

3 서 문 Praise the Lord. 2014년 12월 1일제주연구원장으로취임하게되어학교를휴직하고 3년을가르치는일에서떠나게되었는데마지막강의시간에학생들에게다음과같은약속을하였다. 1993년제주대학교에부임하여경제통계학을강의하면서 2시간이론강의및 1시간실습을지켜왔고, 그동안 MSTAT, Excel, SAS, Stata 등다양한통계패키지를가르쳐왔는데지금은빅데이터의시대이고빅데이터처리에최적화되어있는 R 언어를공부해야할때이다. 따라서본인이 3년의임기를마치고학교로복귀하여경제통계학을다시가르치게되는 2018년 1학기에는 R 언어로실습을하겠다고하였다. 이약속은시대의변화에따른것이기도했지만나를채찍질하기위한나와의약속이기도하였다. 눈에보이지않으면곧잊혀진다 (out of sight and out of mind) 는말이있듯이 3년동안연구원업무에집중하다보니항상 R 언어를공부해야한다는생각은있었지만우선순위에서밀려공부를하지못했다. 2017년 12월 1일학교로다시돌아와보니 3년전에학생들과했던약속이떠올랐고 3월초에개강을앞두고마음이급해졌다. 2018년새해들어 R 언어를집중적으로공부하고 2018년 1학기강의안을마련하였다. 다소부족했지만 2018년 1학기강의를마치고, 2학기에강의안을업데이트하였고, 그결과물이 R 기초및통계분석 으로발간되게되었다. 본교재에서사용된데이터는본인의개인홈페이지 ( data/) 에서다운받을수있고, 실습을위한코드는 에서다운받을수있다. R 언어의유용한점중의하나는다양한 packages가있어이를활용하면다양한분석이가능하다는것이다. 본교재에서활용되는 packages들을한번에 install할수있도록 install- packages.r을만들어놓았으므로본교재로실습하기전에먼저 install-packages.r을실행하기를바란다.

4 지난두학기동안 R 언어를가르치면서강조했던단어가 R 언어의열성적인지지자를뜻하는 R Enthusiast이었다. 학생들에게그들의열정을쏟아부어도아깝지않은그무엇을소개하고싶었는데경제통계학과관련해서는그것이바로 R 언어라고몇번을강조하였다. 본교재가나오기까지많은도움이있었다. 무엇보다도 2018년도제주대학교국립대학육성사업의지원이있었기에본교재가출간될수있었다. 처음대하는 R 언어를포기하지않고굳굳하게따라와준학생들에게도감사를드린다. 그리고항상기도로격려를해주는사랑하는아내와두딸셀라와셀리에게도감사의말을전한다 년 1 월 뉴욕에서저자

5 목차 _ 1 목 차 제1장 R 기본사용 3 1. R 개요 4 2. RStudio 시작하기 9 3. 명령어실행방법 수학및통계함수 15 제 2 장 Data set Data set 만들기 데이터관리기본명령어 30 제3장기본분석 그림그리기 ggplot2를이용한그림그리기 기술통계량계산 평균의계산 두확률변수의공분산 59 제4장이론적확률분포 이론적확률분포의관계 베르누이분포 이항분포 포아송분포 73

6 2 _ R 기초및통계분석 5. 균등분포 표준정규분포 분포 t-분포 F-분포 98 제5장표본분포 표본평균의표본분포 중심극한정리 표본분산의표본분포 127 제6장추정 추정및신뢰구간 모평균의구간추정 모분산의구간추정 144 제7장가설검정 가설검정의기초개념 단일집단에대한가설검정 두집단에대한가설검정 161 참고문헌 171 부록 1. R 코드 173 부록 2. 주요통계표 221

7 제 1 장 R 기본사용 1. R 개요 2. RStudio 시작하기 3. 명령어실행방법 4. 수학및통계함수

8 4 _ R 기초및통계분석 제 1 장 R 기본사용 1. R 개요 (1) R 이란? 컴퓨터로통계및계량분석이가능하도록계산과정을정리해놓은프로그램을통계패키지 ( 또는소프트웨어 ) 라고하는데현재시중에는 SAS(Statistical Analysis System), SPSS(Statistical Package for the Social Sciences), Stata(Statistics Data), WinRats-32(Regression Analysis for Time Series), EViews(Econometric Views), Limdep(Limited Dependent model) 등다양한종류의통계소프트웨어가출시되어활용되고있다. 한편, 컴퓨터에명령을내리는데필요한 컴퓨터의언어 를프로그래밍언어 (programming language) 라고하는데전통적으로 Basic, Cobol, Fortran, C, C++ 등이활용되어왔으나최근에는 GAUSS(Matrix programming language), Matlab, S-plus, R 등의사용자가증가하고있다. R은프로그래밍언어로구성된통계분석도구로다양한분석기능을가지고있는통계패키지임에도불구하고무료로제공되고있어세계적으로많은분석가들이사용하고있다. R은오클랜드대학교의 Robert Gentleman과 Ross Ihaka에의해 1995년에처음으로개발되었고현재는 R core team 이 R 프로젝트를운영하고있다. R은데이터의조작 (manipulation) 과연산 (calculation), 그리고그래픽표현 (graphical display) 을통합하는통합패키지로금융공학, 생명공학, 행정학, 의학, 자연과학등여러전문분야에서활용도가높아지고있는데그이유는 R이다음과같은장점을가지고있기때문이다. 첫째, R은간단한명령어만으로복잡한계산을수행할수있는프로그램이기때문에분석을빠르게수행할수있다.

9 제 1 장 R 기본사용 _ 5 둘째, R은 Linux, UNIX, MAC OS X, Windows 등모든운영체제에서실행가능하고, 각종 DBMS(Database Management System) 데이터에접근이가능하고, 별도의패키지를사용하면 R의소스를 Java, Python, C, C++ 등의언어와호환하여사용할수있다. 셋째, R은공개소프트웨어로모든소스가공개되므로자유로운수정및변경이가능하여다양하고정밀한분석을할수있다. 넷째, 경제학, 행정학, 의학, 생물학등다양한학문분야에서사용되는수많은통계분석방법이패키지형태로공개되므로사용자가복잡한계산식을일일이입력하여분석해야하는수고를들수있다. 모든일에혜택과비용이동시에발생하듯이 R은이러한장점을가지고있지만 R 을사용하기위해서는 R 언어를배워야하며, 새로운기능이빠르게추가되고있기때문에지속적으로새로운기능을습득해야하는어려움이있다. (2) RStudio 란 소프트웨어개발과정에서필요한코딩 (coding), 디버깅 (debugging), 컴파일 (compile) 의과정을하나로패키지화한소프트웨어를통합개발환경 (Integrated Development Environment; IDE) 이라고하는데 RStudio는 R의통합개발환경소프트웨어로 RStudio를사용하기위해서는반드시 R이설치되어있어야한다. 코딩 : 프로그래밍언어를이용하여구체적인컴퓨터프로그램을만드는기술 디버깅 : 코드상의오류를찾아내어수정하는과정 컴파일 : 컴퓨터가처리한언어를사람이읽을수있는언어나그림으로변환하는프로그램 RStudio는기존의 R 개발환경에새로운기능들이추가되어사용자효용을높인유틸리티소프트웨어로다음과같은장점을가지고있다. 첫째, RStudio 역시모든운영체제에서실행이가능하며, 모든 R 버전과호환이가능하다. 둘째, 코딩작업에필요한콘솔 (console), 디버깅작업에필요한소스에디터 (source editor), 그리고데이터뷰어 (data viewer) 및도표이력 (plot history) 등통합개발환경의주요요소들이잘통합되어편리하고신속한작업이가능하다.

10 6 _ R 기초및통계분석 셋째, 표시되는구문을종류별로구분하고 ( 예를들어입력문과출력문, 함수등 ) 여러가지다른색으로강조하여표시하는구문강조 (syntax highlight) 기능, 기능과함수의첫글자로함수를자동으로검색하거나함수에포함될요소들을표시해주는코드완성 (code completion), 코드입력시괄호나따옴표가자동으로입력되는기능등이추가되어수식입력과정에서사용자의편의를기하고있다. (3) R 및 RStudio 설치 R의설치파일을다운로드하기위해서는 R의웹페이지 ( 에접속하여다음과같은순서로진행한다. 첫째, 웹페이지초기화면 (< 그림 1-1>) 의좌측상단에있는 CRAN을클릭한다. < 그림 1-1> R 웹페이지초기화면 둘째, CRAN 페이지의국가별목록에서대한민국 (< 그림 1-2>) 의웹페이지주소중하나를클릭한다. < 그림 1-2> CRAN 페이지목록 ( 대한민국 ) 셋째, 운영체제선택메뉴 (< 그림 1-3>) 에서본인의운영체제에해당되는다운로드를클릭한다.

11 제 1 장 R 기본사용 _ 7 < 그림 1-3> 운영체제선택메뉴 넷째, Download R for Windows를선택하면세가지메뉴 (< 그림 1-4>) 가나타나는데 base 메뉴를선택한다, < 그림 1-4> 운영체제별메뉴 다섯째, Download R for Windows(< 그림 1-5>) 를클릭하여설치파일을다운로드하고설치한다. 단, 설치시설치언어선택은영문을권장한다. < 그림 1-5> R 설치프로그램다운로드 RStudio 설치파일을다운로드하기위해서는 RStudio의웹페이지 ( 에접속하여다음과같은순서로진행한다. 첫째, 웹페이지초기화면 (< 그림 1-6>) 의우측상단에있는 Download RStudio를클릭한다.

12 8 _ R 기초및통계분석 < 그림 1-6> RStudio 웹페이지초기화면 둘째, RStudio의다양한버전 (< 그림 1-7>) 중무료인 RStudio Desktop Open Source License의 Download를클릭한다. < 그림 1-7> RStudio 의다양한버전 셋째, 운영체제별로분류된 RStudio의설치파일목록에서 RStudio Windows Vista/7/8/10 버전 (< 그림 1-8>) 을클릭하여설치파일을다운로드하고설치한다. < 그림 1-8> RStudio Desktop 버전의 OS 용설치파일

13 제 1 장 R 기본사용 _ 9 2. RStudio 시작하기 RStudio아이콘을클릭하면 < 그림 1-9> 와같이 Sources 창, Console 창, Environment/History 창, Files, Packages/Plots, Help, Viewer 창등 4개의창이나타난다. Source 창 : 프로그램 Source를편집프로그램내의 R 명령어에커서를두고 Ctrl-R로실행 Console 창 : 명령어를입력하고결과를확인상하화살표를이용하여이전명령어를편집및실행 Environment/History 창 - Environment 창 : 변수또는객체의목록과값확인 - History 창 : 명령어 History를확인및검색하고더블클릭하여 Console 창으로보냄 Files, Packages/Plots, Help, Viewer 창 - Files, Packages 창 : 파일과폴더및패키지목록 - Plots, Help, Viewer 창 : 그래프, 도움말, HTML 등명령어실행결과 < 그림 1-9> RStudio 4 개의창

14 10 _ R 기초및통계분석 3. 명령어실행방법 R 에서명령어를실행시키는방법에는직접명령문과할당명령문이있다. (1) 직접명령문 Console 창에서명령어를직접입력하여엔터를쳐서실행하거나 print() 함수를사용하여실행할수도있는데 R을마치계산기처럼사용할수있다. 콘솔의환영메시지는 Edit>Clear Console( 또는 Ctrl+L) 을선택하여지운후 ( 예제 1-1) 과같이명령어를입력하여엔터를치면 ( 예제 1-1) 의실행결과를보여준다. ( 예제 1-1) 직접명령문 1 > 2^3 > 2*3 > 3/3 > 3+3 > 3-3 > q() ( 예제 1-1) 의실행결과 > 2^3 [1] 8 > 2*3 [1] 6 > 3/3 [1] 1 > 3+3 [1] 6 > 3-3 [1] 0 > q()

15 제 1 장 R 기본사용 _ 11 또는 Ctrl+L을실행하여 console 창의내용을지운후 ( 예제 1-2) 와같이명령어를입력하여엔터를치면 ( 예제 1-2) 의실행결과를보여준다. ( 예제 1-2) 직접명령문 2 > print(2^.5, digits=5) > print(2*3, digits=5) > print(2/3, digits=5) > print(3+3, digits=5) > print(3-3, digits=5) > q() ( 예제 1-2) 의실행결과 > print(2^.5, digits=5) [1] > print(2*3, digits=5) [1] 6 > print(2/3, digits=5) [1] > print(3+3, digits=5) [1] 6 > print(3-3, digits=5) [1] 0 (2) 할당명령문 특정한데이터또는연산결과를새로운문자열에할당하여하나의객체를정의하는명령문으로작업결과의반환을요구하지않는다. 할당명령문의형태는할당연산자인 <-( 또는 ->) 를사용하는형태와할당함수인 assign() 을사용하는형태가있는데모두동일한기능을수행한다. 할당명령문에의해생성된객체를제거하려면 rm() 함수를이용하면된다. ( 예제 1-3) 과같이명령어를입력하여엔터를치면 ( 예제 1-3) 의실행결과를보여준다.

16 12 _ R 기초및통계분석 여기서 x<-c(1,2,3,4,5) 는 1부터 5까지 5개의수치형 (numeric) 원소를결합함수인 c() 로묶어길이 5인벡터를생성한후식별문자 x 에할당하는명령문이다. ( 예제 1-3) 할당명령문 1 > x<-c(1,2,3,4,5) > y<-c(1:10) > z<-x+y > x > y > z >rm(z) >z ( 예제 1-3) 의실행결과 > x<-c(1,2,3,4,5) > y<-c(1:10) > z<-x+y > x [1] > y [1] > z [1] > rm(z) > z Error: object 'z' not found 한편, ( 예제 1-4) 와같이명령어를입력하여엔터를치면실행결과를보여준다. ( 예제 1-4) 할당명령문 2 > assign( x, c(1,2,3,4,5)) > assign( y, c(1:10)) > assign( z, x+y)

17 제 1 장 R 기본사용 _ 13 > x > y > z > rm(z) > z ( 예제 1-4) 의실행결과 > assign("x", c(1,2,3,4,5)) > assign("y", c(1:10)) > assign("z",x+y) > x [1] > y [1] > z [1] > rm(z) > z Error: object 'z' not found (3) 코드입력및실행 Source 창에서프로그램 Source를작성, 편집, 저장, 실행, 불러오기등을할수있다. 작성된프로그램을한줄씩실행하는방법은 Run을클릭 ( 또는 Ctrl+Enter) 하고, 여러줄또는모든줄을동시에실행하는방법은여러줄또는모든줄을선택하고 Run을클릭하면된다. b1-ch1-5.r과같이명령어를입력하여모두선택하고 Run을클릭하면다음과같은실행결과를보여준다.

18 14 _ R 기초및통계분석 b1-ch1-5.r 의실행결과 > x<-c(1:10) > x [1] > sort(x) [1] > sort(x, decreasing=t) [1] > mean(x) [1] 5.5 > median(x) [1] 5.5 > quantile(x) 0% 25% 50% 75% 100% > diff(range(x)) [1] 9 > var(x) [1] > sd(x) [1] 작성된프로그램 Source를저장하기위해서는 File/Save As를선택한후 < 그림 1-10> 과같이본인이원하는디렉토리에파일이름 ( 예, b1-ch1-1) 을입력하면되는데프로그램의확장자는 R로지정이된다.

19 제 1 장 R 기본사용 _ 15 < 그림 1-10> 프로그램의저장 저장된파일을불러오기위해서는 File/Open File을선택한후불러올파일이위치한디렉토리에서해당파일을불러오면된다. 4. 수학및통계함수 (1) 수학함수 R에서는다양하고광범위한내장함수를제공하고있어사용자는분석과정에서빈번하게사용되는수식을단순화한함수를사용함으로써작업의효율성을높일수있다. R 에서주로사용되는수학함수와그기능은 < 표 1-1> 과같다. < 표 1-1> 주요수학함수 함수 기능 함수 기능 sum() 모든원소의합 range() 범위함수 abs() 절댓값함수 exp() 지수함수 sqrt() 제곱근함수 log() 자연로그함수 max() 최댓값함수 log10() 상용로그함수 min() 최솟값함수 round() 소수점이하반올림

20 16 _ R 기초및통계분석 b1-ch1-2.r과같이수학함수와관련된명령어를입력하여모두선택하고 Run을클릭하면다음의실행결과를보여준다. b1-ch1-2.r 의실행결과 > a<-c(-3,-2,-1,1,2,3) > sum(a) [1] 0 > abs(a) [1] > as<-a[4:6] > sqrt(as) [1] > max(a) [1] 3 > min(a) [1] -3 > range(a) [1] -3 3 > exp(a) [1] > log(as) [1] > log10(as) [1]

21 제 1 장 R 기본사용 _ 17 (2) 기본통계함수 기초적인통계분석과관련하여 R에서주로사용되는통계함수와그기능은 < 표 1-2> 와같다. 기본통계함수의사용은 b1-ch1-1.r을참고하면된다. < 표 1-2> 기본통계함수 함수 기능 함수 기능 mean() 산술평균 cor() 상관계수 sort() 오름 ( 내림 ) 차순정리 cov() 공분산 median() 중앙값 summary() 요약통계량 quantile() 분위수 cumsum() 누적합 diff() 원소사이의차이 lag() 시차변수만들기 var() 분산 sd() 표준편차 b1-ch1-3.r과같이기본통계함수와관련된명령어를입력하여모두선택하고 Run을클릭하면다음과같은실행결과를보여준다. > x<-c(21,4,13,6,12,7,4,25,22) b1-ch1-3.r 의실행결과 > y<-c(-2,4,-3,8,-7,8,-2,-6,5) > x;y [1] [1] > cov(x,y) [1] > cor(x,y) [1] > summary(x);summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max

22 18 _ R 기초및통계분석 Min. 1st Qu. Median Mean 3rd Qu. Max > cumsum(1:10);cumprod(1:10) [1] [1] (3) 확률분포관련통계함수 확률분포와관련된통계함수와그기능은 < 표 1-3> 과같다. < 표 1-3> 확률분포통계함수 분포 R 함수 인수 (arguments) binomial binom() size, prob chi-squared chisq() df, ncp F f() df1, df2, ncp normal norm() mean, sd poison pois() lambda Student s t t() df, ncp uniform unif() min, max 우리가원하는통계량을얻기위해서는함수의이름앞에 < 표 1-4> 와같은접두사를붙여야한다. < 표 1-4> 확률분포접두사 접두사 d p q r 기능확률밀도함수 (PDF) 의확률값, f(x) 누적분포함수 (CDF) 의확률값, F(x) 분위수 (quantile) 값, F -1 (x) 무작위난수생성

23 제 1 장 R 기본사용 _ 19 b1-ch1-4.r과같이확률분포와관련된명령어를입력하여모두선택하고 Run을클릭하면다음과같은실행결과를보여준다. b1-ch1-4.r 의실행결과 > # 수익률평균 =40%, 표준편차 =10% 인정규분포에서수익률이 60% 보다낮을확률 > pnorm(60,mean=40,sd=10) [1] > # 수익률평균 =40%, 표준편차 =10% 인정규분포에서수익률이 60% 보다높은확률 ( 표준화 ) > 1-pnorm(2,0,1) [1] > #P(Z<1.645) > pnorm(1.645, 0,1) [1] > #P(Z<K)=0.95일때, K의값은? > qnorm(0.95, 0,1) [1] > #t-통계량이 , n=16일때 p의값은? > pt(-3.271, 15) [1] > #n=16일때, 5% 유의수준에서기각역 ( 단측 ) > qt(p=0.05, df=15) [1] > round(rnorm(n=20, mean=40, sd=10), digits=2) [1] [15]

24

25 제 2 장 Data set 1. Data set 만들기 2. 데이터관리기본명령어

26 22 _ R 기초및통계분석 제 2 장 Data set 1. Data set 만들기 (1) R 에서직접자료를입력하기 R에서숫자나문자를직접입력하여데이터파일을만드는방법에는 Data Editor 창을이용하는방법과명령어를이용하는방법이있다. R Source 창에서다음과같이입력하면 Data Editor 창이뜨는데 < 그림 2-1> 과같이엑셀에서데이터를입력하는방법과유사하게데이터를입력하면된다. > mydata<-data.frame(age=numeric(), gender=character(), weight=numeric()) > mydata<-edit(mydata) < 그림 2-1> Data Editor 창및데이터입력

27 제 2 장 Data set _ 23 한편, 프로그래밍을할경우에는 Data Editor 창을이용한데이터입력방식을사용할수없으므로이경우명령어를활용할수있다. 예를들어나이 (age), 성별 (gender), 몸무게 (weight) 를보여주는데이터는프로그램작성시다음과같이명령어를입력하면된다. age<-c(25,30,56,61,33,30,85,47,27,70) gender<-c("female","male","male","male","female","male","female","female","male","female") weight<-c(52,65,89,68,55,73,60,49,105,58) (2) 외부에서작성된자료를불러들여오기 1 ASCII-TEXT 파일외부에서작성된 ASCII-TEXT 파일을 R로불러들여오기위해서는 b1-ch2-1.r 또는 b1-ch2-2.r을실행하면 ASCII-TEXT 파일을불러오고, 이를행렬로변경하면요약통계량을포함한다양한통계분석이가능하다. b1-ch2-1.r 의실행결과 > sample1<-" > sample_dat<-read.delim(sample1,header=t) > sample_dat year GDP consumption

28 24 _ R 기초및통계분석 > year<-sample_dat$year > gdp<-sample_dat$gdp > consumption<-sample_dat$consumption > min(gdp) [1] > max(consumption) [1] > mean(gdp) [1] > mean(consumption) [1] > median(gdp) [1] > median(consumption) [1] > quantile(gdp) 0% 25% 50% 75% 100%

29 제 2 장 Data set _ 25 > quantile(consumption) 0% 25% 50% 75% 100% > var(gdp) [1] > var(consumption) [1] > sd(gdp) [1] > sd(consumption) [1] > summary(sample_dat) year GDP consumption Min. :2000 Min. : Min. : st Qu.:2004 1st Qu.: st Qu.: Median :2008 Median : Median : Mean :2008 Mean : Mean : rd Qu.:2012 3rd Qu.: rd Qu.: Max. :2016 Max. : Max. : b1-ch2-2.r 의실행결과 > sample1<-" > sample_dat<- as.matrix(read.delim(sample1,header=t),ncol=3) > sample_dat year GDP consumption [1,] [2,] [3,] [4,]

30 26 _ R 기초및통계분석 [5,] [6,] [7,] [8,] [9,] [10,] [11,] [12,] [13,] [14,] [15,] [16,] [17,] > year<-sample_dat[,1] > year [1] [17] 2016 > gdp<-sample_dat[,2] > gdp [1] [9] [17] > consumption<-sample_dat[,3] > consumption [1] [9]

31 제 2 장 Data set _ 27 [17] > colmeans(sample_dat) year GDP consumption > summary(sample_dat) year GDP consumption Min. :2000 Min. : Min. : st Qu.:2004 1st Qu.: st Qu.: Median :2008 Median : Median : Mean :2008 Mean : Mean : rd Qu.:2012 3rd Qu.: rd Qu.: Max. :2016 Max. : Max. : CSV 파일 CSV(Comma Separated Value) 파일은모든항목을콤마 (,) 단위로구분하여저장한데이터파일로엑셀, 워드, 메모장등다양한응용프로그램에서보기및편집이가능하다는장점이있다. b1-ch2-3.r을실행하면 CSV 파일을불러오고, 요약통계량을포함한다양한통계분석이가능하다. b1-ch2-3.r 의실행결과 > sample1<-(" > sample_dat<-read.csv(sample1,header=t,sep=",") > sample_dat year gdp consumption

32 28 _ R 기초및통계분석 > year<-sample_dat$year > gdp<-sample_dat$gdp > consumption<-sample_dat$consumption > summary(sample_dat) year gdp consumption Min. :2000 Min. : Min. : st Qu.:2004 1st Qu.: st Qu.: Median :2008 Median : Median : Mean :2008 Mean : Mean : rd Qu.:2012 3rd Qu.: rd Qu.: Max. :2016 Max. : Max. : Excel 파일 Excel을불러오는방법은다양한방법이있는데웹상에있는 xlsx 파일을불러올수있는방법을설명하고자한다. 이를위해서는먼저 openxlxs 패키지를 install한후 library로불러와야하는데 b1-ch2-4.r을실행하면 Excel 파일을불러오고, 이를행렬로변경하면요약통계량을포함한다양한통계분석이가능하다. 만약에 xls 파일을위와같은방법으로불러오기위해서는 xls 파일을 xlsx 파일로변환시켜주면된다.

33 제 2 장 Data set _ 29 b1-ch2-4.r 의실행결과 > library(openxlsx) > excel_sample1<-read.xlsx(" > excel_sample1 year gdp consumption > excel_sample1_dat<- data.matrix(excel_sample1) > excel_sample1_dat year gdp consumption

34 30 _ R 기초및통계분석 > year<-excel_sample1_dat[,1] > gdp<-excel_sample1_dat[,2] > consumption<-excel_sample1_dat[,3] > summary(excel_sample1_dat) year gdp consumption Min. :2000 Min. : Min. : st Qu.:2004 1st Qu.: st Qu.: Median :2008 Median : Median : Mean :2008 Mean : Mean : rd Qu.:2012 3rd Qu.: rd Qu.: Max. :2016 Max. : Max. : 데이터관리기본명령어 (1) 변수의변환및변수명의변경 기존의변수를이용하여새로운변수를만들어사용할수있는데예를들어 gdp 및 consumption에자연로그를취하여 lgdp 및 lconsumption 변수를만들수있다. 변수명을변경할수있는데하나의변수명을변경하거나 ( 예를들어, consumption 을 cons로 ) 전체변수명을변경할수있다. b1-ch2-5.r을실행하면변수명이바뀐것을확인할수있다.

35 제 2 장 Data set _ 31 b1-ch2-5.r 의실행결과 > library(openxlsx) > excel_sample1<-read.xlsx(" > excel_sample1_dat<- data.matrix(excel_sample1) > year<-excel_sample1_dat[,1] > gdp<-excel_sample1_dat[,2] > consumption<-excel_sample1_dat[,3] > lgdp<-log(gdp) > lconsumption<-log(consumption) > lgdp; lconsumption > names(excel_sample1) [1] "year" "gdp" "consumption" > excel_sample1 year gdp consumption

36 32 _ R 기초및통계분석 > names(excel_sample1)[3]<-"cons" > excel_sample1 year gdp cons

37 제 2 장 Data set _ 33 > names(excel_sample1)<-c("t","y","c") > excel_sample1 T Y C b1-ch2-6.r은엑셀데이터를불러와서시계열로변경하고, 시계열의시차변수를만들고, 전년대비증가율을구한후그림을그린다. 또한시계열의로그를취한후차분값을구하면전년대비증가율의근사치를구할수있음을보여주고있다. > library(openxlsx) b1-ch2-6.r 의실행결과 > excel_sample1<-read.xlsx(" > excel_sample1_dat<- data.matrix(excel_sample1) > year<-excel_sample1_dat[,1]

38 34 _ R 기초및통계분석 > gdp<-excel_sample1_dat[,2] > consumption<-excel_sample1_dat[,3] > graphics.off() > par("mar") [1] > par(mar=c(1,1,1,1)) > y.ts<-ts(gdp, start=2000, end=2016, frequency=1) > c.ts<-ts(consumption, start=2000, end=2016, frequency=1) > lagy<-lag(y.ts, k=-1) > lagc<-lag(c.ts, k=-1) > gy<-(y.ts-lagy)/lagy > gc<-(c.ts-lagc)/lagc > ly.ts<-log(y.ts) > lc.ts<-log(c.ts) > gly<-ly.ts-lag(ly.ts, k=-1) > glc<-lc.ts-lag(lc.ts, k=-1) > (y<-cbind(gy, gly)) Time Series: Start = 2001 End = 2016 Frequency = 1 gy gly

39 제 2 장 Data set _ > (c<-cbind(gc, glc)) Time Series: Start = 2001 End = 2016 Frequency = 1 gc glc

40 36 _ R 기초및통계분석 > par(mfrow=c(2,1)) > plot(gy, type="l", col="red", main="exact Growth Rate vs. Approx. Growth Rate of GDP") > lines(gly, lwd=3, lty=6, col="green") > plot(gc, type="l", col="red", main="exact Growth Rate vs. Approx. Growth Rate of Consumption") > lines(glc, lwd=3, lty=6, col="green")

41 제 2 장 Data set _ 37 (2) 부분자료추출 데이터의일부분을추출할수도있는데예를들어, b1-ch2-7.r을실행하면 2000 년대와 2010년대의자료를각각추출할수있다. > library(openxlsx) b1-ch2-7.r 의실행결과 > excel_sample1<-read.xlsx(" > excel_sample1_dat<- data.matrix(excel_sample1) > year<-excel_sample1_dat[,1] > gdp<-excel_sample1_dat[,2] > consumption<-excel_sample1_dat[,3] > data1<-excel_sample1_dat[1:10,] > data1 year gdp consumption > data2<-excel_sample1_dat[11:17,] > data2

42 38 _ R 기초및통계분석 year gdp consumption

43 제 3 장 기본분석 1. 그림그리기 2. ggplot2를이용한그림그리기 3. 기술통계량계산 4. 평균의계산 5. 두확률변수의공분산

44 40 _ R 기초및통계분석 제 3 장기본분석 1. 그림그리기 (1) 선그래프 데이터를이용하여다양한그림을그릴수있는데예를들어, b1-ch3-1.r을실행하면 2000년부터 2016년까지우리나라의 GDP와 Consumption( 소비 ) 에대한선그래프를그릴수있다. b1-ch3-1.r 의실행결과 > csv_sample1<-" > csv_sample_dat<- as.matrix(read.csv(csv_sample1,header=t),ncol=3) > year<-csv_sample_dat[,1] > gdp<-csv_sample_dat[,2] > consumption<-csv_sample_dat[,3] > gdp [1] [7] [13] > consumption [1]

45 제 3 장기본분석 _ 41 [7] [13] > par(mfrow=c(2,1)) # 한페이지에그림을위아래로나누어그림 > plot(year, gdp, type="l", main="gdp of Korea( )") > plot(year, consumption, type="l", lty=2,main="consumption of Korea( )") GDP of Korea( ) gdp year Consumption of Korea( ) consumption 4e+05 9e year (2) 히스토그램 b1-ch3-2.r을실행하면 2000년부터 2016년까지우리나라의 GDP와 Consumption( 소비 ) 에대한히스토그램을그릴수있다.

46 42 _ R 기초및통계분석 b1-ch3-2.r 의실행결과 > csv_sample1<-" > csv_sample_dat<- as.matrix(read.csv(csv_sample1,header=t),ncol=3) > year<-csv_sample_dat[,1] > gdp<-csv_sample_dat[,2] > consumption<-csv_sample_dat[,3] > gdp [1] [7] [13] > consumption [1] [7] [13] > par(mfrow=c(1,2)) # 한페이지에그림을좌우로나누어그림 > hist(gdp) > hist(consumption, breaks=8, col="red") # 구간의수를 8 개로함 Histogram of gdp Histogram of consumption Frequency Frequency gdp consumption

47 제 3 장기본분석 _ 43 표준정규분포로부터 10,000개의자료를만든후히스토그램을그리기위해서다음의명령을입력하면된다. >set.seed(1234) # 임의의정수 ( 예를들어 1이나 123이나 300이나 12345) 를부여하여재현가능한무작위번호를얻을수있는함수 >x<-rnorm(10000) # 표준정규분포로부터 10,000개의자료를생성 >hist(x, breaks=100) # 구간의수를 100으로하는히스토그램을그림 (3) 산포도 b1-ch3-3.r을실행하면 2000년부터 2016년까지우리나라의 GDP와 Consumption( 소비 ) 에대한산포도 (scatter plot) 를그릴수있다. b1-ch3-3.r 의실행결과 > csv_sample1<-" > csv_sample_dat<- as.matrix(read.csv(csv_sample1,header=t),ncol=3) > year<-csv_sample_dat[,1] > gdp<-csv_sample_dat[,2]

48 44 _ R 기초및통계분석 > consumption<-csv_sample_dat[,3] > gdp [1] [7] [13] > consumption [1] [7] [13] > plot(gdp, consumption, main="scatter plot of GDp and Consunption") Scatter plot of GDp and Consunption consumption 4e+05 6e+05 8e+05 1e gdp

49 제 3 장기본분석 _ 45 (4) 상자그래프 상자그래프 (box plot) 는최솟값, 아래사분위수 ( ), 중위수, 위사분위수 ( ), 최댓값등 5개순서통계량을이용하여자료를요약 정리하는그래프표현방법으로두개이상의집단을상대적으로비교하기쉬운장점이있다. 상자그래프는 과 를연결하는상자를그리고, 그상자안에중위수를나타내는선을그리며, 최솟값과, 그리고 와최댓값을선으로연결하는표현방법으로 5개의순서통계량의위치를관찰하여자료분포의특징을알수있다. b1-ch3-4.r을실행하면중간고사 (mid), 기말고사 (final), 총점 (total) 에대한상자그래프를그릴수있다. > library(openxlsx) b1-ch3-4.r 의실행결과 > sample1<-read.xlsx(" sheet=1, startrow=1, colnames = T) > mid<-sample1$mid > final<-sample1$final > total<-sample1$total > grade<-sample1$grade > summary(sample1) mid final total grade Min. :12.00 Min. :10.00 Min. :27.70 Min. : st Qu.: st Qu.: st Qu.: st Qu.:2.750 Median :60.00 Median :55.00 Median :67.75 Median :4.000 Mean :59.58 Mean :52.08 Mean :67.04 Mean : rd Qu.: rd Qu.: rd Qu.: rd Qu.:5.000 Max. :98.00 Max. :93.00 Max. :95.45 Max. :8.000

50 46 _ R 기초및통계분석 > par(mfrow=c(1,3)) # 한페이지에그림을좌우로 3 개나누어그림 > boxplot(mid, main="box plot of mid") > boxplot(final, main="box plot of final") > boxplot(total, main="box plot of total") Box plot of Test Score mid final total (5) 원그래프 (Pie Chart) 원그래프 (pie chart) 는전체자료가여러개의카테고리로분류되어지는경우개개의카테고리를전체에대한비율에따라원내부의면적을분할한파이 (pie) 모양의도표이다. 즉, 각범주의관측도수의상대적인크기를원을분할한형태로표현하는방법이다. b1-ch3-5.r을실행하면총점 (total) 을 8개의등급으로나누어원그래프를그릴수있다.

51 제 3 장기본분석 _ 47 b1-ch3-5.r 의실행결과 > library(openxlsx) > sample1<-read.xlsx(" sheet=1, startrow=1, colnames = T) > slices<-c(1,2,3,4,5,6,7,8) > lbls<-c("1 등급 ","2 등급 ","3 등급 ","4 등급 ","5 등급 ","6 등급 ","7 등급 ","8 등급 ") > pie(slices, labels=lbls, main="pie Chart of Total Score")> (6) 막대그래프 (Bar Chart) 도수분포표는숫자로관측된양적자료 ( 연속형자료 ) 를일정한구간으로나눈후에각구간에속한개수들의수를도수로나타낸표이다. 도수분포표에서각구간의관측도수를막대형태로표현하여그크기를비교할수있도록하는자료의요약방법이막대그래프이다.

52 48 _ R 기초및통계분석 b1-ch3-6.r을실행하면총점 (total) 을 8개의구간으로나누어막대그래프를그릴수있다. > library(openxlsx) b1-ch3-6.r 의실행결과 > sample1<-read.xlsx(" sheet=1, startrow=1, colnames = T) > mid<-sample1$mid > final<-sample1$final > total<-sample1$total > grade<-sample1$grade > total [1] [12] [23] [34] [45] [56] > grade [1] [35] > counts<-table(total, grade) > barplot(counts, main="bar Chart of Total Score", xlab="grade")

53 제 3 장기본분석 _ 49 Bar Chart of Total Score Grade (7) 잎 - 줄기그래프 (Stem and Leaf Plot) 숫자단위 (1단위, 10단위, 100단위, ) 를이용하여숫자를두부분으로나누어앞부분은줄기로, 그리고뒷부분은잎으로하여자료를요약 표현하는방법이잎-줄기그래프이다. 잎-줄기그래프를그리는방법은먼저숫자를작은것부터크기순서에따라열 (columnize) 로나열하고, 관측값을그숫자가속한위치의줄기에맞추어잎부분을기록하는데줄기내의잎의값들은작은것부터크기순서로정리한다. 이때각줄기에너무많은관측값이주어지면각줄기에두줄을할당하여첫줄에는잎의 0, 1, 2, 3, 4를기록하고, 둘째줄에는잎의 5, 6, 7, 8, 9를기록할수있다. b1-ch3-7.r을실행하면총점 (total) 으로잎-줄기그래프를그릴수있다. > library(openxlsx) b1-ch3-7.r 의실행결과 > sample1<-read.xlsx(" sheet=1,

54 50 _ R 기초및통계분석 startrow=1, colnames = T) > mid<-sample1$mid > final<-sample1$final > total<-sample1$total > grade<-sample1$grade > total [1] [12] [23] [34] [45] [56] > stem(total) The decimal point is 1 digit(s) to the right of the > > stem(total, scale=0.5) # scale=0.5을통해줄기의수를조정할수있음 The decimal point is 1 digit(s) to the right of the

55 제 3 장기본분석 _ > > stem(total, scale=2) # scale=0.5을통해줄기의수를조정할수있음 The decimal point is 1 digit(s) to the right of the ggplot2 를이용한그림그리기 R에서제공하는다양한시각화관련패키지중하나인 ggplot2 패키지는히스토그램, 상자그래프등다양한종류의그래프를그릴수있고글자크기, 폰트, 색상등도원하는형태로설정할수있어 ggplot2만으로도충분히원하는시각화가가능하다. b1-ch3-8.r을실행하면우리나라의 wifi가설치된위치를그림으로그리거나제주지역의행정구역을그릴수있다.

56 52 _ R 기초및통계분석 b1-ch3-8.r의실행결과 install.packages("ggplot2") library(ggplot2) con1<-url(" con2<-url(" load(con1) load(con2) ggplot()+geom_path(data=map, aes(x=long, y=lat, group=group)) ggplot()+geom_path(data=map.jeju, aes(x=long, y=lat, group=group)) lat long

57 제 3 장기본분석 _ lat long 3. 기술통계량계산 데이터의중심을측정하는통계량으로평균, 중위수, 최빈값등이있는데평균과중위수는각각 mean 함수및 median 함수를이용하여구할수있으나최빈값을구하는 Mode는기본기능에없으므로 prettyr이라는패키지를통해구할수있다. 한편, 데이터의흩어짐의정도를측정하는통계량으로범위, 분산, 표준편차등이있다 b1-ch3-9.r을실행하면데이터의중심및흩어짐의정도를측정하는통계량을구할수있다.

58 54 _ R 기초및통계분석 b1-ch3-9.r 의실행결과 > library(prettyr) > ch2_1<-scan(" Read 50 items > ch2_1 [1] [24] [47] > max(ch2_1) [1] 97 > min(ch2_1) [1] 12 > mean(ch2_1) [1] > diff(range(ch2_1)) [1] 85 > var(ch2_1) [1] > sd(ch2_1) [1] > table(ch2_1)[table(ch2_1)[1:length(unique(ch2_1))]==max(table(ch2_1))] 85 3 > median(ch2_1) [1] 65

59 제 3 장기본분석 _ 55 > Mode(ch2_1) [1] "85" > bins<-c(0, 12, 24, 36, 48, 60, 72, 84, 97) > class<-cut(ch2_1, breaks=bins) > table(class) class (0,12] (12,24] (24,36] (36,48] (48,60] (60,72] (72,84] (84,97] > table(class)/length(ch2_1) class (0,12] (12,24] (24,36] (36,48] (48,60] (60,72] (72,84] (84,97] > transform(table(class), Rel_Freq=prop.table(Freq)) class Freq Rel_Freq 1 (0,12] (12,24] (24,36] (36,48] (48,60] (60,72] (72,84] (84,97] > hist(ch2_1) > hist(ch2_1, breaks=bins, main="test Scores", xlab="score") > summary(ch2_1) Min. 1st Qu. Median Mean 3rd Qu. Max

60 56 _ R 기초및통계분석 > 수치 <-c(70, 17, 8, 3, 2) > 경제책임 <-c(" 정부 ", " 대기업 ", " 금융기관 ", " 근로자 ", " 모두 ") > 경제책임 <-paste( 경제책임, 수치 ) > 경제책임 <-paste( 경제책임, "%", sep=" ") > pie( 수치, labels= 경제책임, col=rainbow(length( 경제책임 )), main=" 경제위기의책임 ")

61 제 3 장기본분석 _ 평균의계산 평균을구하는방법은산술평균 (arithmetic mean), 조화평균 (harmonic mean), 기하평균 (geometric mean) 등이있다. n개의변수의산술평균은변수들의총합을변수의개수 n으로나눈값이다. 조화평균은 n개의양수에대하여그역수들을산술평균한것의역수를말한다. 예를들어, 두지점 A, B를갈때는 'a' km/h의속도로, 올때는 'b' km/h의속도로왕복했다면이사람의평균속력은 a와 b의조화평균에해당된다. n개의양수인변수의조화평균은그변수의역수를산술평균한것의역수이다. 예를들어, 자동차가처음 10km를시속 30km로달리고, 다음 10km를시속 60km로달렸을경우평균시속은산술평균인 45km/h가아니고조화평균인 40km/h 이다. 기하평균은여러개의수를연속으로곱해그개수의거듭제곱근으로구한수로흔히연평균인구증가율이나연평균경제성장률을구할때적용된다. 예를들어, 2014년부터 2017년까지의인구변화가다음의표와같을때전년도대비비율을구하면각각 120%, 130%, 118% 가되는데이경우 2014년부터 2017년까지의연평균인구증가율은산술평균인 이아니고기하평균인 이다. 그이유는 2014년부터산술평균으로구한연평균증가율을매년곱하여 2017년인구를

62 58 _ R 기초및통계분석 구해보면 9228명이되어실제인구 9204명과차이가발생하지만기하평균으로구한연평균증가율을매년곱하여 2017년인구를구해보면 9204명이되어실제인구와동일하게된다. 기하평균의장점중의하나는최초년도부터최종년도까지데이터가모두없어도최초년도와최종년도의데이터만있으면다음의식에의해연평균증가율계산이가능하다는점이다. 최종년도의값, n은경과년도를나타냄최초년도의값 연도 인구 전년대비비율 (%) 전년도인구 전년도인구 b1-ch3-10.r 을실행하면산술평균, 조화평균, 기하평균을각각구할수있다. b1-ch3-10.r 의실행결과 > a<-c(10, 2, 19, 24, 6, 23, 47, 24, 54, 77) > n<-length(a) # now n is equal to the number of elements in a > mean(a) [1] 28.6 > 1/mean(1/a) # compute the harmonic mean [1] > prod(a)^(1/n) # compute the geometric mean [1]

63 제 3 장기본분석 _ 59 > b<-c(30,60) > mean(b) [1] 45 > 1/mean(1/b) [1] 40 > c<-c(120,130,118) > m<-length(c) > round(mean(c),digits=2) [1] > round(prod(c)^(1/m),digits=2) [1] > g<-((9204/5000)^(1/3)-1)*100 > round(g, digits=2) [1] # 연평균증가율이 임을나타냄 5. 두확률변수의공분산 두이산형확률변수의확률분포표가다음과같이주어져있을경우이를이용하여두확률변수의각각의분산과두확률변수의공분산을구할수있다. X Y 합 1 1/6 1/12 1/12 1/3 3 1/12 1/2 1/12 2/3 합 1/4 7/12 1/6 1

64 60 _ R 기초및통계분석 b1-ch3-11.r을실행하면두확률변수의각각의분산을구할수있다. 또한두확률변수의공분산및상관계수를각각구할수있다. b1-ch3-11.r 의실행결과 > data<-c(0.167, 0.083, 0.083, 0.333, 0.083, 0.5, 0.083, 0.667, 0.25, 0.583, 0.167, 1) > mat<-matrix(data, nrow=3, byrow=t) > rownames(mat)<-c("1", "3", " 합계 ") > colnames(mat)<-c("0", "1", "2", " 합계 ") > mat 합계 합계 > mu_x<-1*mat[1,4]+3*mat[2,4] > mu_y<-0*mat[3,1]+1*mat[3,2]+2*mat[3,3] > mu_x [1] > mu_y [1] > var_x<-1^2*mat[1,4]+3^2*mat[2,4]- mu_x^2 > var_y<-0^2*mat[3,1]+1^2*mat[3,2]+2^2*mat[3,3]-mu_y^2 > var_x [1]

65 제 3 장기본분석 _ 61 > var_y [1] > p_xy<-c(0.167, 0.083, 0.083, 0.083, 0.5, 0.083) > xy<-c(0,1,2,0,3,6) > cov_xy<-sum(p_xy*xy)-(mu_x*mu_y) > cov_xy [1] > corr_xy<-cov_xy/sqrt(var_x*var_y) > corr_xy [1]

66

67 제 4 장 이론적확률분포 1. 이론적확률분포의관계 2. 베르누이분포 3. 이항분포 4. 포아송분포 5. 균등분포 6. 표준정규분포 7. -분포 8. t-분포 9. F-분포

68 64 _ R 기초및통계분석 제 4 장 이론적확률분포 1. 이론적확률분포의관계 이론적확률분포는 < 그림 4-1> 에나타나있는바와같이크게이산형확률분포와연속형확률분포로나누어진다. 이산형확률분포에는포아송분포와이항분포가있는데이항분포에서 n이크고, p 가작으면포아송분포와유사하게된다. 이산형확률분포인이항분포에서 n이크고, p가 0.5이면연속형확률분포중정규분포와유사하게된다. 정규분포를평균이 0, 표준편차가 1이되게표준화하면표준정규분포가되는데이분포가연속형확률분포의출발이된다. 서로독립적인표준정규분포의제곱의합은 ( 카이제곱 )-분포에따르게되며, -분포의모양은자유도에의해결정되는데이에대한자세한설명은 -분포에서한다. 표준정규분포에서 n이작고, 분산을모를경우 t-분포에따르게되며, t-분포의모양은자유도에의해결정되는데이에대한자세한설명은 t-분포에서한다. 서로독립적인두개의 -분포의비율은 F-분포에따르게되며, F-분포의모양은분자및분모의자유도에의해결정되는데이에대한자세한설명은 F-분포에서한다. 자유도가 n인 t-분포에따르는 t-통계량을제곱하면분모의자유도가 1이고분자의자유도가 n인 F-분포와동일하다. 이외에도이산형확률분포로서베르누이분포와연속형확률분포로서균등분포등이있다.

69 제 4 장이론적확률분포 _ 65 < 그림 4-1> 이론적확률분포의관계 2. 베르누이분포 실험에서결과가둘중의하나로나타나는실험을베르누이시행 (Bernoulli trial) 이라고하는데그중하나를성공 (success: s) 이라하고다른하나를실패 (failure: f) 라고정의한다. 따라서베르누이시행은실험의결과가 s 또는 f 인확률실험이라고할수있으며, 표본공간은 Ω= {s, f} 가된다. 이실험에서결과가 s일확률이 p라면확률의기본원리에의하여실험결과가 f일확률은 1-p이다. 베르누이시행에서결과가 s이면 1 이고, 결과가 f이면 0 이라고정의된확률변수를베르누이확률변수라고하고, 베르누이확률변수 X의확률분포는다음과같다. 베르누이분포의모양은확률 p의값에의하여결정되므로이분포의모수는 p이므로 X Bernoulli(p) 로정의한다. 베르누이분포의모양은확률 p의값에의하여결정되므로이분포의모수는 p이며, 베르누이분포의평균은 p, 분산은 p(1-p) 이다.

70 66 _ R 기초및통계분석 동일한실험을무한히반복할때한사건에대하여상대도수에의하여계산된확률은고전적의미의확률에접근한다고할수있다. 동전을던지는실험은그결과가앞면과뒷면밖에없는데동전을던지는실험을무한히반복하면동전의앞면이나오는확률은 0.5로점근적으로수렴한다. b1-ch4-1.r을실행하면동전을던지는실험을번복할수록동전의앞면이나오는확률이 0.5로수렴하는것을볼수있다. > set.seed(12345) b1-ch4-1.r 의실행결과 > x<-rbinom(1000, 1,.5) > (table(x)) x > (mean(x)) [1] > cx<-cumsum(x) > heads<-numeric(1000) > for (i in 1:1000) { + heads[i]<-cx[i]/i + } > plot(heads, type="l", xlab="number of Trials", ylab="proportion of Heads", ylim=c(0,1), main="proportion of Heads")

71 제 4 장이론적확률분포 _ 67 Proportion of Heads Proportion of Heads Number of Trials 3. 이항분포 (1) 이항분포의모양 이항분포 (binomial distribution) 는베르누이시행을독립적으로 n번반복했을때나타나는결과에있어서성공 (s) 의횟수에대한분포를구하는것이다. 성공의확률이 p이고실패의확률이 q(q = 1 p) 인베르누이시행을독립적으로 n번반복하였을때나타나는성공의횟수를확률변수 X 라고할때, X를이항확률변수 (binomial random variable) 라하고, X B(n,p) 로정의하며확률분포는다음과같다 이항분포에서모수는각시행에서성공이나타날확률 p와시행횟수 n이며, 이항분포의평균은 np, 분산은 npq이다. 이항분포는성공확률 p가 0.5이면평균 을중심으로좌우대칭인분포를가지며, n과 p의크기에따라모양이결정된다.

72 68 _ R 기초및통계분석 b1-ch4-2.r을실행하면 n과 p에따라이항분포의모양이변하는것을확인할수있으며, p=0.5이고 n이커질때좌우대칭의정규분포와유사함을확인할수있다. set.seed(12345) b1-ch4-2.r 의실행결과 r< binom1<-rbinom(r, 10, 0.1) binom2<-rbinom(r, 10, 0.5) binom3<-rbinom(r, 20, 0.5) par(mfrow=c(1,3)) hist(binom1, breaks=100, xlab="n=10 p=0.1") hist(binom2, breaks=100, xlab="n=10 p=0.5") hist(binom3, breaks=100, xlab="n=20 p=0.5") Histogram of binom1 Histogram of binom2 Histogram of binom3 Frequency Frequency Frequency n=10 p=0.1 n=10 p=0.5 n=20 p=0.5

73 제 4 장이론적확률분포 _ 69 b1-ch4-3.r을실행하면 n이주어진상태에서 p에따라이항분포의모양이변하는것을확인할수있으며, p=0.5에가까울수록좌우대칭의정규분포와유사함을확인할수있다. b1-ch4-3.r 의실행결과 par(mfrow=c(2,2)) # 한페이지에그림을좌우상하하나씩 4개를그림 > par(mfrow=c(2,2)) > n<-25 # 시행횟수 > p_list<-c(0.1, 0.2, 0.5, 0.7) # 발생확률 > for (i in 1:length(p_list)) { + p_x<-dbinom(x=1:n, n, p_list[i]) + plot(x=1:n, p_x, xlab="x", ylab="p(x=x)", + ylim=c(0, 0.3), xli... [TRUNCATED] p= 0.1 p= 0.2 P(X=x) P(X=x) x x p= 0.5 p= 0.7 P(X=x) P(X=x) x x

74 70 _ R 기초및통계분석 (2) 이항분포의확률분포표 n이 5이고성공확률 p가다음의표와같을때주어진성공확률에서다음과같이 5 번시행하여 a번성공하는누적확률을구할수있다. a b1-ch4-4.r을실행하면위와동일한누적이항확률분포표를만들수있음을확인할수있다. > binom11<-rep(na,5) b1-ch4-4.r 의실행결과 > binom12<-rep(na,5) > binom13<-rep(na,5) > binom11[1]<-pbinom(0, 5, 0.1) > binom12[1]<-pbinom(0, 5, 0.2) > binom13[1]<-pbinom(0, 5, 0.3) > for(i in 2:5) { + binom11[i]<-pbinom(i-1, 5, 0.1) + }

75 제 4 장이론적확률분포 _ 71 > for(i in 2:5) { + binom12[i]<-pbinom(i-1, 5, 0.2) + } > for(i in 2:5) { + binom13[i]<-pbinom(i-1, 5, 0.3) + } > (binom<-cbind(binom11,binom12, binom13)) binom11 binom12 binom13 [1,] [2,] [3,] [4,] [5,] > source('~/.active-rstudio-document', echo=true) > binom11<-rep(na,5) > binom12<-rep(na,5) > binom13<-rep(na,5) > binom14<-rep(na,5) > binom15<-rep(na,5) > binom16<-rep(na,5) > binom17<-rep(na,5) > binom18<-rep(na,5) > binom19<-rep(na,5) > binom11[1]<-pbinom(0, 5, 0.1)

76 72 _ R 기초및통계분석 > binom12[1]<-pbinom(0, 5, 0.2) > binom13[1]<-pbinom(0, 5, 0.3) > binom14[1]<-pbinom(0, 5, 0.4) > binom15[1]<-pbinom(0, 5, 0.5) > binom16[1]<-pbinom(0, 5, 0.6) > binom17[1]<-pbinom(0, 5, 0.7) > binom18[1]<-pbinom(0, 5, 0.8) > binom19[1]<-pbinom(0, 5, 0.9) > for(i in 2:5) { + binom11[i]<-pbinom(i-1, 5, 0.1) + } > for(i in 2:5) { + binom12[i]<-pbinom(i-1, 5, 0.2) + } > for(i in 2:5) { + binom13[i]<-pbinom(i-1, 5, 0.3) + } > for(i in 2:5) { + binom14[i]<-pbinom(i-1, 5, 0.4) + } > for(i in 2:5) { + binom15[i]<-pbinom(i-1, 5, 0.5) + }

77 제 4 장이론적확률분포 _ 73 > for(i in 2:5) { + binom16[i]<-pbinom(i-1, 5, 0.6) + } > for(i in 2:5) { + binom17[i]<-pbinom(i-1, 5, 0.7) + } > for(i in 2:5) { + binom18[i]<-pbinom(i-1, 5, 0.8) + } > for(i in 2:5) { + binom19[i]<-pbinom(i-1, 5, 0.9) + } > round((binom<-cbind(binom11,binom12, binom13,binom14,binom15, binom16,binom17,binom18, binom19)),digits=3) binom11 binom12 binom13 binom14 binom15 binom16 binom17 binom18 binom19 [1,] [2,] [3,] [4,] [5,] 포아송분포 (1) 포아송분포의모양 포아송분포 (poison distribution) 는주어진단위시간, 거리, 영역등에서어떤사건이발생하는횟수를측정하는확률분포를말한다. 특정지역에서제한된시간내에발생하는교통사고수의분포나자동생산라인에서특정시간에발생하는불량품수의분포등이대표적인포아송분포에따른다.

78 74 _ R 기초및통계분석 단위구간내에서어떤사건이평균 회발생한다고하고, 확률변수 X를사건의발생횟수라고할때, X Poisson (µ) 로표현하며사건이 k번발생될확률은다음과같다. ( 예제 ) 최근올림픽도로에서는하루평균 5건의교통사고가발생한다. 교통사고의발생횟수가포아송분포를따른다고할때, 다음의확률을계산하라 1 어느날교통사고가전혀일어나지않을확률은얼마인가? > poi1<-ppois(0, 5.0) # 평균이 5인포아송분포에서 P(x=0) 일확률 > poi1 [1] 어느날교통사고가 3 번이상일어날확률은얼마인가? > poi2<-1-(ppois(2, 5.0)) # 평균이 5인포아송분포에서 1-P(x<3) 일확률 > poi2 [1] 포아송분포에서모수는평균 이며, 포아송분포의평균은 이고, 분산도 이다. 포아송분포의모양은평균이작을때는좌우비대칭이나평균이증가함에따라평균을중심으로좌우대칭의모양으로변한다. 즉, 정규분포에가까워지고, 분산은커진다. b1-ch4-5.r을실행하면평균 에따라포아송분포의모양이변하는것을확인할수있으며, 평균 가커질때좌우대칭의분포에가까워지는것을확인할수있다. b1-ch4-5.r 의실행결과 set.seed(12345) n<-10000;

79 제 4 장이론적확률분포 _ 75 poi025<-rpois(n, 0.25) poi1<-rpois(n, 1) poi2<-rpois(n, 2) poi4<-rpois(n, 4) par(mfrow=c(2,2)) hist(poi025, breaks=100, xlab="mu=0.25") hist(poi1, breaks=100, xlab="mu=1.0") hist(poi2, breaks=100, xlab="mu=2.0") hist(poi4, breaks=100, xlab="mu=4.0") Histogram of poi025 Histogram of poi1 Frequency Frequency mu= mu=1.0 Histogram of poi2 Histogram of poi4 Frequency Frequency mu= mu=4.0 b1-ch4-6.r을실행하면평균 에따라포아송분포의모양이변하는것을확인할수있으며, 가커질수록좌우대칭의정규분포와유사함을확인할수있다. b1-ch4-6.r 의실행결과 > par(mfrow=c(2,2)) # 한페이지에그림을좌우상하하나씩 4 개를그림 > lambda_list<-c(3, 5, 10, 15) # 평균

80 76 _ R 기초및통계분석 > x_list<-30 # 발생횟수를 1 부터 x 축에보여줄최대값 > for (i in 1:length(lambda_list)) { + p_x<-dpois(x=0:x_list,lambda_list[i]) + plot(x=0:x_list, p_x, xlab="x", ylab="p(x=x)", ylim=c(0, 0.25),... [TRUNCATED] lambda= 3 lambda= 5 P(X=x) P(X=x) x x lambda= 10 lambda= 15 P(X=x) P(X=x) x x (2) 포아송분포의확률분포표 평균 가다음의표와같을때어떤사건이발생되는횟수의누적확률을구할수있다. 기댓값

81 제 4 장이론적확률분포 _ 77 c b1-ch4-7.r을실행하면위와동일한누적포아송확률분포표를만들수있음을확인할수있다. > poi11<-rep(na,5) b1-ch4-7.r 의실행결과 > poi12<-rep(na,5) > poi13<-rep(na,5) > poi14<-rep(na,5) > poi15<-rep(na,5) > poi16<-rep(na,5) > poi17<-rep(na,5) > poi18<-rep(na,5) > poi11[1]<-ppois(0, 0.02) > poi12[1]<-ppois(0, 0.04) > poi13[1]<-ppois(0, 0.06) > poi14[1]<-ppois(0, 0.08)

82 78 _ R 기초및통계분석 > poi15[1]<-ppois(0, 0.1) > poi16[1]<-ppois(0, 0.2) > poi17[1]<-ppois(0, 0.3) > poi18[1]<-ppois(0, 0.4) > for(i in 2:5) { + poi11[i]<-ppois(i-1, 0.02) + } > for(i in 2:5) { + poi12[i]<-ppois(i-1, 0.04) + } > for(i in 2:5) { + poi13[i]<-ppois(i-1, 0.06) + } > for(i in 2:5) { + poi14[i]<-ppois(i-1, 0.08) + } > for(i in 2:5) { + poi15[i]<-ppois(i-1, 0.1) + } > for(i in 2:5) { + poi16[i]<-ppois(i-1, 0.2) + } > for(i in 2:5) { + poi17[i]<-ppois(i-1, 0.3) + } > for(i in 2:5) {

83 제 4 장이론적확률분포 _ 79 + poi18[i]<-ppois(i-1, 0.4) + } > round((poi<-cbind(poi11,poi12,poi13,poi14,poi15,poi16,poi17,poi18)),digits=3) poi11 poi12 poi13 poi14 poi15 poi16 poi17 poi18 [1,] [2,] [3,] [4,] [5,] 균등분포 균등분포 (uniform distribution) 는연속형분포에서가장단순한분포형태로특정구간내의값들이나타날가능성이균등한분포를말한다. 연속형확률변수 X가실수구간 [a,b] 에서나타날가능성이균등할때, X는균등분포를따른다고하며 X U(a,b) 로표현한다. X의확률밀도함수는다음과같다 다른곳에서 확률변수 X가 X U(a,b) 라고할때, X의평균은, 분산은 이다. b1-ch4-8.r을실행하면 X U(1,2), X U(2,4), X U(4,8), X U(5,10) 에서 X 가각각실수구간에서나타날가능성이균등함을확인할수있다.

84 80 _ R 기초및통계분석 b1-ch4-8.r 의실행결과 set.seed(12345) n<-10000; min_list<-c(1,2,4,5) max_list<-c(2,4,8,10) par(mfrow=c(2,2)) unif1<-runif(n, min=1, max=2) unif2<-runif(n, min=2, max=4) unif3<-runif(n, min=4, max=8) unif4<-runif(n, min=5, max=10) (munif1<-mean(unif1)) (munif2<-mean(unif2)) (munif3<-mean(unif3)) (munif4<-mean(unif4)) (vunif1<-var(unif1)) (vunif2<-var(unif2)) (vunif3<-var(unif3)) (vunif4<-var(unif4)) for (i in 1:length(min_list)) { hist(runif(n, min=min_list[i], max=max_list[i]), freq=f, breaks=100, xlab="x", main=paste("min =", min_list[i], " max =", max_list[i])) }

85 제 4 장이론적확률분포 _ 81 min = 1 max = 2 min = 2 max = 4 Density Density x x min = 4 max = 8 min = 5 max = 10 Density Density x x 6. 표준정규분포 정규분포란다음의 < 그림 4-2> 와같이분포의형태가종을엎어놓은모양인분포 를말하며, 분포의형태는평균 와분산 에의해결정된다. < 그림 4-2> 정규분포의모양및확률밀도함수

86 82 _ R 기초및통계분석 확률변수 X가평균 와분산 을갖는정규분포를따른다면 라고표현하며, X의확률밀도함수는다음과같다., 확률변수 Z가평균이 0이고분산이 1인정규분포를따를때 Z는표준정규분포를따른다고하며, 로표현하고, Z의확률밀도함수는다음과같다., 표준정규분포의형태는 < 그림 4-3> 과같으며, 중심 0에서부터양의값 z까지의확률은색칠한부분의넓이와같다 < 그림 4-3> 표준정규분포의모양및확률밀도함수 z 가 0.45 이면 0 부터 z 까지의확률은 이된다. z

87 제 4 장이론적확률분포 _ 83 b1-ch4-9.r을실행하면위와동일한표준정규분포표를만들수있음을확인할수있다. b1-ch4-9.r의실행결과 > z00<-rep(na,10) > z01<-rep(na,10) > z02<-rep(na,10) > z03<-rep(na,10) > z04<-rep(na,10) > for(i in 1:10) { + z00[i]<-pnorm((i-1)/100, 0, 1) } > (z00<-round(z00, digits=4)) [1] > for(i in 10:19) { + z01[i]<-pnorm(i/100, 0, 1) } > (z01<-round(z01[10:19], digits=4)) [1] > for(i in 20:29) { + z02[i]<-pnorm(i/100, 0, 1) } > (z02<-round(z02[20:29], digits=4)) [1] > for(i in 30:39) { + z03[i]<-pnorm(i/100, 0, 1) } > (z03<-round(z03[30:39], digits=4))

88 84 _ R 기초및통계분석 [1] > for(i in 40:49) { + z04[i]<-pnorm(i/100, 0, 1) } > (z04<-round(z04[40:49], digits=4)) [1] > zdist<-rbind(z00,z01,z02,z03,z04) > (zdist<-round(zdist, digits=4)) [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] z z z z z 분포 (1) - 분포의모양 표준정규분포의제곱의합이카이제곱분포에따른다. 확률변수 이서 로독립적으로표준정규분포에따를때, 의제곱합 은자유도가 n 인 - 분포를따른다. 자유도가 n 인 - 분포의평균은 n, 분산은 2n 이다. b1-ch4-10.r을실행하면자유도가 5인 -분포및 density를그려주고있는데평균이 5에근사함을확인할수있다.

89 제 4 장이론적확률분포 _ 85 b1-ch4-10.r 의실행결과 > set.seed(12345) > n<-10000; > z1<-rnorm(n,0,1) > z2<-rnorm(n,0,1) > z3<-rnorm(n,0,1) > z4<-rnorm(n,0,1) > z5<-rnorm(n,0,1) > chi5<-z1^2+z2^2+z3^2+z4^2+z5^2 > hist(chi5, freq=f, col="grey", xlab="", xlim=c(0, 25), breaks=100) > par(new=t) > plot(density(chi5), axes=f, main="", xlim=c(0, 25), lwd=2, col="blue") Histogram of chi5 Density N = Bandwidth = 0.425

90 86 _ R 기초및통계분석 b1-ch4-11.r을실행하면각각자유도가 5, 10, 20, 30인 -분포를그려주고있는데자유도에따라 -분포의모양이변하는것을확인할수있다. > set.seed(12345) b1-ch4-11.r 의실행결과 > n<-10000; > df_list<-c(5,10,20,30) > par(mfrow=c(2,2)) > for (i in 1:length(df_list)) { + hist(rchisq(n, df=df_list[i], ncp=0), breaks=100, xlab="chisq", main=paste("df=", df_list[i])) + } df= 5 df= 10 Frequency Frequency chisq chisq df= 20 df= 30 Frequency Frequency chisq chisq - 분포는자유도가모수이므로자유도의크기에따라분포의형태가달라진다.

91 제 4 장이론적확률분포 _ 87 b1-ch4-12.r을실행하면각각자유도가 1, 4, 6, 8인 -분포를그려주고있는데자유도에따라 -분포의모양이변하는것을확인할수있으며, 자유도가클수록정규분포와근사한분포형태를갖는다. > n_list<-c(2,5,7,9) # 표본수 (n) b1-ch4-12.r 의실행결과 > df_list<-n_list-1 # 자유도 > curve(dchisq(x, 1, ncp=0), add=t, col="blue", xlim=c(0, 16), ylim=c(0, 0.8), xlab="chisq", ylab="f(chisq)") > curve(dchisq(x, 4, ncp=0), add=t, col="red", xlim=c(0, 16), ylim=c(0, 0.8), xlab="chisq", ylab="f(chisq)") > curve(dchisq(x, 6, ncp=0), add=t, col="green", xlim=c(0, 16), ylim=c(0, 0.8), xlab="chisq", ylab="f(chisq)") > curve(dchisq(x, 8, ncp=0), add=t, col="black", xlim=c(0, 16), ylim=c(0, 0.8), xlab="chisq", ylab="f(chisq)") > par(mfrow=c(2,2)) > for (i in 1:length(df_list)) { + + curve(dchisq(x, df_list[i], ncp=0), add=f, xlim=c(0, 16), ylim=c(0, 0.8), xlab="chisq", ylab="f(chisq)", mai... [TRUNCATED]

92 88 _ R 기초및통계분석 df= 1 df= 4 f(chisq) f(chisq) chisq chisq df= 6 df= 8 f(chisq) f(chisq) chisq chisq (2) - 분포의확률분포표 - 분포는자유도 n-1 에따라형태가다르므로각각의자유도및확률에따른 의값이다음과같이주어져있다. 자유도가 5일때 인데, 이는 을의미한다.

93 제 4 장이론적확률분포 _ 89 자유도 P= b1-ch4-13.r 을실행하면위와동일한 - 분포표를만들수있음을확인할수있다.

94 90 _ R 기초및통계분석 b1-ch4-13.r 의실행결과 > df<-30 > chi1<-numeric(df) > chi2<-numeric(df) > chi3<-numeric(df) > chi4<-numeric(df) > chi5<-numeric(df) > chi6<-numeric(df) > for(j in 1:df) { + chi1[j]<-qchisq(0.01,j) + } > for(j in 1:df) { + chi2[j]<-qchisq(0.05,j) + } > for(j in 1:df) { + chi3[j]<-qchisq(0.1,j) + } > for(j in 1:df) { + chi4[j]<-qchisq(0.9,j) + } > for(j in 1:df) { + chi5[j]<-qchisq(0.95,j) + } > for(j in 1:df) { + chi6[j]<-qchisq(0.99,j)

95 제 4 장이론적확률분포 _ 91 + } > round((chi<-cbind(chi1,chi2,chi3,chi4,chi5, chi6)),digits=4) chi1 chi2 chi3 chi4 chi5 chi6 [1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] [11,] [12,] [13,] [14,] [15,] [16,] [17,] [18,] [19,] [20,] [21,] [22,] [23,] [24,] [25,] [26,] [27,] [28,] [29,] [30,]

96 92 _ R 기초및통계분석 8. t- 분포 (1) t- 분포의모양 표준정규분포와 -분포에의해 t-분포가도출된다. 이고 이며서로독립이면, 다음의확률변수 T는자유도가 인 t-분포에따른다. 한편, 다음의확률변수 t 는자유도가 n-1 인 t- 분포에따른다. 이확률변수 t는자유도가무한히커지면표준정규분포에접근하는데표준정규분포와자유도가 4인 t-분포를비교한 < 그림 4-4> 를보면 t-분포가표준정규분포보다꼬리부분의확률이조금더큰것을알수있다. < 그림 4-4> 표준정규분포와자유도가 4 인 t- 분포의비교

97 제 4 장이론적확률분포 _ 93 b1-ch4-14.r을실행하면자유도가 5인 t-분포를그려주고있는데좌우대칭의분포로정규분포와유사함을확인할수있다. set.seed(12345) b1-ch4-14.r 의실행결과 n<-10000; z<-rnorm(n,0,1) z1<-rnorm(n,0,1) z2<-rnorm(n,0,1) z3<-rnorm(n,0,1) z4<-rnorm(n,0,1) z5<-rnorm(n,0,1) chi5<-z1^2+z2^2+z3^2+z4^2+z5^2 sqchi5<-sqrt(chi5/5) t5<-z/sqchi5 hist(t5, breaks=100) Histogram of t5 Frequency t5

98 94 _ R 기초및통계분석 b1-ch4-15.r을실행하면각각자유도가 5, 10, 15, 30인 t-분포를그려주고있는데자유도에따라 t-분포의모양이변하는것을확인할수있다. > n<-10000; b1-ch4-15.r 의실행결과 > df_list<-c(5,10,15,30) > par(mfrow=c(2,2)) > for (i in 1:length(df_list)) { + hist(rt(n, df=df_list[i], ncp=0), breaks=100, xlab="t", main=paste("df=", df_list[i])) df= 5 df= 10 Frequency Frequency t t df= 15 df= 30 Frequency Frequency t t t-분포는자유도가모수이므로자유도의크기에따라분포의형태가달라진다. b1-ch4-16.r을실행하면각각자유도가 1, 4, 9, 29인 t-분포를그려주고있는데자유도에따라 t-분포의모양이변하는것을확인할수있으며, 자유도가클수록정규분포와근사한분포형태를갖는다.

99 제 4 장이론적확률분포 _ 95 > n_list<-c(2,5,10,30) # 표본수 (n) b1-ch4-16.r 의실행결과 > df_list<-n_list-1 # 자유도 > curve(dt(x, 1, ncp=0), add=t, col="blue", xlim=c(-4, 4), ylim=c(0, 0.5), xlab="t", ylab="f(t)") > curve(dt(x, 4, ncp=0), add=t, col="red", xlim=c(-4, 4), ylim=c(0, 0.5), xlab="t", ylab="f(t)") > curve(dt(x, 9, ncp=0), add=t, col="green", xlim=c(-4, 4), ylim=c(0, 0.5), xlab="t", ylab="f(t)") > curve(dt(x, 29, ncp=0), add=t, col="black", xlim=c(-4, 4), ylim=c(0, 0.5), xlab="t", ylab="f(t)") > par(mfrow=c(2,2)) > for (i in 1:length(df_list)) { + + curve(dt(x, df_list[i], ncp=0), xlim=c(-4, 4), ylim=c(0, 0.5), xlab="t", ylab="f(t)", main=paste("df=", df... [TRUNCATED]

100 96 _ R 기초및통계분석 df= 1 df= 4 f(t) f(t) t t df= 9 df= 29 f(t) f(t) t t (2) t- 분포의확률분포표 t-분포는자유도 n-1에따라분포의형태가다르므로각각의자유도및확률에따른 t- 분포의값이다음과같이주어져있다. 자유도가 5일때 인데이는 를의미한다. v p

101 제 4 장이론적확률분포 _ 97 b1-ch4-17.r 을실행하면위와동일한 t- 분포표를만들수있음을확인할수있다. > t11<-rep(na,9) b1-ch4-17.r 의실행결과 > t12<-rep(na,9) > t13<-rep(na,9) > t14<-rep(na,9) > t15<-rep(na,9) > for(i in 1:9) { + t11[i]<-qt(0.9, i) + } > for(i in 1:9) { + t12[i]<-qt(0.95, i) + } > for(i in 1:9) { + t13[i]<-qt(0.975,i) + } > for(i in 1:9) { + t14[i]<-qt(0.99, i) + } > for(i in 1:9) { + t15[i]<-qt(0.995, i) + } > round((poi<-cbind(t11,t12,t13,t14,t15)), digits=3) t11 t12 t13 t14 t15 [1,]

102 98 _ R 기초및통계분석 [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] F- 분포 (1) F- 분포의모양 두개의독립적인 - 분포에의해 F- 분포가도출된다. 이고 이며서로독립이면, 다음의확률변수 F 는분자및분모의자유도가각 각 인 F- 분포에따른다. 한편, 다음의확률변수 F 는분자및분모의자유도가각각 인 F- 분 포에따른다.

103 제 4 장이론적확률분포 _ 99 이확률변수 F는자유도가분자및분모의자유도가같아지면서커질수록좌우대칭분포와비슷하게된다. b1-ch4-18.r을실행하면분자및분모의자유도가각각 5인 F-분포를그려주고있는데좌우비대칭의분포임을확인할수있다. > set.seed(12345) b1-ch4-18.r 의실행결과 > n<-10000; > z1<-rnorm(n,0,1) > z2<-rnorm(n,0,1) > z3<-rnorm(n,0,1) > z4<-rnorm(n,0,1) > z5<-rnorm(n,0,1) > z6<-rnorm(n,0,1) > z7<-rnorm(n,0,1) > z8<-rnorm(n,0,1) > z9<-rnorm(n,0,1) > z10<-rnorm(n,0,1) > chi15<-z1^2+z2^2+z3^2+z4^2+z5^2 > chi25<-z6^2+z7^2+z8^2+z9^2+z10^2 > f55<-(chi15/5)/(chi25/5) > hist(f55, breaks=100)

104 100 _ R 기초및통계분석 Histogram of f55 Frequency f55 b1-ch4-19.r을실행하면분자및분모의자유도가각각 (5,10), (9,10), (15,20), (38, 40) 인 F-분포를그려주고있는데자유도에따라 F-분포의모양이변하는것을확인할수있다. > set.seed(12345) b1-ch4-19.r 의실행결과 > n<-10000; > df1_list<-c(5,9,15,38) > df2_list<-c(10,10,20,40) > par(mfrow=c(2,2)) > for (i in 1:length(df1_list)) { + hist(rf(n, df1=df1_list[i], df2=df2_list[i], ncp=0), breaks=100, xlab="f", main=paste("df1=", df1_list[i], "df2=..."... [TRUNCATED]

105 제 4 장이론적확률분포 _ 101 df1= 5 df2= 10 df1= 9 df2= 10 Frequency Frequency f f df1= 15 df2= 20 df1= 38 df2= 40 Frequency Frequency f f b1-ch4-20.r을실행하면자유도가각각 (3,15), (5,15), (10,15), (15,15) 인 F- 분포를그려주고있는데분자및분모의자유도가같아질수록좌우대칭에가까운분포로변함을확인할수있다. b1-ch4-20.r 의실행결과 > curve(df(x, 3, 15, ncp=0), add=t, col="blue", xlim=c(0,5), ylim=c(0,1), xlab="f", ylab="f(f)") > curve(df(x, 5, 15, ncp=0), add=t, col="red", xlim=c(0,5), ylim=c(0,1), xlab="f", ylab="f(f)") > curve(df(x, 10, 15, ncp=0), add=t, col="green", xlim=c(0,5), ylim=c(0,1), xlab="f", ylab="f(f)") > curve(df(x, 15, 15, ncp=0), add=t, col="black", xlim=c(0,5), ylim=c(0,1), xlab="f", ylab="f(f)") > df1_list<-c(3,5,10,15)

106 102 _ R 기초및통계분석 > df2_list<-c(15,15,15,15) > par(mfrow=c(2,2)) > for (i in 1:length(df1_list)) { + curve(df(x, df1=df1_list[i], df2=df2_list[i], ncp=0), xlim=c(0,5), ylim=c(0,1), xlab="f", ylab="f(f)", main=past... [TRUNCATED] df1= 3 df2= 15 df1= 5 df2= 15 f(f) f(f) f f df1= 10 df2= 15 df1= 15 df2= 15 f(f) f(f) f f

107 제 4 장이론적확률분포 _ 103 (2) F- 분포의확률분포표 F- 분포는분자의자유도 ( ) 및분모의자유도 ( ) 에따라분포의형태가다르므 로각각의자유도에따른 에대한 F값이다음과같이주어져있다분자의자유도가 7이고분모의자유도가 9인경우 이다. v 1 v b1-ch4-21.r 을실행하면위와동일한 F- 분포표를만들수있음을확인할수있다. > f11<-rep(na,10) b1-ch4-21.r 의실행결과 > f12<-rep(na,10) > f13<-rep(na,10) > f14<-rep(na,10) > f15<-rep(na,10) > f16<-rep(na,10)

108 104 _ R 기초및통계분석 > f17<-rep(na,10) > f18<-rep(na,10) > f19<-rep(na,10) > f110<-rep(na,10) > for(i in 1:10) { + f11[i]<-qf(0.95, 1, i) + } > for(i in 1:10) { + f12[i]<-qf(0.95, 2, i) + } > for(i in 1:10) { + f13[i]<-qf(0.95, 3, i) + } > for(i in 1:10) { + f14[i]<-qf(0.95, 4, i) + } > for(i in 1:10) { + f15[i]<-qf(0.95, 5, i) + } > for(i in 1:10) { + f16[i]<-qf(0.95, 6, i) + } > for(i in 1:10) { + f17[i]<-qf(0.95, 7, i) + }

109 제 4 장이론적확률분포 _ 105 > for(i in 1:10) { + f18[i]<-qf(0.95, 8, i) + } > for(i in 1:10) { + f19[i]<-qf(0.95, 9, i) + } > for(i in 1:10) { + f110[i]<-qf(0.95, 10, i) + } > round((poi<-cbind(f11,f12,f13,f14,f15,f16,f17,f18,f19,f110)), digits=2) f11 f12 f13 f14 f15 f16 f17 f18 f19 f110 [1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,]

110

111 제 5 장 표본분포 1. 표본평균의표본분포 2. 중심극한정리 3. 표본분산의표본분포

112 108 _ R 기초및통계분석 제 5 장표본분포 1. 표본평균의표본분포 모집단에서일정한크기의모든가능한표본을추출하였을때그모든표본으로부터계산된통계량즉, 표본평균및표본분산의확률분포를표본분포 (sampling distribution) 이라고한다. 예를들어, J제약회사는많은종류의신약을개발하였다. 이제약회사가신약을개발하기위해서 1,2,3 혹은 4년의시간이걸렸으며각각의발생확률은동등하다고가정하자. 이때신약의평균개발기간인모집단의평균 및분산 로계산된다. < 그림 5-1> 모집단으로부터표본크기 (n) 가 2 인임의표본추출 표본크기 2의모든가능한표본과표본평균은 < 표 5-1> 과같고, 표본평균의표본분포는 < 표 5-2> 와같다.

113 제 5 장표본분포 _ 109 < 표 5-1> 표본크기 2인표본및표본평균 표본 표본평균 ( ) 표본 표본평균 ( ) (1,1) 1.0 (3,1) 2.0 (1,2) 1.5 (3,2) 2.5 (1,3) 2.5 (3,3) 3.0 (1,4) 2.5 (3,4) 3.5 (2,1) 1.5 (4,1) 2.5 (2,2) 2.0 (4,2) 3.0 (2,3) 2.5 (4,3) 3.5 (2,4) 3.0 (4,4) 4.0 < 표 5-2> 표본평균의표본분포 P( ) 1/16 2/16 3/16 4/16 3/16 2/16 1/16 표본평균의평균을계산해보면 2.5로써모평균과 2.5로같지만표본평균의분산은 0.625로써모분산과같지않으며, 표본평균의분산은모분산의 1/2이된다. b1-ch5-1.r을실행하면표본평균의평균은 , 분산은 로써모집단의이론적인평균과표준편차에근접함을알수있다. b1-ch5-1.r 의실행결과 > sampling.dist.1<-null > for(sample.count in 1:10000){ + set.seed(sample.count) + sample.mean.1<-mean(rnorm(2,2.5,1.118)) + sampling.dist.1<-c(sampling.dist.1, sample.mean.1) + } > mean(sampling.dist.1) [1] > var(sampling.dist.1) [1] > > hist(sampling.dist.1, freq=f, col="grey", xlab="", xlim=c(-1, 6),

114 110 _ R 기초및통계분석 breaks=100) > par(new=t) > plot(density(sampling.dist.1), axes=f, main="", xlim=c(-1, 6), lwd=2, col="blue") Histogram of sampling.dist.1 Density N = Bandwidth = 표본크기에따른표본평균의표본분포를살펴보면 < 그림 5-2> 에나타나있듯이표본평균의평균은표본크기에관계없이모평균과동일하고, 표본평균의분산은모분산을표본크기로나눈값과같으므로표본크기가커짐에따라표본평균의분산은작아진다. < 그림 5-2> 표본크기 (n) 에따른표본평균의표본분포

115 제 5 장표본분포 _ 111 b1-ch5-2.r을실행하면 < 그림 5-1> 의모집단에서표본크기를다르게할경우표본평균의분포를보여주고있는데표본평균의평균은모평균과동일하지만, 표본평균의분산은모분산을표본크기로나눈값이되는것을확인할수있다. b1-ch5-2.r 의실행결과 > sampling.dist.1<-null > for(sample.count in 1:10000){ + set.seed(sample.count) + sample.mean.1<-mean(rnorm(2,2.5,1.118)) + sampling.dist.1<-c(sampling.dist.1, sample.... [TRUNCATED] > mean(sampling.dist.1) [1] > var(sampling.dist.1) [1] > table(round(sampling.dist.1)) > sampling.dist.2<-null > for(sample.count in 1:10000){ + set.seed(sample.count) + sample.mean.2<-mean(rnorm(5,2.5,1.118)) + sampling.dist.2<-c(sampling.dist.2, sample.... [TRUNCATED] > mean(sampling.dist.2) [1] > var(sampling.dist.2) [1]

116 112 _ R 기초및통계분석 > table(round(sampling.dist.2)) > sampling.dist.3<-null > for(sample.count in 1:10000){ + set.seed(sample.count) + sample.mean.3<-mean(rnorm(10,2.5,1.118)) + sampling.dist.3<-c(sampling.dist.3, sample... [TRUNCATED] > mean(sampling.dist.3) [1] > var(sampling.dist.3) [1] > table(round(sampling.dist.3)) > sampling.dist.4<-null > for(sample.count in 1:10000){ + set.seed(sample.count) + sample.mean.4<-mean(rnorm(30,2.5,1.118)) + sampling.dist.4<-c(sampling.dist.4, sample... [TRUNCATED] > mean(sampling.dist.4) [1] > var(sampling.dist.4) [1] > table(round(sampling.dist.4))

117 제 5 장표본분포 _ > par(mfrow=c(2,2)) > hist(sampling.dist.1, freq=f, col="grey", xlab="", xlim=c(-1, 6), breaks=100) > par(new=t) > plot(density(sampling.dist.1), axes=f, main="", xlim=c(-1, 6), lwd=2, col="blue") > hist(sampling.dist.2, freq=f, col="grey", xlab="", xlim=c(-1, 6), breaks=100) > par(new=t) > plot(density(sampling.dist.2), axes=f, main="", xlim=c(-1, 6), lwd=2, col="blue") > hist(sampling.dist.3, freq=f, col="grey", xlab="", xlim=c(-1, 6), breaks=100) > par(new=t) > plot(density(sampling.dist.3), axes=f, main="", xlim=c(-1, 6), lwd=2, col="blue") > hist(sampling.dist.4, freq=f, col="grey", xlab="", xlim=c(-1, 6), breaks=100) > par(new=t) > plot(density(sampling.dist.4), axes=f, main="", xlim=c(-1, 6), lwd=2, col="blue")

118 114 _ R 기초및통계분석 Histogram of sampling.dist.1 Histogram of sampling.dist.2 Density Density N = Bandwidth = N = Bandwidth = Histogram of sampling.dist.3 Histogram of sampling.dist.4 Density Density N = Bandwidth = N = Bandwidth = 중심극한정리 평균이 이고, 분산이 인확률분포로부터표본크기가 n 인확률표본 (,,..., ) 을추출할때, 표본평균 는 n이클수록평균이 이고, 분산이 인정규분포와근사한분포를갖는다. 즉, 의분포는 과같이나타낼수있는데이를중심극한정리 (central limit theorem) 라고한다. 관찰된자료의모집단이정규분포에따를경우관찰자료역시정규분포에따르고, 관찰된자료의모집단이실제로정규분포가아니면관찰자료역시정규분포에따르지않는다. 그러나관찰된자료의모집단이실제로정규분포가아닌경우에도중심극한정리에의해표준정규분포를이용한추정량의근사확률을구할수있다.

119 제 5 장표본분포 _ 115 ( 실험 1) 확률변수 X가균등분포 U(0,1) 을따른다고할때 X U(0,1) 이며, X는 0과 1사이에서균등한분포를갖는연속형확률변수이다. 이러한확률분포로부터표본크기 n 이 11인확률표본을 1,000개추출하는실험을해보자. 1,000 개표본으로부터구한표본평균 을이용하여히스토그램을 그려보면균등분포로부터구한표본평균의분포가정규분포와근사한분포를갖는다는것을알수있다. X U(0,1) 에서 X의평균은 1/2, 분산은 1/12이므로 n=11인경우표본평균 의평균은 1/2, 분산은 1/(11x12) 이됨을다음과같이확인할수있다. 즉, 표본평균 는근사적으로 을따르는데 1,000개표본의표본평균 과분산은각각 및 로서모집단의이론적인평균과표준편차에근접함을알수있다 > (mean(sample_mean)) [1] > (var(sample_mean)) [1] b1-ch5-3.r 을실행하면위의 ( 실험 1) 을확인할수있다. > set.seed( ) b1-ch5-3.r 의실행결과 > sample_size <- 11 > min <- 0 > max <- 1 > n_rep <- 1000

120 116 _ R 기초및통계분석 > sample_mean <- rep(na, n_rep) > sample_var <- rep(na, n_rep) > #graphics.off() > #par(mfrow=c(1,2)) > > for (i in 1:n_rep) { + my_sample <- runif(sample_size,min,max) + sample_mean[i] <- mean(my_samp... [TRUNCATED] > (mean(sample_mean)) [1] > (var(sample_mean)) [1] > hist(sample_mean, breaks=40, prob=t, main=paste("samples of size 11"), col="black") > par(new=t) > plot(density(sample_mean), xlab="", axes=f, main="", col="blue")

121 제 5 장표본분포 _ 117 ( 실험 2) 확률변수 X가평균이 10, 표준편차가 2인정규분포를따른다고할때이러한확률분포로부터표본크기가각각 5, 10, 20, 30인확률표본을 1,000개추출하는실험을해보자. 표본평균 는표본크기에따라 1,000개표본의표본평균과분산은각각다음과같은데모집단의이론적인평균과분산에근접함을알수있다. 구분 n=5 n=10 n=20 n=30 표본평균의평균 표본평균의분산 b1-ch5-4.r 을실행하면위의 ( 실험 2) 를확인할수있다 b1-ch5-4.r 의실행결과 > set.seed(123456) > curve(dnorm(x,10,2), xlim = c(4, 16), ylim = c(0.0, 0.22)) > par(mfrow=c(2,2)) > ybar5<-numeric(10000) > for(j in 1:10000) { + sample<-rnorm(5,10,2) + ybar5[j] <-mean(sample) + } > mean(ybar5) [1] > var(ybar5) [1] > plot(density(ybar5), xlim = c(7, 13), ylim = c(0.0, 0.5))

122 118 _ R 기초및통계분석 > curve(dnorm(x,10,sqrt( )), add=t, lty=2) > ybar10<-numeric(10000) > for(k in 1:10000) { + sample<-rnorm(10,10,2) + ybar10[k] <-mean(sample) + } > mean(ybar10) [1] > var(ybar10) [1] > plot(density(ybar10),xlim = c(7.5, 12.5), ylim = c(0.0, 0.8)) > curve(dnorm(x,10,sqrt( )), add=t, lty=2) > ybar20<-numeric(10000) > for(m in 1:10000) {T + sample<-rnorm(20,10,2) + ybar20[m] <-mean(sample) + } > mean(ybar20) [1] > var(ybar20) [1] > plot(density(ybar20),xlim = c(8.5, 11.5), ylim = c(0.0, 1.0)) > curve(dnorm(x,10,sqrt( )), add=t, lty=2)

123 제 5 장표본분포 _ 119 > ybar30<-numeric(10000) > for(n in 1:10000) { + sample<-rnorm(30,10,2) + ybar30[n] <-mean(sample) + } > mean(ybar30) [1] > var(ybar30) [1] > plot(density(ybar30),xlim = c(8.5, 11.5), ylim = c(0.0, 1.2)) > curve(dnorm(x,10,sqrt( )), add=t, lty=2) dnorm(x, 10, 2) x

124 120 _ R 기초및통계분석 ( 실험 3) 확률변수 X가자유도가 1인 -분포를따른다고할때 ( 따라서평균은 1, 분산은 2가됨 ) 이러한확률분포로부터표본크기가각각 2, 10, 20, 30인확률표본을 1,000 개추출하는실험을해보자. 표본크기에따라 1,000개표본의표본평균의평균과분산은각각다음과같은데모집단의이론적인평균과분산에근접함을알수있다. 구분 n=2 n=10 n=20 n=30 표본평균의평균 표본평균의분산 b1-ch5-5.r 을실행하면위의 ( 실험 3) 을확인할수있다

125 제 5 장표본분포 _ 121 b1-ch5-5.r 의실행결과 > set.seed(123456) > curve(dchisq(x,1)) > par(mfrow=c(2,2)) > ybar2<-numeric(10000) > for(j in 1:10000) { + sample<-rchisq(2,1) + ybar2[j] <-mean(sample) + } > mean(ybar2) [1] > var(ybar2) [1] > plot(density(ybar2), xlim = c(0, 10), ylim = c(0.0, 0.8)) > curve(dnorm(x,1,sqrt( )), add=t, lty=2) > ybar10<-numeric(10000) > for(k in 1:10000) { + sample<-rchisq(10,1) + ybar10[k] <-mean(sample) + } > mean(ybar10) [1] > var(ybar10) [1]

126 122 _ R 기초및통계분석 > plot(density(ybar10),xlim = c(0, 4), ylim = c(0.0, 1)) > curve(dnorm(x,1,sqrt( )), add=t, lty=2) > ybar20<-numeric(10000) > for(n in 1:10000) { + sample<-rchisq(20,1) + ybar20[n] <-mean(sample) + } > mean(ybar20) [1] > var(ybar20) [1] > plot(density(ybar20),xlim = c(0, 3), ylim = c(0.0, 1.5)) > curve(dnorm(x,1,sqrt( )), add=t, lty=2) > ybar30<-numeric(10000) > for(m in 1:10000) { + sample<-rchisq(30,1) + ybar30[m] <-mean(sample) + } > mean(ybar30) [1] > var(ybar30) [1] > plot(density(ybar30),xlim = c(0.3, 1.7), ylim = c(0.0, 2.0)) > curve(dnorm(x,1,sqrt( )), add=t, lty=2)

127 제 5 장표본분포 _ 123 dchisq(x, 1) x

128 124 _ R 기초및통계분석 ( 실험 4) 확률변수 X가균등분포 U(0,1) 을따른다고할때즉, X U(0,1) 일때 ( 따라서평균은 0.5, 분산은 이됨 ) 이러한확률분포로부터표본크기가각각 2, 10, 20, 30인확률표본을 1,000개추출하는실험을해보자. 표본크기에따라 1,000개표본의표본평균의평균과분산은각각다음과같은데모집단의이론적인평균과분산에근접함을알수있다. 구분 n=2 n=10 n=20 n=30 표본평균의평균 표본평균의분산 b1-ch5-6.r 을실행하면위의 ( 실험 4) 를확인할수있다 b1-ch5-6.r 의실행결과 > set.seed(123456) > curve(dunif(x,min=0, max=1)) > par(mfrow=c(2,2)) > ybar2<-numeric(10000) > for(j in 1:10000) { + sample<-runif(2,min=0, max=1) + ybar2[j] <-mean(sample) + } > mean(ybar2) [1] > var(ybar2) [1] > plot(density(ybar2), xlim = c(0, 1), ylim = c(0,3.5))

129 제 5 장표본분포 _ 125 > curve(dnorm(x,0.5,sqrt( )), add=t, lty=2) > ybar10<-numeric(10000) > for(k in 1:10000) { + sample<-runif(10,min=0, max=1) + ybar10[k] <-mean(sample) + } > mean(ybar10) [1] > var(ybar10) [1] > plot(density(ybar10),xlim = c(0, 1), ylim = c(0,4.5)) > curve(dnorm(x,0.5,sqrt( )), add=t, lty=2) > ybar20<-numeric(10000) > for(m in 1:10000) { + sample<-runif(20,min=0, max=1) + ybar20[m] <-mean(sample) + } > mean(ybar20) [1] > var(ybar20) [1] > plot(density(ybar20),xlim = c(0, 1), ylim = c(0, 6.5)) > curve(dnorm(x,0.5,sqrt( )), add=t, lty=2)

130 126 _ R 기초및통계분석 > ybar30<-numeric(10000) > for(n in 1:10000) { + sample<-runif(30,min=0, max=1) + ybar30[n] <-mean(sample) + } > mean(ybar30) [1] > var(ybar30) [1] > plot(density(ybar30),xlim = c(0, 1), ylim = c(0, 7.7)) > curve(dnorm(x,0.5,sqrt( )), add=t, lty=2) dunif(x, min = 0, max = 1) x

131 제 5 장표본분포 _ 표본분산의표본분포 앞의예와동일하게 J제약회사는많은종류의신약을개발하였다. 이제약회사가신약을개발하기위해서 1,2,3 혹은 4년의시간이걸렸으며신약의평균개발기간인 모집단의평균 및분산 로계산된다. < 그림 5-3> 모집단으로부터표본크기 (n) 가 2 인임의표본추출

132 128 _ R 기초및통계분석 표본크기 2의모든가능한표본과표본평균및표본분산은 < 표 5-3> 과같다. 표본평균의경우중심극한정리에의해표본크기가증가함에따라정규분포를따르지만, 표본분산의경우정규분포를따르지않는다. < 표 5-3> 표본크기 2인표본, 표본평균및표본분산 표본 표본평균 ( ) 표본분산 ( ) 표본 표본평균 ( ) 표본분산 ( ) (1,1) (3,1) (1,2) (3,2) (1,3) (3,3) (1,4) (3,4) (2,1) (4,1) (2,2) (4,2) (2,3) (4,2) (2,4) (4,4) 모집단이정규분포에따르더라도표본분산의표본분포는다음히스토그램과같은분포를이루게된다. 즉, 정규분포로부터구한표본분산의분포는정규분포에따르지않는다. b1-ch5-7.r을실행하면표본분산의평균은 , 분산은 로써모집 단의이론적인평균인 와분산인 에근접함을알수있다. > sampling.dist.1<-null b1-ch5-7.r 의실행결과 > for(sample.count in 1:10000){ + set.seed(sample.count) + sample.var.1<-var(rnorm(2,2.5,1.118)) + sampling.dist.1<-c(sampling.dist.1, sample.va... [TRUNCATED] > mean(sampling.dist.1) [1]

133 제 5 장표본분포 _ 129 > var(sampling.dist.1) [1] > hist(sampling.dist.1, freq=f, col="grey", xlab="", xlim=c(-1, 6), breaks=100) > par(new=t) > plot(density(sampling.dist.1), axes=f, main="", xlim=c(-1, 6), lwd=2, col="blue") Histogram of sampling.dist.1 Density N = Bandwidth = 평균이 10 이고, 표준편차가 2 인정규분포에따르는모집단에서 1,000 개표본으로 부터구한표본분산 을이용하여히스토그램을그린 b1-ch5-8.r 을 실행해보면정규분포에따르지않는다는것을확인할수있다.

134 130 _ R 기초및통계분석 b1-ch5-8.r 의실행결과 > sample_size <- 11 > n_rep < > sample_mean <- rep(na, n_rep) > sample_var <- rep(na, n_rep) > #graphics.off() > #par(mfrow=c(1,2)) > > for (i in 1:n_rep) { + my_sample <- rnorm(sample_size,10,2) + sample_mean[i] <- mean(my_sample)... [TRUNCATED] > (mean(sample_mean)) [1] > (var(sample_mean)) [1] > hist(sample_var, breaks=40, prob=t, main=paste( "samples of size 11" ),col="black") > par(new=t) > plot(density(sample_var), xlab="", axes=f, main="", col="blue")

135 제 5 장표본분포 _ 131 samples of size 11 Density sample_var b1-ch5-9.r 을실행하면표본크기를다르게할경우표본분산의분포를보여주고 있는데모집단의이론적인평균인 과분산인 에근접함을알수있다. > set.seed(123456) b1-ch5-9.r 의실행결과 > par(mfrow=c(2,2)) > vbar10<-numeric(10000) > for(j in 1:10000) { + sample10<-rnorm(10,10,2) + vbar10[j] <-var(sample10) + } > (mean(vbar10)) [1] > (var(vbar10))

136 132 _ R 기초및통계분석 [1] > hist(vbar10, freq=f, xlab="", breaks=100) > par(new=t) > plot(density(vbar10), axes=f, main="", col="blue") > vbar20<-numeric(10000) > for(j in 1:10000) { + sample20<-rnorm(20,10,2) + vbar20[j] <-var(sample20) + } > (mean(vbar20)) [1] > (var(vbar20)) [1] > hist(vbar20, freq=f, xlab="", breaks=100) > par(new=t) > plot(density(vbar20), axes=f, main="", col="blue") > vbar30<-numeric(10000) > for(j in 1:10000) { + sample30<-rnorm(30,10,2) + vbar30[j] <-var(sample30) + } > (mean(vbar30)) [1]

137 제 5 장표본분포 _ 133 > (var(vbar30)) [1] > hist(vbar30, freq=f, xlab="", breaks=100) > par(new=t) > plot(density(vbar30), axes=f, main="", col="blue") > vbar100<-numeric(10000) > for(j in 1:10000) { + sample100<-rnorm(100,10,2) + vbar100[j] <-var(sample100) + } > (mean(vbar100)) [1] > (var(vbar100)) [1] > hist(vbar100, freq=f, xlab="", breaks=100) > par(new=t) > plot(density(vbar100), axes=f, main="", col="blue")

138 134 _ R 기초및통계분석 Histogram of vbar10 Histogram of vbar20 Density Density N = Bandwidth = N = Bandwidth = Histogram of vbar30 Histogram of vbar100 Density Density N = Bandwidth = N = Bandwidth =

139 제 6 장 추정 1. 추정및신뢰구간 2. 모평균의구간추정 3. 모분산의구간추정

140 136 _ R 기초및통계분석 제 6 장추정 1. 추정및신뢰구간 (1) 추정 추정량 (estimator) 은표본정보를이용하여알지못하는모수의참값을추정하는방법이며, 알지못하는모수가 라면추정량은 으로표기한다. 추정치 (estimate) 는수치로계산된 의값이다. 추정량에는모수를하나의값으로추정하는점추정량과모수의값이빈번히포함되는구간을추정하는구간추정량이있다. 점추정 (point estimation) 은확률표본의정보를이용하여모수에대한특정값을지정하는방법인데, 표본평균은모평균의점추정치이고표본분산은모분산의점추정치가된다. 점추정량은언제나표본오차를수반하기때문에전적으로신뢰할수없다. 그러나구간추정 (interval estimation) 은이런점추정과달리모수가빈번히포함되는범위를제공하여연구의목적에따라원하는만큼의신뢰성을가지고모수를추정할수있다 (2) 신뢰구간 는알지못하는모수라고하자. 표본정보에근거하여일정한확률 ( ) 범위내에모수가포함될가능성이있는구간, 즉다음을만족하는확률변수 A와 B를구할수있다.

141 제 6 장추정 _ 137 만약확률변수 A와 B에대한측정값을 a와 b라고하면, 구간 a < < b 는 에대한 100( )% 신뢰구간이며 는신뢰수준그리고 는유의수준이라고한다. 2. 모평균구간추정 < 그림 6-1> 은모평균구간추정을위한의사결정트리를나타내고있다. 모집단의정규분포여부에관계없이, 모분산을알든모르든관계없이, 표본의크기가 30 이상의대표본이면 Z-통계량을이용하면된다. 표본의크기가 30 미만의소표본이면, 모집단이정규분포에따를경우에만모평균구간추정이가능하고, 이경우에모분산이알려져있으면 Z-통계량을이용하고모분산을모를경우 t-통계량을이용하면된다. < 그림 6-1> 모평균구간추정을위한의사결정트리 평균이 10이고표준편차가 2인모집단에서 100개의표본을추출하여모평균 ( ) 에대한신뢰구간을추정하는 b1-ch6-1.r을실행해보면모평균에대한 95% 신뢰구간

142 138 _ R 기초및통계분석 100개중 95개이상의신뢰구간이모평균 10을포함하고있는것을확인할수있다. 모평균 가확률변수가아니고고정된상수이므로 에대한 95% 신뢰구간의의미는크기가동일한 100개의서로다른표본에의해동일한공식으로 100개의신뢰구간을구했을때그중에서 95개의구간이모평균 를포함한다고볼수있다는것이다. > set.seed(12343) b1-ch6-1.r 의실행결과 > #par(mfrow=c(1,2)) > > CIlower<-numeric(100) > CIupper<-numeric(100) > pvalue1<-numeric(100) > for(j in 1:100) { + sample<-rnorm(80,10,2) + testres1<-t.test(sample,mu=10) + CIlower[j]<-testres1$conf.int[1] + CIupper[j]<-testres1$conf.i... [TRUNCATED] > testres1$conf.int[1] [1] > testres1$conf.int[2] [1] > testres1$p.value [1] > reject1<-pvalue1<=0.05 > table(reject1)

143 제 6 장추정 _ 139 reject1 FALSE TRUE 97 3 > color<-rep(gray(.7),100) > color[reject1]<-"black" > plot(0, xlim=c(9,11), ylim=c(1,100), ylab="sample No.", xlab="", main="95% Confidence Interval") > abline(v=10, lty=2) > for(j in 1:100) { + lines(c(cilower[j], CIupper[j]), c(j,j), col=color[j], lwd=1) + } 95% Confidence Interval Sample No

144 140 _ R 기초및통계분석 (1) Z- 통계량이용 모집단의정규분포여부에관계없이, 모분산을알든모르든관계없이, 표본의크기가 30 이상의대표본인경우또는모집단이정규분포에따르고, 모분산이알려져있으며, 표본의크기가 30 미만의소표본인경우 Z-통계량을이용하여모평균에대한신뢰구간을구할수있다. 평균 와분산 을가지는모집단이있으며, 는모르고 만안다고가정하자. 그리고이모집단으로부터 을표본추출하였으며 은알지만 는모르기때문에신뢰구간을통하여 를추정할수있으며 Z-통계량을이용하면된다. 신뢰수준이 가되는표준정규분포의신뢰구간은다음과같다. 여기서확률변수 이므로위의확률등식을다음과같이다시쓸수있다. 따라서 부터 까지의임의구간이모평균 를포 함할확률은 가되므로 에대한 100( )% 의신뢰구간은다음과같다. (, )

145 제 6 장추정 _ 141 ( 연습 1) 한기업에서현대인들이대기오염에시달린다는사실에착안하여언제나신선한산소를마실수있는휴대용산소제품을개발하기로하였다. 따라서이기업의연구팀은일반인들의산소소비량을측정하기위해임의로 35명을선정, 분당산소소비량을조사하여다음자료를얻었다. 이연구팀은일반인들의모집단은정규분포하며분산이 0.36이라는사실을알고있다고가정하자. 모집단평균의 95% 신뢰구간을구하라. b1-ch6-2.r을실행해보면모평균에대한 95% 신뢰구간은 ( , ) 이다. 그러므로 는 95% 신뢰수준에서 ( , ) 에속하게된다. b1-ch6-2.r 의실행결과 > data1<-" > data1_dat<-as.matrix(read.csv(data1,header=t), ncol=1) > var1<-data1_dat[,1] > xbar=mean(var1) > z<-qnorm(0.025, 0, 1, lower.tail=f) > LCL1<-xbar-z*(0.6/sqrt(35)) > UCL1<-xbar+z*(0.6/sqrt(35)) > LCL1;UCL1 [1] [1]

146 142 _ R 기초및통계분석 (2) t- 통계량이용 모집단이정규분포에따르고, 표본의크기가 30 미만의소표본이며, 모분산이알려져있지않은경우 t-통계량을이용하여모평균에대한신뢰구간을구할수있다. 모분산을모르고표본의크기가충분히크지않을때, 확률변수 는자 유도 n-1인 t-분포 (Student s t-distribution) 에따른다. 신뢰수준이 가되는 t-분포의신뢰구간은다음과같다. 여기서확률변수 이므로위의확률등식을다음과같이다시쓸수있다. 따라서 부터 까지의임의구간이모평 균 를포함할확률은 가되므로 에대한 100( )% 의신뢰구간은다음과같다. (, )

147 제 6 장추정 _ 143 ( 연습 2) 한피자체인점의지배인은피자배달시간이오래걸린다는소비자들의불평을확인해보기위해피자배달주문중임의로 20개를선정하여배달시간 ( 단위 : 분 ) 을측정하였더니다음과같았다. 모집단이정규분포를한다고가정하고모평균배달시간에대한 95% 신뢰구간을구하라 b1-ch6-3.r을실행해보면모평균에대한 95% 신뢰구간은 ( , ) 이다. 그러므로 는 95% 신뢰수준에서 ( , ) 에속하게된다. b1-ch6-3.r 의실행결과 > library(foreign) > time<-read.dta(file=" > n<-length(time$var1) > s<-sd(time$var1) > t19<-qt(0.025, df=19, lower.tail=f) > average<-mean(time$var1) > LCL<-average-t19*(s/sqrt(n)) > UCL<-average+t19*(s/sqrt(n)) > LCL;UCL [1] [1]

148 144 _ R 기초및통계분석 3. 모분산구간추정 모평균이 10이고표준편차가 2인모집단에서 100개의표본을추출하여모분산 ( ) 에대한신뢰구간을추정하는 b1-ch6-4.r을실행해보면모분산에대한 95% 신뢰구간 100개중 95개이상의신뢰구간이모분산 4를포함하고있는것을확인할수있다. > set.seed(12345) b1-ch6-4.r 의실행결과 > CIlower<-numeric(100) > CIupper<-numeric(100) > pvalue1<-numeric(100) > for(j in 1:100) { + sample<-rnorm(100,10,2) + s2<-var(sample) + chi<-(99*s2)/4 + pvalue1[j]<-pchisq(chi, 0.95, df=99, lower.tail=f) + chi_... [TRUNCATED] > CIlower [1] [7] [13] [19] [25] [31] [37] [43] [49] [55] [61]

149 제 6 장추정 _ 145 [67] [73] [79] [85] [91] [97] > CIupper [1] [7] [13] [19] [25] [31] [37] [43] [49] [55] [61] [67] [73] [79] [85] [91] [97] > pvalue1 [1] [5] [9] [13] [17] [21] [25] [29] [33] [37]

150 146 _ R 기초및통계분석 [41] [45] [49] [53] [57] [61] [65] [69] [73] [77] [81] [85] [89] [93] [97] > reject1<-pvalue1<=0.05 > table(reject1) reject1 FALSE TRUE 96 4 > color<-rep(gray(.7),100) > color[reject1]<-"black" > plot(0, xlim=c(1,7), ylim=c(1,100), ylab="sample No.", xlab="", main="95% Confidence Interval for sigma-square") > abline(v=4, lty=2) > for(j in 1:100) { + lines(c(cilower[j], CIupper[j]), c(j,j), col=color[j], lwd=1) + }

151 제 6 장추정 _ % Confidence Interval for sigma-square Sample No 확률변수 는자유도가 n-1인 -분포를따른다. 신뢰수준이 가되는 의신뢰구간은다음과같다. 여기서확률변수 이므로위의확률등식을다음과같이다시쓸 수있다. 따라서 부터 까지의임의구간이모분산 를포 함할확률은 가되므로 에대한 100( )% 의신뢰구간은다음과같다. (, )

152 148 _ R 기초및통계분석 ( 연습 3) K제약회사에서두통약을개발하였으며이약의효과를알아보기위해두통환자 10명을임의로선정하여두통약을복용하게한후두통억제시간 ( 단위 : 분 ) 을측정하였다. 두통억제시간이정규분포할때, 모분산에대한 99% 의신뢰구간을구하라 b1-ch6-5.r 을실행해보면모분산에대한 99% 신뢰구간은 ( , ) 이다. 그러므로 는 99% 신뢰수준에서 ( , ) 에속하게된다. > time<-c(66,37,18,31,85,63,73,83,65,80) b1-ch6-5.r 의실행결과 > df<-length(time)-1 > s.sq<-var(time) > u.chi<-qchisq(0.005, df=df, lower.tail=f) > u.chi [1] > l.chi<-qchisq(0.995, df=df, lower.tail=f) > l.chi [1] > LCL<-(df*s.sq/u.chi) > UCL<-(df*s.sq/l.chi) > LCL;UCL [1] [1]

153 제 7 장 가설검정 1. 가설검정의기초개념 2. 단일집단에대한가설검정 3. 두집단에대한가설검정

154 150 _ R 기초및통계분석 제 7 장가설검정 1. 가설검정의기초개념 (1) 가설의종류 가설이란모집단의특성을대표하는모수에대한주장이나예상을의미하는데가설의종류에는귀무가설 (Null Hypothesis : ) 과대립가설 (Alternative Hypothesis : ) 이있다. 귀무가설에는모수의값하나만을설정하는단순가설과모수가속하는범위를설정하는복합가설이있다. 대립가설에는귀무가설에서설정된값을기준으로어느한쪽범위를포함하는단측대립가설과귀무가설에서설정된값을제외한양쪽범위를포함하는양측대립가설이있다.

155 제 7 장가설검정 _ 151 (2) 가설설정 일반적으로통계분석에서는모집단의모수에대하여관심이있으므로가설은모수에대하여설정한다. 모수가특정한값이다, 두모수의값이같다 등과같이간단하고구체적인경우를귀무가설로설정한다. 모수가특정한값이아니다, 한모수의값이다른모수의값보다크다, 두모수의값이다르다 등과같이모수에대한관심의영역중에서귀무가설로지정되지않은모든경우를포괄적으로대립가설로설정한다. (3) 가설검정 모집단에대한어떤가설을설정한뒤에표본관찰을통하여그가설의채택여부를결정하는분석방법을가설검정이라고한다. 가설검정이란두가설 와 중에서하나를선택하는과정이므로 를채택 (accept) 하면 을기각 (reject) 하게되고 를기각하면 을채택하게된다. 따라서가설검정이란 두가설중에서귀무가설 를채택하든지또는기각하는과정 이라고이해할수있다. (4) 검정통계량 검정통계량은가설검정에서관찰된표본으로부터구하는통계량으로분포가가설에서주어지는모수에의존한다. 귀무가설이옳다는전제하에서구한검정통계량의값이나타날가능성이크면귀무가설을채택하고나타날가능성이작으면귀무가설을기각한다. 검정통계량 표본통계량 모수의귀무가설의값표본통계량의표준오차 가설검정은단일집단모평균및모분산에대한가설검정이있고, 두집단의모평균

156 152 _ R 기초및통계분석 및모분산에대한가설검정이있는데이와관련된검정통계량으로정리해보면 < 표 7-1> 과같다. < 표 7-1> 가설검정의유형에따른검정통계량 구분 단일집단 두집단 모평균 Z-검정통계량, t-검정통계량 Z-검정통계량, t-검정통계량 모분산 -검정통계량 F-검정통계량 한편, 모평균가설검정을위한의사결정트리를그려보면 < 그림 7-1> 과같다. < 그림 7-1> 모평균가설검정을위한의사결정트리 (5) 유의수준과신뢰수준 유의수준 란귀무가설이옳은데도불구하고이를기각하는확률의크기를말하며검정통계량을구하는것과는무관하게검정을실시하는사람의판단에따라결정되

157 제 7 장가설검정 _ 153 는데일반적으로유의수준은 1%, 5%, 10% 중하나를정한다. 가설검정에서유의수준 % 는구간추정에서신뢰수준 (100- )% 와동일한의미를갖는다. 예를들어, 표준정규분포에서 95% 신뢰구간은 에의하여 (-1.96, 1.96) 임을알수있는데, 표준정규분포를이용하는검정에서 5% 유의수준하에서의기각역은 (-, -1.96) 과 (1.96, ) 로위의 95% 신뢰구간과반대가된다. 이와같이 5% 유의수준하에서의기각역은 95% 신뢰수준하에서의신뢰구간과반대의의미를가지고있기때문에유의수준 % 하에서의검정은 (100- )% 의신뢰수준하에서의검정이라고도한다. (6) 기각역 기각역이란가설검정에서유의수준 가정해졌을때, 검정통계량의분포에서이유의수준의크기에해당하는영역을말하는데, 이영역의위치는대립가설의형태에따라달라진다. 대립가설의형태는가설검정의목적에의하여결정되는데가설검정은대립가설의형태에따라양측검정과단측검정으로나누어지고, 단측검정은다시왼쪽단측검정과오른쪽단측검정으로분류된다.

158 154 _ R 기초및통계분석 (7) 가설검정단계 가설검정과정을단계적으로설명하면다음과같다 (8) 제 1 종의오류및제 2 종의오류 제1종오류 (type I error) 는귀무가설 가옳은데도불구하고 를기각하는오류를말한다. 이것이나타날확률을제1종오류의크기라고하는데, 이는앞에서정의된유의수준 와같다. 제2종오류 (type Ⅱ error) 는귀무가설 가옳지않은데도 를채택하는오류를말한다. 이것이나타날확률을제2종오류의크기라고하는데이를 로표현한다. 가설검정결과정확한사실 가사실이라고판정 가사실이아니라고판정 가사실임 옳은결정 제1종의오류 ( ) 가사실이아님 제2종의오류 ( ) 옳은결정 b1-ch7-1.r을실행하면 이사실이아님에도불구하고 을채택하는제2종의오류를보여준다. 평균이 10이고표준편차가 2인모집단 ( 이사실인귀무가설 ) 에서 100개의표본을추출하여,, 의가설 ( 가사실이아님 ) 을검정하기위한신뢰구간을살펴보면귀무가설의값이사실에서멀어질수록신뢰구간이귀무가설이사실이아닌모평균을포함하는경우는

확률과통계6

확률과통계6 확률과통계 6. 이산형확률분포 건국대학교스마트 ICT 융합공학과윤경로 (yoonk@konkuk.ac.kr) 6. 이산형확률분포 6.1 이산균일분포 6.2 이항분포 6.3 초기하분포 6.4 포아송분포 6.5 기하분포 6.6 음이항분포 * ( 제외 ) 6.7 다항분포 * ( 제외 ) 6.1 이산균일분포 [ 정의 6-1] 이산균일분포 (discrete uniform

More information

statistics

statistics 수치를이용한자료요약 statistics hmkang@hallym.ac.kr 한림대학교 통계학 강희모 ( 한림대학교 ) 수치를이용한자료요약 1 / 26 수치를 통한 자료의 요약 요약 방대한 자료를 몇 개의 의미있는 수치로 요약 자료의 분포상태를 알 수 있는 통계기법 사용 중심위치의 측도(measure of center) : 어떤 값을 중심으로 분포되어 있는지

More information

Microsoft PowerPoint - SBE univariate5.pptx

Microsoft PowerPoint - SBE univariate5.pptx 이상치 (outlier) 진단및해결 Homework 데이터 ( Option.XLS) 결과해석 치우침? 평균이중앙값에비해다소크다. 그러나이상치때문이지치우친것같지않음. Toys us 스톡옵션비율이이상치 해결방법 : Log 변환? 아니다치우쳐있지않기때문에제거 제거후 : 평균 :.74, 중위수 :.7 31 치우침과이상치 데이터 : 노트북평가점수 우로치우침과이상치가존재

More information

Microsoft Word - SAS_Data Manipulate.docx

Microsoft Word - SAS_Data Manipulate.docx 수학계산관련 함수 함수 형태 내용 SIN(argument) TAN(argument) EXP( 변수명 ) SIN 값을계산 -1 argument 1 TAN 값을계산, -1 argument 1 지수함수로지수값을계산한다 SQRT( 변수명 ) 제곱근값을계산한다 제곱은 x**(1/3) = 3 x x 1/ 3 x**2, 세제곱근 LOG( 변수명 ) LOGN( 변수명 )

More information

(001~006)개념RPM3-2(부속)

(001~006)개념RPM3-2(부속) www.imth.tv - (~9)개념RPM-(본문).. : PM RPM - 대푯값 페이지 다민 PI LPI 알피엠 대푯값과산포도 유형 ⑴ 대푯값 자료 전체의 중심적인 경향이나 특징을 하나의 수로 나타낸 값 ⑵ 평균 (평균)= Ⅰ 통계 (변량)의 총합 (변량의 개수) 개념플러스 대푯값에는 평균, 중앙값, 최 빈값 등이 있다. ⑶ 중앙값 자료를 작은 값부터 크기순으로

More information

확률 및 분포

확률 및 분포 확률및분포 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 확률및분포 1 / 15 학습내용 조건부확률막대그래프히스토그램선그래프산점도참고 박창이 ( 서울시립대학교통계학과 ) 확률및분포 2 / 15 조건부확률 I 첫째가딸일때두아이모두딸일확률 (1/2) 과둘중의하나가딸일때둘다딸일확률 (1/3) 에대한모의실험 >>> from collections import

More information

Microsoft PowerPoint - LN05 [호환 모드]

Microsoft PowerPoint - LN05 [호환 모드] 계량재무분석 I Chapter 6 & 7 Probability Distribution II 경영대학재무금융학과 윤선중 0 Objectives 확률변수 이산확률분포 (Discrete Random Variables): 셀수있는확률변수 연속확률분포 (Continuous Random Variables): 셀수없는경우의수 이산확률변수 분포의대표값 기대치 (Expected

More information

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포 생존분석의 추정과 비교 : 보충자료 이용희 December, 8 Cotets 생존함수와 위험함수. 생존함수와 위험함수....................................... 예제: 지수분포.......................................... 예제: 와이블분포.........................................

More information

마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다.

마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임.   가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다. 마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. http://min7014.iptime.org/math/2017063002.htm 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다. https://goo.gl/edxsm7 http://min7014.iptime.org/math/2018010602.pdf

More information

Microsoft Word - EDA_Univariate.docx

Microsoft Word - EDA_Univariate.docx 일변량분석개념 일변량분석은개체의특성을 측정한변수가하나인 통계분석 방법 변수의 종류 ( 수리 통계 ) 이산형 (discrete): 측정결과를셀수있는경우이다. 성별, 직업, 교통량, 나이등이여기해당된다. 연속형 (continuous): 측정결과가무한이 (infinite) 많은변수를연속형형변수라한다. 즉변수의범위 (range) 중어떤구간을설정하더라도측정치가발생할할수있는경우로키,

More information

G Power

G Power G Power 부산대학교통계학과조영석 1. G Power 란? 2. G Power 설치및실행 2.1 G Power 설치 2.2 G Power 실행 3. 검정 (Test) 3.1 가설검정 (Test of hypothesis) 3.2 검정력 (Power) 3.3 효과크기 (Effect size) 3.4 표본수산정 4. 분석 4.1 t- 검정 (t-test) 4.2

More information

R t-..

R t-.. R 과데이터분석 집단의차이비교 t- 검정 양창모 청주교육대학교컴퓨터교육과 2015 년겨울 t- 검정 변수의값이연속적이고정규분포를따른다고할때사용 t.test() 는모평균과모평균의 95% 신뢰구간을추청함과동시에가설검증을수행한다. 모평균의구간추정 - 일표본 t- 검정 이가설검정의귀무가설은 모평균이 0 이다 라는귀무가설이다. > x t.test(x)

More information

확률과통계4

확률과통계4 확률과통계 4. 확률변수와확률분포 건국대학교스마트 ICT 융합공학과윤경로 (yoonk@konkuk.ac.kr) 4. 확률변수와확률분포 4.1 확률변수와확률분포의개념 4.2 결합확률분포 4.3 주변확률분포 4.4 조건부확률분포 4.5 확률변수의독립 4.1 확률변수와확률분포의개념 [ 정의 4-1] 확률변수 (random variable) 표본공간의각원소를실수값으로

More information

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt 수명분포및신뢰도의 통계적추정 포항공과대학교산업공학과전치혁.. 수명및수명분포 수명 - 고장 까지의시간 - 확률변수로간주 - 통상잘알려진분포를따른다고가정 수명분포 - 확률밀도함수또는 누적 분포함수로표현 - 신뢰도, 고장률, MTTF 등신뢰성지표는수명분포로부터도출 - 수명분포추정은분포함수관련모수의추정 누적분포함수및확률밀도함수 누적분포함수 cumulav dsbuo

More information

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

LaTeX. [width=1em]Rlogo.jpg Sublime Text. .. L A TEX 과 을결합한문서작성 Sublime Text 의활용 2015. 01. 31. 차례 1 L A TEX 과활용에유용한 Sublime text 2 LaTeXing 과 Extend 3 LaTeXing 의 Snippet 을활용한 L A TEX 편집 4 L A TEX 과을결합한문서작성 5 Reproducible Research 의응용 활용에 유용한 Sublime

More information

기술통계

기술통계 기술통계 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 기술통계 1 / 17 친구수에대한히스토그램 I from matplotlib import pyplot as plt from collections import Counter num_friends = [100,49,41,40,25,21,21,19,19,18,18,16, 15,15,15,15,14,14,13,13,13,13,12,

More information

01

01 2019 학년도대학수학능력시험 9 월모의평가문제및정답 2019 학년도대학수학능력시험 9 월모의평가문제지 1 제 2 교시 5 지선다형 1. 두벡터, 모든성분의합은? [2 점 ] 에대하여벡터 의 3. 좌표공간의두점 A, B 에대하여선분 AB 를 로외분하는점의좌표가 일때, 의값은? [2점] 1 2 3 4 5 1 2 3 4 5 2. lim 의값은? [2점] 4. 두사건,

More information

1 1 Department of Statistics University of Seoul August 28, 2017 확률분포 누적분포함수 확률공간이정의되었다고가정하자. 즉, 어떤사건 A 에대해서 P(A) 를항상생각할수있다고가정하자. 어떤확률변수 X 주어졌을때 Pr(X x) = P(X (, x]) 로정의하면 Pr(X x) 의값을모든 x 에대해생각할수있다. F

More information

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed 중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed mean), 가중평균 (weighted mean), 기하평균 (geometric mean),

More information

프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음

프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음 프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음 CHAPTER 9 둘중하나선택하기 관계연산자 두개의피연산자를비교하는연산자 결과값은참 (1) 아니면거짓 (0) x == y x 와 y 의값이같은지비교한다. 관계연산자 연산자 의미 x == y x와 y가같은가? x!= y

More information

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut 경영학을 위한 수학 Fial Eam 5//(토) :-5: 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오.. (각 6점) 다음 적분을 구하시오 4 ( ) (a) ( )4 8 8 (b) d이 성립한다. d C C log log (c) 이다. 양변에 적분을 취하면 log C (d) 라 하자. 그러면 d 4이다. 9 9 4 / si (e) cos si

More information

C 프로그래밍 언어 입문 C 프로그래밍 언어 입문 김명호저 숭실대학교 출판국 머리말..... C, C++, Java, Fortran, Python, Ruby,.. C. C 1972. 40 C.. C. 1999 C99. C99. C. C. C., kmh ssu.ac.kr.. ,. 2013 12 Contents 1장 프로그래밍 시작 1.1 C 10 1.2 12

More information

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드] 제 강.1 통계적기초 확률변수 (Radom Variable). 확률변수 (r.v.): 관측되기전까지는그값이알려지지않은변수. 확률변수의값은확률적실험으로부터결과된다. 확률적실험은실제수행할수있는실험뿐아니라가상적실험도포함함 (ex. 주사위던지기, [0,1] 실선에점던지기 ) 확률변수는그변수의모든가능한값들의집합에대해정의된알려지거나알려지지않은어떤확률분포의존재가연계됨 반면에,

More information

Microsoft PowerPoint - Java7.pptx

Microsoft PowerPoint - Java7.pptx HPC & OT Lab. 1 HPC & OT Lab. 2 실습 7 주차 Jin-Ho, Jang M.S. Hanyang Univ. HPC&OT Lab. jinhoyo@nate.com HPC & OT Lab. 3 Component Structure 객체 (object) 생성개념을이해한다. 외부클래스에대한접근방법을이해한다. 접근제어자 (public & private)

More information

통계학입문

통계학입문 통계학입문 ( 기초통계학 ) 1. 1 개요 통계학 (statistics) 관심의대상에대해관련된자료를수집하고그 자료를요약, 정리하여이로부터불확실한사실에 대한결론이나일반적인규칙성을추구하는학문 Statistic : 통계치, 통계량 CH 1-2 1. 1 개요 통계학 (statistics) 기술통계학 (descriptive stat) 수집된자료의정리및요약방법을다룸

More information

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞 줄기잎그림 stem and leaf + 진단내용 1) 분포의개략적인형태를알수있다. (1) 좌우대칭인가? 아니면 skewed 되었는가? (2) 봉우리 (modal) 는하나인가? 아니면여러개인가? 2) 이상치의존재여부를쉽게파악할수있다. + 데이터 ( 정렬 ) ( 정렬않음 ) + 그리는순서 자료를크기순으로정리한다. 자료의수가많을때는자료정렬을수작업하기어려움으로이단계는무시해도되지만자료를크기순으로정렬해놓으면

More information

untitled

untitled R 과함께하는통계학의이해 빅북이라명명된이책은지식공유의세계적인흐름에동참하고지적인업적들이세상과인류의지식이되도록하며, 누구나쉽게접근하고활용할수있는환경을만들고자한다. 이책의저작권은빅북 (www.bigbook.or.kr) 에있으며모든용도로활용할수있다. 다만상업용출판을하고자하는경우에는사전에문서로된허락을받아야한다. 공유와협력의교과서만들기운동본부 R 과함께하는 통계학의이해

More information

데이터 시각화

데이터 시각화 데이터시각화 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 1 / 22 학습내용 matplotlib 막대그래프히스토그램선그래프산점도참고 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 2 / 22 matplotlib I 간단한막대그래프, 선그래프, 산점도등을그릴때유용 http://matplotlib.org 에서설치방법참고윈도우의경우명령프롬프트를관리자권한으로실행한후아래의코드실행

More information

Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2

Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2 통계학 - CAS0001 7 주차 이산확률분포 이석준 Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2 학습목표 확률변수가연속적인지이산적인지구분한다. 이항분포, 초기하분포,

More information

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다 이장에서사용되는 MATLAB 명령어들은비교적복잡하므로 MATLAB 창에서명령어를직접입력하지않고확장자가 m 인 text 파일을작성하여실행을한다. 즉, test.m 과같은 text 파일을만들어서 MATLAB 프로그램을작성한후실행을한다. 이와같이하면길고복잡한 MATLAB 프로그램을작성하여실행할수있고, 오류가발생하거나수정이필요한경우손쉽게수정하여실행할수있는장점이있으며,

More information

Microsoft PowerPoint Android-SDK설치.HelloAndroid(1.0h).pptx

Microsoft PowerPoint Android-SDK설치.HelloAndroid(1.0h).pptx To be an Android Expert 문양세강원대학교 IT 대학컴퓨터학부 Eclipse (IDE) JDK Android SDK with ADT IDE: Integrated Development Environment JDK: Java Development Kit (Java SDK) ADT: Android Development Tools 2 JDK 설치 Eclipse

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Chapter 06 반복문 01 반복문의필요성 02 for문 03 while문 04 do~while문 05 기타제어문 반복문의의미와필요성을이해한다. 대표적인반복문인 for 문, while 문, do~while 문의작성법을 알아본다. 1.1 반복문의필요성 반복문 동일한내용을반복하거나일정한규칙으로반복하는일을수행할때사용 프로그램을좀더간결하고실제적으로작성할수있음.

More information

C# Programming Guide - Types

C# Programming Guide - Types C# Programming Guide - Types 최도경 lifeisforu@wemade.com 이문서는 MSDN 의 Types 를요약하고보충한것입니다. http://msdn.microsoft.com/enus/library/ms173104(v=vs.100).aspx Types, Variables, and Values C# 은 type 에민감한언어이다. 모든

More information

Microsoft PowerPoint - e pptx

Microsoft PowerPoint - e pptx Import/Export Data Using VBA Objectives Referencing Excel Cells in VBA Importing Data from Excel to VBA Using VBA to Modify Contents of Cells 새서브프로시저작성하기 프로시저실행하고결과확인하기 VBA 코드이해하기 Referencing Excel Cells

More information

Microsoft PowerPoint - PDF3 SBE 20080417.pptx

Microsoft PowerPoint - PDF3 SBE 20080417.pptx 연속형 확률밀도함수 연속형 확률분포함수? 데이터 히스토그램의 정상을 연결하면 확률분포함수가 된다. 이를 이용하여 데이터(표본)의 분포(이는 모집단의 분포와 동일)를 구 하게 된다. 그러나 함수를 구하는 것은 불가능해 보인다. 그래서 현실에서는 확률분포를 가정하게 된다. (예)기다리는 시간: 지수분포, 측정 오 차: 정규분포 Gauss(천문학자): 행성들간 거리

More information

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의 제시문 문제지 2015학년도 대학 신입학생 수시모집 일반전형 면접 및 구술고사 수학 제시문 1 하나의 동전을 던질 때, 앞면이나 뒷면이 나온다. 번째 던지기 전까지 뒷면이 나온 횟수를 라 하자( ). 처음 던지기 전 가진 점수를 점이라 하고, 번째 던졌을 때, 동전의 뒷면이 나오면 가지고 있던 점수를 그대로 두고, 동전의 앞면이 나오면 가지고 있던 점수를 배

More information

10. ..

10. .. 점추정구간추정표본크기 차례 점추정구간추정표본크기 1 점추정 2 구간추정 3 표본크기 추정의종류 점추정구간추정표본크기 점추정 (point estimation): 모수를어떤하나의값으로추측하는것 구간추정 (interval estimation): 모수를어떤구간으로추측하는것 예 ) 피그미족 (Pygmytribe) 의평균키는모수 µ 표본을추출하여평균을구해보니 135cm

More information

Microsoft PowerPoint - IPYYUIHNPGFU

Microsoft PowerPoint - IPYYUIHNPGFU 분산분석 분산분석 (ANOVA: ANALYSIS OF VARIANCE) 두개이상의모집단의차이를검정 예 : 회사에서세종류의기계를설치하여동일한제품을생산하는경우, 각기계의생산량을조사하여평균생산량을비교 독립변수 : 다른변수에의해영향을주는변수 종속변수 : 다른변수에의해영향을받는변수 요인 (Factor): 독립변수 예에서의요인 : 기계의종류 (I, II, III) 요인수준

More information

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석 동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석 목차 I. 서론 II. 동아시아각국의무역수지, 실질실효환율및 GDP간의관계 III. 패널데이터를이용한 Granger인과관계분석 IV. 개별국실증분석모형및 TYDL을이용한 Granger 인과관계분석 V. 결론 참고문헌 I. 서론 - 1 - - 2 - - 3 - - 4

More information

확률과통계 강의자료-1.hwp

확률과통계 강의자료-1.hwp 1. 통계학이란? 1.1 수학적 모형 실험 또는 증명을 통하여 자연현상을 분석하기 위한 수학적인 모형 1 결정모형 (deterministic model) - 뉴톤의 운동방정식 : - 보일-샤를의 법칙 : 일정량의 기체의 부피( )는 절대 온도()에 정비례하고, 압력( )에 반비례한다. 2 확률모형 (probabilistic model) - 주사위를 던질 때

More information

OCW_C언어 기초

OCW_C언어 기초 초보프로그래머를위한 C 언어기초 4 장 : 연산자 2012 년 이은주 학습목표 수식의개념과연산자및피연산자에대한학습 C 의알아보기 연산자의우선순위와결합방향에대하여알아보기 2 목차 연산자의기본개념 수식 연산자와피연산자 산술연산자 / 증감연산자 관계연산자 / 논리연산자 비트연산자 / 대입연산자연산자의우선순위와결합방향 조건연산자 / 형변환연산자 연산자의우선순위 연산자의결합방향

More information

<B0A3C3DFB0E828C0DBBEF7292E687770>

<B0A3C3DFB0E828C0DBBEF7292E687770> 초청연자특강 대구가톨릭의대의학통계학교실 Meta analysis ( 메타분석 ) 예1) The effect of interferon on development of hepatocellular carcinoma in patients with chronic hepatitis B virus infection?? -:> 1998.1 ~2007.12.31 / RCT(2),

More information

10 강. 쉘스크립트 l 쉘스크립트 Ÿ 쉘은명령어들을연속적으로실행하는인터프리터환경을제공 Ÿ 쉘스크립트는제어문과변수선언등이가능하며프로그래밍언어와유사 Ÿ 프로그래밍언어와스크립트언어 -프로그래밍언어를사용하는경우소스코드를컴파일하여실행가능한파일로만들어야함 -일반적으로실행파일은다

10 강. 쉘스크립트 l 쉘스크립트 Ÿ 쉘은명령어들을연속적으로실행하는인터프리터환경을제공 Ÿ 쉘스크립트는제어문과변수선언등이가능하며프로그래밍언어와유사 Ÿ 프로그래밍언어와스크립트언어 -프로그래밍언어를사용하는경우소스코드를컴파일하여실행가능한파일로만들어야함 -일반적으로실행파일은다 10 강. 쉘스크립트 쉘스크립트 쉘은명령어들을연속적으로실행하는인터프리터환경을제공 쉘스크립트는제어문과변수선언등이가능하며프로그래밍언어와유사 프로그래밍언어와스크립트언어 -프로그래밍언어를사용하는경우소스코드를컴파일하여실행가능한파일로만들어야함 -일반적으로실행파일은다른운영체제로이식되지않음 -스크립트언어를사용하면컴파일과정이없고인터프리터가소스파일에서명령문을판독하여각각의명령을수행

More information

Microsoft PowerPoint SDK설치.HelloAndroid(1.5h).pptx

Microsoft PowerPoint SDK설치.HelloAndroid(1.5h).pptx To be an Android Expert 문양세강원대학교 IT 대학컴퓨터학부 개발환경구조및설치순서 JDK 설치 Eclipse 설치 안드로이드 SDK 설치 ADT(Androd Development Tools) 설치 AVD(Android Virtual Device) 생성 Hello Android! 2 Eclipse (IDE) JDK Android SDK with

More information

슬라이드 1

슬라이드 1 Pairwise Tool & Pairwise Test NuSRS 200511305 김성규 200511306 김성훈 200614164 김효석 200611124 유성배 200518036 곡진화 2 PICT Pairwise Tool - PICT Microsoft 의 Command-line 기반의 Free Software www.pairwise.org 에서다운로드후설치

More information

PowerPoint Presentation

PowerPoint Presentation 객체지향프로그래밍 클래스, 객체, 메소드 ( 실습 ) 손시운 ssw5176@kangwon.ac.kr 예제 1. 필드만있는클래스 텔레비젼 2 예제 1. 필드만있는클래스 3 예제 2. 여러개의객체생성하기 4 5 예제 3. 메소드가추가된클래스 public class Television { int channel; // 채널번호 int volume; // 볼륨 boolean

More information

1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속

1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속 1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속 2 1.1 함수를표현하는네가지방법 함수 f : D E 는집합 D 의각원소 x 에집합 E 에속하는단하나의원소 f(x) 를 대응시키는규칙이다.

More information

R

R R 프로그래밍의기초 Big Data Analytics Short Courses 5 Big Data Analytics Short Courses R 프로그래밍의기초 5 1 / 37 R Programming 1 R Programming 2 3 Big Data Analytics Short Courses R 프로그래밍의기초 5 2 / 37 Topic R Programming

More information

슬라이드 1

슬라이드 1 대한의료관련감염관리학회학술대회 2016년 5월 26일 ( 목 ) 15:40-17:40 서울아산병원동관 6층대강당서울성심병원김지형 기능, 가격, 모든것을종합 1 Excel 자료정리 2 SPSS 학교에서준다면설치 3 통계시작 : dbstat 4 Web-R : 표만들기, 메타분석 5 R SPSS www.cbgstat.com dbstat 직접 dbstat 길들이기

More information

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63> 제 3 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료 3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료 분포형태, 상대적위치, 극단값 분포형태 z-값 체비셰프의원리 경험법칙 극단값찾기 분포형태 : 왜도 (skewness) 분포형태를측정하는중요한척도중하나를 왜도 라고한다. 자료집합의왜도를구하는계산식은조금복잡하다. 통계프로그램을사용하여왜도를쉽게계산할수있다.

More information

Microsoft PowerPoint - 26.pptx

Microsoft PowerPoint - 26.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2011년봄학기 강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

1

1 04단원 컴퓨터 소프트웨어 1. 프로그래밍 언어 2. 시스템 소프트웨어 1/10 1. 프로그래밍 언어 1) 프로그래밍 언어 구분 각종 프로그래밍 언어에 대해 알아보는 시간을 갖도록 하겠습니다. 우리가 흔히 접하는 소프트웨어 들은 프로그래밍 언어로 만들어지는데, 프로그래밍 언어는 크게 2가지로 나눌 수 있습니다. 1 저급어 : 0과 1로 구성되어 있어, 컴퓨터가

More information

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 (   ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각 JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( http://java.sun.com/javase/6/docs/api ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각선의길이를계산하는메소드들을작성하라. 직사각형의가로와세로의길이는주어진다. 대각선의길이는 Math클래스의적절한메소드를이용하여구하라.

More information

MATLAB and Numerical Analysis

MATLAB and Numerical Analysis School of Mechanical Engineering Pusan National University dongwoonkim@pusan.ac.kr Review 무명함수 >> fun = @(x,y) x^2 + y^2; % ff xx, yy = xx 2 + yy 2 >> fun(3,4) >> ans = 25 시작 x=x+1 If문 >> if a == b >>

More information

Microsoft PowerPoint - chap04-연산자.pptx

Microsoft PowerPoint - chap04-연산자.pptx int num; printf( Please enter an integer: "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num = %d\n", num); } 1 학습목표 수식의 개념과 연산자, 피연산자에 대해서 알아본다. C의 를 알아본다. 연산자의 우선 순위와 결합 방향에

More information

[INPUT] 뒤에는변수와관련된정보를표기한다. [CARDS;] 뒤에는각각의변수가가지는관측값들을표기한다. >> 위의프로그램에서데이터셋명은 wghtclub 이고, 변수는 idno, name, team, strtwght, endwght 이다. 이중 name 과 team 은

[INPUT] 뒤에는변수와관련된정보를표기한다. [CARDS;] 뒤에는각각의변수가가지는관측값들을표기한다. >> 위의프로그램에서데이터셋명은 wghtclub 이고, 변수는 idno, name, team, strtwght, endwght 이다. 이중 name 과 team 은 SAS 의기본형식 1. INPUT 문 DATA wghtclub; INPUT idno 1-4 name $ 6-24 team $ strtwght endwght; loss=strtwght -endwght; CARDS; 1023 David Shaw red 189 165 1049 Amelia Serrno yellow 145 124 1219 Alan Nance red

More information

윈도우즈프로그래밍(1)

윈도우즈프로그래밍(1) 제어문 (2) For~Next 문 윈도우즈프로그래밍 (1) ( 신흥대학교컴퓨터정보계열 ) 2/17 Contents 학습목표 프로그램에서주어진특정문장을부분을일정횟수만큼반복해서실행하는문장으로 For~Next 문등의구조를이해하고활용할수있다. 내용 For~Next 문 다중 For 문 3/17 제어문 - FOR 문 반복문 : 프로그램에서주어진특정문장들을일정한횟수만큼반복해서실행하는문장

More information

Eclipse 와 Firefox 를이용한 Javascript 개발 발표자 : 문경대 11 년 10 월 26 일수요일

Eclipse 와 Firefox 를이용한 Javascript 개발 발표자 : 문경대 11 년 10 월 26 일수요일 Eclipse 와 Firefox 를이용한 Javascript 개발 발표자 : 문경대 Introduce Me!!! Job Jeju National University Student Ubuntu Korean Jeju Community Owner E-Mail: ned3y2k@hanmail.net Blog: http://ned3y2k.wo.tc Facebook: http://www.facebook.com/gyeongdae

More information

Microsoft Word - Software_Ch2_FUNCTION.docx

Microsoft Word - Software_Ch2_FUNCTION.docx Chapter 2 SAS 함수 SAS 함수는소프트웨어에내장되어작업자가손쉽게연산을할수있게데이터값은로그값을계산하려면 LOG() 함수를사용하면된다. 한다. 예를들어 맛보기 EXP() 함수 : () 안의관측치의지수값을구하는함수 RANNOR(seed) 함수 : 평균이 0 이고표준편차가 1인정규분포함수를따르는관측치를생성하는함수, SEED ( 시드 ) 는값을생성할때시작하는위치를나타내는는값으로

More information

초보자를 위한 C++

초보자를 위한 C++ C++. 24,,,,, C++ C++.,..,., ( ). /. ( 4 ) ( ).. C++., C++ C++. C++., 24 C++. C? C++ C C, C++ (Stroustrup) C++, C C++. C. C 24.,. C. C+ +?. X C++.. COBOL COBOL COBOL., C++. Java C# C++, C++. C++. Java C#

More information

Microsoft PowerPoint - 3ÀÏ°_º¯¼ö¿Í »ó¼ö.ppt

Microsoft PowerPoint - 3ÀÏ°_º¯¼ö¿Í »ó¼ö.ppt 변수와상수 1 변수란무엇인가? 변수 : 정보 (data) 를저장하는컴퓨터내의특정위치 ( 임시저장공간 ) 메모리, register 메모리주소 101 번지 102 번지 변수의크기에따라 주로 byte 단위 메모리 2 기본적인변수형및변수의크기 변수의크기 해당컴퓨터에서는항상일정 컴퓨터마다다를수있음 short

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 13 장상관분석 1. 상관계수 2. 상관분석의가정과특성 3. 모상관계수의검정과신뢰한계 4. 순위상관 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 - 실습 - 상관분석 지금까지한가지확률변수에의한현상을검정하였다.

More information

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론 수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론 Ⅱ. 선행연구고찰 집적경제메커니즘의유형공유메커니즘매칭메커니즘학습메커니즘 내용기업이군집을형성하여분리불가능한생산요소, 중간재공급자, 노동력풀등을공유하는과정에서집적경제발생한지역에기업과노동력이군집을이뤄기업과노동력사이의매칭이촉진됨에따라집적경제발생군집이형성되면사람들사이의교류가촉진되어지식이확산되고새로운지식이창출됨에따라집적경제발생

More information

Microsoft PowerPoint - [2009] 02.pptx

Microsoft PowerPoint - [2009] 02.pptx 원시데이터유형과연산 원시데이터유형과연산 원시데이터유형과연산 숫자데이터유형 - 숫자데이터유형 원시데이터유형과연산 표준입출력함수 - printf 문 가장기본적인출력함수. (stdio.h) 문법 ) printf( Test printf. a = %d \n, a); printf( %d, %f, %c \n, a, b, c); #include #include

More information

슬라이드 1

슬라이드 1 Tadpole for DB 1. 도구개요 2. 설치및실행 4. 활용예제 1. 도구개요 도구명 소개 Tadpole for DB Tools (sites.google.com/site/tadpolefordb/) 웹기반의데이터베이스를관리하는도구 Database 스키마및데이터관리 라이선스 LGPL (Lesser General Public License) 특징 주요기능

More information

untitled

untitled 시스템소프트웨어 : 운영체제, 컴파일러, 어셈블러, 링커, 로더, 프로그래밍도구등 소프트웨어 응용소프트웨어 : 워드프로세서, 스프레드쉬트, 그래픽프로그램, 미디어재생기등 1 n ( x + x +... + ) 1 2 x n 00001111 10111111 01000101 11111000 00001111 10111111 01001101 11111000

More information

..(..) (..) - statistics

..(..) (..) - statistics 수치 ( 數値 ) 를이용한자료요약 ( 要約 ) statistics hmkang@hallym.ac.kr 한림대학교 한중시장분석 강희모 ( 한림대학교 ) 수치 ( 數値 ) 를이용한자료요약 ( 要約 ) 1 / 26 수치를 통한 자료의 요약 요약(要約,summary) 많은 자료를 몇 개의 의미(意味)있는 수치로 요약 자료의 분포상태(分布狀態)를 알 수 있는 통계기법(統計技法)

More information

Microsoft Word - ntasFrameBuilderInstallGuide2.5.doc

Microsoft Word - ntasFrameBuilderInstallGuide2.5.doc NTAS and FRAME BUILDER Install Guide NTAS and FRAME BUILDER Version 2.5 Copyright 2003 Ari System, Inc. All Rights reserved. NTAS and FRAME BUILDER are trademarks or registered trademarks of Ari System,

More information

Microsoft PowerPoint - chap02-C프로그램시작하기.pptx

Microsoft PowerPoint - chap02-C프로그램시작하기.pptx #include int main(void) { int num; printf( Please enter an integer "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num = %d\n", num); return 0; } 1 학습목표 을 작성하면서 C 프로그램의

More information

[ 마이크로프로세서 1] 2 주차 3 차시. 포인터와구조체 2 주차 3 차시포인터와구조체 학습목표 1. C 언어에서가장어려운포인터와구조체를설명할수있다. 2. Call By Value 와 Call By Reference 를구분할수있다. 학습내용 1 : 함수 (Functi

[ 마이크로프로세서 1] 2 주차 3 차시. 포인터와구조체 2 주차 3 차시포인터와구조체 학습목표 1. C 언어에서가장어려운포인터와구조체를설명할수있다. 2. Call By Value 와 Call By Reference 를구분할수있다. 학습내용 1 : 함수 (Functi 2 주차 3 차시포인터와구조체 학습목표 1. C 언어에서가장어려운포인터와구조체를설명할수있다. 2. Call By Value 와 Call By Reference 를구분할수있다. 학습내용 1 : 함수 (Function) 1. 함수의개념 입력에대해적절한출력을발생시켜주는것 내가 ( 프로그래머 ) 작성한명령문을연산, 처리, 실행해주는부분 ( 모듈 ) 자체적으로실행되지않으며,

More information

Microsoft PowerPoint - chap06-2pointer.ppt

Microsoft PowerPoint - chap06-2pointer.ppt 2010-1 학기프로그래밍입문 (1) chapter 06-2 참고자료 포인터 박종혁 Tel: 970-6702 Email: jhpark1@snut.ac.kr 한빛미디어 출처 : 뇌를자극하는 C프로그래밍, 한빛미디어 -1- 포인터의정의와사용 변수를선언하는것은메모리에기억공간을할당하는것이며할당된이후에는변수명으로그기억공간을사용한다. 할당된기억공간을사용하는방법에는변수명외에메모리의실제주소값을사용하는것이다.

More information

통계학입문

통계학입문 확률및통계특강 세부사항 교수님 성함 : 김홍기 연락처 : 821-5433 E-mail : honggiekim@cnu.ac.kr 교재 : 통계학입문 ( 정익사 / 김주한외 ) 강의자료 ppt 파일은정보통계학과홈페이지 -> 대학원 -> 수업자료 또는사이버캠퍼스자료실 이사이트에서기출문제도얻을수있습니다. 중간고사 (closed book) : 45%, 기말고사 (open

More information

<4D F736F F F696E74202D20C4C4C8B031B1DEC7CAB1E22DC0FCC3BCB1B3C0E72D D3133B3E232C8B8B1EEC1F62E707074>

<4D F736F F F696E74202D20C4C4C8B031B1DEC7CAB1E22DC0FCC3BCB1B3C0E72D D3133B3E232C8B8B1EEC1F62E707074> 컴퓨터활용능력 1 급필기 (2014 년대비 ) [ 엑셀총정리 (2)] 구분 통계 주요 AVERAGE, MAX, MIN, RANK, VAR, STDEV, COUNT, MEDIAN, MODE, AVERAGEA, LARGE, SMALL, COUNTA, COUNTBLANK, COUNTIF, GEOMEAN, HARMEAN, PERCENTILE, FREQUENCY, AVERAGEIF,

More information

자료의 이해 및 분석

자료의 이해 및 분석 어떤실험이나치료의효과를측정할때독립이아닌표본으로부터관찰치를얻었을때처리하는방법 - 동일한개체에어떤처리를하기전과후의자료를얻을때 - 가능한동일한특성을갖는두개의개체에서로다른처리를하여그처리의효과를비교하는방법 (matching) 1 예제 : 혈청 cholesterol 치를줄이기위해서 12 명을대상으로운동과함께식이요법의효과를 측정하기위한실험실시 2 식이요법 - 운동실험전과후의

More information

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표 Vector Differential: 벡터 미분 Yonhee Lee October 7, 08 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표기법을 정의하는 방법이다 보통 스칼라(scalar)에 대한 미분은 일분수 함수 f : < < 또는 다변수 함수(function

More information

dist=dat[:,2] # 기초통계량구하기 len(speed) # 데이터의개수 np.mean(speed) # 평균 np.var(speed) # 분산 np.std(speed) # 표준편차 np.max(speed) # 최대값 np.min(speed) # 최소값 np.me

dist=dat[:,2] # 기초통계량구하기 len(speed) # 데이터의개수 np.mean(speed) # 평균 np.var(speed) # 분산 np.std(speed) # 표준편차 np.max(speed) # 최대값 np.min(speed) # 최소값 np.me Python 을이용한기초통계분석 1. 통계학을위한 Python 모듈 1.1 numpy 패키지 - 고급데이터분석과수리계산을위한라이브러리를제공 - 아나콘다에기본적으로설치되어있음 (1) numpy가제공하는통계분석함수 import numpy as np print(dir(np)), 'max',, 'mean', 'median',, 'min',, 'percentile',,

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 15 장공분산분석 1. 공분산분석의통계적모형 2. 공분산분석에의한처리효과검정 3. 공분산분석과정 - 실습 - 회귀분석 두확률변수간에관계가있는지검정

More information

Microsoft PowerPoint - ch07 - 포인터 pm0415

Microsoft PowerPoint - ch07 - 포인터 pm0415 2015-1 프로그래밍언어 7. 포인터 (Pointer), 동적메모리할당 2015 년 4 월 4 일 교수김영탁 영남대학교공과대학정보통신공학과 (Tel : +82-53-810-2497; Fax : +82-53-810-4742 http://antl.yu.ac.kr/; E-mail : ytkim@yu.ac.kr) Outline 포인터 (pointer) 란? 간접참조연산자

More information

강의 개요

강의 개요 DDL TABLE 을만들자 웹데이터베이스 TABLE 자료가저장되는공간 문자자료의경우 DB 생성시지정한 Character Set 대로저장 Table 생성시 Table 의구조를결정짓는열속성지정 열 (Clumn, Attribute) 은이름과자료형을갖는다. 자료형 : http://dev.mysql.cm/dc/refman/5.1/en/data-types.html TABLE

More information

모수검정과비모수검정 제 6 강 지리통계학

모수검정과비모수검정 제 6 강 지리통계학 모수검정과비모수검정 제 6 강 지리통계학 통계적추정의목적 연구자가주장하는연구가설을입증하기위한것 1 연구목적에맞는연구가설을설정 2 연구목적과수집된자료에부합되는적절한통계적검정방법을선택 3 귀무가설과연구가설 ( 대립가설 ) 을진술 4 유의수준을결정한후각분포유형에따라분포표를이용하여임계치를구하고기각역을설정 5 통계적검정유형에필요한통계량을각검정유형의공식을이용하여계산 6

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 How to produce ChemML and MathML 조윤상 ( 과편협기획운영위원 ) 1 Applications of XML Applications of XML RDF (Resource Description Framework) : 자원의정보를표현하기위한규격, 구문및구조에대한공통적인규칙을지원. RSS (Rich Site Summary) : 뉴스나블로그사이트에서주로사용하는콘텐츠표현방식.

More information

Microsoft PowerPoint Relations.pptx

Microsoft PowerPoint Relations.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2010년봄학기강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

<322EBCF8C8AF28BFACBDC0B9AEC1A6292E687770>

<322EBCF8C8AF28BFACBDC0B9AEC1A6292E687770> 연습문제해답 5 4 3 2 1 0 함수의반환값 =15 5 4 3 2 1 0 함수의반환값 =95 10 7 4 1-2 함수의반환값 =3 1 2 3 4 5 연습문제해답 1. C 언어에서의배열에대하여다음중맞는것은? (1) 3차원이상의배열은불가능하다. (2) 배열의이름은포인터와같은역할을한다. (3) 배열의인덱스는 1에서부터시작한다. (4) 선언한다음, 실행도중에배열의크기를변경하는것이가능하다.

More information

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다.   우리나라경 KDI정책포럼제221호 (2010-01) (2010. 2. 10) 내용문의 : 이재준 (02-958-4079) 구독문의 : 발간자료담당자 (02-958-4312) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. http://www.kdi.re.kr 우리나라경기변동성에대한요인분석및시사점 이재준 (KDI 부연구위원 ) * 요 약,,, 1970. * (,

More information

untitled

untitled R&S Power Viewer Plus For NRP Sensor 1.... 3 2....5 3....6 4. R&S NRP...7 -.7 - PC..7 - R&S NRP-Z4...8 - R&S NRP-Z3... 8 5. Rohde & Schwarz 10 6. R&S Power Viewer Plus.. 11 6.1...12 6.2....13 - File Menu...

More information

용역보고서

용역보고서 여러고장모드를갖는자료분석방법 2009. 1. ( 주 ) 한국신뢰성기술서비스 목차 여러고장모드를갖는자료분석방법...3 1. 개요...3 2. 분석방법및예제...4 2.1 CFM(Competing Failure Mode) 분석...4 2.2 Mixed Weibull 분석...4 2.3 Mixed Weibull 예제...5 3. 요약정리...9 ii http://www.korts.co.kr

More information

PowerPoint Template

PowerPoint Template JavaScript 회원정보 입력양식만들기 HTML & JavaScript Contents 1. Form 객체 2. 일반적인입력양식 3. 선택입력양식 4. 회원정보입력양식만들기 2 Form 객체 Form 객체 입력양식의틀이되는 태그에접근할수있도록지원 Document 객체의하위에위치 속성들은모두 태그의속성들의정보에관련된것

More information

BK21 플러스방법론워크숍 Data Management Using Stata 오욱찬 서울대사회복지학과 BK21 플러스사업팀

BK21 플러스방법론워크숍 Data Management Using Stata 오욱찬 서울대사회복지학과 BK21 플러스사업팀 BK21 플러스방법론워크숍 Data Management Using Stata 2014. 10. 17. 오욱찬 ukchanoh@daum.net Why use Stata statistical software? 1 - Fast, accurate, and easy to use - Broad suite of statistical features - Complete data-management

More information

Monthly User Guide from JMP Korea 제 13 호 (2018 년 8 월 ) Excel 과 JMP, Excel 보다 JMP * 본 Guide 는매월세번째수요일에발행됩니다 (2018 년 7 월호부터는 JMP 14 Version 기준입니다 ) ** M

Monthly User Guide from JMP Korea 제 13 호 (2018 년 8 월 ) Excel 과 JMP, Excel 보다 JMP * 본 Guide 는매월세번째수요일에발행됩니다 (2018 년 7 월호부터는 JMP 14 Version 기준입니다 ) ** M Monthly User Guide from JMP Korea 제 13 호 (2018 년 8 월 ) Excel 과 JMP, Excel 보다 JMP * 본 Guide 는매월세번째수요일에발행됩니다 (2018 년 7 월호부터는 JMP 14 Version 기준입니다 ) ** Monthly User Guide 지난호는다음 Site 를참조하세요 (https://www.jmp.com/ko_kr/newsletters.html)

More information

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770> 삼각함수. 삼각함수의덧셈정리 삼각함수의덧셈정리 삼각함수 sin (α + β ), cos (α + β ), tan (α + β ) 등을 α 또는 β 의삼각함수로나 타낼수있다. 각 α 와각 β 에대하여 α >0, β >0이고 0 α - β < β 를만족한다고가정하 자. 다른경우에도같은방법으로증명할수있다. 각 α 와각 β 에대하여 θ = α - β 라고놓자. 위의그림에서원점에서거리가

More information

소개 Mac OS X (10.9, 10.10, 10.11, 10.12) 와 OKI 프린터호환성 Mac OS X 를사용하는 PC 에 OKI 프린터및복합기 (MFP) 제품을연결하여사용할때, 최고의성능을발휘할수있도록하는것이 OKI 의목 표입니다. 아래의문서는 OKI 프린터및

소개 Mac OS X (10.9, 10.10, 10.11, 10.12) 와 OKI 프린터호환성 Mac OS X 를사용하는 PC 에 OKI 프린터및복합기 (MFP) 제품을연결하여사용할때, 최고의성능을발휘할수있도록하는것이 OKI 의목 표입니다. 아래의문서는 OKI 프린터및 OKI 프린터호환성 Mac OS X 와호환성 Ma(10.9) Ma(10.10) Ma(10.11) Ma(10.12) 버전 : 7.8 날짜 : 2017-05-10 소개 Mac OS X (10.9, 10.10, 10.11, 10.12) 와 OKI 프린터호환성 Mac OS X 를사용하는 PC 에 OKI 프린터및복합기 (MFP) 제품을연결하여사용할때, 최고의성능을발휘할수있도록하는것이

More information

- 1 -

- 1 - - 1 - External Shocks and the Heterogeneous Autoregressive Model of Realized Volatility Abstract: We examine the information effect of external shocks on the realized volatility based on the HAR-RV (heterogeneous

More information

JAVA PROGRAMMING 실습 02. 표준 입출력

JAVA PROGRAMMING 실습 02. 표준 입출력 자바의기본구조? class HelloJava{ public static void main(string argv[]){ system.out.println( hello,java ~ ){ } } # 하나하나뜯어살펴봅시다! public class HelloJava{ 클래스정의 public static void main(string[] args){ System.out.println(

More information

2002년 2학기 자료구조

2002년 2학기 자료구조 자료구조 (Data Structures) Chapter 1 Basic Concepts Overview : Data (1) Data vs Information (2) Data Linear list( 선형리스트 ) - Sequential list : - Linked list : Nonlinear list( 비선형리스트 ) - Tree : - Graph : (3)

More information

스무살, 마음껏날아오르기위해, 일년만꾹참자! 2014학년도대학수학능력시험 9월모의평가 18번두이차정사각행렬 가 를만족시킬때, 옳은것만을 < 보기 > 에서있는대로고른것은? ( 단, 는단위행렬이다.) [4점] < 보기 > ㄱ. ㄴ. ㄷ. 2013학년도대학수학능력시험 16번

스무살, 마음껏날아오르기위해, 일년만꾹참자! 2014학년도대학수학능력시험 9월모의평가 18번두이차정사각행렬 가 를만족시킬때, 옳은것만을 < 보기 > 에서있는대로고른것은? ( 단, 는단위행렬이다.) [4점] < 보기 > ㄱ. ㄴ. ㄷ. 2013학년도대학수학능력시험 16번 친절한하영쌤의 수학 A형 약점체크집중공략오답률 Best 5 정복 하기! - 보충문제 행렬 2015학년도대학수학능력시험 9월모의평가 19번두이차정사각행렬 가 를만족시킬때, < 보기 > 에서옳은것만을있는대로고른것은? ( 단, 는단위행렬이고, 는영행렬이다.) [4점] < 보기 > ㄱ. 의역행렬이존재한다. ㄴ. ㄷ. 2015학년도대학수학능력시험 6월모의평가 19번두이차정사각행렬

More information

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형 M-Plus 의활용 - 기본모형과예제명령어 - 성신여자대학교 심리학과 조영일, Ph.D. 2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형 3 / 27 1. M-plus 란? 기본정보 M-plus 는구조방정식모형과종단자료분석 ( 잠재성장모형 ) 의분석에사용되기위해서고안된프로그램임.

More information

<4D F736F F F696E74202D20C1A632C0E520C7C1B7CEB1D7B7A5B0B3B9DFB0FAC1A4>

<4D F736F F F696E74202D20C1A632C0E520C7C1B7CEB1D7B7A5B0B3B9DFB0FAC1A4> 쉽게풀어쓴 C 언어 Express 제 2 장프로그램개발과정 통합개발환경 통합개발환경 (IDE: integrated development environment) 에디터 + 컴파일러 + 디버거 Visual C++: 이클립스 (eclipse): Dev-C++: 마이크로소프트제작 오픈소스프로젝트 오픈소스프로젝트 통합개발환경의종류 비주얼 C++(Visual C++)

More information

adfasdfasfdasfasfadf

adfasdfasfdasfasfadf C 4.5 Source code Pt.3 ISL / 강한솔 2019-04-10 Index Tree structure Build.h Tree.h St-thresh.h 2 Tree structure *Concpets : Node, Branch, Leaf, Subtree, Attribute, Attribute Value, Class Play, Don't Play.

More information