통계학입문

Similar documents
통계학입문

확률과통계 강의자료-1.hwp

statistics

슬라이드 1

untitled

(001~006)개념RPM3-2(부속)

= ``...(2011), , (.)''

<C3D6BFECBCF6BBF328BFEBB0ADB5BF29202D20C3D6C1BE2E687770>

확률 및 분포

<C3CA3520B0FAC7D0B1B3BBE7BFEB202E687770>

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료


01....b

2007백서-001-특집

00목차

(291)본문7

¾Ë·¹¸£±âÁöħ¼�1-ÃÖÁ¾

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

ÀüÀÚÇö¹Ì°æ-Áß±Þ

<30392DB9CCB1B9BEE7C7E3C7A55F28C7D1B1DB2C E786C73>

Ç¥Áö-¸ñÂ÷

Microsoft Word - EDA_Univariate.docx

주지스님의 이 달의 법문 성철 큰스님 기념관 불사를 회향하면서 20여 년 전 성철 큰스님 사리탑을 건립하려고 중국 석굴답사 연구팀을 따라 중국 불교성지를 탐방하였습 니다. 대동의 운강석굴, 용문석굴, 공의석굴, 맥적산석 굴, 대족석굴, 티벳 라싸의 포탈라궁과 주변의 큰

목 록( 目 錄 )

02-1기록도전( )

03-1영역형( )

05 ƯÁý

강의계획서 (Sylabus) 2013 학년도 2 학기 * 강의과목 교과목명 (CourseName) 한국문화를찾아서 INSEARCHOFKOREANCULTURE 언어 (Language) 영어 과목번호 - 분반 (CourseNo.-Class) 수강대상

RC /07.12 RC / /6 2 3 / CA-08A-2N 2 CA-10A-2N 2 CA-12A-2N 2 CA-16A-2N 2 CA-20A-2N CA-08A-3N 4 CA-10A-3N 4 CA-12A-3N


Monthly User Guide from JMP Korea 제 13 호 (2018 년 8 월 ) Excel 과 JMP, Excel 보다 JMP * 본 Guide 는매월세번째수요일에발행됩니다 (2018 년 7 월호부터는 JMP 14 Version 기준입니다 ) ** M

<B0A3C3DFB0E828C0DBBEF7292E687770>


기술통계

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

2. 강의방법 (CourseResources) 세미나 Seminar 발표 Presentation 질의응답 Q&A 초청강의 Special Lecture 현장답사 Field Trip 유인물활용 Handouts Audio/Video/TV Team Teaching 토의 / 토

#KM560

Microsoft PowerPoint - Stat03_Numerical technique(New) [Compatibility Mode]

untitled

#KM-235(110222)

..(..) (..) - statistics

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

<C0E5B7C1BBF328BEEEB8B0C0CCB5E9C0C729202D20C3D6C1BE2E687770>

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

슬라이드 1

2017 丁酉年 CALENDAR A Dream for the Future, A Challenge to lead the World

온습도 판넬미터(JTH-05) 사양서V1.0

2017 丁酉年 CALENDAR A Dream for the Future, A Challenge to lead the World

OBJ_DOKU fm

425.pdf

KMC.xlsm

#KM-340BL

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

4 CD Construct Special Model VI 2 nd Order Model VI 2 Note: Hands-on 1, 2 RC 1 RLC mass-spring-damper 2 2 ζ ω n (rad/sec) 2 ( ζ < 1), 1 (ζ = 1), ( ) 1

#SPS/C-5050.B.

cha4_ocw.hwp

교육실습 소감문

#SC-8200.B.

Layout 1

OPEN hwp

yscec.yonsei.ac.kr Useful information 통계학입문 2013 년겨울학기 v 교수 : 정보통계학과박동권교수 v v 연구실 : 창조관 153호 / 교내 2247 v v Pdf file 은정보통

보험판매와 고객보호의 원칙

#KLZ-371(PB)

#KM-250š


¸ðÅä·Î¶ó ÃÖÁ¾ÆÇ.PDF

포천시시설관리공단 내규 제 24호 포천시시설관리공단 인사규정 시행내규 일부개정(안) 포천시시설관리공단 인사규정 시행내규 일부를 다음과 같이 개정 한다. 제17조(기간제근로자의 무기계약직 임용) 1 기간제근로자 관리규정 제16조 를 제19조 로 한다. 제20조(인사기록)

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

실험 5

i

e01.PDF

핵 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (14) 27 (29) 2

#KM-250(PB)

Resampling Methods

- 2 -

<4F E20C7C1B7CEB1D7B7A5C0BB20C0CCBFEBC7D120B5A5C0CCC5CD20BAD0BCAE20B9D720B1D7B7A1C7C120B1D7B8AEB1E F416E616C F616E645F47726

untitled

고차원에서의 유의성 검정

<4D F736F F F696E74202D20342E20B1E8C1F6C7FC28BFACB1B8C0DAB8A620C0A7C7D120B1D7B7A1C7C120B1D7B8AEB1E2292E >

Coriolis.hwp

°íµî1´Ü¿ø

<362D C3D6BFEBBCBA29B0D4B8B1B6F3C0FC20BEE7BBF3C0C720BAAFC8ADB0FAC1A420B0EDC2FB2E687770>

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행


#KM-350AB..

<35B9DAC1F6BCF62CC0CCBFECC8C62CB7F9B5BFBCAE2E687770>

qme1-qm-4.toler&cp(1)-출판★-1?!?]đ??????????

chap 5: Trees

01_피부과Part-01

차례.hwp

CR hwp

ÇÁ·Î±×·¥Áý ³»Áö 1

Microsoft Word - EDA_Univariate.docx

, Fixed Income Analyst, , (pt, 212 초 =1) 17 US HY BofA merrill lynch bond index Europe HY Asian dollar HY Asia

2014년 업소개 정원 4 발달서보조훈련 2013년 원업에 진행되었던 작은 도서관 설을 토대로 발달의 대한 직업에 대한 개발을 위한 훈련들을 진행. 5. 선택업 을 구성하여 당들의 대한 일상에서 받아왔던 스트레스 해소 등 양한 을 운영원. 11 문화제 의 에 대한 거리

Passenger Terminal 1F Limousine Bus Taxi 1. LIMOUSINE BUS (NO.6001, NO.6015) Limousine Bus is the most convenient way to travel from Int l to the Lott

Transcription:

확률및통계특강

세부사항 교수님 성함 : 김홍기 연락처 : 821-5433 E-mail : honggiekim@cnu.ac.kr 교재 : 통계학입문 ( 정익사 / 김주한외 ) 강의자료 ppt 파일은정보통계학과홈페이지 -> 대학원 -> 수업자료 또는사이버캠퍼스자료실 이사이트에서기출문제도얻을수있습니다. 중간고사 (closed book) : 45%, 기말고사 (open book) : 45% 출석및기타 : 10%

담당교수소개 성명 : 김홍기 소속 : 충남대학교정보통계학과교수 학력 77~81 서울대학교계산통계학과학사 82~84 Univ of South Carolina 통계학과석사 84~89 Univ of Wisconsin 통계학과박사 주요경력 2008~2009 충남대학교자연과학연구소소장 2012~2013 충남대학교자연과학대학학장 2012~2013 충남대학교기초과학연구원원장 2014 한국통계학회부회장 2014~ 현재국가통계위원회통계정책분과위원

1. 1 개요 통계학 (statistics) 관심의대상에대해관련된자료를수집하고그 자료를요약, 정리하여이로부터불확실한사실에 대한결론이나일반적인규칙성을추구하는학문 Statistic : 통계치, 통계량 CH 1-2

1. 1 개요 통계학 (statistics) 기술통계학 (descriptive stat) 수집된자료의정리및요약방법을다룸 추측통계학 (inferential stat) 자료를통한모수의추정및모수에대한가설검정 추정 선자료수집후결정 검정 선결정후자료수집및교정 CH 1-3

통계학 (statistics) 1. 1 개요 Infer : 추측하다. 추론하다. 부분 전체 (?) 선자료수집, 후결정선결정, 후자료수집및교정 ( 부분을보고전체에대해결론을내림 ) Ex) 연애투자 신중히맴돌다교제여부결정 ( 신중형 ) 일단교제후계속교제여부결정( 카사노바형 ) 도청, 시청이전계획등을확인하고땅구입 여기저기도청이전가능성높은곳들을구매후도청이전이안된곳은매각 CH 1-4

1. 2 변수의종류 변수 (Variable) 조사대상의관심이되는특성 Ex) 조사대상 변수 조사대상 변수 키 I Q 라면값 몸무게 월 세 사람 수 미 입 모 분식집 성업여부 모수 : 충대남학생전체의키평균, 모수 : 모든궁동분식집라면값의평균 or 최소값 CH 1-5

변수 (Variable) 1. 2 변수의종류 질적변수 (qualitative variable) 명의적 (nominal) 질적변수 : 고향, 색깔등 순서적 (ordinal) 질적변수 : 선호도, 외모등 양적변수 (quantitative) 연속 (continuous): 몸무게, 나이, 시간, 온도등 이산 (discrete): 사람수, 불량품수 크게질적, 양적분류로충분 나이 : 연속이지만이산취급 ( 보통 2 세, 신생아실, 2.1 시간 ) CH 1-6

자료요약법 줄기그림 그림 OR 도표 도수분포표와 histogram 원그래프 자 료 요약법 상자그림 숫 자 수치요약 대표값과산포도 CH 1-7

1.3 줄기그림 (stem plot) Ex) 충남대남학생 15 명의몸무게자료 Data ( 단위 : Kg) 62 65 58 71 48 56 60 71 68 100 69 57 53 67 72 CH 1-8

1. 3 줄기그림 줄기그림 ( 남학생 ) 4 5 6 7 8 9 10 8 3 6 7 8 0 2 5 7 8 9 1 1 2 0 분포의중심파악 분포의전체적인모양 이상치유무판단 CH 1-9

서로맞댄줄기그림 (back to back stem plot) Ex) 충남대여학생 20 명의몸무게자료 Data : 45, 48, 1. 3 줄기그림 남학생 8 8 7 6 3 8 8 7 5 2 0 2 1 1 0 4 5 6 7 8 9 10 여학생 1 1 3 3 8 9 0 1 1 2 4 8 9 9 0 1 2 3 2 장점 두그룹의 자료비교 CH 1-10

줄기의세분 Ex) 충남대남학생 15명의키자료 Data 170 171 175 174 ( 단위 : cm) 173 1. 3 줄기그림 172 174 173 181 178 168 171 173 174 173 16 17 8 0 1 1 2 3 3 3 3 4 4 4 6 8 분포형태 18 1 파악불가 줄기를세분 CH 1-11

줄기의세분 1. 3 줄기그림 16. 17 * 17t 17f 17s 17. 18 * 8 0 1 1 2 3 3 3 3 4 4 4 6 8 1 또는 16. 8 17 * 0 1 1 2 3 3 3 3 4 4 4 17. 6 8 18 * 1 줄기의세분은 5개혹은 2개로만가능 10 = 5 2 CH 1-12

1. 4 도수분포표와 Histogram Ex) 200 쌍부부의자녀수조사 Data : 0, 2, 1, 2, 3, ( 이산형양적자료 ) 도수분포표 자녀수 도수 (frequency) 상대도수 (relative freq.) 임의로뽑은부부의자녀수에대한확률추정치 0 24 0.12 히스토그램 1 66 0.33 0.5 2 82 0.41 0.4 3 18 0.09 0.3 4 5 8 2 0.04 0.01 0.2 0.1 0 합계 200 1.00 0 1 2 3 4 5 CH 1-13

분포파악이가장유리한그림? 1. 4 도수분포표와 Histogram Ex) 충남대생 1000 명의키측정 Data : 167, 171, Ordered data: 155,, 189 min Stem plot( 줄기그림 ) 15 16 17 15 * 15. 16 * 16. 17 * 17. max Too many leaves CH 1-14

분포파악이가장유리한그림? 1. 4 도수분포표와 Histogram 도수분포표 히스토그램 키 도수 155 1 156 2 Pancake graph... 189... 1 1 5 5 1 5 6 1 5 7 1 5 8.... 1 8 8 1 8 9 합계 1000 가지수가너무많음 CH 1-15

분포파악이가장유리한그림? 1. 4 도수분포표와 Histogram 자료의 grouping ( 계급화 ) 필요. 계급의수는관측값의수에따라 6-20 개 만약 7 개로하면 Max - Min 7 = 189-155 = 34 7 7 ~ 5 가계급의폭 CH 1-16

분포파악이가장유리한그림? 1. 4 도수분포표와 Histogram 계 급 도수 상대도수 도수밀도 155 ~ 160 12 0.012 2.4 160 ~ 165 95 0.095 19.0 165 ~ 170 220 0.220 44.0 170 ~ 175 376 0.376 75.2 175 ~ 180 162 0.162 32.4 180 ~ 185 90 0.090 18.0 185 ~ 190 45 0.045 9.0 합 계 1000 1 155 ~ 160 은 155 이상 160 미만임 CH 1-17

185~190 180~185 175~180 170~175 165~170 160~165 155~160 185~190 180~185 175~180 170~175 165~170 160~165 155~160 Chapter 1. 자료의정리및사용예 분포파악이가장유리한그림? 1. 4 도수분포표와 Histogram Histogram 상대도수 도수밀도 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 80 70 60 50 40 30 20 10 0 CH 1-18

1. 4 도수분포표와 Histogram 분포파악이가장유리한그림? 도수밀도 (freq density) = 도수 / 계급폭 계급이등간격이면, 도수, 상대도수, 도수밀도상관없음. Ex) Odered data 2, 6, 7, 7, 7, 7, 8, 8, 8, 9, 11, 11, 11, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 14, 14, 14, 15, 16, 16, 17, 17, 17, 17, 18, 18, 19, 20 CH 1-19

분포파악이가장유리한그림? 1. 4 도수분포표와 Histogram 계 급 도수 상대도수 도수밀도 0 ~ 5 1 0.025 0.2 5 ~ 10 9 0.225 1.8 10 ~ 15 20 0.500 4.0 15 ~ 20 10 0.250 2.0 합 계 40 1 도수 상대도수 30 0.75 20 0.5 10 0.25 0 0~5 5~10 10~15 15~20 0 0~5 5~10 10~15 15~20 CH 1-20

분포파악이가장유리한그림? 1. 4 도수분포표와 Histogram 계 급 도수 상대도수 도수밀도 0 ~ 10 10 0.250 1.0 10 ~ 15 20 0.500 4.0 15 ~ 20 10 0.250 2.0 합 계 40 1 도수 30 20 도수밀도 6 4 10 2 0 0~5 5~10 10~15 15~20 0 0~5 5~10 10~15 15~20 CH 1-21

분포파악이가장유리한그림? 1. 4 도수분포표와 Histogram 도수 30 상대도수 0.75 20 0.5 10 0.25 0 0~5 5~10 10~15 15~20 0 0~5 5~10 10~15 15~20 도수 30 20 도수밀도 6 4 10 2 0 0 0~5 5~10 10~15 15~20 0~5 5~10 10~15 15~20 CH 1-22

질적변수 도수분포표 1. 4 도수분포표와 Histogram 원그래프 Ex) 200 쌍이혼부부의이혼사유조사 사유성격차이고부갈등배우자부정가정폭력 도수 80 35 25 20 주 기 벽 타 10 30 합계 200 각종그래프들 CH 1-23

잘못그려진그래프 1. 4 도수분포표와 Histogram 출처 : Statistics, Concepts and Controrersies by Pavid S.Moore CH 1-24

잘못 (?) 그려진그래프 1. 4 도수분포표와 Histogram 출처 : Statistics, Concepts and Controrersies by Pavid S.Moore CH 1-25

1. 5 수치요약과상자그림 (number summary and box plot) 다섯수치 최소값 제 1 사분위수 (1st Quartile) 중위수 (Median) 제 3 사분위수 (3rd Quartile) 최대값 Ex) Ordered data 0 5 10 11 12 16 18 21 22 최소값 Q1 중위수 Q3 최대값 Ex) 세수치, 아홉수치요약도가능 Note : 자료가다섯개면각값들이다섯수치가됨 CH 1-26

수치요약 1. 5 수치요약과상자그림 관측값의깊이 순서화된자료에서중앙의왼편에있을때에는왼쪽부터, 오른쪽에있을때에는오른쪽부터의누적도수.( 같은값이없을때는순서 ) Ordered data 3 5 5 7 10 15 30 35 41 깊이 1 3 3 4 5 4 3 2 1 CH 1-27

수치의깊이 1. 5 수치요약과상자그림 중위수의깊이 d(m) = n + 1 2 Q1, Q3 의깊이 [d(m)] + 1, [ ] 는를넘지않는최대정수 2 x x CH 1-28

수치의깊이 1. 5 수치요약과상자그림 Ex) 충남대남학생 12 명의한달평균용돈조사 (n=12)( 단위 : 만원 ) Ordered data 3 10 11 13 15 18 20 21 25 29 36 40 d(m) = n + 1 = 13 = 6.5 18 + 20 = 19 2 2 2 Q1, Q3의깊이 = [d(m)] + 1 [6.5] = + 1 = 3.5 2 2 Q1 = 11 + 13 = 12 25 Q3 = + 29 = 27 2 2 CH 1-29

상자그림 1. 5 수치요약과상자그림 용돈조사데이터를다섯수치로요약. ( 3, 12, 19, 27, 40 ) 0 10 20 30 40 < 위의다섯수치로얻은상자그림 > CH 1-30

상자그림 1. 5 수치요약과상자그림 Ex) 만약최대가 100 ( 40 대신 ) 이면, 최소, Q1, M, Q3 는불변 다섯수치요약 : ( 3, 12, 19, 27, 100 ) Min Max -20-10 0 10 20 30 40 90 100 < 위의다섯수치로얻은상자그림 > CH 1-31

상자그림의중요수치 1. 5 수치요약과상자그림 IQR (Interquartile range ; 사분위범위 ) Q₃ Q₁ = 27-12 = 15 IL (Inner Lower fence) Q₁- 1.5 ㆍ IQR = 12 1.5 x 15 = -10.5 IU (Inner Upper fence) Q₃+ 1.5 ㆍ IQR = 27 + 1.5 x 15 = 49.5 OL (Outer Lower fence) Q₁ 3 ㆍ IQR = 12 3 x 15 = -33 OU (Outer Upper fence) Q₃+ 3 ㆍ IQR = 27 + 3 x 15 = 72 AL (Adjacent Lower value) AU (Adjacent Upper value) Inner fence 안에서가장큰값들 CH 1-32

상자그림 1. 5 수치요약과상자그림 다시작성된상자그림 OL IL AL AU IU OU O -30-20 -10 0 10 20 30 40 90 100 < 위의다섯수치로얻은상자그림 > CH 1-33

2 개의상자그림 Data 비교 1. 5 수치요약과상자그림 상자그림의사용예 CH 1-34