목차 1. 통계학이란무엇인가? 2. 통계학의응용분야 3. 통계학의분야들 4. 강의소개 5. 그리고..

Similar documents
슬라이드 1

statistics

(001~006)개념RPM3-2(부속)

Microsoft PowerPoint - SBE univariate5.pptx

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

Microsoft Word - EDA_Univariate.docx

R t-..

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

G Power

untitled

확률과통계6

Microsoft PowerPoint - LN05 [호환 모드]

확률과통계4

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

10. ..

자료의 이해 및 분석

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

모수검정과비모수검정 제 6 강 지리통계학

Microsoft Word - SAS_Data Manipulate.docx

Microsoft PowerPoint - IPYYUIHNPGFU

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

한국정책학회학회보

고객관계를 리드하는 서비스 리더십 전략

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]

01

<B0A3C3DFB0E828C0DBBEF7292E687770>

용역보고서

= ``...(2011), , (.)''

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

슬라이드 1

자료의 이해 및 분석

통계학입문

PowerPoint 프레젠테이션

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

... —....—

Microsoft PowerPoint - PDF3 SBE pptx

확률과통계 강의자료-1.hwp

제 8 장. 통계적추정 개요 : 통계적추정 ( 추론 ) 은모집단에서추출된표본의정보로모집단에대한값의추측또는그값에대한확신을결정하는과정이며다음의두단계가있다. 2 통계적추정 (statistical estimation): 모수인평균 ( m), 분산 ( s ), 표준편차 ( s

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

와플-4년-2호-본문-15.ps

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

확률 및 분포

PowerPoint 프레젠테이션

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

... —... ..—

Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2

슬라이드 제목 없음

cha4_ocw.hwp

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

..(..) (..) - statistics

2013unihangulchar {45380} 2unihangulchar {54617}unihangulchar {44592} unihangulchar {49328}unihangulchar {50629}unihangulchar {51312}unihangulchar {51


(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

Survey Analyst 2013 년 1 회사회조사분석사 2 급필기 제 1 과목조사방법론 1 1. 질문지문항작성원칙에부합하는질문을모두짝지은것은? 2. 연역법과귀납법에관한설명으로옳은것은? 3. 설문조사에관한옳은설명을모두짝지은것은? 제공카페 : Daum 사회조사분석사 G

Microsoft PowerPoint Predicates and Quantifiers.ppt

기술통계

Microsoft PowerPoint - Java7.pptx

(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

<5BB0EDB3ADB5B55D B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D D3135B9AEC7D72E687770>

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

제 12강 함수수열의 평등수렴

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞


ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

A 한국노동연구원 한국보건사회연구원 1998 년 한국사회과학자료원 2008년 2008년

Microsoft PowerPoint - Stat03_Numerical technique(New) [Compatibility Mode]

제 3강 역함수의 미분과 로피탈의 정리

메타분석: 통계적 방법의 기초

목차

Microsoft PowerPoint - 26.pptx

PowerPoint 프레젠테이션

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

<B1B3C0B0B0FAC1A45FC3E2B7C22E687770>

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

untitled

제 5강 리만적분

1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속

Resampling Methods

Lecture12_Bayesian_Decision_Thoery

PowerPoint Presentation

<4D F736F F F696E74202D20C1A636C1D620C7A5BABBC3DFC3E2B9E6B9FD20B0ADC0C72E >

2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd


마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다.

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물


3.2 함수의정의 Theorem 6 함수 f : X Y 와 Y W 인집합 W 에대하여 f : X W 는함수이다. Proof. f : X Y 가함수이므로 f X Y 이고, Y W 이므로 f X W 이므로 F0이만족된다. 함수의정의 F1, F2은 f : X Y 가함수이므로

통계학입문

ad hwp

OCW_C언어 기초

실험 5

Transcription:

경영통계학 경영통계학에서는무엇을배우게될까? 2014 년도 2 학기

목차 1. 통계학이란무엇인가? 2. 통계학의응용분야 3. 통계학의분야들 4. 강의소개 5. 그리고..

1. 통계학이란무엇인가? 매일접하는통계적결과들 연극티켓의평균가격은 18,670원이며우리나라가정의연평균관람횟수는 3.4회이다. 지난해투신사들의평균수익률은 26.5% 였으며투신사에예금한금액은 230억원이증가하였다. 스타벅스에서는북미의 3,000개의커피숍중 2,100개에무선인터넷을설치할계획을가지고있다. 홍콩에서디즈니사는벤처기업의지분의 43% 에해당하는 3억천만달러를투자하였는데현채의가치는약 40억달러로평가되었다. 생활물가오름세심상치않다. 2개월연속오름세... 소비자물가도 3.3% 로올라 -2- Hanbat National University

1. 통계학이란무엇인가? 통계를알면미래가보인다 통계학은자료를수집하고, 분석하고, 요약ㆍ정리하며, 해석하는科學 왜자료를수집하고, 분석하고, 요약ㆍ정리하며해석하는가? - ( 경영이나경제분야 ) 경영자나의사결정자에게기업의경영이나경제적환경에대한이해를돕고 - 더낳은의사결정을하도록하는것이다. 유능한경영자나관리자는제공되는정보를이해할수있고효율적으로의사결정에이용할줄안다. -3- Hanbat National University

2. 통계학의응용분야 회계학 국세청에서는세납자들의세무감사를실시할때통계적표본조사의절차를밟는다. 예를들어세무서에서기업의대차대조표에나타난외상매출금계정에있는금액이실제외상매출금과일치하는지결정하기를원할것이다. 개별적인외상매출금계정의수는너무방대하여검토하고확인하는데시간이많이걸리고비용도많이소요된다. 이런경우감사인들은보통계정의일부를표본으로뽑아정확성을검토한후대차대조표에나타나있는외상매출금계정의금액이조건에맞는지결정을한다. -4- Hanbat National University

2. 통계학의응용분야 마케팅 대형할인매장이나편의점에는 POS(point of sale) 시스템을설치하여제품이팔리는동시에판매정보가수집되어데이터베이스에기록된다. AC닐슨사와같은시장조사전문기관에서는이러한자료를수집하여통계적으로처리하며처리결과인시장분석정보를제품의제조업체에판매한다. 제품의제조업체에서는이러한통계적요약결과를구매하고이를제품의세일이나매장내진열방식과같이판매촉진을위하여활용한다. 요즈음은데이터마이닝 (data mining) 이라는새로운학문분야가탄생하여백화점이나전자상거래등을통해수집되는대량의자료를분석하는기법이개발되고있으며이분야에서통계적기법들이많이사용되고있다. -5- Hanbat National University

2. 통계학의응용분야 제품생산 오늘날기술의발전에따라경쟁기업들사이에첨단기술을제외한대부분의기업은필요한기술이확보되어있다. 따라서제품의경쟁력은품질관리를어떻게철저히하여품질을확보하느냐에달려있다. 다양한품질관리도는제조공정의제품들을관찰하기위하여사용된다. 예를들어너트와볼트를생산하는공장에서는관리도를사용하여풀질관리를실시하는데정기적으로표본을추출하여너트의내경과볼트의외경을측정하고평균을계산하여관리도에타점하는과정을반복하다가경계점을벗어나면공정을중단하고원인을찾아조치를취하게된다. -6- Hanbat National University

2. 통계학의응용분야 경제학 경제학자들은미래의경제나그와관련된여러양상들에대한예측하기를요구받는다. 이를위하여경제학자들은통계적기법이나통계정보를활용한다. 예를들어물가상승율을예측하기위하여경제학자들은 PPI(producer price index), 실업율, 제조능력등에대한통계적정보를이용한다. 이러한통계적지표들은전산화된예측모형에입력되어물가상승율을예측하게된다. -7- Hanbat National University

3. 통계학의분야들 자료수집 자료를수집하는방법 - 이미존재하는자료를모으는방법 - 조사및관찰을통해수집하는방법 - 실험을통해수집하는방법 자료의정리및요약 수집된자료의탐색 도표나그래프를이용하여정리 기술통계법을이용하여요약 -8- Hanbat National University

3. 통계학의분야들 통계적추론 모집단과표본 표본으로부터얻어진정보를이용하여모집단의특성에대해추측하거나어떤현상에대한결론이나판정을내림 관심있는모집단의특성들 다음분기의은행이자율 내년도경제성장률 다음분기의매출액 신규도입한제조공정의불량률 수도권청소년층의새로운현태의유대전화에대한반응 생산성혁신전략으로인한이득 -9- Hanbat National University

3. 통계학의분야들 엑셀과통계학 2장의자료의정리및요약 : 차트마법사와피벗테이블 / 피벗차트마법 3장의자료의요약 : 데이터분석의기술통계법. 5장과 6장의확률분포 : 여러확률분포의누적함수 7장의표본분포 : Excel을이용한중심극한정리의유도과정 8장추정 ; 기술통계법과 Excel의함수를이용한신뢰구간계산 9장과 10장가설검정 : 데이터분석 11장회귀분석 ; 데이터분석을이용한회귀분석 12장분산분석 : 데이터분석을이용한분산분석 13장 : 계산식을이용하여적합성검정과독립성검정과정 -10- Hanbat National University

4. 강의소개 강의소개 교과목명경영통계학 담당교수심상오 (821-1289, soshim@hanbat.ac.kr) 교재 Excel을활용한통계학 ( 제2판 ), 박민재, 이상식, 임재학, 원출판사, 2012 강의시간화요일 9:30~12:30, S1동 205호 강의방법빔프로젝터를이용 Refernce Site: http://cyber.hanbat.ac.kr -11- Hanbat National University

4. 강의소개 수업일정 (S2) 주 강의내용 교재 비고 1 강의소개, 자료의측정과정리 1, 2장 9.2 2 추석 3 자료의측정과정리, 자료의요약 2, 3장 9.16 4 확률 4장 9.23 5 분포이해하기-이산확률분포와기대값 5장 9.30 6 분포이해하기-연속확률분포 ( 정규분포 ) 6장 10.7 7 표본분포이해하기 7장 10.14 8 추정및가설검정 1 8장 10.21 9 추정및가설검정 2 9장 10.28 10 중간고사 11.4 11 휴강 11.11 12 두집단평균비교하기 10장 11.18 13 회귀분석이해하기 11장 11.25 14 분산분석이해하기 12장 12.2 15 카이제곱검정 13장 12.9 16 보강및기말고사 12.16-12- Hanbat National University

4. 강의소개 평가방법 (S2) 중간 (40%), 기말 (30%), 과제및퀴즈 (20%), 출석 (5%), 기타 (5%) -13- Hanbat National University

4. 강의소개 과제내용 연습문제풀이 수업과관련된격언, 속담, 명언을조사하여업로드하기 자료를수집하여분석하는팀프로젝트 기타사항 단원별퀴즈 (Pop quiz) 또는숙제예정입니다. Quiz 는수업시간, 숙제는사이버한밭 결석은 1 점, 지각은 0.5 점감점. -14- Hanbat National University

제 2 장자료의측정와정리 학습목표 자료란무엇이고어떻게수집해야할까요? 조사법에는어떠한종류가있을까요? 자료의측정이란무엇이며척도란무엇일까요? 척도에는어떠한종류가있을까요? 엑셀을이용하여그래프는어떻게그릴까요? 히스토그램과파레토도란무엇일까요? Hanbat National University

제 1 절자료의정의및수집 자료란? 관심의대상이되는개체의성격이나속성을관측한결과 결론이얻어질수있는사실이나수치의집합 자료수집방법 관찰법 사실이나수치를관찰하여기록하여얻는방법 실험을통하여자료를수집하는방법 조사법 설문지나기타기록된문헌또는데이터베이스등을통하여자료를수집하는방법 조사방법의발전과정 PAPI CATI CAI Hanbat National University

제 1 절자료의정의및수집 설문지작성의중요성 설문지란? 설문지는표준화형식에따라작성되어야함 설문지가표준화되어있어야하는이유는? 설문지작성시고려사항 필요한정보의종류와측정방법 분석내용과분석방법 설문조사방법 면접조사, 우편조사, 전화조사, 인터넷설문조사 설문조사방법선택의기준 비용, 시간, 조직, 설비등 Hanbat National University

제 1 절자료의정의및수집 설문조사방법 면접조사 PAPI 미리훈련된조사원이지정된조사대상을방문 / 면접하여정해진설문지에의해서필요한정보를얻는방법. 면접원관리서베이와자기관리서베이 면접조사의장점과단점 우편조사법 PAPI 설문지를조사대상에게우송하여설문지의기입및반송을의뢰하는방법 우편조사의장점과단점 Hanbat National University

제 1 절자료의정의및수집 설문조사방법 전화조사법 CATI 전화를통해서조사대상과연결하여필요한정보를구하는방법 전화자료입력방법과음성인식입력방법도있음 장점과단점 인터넷설문조사법 온라인혹은웹상에서의설문조사법 개방형과폐쇄형이있음 장점과단점 Hanbat National University

제 1 절자료의정의및수집 자료의조사방법 설문지조사의진행과정 (1) 문제인식에대한조사필요성의확인 (2) 조사의기획 (5W 1H 원칙에따름 ) (3) 설문지내용작성 (4) 전수조사및표본조사계획 : 인터넷조사에서가장어렵다 (5) 본조사실시 (6) 집계 ( 수집, 오기조사, 자료의입력준비 ) : 인터넷조사에서가장 쉽다. (7) 조사자료의통계적자료분석 (8) 조사보고서의작성 Hanbat National University

제 1 절자료의정의및수집 설문지의예 1. 귀하의성별을선택 ( ) 하십시오. 남자 여자 2. 귀하의연령을기입해주십시오. 만 ( ) 세 3. 귀하의직업을선택해주십시오. 전문직 사무직 판매 서비스직 노무직 학생 전업주부 기타 4. 귀하의월수입이얼마나되는지적어주십시오.?( 단, 전업주부의경우는남편을기준으로함 ) ( ) 만원 5. 신상품 파인벨트 에대한귀하의만족도를선택해주십시오. 매우불만족 불만족 보통 만족 매우만족 6. 신상품 파인벨트 를 10만원에판매한다고할때, 귀하께서는구매하시겠습니까? 예 아니요 아직은결정못하겠다 7. 다음의회사들이 파인벨트 라는신상품과유사한의료기기를판매한다고할때, 귀하께서는어느회사제품 을구입하시겠습니까? ( 주 ) 메디피아 ( 주 ) 닥터기기 ( 주 ) 대화의료기 Hanbat National University

제 2 절자료의종류 자료의종류 이산형자료 양적자료 연속형자료 자료 이분형자료 질적자료 다분형자료 Hanbat National University

제 2 절자료의종류 양적자료와질적자료 양적자료 (quantitative data, categorical data) 값이수치로나타내어지는자료 : 성별, 직업, 거주지역, 결혼여부.. 사칙연산불가 질적자료 (qualitative data, numerical data) 값이비수치로나타내어지는자료 : 기온, 습도, 금액, 연봉, 인터넷횟수.. 이산형자료와연속형자료 이산형자료 (discrete data) 자녀의수나고장의수와같이하나둘세어서 (counting) 얻는자료 연속형자료 (continuous data) 어느구간내의모든연속적인값을취할수있는자료 (( 예 )) 키, 몸무게, 주가, 매출액등 What about age( 나이 )? 양적자료의질적자료변환, 집단화 (grouping) Hanbat National University

제 2 절자료의종류 횡단면자료와시계열자료 횡단면자료 (cross-section data) 는관심의대상이되는어떤특정변수를일정시점에서각주체별로관측하여얻은값 교육수준 < 표 > 교육수준과경제활동 경제활동 봉급생활자영업농림수산업비정규직 ( 단위 : 명, %) 전체 초등학교졸이하 182(23.0) 154(19.5) 268(33.9) 187(23.6) 791(100.0) 중학교졸업 262(34.8) 256(34.0) 99(13.2) 135(18.0) 752(100.0) 고등학교졸업 1,315(58.1) 711(31.4) 82(3.6) 157(6.9) 2,265(100.0) 전문대졸업 255(75.4) 62(18.3) 6(1.8) 15(4.4) 338(100.0) 대학 ( 교 ) 졸업 669(75.8) 177(20.1) 7(0.8) 30(3.4) 883(100.0) 합계 2,683(53.4) 1,360(27.0) 462(9.2) 524(10.4) 5,029(100.0) Hanbat National University

제 2 절자료의종류 횡단면자료와시계열자료 시계열자료 (time-series data) 는관심의대상이되는어떤특정변수를시간의순서에따라일정기간동안관측하여얻은값 < 표 > 주가지수 ( 단위 : 1980.1.4=100) 연월 주가지수 연월 주가지수 연월 주가지수 1995.01 1995.02 1995.03 1995.04 1995.05 1995.06 1995.07 1995.08 1995.09 1995.10 1995.11 1995.12 965.3 929.6 942.3 902.7 884.2 884.2 945.6 916.8 971.1 998.9 957.3 918.1 1996.01 1996.02 1996.03 1996.04 1996.05 1996.06 1996.07 1996.08 1996.09 1996.10 1996.11 1996.12 866.1 874.7 857.4 920.1 942.5 867.6 832.2 805.4 783.4 806.7 740.9 690.6 1997.01 1997.02 1997.03 1997.04 1997.05 1997.06 1997.07 1997.08 1997.09 1997.10 1997.11 1997.12 669.6 698.1 656.7 694.3 713.1 765.2 752.3 740.5 676.5 584.1 494.1 390.3 자료 : 한국은행 [ 경제통계연보 ] Hanbat National University

제 3 절자료의측정 명목척도 (nominal scale) 순서, 거리및원점의개념이없는척도 자료를상호배타적 (mutually exclusive) 이고포괄적 (exhaustive) 인몇개의범주 (category) 또는계급으로분류 : 빈도수 상호관계를찾고자할때아주유용하며특히조사방법 (survey) 에서자료를범주별로분류할때널리이용 집중화경향 (tendency) 을측정하기위하여는최빈값 (mode) 이이용되며, 통계적유의성을검증하는데는 2 검정 (chi-square test) 이자주이용된다. 종교, 꽃의종류, 구기종목, 혈액형등 Hanbat National University

제 3 절자료의측정 서열척도 명목척도에순서또는서열개념을부여한것 이행성 (transitivity) 의특성 갑 > 을이고을 > 병이면갑 > 병임을의미 집중화경향치로는중앙치 (median) 가이용 산포도를측정하기위하여는백분위수 (percentile) 나사분위수 (quartile) 가이용 통계적유의성을검증하는데에는비모수통계방법이이용 학점, 달리기경기에서순위, 키순에따른번호 Hanbat National University

제 3 절자료의측정 구간척도 사물이나현상을분류하고서열을결정하는것뿐만아니라거리또는간격의개념을부여한것 각부분간의거리는동일한것으로간주 10시에서 12시까지의간격이나 1시에서 3시까지의간격은동일한것으로간주, 비율 (ratio) 개념은없음 ( 기준, 영점이없음 ) 집중화경향치로서산술평균 (mean) 이이용 산포도를알기위하여는분산또는표준편차 통계적기법 : t-검정, F-검정및분산분석 온도, 시간 Hanbat National University

제 3 절자료의측정 비율척도 앞의세가지척도가가지고있는모든개념에다원점 (origin) 또는영 (zero) 의개념이부가된것 0의개념이란 비율이의미를가지게되는척도 수익률이 20% 인주식은수익률이 10% 인주식보다수익률이두배라고말할수있게된다. 집중화경향치로는기하평균이나조화평균이 산포도를알기위하여변동계수도이용 키, 몸무게, 거리, 면적, 인구, 수익률, 수입 Hanbat National University

제 3 절자료의측정 주요척도에대한요약 [ 그림 2-1]: 번호, 등수, 정성점수, 정량점수 네가지중한가지척도만을고집할필요는없음 주민등록번호 (770110-1XXXXX) 명목, 서열등등.. 네척도의정보량 특성척도범주순위등간격절대영점 정보수준 명목척도 서열척도 구간척도 비율척도 질적자료 양적자료 Hanbat National University

제 4 절엑셀을이용한자료정리 질적자료의정리 도수분포표 (p. 27 표 2-1) Hanbat National University

제 4 절엑셀을이용한자료정리 질적자료의정리 - 도수분포표 도수란? 각자료값이반복되어나타난횟수 도수분포표란? 각자료값에대하여도수를나열해놓은도표 도수분포의예 성별남자여자합계 도수 31(62%) 19(38%) 50 Hanbat National University

제 4 절엑셀을이용한자료정리 질적자료의정리 - 도수분포표 B2/D2 Countif($B$2:B$51,1) 성별비율 남자 여자 19, 38% 31, 62% Hanbat National University

제 4 절엑셀을이용한자료정리 질적자료의정리 - 도수분포표 B2/$B$9 Countif($D$2:D$51,1) 12 10 8 6 4 2 4 10 7 6 5 9 9 12 10 8 6 4 2 4 10 7 6 5 9 9 25% 20% 15% 10% 5% 0 0 0% Hanbat National University

제 4 절엑셀을이용한자료정리 연속자료의정리 도수분포표 도수분포표란? 연속적자료를몇개의계급 (Class) 로나누어각계급에속하는도수 (Frequency) 를기입하여체계적으로정리한표 A사직원들의연령에따른도수분포표 계급구간하한상한 도수 상대도수 20 30 25 0.25 30 40 30 0.30 40 50 28 0.28 50 60 17 0.17 합계 100 1.00 도수분포표작성을위해서결정해야할사항 계급의수결정 : 보통 5 에서 15 개사이에서결정 자료의최대값과최소값결정 계급구간 : ( 자료의최대값 자료의최소값 )/ 계급의수 계급구간은 5, 10, 100 등의배수로하는것이후속적인분석을위해서바람직함. Hanbat National University

제 4 절엑셀을이용한자료정리 연속자료의정리 도수분포표 도수분포표를작성하는절차 절차 1> 자료중에서최소값과최대값을찾은후, 범위 (= 최대값 - 최소값 ) 을계산 절차 2> 구간의수를정한다. 일반적으로는구간의개수로는자료의크기에따라 5 개내지 20 개정도를정한다. 또는 ( 관찰값의수 ) 1/2 를기준으로하기도함 절차 3> 계급구간의폭은범위를계급구간의수로나누어얻은값보다조금큰값을계급구간의폭으로정한다. 절차 4> 모든관측값을포함하도록각계급구간의하한값과상한값을정한다. ( 관찰값이계급구간의경계점에놓이지않도록하는것이바람직하다.) 절차 5> 각계급구간의상한값은그계급구간의하한값에계급구간의폭을더한값이된다. 첫번째계급구간을제외한나머지계급구간의하한값은바로전계급구간의상한값과일치한다. 절차 6> 각구간에속하는자료값의개수를세어구간의도수를구하여도수분포표를작성한다 Hanbat National University

제 4 절엑셀을이용한자료정리 연속자료의정리 도수분포표 월수입에대한도수분포표작성 =V11-V10 =FREQUENCY($E$2:$E$51,T10) =U10/$U$17 =X10+W11 Hanbat National University

제 4 절엑셀을이용한자료정리 연속자료의정리 도수분포표 월수입에대한그래프 히스토그램 데이터 데이터분석 Hanbat National University

제 4 절엑셀을이용한자료정리 연속자료의정리 도수분포표 월수입에대한그래프 히스토그램 데이터계열서식 Hanbat National University

제 4 절엑셀을이용한자료정리 연속자료의정리 도수분포표 월수입에대한그래프 히스토그램 참고 : 축서식조정을통해더멋진그래프를만들수있음 Hanbat National University

제 4 절엑셀을이용한자료정리 연속자료의정리 도수분포표 숙제 #1 : 교재 P.40~59 에있는엑셀자료정리과정을하고파일로사이버한밭에제출 Hanbat National University

제 3 장자료의요약 학습목표 모수와통계량이란무엇일까요? 집중화경향이란무엇이며대표값으로는어떤것들이있을까요? 산포경향이란무엇이며이를나타내는값들로는어떠한것들이있을까요? 왜도와첨도란무엇일까요? 상자그림은무엇이며엑셀로어떻게그릴까요? Hanbat National University

들어가기전에... 맹구의첫경험 H 대학교 2 학년에재학중인맹구는어느날처음으로 PC 방에가서채팅을하였다. 독수리타법으로겨우겨우채팅을하던도중고등학교 3 학년인상대방으로부터 H 대학교에대하여설명해달라는요청을받았다. 맹구는어디서부터설명을해야할지망설이다가황급히 PC 방을뛰쳐나왔다. 그후로맹구는 PC 방엘가는것이두려워졌다. 만일여러분이이런상황에처했다면. 여러분들의답은어떤공통점을갖는가? 만일수집된자료에대해동일한질문을받는다면? 자료의특징 : 집중화경향, 흩어진정도, 치우침정도 Hanbat National University

제 1 절모수와통계량 모집단과표본 모수와통계량 모집단 표본 특징 모수 통계량 크기 N n 연습문제 2, 4 Quiz#1 : 연습문제 3 Hanbat National University

제 2 절집중화경향의측정 - 정리되지않은자료 평균 보통의개념을통계적으로정의한것이평균이다. 평균 (mean) = 관측된숫자들의총합 / 관측된숫자들의총개수 : 모평균, X : 표본평균 표본평균계산하는방법 X x 1 x 2 x n n 예제 3-1 평균은극단적인값에민감하다. 경상대학을졸업한학생들의월소득 ( 단위 : 만원 ) 280, 230, 260, 250, 220, 2300, 210 평균 = (280+230+ +210)/7=535( 만원 ) Hanbat National University

제 2 절집중화경향의측정 - 정리되지않은자료 중앙값 극단적인값에민감하지않은척도는중앙값이다. 중앙값 : 자료를크기순으로나열하였을때한가운데위치한값 프로야구선수의연봉현황 ( 만원 ) 2,000 3,800 3,800 2,900 3,100 3,500 4,100 50,000 3,400 표본평균은 8,511만원 ( Does it make sense?) 중앙값은 2,000 2,900 3,100 3,400 3,500 3,800 3,800 4,100 500,000 중앙값은 3,500 만원 ( Is it reasonable?) Hanbat National University

제 2 절집중화경향의측정 - 정리되지않은자료 중앙값 중앙값 (Median) 의계산방법 관측값의총수 (n) 가홀수인경우 관측값을크기순서대로나열하였을때가운데위치하는관측값, 즉 n/2번째값이중앙값이다. 관측값의총수 (n) 가짝수인경우 관측값을크기순서대로나열하였을때가운데위치하는두관측값의평균, 즉 n/2번째값과 (n/2+1) 번째값의평균이중앙값이다. 중앙값의특징 극단적인관측값에영향을받지않으며 중앙값을기준으로관측값들의 50% 가왼쪽에그리고나머지 50% 가오른쪽에존재하게된다. Hanbat National University

제 2 절집중화경향의측정 - 정리되지않은자료 최빈값 (Mode) 최빈값은관측횟수가가장많은값 프로야구선수의연봉현황 ( 만원 ) 2,000 3,800 3,800 2,900 3,100 3,500 4,100 50,000 3,400 최빈값성질 평균이나중앙값은양적자료일경우에만집중화경향을측정 / 최빈값 (Mode: Mo) 은양적자료와질적자료에모두적용가능 평균값처럼소수의극단적인값에의해영향을받지않음 평균과중앙값은단하나만존재 / 최빈값은하나이상가능 최빈값이유용한경우 옷, 신발, 모자등을생산하는공장에서..( 표준규격의다량의제품 ) Hanbat National University

제 2 절집중화경향의측정 - 정리되지않은자료 범위의중앙값 관측된데이터중에서최소값과최대값의평균을범위의중앙값 (mid-range) 이라고함 예 : 프로야구선수의연봉현황 ( 만원 ) 2,000 3,800 3,800 2,900 3,100 3,500 4,100 50,000 3,400 가중평균 각각의데이터에가중치를부여하여평균을계산한결과를가중평 균이라함 wi xi i1 n w i1 예제 3-2 ( 수학 5 시간, 체육 1 시간 ) X w n i 단 w i : 가중치, x : 측정값, i Hanbat National University

제 2 절집중화경향의측정 - 정리되지않은자료 엑셀을이용한집중화경향계산 K대학의경영학과학생의키를조사하기위하여남학생과여학생 20명을표본으로추출하여다음과같은데이터를수집하였다. 학생신장 (Cm) 170 183 176 181 165 178 167 187 179 179 172 164 180 182 170 172 175 172 170 169 학생들의신장에대해평균, 중앙값, 최빈값, 범위의중앙값을계산하라 =AVERAGE(B2:F5) =MEDIAN(B2:F5) =MODE(B2:F5) =(MAX(B2:F5)-MIN(B2:F5))/2 Hanbat National University

제 2 절집중화경향의측정 - 정리되지않은자료 평균, 중앙값그리고최빈값의관계 대칭분포 오른쪽긴꼬리분포 X Me Mo X Me Mo 왼쪽긴꼬리분포 X Me Mo Hanbat National University

제 2 절집중화경향의측정 - 정리된자료 평균 예제 3-3 Hanbat National University 계급 ( 이상 - 미만 ) 300-400 400-500 500-600 600-700 700-800 800-900 900-1000 도수 1 1 1 6 6 9 12

제 2 절집중화경향의측정 - 정리된자료 평균 예제 3-3 : 엑셀을이용한풀이 Hanbat National University

제 2 절집중화경향의측정 - 정리된자료 중앙값 계급 ( 이상 - 미만 ) 도수 300-400 400-500 500-600 600-700 700-800 800-900 900-1000 1 1 1 6 6 9 12 예제 Quzi#1: 연습문제 6, 9 최빈값 정리된자료에서최빈값은도수가가장많은계급 (modal class) 의계급값 Hanbat National University

제 3 절산포경향의측정 집중화경향만으로는부족하다 그러면. 자료 1 : 10 20 30 40 50 60 60 70 80 90 100 110 자료 2 : 40 50 50 50 60 60 60 60 70 70 70 80 자료1 평균 = 중앙값 = 최빈값 =60 자료2 평균 = 중앙값 = 최빈값 =60 ( 철수 ): 자료 1 과자료 2 는동일하다고할수있나? ( 미미 ) : Not really. ( 철수 ): 그러면자료 1 과자료 2 는어떤차이가있는가? Hanbat National University

제 3 절산포경향의측정 집중화경향만으로는부족하다 그러면. 맹구의경험 (2) 어느강의평균수심이 1m라는면사무소의정보만믿고맹구는물놀이를하기위하여강에들어갔다. 그러나강의실제수심은 20Cm인곳도있고어떤곳은3m인곳도있었다. 수영에익숙하지못한맹구는그만수심이 3m되는지점에서익사할뻔하였다. 그후로맹구는목욕탕에서만수영을하였다. 맹구의잘못은무엇인가? 맹구는무엇을고려하지않아서익사할뻔하였나? Hanbat National University

제 3 절산포경향의측정 집중화경향만으로는부족하다 그러면. 자료 1 : 60 10 20 30 40 50 60 70 80 90 100 110 자료 2 : 60 50 60 70 50 60 70 40 50 60 70 80 자료 1 과자료 2 의차이를설명하여보자. 산포 범위, 분산, 표준편차, 변동계수 Hanbat National University

제 3 절산포경향의측정 범위 (Range) 범위 (range) 란자료의집단중에서가장큰관측값과가장작은관측값의차이이다. 예제 자료 1의범위 = 110-10 = 100 / 자료 2의범위 = 80-40 = 40 자료 1이자료 2보다더퍼져있음을알수있다. 가장큰관측값과가장작은관측값에의해서만영향을받음모든관측값들의분포양상을나타내지못한다. 자료 3 : 10 10 40 40 40 40 60 60 60 80 80 110 40 40 60 10 40 60 80 110 10 40 60 80 110 Hanbat National University

제 3 절산포경향의측정 분산 (Variance) 분산 (Variance) 이란편차를제곱하여합한값을관측값의총수로나눈것 분산 (Variance) = 편차들의제곱합 / 관측된숫자들의총개수 2 : 모분산, S 2 : 표본분산 모분산 = 표본분산 = N ( x ) i1 n 2 i / ( x i1 i X ) 2 N /( n 1) Hanbat National University

제 3 절산포경향의측정 분산 (Variance) 예제 : 자료 1과 2의분산을구하시오. 자료 1 : 10 20 30 40 50 60 60 70 80 90 100 110 자료 2 : 40 50 50 50 60 60 60 60 70 70 70 80 자료 3 : 10 10 40 40 40 40 60 60 60 80 80 110 자료 1의분산 모분산 = 11000/12 = 916.7 표본분산 = 11000/11 = 1000.0 자료 2의분산 모분산 = 1400/12 = 116.7 표본분산 = 1400/11 = 127.3 자료 3의분산 모분산 = 9900/12 = 825.0 표본분산 = 9900/11 = 900.0 Hanbat National University

제 3 절산포경향의측정 분산 (Variance) 자료 1 자료 2 번호 자료 편차 편차제곱 번호 자료 편차 편차제곱 1 10-50 2500 1 40-20 400 2 20-40 1600 2 50-10 100 3 30-30 900 3 50-10 100 4 40-20 400 4 50-10 100 5 50-10 100 5 60 0 0 6 60 0 0 6 60 0 0 7 60 0 0 7 60 0 0 8 70 10 100 8 60 0 0 9 80 20 400 9 70 10 100 10 90 30 900 10 70 10 100 11 100 40 1600 11 70 10 100 12 110 50 2500 12 80 20 400 합계 720 0 11000 합계 720 0 1400 Hanbat National University

제 3 절산포경향의측정 표준편차 (Standard Deviation) 분산의단위는? 그이유는? 원래의단위의제곱이다. ( 편차의제곱 ) 원래관측값들의단위에서산포의경향을나타내는값으로분산의제곱근인표준편차를사용할수있다. 모집단표준편차 2 표본표준편차 S 2 S 자료 1의표준편차 = 30.2665 자료 2의표준편차 = 10.8028 분산혹은표준편차에의한산포경향은재무관리에서위험성을측정하는데응용 기업의판매량, 이윤, 투자의수익률등의자료에서분산이크면수익률의변동이큼을의미하며이는투자에따른높은위험을의미하게될것이다. Hanbat National University

제 3 절산포경향의측정 엑셀을이용한계산 =MAX(B2:F5)-MIN(B2:F5) =VARP(B2:F5) =VAR(B2:F5) =STDEVP(B2:F5) =STDEV(B2:F5) Hanbat National University

제 3 절산포경향의측정 정리된자료의분산과표준편차 예제 3-4 Hanbat National University

제 3 절산포경향의측정 정리된자료의분산과표준편차 예제 Hanbat National University

제 3 절산포경향의측정 변동계수 (Coefficient of Variation) 맹구의경험 (2) 어느경제학자와사회학자는선진국과개발도상국가의빈부격차에대한연구를수행하기위하여선진국과개발도상국의 GNP를조사하였다. 이자료를이용하여평균과표준편차를계산하여다음과같은결과를얻었다. 평균 표준편차 선진국가 $65,400 $4,390 개발도상국가 $3,500 $360 통계학공부를열심히한맹구는선진국의변동폭이심하므로선진국의빈부격차가더심하다고결론지었다. 맹구의판단은올바른것인가? Hanbat National University

제 3 절산포경향의측정 변동계수 (Coefficient of Variation) 표준편차는자료의절대적변이성을측정 변동계수는자료의상대적변이성을측정변동계수 (CV:Coefficient of Variation) = 표준편차 / 평균 변동계수가유용한경우 관측값의차이가큰자료들간의산포도를비교하거나측정단위가상이한자료들간의산포도를비교할때사용 Hanbat National University

제 3 절산포경향의측정 변동계수 (Coefficient of Variation) 예제 신생아들의평균몸무게는 3.5(Kg) 이고표준편차는 0.36(Kg) 이었다. 이신생아들의아버지의몸무게를측정한결과평균은 65.4(Kg) 이고표준편차는 4.39(Kg) 이었다. 신생아와아버지들의몸무게중어느쪽이더넓게퍼져있다고할수있는가? Hanbat National University

제 4 절왜도와첨도 비대칭도 분포의모양이어느쪽에치우쳐있는지를측정하고자함. 평균과중앙값을비교함으로써알수있음 첨도 첨도 피어슨비대칭계수비대칭계수 = 3 ( 평균 중앙값 )/ 표준편차 분포의뾰족한정도를정규분포와비교해서나타내는것 높은첨도, 보통첨도, 낮은첨도로구분함 정규분포 (6장) 는보통첨도임. ( 첨도계수 = 3) 엑셀에서의첨도계수에대한해석은 0을기준으로하고있음 첨도가양이면높은첨도 첨도가음이면낮은첨도 Hanbat National University

제 5 절엑셀을이용한자료의요약 자료 예제 3-5 의자료 판매사원의월평균급여 221 305 440 275 190 330 200 317 371 350 255 318 280 277 330 230 260 175 285 175 300 416 240 320 390 150 250 210 490 318 Hanbat National University

제 5 절엑셀을이용한자료의요약 통계데이터분석 Hanbat National University

제 5 절엑셀을이용한자료의요약 통계데이터분석결과 월평균급여 평균 288.933 표준오차 14.8122 중앙값 282.5 최빈값 330 표준편차 81.1299 분산 6582.06 첨도 0.12734 왜도 0.49259 범위 340 최소값 150 최대값 490 합 8668 관측수 30

제 4 장확률 사건과표본공간의이해 확률의개념 확률의기본법칙 조건부확률 베이지안정리 학습목표 제 4 장확률

들어가기전에...( 지난번배운건?) 안타깝지만모르는학생이없다! 숙제 #2. 교재 p.99~p.102 제 4 장확률

제 1 절사건과표본공간 실험 (Experiment) 동전던지기, 제품의검사, 설문조사의전화, 주사위던지기 관찰을하거나측정을유발하는행위또는과정 사건 (Event), 사상, 사고 앞 / 뒤, 불 / 량, 조사결과, 1/2/3/4/5/6. 실험의결과 -단순사건: 실험결과가오직한개만나올경우 -복합사건:??? 주사위의홀수! 표본공간 (Sample space, Ω) 경우의수, 모든가능한사건들을모아놓은것 제 4 장확률

제 2 절확률의개념 고전적이론특별한이유가없다면표본공간의각사건의발생가능성은동일함찌그러진동전? P(A)= 사건 A의원소수 / 표본공간의원소수 상대도수이론졸라많이했다가정하고통상나오는확률 P(A) = 사건 A의관찰횟수 / 졸라많이실험이나관찰한횟수 = lim ( f / n ) 니맘대로이론 ( 주관적이론 ) 무릎팍도사한테물어봐 제 4 장확률

제 2 절확률의개념 사건이발생할확률은? 확률의합은? 제 4 장확률

제 3 절확률의기본법칙 여사건 (Complementary Event), A c 덧셈법칙 (additional rule) AUB (union) A B (Intersection) 상호배반 (Mutually Exclusive), P(A B) = 0, 서로동시에발생할수없는경우 제 4 장확률

제 4 절조건부확률 밥먹고응가할확률 vs. 그냥응가할확률 ^^ Conditional Probability 사건 B가발생했다는가정하에사건 A가일어날확률 P(A B) = P(A B) / P(B) P(B A) = P(B A) / P(A) 남 여 합계 흡연 70 20 90 비흡연 30 80 110 합계 100 100 200. 남자일확률? P(B). 흡연할확률? P(A). 남자가흡연할확률? P(A B). 남자이면서흡연할확률? P(A B) 제 4 장확률

제 4 절조건부확률 독립 Independent 사건 vs 종속 dependent 사건 P(A B) =P(A) P(B) P(A B) = P(A B) / P(B) = P(A) - 한사건이다른사건에영향을주지않는경우 제 4 장확률

제 5 절 Bayesian Theorem 사전 Prior 확률 vs. 사후 posterior 확률 뭐가되었든지간에, 확률을높이고자함이인간의본성이다. 추가적인정보는믿음을견고하게한다. ( 확률을높이게된다 ) S 사의머플러 60%, T 사의머플러 40% 머플러가고장난차의머플러가 S 사꺼임? T 사꺼임? - 단순히 S사, T사각각 60%, 40% 납품한거라면 60% 확률로 S사꺼임 이랬을꺼임..^^ : 사전확률 - 만약 S 사의머플러불량률 2%, T 사의머플러불량률 5% 라고하는정보가추가되었다면? : 새로뭔가를구하겠지.. 사후확률 제 4 장확률

제 5 절 Bayesian Theorem 사후 posterior 확률을구하기위한 must have theorem 전체 100 개 S 사 :60 개 T 사 :40 개 불량 :1.2 개불량 :2 개 머플러가고장난 (D) 차의머플러가 S사꺼임 (M1)? T사꺼임 (M2)? 전체 100개중머플러고장은 3.2개임 P(D) = 0.032 그중 S사의제품은 1.2개 P(M1 D) = 1.2/3.2 = 0.375 제 4 장확률

제 5 절 Bayesian Theorem 사후 posterior 확률을구하기위한 must have theorem 전체 100 개 S 사 :60 개 T 사 :40 개 불량 :1.2 개불량 :2 개 사건의정의및사전확률의정의 M1: 머플러가 S사, P(M1) = 0.6 M2: 머플러가 T사, P(M2) = 0.4 D: 머플러고장확률 S사의불량률, P(D M1) = 0.02 T사의불량율, P(D M2) = 0.05 머플러가고장난차의머플러가 S사? P(M1 D) =? 제 4 장확률

제 5 절 Bayesian Theorem 사건의정의및사전확률의정의 M1: 머플러가 S사, P(M1) = 0.6 M2: 머플러가 T사, P(M2) = 0.4 D: 머플러고장확률 S사의불량률, P(D M1) = 0.02 T사의불량율, P(D M2) = 0.05 머플러가고장난차의머플러가 S사? P(M1 D) =? P(M1 D) = P(M1 D) / P(D) P(D) = P(M1 D) + P(M2 D) ; Bayesian Theorem P(M1 D) = P(D M1) P(M1) = 0.02 0.6 = 0.12 P(M2 D) = P(D M2) P(M2) = 0.05 0.4 = 0.2 P(D) = P(M1 D) + P(M2 D) = 0.32 P(M1 D) = P(M1 D) / P(D) = 0.12 / 0.32 = 0.375 제 4 장확률

제 5 장이산확률분포 학습목표 확률변수및확률분포함수에대한이해 이산확률변수의기대값과분산의의미이해및계산 기대값과분산의성질에대한이해및응용 이항분포를이해하고엑셀을이용하여확률을계산 포아송분포를이해하고엑셀을이용하여필요한확률을계산 제 5 장이산확률분포

들어가기전에... 맹구의경험 (3) 맹구는어느날여자친구와유원지엘놀러갔다. 재미있는시간을보내고있던중유원지한구석에서찍기놀이를하는가게를지나게되었다. 찍기놀이는다음과같은놀이판을이용하여서울, 대전, 대구, 부산, 광주에걸리면상금이 10 만원, 5 만원, 3 만원, 2 만원, 1 만원이었다. 만일한번게임하는데 2 만원을내야한다면 꽝 대전 서울 부산 광주 꽝 꽝 서울 맹구가이게임에서돈을딸수있을까? 맹구는한판에얼마의돈을딸수있을까? 또는얼마의돈을잃는것일까? How do you guess the answer? 꽝 광주 꽝 대구 제 5 장이산확률분포

제 1 절확률변수 확률변수 확률변수 (random variable) 란임의실험의결과에실수값을대응시켜주는함수이다. ( 기호 : X,, Z,..) 예 ) 동전을세번던지는실험 표본공간 (HHH) 제 5 장이산확률분포 (HHT) (HTH) (THH) (HTT) (THT) (TTH) X 앞면이나오는횟수 (TTT) 이산확률변수와연속확률변수 3 2 1 0 실험전에는어떤값이나올지모르기때문에확률변수라한다.

제 2 절이산확률분포 확률변수 X 를이산확률변수라하고, X 가가질수있는 K 개의값을 x 1, x 2,... x k 이라하자. P[X= x i ] = p(x i ) : X 가 x i 값을가질확률 예 ) X : 어느자동차대리점이지난 25일동안판매한자동차대수 한대도판매하지못한날이 3일 P[X=0] = 3/25 = 0.12 1대를판매한날이 7일 P[X=1] = 7/25 = 0.28 2대를판매한날이 9일 P[X=2] = 9/25 = 0.36 3대를판매한날이 4일 P[X=3] = 4/25 = 0.16 4대를판매한날이 2일 P[X=4] = 2/25 = 0.08 제 5 장이산확률분포

제 2 절이산확률분포 이산확률분포표 x x1 x2... xk p(x) p(x1) p(x2)... p(xk) 확률함수의특성 모든 xi에대해 p(x i ) 0, i = 1, 2,..., k p(x 1 )+p(x 2 ) + + p(x k )=1 자동차판매대수 x 0 1 2 3 4 p(x) 0.12 0.28 0.36 0.16 0.08 제 5 장이산확률분포

제 2 절이산확률변수의확률분포 확률분포의그래프 누적분포함수 F(x 0 )=P(X x 0 ) 자동차판매대수의예에서자동차가두대이하로팔릴확률은? 제 5 장이산확률분포

제 2 절이산확률변수의확률분포 누적분포함수 Example x 0 1 2 3 4 p(x) 0.12 0.28 0.36 0.16 0.08 F(0) = P(X 0) = 0.12 F(0.5) = P(X 0.5)= P(X=0) = 0.12 F(1) = P(X 1) = P(0) + P(1) = 0.4 F(1.5) = P(X 1.5) = 0.4 F(2)= 0.76 F(3)= 0.92 F(4) = 1 1 23/25 19/25 10/25 3/25 0 1 2 3 4 제 5 장이산확률분포

제 3 절기대값과분산 기대값 확률변수의평균을기대값이라한다. 기대값계산식의이해 X : 자녀가 2명인집안에서아들의수 / 표본 1000가구를조사 x P(x) 빈도 상대빈도 0 0.25 260 0.260 1 0.5 517 0.517 2 0.25 223 0.223 계 1.0 1000 1.000 E( X) = (0 260 + 1 517 + 2 223) / 1000 = 0 0.260 + 1 0.517 + 2 0.223 = 3.963 즉, E[X] = x* 빈도 /n E[X]= x p(x) as n ( 모든가구 ) 제 5 장이산확률분포

제 3 절기대값과분산 이산확률변수의기대값과분산 E(X)(=m) = x p(x) ( 기대값 ) V(X) = (x- m) 2 p(x) = x 2 p(x) - m 2 ( 분산 ) 예제 ( 자동차판매대수 ) 판매대수 (X) 확률 (p(x)) x*p(x) x*x*p(x) 0 0.12 1 0.28 2 0.36 3 0.16 4 0.08 계 1.0 기대값 분산 표준편차 제 5 장이산확률분포

제 3 절기대값과분산 예제 주당제품의생산량 (X) 이다음과같은분포를갖는다. 주당평균생산량과분산을구하시오. 즉, X 의기대값과분산을구하시오. X 50 55 60 65 P(x) 0.1 0.3 0.4 0.2 제 5 장이산확률분포

제 3 절기대값과분산 연습 어떤투자안의수익률이경기상황에따라다음과같이예상되고, 각경기상황이발생할확률이아래와같다고하자. 상황호황보통불황 확률 0.3 0.4 0.3 수익률 30% 20% 10% 평균수익률과표준편차를구하시오. [ 투자론, 최운열, 1997, p.26] 제 5 장이산확률분포

제 3 절기대값과분산 기대값의특성 X와 Y는 ( 이산 ) 확률변수이고 a는상수 1. E(a)=a 2. E(aX)=aE(X) 3. E(X+Y) = E(X)+E(Y), E(X-Y)=E(X)-E(Y) 분산의특성 X와 Y는확률변수, a는상수 1. Var(a) = 0 2. Var(aX) = a 2 Var(X) 3. Var(a+X) = Var(X) 4. X와 Y가독립이면 Var(X+Y)=Var(X)+Var(Y), Var(X-Y)=Var(X)+Var(Y) 제 5 장이산확률분포

제 3 절기대값과분산 예제 5-1 예제 5-2 제 5 장이산확률분포

제 3 절기대값과분산 예제 5-3 제 5 장이산확률분포

제 3 절기대값과분산 연습 주간제품의생산량 (X) 의평균은 67.3 분산은 20.25였다. 만일총생산비용 (Y) 이 200억원의고정비와제품한개당 300만원의변동비용으로이루어진다면, 총생산비용의기대값과분산을구하시오. 제 5 장이산확률분포

제 4 절이항분포 베르누이시행 실험결과가성공또는실패의두가지상호배반사건으로나누어질수있으며, 실험의결과가성공일확률이 p이고실패일확률이 (1-p) 인실험을베르누이실험또는베르누이시행이라한다. 베르누이확률변수 X ( 실험결과를나타내는확률변수 ) 결과 : 성공 or 1 (X=1) 실패 or 0 (X=0) 베르누이시행의예 자유투의성공여부, 입사시험의성공여부 Note 1. 베르누이시행에서성공의확률은 p = P(X=1) 실패의확률은 q=1-p = P(X=0) 2. 확률분포함수 p(x) = p x (1-p) 1- x x=0,1 제 5 장이산확률분포

제 4 절이항분포 이항실험 성공의확률이 p인베르누이시행을 n번독립적으로반복하는실험. 이항확률변수 이항실험에서성공의횟수 (X) X가가질수있는값은 0,1,2,...n이다. Note 이항분포는 n과 p로나타낸다. ( 예 ) 1. 동전을 5번던졌을때앞면이나오는횟수 n = 5, p = 1/2 2. 불량률이 0.1인공정에서생산된 10개의제품중불량품의개수 n=10,p=0.1 제 5 장이산확률분포

제 4 절이항분포 이항분포의확률분포함수 P(X=x) = ncx p x (1-p) n-x, x= 0,1,2,...n Note 1. 조합 n개중 x개를뽑는방법의수 ncx = n!/x!(n-x)!, k! = k (k-1) (k-2)... 2 1 2. [X=x] x 번 (n-x) 번 S S S F F F F F S S S n-x x P[X=x]= ncx p X (1-p) n-x p X (1-p) n-x p X (1-p) n-x ncx 개 제 5 장이산확률분포

제 4 절이항분포 [ 예제 5-4] 제 5 장이산확률분포

제 4 절이항분포 [ 예제 5-4] 이항분포표를이용한풀이 엑셀을이용한풀이 제 5 장이산확률분포

제 4 절이항분포 이항분포의기대값과분산 E(X) = np V(X) = npq = np(1-p) 표준편차 = [V(X)] 0.5 = [np(1-p)] 0.5 [ 예제 5-5] 연습 자신의보험체결확률이 0.4라고믿고있는보험판매원이 5명을방문했을때평균체결수는? 그리고분산은? ( 해 ) 제 5 장이산확률분포

제 5 절포아송분포 포아송분포를적용하는경우 지난일주일동안복잡한사거리에서발생하는교통사고의수 회계장부한장에있는오류의수 일정한혈액소에있는백혈구의수 어느하루에걸려오는전화의수 오전 10시부터오후 3시사이에은행창구를찾는고객의수 포아송분포의특징 주어진구간에서사건의평균발생수는구간의시작점에는관계가없고구간의길이에만영향을받는다. 아주작은구간에서 2회이상의사건이발생할확률은아주작아서무시할수있다. 한구간에서발생하는사건의수는시간이나공간의구간별로독립이다. 제 5 장이산확률분포

제 5 절포아송분포 포아송분포의확률함수 포아송분포의평균과분산평균 =m = E(X) = 분산 =s 2 = V(X) = 표준편차 = s = 1/2 제 5 장이산확률분포

제 5 절포아송분포 예제 5-6 포아송분포표를이용한풀이 엑셀을이용한풀이 제 5 장이산확률분포

제 5 절포아송분포 예제 5-7 (1) 1 시간동안방문하는고객의수 (X) 의평균및표준편차를구하라. (2) 1 시간동안방문하는고객이한명도없을확률을구하라. (3) 3 명이상의고객이방문할확률을구하라. 제 5 장이산확률분포

제 6 장연속확률분포 학습목표 연속확률분포는이산확률분포와어떤차이가있는가? 평균과표준편차에따라정규분포의모양은어떻게달라지는가? 표준정규분포를알아야하는이유는무엇인가? 정규분포는왜중요한가? 제 6 장연속확률분포

제 1 절연속확률분포의기본개념 1인분에 200g씩판매하는학교앞삼겹살구이집에서 1인분이정확하게제공되고있는지를조사하는실험을하였다고하자. X : 한꺼번에 5 인분즉 1,000g 을주문했을때제공되는삼겹살의양 삼겹살의양 대표값 빈도수 상대도수 950< X <= 960 955 3 0.03 960< X <= 970 965 8 0.08 970< X <= 980 975 15 0.15 980< X <= 990 985 22 0.22 990< X <= 1000 995 26 0.26 1000< X <= 1010 1005 14 0.14 1010< X <= 1020 1015 8 0.08 1020< X <= 1030 1025 3 0.03 1030< X <= 1040 1035 1 0.01 계 100 1 제 6 장연속확률분포

제 1 절연속확률분포의기본개념 5 인분의무게에대한히스토그램 ( 계급구간 = 9) 0.03 0.025 0.02 0.015 0.01 0.005 0 955 965 975 985 995 1005 1015 1025 1035 950 960 970 980 990 1000 1010 1020 1030 1040 P[950 < X < 960] = 기둥높이 x 기둥너비 = 10*0.003=0.03 P[1000 < X < 1030] =.14 +.08 +.03 =.25 기둥의총면적은 1.00 이다. 제 6 장연속확률분포

제 1 절연속확률분포의기본개념 5 인분의무게에대한히스토그램 ( 계급구간 = 18) 0.03 0.025 0.02 0.015 0.01 0.005 0 952.5 957.5 962.5 967.5 972.5 977.5 982.5 987.5 992.5 997.5 1002.5 1007.5 1012.5 1017.5 1022.5 1027.5 1032.5 1037.5 제 6 장연속확률분포

제 1 절연속확률분포의기본개념 5 인분의무게에대한히스토그램 0.03 0.025 0.02 0.015 0.01 0.005 확률밀도함수 임의의함수 f(x) 가확률밀도함수가되기위해서는다음성질을만족해야한다 f(x) 0, - < x < f ( x) dx 1 0 940 960 980 1000 1020 1040 P[950 < X < 960] = P[1000 < X < 1030] = 제 6 장연속확률분포

제 1 절연속확률분포의기본개념 연속형확률분포 이산형확률분포와연속형확률분포의성질비교 0 p(x i ) 1 이나 f(x) 는 1 보다큰값을가질수있다. 이산확률분포에서는연속확률분포에서는 P ( c X d) p( x) 이나 d c P( c X d) f ( x) dx c 이산확률분포에서는 X 가어떤값 a 를가질확률이 P(X=a)=p(a) 로존재하 나연속확률변수에대해서는 P(X=a)=0 으로정의된다. P(X=a) f(a) d p (a x b) a b 제 6 장연속확률분포

제 1 절연속확률분포의기본개념 연속형확률분포 연속형확률분포의평균과분산 E ( X ) xf ( x) dx 2 2 V ( X ) E( X ) ( x ) f ( x) dx 2 제 6 장연속확률분포

제 2 절균일분포와지수분포 균일 ( 균등, uniform) 분포 (distribution) 평균 표준편차 예제 6-1 지수 (Exponential) 분포포아송분포 ( 단위시간, 길이, 넓이당평균몇개발견 ) 와배다른형제발견당간격 ( 시간, 길이, 넓이등등 ) λ: 횟수 μ f(x): cdf F(x): pdf 제 6 장연속확률분포

제 3 절정규분포 정규분포의확률밀도함수 f ( x) 1 e 2 ( x) 2 2 2, - x 정규분포의특징 1. 정규분포의모양과위치는평균 = 와분산 = 2 에의해결정됨 곡선아래의면적은 1 이다 2. 정규분포곡선에서가장높은위치에해당하는 x축의점이분포의평균, 중앙값, 최빈값이다. 3. 정규분포곡선은종모양이며평균 를중심으로대칭이다. 4. 평균 는분포의위치를결정하고분산 2 분포의모양결정. < 그림 6-10> (192쪽) 제 6 장연속확률분포

제 3 절정규분포 서로다른평균과분산을갖는여러정규분포들 제 6 장연속확률분포

제 3 절정규분포 정규분포의특징 5. 두점사이정규분포곡선밑의면적은확률변수가두점사이에있을확률이다. 정규분포곡선의아래의총면적은 1.0이다. 6. 정규분포에서평균으로부터 ±σ안에있을확률이 68.26% 이며 ±2σ안에있을확률이 95.44% 이며 ±3σ안에있을확률이 99.73% 이다. 7. 기호 : X ~ N(, 2 ) 제 6 장연속확률분포

제 4 절표준정규분포 표준정규분포란? 평균이 =0이고분산 2 이 1인정규분포. 기호 Z ~ N(0,1) z 1 f ( z) e 2 2 2, - z 표준정규분포의특징 0을중심으로대칭 모양이항상일정 위치도항상일정 0 1 제 6 장연속확률분포

제 4 절표준정규분포 기본개념 X~N(, 2 ) 이라하자. Z=X-/ 라하면 Z~N(0,1) 이다. 예 X ~ N(50,10 2 ) Z = X-50/10 ~ N(0.1) X/10 50 10 1 X-50 0 제 6 장연속확률분포

제 4 절표준정규분포 예계속 P(X>60) 을표준정규분포로표현 ( 그래야확률을구할수있음 )) P(X-50/10 > 60-50/10) = P(Z>1) X/10 50 10 1 X-50 0 제 6 장연속확률분포

제 4 절표준정규분포 표준정규분포에서의확률계산 < 표 6-1> 표준정규분포표 (199 쪽 ) 는 P(Z<z) 를나타내고있음. 0 z P(Z>1) -1 1 0 z =1 Z =-1 P(-1<Z<1) P(Z<1) P(Z<-1) 제 6 장연속확률분포

제 4 절표준정규분포 표준정규분포에서의확률계산 예제 1 1. P(Z<1) = 2. P(Z<-1) = 3. P(Z>1) = 1 - P(Z<1) 4. P(Z>-1) = P(Z<1) 5. P(-1.5<Z<1)) 연습 1. P(Z < 2.33) 2. P(Z<-1.64) 3. P(Z>2.33) 4. P(Z>-1.64) 5. P(-1.64<Z<2.33) 6. P(1.64<Z<2.33) 제 6 장연속확률분포

제 4 절표준정규분포 X~N(, 2 ) 의 Z로의변환 1. P(X<a) = P(Z<(a-)/) 2. P(X>b) = P(Z>b-/) 3. P(a<x<b) = P(a-/ <Z<b-/) 예제 : 정규분포의성질 1. P(- <x<+) 2. p(-2 <x< +2) 3. p(-3<x<+3) 제 6 장연속확률분포

제 4 절표준정규분포 [ 예제 6-4] 정규확률변수 X가평균 80과표준편차 8인정규분포를따를때, 아래의문제에대해표준정규분포표를이용하여확률을구하라. 1 P(X<90) 2 P(X<76) 3 P(X<92) 4 P(70<X<86) 5 P(84<X<92) 6 P(66<X<74) 숙제 #3 연습문제 9, 10, 12, 13 제 6 장연속확률분포

숙제 #3 연습문제 4.12, 4.14 연습문제 4.19, 4.23 워드또는한글로풀이과정을사이버한밭에제출할것 ~10/14 숙제 #4 연습문제 5.13, 5.15 연습문제 6.5, 6.12, 6.16 엑셀의확률분포함수기능을이용하여제출할것 ~10/14 Hanbat National University

제 7 장표본분포 학습목표 표본추출의필요성과방법을설명할수있다. 표본평균들의분포가무엇인지실험을통해서그원리를파악한다. 중심극한정리를이해하고이를이용하여원하는값을계산할수있다. 표본비율에대한중심극한정리를이해한다. 표본분산의분포에대해이해한다 제 7 장표본분포

제 1 절표본의기본개념 리터러리다이제스트 1936 년미국대통령선거 루즈벨트 vs. 랜던 리터러리다이제스트 갤럽 표본크기 240 만명 (1000 만 >) 5 만명 유권자선정 자동차등록자료에서선택전화번호에서선택잡지사의주관에의한표본선택 미국전역에있는유권자 ( 할당추출 ) 예상후보랜던루즈벨트 루즈벨트의당선 리터러리다이제스트판매부수격감, 폐간 http://navercast.naver.com/contents.nhn?rid=214&contents_id=33664 제 7 장표본분포

제 1 절표본의기본개념 리터러리다이제스트라는잡지를아세요? 제 7 장표본분포

제 1 절표본의기본개념 표본추출의의미 추측 특성들 표본추출 특성들 모집단 표본 제 7 장표본분포

제 1 절표본의기본개념 표본추출의의미 센서스 census, enumeration 모집단전체를조사하는것 / 전수조사 표본조사 sampling 모집단으로부터표본을추출하여표본으로부터모집단의특성파악 표본조사를하는이유 시간과비용의제약성 모집단이무한모집단인경우전수조사불가능 파괴성을지닌조사에는전수조사가불가능 제 7 장표본분포

제 1 절표본의기본개념 표본추출방법 확률표본 각표본단위가표본에포함될확률이미리알려져있을때추출된표본 ( 예 ) 2500의공인회계사모임에서 50명의표본을추출하는경우 장점 1 표본조사에따르는오류의한계를알수있다. 2 편의 (bias) 를줄일수있다. 편의 = 모집단의참값 표본에서얻은결과 비확률표본 모집단으로부터표본을추출할때모집단을대표할만하다고판단되어추출된표본 ( 예 ) PD가 TV프로그램의시청자의견을조사하기위해자기가사는아파트단지주민중적당히 100명추출 제 7 장표본분포

제 1 절표본의기본개념 확률표본의종류 단순확률표본추출 크기가 N인모집단에서 n개의표본을추출하는경우, 각원소의추출확률을모두동일하게하여표본을추출하는방법 난수표, 회전판을이용 장점 단점 단순무작위추출은이해하기쉽고, 자료분석결과가사전에정해진허용오차내에서모집단에대한대표성을가질수있음 모집단을구성하는요소들의목록을확보하기어려움 ( 정보획득불가능, 비용 ) 추출단위목록이있거나모집단이작은경우유리 다른고급확률표본추출과비교해볼때, 단순무작위추출은비효율적이며, 불안정한추정량을제공 제 7 장표본분포

제 1 절표본의기본개념 확률표본의종류 층별추출법 모집단을어떤속성에따라여러층 (stratum) 으로나눈후각층에서단순확률표본을추출하는것. 층은동일한성격을지닌원소로구성됨 모집단을층별그룹으로구별하는기준으로는성별, 나이, 지역등의단일기준으로하는경우와교육과수입, 성별과연령등과같이두개이상의혼합기준으로하는경우가있음. 대학생들의사고방식조사 학생들을동질성을갖는학년으로구분한다음각학년별로단순무작위추출을이용하여추출함 비례적층별추출과불비례적층별추출 제 7 장표본분포

제 1 절표본의기본개념 확률표본의종류 군집 ( 집락 ) 추출법 모집단을대개의경우자연적인소집단또는집락 (cluster) 으로나누고이들중일부를표본으로선택하여, 선택된집락속의원소들을모두관찰하는방법 집락은동질일필요가없음 대학생들의사고방식조사 장점 학생들을군집에해당되는학과로나눈뒤에단순무작위추출을이용하여추출함 한도시에사는사람들의소득수준을조사하는경우몇개의동을무작위로선정한후각동마다일부또는전수조사를실시 비용경제성과실행의편의성이높음 제 7 장표본분포

제 1 절표본의기본개념 확률표본의종류 체계적 ( 계통 ) 추출법 모집단을일렬로늘어놓고 ( 순번을정한다음 ) 일정한간격으로표본을추출하는방법 단계 1. 샘플링구간 (k) 계산 k = 모집단의수 / 표본의수단계 2. 첫번째에서 k 번째표본사이에서임의로첫번째샘플추출단계 3. 첫번째샘플로부터매 k 번째샘플추출 장점 단순무작위추출과비교하여적용이쉽고, 시간과비용을절약할수있음 단점 체계적추출의한계점은모집단이무한하거나알려지지않은경우추출이불가능 샘플링프레임에서나타나는순서가어떠한주기성 (periodicity) 을가지고있는경우에유의하여야함 제 7 장표본분포

제 1 절표본의기본개념 확률표본의종류 한밭대학교학생생활연구소에서 400명의표본을선발하는경우 1 단순확률표본 일련번호를부여한후난수를 400개생성하여해당학생선발 (1~ 8000) 2 체계적추출일련번호를부여한후 5번부터매 20번째학생을선발 3 층별추출전체학생을 1, 2, 3, 4 학년으로나누고각학년에서 100명씩추출 4 군집추출전체학과중 5개학과를선발하고 2학과에속한학생전체를표본으로사용 제 7 장표본분포

제 1 절표본의기본개념 비확률표본의종류 편의추출 표본추출이용이한대상을표본에포함시키는경우 편의추출은하나의새로운아이디어나가설을탐색하거나, 신제품을테스트하는경우등연구절차상탐색단계나질문지의사전조사에주로이용 일반적으로사회과학조사에서모집단의특성이크게차이나지않고동질적 (homogeneous) 이라고판단될때사용 장점 단점 예 자료를신속하고저렴하게얻을수있음 모집단을적절히대표할수없는경우가발생할수있음 길거리에서만난사람을대상으로표본을선정 친구나직장동료등친숙한이들을표본에포함 제 7 장표본분포

제 1 절표본의기본개념 비확률표본의종류 판단추출 연구자가연구목적에가장적합한표본이라고생각하는연구대상을선택하는방법 판단추출을이용하면비용을절약할수있음 모집단에대한사전지식이많은경우표본추출이편리하고정확도도높아짐 예 회사의신제품아이디어나신제품시험을위해회사종업원을이용하는경우» 회사종업원들이자신들의상품에대해더욱잘알고있다고판단하고있으며회사종업원들을일차적으로만족시키지못하면일반시장에서는성공하지못한 다는것을기업주가알고있기때문이다. 조사하고있는패널구성원중한사람이사정에의하여탈락하였을경우이사람과비슷한인구통계학적특성을지닌다른사람을구성원으로선별하는경우에판단추출을이용 판단추출은해당분양의전문가로선정된표본이실제로유용한정보를제공할수있다면매우유용한표본추출방법 제 7 장표본분포

제 1 절표본의기본개념 비확률표본의종류 할당추출 비확률표본추출중에서가장정교한표본추출 사회과학연구에서많이사용되고있는방법 연구주제와관련된통제변수 (control variable) 의특성에따라모집단을몇개의세그먼트 (segment; cell) 로나눈후, 각세그먼트에대한표본의수를나타내는범주 (category) 나할당량 (quota) 을연구자의판단아래결정 조사자는주어진할당량을채우면됨 예 : 교재 226쪽 제 7 장표본분포

제 2 절표본평균의분포 표본평균의분포 표본 1 X1 모집단 평균분산모양 표본크기 n 표본 2. X2 표본 m Xm 들의분포? 1 평균? 2 분산? 3 모양? 제 7 장표본분포

제 2 절표본평균의분포 정규분포로부터추출한표본평균의분포 평균이 이고분산이 인정규모집단으로부터동일한크기 n의표본을추출하여그들의평균을계산한후, 이표본평균들의분포를보면, /가된다. / 제 7 장표본분포

제 2 절표본평균의분포 실험을통한표본평균의분포에대한이해 모집단분포 0과 100사이의균일분포 1 f ( x) 단, 0 x 100 100 μ = E(X) = 50, σ2 = V(X) = 833.3, σ = sd(x)=28.868 f(x) 1/100 100 x 제 7 장표본분포

제 2 절표본평균의분포 실험을통한표본평균의분포에대한이해 n=3인경우 균일분포를따르는모집단으로부터 3개의표본을추출 72.05 11.75 6.26 표본의평균 (72.05 + 11.75 + 6.26) / 3 = 30.02 5번반복한결과 1 2 3 4 5 1 2 3 표본평균 72.05 11.75 6.26 30.02 17.78 12.84 84.47 38.36 1.40 0.67 57.24 19.77 65.00 59.56 75.26 66.61 82.49 31.84 48.64 54.32 표본오류 (sampling error) 모집단의참값과표본으로부터얻은통계량의차이를표본오류라고한다. 제 7 장표본분포

제 2 절표본평균의분포 실험을통한표본평균의분포에대한이해 n=3 인표본을 100 번반복하여계산한표본평균의분포 도수 30 평균 = 51.551 25 분산 = 294.270 표준편차 = 17.154 20 15 10 5 0 0 10 20 30 40 50 60 70 80 90 100 μ = E(X) = 50, σ 2 = V(X) = 833.3, σ = sd(x)=28.868 제 7 장표본분포

제 2 절표본평균의분포 실험을통한표본평균의분포에대한이해 n=10 인표본을 100 번반복하여계산한표본평균의분포 45 도수 40 35 30 25 20 15 10 5 평균 = 49.595 분산 = 89.208 표준편차 = 9.445 0 0 10 20 30 40 50 60 70 80 90 100 μ = E(X) = 50, σ 2 = V(X) = 833.3, σ = sd(x)=28.868 제 7 장표본분포

제 2 절표본평균의분포 실험을통한표본평균의분포에대한이해 n=30 인표본을 100 번반복하여계산한표본평균의분포 60 도수평균 = 50.054 분산 = 41.164 50 표준편차 = 6.416 40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100 μ = E(X) = 50, σ 2 = V(X) = 833.3, σ = sd(x)=28.868 제 7 장표본분포

제 2 절표본평균의분포 실험을통한표본평균의분포에대한이해 결과로부터얻어진결론 표본평균들의평균은 ( ) 에가까워진다. 표본평균들의분산이나표준편차는 ( ) 진다. 표본평균들의모양은 ( ) 형이되며 ( ) 분포에접근한다. 모집단 0 과 100 사이의균일분포 1 f ( x) 단, 0 x 100 100 μ = E(X) = 50, σ2 = V(X) = 2500, σ = sd(x)=28.868 제 7 장표본분포

제 2 절표본평균의분포 중심극한정리 모집단의분포에관계없이 의표본분포는표본의크기 (n) 가충분히크면평균이 μ 이고분산이 σ 2 /n인정규분포에근사한다. 즉 ~ N ( μ, σ 2 /n ) 표본평균들의기대값 모평균 표본평균들의분산 모분산 /n 표본평균들의분포 정규분포 표본크기에따른표본분포의형태 < 그림 7-10> 참고 제 7 장표본분포

제 2 절표본평균의분포 중심극한정리 [ 예제 7-2] [ 예제 ] 어느과수원에서생산되는사과의무게는평균이 150g이고분산이 400인것으로알려져있다. 만일이과수원에서생산되는사과중 100개를임의로뽑았을때평균무게가 153g 이상일확률을구하시오. 제 7 장표본분포

제 2 절표본평균의분포 중심극한정리 [ 예제 ] 건전지평균수명은 1000시간이고분산은 2500으로알려져있다. 100개의건전지를단순확률표본으로추출했을때평균수명이 990 시간미만일확률은얼마인가? (0.0228) 숙제 10, 11, 15 제 7 장표본분포

제 3 절표본비율과표본분산의분포 표본비율의중심극한정리 표본 1 p 1 p 1, p 2,, p m 의분포는? 모집단 p... 표본 2 p 2 (1) 평균 = p (2) 분산 = p(1-p)/n (3) 모양 : 정규분포 표본 m p m 즉, p ~ N ( p, p(1-p)/n) 제 7 장표본분포

제 3 절표본비율과표본분산의분포 표본비율의중심극한정리 [ 예제 ] 한지방자체단체에따르면이지방에소재하고있는기업들의 75% 가외국인근로자를고용하고있지않다. 이지방에서 100개의기업을추출하여임의표본을얻었다고하자. 외국인근로자를고용하지않는기업의표본비율의평균과분산은얼마인가? 이표본비율이 0.8 보다클확률은? 제 7 장표본분포

제 3 절표본비율과표본분산의분포 표본비율의중심극한정리 [ 예제 ] 한여행사에따르면관광코스중에가이드의안내로방문하는상점에서여행객의 20% 는물건을구입한다고한다. 여행객중 180 명이임의로추출된표본이있다고가정하시오. 여행객중물건을구입하는표본비율의평균을구하시오. 여행객중물건을구입하는표본비율의분산을구하시오. 여행객중물건을구입하는표본비율의표준편차를구하시오. 표본비율이 0.15 보다작을확률을계산하시오. 숙제 17, 18 제 7 장표본분포

제 3 절표본비율과표본분산의분포 표본분산의분포 모분산이 σ 2 인정규분포를이루는모집단에서표본을추출할때각표본의분산 S 2 의분포 모분산이 100인정규분포에서크기가 10인표본을 500개추출하여각표본에대하여계산한표본분산들의히스토그램 비대칭이며긴꼬리를갖는다. 빈도 S 2 제 7 장표본분포

제 3 절표본비율과표본분산의분포 표본분산의분포 표본분산의분포 - 카이제곱분포 (Chi-square distribution) 분산이 σ 2 인정규분포를이루는모집단으로부터표본크기가 n인선택가능한모든임의표본이추출되었을때, 각표본의분산을 S 2 라고하자. 그러면 (n-1)s 2 /σ 2 은자유도 (n-1) 인카이제곱분포를따른다. χ 2 = (n-1)s 2 /σ 2 ~ χ 2 (n-1), p(χ 2 >????) = α 카이제곱분포의그림 카이제곱분포의평균과분산평균 = (n-1) 분산 = 2(n-1) 제 7 장표본분포

제 8 장추정 학습목표 모수란? 추정이란무엇일까? 점추정과구간추정의차이 모평균과모비율에대한신뢰구간구하기 엑셀을이용하여모평균에대한신뢰구간구하기

INTRO 제 1 절추정의기본개념 통계적추론이란? 모집단 특성또는모수 현상에대한주장 표본 특성또는추정량 현상을관찰 통계적추론 모집단에대한추측또는결정 추정과가설검정

제 1 절추정의기본개념 통계적추론이란? 예제 어느연구자가 A 지역의가구당평균월수입을조사하기위하여, 그지역의전체가구중에서임의로 20 가구의표본을랜덤추출하여월수입을조사하였다. ( 단위 : 만원 ) 152 128 146 142 113 140 161 185 142 164 132 160 140 154 126 109 138 182 144 172 세가지문제 A지역의가구당평균월수입의참값을어떻게추측할수있는가? A지역의가구당평균월수입의참값이속하는범위를어떻게추측할수있는가? 만일이연구자가 A지역의가구당평균월수입이 140만원이라고주장한다고할때, 이연구자의주장이옳다고할수있는가?

제 1 절추정의기본개념 통계적추론이란? 점추정 표본에의하여얻어지는정보를이용하여미지의모수인 의참값으로생각되는하나의값을일정한과정에의하는구하는과정 추정량 (Estimator) 과추정값 (Estimate) 표준오차 : 추정량의표준편차 구간추정 모수 의참값이속할것으로생각되는구간 (L, U) 을제공하는것 좋은구간추정이되려면정확도와신뢰도가높아야한다. 정확도란? 구간이얼마나모수의참값에대해근사한정보를제공하는지를나타내는척도 구간의길이, U L, 로나타냄 신뢰도란? 구간이모수의참값을포함하고있을가능성을나타내는척도

Pt. est 제 1 절추정의기본개념 점추정 좋은추정량의조건 표본평균 모집단평균 () 표본중앙값 표본최빈수 1. 추정량의기대값이모수와같아야한다. ( 불편성 ) 2. 추정량의분산이적어야한다.( 정확할가능성이높음.)

제 1 절추정의기본개념 좋은추정량들 (unbiased est.) 모집단모평균 () 모비율 (p) 모분산 ( 2 ) 표본 표본평균 ( ) X 표본비율 ( pˆ ) 표본분산 (S 2 )

Int. est 제 2 절구간추정 구간추정 구간추정을사용한예 일전에막을내린 파리의연인 의시청률은 43.7% 를기록했다. 이조사는성인남녀 500명을대상으로조사한것으로 95% 신뢰수준에서표본의허용오차는 3% 였다. 시청률 (40.7%, 46.7%)

제 2 절구간추정 구간추정 신뢰구간 모수 에대하여 P(A< <B) = 1- 를만족하는구간 (A,B) 를 의 100(1-)% 신뢰구간이라한다. 좋은신뢰구간이란? 1. 정확도 : 구간이얼마나모수의참값에대해근사한정보를제공하는지를나타내는척도 구간의길이, B-A, 로나타냄 2. 신뢰도 : 구간이모수의참값을포함하고있을가능성을나타내는척도 신뢰수준, 신뢰계수라고도함

제 2 절구간추정 구간추정 신뢰구간의원리 신뢰구간은점추정량과표준오차 ( 표준편차의함수로 ) 에의해구성 모집단분포 1- X - 표준오차 X X + 표준오차 P( X -표준오차 X + 표준오차 )= 1- 를만족시키기위하여.

제 2 절구간추정 구간추정 평균이 이고분산이 2 인분포에서뽑은표본의평균은표본의크기 (n) 이크면평균이 이고분산이 2 /n인정규분포를따른다. 즉, 모집단분포 95% 1.96 / 2 X ~ N(, ) n n 중심극한정리 1.96 / P( 1.96 X 1.96 ) 0.95 n n n X ( X 1.96 n 오차한계 신뢰수준 X 1.96 ) n 모평균에대한 95% 신뢰구간

제 2 절구간추정 구간추정 모평균에대한 95% 신뢰구간 ( X 1.96 n X 1.96 ) n 알려져있지않음 모집단 표본 표본 표본 x1 1.96 x2 1.96 x3 1.96 n n n 표본 k x k 1.96 n

Est. #1 모평균의구간추정 제 2 절구간추정 모평균 () 에대한 100(1-)% 신뢰구간 ( 2 이알려져있는경우 ) ( X Z / 2, X Z / 2 n ) n 단 Z /2 는표준정규분포에서오른쪽꼬리면적이 /2 가되는표준정규확률변수의값 Note Z / 2 를오차한계 (ME) 라한다. n = 0.01 Z /2 =NORMSINV(0.995) = 2.575835=2.5175 = 0.05 Z /2 =NORMSINV(0.975) = 1.959961=1.96 = 0.1 Z /2 =NORMSINV(0.95) = 1.644853 = 1.645

제 2 절구간추정 모평균의구간추정 예제 8-1 대졸신입사원의평균연봉에관하여조사한결과, 표준편차는 500만원이고정규분포를따른다는사실을알게되었다. 임의로대졸신입사원 25명을추출하여평균연봉을조사하니 1800만원이었다. 신입사원의평균연봉에관하여 95% 신뢰구간을구하라. 풀이

제 2 절구간추정 모평균의구간추정 예제 8-1 엑셀을이용한풀이

Est. #2 제 2 절구간추정 모평균의구간추정 ( 2 을모르는경우 / 대표본인경우 ) 모평균 () 에대한 100(1-)% 신뢰구간 s ( X Z / 2, X Z / 2 n s n ) 단 Z /2 는표준정규분포에서오른쪽꼬리면적이 /2 가되는표준정규확률변수의값 Note X ~ / n N(0,1) X s ~ / n N(0,1) ( 표본의크기가큰경우 )

제 2 절구간추정 모평균의구간추정 예제 8-2 A 은행에서는 85가구를대상으로신용카드의예치금액을조사하였다. 조사결과에따르면 85가구의평균예치금액은 590만원이고표본표준편차는 305.8만원이다. 전체가구를대상으로신용카드의평균예치금액에대한 95% 신뢰구간을구하여라. 풀이

Est. #3 제 2 절구간추정 모평균의구간추정 ( 2 을모르는경우 / 소표본인경우 ) < 정리 > 표본 (X 1,X 2,, X n ) 을정규분포를따르는모집단으로부터추출하였다고 X 하자. 그러면 T= 는자유도가 (n-1) 인 t분포를한다. s / n Note t 분포의특징 1. 평균이 0이며좌우대칭이다. 2. 표준정규분포와유사하나긴꼬리를갖는다. 3.t분포는자유도에의해모양이결정된다. 4.n이아주커지면표준정규분포에접근한다.

모평균의구간추정 제 2 절구간추정 모평균 () 에대한 100(1-)% 신뢰구간 ( 2 을모르는경우 / 소표본인경우 ) s s ( X t / 2, n1, X t / 2, n1 ) n n 단 t /2, n-1 는 t- 분포에서오른쪽꼬리면적이 /2 가되는값 Note =0.10, 자유도 =10 t 0.05, 10 = 1.812 =0.01, 자유도 =15 t 0.005, 15 = 2.947 =0.10, 자유도 =20 t 0.05, 20 = 1.725

제 2 절구간추정 모평균의구간추정 예제 8-3 Z 전자회사는새로운방법으로 15명의직원을대상으로직원훈련을실시하였다. 교육실시후평가에서합격으로판정될때까지아래와같은시간 ( 단위 : 일 ) 이소요되었다. 52, 44, 55, 44, 45, 59, 50, 54, 62, 46, 54, 58, 60, 62, 63 이자료를이용하여새로운직원훈련방법을전체직원을대상으로실시할때합격까지의평균소요시간에대한 95% 신뢰구간을구하여라. 풀이

모평균의구간추정 예제 8-3 엑셀을이용한풀이 제 2 절구간추정

Est. #4 제 2 절구간추정 모비율의구간추정 Note 모비율 p 의좋은추정량 : p ˆ X / n X 는표본중에서관심있는특성을가진대상의수 이항분포를따르는 Note 확률변수 (n, p) pˆ 의표준편차 V ( pˆ) V ( X / n) p(1 p) / n sd ( pˆ) V ( X / n) p(1 p) / n pˆ 의중심극한정리 pˆ ~ N( p, p(1 p)/ n)

모비율의구간추정 제 2 절구간추정 모비율 (p) 에대한 100(1-)% 신뢰구간 pˆ Z / pˆ(1 pˆ), n pˆ Z / ( 2 2 pˆ(1 n pˆ) ) 단 Z /2 는표준정규분포에서오른쪽꼬리면적이 /2 가되는값

제 2 절구간추정 모비율의구간추정 예제 8-4 A 전자회사는자사의제품을구입한후다시자사의제품을재구매할소비자의비율에관심을갖고 500명의소비자를대상으로제품의만족도를조사하였다. 이중재구매를답한소비자는 250명이었다.A제품의소비자중재구매할소비자의모비율에대한 99% 신뢰구간을구하여라.

제 3 절엑셀을이용한구간추정 추정 - 단일모평균에대한추정 구간추정 [ 예제 ] 어느연구자가 A 지역의가구당평균월수입을조사하기위하여, 그지역의전체가구중에서임의로 20 가구의표본을랜덤추출하여월수입을조사하였다. 모집단의정규분포를가정하고다음에답하시오. ( 단위 : 만원 ) 152 128 146 142 113 140 161 185 142 164 132 160 140 154 126 109 138 182 144 172 위의자료를이용하여 (1) A 지역의가구당평균월수입을추정하고표준오차를구하라. (2) A 지역의가구당평균월수입에대한 95% 신뢰구간을구하시오.

Excel 제 3 절엑셀을이용한구간추정 모평균에대한추정 구간추정 단계 1> 빈워크시트에자료를입력한다.

제 3 절엑셀을이용한구간추정 모평균에대한추정 구간추정 단계 2> 메뉴에서 [ 도구 (T)] [ 데이터분석 (D)] 을선택한다. [ 통계데이터분석 ] 대화상자가나타나면, 기술통계법 을선택하고 [ 확인 ] 버튼을누른다.

제 3 절엑셀을이용한구간추정 모평균에대한추정 구간추정 단계 3> 기술통계법 대화상자에서다음과같이입력하고, [ 확인 ] 버튼을누른다.

제 3 절엑셀을이용한구간추정 모평균에대한추정 구간추정 단계 4> 다음과같은결과를확인할수있다.

제 3 절엑셀을이용한구간추정 모평균에대한추정 구간추정 단계 5> 단계 4> 의출력결과에다음과같이신뢰하한과신뢰상한의계산결과를추가한다. 셀 E17과 E18의입력내용은다음과같다. E17 ; = E3 - E16 E18 : = E3 + E16 숙제 2, 3, 8, 9, 10, 13

제 9 장가설검정 - 강의목표 표본을이용하여얻어진결과를통해서모집단의특성에대한주장을판단하는과정에대해이해함. 가설검정의여러가지용어 : 귀무가설, 대립가설, 유의확률, 유의수준 가설검정의절차를이해 엑셀을이용하여가설검정을수행하는방법을익힌다.

제 1 절가설검정의기본개념 통계적가설검정이란? 표본을이용하여모수에대한예상이나주장또는단순한추측등의옳고그름을판단하는과정 가설과관련된주장들 새로개발한진통제는기존의진통제보다진통효과가더길다 국산전구의수명이외국산전구의수명보다더길다 이정책에대한국민의지지도는과반수이상이다 A자동차의리터당연비가 11.5km 이다. 어느단체장지지율은 60% 이상이다. 제 9 장가설검정경영통계학 2

제 1 절가설검정의기본개념 통계적가설검정과관련된사례 [ 사례 1] 작년에입사한대졸신입사원의평균연봉에관하여조사한결과, 평균연봉은 1,750만원이고표준편차는 40만원임을알게되었다. 올해에입사한대졸신입사원 36명을임의로추출하여평균연봉을조사한결과는 1,770만원으로얻어졌다고하자. 올해에입사한사원들의월급이작년도입사한신입사원에비하여실제로 20만원인상되었는가? [ 사례 2] A 전자회사의경영진은자사의제품을구입한후다시자사의제품을재구매할소비자의비율을 70% 로파악하고있다. A제품의소비자중 500명의소비자를대상으로새롭게제품의재구매여부를조사하였더니재구매를응답한비율은 60% 로조사되었다. 제품의재구매비율이실질적으로 10% 하락되었는가? 제 9 장가설검정경영통계학 3

제 2 절가설검정의방법 가설검정의절차 ( 전통적인방법 ) 가설의설정 검정통계량계산 기각역결정 ( 유의수준 ) 의사결정 가설의설정 통계적가설이란? 모수에대한예상, 주장또는단순한추측 귀무가설 설정된가설이잘못되었다는충분한증거가제시되기전까지참 (true) 으로받아들여지는가설 H 0 으로표시 제 9 장가설검정경영통계학 4

제 2 절가설검정의방법 가설의설정 대립가설 귀무가설이잘못되었다는충분한증거로귀무가설을기각할때받아들이는가설 입증하고자하는사실이나주장 H 1 으로표시 가설검정의유형 귀무가설 H0 : = 0 대립가설 H1 : 0 ( 양측가설 ) H1 : > 0 ( 단측가설 ) H1 : < 0 ( 단측가설 ) 제 9 장가설검정경영통계학 5

제 2 절가설검정의방법 가설의설정 예제 9-1 [ 사례 1] 의경우에 올해입사한신입사원의평균연봉이작년에입사한대졸신입사원의평균연봉 1750만원에비하여인상되었는지 에관한가설을설정하시오. H 0 : = 1750 H 1 : > 1750 예제 9-1 [ 사례 2] 의경우와같이 A 전자회사제품을구입한후새롭게조사된제품의재구매비율이기존의비율 70% 와비교했을때같지않은지 에관한가설을설정하시오. H 0 : p = 0.7 H 1 : p 0.7 제 9 장가설검정경영통계학 6

제 2 절가설검정의방법 검정통계량 검정통계량이란귀무가설과대립가설중에서하나의가설을입증하기위하여사용하는통계량 모집단평균의가설검정 Z X 0 / n Z X S 0 / n T X S 0 / n 모집단비율의가설검정 Z p pˆ 0 p 0 (1 p n 0 ) 제 9 장가설검정경영통계학 7

제 2 절가설검정의방법 제 1 종오류와제 2 종오류 채택과기각 검정결과 H0 참 실제현상 H0 거짓 H0 채택 옳은결정 제 2 종오류 H0 기각 제 1 종오류 옳은결정 [ 사례 1] 에서제 1 종오류와제 2 종오류 H 0 : = 1750 H 1 : > 1750 유의수준 () 이란? 제1종오류를범할확률의최대허용한계 보통 0.05(5%), 0.01(1%), 0.1(10%) 를사용 제 9 장가설검정경영통계학 8

제 2 절가설검정의방법 기각역 귀무가설을기각할수있는검정통계량의영역 기각역의범위설정방법은대립가설에서사용된 >, <, 과유의수준 () 에따라결정 제 9 장가설검정경영통계학 9

제 2 절가설검정의방법 가설검정의절차요약 1. 귀무가설 H0와대립가설 H1을설정한다. 2. 유의수준 () 를결정한다. 3. 검정통계량을선택하고귀무가설이옳다는가정하에서검정통계량분포를구한다. 4. 기각역을구한다. 5. 기각역에검정통계량이포함되는지여부를파악하여결과를판정한다. 제 9 장가설검정경영통계학 10

제 3 절모평균에대한가설검정 가설 ⅰ. H 0 : = 0 ⅱ. H 0 : = 0 ⅲ. H 0 : = 0 H 1 : > 0 H 1 : < 0 H 1 : 0 2 이알려진경우의모평균에대한검정. 검정통계량 : X Z 0 / n 기각역 ⅰ. H 1 : > 0 Reject H0 if Z z ⅱ. H 1 : < 0 Reject H0 if Z z ⅲ. H 1 : 0 Reject H0 if Z z / 2 제 9 장가설검정경영통계학 11

제 3 절모평균에대한가설검정 [ 예제 9-3] n = 36, X = 1770, = 40, = 0.05 ( 해 ) 제 9 장가설검정경영통계학 12

제 3 절모평균에대한가설검정 [ 예제 ] 어느사회단체에대한기부금의평균은 68,000원이며표준편차는 6000원이다. 기부금을장려하기위하여기부금과관련된법령을개정하였다. 법령이개정된후평균기부금이늘어났는지검정하려한다. 이를위해 36개의표본을추출하여조사한결과평균 70,500원이었다. 법령이개정된후평균기부금이늘어났다고할수있는지유의수준 1% 에서검정하시오. 제 9 장가설검정경영통계학 13

제 3 절모평균에대한가설검정 2 이알려져있지않은경우모평균에대한검정. ( 표본의크기가큰경우 (n 30)) 검정통계량 Z X S 0 / n 기각역 ⅰ. H 1 : > 0 Reject H0 if Z z ⅱ. H 1 : < 0 Reject H0 if ⅲ. H 1 : 0 Reject H0 if Z z Z z / 2 제 9 장가설검정경영통계학 14

제 3 절모평균에대한가설검정 예제 VIVA 신용카드회사에서는전국의카드소유자들을대상으로카드소유기간을조사한결과평균 36개월이었다. 수도권에거주하는 VIVA 카드소유자들로부터 100명을임의로선정하였으며이표본의평균카드소유기간은 35개월이며표준편차는 8개월이었다. 이정보에근거하여수도권에거주하는카드소유자들을대상으로평균카드소유기간이전국평균보다짧다고할수있는지 5% 유의수준에서검정하시오. 제 9 장가설검정경영통계학 15

제 3 절모평균에대한가설검정 2 이알려져있지않은경우모평균에대한검정. ( 표본의크기가작은경우 (n<30), 모집단의분포가 N (, 2 ) 임을가정 ) 검정통계량은 T X 0 S / n ~ 자유도가 (n-1) 인 t- 분포를따른다. 기각역 ⅰ. H 1 : > 0 Reject H0 if T t, n1 ⅱ. H 1 : < 0 Reject H0 if T t, n1 ⅲ. H 1 : 0 Reject H0 if T t / 2, n1 제 9 장가설검정경영통계학 16

제 3 절모평균에대한가설검정 예제 9-5 A 지역은지역내생산하는 4kg 쌀부대의실제무게를자체조사하기로결정하였다. 16 개의 4kg 쌀부대를대상으로조사한결과평균이 3.9kg이고표준편차가 0.4kg 으로조사되었다. 조사결과로부터쌀부대의무게가잘못표시되었다고할수있는지를유의수준 5% 에서가설검정을수행하시오. ( 단, 모집단은정규분포를가정한다.) 제 9 장가설검정경영통계학 17

제 3 절모평균에대한가설검정 예제 자동차부품회사의작년회계연도매출송장의평균금액이 42,000원이었다고한다. 금년도매출송장의평균금액을알기위하여 25개의송장을조사한후평균을계산하였더니 43,000원이었으며표준편차는 5,000원이었다. 금년도평균금액이작년에비하여증가하였다는가설을 5% 유의수준에서검정하시오. ( 단, 모집단은정규분포를가정한다.) 제 9 장가설검정경영통계학 18

제 3 절모평균에대한가설검정 유의확률 (p-value) 이란? 제 1 종오류를범할확률 [ 예제 ] 새로운전구생산공정에관한예. - 기존의공정으로생산한전구의수명은 450시간. - 새로운공정개발 전구수명 > 450시간. - 분산 = 360시간. / 분포는정규분포를따름. 가설 H 0 : = 450 H 1 : > 450 표본 n = 9 583, 518, 464,, 376 X = 490.67 Note. 만일새로운공정이효과가없다면새로운공정에서생산한전구의표본평균은 450에가까울것이다. 즉, X ~ N(450,360/9) 제 9 장가설검정경영통계학 19

제 3 절모평균에대한가설검정 유의확률 (p-value) 이란? P(X > 490.67) = P(Z > 2.03)= 0.0212 Interpretation of this probability 귀무가설이참인경우표본평균이 490.67 이상이될확률은 2.1% 이다. 즉, 이표본은평균이 450인모집단으로부터나왔을가능성이아주적다. 는것을나타냄 ( 관측된표본의결과가귀무가설을지지하는정도 ) 귀무가설이틀리다 는결론을내렸을때그판단이잘못되었을가능성이 0.0212 ( 제1종오류를범할확률 ) 유의확률이 0.0212 유의확률과유의수준을이용한의사결정 유의확률 (p-value) < 유의수준 (a) 인경우 H0를기각 (H1을채택 ) 검정통계량의값이기각역의범위에속하는경우 제 9 장가설검정경영통계학 20

제 3 절모평균에대한가설검정 유의확률 (p-value) 이란? 유의확률계산방법 ( 모분산 2 이알려져있는경우 ) ⅰ. H 1 : > 0 P value = ⅱ. H 1 : < 0 P value = P[ Z 0 ] / n x ⅲ. H 1 : 0 P value = 2P[ Z 0 ] / n 유의확률계산방법 ( 모분산 2 을모르는경우, 표본의크기가큰경우 ) ⅰ. H 1 : > 0 P value = ⅱ. H 1 : < 0 P value = ⅲ. H 1 : 0 P value = x P[ Z 0 ] / n x x 0 P[ Z ] S / n x 0 P[ Z ] S / n x 0 2P[ Z ] S / n 제 9 장가설검정경영통계학 21

제 3 절모평균에대한가설검정 유의확률 (p-value) 이란? 유의확률계산방법 ( 모분산 2 을모르는경우, 표본의크기가작은경우 ) ⅰ. H 1 : > 0 P value = ⅱ. H 1 : < 0 P value = ⅲ. H 1 : 0 P value = P[ T P[ T 2P[ T x S / S / 0 n x x S / ] 0 n 0 n ] ] 제 9 장가설검정경영통계학 22

제 3 절모비율에대한가설검정 가설 ⅰ. H 0 : p = p 0 ⅱ. H 0 : p = p 0 ⅲ. H 0 : p = p 0 H 1 : p > p 0 H 1 : p < p 0 H 1 : p p 0 검정통계량 Z 기각역 p 0 pˆ (1 p p ) / n ⅰ. H 1 : p > p 0 Reject H0 if ⅱ. H 1 : p < p 0 Reject H0 if ⅲ. H 1 : p p 0 Reject H0 if 유의확률계산방법은앞과동일함 0 0 Z z Z z Z z / 2 제 9 장가설검정경영통계학 23

제 3 절모비율에대한가설검정 예제 9-7 A 전자회사는자사의제품을구입한후다시자사의제품을재구매할소비자의비율은 60% 로파악하고있다. 이를확인하기위하여 500 명의소비자를대상으로제품의만족도를조사하였다. 이중재구매를답한소비자는 350명이었다. A제품의소비자중재구매할소비자의비율이증가되었다고할수있는가? 유의수준 1% 에서가설검정을수행하시오. 제 9 장가설검정경영통계학 24

제 10 장 두모집단에대한추론 - 강의목표 두모집단의특성에대한차이를표본을이용하여얻어진결과를통해서추측하고판단하는과정에대해이해함. 독립표본과상체표본에대한이해를한다. 엑셀을이용하여가설검정을수행하는방법을익힌다.

제 1 절두모집단의추론에관한기본개념 두모집단의추론이란? 모집단 1 모집단 2 분포분포모평균 = 모평균 = 1 2 모분산 = 2 모분산 = 2 1 2 모비율 = p1 모비율 = p2 제 10 장두모집단에대한추론 2

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 두모평균차에대한추정 모집단 1 정규분포모평균 = 1 모분산 = 2 1 1 2 모집단 2 정규분포모평균 = 2 모분산 = 2 2 세가지경우 모분산 2 2 1, 2 을아는경우 모분산 2 2 1, 2 을모르지만 2 2 1 2 인경우 표본 1 크기 = n1 표본평균 = X 1 X 1 X 2 표본 2 크기 = n2 표본평균 = X 2 표본분산 = 2 S 1 표본분산 = 2 S 2 제 10 장두모집단에대한추론 3

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 의표본분포특성 ( 모분산을아는경우 ) X 1 X 2 정규분포 NoTe 만약 를모르지만표본크기가충분히크다면 를 S 2 로대체할수있다. 1 2 에대한100(1-)% 신뢰구간 ( X 2 2 1 2 1 X 2) Z / 2, ( X 1 X 2) n1 n2 Z / 2 n 2 1 1 2 2 n 2 제 10 장두모집단에대한추론 4

제 10 장두모집단에대한추론 5 제 2 절두모집단의모평균에대한추론두모집단의평균비교 : 독립표본인경우 신뢰구간 ( 모분산을모르지만등분산 ( = ) 인경우 ) 통합표본분산 S p 를이용 1 2 에대한 100(1-)% 신뢰구간 2 1 2) / 2, ( 2 1 2 1 2) / 2, ( 2 1 1 1 ) (, 1 1 ) ( 2 1 2 1 n n S t X X n n S t X X p n n p n n 2 1) ( 1) ( 2 1 2 2 2 2 1 1 2 n n S n S n S p

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 두모평균차에대한가설검정 귀무가설 H0 : = 2 대립가설 H1 : - 2 > 0 ( > 2 ) H1 : - 2 < 0 ( < 2 ) H1 : - 2 0 ( 2 ) 세가지경우 모분산, 을아는경우 모분산, 을모르지만 = 인경우 제 10 장두모집단에대한추론 6

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 두모평균차에대한가설검정 ( 모분산, 을아는경우 ) 1 2 검정통계량은 z0 ( X1 X 2) / 이다. n n 2 1 2 2 기각역 ⅰ. H 1 : 1-2 > 0 Reject H0 if Z > z ⅱ. H 1 : 1-2 < 0 Reject H0 if Z < z ⅲ. H 1 : 1-2 0 Reject H0 if Z > z 유의확률 (P value) ⅰ. H 1 : 1-2 > 0 P value =P[Z>z 0 ] ⅱ. H 1 : 1-2 < 0 P value = P[Z<z 0 ] ⅲ. H 1 : 1-2 0 P value = 2P[Z> z 0 ] 제 10 장두모집단에대한추론 7

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 두모평균차에대한가설검정 ( 모분산, 을모르지만 = 인경우 ) 검정통계량은 t ( X1 X 2) / S p 이다. 기각역 ⅰ. H 1 : > 0 Reject H0 if t > t (n1+n2-2,) ⅱ. H 1 : < 0 Reject H0 if t < t (n1+n2-2,) ⅲ. H 1 : 0 Reject H0 if t > t (n1+n2-2,) n 1 n n 1 n 2 2 제 10 장두모집단에대한추론 8

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 두모평균차에대한가설검정 ( 모분산, 을모르지만 = 인경우 ) 유의확률 (P value) ⅰ. H 1 : > 0 P value =P[T>t 0 ] ⅱ. H 1 : < 0 P value = P[T<t 0 ] ⅲ. H 1 : 0 P value = 2P[T> t 0 ] 제 10 장두모집단에대한추론 9

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 예제 10-1 A 은행은마포지점과성북지점에서임의로각각 12 명과 10 명의성인가입자의은행잔고를조사한결과는아래와같다. 마포지점 : 1208, 983, 1037, 836, 978, 915, 996, 699, 1223, 1085, 1119, 921 성북지점 : 1081, 971, 1032, 886, 958, 1043, 734, 747, 906, 842 각지점의은행잔고는정규분포를따르며은행잔고의분산은같다고가정하자. 1) 두지점간의평균은행잔고의차에관한 90% 신뢰구간을구하시오. 2) 두지점예금자의평균은행잔고액에있어서유의한차이가있는지를유의수준 10% 에서가설검정하시오.. 제 10 장두모집단에대한추론 10

제 10 장두모집단에대한추론 11 제 2 절두모집단의모평균에대한추론두모집단의평균비교 : 독립표본인경우예제 10-1 1) 두지점간의평균은행잔고의차에관한 90% 신뢰구간을구하시오. 1 2 에대한 100(1-)% 신뢰구간 2 1 2) / 2, ( 2 1 2 1 2) / 2, ( 2 1 1 1 ) (, 1 1 ) ( 2 1 2 1 n n S t X X n n S t X X p n n p n n

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 예제 10-1 1) 두지점예금자의평균은행잔고액에있어서유의한차이가있는지를유의수준 10% 에서가설검정하시오. 가설설정 H0 : = 2 검정통계량 H1 : - 2 0 ( 2 ) t ( X 1 X 2) / S p n1 n n n 1 2 2 기각역 제 10 장두모집단에대한추론 12

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본 두모평균차에대한가설검정 ( 모분산, 을모르는경우 ) 예제 10-1 : 엑셀을이용한풀이 ( 자료는 A1:A13과 B1:B11에입력되어있음 ) Step 1 : 도구 (T) - 데이터분석 (D) - <t- 검정 : 등분산가정두집단 > 을클릭 제 10 장두모집단에대한추론 13

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본 두모평균차에대한가설검정 ( 모분산, 을모르는경우 ) 예제 10-1 Step2 t-검정 : 등분산가정두집단 대화상자에서필요한값을입력한다.. 제 10 장두모집단에대한추론 14

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본 두모평균차에대한가설검정 ( 모분산, 을모르는경우 ) 예제 10-1 Step 3 나타난결과를해석한다. p-value 제 10 장두모집단에대한추론 15

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 두모평균차에대한가설검정 ( 모분산, 을아는경우 ) 예제 한연구자는소프트웨어산업근로자와제조업근로자를대상으로평균지능지수를조사하였다. 두모집단은정규분포하며소프트웨어산업근로자지능지수의분산은 100, 그리고제조업근로자지능지수의분산은 144 였다. 이두모집단으로부터각각크기 25 와 16 인표본을서로독립적으로추출하여다음과같은표본자료를얻었다. < 표 10-1> 두산업별근로자의지능지수표본 1 ( 소프트웨어산업근로자의지능지수 ) 108 107 101 108 103 109 103 116 116 115 111 116 109 111 120 102 119 124 101 114 128 111 115 129 126 표본 2 ( 제조업근로자의지능지수 ) 116 98 94 89 124 99 114 114 99 89 110 117 99 94 92 117 (1) 두그룹의평균지능지수차에대한 95% 신뢰구간을계산하라. (2) 통념적으로소프트웨어산업근로자들의평균지능이높다고믿고있는데이런통념이타당한지조사하기위해 1% 유의수준에서두그룹근로자들의평균지능이같다는귀무가설을검정하라. 제 10 장두모집단에대한추론 16

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 두모평균차에대한가설검정 ( 모분산, 을아는경우 ) 예제 (1) 두그룹의평균지능지수차에대한 95% 신뢰구간을계산하라. 1 2 에대한100(1-)% 신뢰구간 2 2 1 ( X 2 1 X 2) Z 1 2 / 2, ( X X ) n 1 n2 Z / 2 n 2 1 1 2 2 n 2 (112.88 104.06) 1.96 100 144, 25 16 8.82 1.963.61, 8.82 1.96 3.61 8.82 7.07, 8.82 1.75, 15.89 7.07 (112.88 104.06) 1.96 100 144 25 16 제 10 장두모집단에대한추론 17

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본 두모평균차에대한가설검정 ( 모분산, 을아는경우 ) 예제 (2) 통념적으로소프트웨어산업근로자들의평균지능이높다고믿고있는데이런통념이타당한지조사하기위해 1% 유의수준에서두그룹근로자들의평균지능이같다는귀무가설을검정하라. Step 1 다. 자료를다음과같이워크시트에입력한 제 10 장두모집단에대한추론 18

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본 두모평균차에대한가설검정 ( 모분산, 을아는경우 ) 예제 Step 2 도구의데이터분석을실행하고대화상자에서 z-검정: 평균에대한두집단 을선택한다. 제 10 장두모집단에대한추론 19

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본 두모평균차에대한가설검정 ( 모분산, 을아는경우 ) 예제 Step3 z- 검정 : 평균에대한두집단 대화상자에서필요한값을입력한다. 제 10 장두모집단에대한추론 20

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본 두모평균차에대한가설검정 ( 모분산, 을아는경우 ) 예제 Step 4 나타난결과를해석한다. p-value 제 10 장두모집단에대한추론 21

제 2 절두모집단의모평균에대한추론 두모집단의평균비교 : 독립표본인경우 두모평균차에대한가설검정 ( 모분산, 을모르는경우 ) 두모집단의평균비교분석 독립표본인경우 대응표본인경우 분산의동일성검정수행 F- 검정 : 분산에대한두집단 t- 검정 : 대응비교 = t- 검정 : 등분산가정두집단 t- 검정 : 이분산가정두집단 제 10 장두모집단에대한추론 22

제 2 절두모집단의모평균에대한추론 독립표본과대응표본 예제 1 지역환경에따라학력에차이가있는지를알아보고자한다. 두도시의고등학교 1 학년학생중에서각각 150 명과 200 명을독립적으로랜덤추출 ( 독립표본 ) 동일한시험을시행 이때시험성적을비교함으로써두도시학생의학력을비교할수있다. 예제 2 새로운강의방식이초등학교 1 학년학생들의학습능력을향상시키는지알아보고자한다. 학습능력이비슷한학생끼리 2 명씩한조를이루게하여 30 개조를랜덤하게편성 ( 대응표본 ) 각조에서랜덤하게한명을선택하여새로운강의방식을적용시키고나머지한명은기존의방식으로강의 이때동일한시험의성적을비교함으로써새로운강의방식의효과를알아볼수있다. 제 10 장두모집단에대한추론 23

제 2 절두모집단의모평균에대한추론 대응비교 : 대응표본인경우 대응비교에서의자료구조 쌍 1 2 3... n 처리 1 X 1 X 2 X 3... X n 처리 2 Y 1 Y 2 Y 3... Y n 차이 D 1 D 2 D 3... D n D 1 2 에대한100(1-)% 신뢰구간 ( ) X Y ) t( n 1, / 2) SD / n, (( X Y )) t( n1, / 2 SD / n 단, 2 D S ( D D) /( n 1) i i 2 제 10 장두모집단에대한추론 24

제 2 절두모집단의모평균에대한추론 대응비교 : 대응표본인경우 가설검정 귀무가설 H0 : D = 0 대립가설 H1 : D > 0 H1 : D < 0 H1 : D 0 두가지경우 모분산 모분산 2 D 을아는경우 2 D 을모르는경우 검정통계량 t X Y SD / n 기각역 ⅰ. H1 : D > 0 Reject H0 if t > t (n-1, ) ⅱ. H 1 : D < 0 Reject H0 if t < t (n-1, ) ⅲ. H 1 : D 0 Reject H0 if t > t (n-1, ) 제 10 장두모집단에대한추론 25

제 2 절두모집단의모평균에대한추론 대응비교 : 대응표본인경우 유의확률 (P value) ⅰ. H1 : D > 0 P value =P[T>t 0 ] ⅱ. H 1 : D < 0 P value = P[T<t 0 ] ⅲ. H 1 : D 0 P value = 2P[T> t 0 ] 제 10 장두모집단에대한추론 26

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 [ 예제 2] 표 10-1에주어진자료에대하여 1) D 에관한 95% 신뢰구간을구하시오. 2) 방법1 과방법2에관하여유의한차이가있는지를유의수준 5% 에서가설검정하시오. < 표 10-1> 방법1과방법2를통한임무완수까지의소요시간 ( 단위 : 분 ) 근로자 소요시간 ( 방법 1 사용 ) 소요시간 ( 방법 2 사용 ) 소요시간차이 1 2 3 4 5 6 6.0 5.0 7.0 6.2 6.0 6.4 5.4 5.2 6.5 5.9 6.0 5.8 0.6-0.2 0.5 0.3 0.0 0.6 제 10 장두모집단에대한추론 27

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 [ 예제 2] 표 10-1에주어진자료에대하여 1) D 에관한 95% 신뢰구간을구하시오. 제 10 장두모집단에대한추론 28

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 [ 예제 2] 표 10-1에주어진자료에대하여 2) 방법1 과방법2에관하여유의한차이가있는지를유의수준 5% 에서가설검정하시오. 제 10 장두모집단에대한추론 29

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 대응비교 : 대응표본인경우 [ 예제 ] 어느과학자는휘발유에자신이개발한새로운첨가제를넣을경우에주행거리를증가시킨다고주장하였다. 이를확신하기위하여 10종류의자동차에대하여실험을실시한결과 1리터당주행거리가다음과같았다. 차번호 1 2 3 4 5 6 7 8 9 10 사용전 11.5 15.8 20.3 18.2 25.3 09.8 14.8 16.0 16.4 13.5 사용후 12.3 15.5 23.2 19.5 28.1 10.2 16.2 15.8 16.5 14.4 위의자료를바탕으로평균차이에대한 95% 신뢰구간을구하시오. 제 10 장두모집단에대한추론 30

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 대응비교 : 대응표본인경우 [ 예제 ] Step 1 자료입력및차이의계산 =A2-B2 제 10 장두모집단에대한추론 31

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 대응비교 : 대응표본인경우 [ 예제 ] Step 2 도구-데이터분석을선택한후대화상자에서기술통계법선택 제 10 장두모집단에대한추론 32

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 대응비교 : 대응표본인경우 [ 예제 ] Step 3 기술통계법대화상자에서필요한값을입력 제 10 장두모집단에대한추론 33

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 대응비교 : 대응표본인경우 [ 예제 ] Step 4 기술통계법결과를이용하여신뢰하한과상한을계산 =F4-F17 =F4+F17 제 10 장두모집단에대한추론 34

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 대응비교 : 대응표본인경우 [ 예제 ] 어느과학자는휘발유에자신이개발한새로운첨가제를넣을경우에주행거리를증가시킨다고주장하였다. 이를확신하기위하여 10종류의자동차에대하여실험을실시한결과 1리터당주행거리가다음과같았다. 차번호 1 2 3 4 5 6 7 8 9 10 사용전 11.5 15.8 20.3 18.2 25.3 09.8 14.8 16.0 16.4 13.5 사용후 12.3 15.5 23.2 19.5 28.1 10.2 16.2 15.8 16.5 14.4 위의자료를바탕으로, 이과학자의주장을받아들일만한뚜렷한증거가있는지를유의수준 5% 에서검정하시오. 가설설정 귀무가설 H0 : D = 0 ( 차이가없다 ) 대립가설 H1 : D < 0 ( 첨가제사용후주행거리증가 ) 제 10 장두모집단에대한추론 35

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 [ 예제 ] 대응비교 - 엑셀을이용한수행절차및결과분석 단계 1> 자료를입력한다. 제 10 장두모집단에대한추론 36

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 [ 예제 ] 대응비교 - 엑셀을이용한수행절차및결과분석 단계 2> 메뉴에서 [ 도구 (T)] [ 데이터분석 (D)] 을선택한다. [ 통계데이터분석 ] 대화상자가나타나면 [t-검정: 대응비교 ] 를선택하고 [ 확인 ] 버튼을클릭한다. 제 10 장두모집단에대한추론 37

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 [ 예제 ] 대응비교 - 엑셀을이용한수행절차및결과분석 단계 3> [t-검정: 대응비교 ] 대화상자가나타나면다음과같이검정을위한자료의입력범위및출력범위를지정하고 [ 확인 ] 버튼을누른다. 제 10 장두모집단에대한추론 38

제 2 절두모집단의모평균에대한추론 엑셀을이용한두모집단의평균비교분석 [ 예제 ] 대응비교 - 엑셀을이용한수행절차및결과분석 단계 4> 다음과같은검정수행결과를확인할수있다. 유의확률 (p-value) = 0.009 < 유의수준 (0.05) 이므로 H0 를기각한다. 즉첨가제를사용한후주행거리가증가했다고할수있다. 제 10 장두모집단에대한추론 39

숙제 9.5 9.9 9.12 10.4 10.6 10.9 Excel) p.332~p.342 Due: ~ 12/2

제 11 장회귀분석 학습목표 변수들사이의인과관계를파악하는방법 산점도와상관계수 를습득한다. 두변수사이의관계를나타내는수학식을구하고해석하는방법 ( 회귀분석 ) 에대해학습한다. 주어진자료에대하여회귀분석을실시하기위하여엑셀을이용하는방법과얻어지는결과를해석하는방법을학습한다. 제 11 장회귀분석

제 11 장회귀분석 목차 제1절산점도와상관분석 제2절단순선형회귀모형 제3절엑셀도구를이용한회귀분석 제4절다중회귀분석 제 11 장회귀분석

제 1 절산점도와상관분석 아파트단지세대수와분기제 1 사분기매출액 표본번호 1 2 3 4 5 6 7 8 9 10 세대수 (X) ( 단위 : 1000 세대 ) 2 6 8 8 12 16 20 20 22 26 분기매출액 (Y) ( 단위 : 백만원 ) 58 105 88 118 117 136 156 168 146 202 제 11 장회귀분석

제 1 절산점도와상관분석 산점도 관측순서에따른두값을좌표로해서작성된그림 ( 엑셀의차트마법사로작성 ) 제 11 장회귀분석

제 1 절산점도와상관분석 상관계수 35 35 30 25 ρ=+1 30 25 ρ=-1 20 20 15 15 10 10 5 5 0 35 0 5 10 15 20 0 30 0 5 10 15 20 30 25 25 20 15 10 5 ρ=-0.8 20 15 10 5 ρ=+0.8 0 0 5 10 15 20 0 0 5 10 15 20 제 11 장회귀분석

제 1 절산점도와상관분석 산점도 산점도를해석하는방법 관계가없는경우의산점도 Y 30 25 20 15 10 5 0 0 2 4 6 8 X 제 11 장회귀분석

제 1 절산점도와상관분석 상관계수 상관계수란? 상관계수의성질 1. 상관계수 ρ는 -1과 1사이의값을갖는다. 2. ρ=+1이면, 두변수 X와 Y는완전한양의선형관계에있음을의미한다. 즉, 임의의상수 a와 b에대하여 Y=a+bX가성립한다. 3. ρ=-1이면, 두변수 X와 Y는완전한음의선형관계에있음을의미한다. 즉, 임의의상수 a와 b에대하여 Y=a-bX가성립한다. 4. 두변수 X와 Y가서로통계적으로독립이면 ρ=0이다. 그러나 ρ=0이라고해서두변수는서로독립이라고할수는없다. 5. ρ가 +1이나 -1에가까울수록두변수 X와 Y 사이에는밀접한관계가있다고할수있다. 제 11 장회귀분석

제 1 절산점도와상관분석 상관계수 표본상관계수 r X 2 XY nxy nx 2 Y 2 ny 2 예제 11-1 다음은자료에대하여표본상관계수를구하고두변수사이의선형관련성을평가하여라. x y xy x*x y*y 7 10 15 10 30 50 32 90 제 11 장회귀분석

제 1 절산점도와상관분석 선형관련성과비선형관련성 제 11 장회귀분석

제 1 절산점도와상관분석 엑셀을이용한상관계수의계산 제 11 장회귀분석

제 2 절단순선형회귀모형 아파트단지세대수와분기제 1 사분기매출액 표본번호 1 2 3 4 5 6 7 8 9 10 세대수 (X) ( 단위 : 1000 세대 ) 2 6 8 8 12 16 20 20 22 26 분기매출액 (Y) ( 단위 : 백만원 ) 58 105 88 118 117 136 156 168 146 202 세대수와매출액의관계를가장잘나타낼수있는수학식을그린다면 제 11 장회귀분석

제 2 절단순선형회귀모형 종속변수와독립변수 독립변수 : 변수의변화가다른변수에영향을주는경우이를독립변수또는설명변수라함. 종속변수 : 다른변수에의하여영향을받는변수, 반응변수 예 : IQ 와수학성적, 광고비와매출액 회귀분석 (Regression Analysis) 란? 주어진변수 ( 종속변수 ) 와다른변수들 ( 독립변수 ) 간의관련성을기술하고평가하는방법 제 11 장회귀분석

제 2 절단순선형회귀모형 단순선형회귀모형 여기서 Y = 0 + 1 X + Y 는우리가설명하고자하는변수인종속변수, X 는독립변수 은오차항혹은교란항 (disturbance term) 이때독립변수 X 는종속변수 Y 를설명하는변수로주어진상수로취급하며, 절편 0 과기울기 1 은독립변수에의해종속변수를설명하기위한모수인회귀변수 (regression coefficient) 를각각나타낸다. 제 11 장회귀분석

제 2 절단순선형회귀모형 단순선형회귀모형의가정 1. Y와 X간의관계는일차선형함수이다. 2. 독립변수 X의값은주어진상수이다. 3. 오차항 ε은서로독립이고평균 0과고정된분산 s 2 을갖는정규분포를따른다. 제 11 장회귀분석

제 2 절단순선형회귀모형 단순선형회귀모형의다양한형태 추정된회귀식 Y = b 0 + b 1 X 제 11 장회귀분석

제 2 절단순선형회귀모형 단순선형회귀모형의추정절차 제 11 장회귀분석

제 2 절단순선형회귀모형 단순선형회귀모형의회귀계수추정 ˆ Yi b0 b1 X i i ˆ Yi Yi Yi b0 b1 잔차 X i 제 11 장회귀분석

제 11 장회귀분석제 2 절단순선형회귀모형 단순선형회귀모형에서회귀계수 (b 0 과 b 1 ) 의추정 b 0 과 b 1 을각각 b 0 과 b 1 의추정값 : Y i 의예측값 잔차 잔차의제곱합을가장적게하는 b 0 과 b 1 을구하는기준 최소자승법 (method of least squares) & i X i b b Y 1 0 ˆ i i i i i X b b Y Y Y 1 0 ˆ ) ( ) ( 1 2 1 0 1 2 잔차제곱합 n i i i n i i X b b Y 2 2 1 nx X nxy Y X b i i i X b Y b o 1

제 2 절단순선형회귀모형 [ 예제 11-2] < 표 11-1> 의세대수와분기매출액자료에대한회귀모형을설정하고, 최소제곱법에의하여회귀선을구하시오 표본 x y x*x y*y xy 1 2 58 4 3,364 116 2 6 105 36 11,025 630 3 8 88 64 7,744 704 4 8 118 64 13,924 944 5 12 117 144 13,689 1,404 6 16 136 256 18,496 2,176 7 20 156 400 24,336 3,120 8 20 168 400 28,224 3,360 9 22 146 484 21,316 3,212 10 26 202 676 40,804 5,252 합계 140 1,294 2,528 182,922 20,918 b 1 XiY 2 X i i nxy nx b o Y b 1 X 2 제 11 장회귀분석

제 2 절단순선형회귀모형 결정계수란? 전체차이 ( Y i Y ) 회귀모형에의해설명되지못한차이 Y Yˆ ) ( i i 회귀모형에의해설명된차이 ( Yˆ i Y ) Y 2 2 ( Y i Y ) = ( Yˆ i Y ) + Y i Yˆ ) ( i 총변동 = 회귀모형에의해설명된변동 + 회귀모형에의해설명되지않은변동 SST = SSR + SSE 2 제 11 장회귀분석

제 2 절단순선형회귀모형 결정계수란? 결정계수 = 회귀모형에의해설명된변동총변동 = SSR SST 이러한결정계수는 0 과 1 사이의값을가지며 1 에가까운값을가질수록추정회귀직선이자료에잘적합되는것으로평가한다. 예제 11-3 에서추정된회귀직선에대한결정계수를구하고, 추정된회귀직선이주어진자료에적합한지평가하시오 제 11 장회귀분석

제 2 절단순선형회귀모형 엑셀의산점도에서추정회귀선구하기 0 단계 : 자료를이용하여산점도를작성한다. 1단계 : 마우스를산점도위의임의의점에위치시키고오른쪽버튼을클릭하고나타난메뉴중에서추세선추가를선택한다. 2단계 : 추세선대화상자에서 - < 종류 > 탭을선택하고추세 / 회귀유형을선형으로선택하고 - < 옵션 > 탭을선택하고 ' 수식을차트에표시 ' 및 R-제곱값을차트에표시 를선택한한후 - < 확인 > 단추를누른다. 제 11 장회귀분석

제 2 절단순선형회귀모형 엑셀의산점도에서추정회귀선구하기 제 11 장회귀분석

제 2 절단순선형회귀모형 엑셀의산점도에서추정회귀선구하기 제 11 장회귀분석

제 2 절단순선형회귀모형 엑셀을이용한추정회귀선계산 제 11 장회귀분석

제 3 절엑셀도구를이용한회귀분석 세대수와분기매출액자료를이용한회귀분석 제 11 장회귀분석

제 3 절엑셀도구를이용한회귀분석 세대수와분기매출액자료를이용한회귀분석 Step 1 < 데이터 >-< 데이터분석 > 을선택한후회귀분석을선택한다. 제 11 장회귀분석

제 3 절엑셀도구를이용한회귀분석 Step 2 입력대화상자에서필요한값을입력한다. 제 11 장회귀분석

제 3 절엑셀도구를이용한회귀분석 Step 3 결과를해석한다. Y = 60.3366 + 4.9331 X 제 11 장회귀분석

상관계수 상관계수 : 가설검정

상관계수 상관계수 : 가설검정 : 예제

상관계수 상관계수 : 가설검정 : 예제

상관계수 상관계수 : 가설검정 : 예제

모분산에대한추정 정규모집단의모분산추정

모분산에대한추정 정규모집단의모분산추정

모분산에대한가설검정 정규모집단의모분산검정

두모집단의모분산의비에대한추정과가설검정 두정규모집단의분산의비에대한추정

두모집단의모분산의비에대한추정과가설검정 두정규모집단의분산의비대한검정

분산분석 분산분석의정의 - 분산분석 (ANOVA:analysis of variance) -3 가지이상의모집단평균을비교하는통계적방법 - 요인 (factor) - 모집단간평균의차이를유발하는변수 - 처리 (treatment) - 요인의수준또는요인들의수준조합 - 일원분산분석 (one way ANOVA) - 1 가지의요인에대해비교하는분산분석 - 이원분산분석 (two way ANOVA) - 2 가지요인에대해비교하는분산분석

분산분석 - 일원배치 분산분석의정의 : 일원배치법 : 표본의구성과모형

분산분석 - 일원배치 분산분석의정의 : 일원배치법 : 표본의구성과모형

분산분석 - 일원배치 분산분석의정의 : 일원배치법 : 표본의구성과모형

분산분석 - 일원배치 분산분석의정의 : 일원배치법 : 표본의구성과모형

분산분석 - 이원배치 이원배치법 : 정의

분산분석 - 이원배치 이원배치법 : 예제

분산분석 - 이원배치 이원배치법 : 예제

분산분석 - 이원배치 이원배치법 : 예제