Microsoft PowerPoint - SBE univariate5.pptx

Similar documents
Microsoft Word - SAS_Data Manipulate.docx

확률과통계6

Microsoft Word - EDA_Univariate.docx

statistics

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

슬라이드 1

Microsoft PowerPoint - LN05 [호환 모드]


Microsoft PowerPoint - PDF3 SBE pptx

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

확률 및 분포

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

Contents 확률분포 (probability distribution) 이항분포 (binomial distribution) 초기하분포 (hypergeometric distribution) 포아송분포 (poisson distribution) 2

Microsoft Word - Ch2_Function_math.docx

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

R t-..

기술통계

untitled

Microsoft PowerPoint - IPYYUIHNPGFU

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

10. ..

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

nonpara1.PDF

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

Microsoft Word - Chapter4.doc


모수검정과비모수검정 제 6 강 지리통계학

... —....—

수리통계학

Microsoft PowerPoint - Stat03_Numerical technique(New) [Compatibility Mode]

(001~006)개념RPM3-2(부속)

untitled

마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다.

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]


<B1B3C0B0B0FAC1A45FC3E2B7C22E687770>

G Power

MS_적분.pages


고객관계를 리드하는 서비스 리더십 전략

untitled

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞

자료의 이해 및 분석

05 ƯÁý

歯ki 조준모.hwp

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

01

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선



저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

hwp


3.2 함수의정의 Theorem 6 함수 f : X Y 와 Y W 인집합 W 에대하여 f : X W 는함수이다. Proof. f : X Y 가함수이므로 f X Y 이고, Y W 이므로 f X W 이므로 F0이만족된다. 함수의정의 F1, F2은 f : X Y 가함수이므로

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

Microsoft Word - Chapter6.doc


목차 1. 통계학이란무엇인가? 2. 통계학의응용분야 3. 통계학의분야들 4. 강의소개 5. 그리고..

PowerPoint 프레젠테이션

= ``...(2011), , (.)''

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

... —... ..—

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표


국가기술자격 재위탁 효율성 평가

경영학석사학위논문 투자발전경로이론의가설검증 - 한국사례의패널데이타분석 년 8 월 서울대학교대학원 경영학과국제경영학전공 김주형

untitled

통계학입문

PowerPoint 프레젠테이션

Microsoft Word - skku_TS2.docx

.4 편파 편파 전파방향에수직인평면의주어진점에서시간의함수로 벡터의모양과궤적을나타냄. 편파상태 polriion s 타원편파 llipill polrid: 가장일반적인경우 의궤적은타원 원형편파 irulr polrid 선형편파 linr polrid k k 복소량 편파는 와 의

untitled

Microsoft Word - EDA_Univariate.docx

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

untitled

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

..(..) (..) - statistics

확률과통계4


<4D F736F F F696E74202D20C5EBB0E8C0FB20B0F8C1A4B0FCB8AEBFE4BEE02E >

한국보건사회연구원통계학및계량경제학의기초및응용 강의노트 2017 년 4 월 5 월 통계학 : 통계적추론 (Statistical Inference) I. 들어가며 이제통계학에서가장중요한토픽이라고할수있는통계적추론에대해서본격적으로공부를해보도록하겠습니다. 통계적추론을통해연구와관

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

MATLAB and Numerical Analysis

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D>

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

PowerPoint 프레젠테이션

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):


nonpara6.PDF


yscec.yonsei.ac.kr Useful information 통계학입문 2013 년겨울학기 v 교수 : 정보통계학과박동권교수 v v 연구실 : 창조관 153호 / 교내 2247 v v Pdf file 은정보통

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

제 8 장. 통계적추정 개요 : 통계적추정 ( 추론 ) 은모집단에서추출된표본의정보로모집단에대한값의추측또는그값에대한확신을결정하는과정이며다음의두단계가있다. 2 통계적추정 (statistical estimation): 모수인평균 ( m), 분산 ( s ), 표준편차 ( s

Microsoft Word - Software_Ch2_FUNCTION.docx

Transcription:

이상치 (outlier) 진단및해결 Homework 데이터 ( Option.XLS) 결과해석 치우침? 평균이중앙값에비해다소크다. 그러나이상치때문이지치우친것같지않음. Toys us 스톡옵션비율이이상치 해결방법 : Log 변환? 아니다치우쳐있지않기때문에제거 제거후 : 평균 :.74, 중위수 :.7 31

치우침과이상치 데이터 : 노트북평가점수 우로치우침과이상치가존재 해결방법 이상치먼저제거그후우로치우침해결 ( 신뢰구간좁다 ) log 변환, 변환 좌로치우침 : X, X 3 변환 우로치우침해결후이상치제거 ( 모든관측치사용 ) 3

치우침과이상치진단효과 LOG 변환먼저 변환후에도치우침존재. 이상치먼저제거 여전히치우침존재 LOG 변환하자. 평균추정치 : 79.6 95% 구간 : (77.4, 81.8) 평균추정 : 78.9 95% 신뢰구간 : (77.1, 80.6) 33

평균과중앙값 중앙개념 평균보다중앙값 (median) 이더좋다 이상치, 치우침에영향을받지않는다. 치우침이나이상치가있는경우평균 절사평균k-배절삭평균 (k-times trimmed mean) 은큰값k개, 적은값 k 개를제외하고평균을구한다. 왜평균인가? 중심극한정리에의해확률밀도함수를구할수있다. 확률 ( 유의확률 ) 을계산할수있으므로통계적가설검정가능 중심극한정리 (Central Limit Theorem) 모집단의분포와관계없이표본의크기 (n) 가크면 (n>0) 표본평균의분포는정규분포에근사한다. Winsorized Mean: k-배윈저화평균 (k-times winsorized mea n) 은큰값k개, 적은값 k개를바로옆의값으로대체하여평균을구한다. 모집단 ~f(x) σ X ~ N( μ, ) as n n 표본데이터 (x 1, x,, x n ) 표본평균 X In SPSS 5%( 총 10%) 절삭평균출력한다. 분석 (A) 기술통계량 (E) 데이터분석 (E) 표본분포 ~f(x) 이상치, 치우침제거효과가있음. 34

평균과표준편차 평균은표준편차와함께사용 ( X, s) 단위가같고, 실증적법칙에의해 CV ( 변동계수 ) 측정단위나관측대상이서로다른두집단의분산을비교하는경우편차의단위를같게할필요가있다. 이를위하여표준편차를평균으로나눈값에 100 을곱한값을변동계수 (CV: Coefficient of Variation) 라하고상대변동 ( 분산 ) 개념으로정의하고있다. s CV = 100(%) x Empirical rule 데이터의분포가좌우대칭 ( 종모양 ) 이면다음이성립한다. 범위 ( 평균 ±s) 에데이터 68% 범위 ( 평균 ±s) 에데이터 95% 범위 ( 평균 ±3s) 에데이터대부분 (99%) 고등학교 3 학년인 A 학생과 B 학생의공부습관을조사하여한달간조사하여 A학생은평균 3시간, 표준편차는 0.5, B 학생은 6시간표준편차0.8인결과를얻었다. 어느학생이더꾸준히공부하는습관을가지고있을까? 이에대한답을위해변동계수를계산하면된다. 다음의계산결과 B 학생이더꾸준히공부하는습관을가지고있다고결론지을수있다. Chevyshev s Theorem 데이터의분포가 ( 평균 ±k*s) 범위안에는적어도터가있다. 1 1/ k 데이 35

확률밀도함수와이산형확률분포함수 확률변수 확률실험이나조사, 관측에서측정될수있는값에실수를대응시킨함수로 X로표현, X=X(s), 즉실험결과의숫자표현 ( 이산형 : 예 )X= 주사위눈금, 교통사고건수 ( 연속형 : 예 )X= 키, IQ, 측정오차 확률밀도함수 확률변수 X(x- 축 ) 와그에대응하는확률 (p(x), f(x): y- 축 ) 을그래프, 표, 혹은수식 ( 예 ) 여자 3명, 남자 3명이지원했다. 무작위로 명을선발할때선발될남자의수를확률변수라정의하자. 확률변수의확률밀도함수를구하시오. 이산형확률밀도함수 ( 확률계산가능 ) 확률분포표 베르누이분포 (Bernoulli distribution) B(p) 베르누이시행 실험결과가두개 ( 성공 / 실패 ), 성공확률 p, 서로독립 이항분포 (Binomial) B(n, p) n 번의베르누이시행에서성공의회수 기하분포 (Geometric) G(p) 성공을한번하는데시행하는베르누이시행회수 음이항분포 (Negative Binomial) NB(r, p) 성공을 r번하는데시행하는베르누이시행회수 포아송분포 (Poisson) P(λ) 단위시간, 면적에서임의의사건성공회수에관심을갖는경우를생각하자. 한남대앞정류장에도착하는버스수 ( 시간당 ), 한페이지당오타숫자, 은행창구를찾는고객수 (10분당) 36

연속형확률분포함수 연속형확률분포함수? 확률분포표 데이터히스토그램의정상을연결하면확률분포함수가된다. 이를이용하여데이터 ( 표본 ) 의분포 ( 이는모집단의분포와동일 ) 를구하게된다. 그러나함수를구하는것은불가능해보인다. 그래서현실에서는확률분포를가정하게된다. ( 예 ) 기다리는시간 : 지수분포, 측정오차 : 정규분포 Gauss( 천문학자 ): 행성들간거리측정오차의히스토그램에서정규분포 (normal distribution) 유도 연속형확률변수와이산형확률변수연결확률변수관계 이항분포의정규분포근사 n이커짐에따라 B(n, p)->normal (np, npq) 일반적근거 : min(np, npq) 가적어도 5 이상 Continuity Correction: ( 예1)P(X>=3: 이항분포 )P(X )=P(X>.5: 정규분포 ) ( 예)P(X<=: 이항분포 )=P(X<.5: 정규분포 ) ( 예3)P(<X<=5: 이항분포 )=P(.5<X<5.5: 정규분포 ) 포아송분포와지수분포 X ~ N( μ, σ ) Z = X ~ iidn( μ, σ ) Z ~ iidn(0,1) N (0,1) χ ( m) / m χ ( m1 ) / m χ ( m ) / m 1 k ~ t( m) ~ F( m, m X μ ~ N(0,1) σ X ~ N( μ, σ ) Z ~ χ ( k) 1 ) Exponential(1/ λ) Poisson(λ) 단위시간당사람이오는회수 : Poisson 분포 다음사람이오는데걸리는시간 : Exponential 분포 m 사람이오는데걸리는시간 : Gamma 분포 37

지수분포생성 지수분포 (exponential distribution) ~Exp(β) 균일 (Uniform distribution) 분포 : U ~ Uniform(0,1) 지수분포 ( 평균이 λ인 ) 의누적확률분포함수 : F( X ) =1 e F는균일분포를따른다는성질을이용하여 x 균일분포생성 in Excel λ 1 e = U X = λ ln(1 U ) x λ 감마 (Gamma) 분포 ~Gamma(α, β) 지수분포를따르는서로독립인확률변수의 r개합 카이스퀘어 (χ ) 분포 (Chi-square) ~ χ (r) α=r/, β 인감마분포 베타 (Beta) 분포 ~ Beta(α, β) X~ 감마분포 (α, m), Y~ 감마분포 (β,m) (X+Y)/X ~ Beta(α, β) 38