R t-..

Similar documents
G Power

R

Jeeshim & KUCC625 (08/04/2009) Statistical Data Analysis Using R:22 6. 집단간평균비교 집단간평균을비교하는것은기본방법이다. 따라서비교할변수는평균을계산할수있어야하고, 의미있게해석할수있어야한다. 두집단

Microsoft PowerPoint - IPYYUIHNPGFU

슬라이드 1

자료의 이해 및 분석

고객관계를 리드하는 서비스 리더십 전략

R Cookbook

모수검정과비모수검정 제 6 강 지리통계학

untitled

statistics

<C5EBB0E8C0FBB0A1BCB3B0CBC1F5C0C7C0FDC2F7BFCDB9AEC1A6C1A1B1D7B8AEB0EDB4EBBEC E687770>

F6-Á¤´ä

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

텀블러514

2003report hwp

스무살, 마음껏날아오르기위해, 일년만꾹참자! 2014학년도대학수학능력시험 9월모의평가 18번두이차정사각행렬 가 를만족시킬때, 옳은것만을 < 보기 > 에서있는대로고른것은? ( 단, 는단위행렬이다.) [4점] < 보기 > ㄱ. ㄴ. ㄷ. 2013학년도대학수학능력시험 16번

methods.hwp

연속형 자료분석 R commander 예제

<B0A3C3DFB0E828C0DBBEF7292E687770>

국가기술자격 재위탁 효율성 평가

PowerPoint 프레젠테이션

Microsoft Word - Chapter9.doc

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

10. ..

Microsoft PowerPoint - e pptx

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

DBPIA-NURIMEDIA

확률과통계 강의자료-1.hwp

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

... —... ..—

Chapter 7 분산분석

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

untitled

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

R R ...

제 8 장. 통계적추정 개요 : 통계적추정 ( 추론 ) 은모집단에서추출된표본의정보로모집단에대한값의추측또는그값에대한확신을결정하는과정이며다음의두단계가있다. 2 통계적추정 (statistical estimation): 모수인평균 ( m), 분산 ( s ), 표준편차 ( s

PowerPoint Presentation

PowerPoint 프레젠테이션

Microsoft Word - EDA_Univariate.docx

Survey Analyst 2012 년하반기사회조사분석사 2 급필기 제 1 과목조사방법론 1 1. 다음중일반적으로가장높은응답률을확보할수있는조사방법은? 2. 다음중우편조사의특성과가장거리가먼것은? 3. 연구방법으로서의연역적접근법과귀납적접근법에관한설명으로틀린것은? 4. 참여

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt


Chapter 11 비모수 및 무분포통계학

Microsoft PowerPoint - PDF3 SBE pptx

(001~006)개념RPM3-2(부속)

012임수진

01


<5BB0F8B0F8BFECC6ED5D20C3D6C1BEBAB8B0EDBCAD5F BFCF292E687770>

<31372DB9DABAB4C8A32E687770>

= ``...(2011), , (.)''

Chapter 7 분산분석

제 4 장회귀분석

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞

제 1 부 연구 개요

Microsoft PowerPoint - SBE univariate5.pptx

2020 학년도랑데뷰실전모의고사문제지 - 시즌 3 제 1 회 제 2 교시 수학영역 ( 나형 ) 1 5 지선다형 3. 그림은함수 를나타낸것이다 학년도 9월모의평가나형과싱크로율 99% 학년도수학영역대비랑데뷰실전모의고사가형-시즌1~ 시즌6, 나형-시즌

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

92 이창석 유성연 한기주 차재형 전의찬 었으나, 최근각국의정권교체에따른녹색성장과신재생에너지에대한관심하락및셰일가스의등장으로인해신재생에너지분야의성장세가주춤했다. 더불어중국태양광기업들의시장지배력확대및저가물량공급으로인해한국태양광기업은선진국태양광기업에게는기술력이밀리고, 중국태

untitled

KH100¼³¸í¼�

PowerPoint 프레젠테이션

슬라이드 1

nonpara1.PDF

<B1B3C0B0B0FAC1A45FC3E2B7C22E687770>

Chapter 7 분산분석

DBPIA-NURIMEDIA

(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰

Microsoft PowerPoint Relations.pptx

abstract.dvi

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

속지-7.21

hwp

통계자료분석강희모 2013 년 11 월 29 일

PPT Template

<3137B9DABAB4C8A E687770>

Microsoft PowerPoint - 26.pptx


<BCF6B8AEBFB5BFAA28B0A1C7FC295FC2A6BCF62E687770>

제 출 문 환경부장관 귀하 본 보고서를 폐기물관리 규제개선 방안연구 에 관한 최종보고서로 제출합니다 연구기관 한국산업폐기물처리공제조합 연구책임자 연 구 원 연구보조원 이 남 웅 황 연 석 은 정 환 백 인 근 성 낙 근 오 형 조 부이사장 상근이사 기술팀장 법률팀장 기

?

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

* ** *** ****

<B0A3C1F62E687770>

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

Microsoft Word - SAS_Data Manipulate.docx

분산분석.pages

데이터정규성 이문서에서는이러한조건이실제로일원분산분석과어떤관계가있는지조사하고보조 도구에서해당조건을확인하기위한가이드라인을정한방법에대해설명합니다. 일원분산분석 2

27 2, 1-16, * **,,,,. KS,,,., PC,.,,.,,. :,,, : 2009/08/12 : 2009/09/03 : 2009/09/30 * ** ( :

DBPIA-NURIMEDIA

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

Survey Analyst 2013 년 1 회사회조사분석사 2 급필기 제 1 과목조사방법론 1 1. 질문지문항작성원칙에부합하는질문을모두짝지은것은? 2. 연역법과귀납법에관한설명으로옳은것은? 3. 설문조사에관한옳은설명을모두짝지은것은? 제공카페 : Daum 사회조사분석사 G

380 Hyun Seok Choi Yunji Kwon Jeongcheol Ha 기존 선행연구에서는 이론연구 (Ki, 2010; Lee, 2012), 단순통계분석 (Lee, 2008), 회귀분석 (Kim, 2012)과 요인분석 (Chung, 2012), 경로분석 (Ku,

설계란 무엇인가?

집단의효과 ( 모평균에대한오차, j는오차. 모수모형에서 a 0 (. 변수모형에서 ( a 0 (.3..3 실험순서에의한분류 모든실험의순서를임의로행하는것 ( 완전확률화실험 과일부만임의로하는분할법 (splt-plot desgn 의두가지가있다...4 실험 동일한실험에서비교및검

통계분석가이드라인 통계 (Statisitcs) 란? Second Language in Science 전남대학교치의학전문대학원임회정 1 2 모집단 (Population) 과표본 (Sample) 통계분석단계 Sampling 추정 1. 귀무가설수립 2.

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

Transcription:

R 과데이터분석 집단의차이비교 t- 검정 양창모 청주교육대학교컴퓨터교육과 2015 년겨울

t- 검정 변수의값이연속적이고정규분포를따른다고할때사용 t.test() 는모평균과모평균의 95% 신뢰구간을추청함과동시에가설검증을수행한다.

모평균의구간추정 - 일표본 t- 검정 이가설검정의귀무가설은 모평균이 0 이다 라는귀무가설이다. > x <- rnorm(30) > t.test(x) One Sample t-test data: x t = -0.87719, df = 29, p-value = 0.3876 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -0.5858220 0.2341414 sample estimates: mean of x -0.1758403

모평균의구간추정 - 일표본 t- 검정 다른정규분포의모평균에대한귀무가설은 mu 를이용해지정해 주면수행할수있다. > x <- rnorm(30, mean = 10) > t.test(x, mu = 10) One Sample t-test data: x t = 0.28387, df = 29, p-value = 0.7785 alternative hypothesis: true mean is not equal to 10 95 percent confidence interval: 9.672189 10.433475 sample estimates: mean of x 10.05283

모평균의구간추정 - 일표본 t- 검정 예 ) 소비자만족도조사 > ans <- c(75, 63, 49, 86, 53, 80, 70, 72, 81, 80, 69, 59, 60, + 76, 85, 95, 66, 77, 77, 63, 58, 74, 68, 90, 82)

모평균의구간추정 - 일표본 t- 검정 예 ) 소비자만족도조사 표본이정규분포를이루는모집단에서추출된것임을 shapiro.test(vector) 함수를사용하여검정 귀무가설 : 표본이정규분포를이루는모집단에서추출된것 > shapiro.test(ans) Shapiro-Wilk normality test data: ans W = 0.98914, p-value = 0.9929 p value = 0.9929 > 0.5 이므로귀무가설을채택

모평균의구간추정 - 일표본 t- 검정 예 ) 소비자만족도조사 > t.test(ans) One Sample t-test data: ans t = 31.172, df = 24, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 67.53176 77.10824 sample estimates: mean of x 72.32 p value < 2.2e 16 이므로 평균이 0 이다 라는귀무가설을기각 추정된평균은 72.32 이고 95% 신뢰구간은 [67.53176, 77.10824]

모평균의구간추정 - 일표본 t- 검정 예 ) 소비자만족도의평균이 70 이상인지신뢰수준 95% 에서검정 > t.test(ans, mu=70, conf.level=.95, alternative = "greater") One Sample t-test data: ans t = 1, df = 24, p-value = 0.1636 alternative hypothesis: true mean is greater than 70 95 percent confidence interval: 68.35075 Inf sample estimates: mean of x 72.32 p value = 0.1636 > 0.05 이므로 평균이 70 보다크지않다 라는 귀무가설을채택

모평균의구간추정 - 일표본 t- 검정 예 ) 소비자만족도의평균이 60 이상인지신뢰수준 99% 에서검정 > t.test(ans, mu=60, conf.level=.99, alternative = "greater") One Sample t-test data: ans t = 5.3103, df = 24, p-value = 9.489e-06 alternative hypothesis: true mean is greater than 60 99 percent confidence interval: 66.53819 Inf sample estimates: mean of x 72.32 p value = 9.489e 06 < 0.01 이므로 평균이 60 보다크지않다 라는귀무가설을기각

모평균의구간추정 - 일표본 t- 검정 sleep 데이터집합을사용하여설명한다. extra: 수면시간의증가량, group: 사용한수면제의종류, ID: 환자식별번호 > head(sleep) extra group ID 1 0.7 1 1 2-1.6 1 2 3-0.2 1 3 4-1.2 1 4 5-0.1 1 5 6 3.4 1 6 > str(sleep) data.frame : 20 obs. of 3 variables: $ extra: num 0.7-1.6-0.2-1.2-0.1 3.4 3.7 0.8 0 2... $ group: Factor w/ 2 levels "1","2": 1 1 1 1 1 1 1 1 1 1... $ ID : Factor w/ 10 levels "1","2","3","4",..: 1 2 3 4 5 6 7

모평균의구간추정 - 일표본 t- 검정 sleep에서수면증가 (extra) 의평균이 0인지를유의수준 95% 에서검정하라. sleep에서수면증가 (extra) 의평균이 0이상인지를유의수준 99% 에서검정하라.

독립이표본 t- 검정 two-group independent t-test 독립이표본은서로독립인두개의표본집단이있는경우

독립이표본 t- 검정 two-group independent t-test 두모집단의평균이같은지검정한다. 두모집단은독립적이며정규분포를따른다고가정한다. 때문에 R에서독립이표본검정을하려면먼저 var.test() 함수를사용하여두모집단이같은분산을갖는지를검정하는등분산검정을실시하여야한다.

독립이표본 t- 검정 two-group independent t-test 1 번수면제와 2 번수면제를서로다른집단에각각처치했을때 효과의차이가있는지검정 1 번수면제와 2 번수면제를처치한그룹으로나눈다. > grp <- data.frame(group1=sleep$extra[sleep$group==1], + group2=sleep$extra[sleep$group==2]) > grp group1 group2 1 0.7 1.9 2-1.6 0.8 3-0.2 1.1 4-1.2 0.1 5-0.1-0.1 6 3.4 4.4 7 3.7 5.5 8 0.8 1.6 9 0.0 4.6

등분산검정 var.test() 함수는귀무가설로 두변수의분산비율은 1이다 를사용한다. var.test(y x, data=) x - 범주형변수 y - 수치형변수

등분산검정 grp 의 group1 변수의값과 group2 변수의값의분산이같은지를 var.test() 함수를사용하여검정한다. > var.test(grp$group1, grp$group2) F test to compare two variances data: grp$group1 and grp$group2 F = 0.79834, num df = 9, denom df = 9, p-value = 0.7427 alternative hypothesis: true ratio of variances is not equal to 95 percent confidence interval: 0.198297 3.214123 sample estimates: ratio of variances 0.7983426

등분산검정 검정결과 p = 0.7427 > 0.5 이므로귀무가설을채택하여두변수의 분산이같다고결론내릴수있다. > var.test(grp$group1, grp$group2) F test to compare two variances data: grp$group1 and grp$group2 F = 0.79834, num df = 9, denom df = 9, p-value = 0.7427 alternative hypothesis: true ratio of variances is not equal to 95 percent confidence interval: 0.198297 3.214123 sample estimates: ratio of variances 0.7983426

독립이표본 t- 검정 two-group independent t-test t.test(y1, y2, data=) y1, y2 - 수치형변수 data= 행렬또는데이터프레임 단측검정one-sided test) 을위하여 alternative="less" 또는 alternative="greater" 사용

독립이표본 t- 검정 two-group independent t-test grp의 group1 변수의값과 group2 변수값의분산이동일하므로, grp의 group1 변수의값과 group2 변수값의차이를양측검정two-tailed test으로비교할수있다.

독립이표본 t- 검정 two-group independent t-test p = 0.07939 > 0.01 이므로두변수의평균의차이가 0 이라는 귀무가설을채택한다. 1 번, 2 번수면제의차이는없다라고결론내릴수있다. > t.test(grp$group1, grp$group2) Welch Two Sample t-test data: grp$group1 and grp$group2 t = -1.8608, df = 17.776, p-value = 0.07939 alternative hypothesis: true difference in means is not equal t 95 percent confidence interval: -3.3654832 0.2054832 sample estimates: mean of x mean of y 0.75 2.33

독립이표본 t- 검정 two-group independent t-test 예 어린이성장과사회환경에관한연구 부모가고등교육을받지못한경우와받은경우초등학교 1 학년생들의언어능력비교연구 부모가고등교육을받지못한 1학년생 ( 집단1) 66명의언어능력 - 평균 : 305, 표준편차 : 29 부모가고등교육을받은 1학년생 ( 집단2) 38명의언어능력 - 평균 : 311, 표준편차 : 40 두집단의언어능력은같은지유의수준 5% 에서검정

독립이표본 t- 검정 two-group independent t-test 예 어린이성장과사회환경에관한연구 부모가고등교육을받지못한 1 학년생 (s1) 66 명의언어능력 - 평균 : 305, 표준편차 : 29 부모가고등교육을받은 1 학년생 (s2) 38 명의언어능력 - 평균 : 311, 표준편차 : 40 s1 <- rnorm(66, mean = 305, sd=29) s2 <- rnorm(38, mean = 311, sd=40)

독립이표본 t- 검정 two-group independent t-test 예 어린이성장과사회환경에관한연구 두표본이동일한연속분포를이루는모집단에서추출된 것임을검정 Kolmogorov-Smirnov test ks.test(vector, vector) 두표본이동일한연속분포를이루는모집단에서추출된것 이라는귀무가설 > ks.test(s1,s2) Two-sample Kolmogorov-Smirnov test data: s1 and s2 D = 0.23206, p-value = 0.1234 alternative hypothesis: two-sided

독립이표본 t- 검정 two-group independent t-test 예 어린이성장과사회환경에관한연구 두집단의모분산이동일한지를검정 > var.test(s1,s2) F test to compare two variances data: s1 and s2 F = 0.48093, num df = 65, denom df = 37, p-value = 0.009721 alternative hypothesis: true ratio of variances is not equal to 95 percent confidence interval: 0.2635913 0.8377697 sample estimates: ratio of variances 0.4809257

독립이표본 t- 검정 two-group independent t-test 예 어린이성장과사회환경에관한연구 두집단의모분산이동일하지않을때는 var.equal=f 라는 인자를기술하여 t- 검정실시 > t.test(s1, s2, var.equal=f) Welch Two Sample t-test data: s1 and s2 t = -1.02, df = 57.804, p-value = 0.312 alternative hypothesis: true difference in means is not equal t 95 percent confidence interval: -21.196368 6.887163 sample estimates: mean of x mean of y 305.6117 312.7663

독립이표본 t- 검정 two-group independent t-test 예 목초의종류에따른우유생산량의차이확인 13마리의젖소에게는인공적으로건조시킨목초를줌 - 평균 : 45.15, 표준편차 : 7.998 12마리의젖소에게는들판에서말린목초를줌 - 평균 : 42.25, 표준편차 : 8.740

짝지은이표본 t- 검정 paired two-group t-test 두개표본이짝지은순서쌍처럼구해진경우

짝지은이표본 t- 검정 paired two-group t-test 한반학생들의수업전후점수를비교하고자한다. > pretest <- c(25, 41.7, 41.7, 54.2, 29.2, 50.0, 54. + 54.2, 33.3, 33.3, 54.2, 37.5, 12.5, 29.2, 41.7) > posttest <- c(41.7, 66.7, 91.7, 70.8, 70.8, 54.2, + 70.8, 50.0, 58.3, 79.2, 87.5, 45.8, 66.7, 45.8) > PrePostScore <-data.frame(pretest, posttest)

짝지은이표본 t- 검정 paired two-group t-test 한반학생들의수업전후점수를비교하고자한다. 동일집단에대한다른처치이므로짝지은이표본 (paired=true) t- 검정 > attach(prepostscore) > t.test(pretest, posttest, paired=t) Paired t-test data: pretest and posttest t = -6.723, df = 15, p-value = 6.832e-06 alternative hypothesis: true difference in means is not equal t 95 percent confidence interval: -33.03302-17.12948 sample estimates: mean of the differences -25.08125

짝지은이표본 t- 검정 paired two-group t-test 두점수의차이로일표본검정을하면, 짝지은이표본 t- 검정과 동일한결과를얻는다. > diffscore <- posttest-pretest > t.test(diffscore) One Sample t-test data: diffscore t = 6.723, df = 15, p-value = 6.832e-06 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 17.12948 33.03302 sample estimates: mean of x 25.08125

셋이상의집단비교 정규분포에따르는모집단에서독립적으로추출된셋이상의집단을비교하려면, 분산분석analysis of variance ANOVA 를사용한다.