중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed mean), 가중평균 (weighted mean), 기하평균 (geometric mean), 조화평균 (harmonic mean), 중앙값 ( 중위수 ; median), 최빈값 ( 최빈수 ; mode) 등 산포도 (measure of dispersion) 자료에서관측값들이얼마만큼퍼져있는가를측정하는척도로변동성의척도 (measure of variability) 라고도함. 예 : 범위 (range), 분산 (variance), 표준편차 (standard deviation), 사분위편차 (interquartile range), 변동계수 (coefficient of variation) 등
중심경향치 (measure of central tendency) ( 산술 ) 평균 (mean; arithmetic mean; average) 균형점 ( 자료의중심 ) 모든관측값의크기 ( 정보 ) 를반영 이상값 (outlier) 의영향을받음. X 1 n n = å= i 1 X i = X 1 + X + L + 예 : 79, 82, 86, 80, 84, 75, 78, 100, 77 : 82.3 0, 82, 86, 80, 84, 75, 78, 100, 77 : 73.6 2 n X n
중심경향치 (measure of central tendency) ( 산술 ) 평균 (mean; arithmetic mean; average) Excel 에서산술평균을구하려면우선평균값을기재하고자하는셀을지정하고, 함수마법사에서범주는 통계 로설정하고함수명 AVERAGE 를선택하고확인버튼을누름.
중심경향치 (measure of central tendency) ( 산술 ) 평균 (mean; arithmetic mean; average) 함수인수 AVERAGE 창에서 Number1 에평균을구하고자하는전체데이터의영역을지정한후확인버튼을누름.
중심경향치 (measure of central tendency) (a%) 절사평균 (trimmed mean : trimmean) 자료중에서큰관측값이나작은관측값을각각 α% 만큼버린나머지관측값들로부터구한평균 일정비율만큼이상값을포함시키지않고구한평균 X 1 n n = å= i 1 X i = X 1 + X 2 + L + 예 : 0, 75, 77, 78, 80, 82, 84, 85, 86, 100 : 74.7 n X n 75, 77, 78, 80, 82, 84, 85, 86 : 80.88 ( 10% 절사평균 )
중심경향치 (measure of central tendency) (a%) 절사평균 (trimmed mean : trimmean) 우선절사평균값을기재하고자하는셀을지정하고, 함수마법사에서범주는 통계 로설정하고함수명 TRIMMEAN 을선택하고확인버튼을누름.
중심경향치 (measure of central tendency) (a%) 절사평균 (trimmed mean : trimmean) 함수인수 TRIMMEAN 창에서 Array 에는전체데이터의영역에서 α% 를제외하고평균을구하고자하는영역을지정하고 Percent 에는데이터의양끝에서제외시킬비율, 예를들어좌우 10% 인경우 0.2 를기재한후확인버튼을누름.
중심경향치 (measure of central tendency) 가중평균 (weighted mean) 관측값하나하나의중요도가모두같지않은경우에사용되는평균 가중평균을사용할때상대적중요도를반영하는값을가중치 (weight) 라고함. 자료의관측값 X 1, X 2,, X n 의가중치를각각 w 1, w 2,, w n 이라할때가중평균은다음과같음. W w X + w X + L + w X n å 1 1 2 2 n n i= 1 = = n w 1 + L + w n å i= 1 w X i w i i
중심경향치 (measure of central tendency) 기하평균 (geometric mean : geomean) 기하평균은비율 (ratios) 로이루어진데이터의평균으로적절함. 물가지수등과같이증가또는감소의평균변화값을구하는경우에사용 일반적으로변동률, 상승률, 증가율등의평균을구하는경우에사용 ( 예 : 경제성장률, 물가상승률, 인구증가율등 ) n G = X 1 X 2 L X n
중심경향치 (measure of central tendency) 기하평균 (geometric mean : geomean) 우선평균값을기재하고자하는셀을지정하고, 함수마법사에서범주는 통계 로설정하고함수명 GEOMEAN 을선택하고확인버튼을누름.
중심경향치 (measure of central tendency) 기하평균 (geometric mean : geomean) 함수인수 GEOMEAN 창에서 Number1 에평균을구하고자하는전체데이터의영역을지정한후확인버튼을누름.
중심경향치 (measure of central tendency) 조화평균 (harmonic mean : harmean) 측정치에대한단위당대표값을구하는경우에사용 예를들어동일거리를반복주행할때의평균속도및평균시간계산에사용 조화평균의역수는각측정값의역수들의산술평균과같음. H = 1 X 1 + 1 X 2 n + L + 1 X n
중심경향치 (measure of central tendency) 조화평균 (harmonic mean : harmean) 우선평균값을기재하고자하는셀을지정하고, 함수마법사에서범주는 통계 로설정하고함수명 HARMEAN 을선택하고확인버튼을누름.
중심경향치 (measure of central tendency) 조화평균 (harmonic mean : harmean) 함수인수 HARMEAN 창에서 Number1 에평균을구하고자하는전체데이터의영역을지정한후확인버튼을누름.
중심경향치 (measure of central tendency) 도수분포표를이용한평균 (average) 의계산 도수분포표는자료가계급구간으로나누어져있으므로계급구간의자료값들을하나하나파악하지못함. 이러한경우다음과같이평균을구해야함. 계급구간별 ( 계급 ) 중앙값을구함. ( 계급 ) 중앙값과도수를곱한후그값을모두합함. 이렇게구해진값을전체도수로나누면평균을구할수있음.
중심경향치 (measure of central tendency) 도수분포표를이용한평균 (average) 의계산 도수분포표의평균을구하는경우, 서로다른두값을대응하여곱한후합할수있는 SUMPRODUCT 라는함수가있음 ( 함수마법사 범주선택 : 모두 SUMPRODUCT).
중심경향치 (measure of central tendency) 도수분포표를이용한평균 (average) 의계산 함수인수 SUMPRODUCT 창에서 Array1 에는계급중앙값영역을, 그리고 Array2 에는도수영역을지정하고확인버튼을누름.
중심경향치 (measure of central tendency) 도수분포표를이용한평균 (average) 의계산 이제 SUMPRODUCT 에의하여구한총합계를자료수인총도수로나누어주면평균값을구할수있음.
중심경향치 (measure of central tendency) 중앙값 (= 중위수 ; median) 우선중앙값을기재하고자하는셀을지정하고, 함수마법사에서범주는 통계 로설정하고함수명 MEDIAN 을선택하고확인버튼을누름.
중심경향치 (measure of central tendency) 중앙값 (= 중위수 ; median) 함수인수 MEDIAN 창에서 Number1 에중앙값을구하고자하는전체데이터의영역을지정한후확인버튼을누름.
중심경향치 (measure of central tendency) 최빈값 (= 최빈수 ; mode) 데이터중에서가장많이출현하는관측값 존재하지않을수도있으며, 1개이상존재할수도있음. 예 : 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1, 4 : 2, 4
중심경향치 (measure of central tendency) 최빈값 (= 최빈수 ; mode) 우선최빈값을기재하고자하는셀을지정하고, 함수마법사에서범주는 통계 로설정하고함수명 MODE 를선택하고확인버튼을누름.
중심경향치 (measure of central tendency) 최빈값 (= 최빈수 ; mode) 함수인수 MODE 창에서 Number1 에최빈값을구하고자하는전체데이터의영역을지정한후확인버튼을누름.
산포도 (measure of dispersion) 다음 A, B, C 데이터들의평균과중앙값은모두같음. 데이터 A : 7, 7, 7, 7, 7 : 7 / 7 데이터 B : 5, 6, 7, 8, 9 : 7 / 7 데이터 C : 1, 4, 7, 10, 13 : 7 / 7 이와같이자료를숫자로요약 정리하는데이터의대표값만으로충분하지않음. 따라서데이터에서관측값들이얼마만큼퍼져있는가를측정하는척도인산포도를고려해야함. 산포도는데이터에서관측값들이변화하는크기인변동량을나타내는계수임.
산포도 (measure of dispersion) 범위 (range) 데이터의관측값중가장큰값인최대값 (max) 과가장작은값인최소값 (min) 과의차이 범위 (range)= 최대값 (max)- 최소값 (min) 오직데이터들중두관측값만이용함. 관측값하나하나의크기가반영되지못함. 이상값에의해크게영향받음. 데이터 A : 3, 4, 5, 6, 8, 9, 10, 12, 15 (range=15-3=12) 데이터 B : 3, 7, 7, 7, 8, 8, 8, 9, 15 (range=15-3=12)
산포도 (measure of dispersion) 범위 (range) 범위 (range)= 최대값 (max)-최소값(min)
산포도 (measure of dispersion) 사분위수 (quartile) 데이터를크기순으로나열할경우데이터가 4 등분되는위치의관측값을말함. 제 1 사분위수 (Q 1 ) 데이터의 25% 에해당하는수, 하위 50% 의중앙값 제 2 사분위수 (Q 2 ) 데이터의 50% 에해당하는수, 중앙값 제 3 사분위수 (Q 3 ) 데이터의 75% 에해당하는수, 상위 50% 의중앙값 0% 25% 50% 75% 100% Q 1 Q 2 Q 3
산포도 (measure of dispersion) 사분위수 (quartile) 함수마법사에서범주는통계로설정하고함수명 QUARTILE 을클릭하고확인버튼을누름.
산포도 (measure of dispersion) 사분위수 (quartile) 함수인수 QUARTILE 창에서 Array 는전체데이터를지정하고, Quart 에는구하고자하는사분위수를적어넣고확인버튼을누름.
산포도 (measure of dispersion) 사분위편차 (= 사분위수범위 ; interquartile range : IQR) 사분위편차 (IQR)= 제3사분위수 (Q 3 )-제1사분위수(Q 1 ) 상위 25% 와하위 25% 를뺀나머지의범위
산포도 (measure of dispersion) 분산 (variance) 산포도를정확하게측정하기위해서는하나하나의관측값들의크기가반영되어야바람직함. 여기서 N 개의원소로구성된모집단으로부터데이터의관측값 X 1, X 2,, X N 에서각관측값 X i 들이평균 μ 에서떨어진크기 (= 편차 : deviation) 인 X i -μ 를직접더하면항상 0 이됨. N å X - m) = i i= 1 i= 1 N å ( X - Nm = 0 따라서편차인 X i -μ 를직접더하지않고제곱을하고더한후평균을구한값을산포도로사용하는것이적당함. 이값을분산 (variance) 이라함. i
산포도 (measure of dispersion) 분산 (variance) 모분산 (population variance) X 1, X 2,, X N 이모집단으로부터전수조사를하여얻은관측값인경우모집단의분산 σ 2 은다음과같이정의됨. 2 s = N å= i 1 - m) 표본분산 (sample variance) 1 N ( X i 2 X 1, X 2,, X n 이표본으로부터얻은관측값인경우표본의분산 S 2 은다음과같이정의됨. S 2 1 = n -1 n å= i 1 ( X i - X ) 2
산포도 (measure of dispersion) 분산 (variance) 앞에서살펴본바와같이모분산과표본분산은공식에서서로차이가있음. 즉, 모분산은 N 으로나누는반면, 표본분산은 n-1 로나누어줌. 따라서 Excel 에서도분산과표준편차를구하는경우다음과같은 Excel 함수를사용함. 모집단 (population) 표본 (sample) 분산 (variance) VARP VAR 표준편차 (S.D.) STDEVP STDEV
산포도 (measure of dispersion) 분산 (variance) 함수마법사에서범주는통계로설정하고함수명 VARP ( 모분산 ) 를클릭하고확인버튼을누름.
산포도 (measure of dispersion) 분산 (variance) 함수인수 VARP 창에서 Number1 에분산을구하고자하는전체데이터의영역을지정한후확인버튼을누름.
산포도 (measure of dispersion) 표준편차 (standard deviation) 모분산이나표본분산은관측값들의편차를제곱하여계산하므로모분산이나표본분산의측정단위는관측값들의측정단위와일치하지않음. 따라서관측값의측정단위와일치시키기위하여분산의양의제곱근 (square root) 을사용하는데, 이를표준편차 (standard deviation : S.D.) 라고함. 모집단의모표준편차 : s = 표본의표본표준편차 : 관측값들이데이터의중심인평균으로부터얼마나밀집되어있는가의척도, 즉평균과관측값차이들의평균 이상값에민감함. S = 2 s 2 S
산포도 (measure of dispersion) 표준편차 (standard deviation) 함수인수 STDEVP 창에서 Number1 에표준편차를구하고자하는전체데이터의영역을지정한후확인버튼을누름.
산포도 (measure of dispersion) 표준편차 (standard deviation) 표준편차는 Excel 의함수마법사에서 STDEVP ( 모분산 ) 를이용또는분산의제곱근 (square root) 을이용, 즉 SQRT( 분산 )
산포도 (measure of dispersion) 분산과표준편차 통계학시험성적에대한두반의분산과표준편차
산포도 (measure of dispersion) 변동계수 (coefficient of variation : CV) 데이터측정단위의변화와무관한산포도 s 모변동계수 : ( 100%), 표본변동계수 : ( 100%) m X 측정단위가서로다른데이터들의산포도를비교하는데사용함. 예 : 기업 A 주식 평균 50,000 원, 표준편차 10,000 원기업 B 주식평균 12,000 원, 표준편차 4,000 원기업 A 주식의변동계수 =(10,000/50,000) 100=20.0% 기업 B 주식의변동계수 =(4,000/12,000) 100=33.3% S
산포도 (measure of dispersion) 변동계수 (coefficient of variation : CV)
비대칭도 (= 왜도 ; skewness) 분포가중앙으로부터좌우로치우친정도를나타내는척도 S k 가 0 이면대칭분포 ( 정규분포 ), 양수 (+) 이면오른쪽긴꼬리분포 (right-skewed), 음수 (-) 이면왼쪽긴꼬리분포 (left-skewed)
첨도 (kurtosis) 대칭인분포에서꼬리가두터운정도를나타내는척도로분포의뾰족함정도를측정하는척도임. 3 이면정규분포, 3 보다크면첨예분포, 3 보다작으면평탄분포
통계데이터분석 대화상자 통계데이터분석 대화상자는대화식으로통계분석을수행할수있는도구임. 이대화상자를이용하면기술통계법, 난수생성, 분산분석, 회귀분석등다양한통계분석결과를얻을수있음. 통계데이터분석 대화상자를이용하기위해서는 Excel 의풀 - 다운메뉴에서 데이터 - 데이터분석 메뉴를선택해야함. 그러나일반적인환경설정에서는풀 - 다운메뉴에나타나있지않음. 따라서다음의과정을거쳐설정해야함. 우선 Excel 창에서 Office 단추를클릭
통계데이터분석 대화상자 풀-다운메뉴에나타내기위해서는다음의과정을거쳐설정함. 우선 Excel 창에서 Office 단추를클릭
통계데이터분석 대화상자 Excel 창에서 Office 단추를클릭한후나타나는창에서하단부의 Excel 옵션클릭
통계데이터분석 대화상자 Excel 옵션창에서 추가기능 클릭
통계데이터분석 대화상자 Excel 옵션창에서하단부의 이동 클릭
통계데이터분석 대화상자 추가기능에서 분석도구 에체크한후확인버튼을누름.
통계데이터분석 대화상자 추가기능인완료되면 Excel 창의 데이터 를클릭하면오른쪽상단에 데이터분석 메뉴가나타남.
통계데이터분석법을이용한방법 통계데이터분석 대화상자에서의통계분석도구는다음과같음.
통계데이터분석법을이용한방법 기술통계량을구하는방법 통계데이터분석 메뉴에서 데이터분석 을선택하면다음과같은 통계데이터분석 대화상자가나타남.
통계데이터분석법을이용한방법 기술통계량을구하는방법 통계데이터분석 의분석도구중에서기술통계법을선택하고확인버튼을누르면다음과같은대화상자가나타남.
통계데이터분석법을이용한방법 기술통계량을구하는방법 데이터를정리할때우선 열 또는 행 으로반드시정렬해야함. 입력범위에는데이터영역을선택 만약데이터영역의변수명을삽입하고자하면첫째행이름표사용에체크를함. 출력옵션에서요약통계량에체크한후출력범위에서요약통계량을나타낼셀을지정하고확인버튼을누름.
통계데이터분석법을이용한방법 기술통계량을구하는방법 데이터들의평균, 표준편차, 분산, 첨도, 왜도, 범위등요약통계량에대한결과가다음과같이나타남.