93 Chapter 5. 빈도분석 CHAPTER 5 빈도분석 5.1. 빈도분석 빈도분석이란분류형 ( 범주형 ) 변수에대한빈도표 (frequency table) 를작성하고그에적절한그래프 ( 바차트, 파이차트 ) 를그리는분석방법이다. 빈도표에는변수의수준별빈도 (frequency), ( 상대 ) 비율이 (relative percentage %) 모두나타나있으나그래프는상대비율로그리면된다. 설문데이터분석에서폐쇄형문항 ( 리커드척도문항도포함 ) 은모두범주형변수이며개방형 ( 주관식 ) 문항도분석자가적절히분류하면 ( 예 : 용돈을주관식으로조사한후적절한범주로나눈후상 / 중 / 하로분류하였다면 ) 범주형문항으로취급될수있다. 5.1.1. 설문분석에서빈도분석사용이유 (1) 코딩오류발견입력오류가있는지알아보기위하여모든문항에대한빈도분석을한다. 빈도분석결과문항의보기번호에없는값이출력되면그문항자료에오류가있다는것을의미한다. 이방법이설문지와메모장자료를일일이대조하는것보다자료의코딩오류를발견하는데더효율적이고때로는더정확하다. 그러므로빈도분석은설문데이터분석의첫걸음이며모든폐쇄형문항에대해서는반드시실시해야한다.
94 Chapter 5. 빈도분석 (2) 인구학적문항인구학적문항에대해서는빈도표를작성하거나적절한그래프를그려설문응답자들의분포를나타낸다. 빈도분석을통해응답자들이모집단과유사하게추출되었는지알수있고, 응답자들의인구학적분포를알아볼수있다. (3) 본문항본문항중보기문항이거나리커드척도문항 ( 이를분류형으로간주한경우, 5 점척도의경우 1~5 점점수화하여점수평균을구하기도하지만일반적으로만족하는사람비율, 혹은불만족비율에관심을갖는다. 특히회사에서는 ) 의응답분포를알아보기위한것이다. 본문항은일반적으로인구학적문항과의관계분석 ( 교차분석 ) 을주로하고개별적으로분석하는경우는드물다. 인구학적요인에따라응답의차이가없는본문항들에대해서만빈도분석결과를제시하고해석한다. 5.1.2. 분석결과정리예제 다음은 A 학과학생 120 명을대상으로어학연수지역으로선호하는국가를조사하여빈도 분석한결과를엑셀에서나타낸것이다. 만약성별에따른어학연수지역에차이가있다면 빈도분석결과는없애고, 교차분석결과를제시해야한다. 국가 빈도 비율 (%) 미국 50 41.7 캐나다 35 29.2 호주 20 16.7 유럽 15 12.5 합계 120 100.0 어학연수선호국가 어학연수선호지역 (%) 호주 17% 유럽 13% 41.7 캐나다 29% 미국 41% 파이차트 50.0 40.0 30.0 20.0 10.0 0.0 29.2 16.7 바차트 미국캐나다호주유럽 12.5
5.2. 통계소프트웨어사용 95 5.2. 통계소프트웨어사용 예제설문 CODING.txt 를 SPSS 데이터로만들어 SURVEY.sav 에저장했고, SAS 경우에는 프로그램을 SURVEY.sas 으로저장하였다. (4 장참고 ) 5.2.1. SAS (1) 빈도표빈도표는 FREQ procedure 에의해출력된다. VAR 문은원하는변수에대해빈도표를출력할경우사용하고 VAR 을사용하지않으면 SURVEY 데이터에있는모든변수에대한빈도표가출력된다. (2) 결과해석하기다음은출력결과창에서 Q3( 출신지역 ) 문항빈도분석결과를가져온것이다. 도수 = 빈도, 백분율 = 상대빈도, 비율 (%) 을의미하며누적 (cumulative) 은그범주까지누적값을의미한다. 결측값의개수는그문항에대해응답하지않은사람의수를의미하며이설문조사에서는한사람이 Q3= 출신지역 문항에응답하지않았음을의미한다.
96 Chapter 5. 빈도분석 응답자를출신지역별로보면대전 65.9% 로가장많고충남 15.5% 이며그외지역은 18.6% 이다. 학교전체대전지역출신자비율이 80% 인데비해중국경제학부는대전지역출신자가다소낮은것은학교내에서경쟁력이있는학부라대전이외지역에서많이온것을알수있다. (3) 결과창수정하기결과제목은왼쪽결과창에리스트되고출력창에분석결과가나타난다. 출력창결과의정렬이맞지않을때는다음작업을하면된다. (4)Label 문사용만약 Q3 라는변수명대신적절한이름이출력되게하려면아래와같이 LABEL 문을사용하면된다. 첫번째설문지에는변수번호가적혀있으므로굳이이방법을사용해프로그램을복잡하게만들필요는없다.
5.2. 통계소프트웨어사용 97 (5)FORMAT 문사용 만약각변수의범주 ( 보기 ) 에대해숫자대신이름을붙이기원하면 FORMAT procedure 를사용하면된다. 사용방법은다음과같다. (6) 그래프그리기다음 procedure 에의해파이차트를그릴수있으나옵션설정이복잡하고좋은그래프를그리기어렵다. SAS/INSIGHT 나 SAS/INSIGHT 에서다소용이하게그래프를그릴수있으나시각적효과가뛰어난그래프그리는것은역시어렵다. 그래프는엑셀에서그리기바란다.
98 Chapter 5. 빈도분석 (7) 웹출력하기 SAS 로그래프그리기보다는그래프그리기의리더엑셀을이용하는것이편리하다. 다음방법에의해 SAS 빈도분석결과를엑셀로가져갈수있다. 출력창에있는결과는텍스트모드이므로 CTRL+C, CTRL+V 방법으로옮겨가면문제가발생한다. 그러므로 SAS 결과를우선웹모드로출력한후복사해가면된다.
5.2. 통계소프트웨어사용 99 위와같이설정이끝난후프로그램을실행하면출력결과가출력창에는물론 Result Viewer ( 출력보기 ) 창에웹형식의결과가나타난다. 웹형태의결과를이용하면그결과 를엑셀로옮겨가는데용이하다. 웹문서출력보기창에서빈도표부분을선택한후 (CTRL+C) 엑셀에가서적당한셀을 선택한후 CTRL+V 를누르면빈도표가복사된다. 빈도표를이용하여원하는그래프를 그리면된다. 다음은위결과를엑셀에붙여넣은화면이다.
100 Chapter 5. 빈도분석 5.2.2. SPSS (1) 빈도분석 빈도분석메뉴를선택한다. 다음과같이빈도분석결과를설정한다. 다른옵션은 default 로하고도표옵션에서원 하는그래프를지정하면된다. 빈도분석원하는변수를선택한후가운데변수추가버튼을누르면변수들이오른쪽창으로이동한다.
5.2. 통계소프트웨어사용 101 빈도표와막대그래프가그려지고왼쪽결과창에제목이리스트된다. 원하는결과에서 변수명을선택하면관련결과로바로이동할수있다. (2) 빈도표다루기빈도표를문서로가져오려면원하는빈도표에서그림에서오른쪽마우스버튼을눌러선택한후워드에가서 CTRL+V 를누르면된다. 만일엑셀로결과를옮겨가려면선택한후엑셀에가서 CTRL+V 를누르면된다. SPSS 는출력결과를 OUTPUT 윈도우에서직접수정이가능하다. 빈도표부분을더블클릭하여개체를선택한후원하는작업을하면된다. 단어바꾸기, 필요없는결과제거하기등이가능하다. 다음은제목을 V3 에서 출신지역 으로바꾸고퍼센트열과마지막행합계부분을제거한결과이다. 일반적으로퍼센트열과마지막합계향은사용하지않는다.
102 Chapter 5. 빈도분석 출신지역 유효 결측 1 2 3 4 5 합계시스템결측값 빈도 유효퍼센트 누적퍼센트 85 65.9 65.9 20 15.5 81.4 2 1.6 82.9 5 3.9 86.8 17 13.2 100.0 129 100.0 1 그래프를워드문서에가져오려면그림에서오른쪽마우스버튼을눌러 택한후워드에가서 CTRL+V 를누르면된다. 선 선택하 여그래프를수정할수있다.
5.3. 코딩오류발견하기 103 5.3. 코딩오류발견하기설문데이터는코딩오류를발견하기위하여설문지와코딩결과를대조하는것은효율적이지못하다. 각문항에대해빈도분석을실시하고만약문항보기에없는번호가나오면코딩오류가있는것으로간주하고설문지와비교하여오류를수정한다. 오류가있는설문코딩데이터는 coding_error.txt 이다. ( 웹페이지에올려져있음 ) 5.3.1. SAS 빈도분석결과 Q13 에 8 번한개, Q16 에 8 번 (1 개 ), Q17 9 번 1 개, Q29_2 에 7 번한개가 발견되었다고하자. ID 번호에일치하는설문지번호를찾아문제가있는문항응답결과를체크한후원본텍 스트데이터의오류를수정하고데이터불러오기와빈도분석을다시실시한다.
104 Chapter 5. 빈도분석 5.3.2. SPSS 빈도분석결과 Q16 에 8번보기에오류 (1-7 보기밖에는없는데 8이입력 ) 있는것으로나타났다면문제가생긴 16 번문항을선택한후편집 찾기메뉴를선택하고찾기창에서 8 을입력한다. 위와같이 8 이입력된부분이하얗게반전되므로 35 번설문지의 16 번문항응답결과를 체크하여오류를수정하면된다. 5.4. 다중선택문항빈도분석 다중선택문항에대한빈도분석은다른빈도분석과는다르다. 한문항에대해여러선택이가능하므로이문항에대한총응답결과는응답자수를초과한다. 그러므로빈도의의미는없고단지비율에대한해석만가능하다. 다중선택문항분석은다른분석과분리하여실시하고다중문항이 2 개이상인경우에는각각분리하여분석을실시하여야한다. 예제설문 coding.txt 에서 Q29 번문항이다중선택문항이다. (Q29_1-Q29_3) 다중선택문항을다른문항과교차하여분석하는경우에도다른분석과분리하여따로분석해야한다.
5.4. 다중선택문항빈도분석 105 5.4.1. SAS 데이터관리를위하여 SAS data 이름을다르게해야한다. SURVEY1 은다중문항빈도분 석에만사용되고다시는사용하지않는다. 변수 Q29 에는 Q29_1-Q29_3 까지응답결과가 한열에저장된다. 다중선택문항이라빈도가 308( 응답자는 130 명인데 ) 이다. 그러므로해석할때는비율만가지고하면된다. 어학실에대해불만족을느끼는학생비율이가장높음을알수있다. 만약성별에따른불만족시설의차이를보기위하여교차분석 (7 장참고 ) 을실시하는경우다음과같이프로그램하면된다. 이경우 SURVEY1 이라는데이터를사용해야한다. TABLE 문의앞에변수는행을, * 뒤의변수는열을지정한다.
106 Chapter 5. 빈도분석 각셀에서첫행을빈도, 두번째행은백분율 (%), 세번째행은행백분율 ( 세번째것을 행으로다더하면 100%), 네번째행은열백분율이다. 여자 (1) 는어학실 (5), 남자는 (2) 실 습실 (6) 에가장많이불만을느끼고있다. 여자 남자 5.4.2. SPSS 다중선택문항에대한빈도분석방법이있을것같은데 찾을수없네요. 세 (V33-V35) 문항에대해각각빈도분석을실시하고각문항의보기에대한빈도를합쳐빈도표와비율을재작성하면된다. 3 번보기의경우 V33 에서 24, V34 에서 23, V35 에서 5이므로총 (24+23+5)=52 이다. 위의 SAS 결과와일치한다. 다중문항에대한교차분석도문항각각에대한교차분석을실시한후빈도를합하고비율을계산하면된다. 5.5. 우선순위문항 우선순위문항은각문항별로순위에대한빈도분석을실시하여표로정리하면된다. 5.5.1. SAS 새로운변수 MAJOR 에는문항보기내용이 Q26 은순위점수가들어가있다. NOCOL 옵 션은열퍼센트를출력하지말라는명령이고 NOPERCENT 는전체백분율을출력하지말 라는옵션이다. Q26 변수를행으로, MAJOR 변수를열로하여교차표가작성된다.
5.5. 우선순위문항 107 Q26 변수는보기문항의순위가입력되 어있고 MAJOR 변수는문항보기내용 이들어가있다. Q26 MAJOR 1 취업첫번째사람응답 3 학문 각행에서행퍼센트비율이가장높은것, 혹은그다음것까지살펴해석하면된다. 학생들은전공을선택할때취업 (1 순위비율이가장높다 ) 적성 학문 교수 학우순으로고려하고있음을알수있다. 행퍼센트를가지고해석하는데어려움이있는경우순위도점수화할수있으므로각보기문항에대해 ( 교수, 적성, ---, 학우 ) 우선순위점수의평균을계산하여비교할수있다. 우선순위 위와같이교차표를작성할때는행에설명문항이나분포를보려는문항을놓는다. 예를들면성별에따른전공선택의차이가있는지보려면성별문항을행에놓는다. 위의경우에도우선순위의분포를보는것이더효과적이므로우선순위를행에놓았다. 교차표를만들때는 NOPERCENT, NOCOL 옵션을사용하자.
108 Chapter 5. 빈도분석 만약예제설문과같이조사되지않고우선순위를적으라고한설문조사는어떻게분석 할것인가? 다음의예를보자. 설문데이터입력할때는 324 로입력된다. SAS 프로그램은다음과같다. Q26 변수는문항의번호가입력되어있고 RANK 변수는순위가들어가있다. Q26 RANK 3 1 순위 2 2 순위 첫번째사람응답
5.5. 우선순위문항 109 5.5.2. SPSS 각문항 (V26-V30) 에대한빈도분석결과를정리하여수작업을하면된다. 다른방법이있을것같은데 SPSS 빈도분석결과를엑셀로저장하여하나의표로만드는것이편리하다. 설문예제 Q26_1-Q26_5 (SPSS 데이터에서는 V26-V32) 에대한빈도분석을실시하고 SPSS 출력창에서다음과같이빈도표를수정한다. 엑셀에가서 CTRL+V 로복사한다. V26 은취업전망에대한빈도와동일하다. ( 페이지 98, 취업전망 ) 두번째부터는빈도부분만복사하여엑셀에복사한다.
110 Chapter 5. 빈도분석 만약우선순위문항이페이지 98 처럼조사되었다면 1, 2, 3, 4, 5 가문항보기가되고 V26, V27, V28 이 1 순위, 2 순위, 3 순위결과에해당된다. 즉바로위의엑셀화면에서빨간숫자 는문항의보기에해당되고열은각각 1 순위, 2 순위, 3 순위가된다. 5.6. 보고서작성 인구학적문항빈도분석은빈도표 (frequency table) 와막대그래프나 (bar chart) 파이차트 (pie chart) 를이용하여정리할수있다. 다음은 SAS 출력결과를엑셀로옮겨온후 ( 페이지 90 참고 ) 빈도표작성과그래프그리는방법을소개하려고한다. 숫자대신문항보기내용으로바꾸고누적도수, 누적백분율을제거한다. 그리고채우기 효과, 글꼴설정을일반글자체로바꾸고빈도의합, 비율의합을구한다. 엑셀작업이끝나면빈도표나파이차트를워드문서로옮겨오면된다. 빈도표는마우스로빈도표를선택한다음오른쪽마우스버튼을눌러팝업창의복사하기를선택하고워드에다붙여넣기 (CTRL+V) 실시하면된다. 그래프도같은방법으로복사하여워드문서에넣으면된다. 빈도분석결과는빈도표나파이차트중하나만나타내면된다.
5.6. 보고서작성 111 Q3 도수 백분율 대전 85 65.89 충남 20 15.5 서울 2 1.55 경기 5 3.88 기타 17 13.18 합계 129 100 출신지역분포 경기서울4% 2% 기타 13% 충남 16% 대전 65% 응답자를출신지역별로보면대전 65.9% 로가장많고충남 15.5% 이며그외지역은 18.6% 이다. 대학교의대전지역출신자비율이 80% 인데비해중국경제학부는대전지역출신자가다소낮은것은중국경제학부가 (3+1 학년제도입, 중국현지대학교육 ) 학교내에서경쟁력이있는학부라대전이외지역에서많이온것같다. 서울, 경기, 기타지역의학생들의비율이낮으므로출신지역별로문항의차이를볼때는 3 지역 ( 대전, 충남, 그외지역 ) 으로만나누어분석할것이다. 다중문항과우선순위문항다중문항에대한결과정리및해석은개별문항빈도분석과동일하게 ( 물론빈도는의미가없으니제외 ) 한다. 순위문항에대한보고서작성방법은다음과같이바차트를이용하는것이바람직하다.
112 Chapter 5. 빈도분석 80 70 60 50 40 30 20 10 0 순위 1 순위 2 순위 3 순위 4 순위 5 교수적성취업학문학우 학생들이전공을선택하는데취업은우선순위가가장높고그다음적성이며학우관계는 큰영향을미치지않음을알수있다.
Exercise 113 [ 연습문제 ] (1) 대학교학생으로느끼는점에대한 4 개문항 (Q22~Q25) 각각에대해빈도분석하시오. 빈도분석결과를빈도표와적절한그래프로나타내시오. (2) 우선순위문항 (Q26_1~Q26_5) 에서각순위 (1-5 순위 ) 에대한빈도분석을실시하고해석하시오. (3) 팀프로젝트설문조사결과를텍스트 ( 아스키 ) 데이터로코딩하고 SAS 나 SPSS 데이터로읽으시오. 첫번째설문지에변수명을적고항상가지고다니시오. (4) 팀프로젝트설문지에서빈도분석이가능한문항 ( 인구학적변인문항 ) 에대해빈도분석을하고해석하시오.