IBM SPSS Statistics 25 요약 안내서 IBM
참고 이 정보와 이 정보가 지원하는 제품을 사용하기 전에, 103 페이지의 주의사항 에 있는 정보를 확인하십시오 제품 정보 이 개정판은 새 개정판에서 별도로 명시하지 않는 한, IBM SPSS Statistics의 버전 25, 릴리스 0 수정사항 0 및 모든 후속 릴리스와 수정에 적용됩니다
목차 제 1 장 소개 표본 파일 데이터 파일 열기 분석 실행 도표 작성 1 1 1 3 5 제 2 장 데이터 읽기 데이터 파일의 IBM SPSS Statistics 기본 구조 IBM SPSS Statistics 데이터 파일 읽기 Excel 데이터 읽기 데이터베이스에서 데이터 읽기 텍스트 파일에서 데이터 읽기 9 9 9 10 13 17 제 3 장 데이터 편집기 사용 숫자 데이터 입력 문자열 데이터 입력 데이터 정의 변수 레이블 추가 변수 유형 및 형식 바꾸기 값 레이블 추가 결측 데이터 처리 숫자변수에 대한 결측값 문자열 변수에 대한 결측값 21 21 23 23 23 24 25 26 27 27 제 4 장 개별 변수의 요약 통계 탐색 측정 수준 범주형 데이터에 대한 요약 측도 범주형 데이터에 대한 도표 척도변수에 대한 요약 측도 척도변수에 대한 히스토그램 29 29 29 30 31 32 제 5 장 도표 작성 및 도표 작성 기본 사항 도표 작성기 갤러리 변수 및 통계 정의 텍스트 추가 도표 작성 제 6 장 결과 작업 뷰어 사용 피벗 표 편집기 사용 결과 정의 액세스 피벗 표 편집 사용 35 35 36 37 39 39 41 41 42 42 43 레이어 작성 및 표시 표 편집 행과 열 감추기 데이터 표시 형식 바꾸기 표모양 사전 정의된 형식 사용 표모양 스타일 사용자 정의 기본값 표 형식 바꾸기 초기 출력 설정 사용자 정의 변수와 값 레이블 표시 다른 애플리케이션에서 결과 사용 Word 표로 결과 붙여넣기 텍스트로 결과 붙여넣기 Microsoft Word, PowerPoint 로 결과 내보내기 PDF로 결과 내보내기 HTML로 결과 내보내기 및 Excel 파일 45 45 46 47 49 49 49 52 53 54 56 56 56 제 7 장 구문 사용 구문 붙여넣기 구문 편집 구문 파일 열기 및 중단점 사용하기 67 67 68 69 70 73 73 75 77 77 78 79 80 83 83 84 85 86 86 87 88 89 90 실행 제 8 장 데이터 값 수정 척도변수에서 범주형 변수 작성 새로운 변수 계산 표현식에 함수 사용 조건식 사용 날짜 및 시간을 사용한 작업 두 날짜 사이의 시간 길이 계산 날짜에 기간 더하기 제 9 장 데이터 정렬 및 선택 데이터 정렬 분할 파일 처리 분할 파일 처리의 케이스 정렬 분할 파일 처리 켜기 및 끄기 케이스 서브세트 선택 조건식을 기준으로 케이스 선택 케이스의 무작위 표본 선택 시간 범위 또는 케이스 범위 선택 선택하지 않은 케이스 처리 57 64 65 iii
케이스 선택 상태 90 제 10 장 표본 파일 91 주의사항 103 상표 105 i IBM SPSS Statistics 25 요약 안내서 색인 107
제 1 장 소개 이 안내서는 제공하는 여러 기능의 사용 방법을 설명하기 위해 예제를 통한 단계별 실습을 제공합니 다 이 예제에 표시된 모든 파일은 필요한 경우 스스로 연습해 볼 수 있도록 안내서와 함께 설치되므 로 동일한 분석을 수행했을 때 여기에 표시된 것과 동일한 결과를 얻을 수 있습니다 다양한 통계 분석 기법의 자세한 예제를 보려면 도움말 메뉴에서 사용 가능한 단계별 사례 연구를 수 행해 보십시오 표본 파일 여기에 표시된 대부분의 예제에서는 demosa 데이터 파일을 사용합니다 이 데이터 파일은 수천 명을 대상으로 한 가상 설문조사로 기본적인 인구 통계학적 정보와 소비자에 대한 정보를 포함합니다 Student 버전을 사용 중인 경우, 이 버전에서는 demosa가 제공되는 데이터 파일의 대표적인 표본이 며 이 파일의 케이스 수는 1,500개로 제한되어 있습니다 따라서 이 데이터 파일을 사용하여 얻은 결 과는 여기에 표시된 결과와 다릅니다 제품에 설치된 표본 파일은 설치 디렉토리 표본 추출 하위 디렉토리에서 찾으실 수 있습니다 영어, 프 랑스어, 독일어, 이탈리아어, 일본어, 한국어, 폴란드어, 러시아어, 중국어 간체, 스페인어 및 중국어 번 체 등의 각 언어에 대해 Samples 하위 디렉터리 내에 별도의 폴더가 있습니다 모든 언어에서 모든 표본 파일을 사용할 수 있는 것은 아닙니다 특정 언어로 표본 파일을 사용할 수 없는 경우 해당 언어 폴더에 영어 버전의 표본 파일이 들어 있습니다 데이터 파일 열기 데이터 파일 열기: 1 메뉴에서 다음을 선택합니다 파일 > 열기 > 데이터 파일 열기 대화 상자가 표시됩니다 기본적으로 IBM SPSS Statistics 데이터 파일(확장: sa)이 표시됩니다 이 예제에서는 파일 demosa를 사용합니다 Copyright IBM Corp 1989, 2017 1
그림 1 데이터 편집기의 demosa 파일 데이터 파일이 데이터 편집기에 표시됩니다 데이터 보기에서 마우스 커서를 변수 이름(열 머리말) 위에 두면 해당 변수에 정의된 레이블이 있는 경우 변수 설명 레이블이 나타납니다 기본적으로 실제 데이터 값이 표시됩니다 레이블 표시: 2 메뉴에서 다음을 선택합니다 보기 > 값 레이블 그림 2 값 레이블 단추 또는 도구 모음의 값 레이블 단추를 사용할 수도 있습니다 2 IBM SPSS Statistics 25 요약 안내서
그림 3 데이터 편집기에 표시된 값 레이블 이제 구체적인 값 레이블이 표시되어 반응을 쉽게 이해할 수 있습니다 분석 실행 추가 기능 옵션을 사용하는 경우, 분석 메뉴에 보고 및 통계 분석 범주의 목록이 들어 있습니다 빈도표(개수표) 작성으로 시작합니다 이 예를 사용하려면 Statistics Base Edition이 필요합니다 1 메뉴에서 다음을 선택합니다 분석 > 기술통계량 > 빈도 빈도분석 대화 상자가 표시됩니다 그림 4 빈도분석 대화 상자 각 변수 옆의 아이콘은 데이터 유형 및 측정 수준에 대한 정보를 제공합니다 제 1 장 소개 3
숫자 척도(연속형) 문자열 날짜 시간 해당 없음 순서 명목 변수 레이블 및/또는 이름이 목록에서 잘려 나타날 경우 커서를 변수 위에 두면 구체적인 레이블/ 이름이 표시됩니다 변수 이름 소득범주가 대괄호 안에 변수 설명 레이블 뒤에 표시됩니다 가구소 득범주 [단위: 1000]는 변수 레이블입니다 변수 레이블이 없을 경우 변수 이름만 목록 상자에 나 타납니다 외부 경계나 모서리를 클릭하고 끌어 창과 마찬가지로 대화 상자 크기를 조정할 수 있습니다 예 를 들어, 대화 상자를 더 넓게 만들면 변수 목록도 넓어집니다 대화 상자 왼쪽의 소스 목록에서 분석하려는 변수를 선택하고 오른쪽의 변수 목록으로 끌어 놓습 니다 확인 단추는 하나 이상의 변수를 변수 목록으로 옮기면 활성화되고, 이 단추를 클릭하면 분 석이 실행됩니다 많은 대화 상자에서, 목록에 있는 변수 이름을 마우스 오른쪽 단추로 클릭하고 팝업 메뉴에서 변 수 정보를 선택하면 추가 정보를 볼 수 있습니다 2 소스 변수 목록에서 성별 [성별]을 클릭하고 변수를 대상 변수 목록으로 끌어다 놓습니다 3 소스 목록의 가구소득범주 [단위: 1000] [소득범주]를 클릭한 다음 대상 목록으로 끌어다 놓습니다 그림 5 분석을 위해 선택한 변수 4 IBM SPSS Statistics 25 요약 안내서
4 확인을 클릭하여 프로시저를 실행합니다 결과가 뷰어 창에 표시됩니다 그림 6 가구소득 범주에 대한 빈도표 도표 작성 몇 가지 통계 프로시저를 통해 도표를 작성할 수 있지만 그래프 메뉴를 사용하여 도표를 작성할 수도 있습니다 예를 들어, 핸드폰 서비스와 PDA(Personal Digital Assistant) 소유권 간의 관계를 보여주는 도표를 작성할 수 있습니다 1 메뉴에서 다음을 선택합니다 그래프 > 도표 작성기 제 1 장 소개 5
그림 7 완성된 끌어놓기 영역이 표시된 도표 작성기 대화 상자 2 갤러리 탭을 클릭합니다(선택되어 있지 않은 경우) 3 막대 탭을 클릭합니다(선택되어 있지 않은 경우) 4 갤러리 위의 넓은 영역인 캔버스로 수평배열 막대도표 아이콘을 끕니다 5 변수 목록에서 아래로 스크롤하여 핸드폰 [핸드폰]을 마우스 오른쪽 단추로 클릭한 다음 명목을 해 당 측정 수준으로 선택합니다 6 핸드폰 [핸드폰] 변수를 x축으로 끕니다 7 PDA 소유 [PDA 보유]를 마우스 오른쪽 단추로 클릭한 다음 명목을 해당 측정 수준으로 선택합 니다 8 PDA 소유 [PDA 보유] 변수를 캔버스 오른쪽 위에 있는 군집 끌어놓기 영역으로 끕니다 9 확인을 클릭하여 도표를 작성합니다 6 IBM SPSS Statistics 25 요약 안내서
그림 8 뷰어 창에 표시된 막대도표 막대도표가 뷰어에 표시됩니다 막대도표는 무선 전화 서비스를 사용하는 사람이 핸드폰을 사용하지 않 는 사람보다 훨씬 더 많이 PDA를 갖고 있음을 보여 줍니다 뷰어 창의 목차 분할창에서 도표와 표를 두 번 클릭하여 편집하고 결과를 복사하여 다른 애플리케이션 에 붙여넣을 수 있습니다 이러한 항목은 뒷부분에서 다룹니다 제 1 장 소개 7
8 IBM SPSS Statistics 25 요약 안내서
제 2 장 데이터 읽기 데이터는 직접 입력하거나 여러 다른 소스에서 가져올 수 있습니다 이 장에서는 IBM SPSS Statistics 데이터 파일, Microsoft Excel과 같은 스프레드시트 애플리케이션, Microsoft Access와 같은 데이터베 이스 애플리케이션 및 텍스트 파일에 저장된 데이터 읽기 프로세스를 설명합니다 데이터 파일의 IBM SPSS Statistics 기본 구조 그림 9 데이터 편집기 IBM SPSS Statistics 데이터 파일은 케이스(행)와 변수(열)로 구성됩니다 이 데이터 파일에서 케이스 는 설문조사에 반응한 개별 반응자를 나타냅니다 변수는 설문조사에 있는 각 질문 사항에 대한 반응 을 나타냅니다 IBM SPSS Statistics 데이터 파일 읽기 IBM SPSS Statistics 데이터 파일은 파일 확장이 sa이며 저장된 데이터를 포함합니다 1 메뉴에서 다음을 선택합니다 파일 > 열기 > 데이터 2 demosa를 찾은 다음 이 파일을 엽니다 자세한 정보는 91 페이지의 제 10 장 표본 파일 주 제를 참조하십시오 데이터 편집기에 데이터가 표시됩니다 Copyright IBM Corp 1989, 2017 9
그림 10 열려 있는 데이터 파일 Excel 데이터 읽기 데이터 편집기에 모든 데이터를 직접 입력하지 않고 Microsoft Excel과 같은 애플리케이션에서 데이 터를 읽을 수 있습니다 열 머리말을 변수 이름으로 읽을 수도 있습니다 1 메뉴에서 다음을 선택합니다 파일 > 데이터 가져오기 > Excel 2 Samples\English 폴더로 이동하여 demoxlsx를 선택합니다 Excel 파일 읽기 대화 상자에 데이터 파일의 미리보기가 표시됩니다 파일에 있는 첫 번째 시트의 컨텐츠가 표시됩니다 파일에 여러 개의 시트가 있는 경우 목록에서 시트를 선택할 수 있습니다 Gender의 문자열 값 중 일부에는 선행 공백이 있습니다 MaritalStatus의 값 중 일부는 마침표()로 표시됩니다 10 IBM SPSS Statistics 25 요약 안내서
그림 11 Excel 파일 읽기 대화 상자 3 데이터 첫 행에서 변수 이름 읽어오기가 선택되었는지 확인합니다 열 머리말이 변수 이름 규칙을 따르지 않는 경우 열 머리말은 유효한 변수 이름으로 변환됩니다 원래 열 머리말은 변수 레이블 로 저장됩니다 4 문자열 값에서 선행 공백 제거를 선택합니다 5 데이터 유형을 결정하는 값의 퍼센트를 선택 취소합니다 제 2 장 데이터 읽기 11
시스템 결측값인 셀에 이제 문자열 값 "응답 없음"이 표시됩니다 값 퍼센트 매개변수가 있고 열에 혼합 데이터 유형이 포함되는 경우 변수는 문자열 데이터 유형으로 읽혀집니다 모든 값이 보존되 지만 숫자값은 문자열 값으로 처리됩니다 6 데이터 유형을 결정하는 값의 퍼센트를 선택하여 MaritalStatus를 숫자 변수로 처리합니다 7 확인을 클릭하여 Excel 파일을 읽습니다 이제 열 머리말이 변수 이름으로 사용된 데이터가 데이터 편집기에 나타납니다 변수 이름은 공백을 포 함할 수 없으므로 원래 열 머리말에서 공백이 제거됩니다 예를 들어, 열 머리말 "결혼 상태"가 MaritalStatus 변수로 변환됩니다 원래 열 머리말은 변수 레이블로 유지됩니다 12 IBM SPSS Statistics 25 요약 안내서
그림 12 가져온 Excel 데이터 관련 정보: 91 페이지의 제 10 장 표본 파일 데이터베이스에서 데이터 읽기 데이터베이스 마법사를 사용하여 데이터베이스 소스에서 데이터를 쉽게 가져올 수 있습니다 ODBC(Open Database Connectiity) 드라이버를 설치하면 이 드라이버를 사용하는 데이터베이스를 직접 읽을 수 있습니다 여러 데이터베이스 형식의 ODBC 드라이버가 설치 CD에 제공됩니다 타공급 업체의 드라이버를 추가할 수도 있습니다 가장 많이 사용되는 데이터베이스 애플리케이션 중 하나인 Microsoft Access를 이 예제에서 설명합니다 참고: 이 예제는 Microsoft Windows에 관련한 예제이며 Access용 ODBC 드라이버가 필요합니다 Microsoft Access ODBC 드라이버는 32비트 버전의 IBM SPSS Statistics에서만 작동합니다 단계는 다른 플랫폼에서와 유사하지만 타사의 Access용 ODBC 드라이버가 필요할 수 있습니다 1 메뉴에서 다음을 선택합니다 파일 > 데이터 가져오기 > 데이터베이스 > 새 쿼리 제 2 장 데이터 읽기 13
그림 13 데이터베이스 마법사 시작 대화 상자 2 데이터 소스 목록에서 MS Access Database를 선택하고 다음을 클릭합니다 참고: 설치에 따라 마법사의 왼쪽에 OLE DB 데이터 소스 목록이 표시될 수도 있지만(Windows 운영체제에만 해당) 이 예제에서는 오른쪽에 표시된 ODBC 데이터 소스 목록을 사용합니다 3 찾아보기를 클릭하여 열려는 Access 데이터베이스 파일을 탐색합니다 4 demomdb를 엽니다 자세한 정보는 91 페이지의 제 10 장 표본 파일 주제를 참조하십시오 5 로그인 대화 상자에서 확인을 클릭합니다 다음 단계에서는 가져올 표와 변수를 지정할 수 있습니다 14 IBM SPSS Statistics 25 요약 안내서
그림 14 데이터 선택 단계 6 전체 demo 표를 이 순서로 필드 검색 목록으로 끕니다 7 다음을 클릭합니다 다음 단계에서는 가져올 레코드(케이스)를 선택할 수 있습니다 일부 케이스만 가져오려면 케이스서브세트(예: 30세 이상의 남자)를 가져오거나 데이터 소스에서 무작위로 케이스 표본을 가져올 수 있습니다 큰 데이터 소스의 경우 케이스 수를 작은 대표 표 본으로 제한하여 처리 시간을 줄일 수 있습니다 8 계속하려면 다음을 클릭합니다 필드 이름은 변수 이름을 작성하는 데 사용됩니다 필요한 경우 이름은 유효한 변수 이름으로 변 환됩니다 원래 필드 이름은 변수 레이블로 유지됩니다 데이터베이스를 가져오기 전에 변수 이름 을 변경할 수도 있습니다 제 2 장 데이터 읽기 15
그림 15 변수 정의 단계 9 성별 필드의 숫자로 코딩변경 셀을 선택합니다 이 옵션은 문자열 변수를 정수변수로 변환하고 원 래 값을 새 변수의 값 레이블로 유지합니다 10 계속하려면 다음을 클릭합니다 데이터베이스 마법사에서 선택한 항목에 따라 작성된 SQL 문이 결과 단계에 나타납니다 이 SQL 문을 지금 실행하거나 나중에 사용할 수 있도록 저장할 수 있습니다 11 데이터를 가져오려면 마침을 클릭합니다 가져오도록 선택한 Access 데이터베이스의 모든 데이터를 이제 데이터 편집기에서 사용할 수 있습니 다 16 IBM SPSS Statistics 25 요약 안내서
텍스트 파일에서 데이터 읽기 텍스트 파일은 다른 하나의 공통 데이터 소스를 나타냅니다 많은 스프레드시트 프로그램과 데이터베 이스에서 해당 내용을 여러 텍스트 파일 형식 중 하나로 저장할 수 있습니다 콤마나 탭으로 구분된 파일은 콤마나 탭을 사용하여 각 변수를 나타내는 데이터의 행을 참조합니다 이 예에서 데이터는 탭 으로 구분됩니다 1 메뉴에서 다음을 선택합니다 파일 > 데이터 가져오기 > 텍스트 데이터 2 Samples\English 폴더로 이동하여 demotxt를 선택합니다 텍스트 가져오기 마법사는 지정한 텍스트 파일에 대한 해석 방법을 정의하는 프로세스를 안내합 니다 그림 16 텍스트 가져오기 마법사: 6단계 중 1단계 3 1단계에서는 사전 정의한 형식을 선택하거나 마법사로 새 형식을 작성할 수 있습니다 아니오를 선택합니다 4 계속하려면 다음을 클릭합니다 앞에서 언급한 대로 이 파일에서는 탭으로 구분된 형식을 사용합니다 또한, 변수 이름은 이 파일 의 맨 위 행에 정의됩니다 5 마법사의 2단계에서 구분자에 의한 배열을 선택하여 파일의 구조가 구분 형식 구조임을 표시합니 다 6 예를 선택하여 파일 맨 위에 변수 이름이 포함됨을 표시합니다 제 2 장 데이터 읽기 17
7 계속하려면 다음을 클릭합니다 8 변수 이름이 첫 번째 행에 있으므로 3단계에서 데이터의 첫 번째 케이스가 시작하는 행 번호에 대해 2를 입력하십시오 9 이 단계의 나머지 옵션은 기본값을 유지하고 계속하려면 다음을 클릭합니다 4단계의 데이터 미리보기를 통해 파일을 제대로 읽고 있는지 신속하게 확인할 수 있습니다 10 탭을 선택하고 구분자의 다른 옵션을 선택 해제합니다 파일에 공백이 있으므로 기본적으로 공백 이 선택됩니다 이 파일의 경우, 공백은 데이터 값의 일부이고 구분자가 아닙니다 파일을 올바로 읽으려면 공백을 선택 취소해야 합니다 11 문자열 값의 선행 공백 제거를 선택합니다 문자열 값의 맨 앞에 있는 공백은 표현식에서 문자열 값이 평가되는 방법에 영향을 미칩니다 이 파일에서 Gender의 일부 값은 값의 일부가 아닌 선행 공백을 포함합니다 그러한 공백을 제거하지 않는 경우 " f" 값은 "f"와 다른 값으로 처리됩니다 그림 17 텍스트 가져오기 마법사: 6단계 중 4단계 12 계속하려면 다음을 클릭합니다 변수 이름이 이름 규칙을 따르도록 수정되므로 5단계에서는 적합하지 않은 이름을 편집할 수 있 는 기회를 제공합니다 여기서 데이터 유형을 정의할 수도 있습니다 예를 들어, Income을 달러 통화 형식으로 변경할 수 있습니다 데이터 유형 변경: 13 데이터 미리보기에서 Income을 선택합니다 18 IBM SPSS Statistics 25 요약 안내서
14 데이터 형식 드롭다운 목록에서 달러를 선택합니다 그림 18 데이터 형식 바꾸기 MaritalStatus 변수에는 문자열 값과 숫자값이 모두 포함됩니다 값 중 5% 미만이 문자열입니다 자동 데이터 형식을 결정하는 값의 퍼센트에 기본 설정 95%를 사용하는 경우 변수는 숫자로 처 리되고 문자열 값은 시스템 결측값으로 설정됩니다 퍼센트 값을 충족하는 데이터 형식이 없으면 변수는 문자열 변수로 처리됩니다 설정을 100으로 변경하면 모든 값이 보존되지만 모든 숫자값 이 문자열로 처리됩니다 15 계속하려면 다음을 클릭합니다 16 데이터를 가져오려면 마지막 단계의 선택을 기본값으로 유지하고 마침을 클릭합니다 제 2 장 데이터 읽기 19
20 IBM SPSS Statistics 25 요약 안내서
제 3 장 데이터 편집기 사용 데이터 편집기는 활성 데이터 파일의 내용을 표시합니다 데이터 편집기의 정보는 변수와 케이스로 구 성됩니다 데이터 보기에서 열은 변수를 나타내고 행은 케이스(관측값)를 나타냅니다 변수 보기에서 각 행은 변수이고 각 열은 해당 변수와 관련된 속성입니다 변수는 컴파일한 다른 유형의 데이터를 나타내는 데 사용되며 일반적으로 설문조사에 의한 유추법이 적용됩니다 설문조사에서 각 질문에 대한 반응이 변수에 해당합니다 변수는 숫자, 문자열, 통화 및 날 짜를 비롯하여 다양한 유형으로 표시됩니다 숫자 데이터 입력 데이터 편집기에 데이터를 입력할 수 있으며 작은 데이터 파일을 사용하거나 큰 데이터 파일을 약간씩 편집하는 경우에 유용합니다 1 데이터 편집기 창의 아래에서 변수 보기 탭을 클릭합니다 사용할 변수를 정의해야 합니다 이 경우에는 세 가지 변수인 연령, 결혼 상태 및 가구소득만 필 요합니다 그림 19 변수 보기의 변수 이름 2 첫 번째 열의 첫 번째 행에 연령을 입력합니다 21
3 두 번째 행에 결혼 상태를 입력합니다 4 세 번째 행에 가구소득을 입력합니다 새 변수에는 자동으로 숫자 데이터 유형이 제공됩니다 변수 이름을 입력하지 않을 경우 고유한 이름이 자동으로 작성됩니다 그러나 자동으로 작성되는 이름은 해당 변수를 설명하지 않으므로 큰 데이터 파일의 경우 직접 입력하는 것이 좋습니다 5 데이터 보기 탭을 클릭하여 데이터 입력을 계속합니다 변수 보기에 입력한 이름이 이제 데이터 보기의 처음 세 개 열에서 머리말이 됩니다 첫 번째 열부터 시작하여 첫 번째 행에 데이터 입력을 시작합니다 그림 20 데이터 보기에 입력한 값 6 연령 열에 55를 입력합니다 7 결혼 상태 열에 1을 입력합니다 8 가구소득 열에 72000을 입력합니다 9 커서를 첫 번째 열의 두 번째 행으로 이동하여 다음 개체의 데이터를 추가합니다 10 연령 열에 53을 입력합니다 11 결혼 상태 열에 0을 입력합니다 12 가구소득 열에 153000을 입력합니다 연령 및 결혼 상태 열은 정수 값을 가져야 하지만 기본적으로 소수점 형식으로 표시됩니다 이러 한 변수에서 소수점을 감추려면 다음과 같이 하십시오 13 데이터 편집기 창의 아래에서 변수 보기 탭을 클릭합니다 22 IBM SPSS Statistics 25 요약 안내서
14 연령 행의 소수점이하자리 열에 0을 입력하여 소수점이하자리를 감춥니다 15 결혼 상태 행의 소수점이하자리 열에 0을 입력하여 소수점이하자리를 감춥니다 문자열 데이터 입력 텍스트의 문자와 같은 비숫자 데이터를 데이터 편집기에 입력할 수도 있습니다 1 데이터 편집기 창의 아래에서 변수 보기 탭을 클릭합니다 2 비어 있는 첫 번째 행의 첫 번째 셀에 변수 이름으로 성별을 입력합니다 3 항목 옆의 유형 셀을 클릭합니다 4 유형 셀 오른쪽의 단추를 클릭하여 변수 유형 대화 상자를 엽니다 5 문자열을 선택하여 변수 유형을 지정합니다 6 확인을 클릭하여 선택을 저장하고 데이터 편집기로 돌아갑니다 그림 21 변수 유형 대화 상자 데이터 정의 데이터 유형 정의와 함께 변수 이름과 데이터 값에 대해 변수 설명 레이블 및 값 레이블도 정의할 수 있습니다 이러한 설명 레이블은 통계 보고서와 도표에 사용됩니다 변수 레이블 추가 레이블에서는 변수 이름을 서술합니다 대부분 변수 이름을 길게 풀어 쓴 것입니다 레이블은 255바이 트를 넘지 않아야 합니다 이러한 레이블은 결과에서 다른 변수를 식별하는 데 사용됩니다 1 데이터 편집기 창의 아래에서 변수 보기 탭을 클릭합니다 2 연령 행의 레이블 열에 반응자 연령을 입력합니다 제 3 장 데이터 편집기 사용 23
3 결혼 상태 행의 레이블 열에 결혼 상태를 입력합니다 4 가구소득 행의 레이블 열에 가구소득을 입력합니다 5 성별 행의 레이블 열에 성별을 입력합니다 그림 22 변수 보기에 입력된 값 레이블 변수 유형 및 형식 바꾸기 유형 열에는 각 변수의 현재 데이터 유형이 표시됩니다 가장 일반적인 데이터 유형은 숫자와 문자열 이지만 기타 여러 가지 형식이 지원됩니다 현재 데이터 파일에서 가구소득 변수는 숫자 유형으로 정 의됩니다 1 가구소득 행에서 유형 셀을 클릭한 다음 셀 오른쪽의 단추를 클릭하여 변수 유형 대화 상자를 엽 니다 2 24 달러를 선택합니다 IBM SPSS Statistics 25 요약 안내서
그림 23 변수 유형 대화 상자 현재 선택한 데이터 유형에 대한 형식 지정 옵션이 표시됩니다 3 이 예제에서는 통화 형식으로 $###,###,###을 선택합니다 4 확인을 클릭하여 변경 내용을 저장합니다 값 레이블 추가 값 레이블의 변수값을 문자열 레이블에 매핑할 수 있습니다 이 예제에서는 결혼 상태 변수에 두 가지 값이 허용됩니다 값이 0이면 개체가 미혼이며 값이 1이면 기혼임을 의미합니다 1 결혼 상태 행에서 값 셀을 클릭한 다음 셀 오른쪽의 단추를 클릭하여 값 레이블 대화 상자를 엽니 다 값은 실제 숫자값입니다 값 레이블은 지정된 숫자값에 적용되는 문자열 레이블입니다 2 변수값 필드에 0을 입력합니다 3 레이블 필드에 미혼을 입력합니다 4 추가를 클릭하여 이 레이블을 목록에 추가합니다 제 3 장 데이터 편집기 사용 25
그림 24 값 레이블 대화 상자 5 변수값 필드에 1을 입력한 다음 레이블 필드에 기혼을 입력합니다 6 추가를 클릭한 다음 확인을 클릭하여 변경 내용을 저장하고 데이터 편집기로 돌아갑니다 이러한 레이블은 또한 데이터 보기에도 표시될 수 있으며 이 경우 데이터를 더 읽기 쉽게 만드는 데 도움이 됩니다 7 데이터 편집기 창의 아래에서 데이터 보기 탭을 클릭합니다 8 메뉴에서 다음을 선택합니다 보기 > 값 레이블 이제 데이터 편집기에 값을 입력할 때 목록에 레이블이 표시됩니다 이 설정은 유효한 반응을 제안하 고 반응을 구체적으로 서술하는 데 유용합니다 값 레이블 메뉴 항목이 이미 활성화되어 있는 경우(항목 옆에 체크 표시가 있음) 값 레이블을 다시 선 택하면 값 레이블 표시가 해제됩니다 결측 데이터 처리 일반적으로 결측 데이터나 유효하지 않은 데이터가 발생하는 이유는 대개 비슷하기 때문에 분석 시 무 시할 수 없습니다 설문조사 반응자가 특정 질문에 대답하기를 거부하거나, 답을 알지 못하거나, 예상 치 않은 형식으로 대답하기 때문입니다 이러한 데이터를 필터링 또는 식별하지 않으면 분석 결과가 정 확하지 않을 수 있습니다 숫자 데이터의 경우 빈 데이터 필드나 잘못된 항목을 포함하는 필드는 하나의 마침표로 식별 가능한 시스템-결측값으로 변환됩니다 결측이 발생하는 이유는 분석에 중요할 수 있습니다 예를 들어, 질문에 대답하는 것을 거부한 반응자 와 해당 사항이 없기 때문에 질문에 대답하지 않은 반응자를 서로 구별하는 것이 유용할 수 있습니다 26 IBM SPSS Statistics 25 요약 안내서
숫자변수에 대한 결측값 1 데이터 편집기 창의 아래에서 변수 보기 탭을 클릭합니다 2 연령 행에서 결측 셀을 클릭한 다음 셀 오른쪽의 단추를 클릭하여 결측값 대화 상자를 엽니다 이 대화 상자에서 최대 세 개의 이산형 결측값을 지정하거나 값 범위와 하나의 추가 이산값을 지 정할 수 있습니다 그림 25 결측값 대화 상자 3 이산형 결측값을 선택합니다 4 첫 번째 입력란에 999를 입력하고 다른 두 개의 입력란은 비워 둡니다 5 확인을 클릭하여 변경 내용을 저장하고 데이터 편집기로 돌아갑니다 이제 결측 데이터 값이 추가되었으며 레이블을 해당 값에 적용할 수 있습니다 6 연령 행에서 값 셀을 클릭한 다음 셀 오른쪽의 단추를 클릭하여 값 레이블 대화 상자를 엽니다 7 변수값 필드에 999를 입력합니다 8 레이블 필드에 무반응을 입력합니다 9 추가를 클릭하여 이 레이블을 데이터 파일에 추가합니다 10 확인을 클릭하여 변경 내용을 저장하고 데이터 편집기로 돌아갑니다 문자열 변수에 대한 결측값 문자열 변수에 대한 결측값은 숫자변수에 대한 결측값과 비슷하게 처리됩니다 그러나 숫자변수와 달 리 문자열 변수의 빈 필드는 시스템-결측값으로 지정되지 않습니다 대신, 이러한 필드는 빈 문자열로 해석됩니다 1 데이터 편집기 창의 아래에서 변수 보기 탭을 클릭합니다 2 성별 행에서 결측 셀을 클릭한 다음 셀 오른쪽의 단추를 클릭하여 결측값 대화 상자를 엽니다 3 이산형 결측값을 선택합니다 4 첫 번째 입력란에 NR을 입력합니다 제 3 장 데이터 편집기 사용 27
문자열 변수에 대한 결측값은 대소문자를 구분합니다 따라서 nr 값은 결측값으로 간주되지 않습 니다 5 확인을 클릭하여 변경 내용을 저장하고 데이터 편집기로 돌아갑니다 이제 결측값에 대한 레이블을 추가할 수 있습니다 6 성별 행에서 값 셀을 클릭한 다음 단추를 클릭하여 값 레이블 대화 상자를 엽니다 7 변수값 필드에 NR을 입력합니다 8 레이블 필드에 무반응을 입력합니다 9 추가를 클릭하여 이 레이블을 프로젝트에 추가합니다 10 확인을 클릭하여 변경 내용을 저장하고 데이터 편집기로 돌아갑니다 28 IBM SPSS Statistics 25 요약 안내서
제 4 장 개별 변수의 요약 통계 탐색 이 절에서는 간단한 요약 측도 및 사용해야 하는 통계 유형에 변수 측정 수준이 주는 영향에 대해 설 명합니다 데이터 파일 demosa를 사용할 것입니다 자세한 정보는 91 페이지의 제 10 장 표본 파 일 주제를 참조하십시오 측정 수준 데이터 유형별로 측정 수준에 맞는 요약 측정이 필요합니다 범주형 고유한 값/범주 수가 제한된 데이터(예: 성별 또는 결혼 상태)입니다 질적 데이터라고도 합니 다 문자열(문숫자) 데이터 변수 또는 숫자 코드를 사용하여 범주를 나타내는 숫자변수(예: 0 = 미혼, 1 = 기혼)가 범주형 변수에 해당될 수 있습니다 두 가지 기본 범주형 데이터 유형이 있습니다 명목 범주에 순서가 없는 범주형 데이터입니다 예를 들어, 판매 직업 범주는 마케팅 또는 조사 직 업 범주와 비교하여 높고 낮음의 순서를 구분할 수 없습니다 순서 범주 간에 의미상의 순서는 있지만 이러한 범주 간의 차이는 측정할 수 없는 범주형 데이터 입니다 예를 들어, 높음, 중간, 낮음과 같이 값의 순서가 있어도 이러한 값들 간의 "차이"는 계산할 수 없습니다 척도 구간 또는 비율 척도로 측정된 데이터에서 데이터 값은 값의 순서와 차이를 모두 나타냅니다 예 를 들어, $72,195의 급여는 $52,398보다 높은 순위이고 두 값의 차이는 $19,797입니다 이러한 데이터 는 양적 데이터 또는 연속형 데이터라고도 합니다 범주형 데이터에 대한 요약 측도 범주형 데이터의 경우 가장 일반적인 요약 측도는 각 범주의 케이스 수 또는 퍼센트입니다 최빈값은 케이스가 가장 많은 범주입니다 순서 데이터의 경우 중앙값(전체 케이스의 절반이 위아래에 해당되는 값)은 범주가 많을 경우 유용한 요약 측도가 될 수도 있습니다 빈도분석 프로시저는 변수의 각 관측값에 대한 케이스 수와 퍼센트를 모두 표시하는 빈도표를 생성합 니다 1 메뉴에서 다음을 선택합니다 분석 > 기술통계량 > 빈도 참고: 이 기능을 사용하려면 Statistics Base Edition이 필요합니다 2 PDA 소유 [PDA보유]와 TV 소유 [TV보유]를 선택하여 변수 목록으로 이동합니다 29
그림 26 분석을 위해 선택한 범주형 변수 3 확인을 클릭하여 프로시저를 실행합니다 그림 27 빈도표 빈도표가 뷰어 창에 표시됩니다 이 빈도표를 보면 약 204%만이 PDA를 소유하고 있지만 거의 모든 사람이 TV(990%)를 소유하고 있음을 알 수 있습니다 이는 TV를 소유하지 않은 소규모 그룹에 대한 자세한 정보를 찾을 때는 유용하지만 그리 적합한 표 형식은 아닙니다 범주형 데이터에 대한 도표 빈도표에 막대도표나 원형 도표로 정보를 그림으로 표시할 수 있습니다 1 30 빈도분석 대화 상자를 다시 엽니다 두 개의 변수가 선택되어 있어야 합니다 IBM SPSS Statistics 25 요약 안내서
도구 모음에서 대화 상자 다시 불러오기 단추를 사용하여 최근에 사용한 프로시저로 바로 돌아갈 수 있습니다 그림 28 대화 상자 다시 불러오기 단추 2 도표를 클릭합니다 3 막대도표를 선택한 다음 계속을 클릭합니다 4 기본 대화 상자에서 확인을 클릭하여 프로시저를 실행합니다 그림 29 막대도표 빈도표에 나와 있는 정보가 그대로 이 막대도표 형식으로 표시되므로 PDA를 소유하고 있는 사람은 매우 적지만 거의 모든 사람이 TV를 소유하고 있음을 쉽게 알 수 있습니다 척도변수에 대한 요약 측도 다음을 비롯하여 척도변수에 사용할 수 있는 여러 가지 요약 측도가 있습니다 중심 경향 측도 가장 일반적인 중심 경향 측도는 평균(산술 평균)과 중앙값(전체 케이스의 반은 값 의 위에, 나머지 반은 아래에 포함시키는 중간값)입니다 산포 측도 데이터에 분포되어 있는 변동의 양을 측도하는 통계에는 표준 편차, 최소값, 최대값이 있 습니다 1 빈도분석 대화 상자를 다시 엽니다 제 4 장 개별 변수의 요약 통계 탐색 31
2 이전 설정을 지우려면 재설정을 클릭합니다 3 가구소득 [단위:1000] [가구소득]을 선택하여 변수 목록으로 이동합니다 4 통계를 클릭합니다 5 평균, 중앙값, 표준 편차, 최소값, 최대값을 선택합니다 6 계속을 클릭합니다 7 기본 대화 상자에서 빈도표 출력을 선택 해제합니다 빈도표는 데이터 파일에 있는 케이스 수만큼 의 고유한 값을 가지고 있기 때문에 척도변수에는 유용하지 않습니다 8 확인을 클릭하여 프로시저를 실행합니다 빈도 통계표가 뷰어 창에 표시됩니다 그림 30 빈도 통계표 이 예제에서는 평균과 중앙값의 차이가 매우 큽니다 평균이 중앙값보다 거의 25,000 이상 큰데 이는 값이 정상적으로 분포되지 않았음을 나타냅니다 히스토그램을 사용하여 이러한 분포 상황을 시각적으 로 확인할 수 있습니다 척도변수에 대한 히스토그램 1 빈도분석 대화 상자를 다시 엽니다 2 도표를 클릭합니다 3 히스토그램과 정규 곡선 표시를 선택합니다 4 계속을 클릭한 다음 기본 대화 상자의 확인을 클릭하여 프로시저를 실행합니다 32 IBM SPSS Statistics 25 요약 안내서
그림 31 히스토그램 대부분의 케이스가 100,000 아래로 떨어져 척도의 아래쪽 끝에 군집되어 있지만 500,000 범위를 초과 하는 케이스가 몇 개 있습니다 이는 매우 적은 수이기 때문에 히스토그램을 수정해야 볼 수 있습니다 이러한 소수 케이스의 상한값이 평균에는 중요한 영향을 주지만 중앙값에는 거의 영향을 주지 않으므 로 이 예제에서는 중앙값이 중심 경향 지표로 적합합니다 제 4 장 개별 변수의 요약 통계 탐색 33
34 IBM SPSS Statistics 25 요약 안내서
제 5 장 도표 작성 및 편집 다양한 도표 유형을 작성하고 편집할 수 있습니다 이 장에서 막대도표를 작성하고 편집하게 됩니다 모든 도표 유형에 원리를 적용할 수 있습니다 도표 작성 기본 사항 도표 작성 기본 사항을 설명하기 위해 여러 수준의 직업만족도별 평균 소득에 관한 막대도표를 작성합 니다 이 예제에서는 데이터 파일 demosa를 사용합니다 자세한 정보는 91 페이지의 제 10 장 표 본 파일 주제를 참조하십시오 1 메뉴에서 다음을 선택합니다 그래프 > 도표 작성기 도표 작성기 대화 상자는 도표를 작성하는 동안 도표 모양을 미리 볼 수 있는 대화형 창입니다 Copyright IBM Corp 1989, 2017 35
그림 32 도표 작성기 대화 상자 도표 작성기 갤러리 사용 1 갤러리 탭이 선택되어 있지 않은 경우 갤러리 탭을 클릭합니다 갤러리에는 여러 가지 사전 정의된 도표가 도표 유형별로 구성되어 있습니다 기본 요소 탭도 스 크래치에서 도표를 작성할 수 있는 기본 요소(예: 축, 그래픽 요소 등)를 제공하지만 갤러리를 사 용하는 것이 더 쉽습니다 2 막대가 선택되어 있지 않은 경우 막대를 클릭합니다 갤러리에 사용 가능한 막대도표를 나타내는 아이콘이 대화 상자에 나타납니다 그림을 보면 특정 도표 유형을 쉽게 확인할 수 있습니다 추가 정보가 필요한 경우 아이콘 위에 커서를 일시 중지하 여 도표의 도구 팁 설명을 표시할 수도 있습니다 3 갤러리 위의 넓은 영역인 "캔버스"로 단순 막대도표 아이콘을 끕니다 캔버스에 도표 작성기의 미 리보기가 표시됩니다 도표를 그리는 데 사용하는 데이터는 실제 데이터가 아니라 예제 데이터입 니다 36 IBM SPSS Statistics 25 요약 안내서
그림 33 도표 작성기 캔버스의 막대도표 변수 및 통계 정의 캔버스에 도표가 있지만 막대 높이를 제어하고 각 막대에 해당하는 변수 범주를 지정할 변수 또는 통 계가 없으므로 이 도표는 완전한 것이 아닙니다 변수 또는 통계가 없는 도표는 작성할 수 없습니다 캔버스의 왼쪽에 있는 변수 목록에서 변수를 끌어서 추가합니다 도표 작성기에서는 변수의 측정 수준이 중요합니다 x축에는 직업만족도 변수를 사용합니다 그러나 변 수 옆에 있는 눈금자 모양의 아이콘은 해당 측정 수준이 척도로 정의되어 있음을 나타냅니다 올바른 도표를 작성하려면 범주형 측정 수준을 사용해야 합니다 이전으로 돌아가 변수 보기에서 측정 수준을 바꾸는 대신 도표 작성기에서 일시적으로 측정 수준을 변경할 수 있습니다 1 변수 목록에서 직업만족도를 마우스 오른쪽 단추로 클릭하고 순서를 선택합니다 직업만족도의 범 주는 만족도 수준에 따라 순위를 정할 수 있으므로 순서가 적절한 측정 수준입니다 측정 수준을 변경하면 아이콘도 따라서 바뀝니다 2 이제 직업만족도를 변수 목록에서 x축 끌어놓기 영역으로 끕니다 제 5 장 도표 작성 및 편집 37
y축 끌어놓기 영역의 기본값은 개수 통계입니다 그러나 원하는 경우 퍼센트 또는 평균과 같은 다 른 통계로 쉽게 바꿀 수 있습니다 이 예제에서는 이러한 통계를 사용하지 않지만 나중에 통계를 변경해야 하는 경우를 대비하여 해당 프로세스를 검토해 봅니다 3 도표 작성기의 세로 막대에서 요소 특성 탭을 클릭합니다 세로 막대가 표시되지 않으면 도표 작 성기의 오른쪽 상단 코너에 있는 단추를 클릭하여 세로 막대를 표시하십시오 그림 34 요소 특성 요소 특성에서는 여러 도표 요소의 특성을 변경할 수 있습니다 이러한 요소에는 막대도표의 막대 와 같은 그래픽 요소 및 도표의 축이 포함됩니다 다음 특성 편집 목록에서 관련된 특성을 변경할 요소 하나를 선택합니다 또한 목록의 오른쪽에 있는 빨간색 X 표시에 유의합니다 이 단추는 캔 버스에서 그래픽 요소를 삭제합니다 막대1을 선택했으므로 표시된 특성이 그래픽 요소, 특히 막대 그래픽 요소에 적용됩니다 통계 드롭다운 목록에서는 사용 가능한 특정 통계를 보여 줍니다 일반적으로 모든 도표 유형에 동 일한 통계를 사용할 수 있습니다 그러나 일부 통계는 y축 끌어놓기 영역에 변수가 있어야 한다는 점에 유의해야 합니다 4 가구소득 [단위:1000]을 변수 목록에서 y축 끌어놓기 영역으로 끕니다 y축 변수는 척도형이고 x축 변수는 범주형(순서는 범주형 측정 수준의 한 유형)이므로 y축 끌어놓기 영역의 기본값은 평균 통 계입니다 원하는 변수 및 통계이므로 요소 특성을 바꿀 필요가 없습니다 38 IBM SPSS Statistics 25 요약 안내서
텍스트 추가 도표에 제목 및 꼬리말을 추가할 수도 있습니다 1 제목/꼬리말 탭을 클릭합니다 2 제목 1을 선택합니다 그림 35 캔버스 분할창에 표시된 제목 1 캔버스에 T1이라는 레이블과 함께 제목이 표시됩니다 3 요소 특성 탭의 다음 특성 편집 목록에서 제목 1을 선택합니다 4 내용 입력란에 직업만족도별 소득을 입력합니다 이것은 제목이 표시되는 텍스트입니다 도표 작성 1 확인을 클릭하여 막대도표를 작성합니다 제 5 장 도표 작성 및 편집 39
그림 36 막대도표 이 막대도표에는 직업 만족도가 높은 반응자가 가구소득도 높은 것으로 나타나 있습니다 40 IBM SPSS Statistics 25 요약 안내서
제 6 장 결과 작업 통계 프로시저를 실행한 결과가 뷰어에 표시됩니다 프로시저를 실행할 때 선택한 사항에 따라 결과는 통계표, 도표, 그래프, 또는 텍스트 등으로 생성될 수 있습니다 이 섹션은 파일 iewertutsp 및 demosa 를 사용합니다 자세한 정보는 91 페이지의 제 10 장 표본 파일 주제를 참조하십시오 뷰어 사용 그림 37 뷰어 뷰어 창은 두 개의 분할창으로 구분됩니다 개요 분할창에는 뷰어에 저장된 모든 정보의 개요가 표시 됩니다 목차 분할창에는 통계표, 도표 및 텍스트 결과가 표시됩니다 가로 및 세로 스크롤 막대를 사용하여 창의 내용을 탐색합니다 보다 쉽게 탐색하려면 개요 분할창에 서 항목을 클릭하여 목차 분할창에 항목을 표시합니다 1 개요 분할창의 오른쪽 경계선을 클릭한 다음 끌어서 너비를 변경합니다 개요 분할창에서 항목 옆의 열린 책 모양 아이콘은 현재 목차 분할창에서는 보지 못할 수도 있지 만 뷰어에서 볼 수 있는 항목을 나타냅니다 2 표가나 도표를 감추려면 개요 분할창에서 책 모양 아이콘을 두 번 클릭합니다 열린 책 모양 아이콘은 연관된 정보가 현재 감춰져 있음을 나타내는 닫힌 책 모양 아이콘으로 변 경됩니다 3 감춘 결과를 다시 표시하려면 닫힌 책 모양 아이콘을 두 번 클릭합니다 Copyright IBM Corp 1989, 2017 41
또한 특정 통계 프로시저의 모든 결과나 뷰어의 모든 결과를 감출 수 있습니다 4 특정 프로시저의 결과를 감추려면 해당 프로시저의 왼쪽에서 뺄셈 부호( )가 있는 상자를 클릭하 고 결과를 모두 감추려면 개요 분할창의 맨 위 항목 옆에 있는 상자를 클릭합니다 개요가 합쳐지면서 이러한 결과가 감춰진 것처럼 보이게 됩니다 결과가 표시되는 순서를 변경할 수도 있습니다 5 개요 분할창에서 이동할 항목을 클릭합니다 6 개요 분할창의 새 위치로 선택한 항목을 끌어다 놓습니다 그림 38 뷰어에서 순서가 변경된 결과 또한 목차 분할창에서 결과 항목을 클릭하여서 끌면 항목을 이동할 수 있습니다 피벗 표 편집기 사용 대부분의 통계 프로시저는 그 결과가 피벗 표로 표시됩니다 결과 정의 액세스 많은 통계 용어가 결과에 표시됩니다 이러한 용어에 대한 정의를 뷰어에서 직접 액세스할 수 있습니 다 1 PDA 소유 * 성별 * 인터넷 교차 분석표를 두 번 클릭합니다 2 기대개수를 마우스 오른쪽 단추로 클릭하고 팝업 메뉴에서 설명을 선택합니다 팝업 창에 정의가 표시됩니다 42 IBM SPSS Statistics 25 요약 안내서
그림 39 팝업 정의 피벗 표 생성된 기본값 표에는 사용자가 원하는 것만큼 정보가 명확하게 표시되지 않을 수 있습니다 피벗 표 를 사용해서 행과 열을 전치(표 "이동")하고 표에서 데이터 순서를 조정하며 여러 다른 방법으로 표를 수정할 수 있습니다 예를 들어, 행과 열을 전치하여 가로로 긴 표를 세로로 길게 변경할 수 있습니다 표 윤곽을 변경해도 결과에는 영향을 미치지 않습니다 이러한 방법을 통해 정보를 단지 다른 방식이 나 더 적합한 방식으로 표시하는 것입니다 1 이것이 이미 활성화되지 않았으면 PDA 소유 * 성별 * 인터넷 교차 분석표 표를 두 번 클릭하여 활성화합니다 2 피벗 트레이 창이 표시되지 않으면 메뉴에서 다음을 선택합니다 피벗 > 피벗 트레이 피벗 트레이는 열, 행 및 레이어 간에 데이터를 이동하는 방법을 제공합니다 제 6 장 결과 작업 43
그림 40 피벗 트레이 3 통계 요소를 행 차원에서 성별 아래 열 차원으로 끌어 놓습니다 표가 바로 재구성되어 변경 사항 이 적용됩니다 피벗 트레이에서 요소의 순서는 표에서 요소의 순서를 반영합니다 4 행 차원에서 PDA 소유 요소를 인터넷 요소 앞으로 끌어다 놓아 이 두 행의 순서를 바꿉니다 그림 41 행 바꾸기 44 IBM SPSS Statistics 25 요약 안내서
레이어 작성 및 표시 레이어는 중첩된 정보 범주가 있는 큰 표에 유용합니다 레이어를 작성하여 표의 모양을 단순화하면 표 를 더 쉽게 읽을 수 있습니다 1 Gender 요소를 열 차원에서 레이어 차원으로 끕니다 그림 42 레이어 차원의 성별 피벗 아이콘 다른 레이어를 표시하려면 표의 드롭다운 목록에서 범주를 선택합니다 표 편집 사용자 정의 표모양을 작성하지 않은 경우 피벗 표는 표준 형식으로 작성됩니다 표의 텍스트 형식을 변경할 수 있습니다 변경할 수 있는 형식은 꼴 이름, 글꼴 크기, 글꼴 스타일(굵게 또는 기울임꼴), 색 상 등입니다 1 피교육수준 표를 두 번 클릭합니다 2 서식 도구 모음이 표시되지 않으면 메뉴에서 다음을 선택합니다 보기 > 도구 모음 3 제목 텍스트인 피교육수준을 클릭합니다 4 도구 모음의 글꼴 크기 드롭다운 목록에서 12를 선택합니다 5 제목 텍스트의 색상을 변경하려면 텍스트 색상 도구를 클릭하고 새 색상을 선택합니다 제 6 장 결과 작업 45
그림 43 피벗 표에서 형식이 재지정된 제목 텍스트 표의 내용 및 레이블을 편집할 수도 있습니다 예를 들어, 이 표의 제목을 변경할 수 있습니다 6 제목을 두 번 클릭합니다 7 새 레이블로 피교육수준을 입력합니다 참고: 표에서 값을 변경하는 경우 총계와 기타 통계는 다시 계산되지 않습니다 행과 열 감추기 표에 표시된 일부 데이터는 유용하지 않거나 불필요하게 표를 복잡하게 만드는 원인이 될 수 있습니 다 데이터를 손상시키지 않고도 전체 행과 열을 감출 수 있습니다 1 이것이 이미 활성화되지 않았으면 피교육수준 표를 두 번 클릭하여 활성화합니다 2 유효 퍼센트 열 레이블을 클릭하여 선택합니다 3 편집 메뉴나 마우스 오른쪽 단추로 클릭하면 표시되는 팝업 메뉴 메뉴에서 다음을 선택합니다: 선택 > 데이터 및 레이블 셀 4 보기 메뉴에서 감추기를 선택하거나 마우스 오른쪽 단추로 클릭하면 표시되는 팝업 메뉴에서 범주 감추기를 선택합니다 열이 감춰지지만 삭제되는 것은 아닙니다 그림 44 표에서 감춰진 유효 퍼센트 열 열을 다시 표시하려면 다음과 같이 하십시오 46 IBM SPSS Statistics 25 요약 안내서
5 메뉴에서 다음을 선택합니다 보기 > 모두 표시 열과 동일한 방법으로 행을 감추고 표시할 수 있습니다 데이터 표시 형식 바꾸기 피벗 표에서 데이터 표시 형식을 쉽게 변경할 수 있습니다 1 이것이 이미 활성화되지 않았으면 피교육수준 표를 두 번 클릭하여 활성화합니다 2 퍼센트 열 레이블을 클릭하여 선택합니다 3 편집 메뉴나 마우스 오른쪽 단추로 클릭하면 표시되는 팝업 메뉴 메뉴에서 다음을 선택합니다: 선택 > 데이터 셀 4 형식 메뉴 또는 마우스 오른쪽 단추로 클릭하면 표시되는 팝업 메뉴 메뉴에서 셀 특성을 선택합니 다 5 형식 값 탭을 클릭합니다 6 소수점이하자리 필드에 0을 입력하여 이 열의 모든 소수점을 감춥니다 제 6 장 결과 작업 47
그림 45 셀 특성, 형식 값 탭 이 대화 상자에서 데이터 유형과 형식도 변경할 수 있습니다 7 범주 목록에서 원하는 유형을 선택한 다음 형식 목록에서 해당 유형의 형식을 선택합니다 8 확인 또는 적용을 클릭하여 변경사항을 적용합니다 그림 46 퍼센트 열에서 감추어진 소수점이하자리 이제 퍼센트 열에서 소수점이하자리가 감춰집니다 48 IBM SPSS Statistics 25 요약 안내서
표모양 표의 형식은 분명하고 간결하며 의미 있는 결과를 제공하는 데 중요한 부분입니다 표를 읽기 어려우 면 그 안에 들어 있는 정보를 쉽게 이해하지 못할 수 있습니다 사전 정의된 형식 사용 1 결혼 상태 표를 두 번 클릭합니다 2 메뉴에서 다음을 선택합니다 형식 > 표모양 표모양 대화 상자는 사전 정의된 다양한 스타일을 나열합니다 목록에서 스타일을 선택하여 오른 쪽의 보기 창에서 미리보기를 확인합니다 그림 47 표모양 대화 상자 스타일을 그대로 사용하거나 사용자의 요구에 적합하게 기존 스타일을 편집할 수 있습니다 3 기존 스타일을 사용하려면 스타일을 선택하고 확인을 클릭합니다 표모양 스타일 사용자 정의 사용자의 특정 요구에 맞게 형식을 사용자 정의할 수 있습니다 배경 색상에서 경계선 스타일에 이르 기까지 표의 거의 모든 형식을 사용자 정의할 수 있습니다 1 결혼 상태 표를 두 번 클릭합니다 2 메뉴에서 다음을 선택합니다 제 6 장 결과 작업 49
형식 > 표모양 3 원하는 형식과 가장 비슷한 스타일을 선택하고 모양 편집을 클릭하십시오 4 셀 형식 탭을 클릭하여 서식 지정 옵션을 표시합니다 그림 48 표 특성 대화 상자 서식 지정 옵션에는 글꼴 이름, 글꼴 크기, 스타일 및 색상이 포함됩니다 추가 옵션으로는 정렬, 텍스트 및 배경 색상, 여백 크기 등이 있습니다 오른쪽의 보기 창에서는 서식 변경 내용이 표에 적용된 결과를 미리 보여 줍니다 표의 각 영역 에 다른 서식 스타일을 지정할 수 있습니다 예를 들어, 제목과 데이터의 스타일을 다르게 설정하 려는 경우가 있습니다 편집할 표 영역을 선택하려면 영역 드롭다운 목록에서 이름으로 영역을 선 택하거나 보기 창에서 변경하려는 영역을 누를 수 있습니다 5 영역 드롭다운 목록에서 데이터를 선택합니다 6 배경 색상 드롭다운 팔레트에서 새 색상을 선택합니다 7 그런 다음 다음 번 텍스트 색상을 선택합니다 보기 창에 새 스타일이 표시됩니다 50 IBM SPSS Statistics 25 요약 안내서
그림 49 표 셀 형식 변경 8 확인을 클릭하여 표모양 대화 상자로 돌아갑니다 나중에 표에 쉽게 적용할 수 있도록 새 스타일을 저장할 수 있습니다 9 다른 이름으로 저장을 클릭합니다 10 대상 디렉토리로 이동하여 새 스타일의 이름을 파일 이름 입력란에 입력합니다 11 저장을 클릭합니다 12 확인을 클릭하여 변경 사항을 적용하고 뷰어로 돌아갑니다 지정된 사용자 정의 형식이 표에 포함됩니다 제 6 장 결과 작업 51
그림 50 사용자 정의 표모양 기본값 표 형식 바꾸기 표를 작성한 후 표 형식을 변경할 수 있지만 표를 작성할 때마다 형식을 변경할 필요가 없도록 기본값 표모양을 변경하는 것이 더 효율적일 수 있습니다 피벗 표에 대한 기본값 표모양 스타일을 변경하려면 메뉴에서 다음을 선택합니다 편집 > 옵션 1 52 옵션 대화 상자에서 피벗 표 탭을 클릭합니다 IBM SPSS Statistics 25 요약 안내서
그림 51 옵션 대화 상자 2 모든 새 표에 사용할 표모양 스타일을 선택합니다 오른쪽의 보기 창에 각 표모양의 미리보기가 표시됩니다 3 확인을 클릭하여 설정을 저장하고 대화 상자를 닫습니다 기본값 표모양을 변경한 후 작성하는 모든 표는 자동으로 새 형식 규칙을 따릅니다 초기 출력 설정 사용자 정의 초기 출력 설정에는 뷰어에서 개체 맞춤, 개체를 기본적으로 보이기 또는 감추기로 설정할지 여부 및 뷰어 창 너비가 포함됩니다 이러한 설정을 변경하려면 다음과 같이 하십시오 1 메뉴에서 다음을 선택합니다 편집 > 옵션 2 뷰어 탭을 클릭합니다 제 6 장 결과 작업 53
그림 52 뷰어 옵션 설정 설정은 개체별로 적용됩니다 예를 들어, 표가 표시되는 방법은 변경하지 않고 도표가 표시되는 방 법을 사용자 정의할 수 있습니다 사용자 정의할 개체를 선택하고 원하는 사항을 변경합니다 3 제목 아이콘을 클릭하여 해당 설정을 표시합니다 4 가운데 맞춤을 클릭하여 뷰어의 가운데(수평)에 모든 제목을 표시합니다 또한 결과를 복잡하게 만들 수 있는 로그 및 경고 메시지 등의 요소를 감출 수 있습니다 아이콘 을 두 번 클릭하면 해당 개체의 표시 특성이 자동으로 변경됩니다 5 경고 아이콘을 두 번 클릭하여 결과에서 경고 메시지를 감춥니다 6 확인을 클릭하여 변경 사항을 저장하고 대화 상자를 닫습니다 변수와 값 레이블 표시 대부분의 경우 변수 및 변수값에 대한 레이블을 표시하는 것이 변수 이름이나 실제 데이터 값을 표시 하는 것보다 효과적입니다 하지만 이름과 레이블을 모두 표시하려는 경우가 있을 수 있습니다 1 메뉴에서 다음을 선택합니다 54 IBM SPSS Statistics 25 요약 안내서
편집 > 옵션 2 결과 레이블 탭을 클릭합니다 그림 53 피벗 표 레이블 붙이기 설정 개요 분할창 및 목차 분할창에 대해 다른 설정을 지정할 수 있습니다 예를 들어, 개요 분할창에 레이블을 표시하고 목차 분할창에 변수 이름과 데이터 값을 표시하려면 다음과 같이 하십시오 3 피벗 표 레이블 붙이기에서 변수의 레이블 표시는 다음과 같이 나타남 드롭다운 목록에서 이름을 선택하여 레이블 대신 변수 이름을 표시합니다 4 그런 다음 변수값의 레이블 표시는 다음과 같이 나타남 드롭다운 목록에서 값을 선택하여 레이블 대신에 데이터 값을 표시합니다 이후에 세션에서 생성된 표는 이러한 변경사항이 반영됩니다 제 6 장 결과 작업 55
그림 54 표시된 변수 이름과 값 다른 애플리케이션에서 결과 사용 결과를 여러 애플리케이션에서 사용할 수 있습니다 예를 들어, 프리젠테이션이나 보고서에 표가나 도 표를 포함할 수 있습니다 다음 예제는 Microsoft Word에 해당하는 것이지만 다른 워드 프로세스 애플리케이션에서도 유사한 방 식으로 사용할 수 있습니다 Word 표로 결과 붙여넣기 피벗 표를 원시 Word 표로 Word에 붙여넣을 수 있습니다 글꼴 크기 및 색상과 같은 모든 표 속성 이 유지됩니다 표를 Word 표 형식으로 붙여넣기 때문에 다른 모든 표와 마찬가지로 Word에서 편집 할 수 있습니다 1 뷰어에서 표를 클릭하여 선택합니다 2 메뉴에서 다음을 선택합니다 편집 > 복사 3 워드 프로세스 애플리케이션을 엽니다 4 워드 프로세서의 메뉴에서 다음을 선택합니다 편집 > 선택하여 붙여넣기 5 선택하여 붙여넣기 대화 상자에서 서식있는 텍스트(RTF)를 선택합니다 6 확인을 클릭하여 결과를 현재 문서에 붙여넣습니다 이제 문서에 표가 표시됩니다 필요에 따라 적합하게 사용자 정의 형식을 적용하고 데이터를 편집하며 표 크기를 변경할 수 있습니다 텍스트로 결과 붙여넣기 피벗 표를 일반 텍스트로 다른 애플리케이션에 복사할 수 있습니다 이 방법에서는 서식 스타일이 유 지되지 않지만 대상 애플리케이션에 표 데이터를 붙여넣은 후 이를 편집할 수 있습니다 1 뷰어에서 표를 클릭하여 선택합니다 2 메뉴에서 다음을 선택합니다 56 IBM SPSS Statistics 25 요약 안내서
편집 > 복사 3 워드 프로세스 애플리케이션을 엽니다 4 워드 프로세서의 메뉴에서 다음을 선택합니다 편집 > 선택하여 붙여넣기 5 선택하여 붙여넣기 대화 상자에서 서식없는 텍스트를 선택합니다 6 확인을 클릭하여 결과를 현재 문서에 붙여넣습니다 그림 55 Word에 표시된 피벗 표 표의 각 열은 탭으로 구분됩니다 워드 프로세스 애플리케이션에서 탭 간격을 조정하여 열 너비를 변 경할 수 있습니다 Microsoft Word, PowerPoint 및 Excel 파일로 결과 내보내기 Microsoft Word, PowerPoint 또는 Excel 파일로 결과를 내보낼 수 있습니다 선택한 항목 또는 뷰 어의 모든 항목을 내보낼 수 있습니다 이 섹션은 파일 msouttutsp 및 demosa를 사용합니다 자세 한 정보는 91 페이지의 제 10 장 표본 파일 주제를 참조하십시오 참고: PowerPoint로 내보내기는 Windows 운영체제에서만 사용할 수 있으며 Student 버전에 대해서 는 사용할 수 없습니다 뷰어의 개요 분할창에서 내보낼 특정 항목을 선택하거나 모든 항목 또는 볼 수 있는 모든 항목을 내보 낼 수 있습니다 제 6 장 결과 작업 57
그림 56 뷰어 1 뷰어 메뉴에서 다음을 선택합니다 파일 > 내보내기 뷰어에서 모든 개체를 내보내지 않고 표시된 개체(개요 분할창의 열린 책 모양)만 내보내거나 개 요 분할창에서 선택한 개체만 내보내도록 선택할 수 있습니다 개요 분할창에서 항목을 선택하지 않은 경우 선택한 개체를 내보내는 옵션이 표시되지 않습니다 58 IBM SPSS Statistics 25 요약 안내서
그림 57 내보내기 결과 대화 상자 2 내보내기 그룹 개체에서 모두를 선택합니다 3 유형 드롭다운 목록에서 Word/RTF 파일 (*doc)을 선택합니다 4 확인을 클릭하여 Word 파일을 생성합니다 Word에서 결과 파일을 열면 결과를 내보낸 방법을 확인할 수 있습니다 모든 개체를 내보내도록 선택 했으므로 표시된 개체가 아닌 노트가 Word에 표시됩니다 피벗 표는 글꼴, 색상, 경계선 등을 비롯한 원래 피벗 표의 모든 형식을 유지하는 Word 표가 됩니다 제 6 장 결과 작업 59
그림 58 Word에서의 피벗 표 도표는 그래픽 이미지로 Word 문서에 포함됩니다 그림 59 Word에서의 도표 텍스트 결과는 뷰어에서 텍스트 개체에 사용되는 글꼴과 동일한 글꼴로 표시됩니다 적절한 정렬을 위 해 텍스트 결과는 고정 피치(단일자간) 글꼴을 사용해야 합니다 60 IBM SPSS Statistics 25 요약 안내서
그림 60 Word에서의 텍스트 결과 PowerPoint 파일로 내보내는 경우 내보낸 각 항목은 별도의 슬라이드에 배치됩니다 PowerPoint로 내 보낸 피벗 표는 글꼴, 색상, 경계선 등을 포함하여 원래 피벗 표의 모든 서식을 유지하는 Word 표가 됩니다 그림 61 PowerPoint에서의 피벗 표 제 6 장 결과 작업 61
PowerPoint로 내보낼 도표는 PowerPoint 파일에 포함됩니다 그림 62 PowerPoint에서의 도표 참고: PowerPoint로 내보내기는 Windows 운영체제에서만 사용할 수 있으며 Student 버전에 대해서 는 사용할 수 없습니다 Excel 파일로 내보낼 경우 결과가 다르게 내보내집니다 62 IBM SPSS Statistics 25 요약 안내서
그림 63 Excel에서의 Outputxls 피벗 표 행, 열 및 셀은 Excel 행, 열 및 셀이 됩니다 텍스트 결과의 각 줄은 Excel 파일에서 하나의 행이고, 이 행은 단일 셀에 포함된 줄의 전체 내용을 포함합니다 그림 64 Excel에서의 텍스트 결과 제 6 장 결과 작업 63
PDF로 결과 내보내기 뷰어에서 PDF(Portable Document Format) 파일로 모든 항목 또는 선택된 항목을 내보낼 수 있습니 다 1 PDF로 내보내려는 결과를 포함하는 뷰어 창의 메뉴에서 다음을 선택합니다: 파일 > 내보내기 2 내보내기 결과 대화 상자의 내보내기 형식 파일 유형 드롭다운 목록에서 Portable Document Format을 선택합니다 그림 65 내보내기 결과 대화 상자 뷰어 문서의 개요 분할창은 쉽게 탐색할 수 있도록 PDF 파일의 책갈피로 전환됩니다 PDF 문서의 쪽 크기, 방향, 여백, 쪽 머리글과 꼬리말의 내용 및 출력, 인쇄된 문자 크기는 뷰어 창의 파일 메뉴에서 쪽 설정을 선택하여 액세스할 수 있는 쪽 설정 옵션으로 제어합니다 64 IBM SPSS Statistics 25 요약 안내서
PDF 문서의 해상도(DPI)는 기본값 프린터 또는 현재 선택된 프린터의 현재 해상도 설정입니다 이 는 쪽 설정을 사용하여 변경할 수 있습니다 최대 해상도는 1200DPI입니다 프린터 설정이 이보다 더 높더라도 PDF 문서는 1200DPI로 설정됩니다 참고: 문서의 해상도가 높아도 프린터의 해상도 가 낮으면 인쇄 결과물의 품질이 낮을 수 있습니다 그림 66 책갈피가 있는 PDF 파일 HTML로 결과 내보내기 결과를 HTML(Hypertext Markup Language)로도 내보낼 수 있습니다 HTML로 저장할 경우 그래 픽이 아닌 모든 결과를 단일 HTML 파일로 내보냅니다 제 6 장 결과 작업 65
그림 67 웹 브라우저에서의 Outputhtm HTML로 내보내는 경우 도표도 함께 내보낼 수 있지만 단일 파일로 내보낼 수는 없습니다 그림 68 HTML에서의 도표 각 도표는 사용자가 지정한 형식의 파일로 저장되며 이러한 그래픽 파일에 대한 참조는 HTML에 저 장됩니다 또한 별도의 그래픽 파일에 모든 도표 또는 선택한 도표를 내보낼지 선택할 수 있습니다 66 IBM SPSS Statistics 25 요약 안내서
제 7 장 구문 사용 강력한 명령을 사용하여 수많은 공통 작업을 저장하고 자동화할 수 있습니다 메뉴와 대화 상자에 없 는 일부 기능도 제공합니다 대부분의 명령은 메뉴와 대화 상자에서 액세스할 수 있습니다 그러나 일 부 명령과 옵션은 명령을 통해서만 사용할 수 있습니다 또 명령을 사용하면 명령 구문 파일에 작업을 저장하여 나중에 분석을 반복할 수 있습니다 명령 구문 파일은 IBM SPSS Statistics 명령이 들어 있는 텍스트 파일에 불과합니다 구문 창을 열고 명령을 직접 입력할 수 있지만 대화 상자에서 전체 또는 일부 작업을 수행하도록 하는 것이 보다 쉬운 방법입니다 이 장의 예제에서는 demosa 데이터 파일을 사용합니다 자세한 정보는 91 페이지의 제 10 장 표본 파일 주제를 참조하십시오 참고: Student 버전에서는 명령 구문을 사용할 수 없습니다 구문 붙여넣기 구문을 생성하려면 대부분의 대화 상자에 있는 구문 단추를 누르기만 하면 됩니다 1 데이터 파일 demosa를 엽니다 자세한 정보는 91 페이지의 제 10 장 표본 파일 주제를 참조 하십시오 2 메뉴에서 다음을 선택합니다 분석 > 기술통계량 > 빈도 3 결혼 상태 [결혼]을 선택하고 변수 목록으로 이동합니다 4 도표를 클릭합니다 5 도표 대화 상자에서 막대도표를 선택합니다 6 도표화 값에서 퍼센트을 선택합니다 7 계속을 클릭합니다 대화 상자에서 선택한 내용에 따라 작성된 구문을 구문 편집기로 복사하려면 붙여넣기를 클릭합니다 Copyright IBM Corp 1989, 2017 67
그림 69 빈도분석 대화 상자 그림 70 빈도분석 구문 8 현재 표시된 구문을 실행하려면 메뉴에서 다음을 선택합니다 실행 > 선택 구문 편집 구문 창에서 구문을 편집할 수 있습니다 예를 들어, 퍼센트 대신 빈도분석이 표시되도록 /BARCHART 부명령문을 변경할 수 있습니다 (부명령문에는 슬래시가 표시됩니다) 표시 빈도를 위한 키워드를 알 고 있는 경우 직접 입력할 수 있습니다 키워드를 모르는 경우 부명령문 이름에 따라 Ctrl+스페이스바 를 눌러 어디에서나 커서를 놓으면 부명령문에 사용 가능한 키워드 목록을 얻을 수 있습니다 부명령 문에 대한 자동 완성 제어를 표시합니다 BARCHART 부명령문에서 PERCENT 키워드를 삭제하십시오 Ctrl-스페이스바를 클릭합니다 68 IBM SPSS Statistics 25 요약 안내서
1 빈도에 대해 FREQ라는 항목을 클릭합니다 자동 완성 제어에서 항목을 클릭하면 현재 커서 위치 에 삽입됩니다 기본적으로 자동 완성 제어는 입력할 때 사용할 수 있는 항목을 묻는 메시지를 표시합니다 예를 들어, 원형 도표를 막대도표와 함께 포함할 것입니다 원형 도표는 별도의 부명령문으로 지정됩니 다 2 FREQ 키워드 다음에 Enter를 입력하고 포워드 슬래시(/)를 입력하여 부명령문 시작을 나타냅니 다 구문 편집기는 현재 명령의 부명령문 목록을 선택하라는 메시지를 표시합니다 그림 71 부명령문을 표시하는 자동 완성 제어 현재 명령에 대한 자세한 도움말을 보려면 F1 키를 클릭합니다 이렇게 하면 현재 명령의 명령 구문 참조 정보로 바로 이동합니다 구문 창에 표시되는 텍스트는 색상이 있다는 것을 알 수 있습니다 색상 코딩을 사용하면 인식되는 항 목만 색상이 표시되므로 인식되지 않는 항목을 신속하게 식별할 수 있습니다 예를 들어, FORMAT 부명 령문을 FRMAT로 잘못 적는다면 부명령문을 기본적으로 녹색으로 표시되지만 텍스트 FRMAT는 인식되지 않기 때문에 색상 없이 나타날 것입니다 구문 파일 열기 및 실행 1 저장된 구문 파일을 열려면 메뉴에서 다음을 선택합니다 파일 > 열기 > 구문 파일 열기 표준 대화 상자가 표시됩니다 제 7 장 구문 사용 69
2 구문 파일을 선택합니다 구문 파일이 표시되지 않으면 구문(*sps)이 보기 원하는 파일 형식으로 선택되어 있는지 확인하십시오 3 열기를 클릭합니다 4 구문 창에서 실행 메뉴를 사용하여 명령을 실행합니다 명령을 특정 데이터 파일에 적용하려면 명령을 실행하기 전에 데이터 파일이 열려 있거나, 열려 있지 않은 경우 데이터 파일을 여는 명령을 함께 실행해야 합니다 데이터 파일을 연 대화 상자에서 이러한 유형의 명령을 붙여넣을 수 있습니다 중단점 사용하기 중단점을 사용하면 구문 내의 특정 지점에서 명령 구문 실행을 중단할 수 있으며 준비가 되면 다시 실 행할 수 있습니다 따라서 명령 구문 작업의 임시 지점에서 FREQUENCIES 같은 데이터의 현재 상태에 대한 정보를 표시하는 결과나 데이터를 볼 수 있습니다 중단점은 명령 내의 특정 줄이 아닌 명령 수 준에서만 설정할 수 있습니다 명령에 중단점을 삽입하려면 1 명령과 관련된 텍스트의 왼쪽 영역 아무 곳이나 클릭합니다 중단점은 마우스로 클릭한 위치에 관계 없이 영역의 명령 텍스트 왼쪽 및 명령 이름과 동일한 줄 에서 빨간색 원으로 표시됩니다 그림 72 중단점에서 중지된 실행 중단점이 포함된 명령 구문을 실행하려면 중단점이 포함된 각 명령 앞에서 실행이 중지됩니다 70 IBM SPSS Statistics 25 요약 안내서
명령 텍스트 왼쪽의 아래를 향한 화살표는 구문 실행의 진행을 보여줍니다 첫 번째 명령에서 마 지막 명령 실행까지 영역에 걸쳐 있으며 특히 중단점이 포함되어 있는 명령 구문을 실행할 때 유 용합니다 중단점 이후의 실행을 다시 시작하려면 2 구문 편집기의 메뉴에서 다음을 선택합니다 실행 > 계속 제 7 장 구문 사용 71
72 IBM SPSS Statistics 25 요약 안내서
제 8 장 데이터 값 수정 데이터가 항상 분석 또는 보고에 가장 적합한 형식으로 준비되어 있지는 않습니다 예를 들어, 다음 작 업을 수행해야 할 수 있습니다 척도변수에서 범주형 변수를 작성합니다 여러 개의 반응 범주를 단일 범주로 조합합니다 기존 두 변수 간에 계산된 차이인 새로운 변수를 작성합니다 두 날짜 사이의 시간 길이를 계산합니다 이 장에서는 데이터 파일 demosa를 사용합니다 자세한 정보는 91 페이지의 제 10 장 표본 파일 주제를 참조하십시오 척도변수에서 범주형 변수 작성 demosa 데이터 파일에 있는 여러 개의 범주형 변수는 실제로 이 데이터 파일에 있는 척도변수에서 작성됩니다 예를 들어, 소득범주 변수는 네 개의 가구소득 범주로 분류됩니다 이 범주형 변수는 정수 값 1 4를 사용하여 $25 미만, $25 $49, $50 $74, $75 이상의 가구소득 범주(단위:1000)를 나타냅니다 소득범주 범주형 변수 작성: 1 데이터 편집기 창의 메뉴에서 다음을 선택합니다 변환 > 비주얼 구간화 초기 시각적 구간화 대화 상자에서 구간화된 새로운 변수를 작성할 척도변수 또는 순서변수를 선 택합니다 구간화란 둘 이상의 연속 값을 가져와서 같은 범주로 분류하는 것입니다 시각적 구간화는 사용자가 적합한 구간화를 선택할 수 있도록 데이터 파일에 있는 실제 값을 사 용하므로 먼저 데이터 파일을 읽어야 합니다 데이터 파일에 케이스가 많을 경우 이 작업은 시간 이 걸리므로 이 초기 대화 상자에서 읽을("스캔") 케이스 수를 제한할 수 있습니다 표본 데이터 파일에는 이 작업이 필요하지 않습니다 6,000개 이상의 케이스가 들어 있어도 이 개수의 케이스 를 스캔하는 데 시간이 많이 걸리지 않습니다 2 변수 목록에서 구간화할 변수 목록으로 가구소득 [단위:1000] [가구소득]을 끌어 놓은 다음 계속 을 클릭합니다 73
그림 73 기본 시각적 구간화 대화 상자 3 기본 시각적 구간화 대화 상자의 스캔된 변수 목록에서 가구소득 [단위:1000] [가구소득]을 선택 합니다 히스토그램은 선택한 변수의 분포(이 경우 비대칭)를 표시합니다 4 새로 구간화된 변수 이름으로 소득범주2를, 변수 레이블로 가구소득 범주 [단위: 1000]를 입력 합니다 5 절단점 만들기를 클릭합니다 6 동일한 너비 구간을 선택합니다 7 처음 절단점 위치로 25, 절단점 수로 3, 절단점 너비로 25를 입력합니다 구간화된 범주 수는 절단점 수에 1을 더한 값입니다 그러므로 이 예제에서 새로 구간화된 변수 는 모두 네 개의 범주를 갖게 됩니다 처음 세 개 범주는 각각 25(천 단위) 범위를 포함하고 마지 막 한 개 범주는 가장 큰 절단점 값 75(천 단위)보다 큰 모든 값을 포함합니다 8 적용을 클릭합니다 현재 눈금에 표시된 값은 각 범주의 상한 엔드포인트로 정의된 절단점을 나타냅니다 히스토그램 의 수직선은 절단점의 위치를 나타냅니다 기본적으로 이러한 절단점 값은 해당 범주에 포함되어 있습니다 예를 들어, 첫 번째 값 25는 25 보다 작거나 같은 모든 값을 포함합니다 그러나, 이 예제에서는 25 미만, 25-49, 50-74 또는 75 이상에 해당하는 범주가 필요합니다 9 74 상한 엔드포인트에서 제외(<)를 선택합니다 IBM SPSS Statistics 25 요약 안내서
10 그런 다음 레이블 만들기를 클릭합니다 그림 74 자동으로 생성된 값 레이블 각 범주에 대한 구체적인 값 레이블을 자동으로 생성합니다 새로 구간화된 변수에 할당된 실제 값은 1로 시작하는 순차 정수이므로 이 값 레이블이 매우 유용할 수 있습니다 또한, 눈금에 있는 절단점과 레이블을 수동으로 입력하거나 변경하고 히스토그램의 절단점 선을 끌어 놓아 절단점 위치를 변경할 뿐만 아니라 절단점 선을 히스토그램 밖으로 끌어서 절단점을 삭제할 수 있습니다 11 확인을 클릭하여 새로 구간화된 변수를 작성합니다 새 변수가 데이터 편집기에 표시됩니다 변수가 파일 끝에 추가되므로 데이터 보기의 오른쪽 끝에 있 는 열과 변수 보기의 마지막 행에 표시됩니다 새로운 변수 계산 광범위한 수학 함수를 사용하면 매우 복잡한 방정식에 따라 새로운 변수를 계산할 수 있습니다 그러 나, 이 예제에서는 기존 두 변수 값 차이인 새로운 변수를 간단히 계산하겠습니다 demosa 데이터 파일에 반응자의 현재 연령에 대한 변수와 현재 회사에서의 근속연수에 대한 변수가 들어 있습니다 그러나, 반응자가 해당 회사에 처음 입사했을 때의 연령에 대한 변수는 들어 있지 않습 니다 현재 연령과 현재 회사에서의 근속연수 간의 차이를 계산한 새로운 변수를 작성할 수 있으며, 이 변수는 반응자가 그 회사에 입사했을 때의 정확한 연령이 됩니다 제 8 장 데이터 값 수정 75
1 데이터 편집기 창의 메뉴에서 다음을 선택합니다 변환 > 변수 계산 2 대상 변수에 jobstart를 입력합니다 3 소스 변수 목록에서 연령[단위:세] [연령]을 선택하고 화살표 단추를 클릭하여 숫자표현식 입력란 에 복사합니다 4 대화 상자의 계산기에 있는 빼기( ) 단추를 클릭하거나 키보드의 빼기 키를 클릭합니다 5 현직장 근무년수 [근무년수]를 선택하고 화살표 단추를 클릭하여 표현식에 복사합니다 그림 75 변수 계산 대화 상자 참고: 올바른 직원 변수를 선택하도록 주의하십시오 또한 코딩변경된 범주형 변수 버전이 있습니 다 이것은 귀하가 원하는 변수가 아닙니다 숫자표현식은 연령 empcat이 아닌 연령-근무년수여야 합니다 6 확인을 클릭하여 새로운 변수를 계산합니다 새 변수가 데이터 편집기에 표시됩니다 변수가 파일 끝에 추가되므로 데이터 보기의 오른쪽 끝에 있 는 열과 변수 보기의 마지막 행에 표시됩니다 76 IBM SPSS Statistics 25 요약 안내서
표현식에 함수 사용 표현식에 미리 정의된 함수를 사용할 수도 있습니다 70개 이상의 기본 함수를 사용할 수 있으며, 함 수의 예는 다음과 같습니다 산술 함수 통계 함수 분포 함수 논리 함수 날짜와 시간 통합 함수 및 추출 함수 결측값 함수 교차 케이스 함수 문자열 함수 함수는 산술 연산 그룹, 통계 메트릭 계산 그룹 등 논리적으로 구별되는 그룹으로 구성되어 있습니다 편의를 위해 $TIME(현재 날짜 및 시간)과 같은 일반적으로 사용되는 몇 가지 시스템 변수도 적합한 함수 그룹에 포함됩니다 표현식에 함수 붙여넣기 함수를 표현식에 붙여넣기: 1 표현식에서 함수가 표시될 위치에 커서를 놓습니다 2 함수 그룹 목록에서 적절한 그룹을 선택합니다 모두 레이블이 표시된 그룹은 사용 가능한 모든 함 수 및 시스템 변수 목록을 제공합니다 3 함수 목록 및 특수변수 목록의 함수를 두 번 클릭하거나, 함수를 선택하고 함수 그룹 목록 옆 화 살표를 클릭합니다 함수가 표현식에 삽입됩니다 표현식의 일부를 선택한 다음 함수를 삽입하면 선택한 표현식 부분이 함 수의 첫 번째 인수로 사용됩니다 표현식에서 함수 편집 인수를 입력할 때까지 함수가 완료되지 않고 붙여넣은 함수에 물음표가 표시됩니다 물음표 개수는 해 당 함수를 완료하는 데 필요한 최소 인수 개수를 나타냅니다 1 붙여넣은 함수에서 물음표를 선택합니다 2 인수를 입력합니다 인수가 변수 이름이면 변수 목록에서 붙여넣을 수 있습니다 조건식 사용 조건식(논리 표현식이라고도 함)을 사용하여 선택한 케이스 서브세트에 변환을 적용할 수 있습니다 조 건식은 각 케이스에 대해 True, False의 값 또는 결측값을 반환합니다 조건식 결과가 True이면 해당 케이스에 변환이 적용됩니다 조건식 결과가 False 또는 결측값이면 케이스에 변환이 적용되지 않습니 다 제 8 장 데이터 값 수정 77
조건식 지정하기: 1 변수 계산 대화 상자에서 조건을 클릭합니다 케이스 조건 대화 상자가 열립니다 2 다음 조건을 만족하는 케이스 포함을 선택합니다 3 조건식을 입력합니다 대부분의 조건식에는 아래와 같이 하나 이상의 관계 연산자가 있습니다 연령>=21 또는 가구소득*3<100 첫 번째 예제에서 연령 [연령]의 값이 21인 케이스만 선택됩니다 두 번째 예제에서는 가구소득 [단위 :1000] [가구소득]에 3을 곱한 값이 100보다 작은 케이스가 선택되어야 합니다 아래와 같이 논리 연산자를 사용하여 둘 이상의 조건식을 연결할 수도 있습니다 연령>=21 교육수준>=4 또는 가구소득*3<100 & 교육수준=5 첫 번째 예제에서 연령 [연령] 조건 또는 피교육수준 [교육수준] 조건을 만족하는 케이스가 선택됩니 다 두 번째 예제에서는 가구소득 [단위:1000] [가구소득] 조건과 피교육수준 [교육수준] 조건을 모두 만족하는 케이스가 선택되어야 합니다 날짜 및 시간을 사용한 작업 일반적으로 날짜 및 시간을 사용하는 여러 작업은 날짜 및 시간 마법사를 사용하여 쉽게 수행할 수 있 습니다 이 마법사를 사용하여 수행할 수 있는 작업은 다음과 같습니다 날짜 또는 시간이 포함된 문자열 변수에서 날짜/시간변수를 작성합니다 날짜 또는 시간의 여러 부분이 포함된 변수를 병합하여 날짜/시간변수를 구성합니다 두 날짜/시간변수를 더하거나 빼는 등 날짜/시간변수에서 값을 더하거나 뺍니다 날짜 또는 시간변수의 일부, 예를 들어 mm/dd/yyyy 형식의 날짜/시간변수에서 일자를 추출합니 다 이 섹션의 예제에서는 데이터 파일 upgradesa를 사용합니다 자세한 정보는 91 페이지의 제 10 장 표본 파일 주제를 참조하십시오 날짜 및 시간 마법사 사용하기: 1 메뉴에서 다음을 선택합니다 78 IBM SPSS Statistics 25 요약 안내서
변환 > 날짜 및 시간 마법사 그림 76 날짜 및 시간 마법사 안내 화면 날짜 및 시간 마법사 안내 화면에는 일반 작업 세트가 표시되어 있습니다 현재 데이터에 적용되지 않 는 작업은 사용할 수 없습니다 예를 들어, upgradesa 데이터 파일에는 문자열 변수가 없으므로 문자 열에서 날짜 변수를 작성하는 작업은 사용할 수 없습니다 IBM SPSS Statistics에서 날짜 및 시간을 처음 사용하는 경우 날짜 및 시간을 표시하는 방법을 선택하 고 다음을 클릭합니다 그러면 날짜/시간변수에 대한 간단한 개요와 도움말 단추를 통해 자세한 내용 을 볼 수 있는 링크를 제공하는 화면이 나타납니다 두 날짜 사이의 시간 길이 계산 날짜와 관련된 가장 일반적인 작업 중 하나는 두 날짜 사이의 시간 길이를 계산하는 것입니다 예를 들어, 각 고객이 마지막으로 업그레이드를 구매한 이후의 연도 수를 파악하여 업그레이드 라이센스 구 매를 분석하는 데 관심이 있는 소프트웨어 회사가 있다고 가정합니다 upgradesa 데이터 파일에는 각 고객이 마지막으로 업그레이드를 구매한 날짜에 대한 변수는 있지만 그 이후에 경과한 연도 수에 대한 변수는 없습니다 이 경우 마지막 업그레이드 날짜와 다음 제품 릴리스 날짜 사이의 시간 길이(연도 수) 를 새로운 변수로 사용하여 이 수량을 측정할 수 있습니다 두 날짜 사이의 시간 길이 계산하기: 1 날짜 및 시간 마법사 안내 화면에서 날짜 및 시간으로 계산을 선택하고 다음을 클릭합니다 2 두 날짜 사이의 시간 단위 수 계산을 선택하고 다음을 클릭합니다 제 8 장 데이터 값 수정 79
그림 77 두 날짜 사이의 시간 길이 계산: 2단계 3 2단계에서 날짜1에 다음 버전이 출시될 날짜를 선택합니다 4 날짜2에 마지막 업그레이드 날짜를 선택합니다 5 단위로 년을 선택하고 결과 처리를 위해 정수로 내림을 선택합니다 (이것은 기본값 선택입니다) 6 다음을 클릭합니다 7 3단계에서 결과변수 이름에 YearsLastUp를 입력합니다 결과변수 이름은 기존 변수 이름과 같을 수 없습니다 8 결과변수에 대한 레이블로 마지막 업그레이드 이후의 연도 수를 입력합니다 결과변수에 대한 변 수 레이블은 선택 사항입니다 9 기본값 선택인 지금 변수 생성을 그대로 두고 마침을 클릭하여 새로운 변수를 작성합니다 데이터 편집기에 표시된 새로운 변수 업그레이드날짜는 두 날짜 사이의 연도 수(정수)입니다 연도 수 의 분수 부분은 잘립니다 날짜에 기간 더하기 날짜에 10일 또는 12개월 등의 기간을 더하거나 뺄 수 있습니다 이전 섹션에서 사용한 소프트웨어 회 사를 계속 예로 들어 각 고객의 최초 기술 지원 계약 종료 날짜를 결정해 봅니다 upgradesa 데이터 파일에는 지원 계약 연도 수에 대한 변수 및 최초 구매 날짜에 대한 변수가 포함되어 있습니다 따라 서 구매 날짜에 지원 연도 수를 더하여 최초 지원 종료 날짜를 결정할 수 있습니다 날짜에 기간을 더하기: 1 날짜 및 시간 마법사 안내 화면에서 날짜 및 시간으로 계산을 선택하고 다음을 클릭합니다 2 1단계에서 날짜에서 기간을 더하거나 빼기를 선택하고 다음을 클릭합니다 80 IBM SPSS Statistics 25 요약 안내서
그림 78 날짜에 기간 더하기: 2단계 3 날짜에 초기 생산품 라이센스의 날짜를 선택합니다 4 2단계에서 기간 변수에 기술지원 가능 년수를 선택합니다 기술지원 가능 년수는 숫자변수이므로 이 변수를 기간으로 더할 경우에는 사용할 단위를 표시해야 합니다 5 단위 드롭다운 목록에서 년을 선택합니다 6 다음을 클릭합니다 7 3단계에서 결과변수 이름에 SupEndDate를 입력합니다 결과변수 이름은 기존 변수 이름과 같을 수 없습니다 8 결과변수의 레이블로 지원 종료 날짜를 입력합니다 결과변수에 대한 변수 레이블은 선택 사항입 니다 9 마침을 클릭하여 새로운 변수를 작성합니다 새 변수가 데이터 편집기에 표시됩니다 제 8 장 데이터 값 수정 81
82 IBM SPSS Statistics 25 요약 안내서
제 9 장 데이터 정렬 및 선택 데이터 파일은 항상 특정 요구에 맞게 이상적인 형태로 구성되지는 않습니다 분석을 목적으로 데이터 를 준비하기 위하여 다음과 같은 기능들을 포함한 광범위한 파일 변환물 중에서 선택할 수 있습니다: 데이터 정렬 하나 이상의 변수 값을 기준으로 케이스를 정렬할 수 있습니다 케이스 서브세트 선택 케이스 서브세트로 분석을 제한하거나 여러 서브세트에서 동시에 분석을 수 행할 수 있습니다 이 장의 예제에서는 demosa 데이터 파일을 사용합니다 자세한 정보는 91 페이지의 제 10 장 표본 파일 주제를 참조하십시오 데이터 정렬 케이스 정렬은 (데이터 파일의 행 정렬) 종종 유용하며 특정 유형의 분석에 때때로 필요합니다 여러 정렬변수 값에 따라 데이터 파일의 케이스 시퀀스 바꾸기: 1 메뉴에서 다음을 선택합니다 데이터 > 케이스 정렬 케이스 정렬 대화 상자가 표시됩니다 그림 79 케이스 정렬 대화 상자 2 연령 [연령] 및 가구소득 범주[단위:1000][소득] 변수를 목록별 정렬에 추가합니다 다중 정렬변수를 선택할 때는 목록별 정렬에 나타나는 순서가 케이스 정렬 순서를 결정합니다 이 예 에서 목록별 정렬의 항목을 기반으로 케이스는 연령 [연령] 범주 내에서 가구소득 범주[단위:1000][소 득] 값에 의해 정렬됩니다 문자열 변수의 경우 정렬 순서에서 대문자는 소문자보다 먼저 나옵니다 (예 를 들어 문자열 값 Yes는 정렬 순서에서 yes보다 먼저 나옵니다) Copyright IBM Corp 1989, 2017 83
분할 파일 처리 분석을 위해 데이터 파일을 별개의 그룹으로 분할: 1 메뉴에서 다음을 선택합니다 데이터 > 분할 파일 분할 파일 대화 상자가 표시됩니다 그림 80 분할 파일 대화 상자 2 그룹 비교 또는 각 그룹별로 결과를 나타냄을 선택합니다 (이 단계 뒤에 나오는 예제들은 이 두 옵션 사이의 차이점을 보여 줍니다) 3 성별 [성별]을 선택하여 이들 변수에 대해 파일을 별개의 그룹으로 분할합니다 숫자 변수, 단문자열 변수, 장문자열 변수를 그룹화 변수로 사용할 수 있습니다 그룹화 변수에 의해 정의되는 각 하위 그룹에 대해 개별 분석이 수행됩니다 다중 그룹화 변수를 선택할 때는 분할 그룹화 변수 목록에 나타나는 순서가 케이스를 그룹화하는 방법을 결정합니다 그룹 비교를 선택할 경우 모든 분할 파일 그룹의 결과가 빈도분석 프로시저에 의해 생성된 다음의 요 약 통계 표에 나타난 것처럼 동일한 표에 포함될 것입니다 84 IBM SPSS Statistics 25 요약 안내서
그림 81 단일 피벗 표가 있는 분할 파일 결과 각 그룹별로 결과를 나타냄을 선택하고 빈도분석 프로시저를 실행할 경우 두 개의 피벗 표가 생성됩니 다(한 개의 여자 파벗 표 및 한 개의 남자 피벗 표) 그림 82 여자 피벗 표가 있는 분할 파일 결과 그림 83 남자 피벗 표가 있는 분할 파일 결과 분할 파일 처리의 케이스 정렬 분할 파일 프로시저는 그룹화 변수중 하나에 대해 다른 값을 만나게 될 때마다 새 하위 그룹을 생성합 니다 따라서, 분할 파일 처리를 호출하기 전 그룹화 변수 값을 기반으로 케이스를 정렬하는 것이 중요 합니다 제 9 장 데이터 정렬 및 선택 85
기본적으로 분할 파일은 그룹화 변수 값을 기반으로 데이터 파일을 자동으로 정렬합니다 파일이 적절 한 순서대로 이미 정렬되어 있는 경우 파일이 이미 정렬되어 있음을 선택하면 처리 시간이 단축될 수 있습니다 분할 파일 처리 켜기 및 끄기 분할 파일 처리를 호출한 후 이것을 끄지 않으면 세션 나머지 부분에 대해서도 계속 효력을 갖습니다 모든 케이스 분석 이 옵션은 분할 파일 처리를 끕니다 그룹 비교 및 각 그룹별로 결과를 나타냄 이 옵션은 분할 파일 처리를 켭니다 분할 파일 처리가 효력을 나타낼 경우 분할 파일 켜기의 메시지가 애플리케이션 창 하단의 상태 표시 줄에 표시됩니다 케이스 서브세트 선택 변수와 복잡한 표현식을 포함한 범주를 기준으로 분석을 특정 하위 그룹으로 제한할 수 있습니다 케 이스의 무작위 표본을 선택할 수도 있습니다 부그룹을 정의하는데 사용되는 기준은 다음과 같습니다 변수 값과 범위 날짜와 시간 범위 케이스 (행) 번호 산술 표현식 논리 표현식 함수 분석을 위해 케이스의 서브세트 선택: 1 메뉴에서 다음을 선택합니다 데이터 > 케시스 선택 케이스 선택 대화 상자가 열립니다 86 IBM SPSS Statistics 25 요약 안내서
그림 84 케이스 선택 대화 상자 조건식을 기준으로 케이스 선택 조건식을 기반으로 케이스 선택: 1 조건을 만족하는 케이스를 선택하고 케이스 선택 대화 상자에서 조건을 클릭합니다 케이스 조건 선택 대화 상자가 열립니다 제 9 장 데이터 정렬 및 선택 87
그림 85 케이스 조건 선택 대화 상자 조건식은 기존의 변수 이름, 상수, 산술 연산자, 논리 연산자, 관계 연산자 및 함수를 사용할 수 있습니 다 결과 창의 텍스트와 마찬가지로 입력란 안에 표현식을 입력하고 편집할 수 있습니다 또 계산기 패 드, 변수 목록, 함수 목록을 사용하여 표현식 안에 요소를 붙여넣을 수 있습니다 자세한 정보는 77 페 이지의 조건식 사용 주제를 참조하십시오 케이스의 무작위 표본 선택 무작위 표본 구하기: 1 케이스 선택 대화 상자에서 케이스의 무작위 표본을 선택합니다 2 표본을 클릭합니다 케이스 무작위 표본 선택 대화 상자가 열립니다 그림 86 케이스 무작위 표본 선택 대화 상자 88 IBM SPSS Statistics 25 요약 안내서
표본 결과에 대해 다음 선택 중 하나를 선택할 수 있습니다: 대략 사용자가 지정한 퍼센트 이 옵션은 대략적으로 지정된 케이스 퍼센트를 갖는 무작위 표본을 작성합니다 정확하게 사용자가 지정한 케이스 수입니다 표본을 작성할 케이스 수를 지정해야 합니다 이 케이 스 수는 데이터 파일의 총 케이스 수보다 작거나 같아야 합니다 이 수가 데이터 파일의 총 수를 넘을 경우에는 상대적으로 요청한 수보다 적은 케이스가 표본에 포함됩니다 시간 범위 또는 케이스 범위 선택 날짜, 시간 또는 관측값(행) 번호를 기반으로 케이스 범위 선택: 1 시간 또는 케이스 범위를 기준으로를 선택하고 케이스 선택 대화 상자에서 범위를 클릭합니다 이렇게 하면 케이스 범위 선택 대화 상자가 열리며 여기에서 광범위한 관측값(행) 번호를 선택할 수 있습니다 그림 87 케이스 범위 선택 대화 상자 첫번째 케이스 범위에 대한 시작 날짜 및/또는 시간 값을 입력합니다 정의된 날짜 변수가 없 을 경우 시작 관측값 번호를 입력합니다(분할 파일이 켜져 있지 않은 경우 데이터 편집기의 행 번호) 마지막 케이스 값을 지정하지 않을 경우 시작 날짜/시작 시간에서 종료 시간까지 모든 케이스 계열이 선택됩니다 마지막 케이스 범위에 대한 종료 날짜 및/또는 시간 값을 입력합니다 정의된 날짜 변수가 없 을 경우 종료 관측값 번호를 입력합니다(분할 파일이 켜져 있지 않은 경우 데이터 편집기의 행 번호) 첫 번째 케이스 값을 지정하지 않을 경우 시작 시간에서 종료 날짜/종료 시간까지 모든 케이스 계열이 선택됩니다 날짜 변수가 정의된 시계열 데이터의 경우 정의된 날짜변수를 기준으로 날짜 범위 및/또는 시간 범위를 선택할 수 있습니다 각 케이스는 서로 다른 시간의 관측값을 나타내며 파일은 연대기적 순 서로 정렬됩니다 제 9 장 데이터 정렬 및 선택 89
그림 88 케이스 범위 선택 대화 상자(시계열) 시계열 데이터의 날짜 변수 작성: 2 메뉴에서 다음을 선택합니다 데이터 > 날짜 정의 선택하지 않은 케이스 처리 선택되지 않은 케이스를 처리하기 위한 방법으로 다음 옵션 중 하나를 선택할 수 있습니다 선택하지 않은 케이스 필터 선택되지 않은 케이스가 분석에 포함되지 않지만 데이터 세트에는 계 속 남아 있습니다 세션을 진행하는 동안 나중에라도 필터링을 해제하면 선택되지 않은 케이스를 사 용할 수 있습니다 무작위 표본을 선택하거나 조건식을 기반으로 케이스를 선택하는 경우 이 옵션 을 사용하면 선택된 케이스의 값은 1이고 선택되지 않은 케이스의 값은 0인 filter_$라는 변수가 생 성됩니다 새 데이터 세트에 선택한 케이스 복사 선택된 케이스가 새로운 데이터 세트에 복사되고 원래 데이 터 세트는 그대로 유지됩니다 선택되지 않은 케이스는 새로운 데이터 세트에 포함되지 않으며 원 래 데이터 세트에 원래 상태 그대로 남습니다 선택하지 않은 케이스 삭제 선택되지 않은 케이스가 데이터 세트에서 삭제됩니다 삭제된 케이스를 복구하려면 파일의 변경 내용을 저장하지 않은 채 파일을 닫고 다시 열어야 합니다 데이터 파일의 변경 내용을 저장하면 삭제된 케이스를 복구할 수 없습니다 참고: 선택되지 않은 케이스를 삭제하고 파일을 저장하면 케이스를 복구할 수 없습니다 케이스 선택 상태 케이스 서브세트를 선택했으나 선택하지 않은 케이스를 버리지 않을 경우에는 선택하지 않은 케이스가 행 번호에 대각선 또는 슬래시(/)가 그어진 상태로 데이터 편집기에 표시됩니다 90 IBM SPSS Statistics 25 요약 안내서
그림 89 케이스 선택 상태 제 10 장 표본 파일 제품에 설치된 표본 파일은 설치 디렉토리 표본 추출 하위 디렉토리에서 찾으실 수 있습니다 영어, 프 랑스어, 독일어, 이탈리아어, 일본어, 한국어, 폴란드어, 러시아어, 중국어 간체, 스페인어 및 중국어 번 체 등의 각 언어에 대해 Samples 하위 디렉터리 내에 별도의 폴더가 있습니다 모든 언어에서 모든 표본 파일을 사용할 수 있는 것은 아닙니다 특정 언어로 표본 파일을 사용할 수 없는 경우 해당 언어 폴더에 영어 버전의 표본 파일이 들어 있습니다 설명 이것은 문서 전반에서 다양한 예제에 사용된 표본 파일에 대한 요약 설명입니다 accidentssa 이것은 주어진 지역에서 자동차 사고에 대한 연령 및 성별 유험 요인을 연구하는 보 험회사와 관련이 있는 가설 데이터 파일입니다 각 케이스는 연령 범주 및 성별의 교차 분류에 대 응합니다 adlsa 이것은 뇌졸중 환자에 대해 제시된 치료 유형의 장점을 판단하려는 노력과 관련이 있는 가 설 데이터 파일입니다 의사는 여성 뇌졸중 환자를 두 그룹 중 하나에 무작위 할당합니다 첫 번째 로 받은 표준 물리치료, 두 번째로 받은 추가 정서적 치료 치료 후 석달 동안 각 환자가 일상생활 에서 흔한 활동들을 수행하는 기능을 순서 변수로써 스코어를 매겼습니다 adertsa 이것은 광고에 소비된 돈과 그 결과로써 판매에 소비된 돈 사이의 관계를 조사하려는 유통업체의 시도와 관련이 있는 가설 데이터 파일입니다 이를 위해 과거 매출 수치와 관련 광고비 를 수집했으며, aflatoxinsa 이것은 옥수수 작물에 대해서 농작물마다 농도가 크게 다른 독성 물질인 아플라톡신 검정과 관련이 있는 가설 데이터 파일입니다 어느 곡물 가공업자가 8가지 농작물 중에서 16개 표 본을 얻어 10억분의 1단위로 아플라톡신 레벨을 측정하였습니다 91
anorecticsa 연구원들은 식욕 감퇴/폭식증 등 표준적인 증상에 대한 연구와 병행하여 1 알려진 섭 식 장애를 갖고 있는 55명의 젊은이에 대한 연구를 수행하였습니다 각 환자를 4년 동안 네 차례 진찰하여 총 220개의 관측값을 얻었습니다 환자들을 대상으로 관찰하는 동안 16개 증상 각각에 대 해 스코어를 매겼습니다 환자 71번의 2회차, 환자 76번의 2회차, 환자 47번의 3회차 진료에 대한 증상 스코어가 누락되었으며 나머지 217개 관측값은 유효합니다 bankloansa 이것은 은행이 기본 대부율을 낮추려는 시도와 관련이 있는 가설 데이터 파일입니 다 파일에는 과거 및 장래 전망 있는 850명의 고객에 대한 금융 정보 및 인구 통계학 정보가 들어 있습니다 처음 700개의 케이스는 이전에 대출을 받은 고객입니다 마지막 150 케이스는 은행이 신 용 위험이 낮거나 높은 것으로 분류할 필요가 있는 장래 전망 있는 고객들입니다 bankloan_binningsa 이것은 과거 5,000명의 고객들에 관한 금융 정보 및 인구 통계학 정보가 들어있는 가설 데이터 파일입니다 behaiorsa 고전적인 예제 2에서 52명의 학생들에게 부탁하여 15가지 상황과 15가지 행동의 조 합에 대해 0 = "매우 적절함"에서 9 = "매우 부적절함"까지 10단계 척도로 순위를 매기도록 요청했 습니다 각 응답자에 대해 평균을 구한 값은 상이도로 간주됩니다 behaior_inisa 이 데이터 파일에는 behaiorsa에 대한 2차원적 솔루션의 초기 설정이 들어 있 습니다 brakessa 이것은 성능이 높은 자동차용 디스크 브레이크 생산 공장의 품질 관리와 관련이 있는 가설 데이터 파일입니다 데이터 파일에는 생산 기계 8대 각각의 16개 디스크에 대한 지름 치수가 들어 있습니다 브레이크의 대상 지름은 322mm입니다 breakfastsa 고전적인 연구3에서 21명의 Wharton School MBA 학생들과 그 배우자들에게 15 가지 아침 식사 메뉴에 선호도에 따라 1부터 15까지 순위를 매기도록 부탁했습니다 1은 가장 좋 아함 을 의미하고 15는 가장 싫어함 을 의미합니다 "전반적인 선호"에서 "음료수만 포함된 가벼운 식사"에 이르는 서로 다른 여섯 가지 시나리오에 따라 응답자들의 선호도를 기록했습니다 breakfast-oerallsa 이 데이터 파일에는 최초의 시나리오 "전반적인 선호도"에 대한 아침 식사 메뉴 중 좋아하는 음식이 들어 있습니다 broadband_1sa 이것은 지역별 국가 광대역 서비스 가입자 수가 들어 있는 가설 데이터 파일입 니다 데이터 파일에는 4년 동안 85개 지역에 대한 매달 가입자 수가 들어 있습니다 broadband_2sa 이 데이터 파일은 broadband_1sa와 동일하나 추가 3달에 대한 데이터가 들어 있습니다 1 Van der Ham, T, J J Meulman, D C Van Strien, and H Van Engeland 1997 Empirically based subgrouping of eating disorders in adolescents: A longitudinal perspectie British Journal of Psychiatry, 170, 363-368 2 Price, R H, and D L Bouffard 1974 Behaioral appropriateness and situational constraints as dimensions of social behaior Journal of Personality and Social Psychology, 30, 579-586 3 Green, P E, and V Rao 1972 Applied multidimensional scaling Hinsdale, Ill: Dryden Press 92 IBM SPSS Statistics 25 요약 안내서
car_insurance_claimssa 자동차 손해배상 청구와 관련하여 4 외에서 제시 및 분석된 데이터 세 트입니다 평균 청구 금액은 평균 종속 변수를 보험 계약자의 연령, 차종 및 차량 연식과 관련시켜 설명하는 역 연결 함수를 사용하여 감마 분포로써 모델링할 수 있습니다 기록에 남긴 청구 개수는 척도 가중치로 사용될 수 있습니다 car_salessa 이 데이터 파일은 다양한 메이커와 차량 모형에 대한 예상 판매량, 정가 및 물리적 지정 사항을 포함합니다 정가와 물리적 지정 사항은 edmundscom과 제조업체 사이트에서 번갈아 입수하였습니다 car_sales_upreparedsa car_salessa의 수정된 버전으로서 변환된 버전의 필드가 포함되지 않습 니다 carpetsa 자주 인용되는 예제인 5에서는 새로운 카펫 세척제를 마케팅하려는 한 회사가 패키지 계획, 브랜드 이름, 값, 보증 유무 및 환불 유무라는 다섯 가지 요인이 고객 선호도에 어떤 영향을 미치는지 조사합니다 패키지 계획에는 세 가지 요인 수준이 있고 그 각각은 세척용 솔의 위치에서 차이가 납니다 그밖에도 세 가지 브랜드 이름(K2R, Glory, Bissell)이 있으며, 값 수준도 세 가지이 고, 마지막 두 요인에 대해서는 각각 두 가지 수준(예 또는 아니오)이 있습니다 이들 요인으로 정 의된 22개의 프로파일에 대해 10명의 고객이 순위를 매겼습니다 변수 선호도에는 각 프로파일의 평균 순위가 포함되어 있습니다 낮은 순위는 선호도가 높음을 의미합니다 이 변수는 각 프로파일 에 대한 선호도의 전반적인 측도를 반영합니다 carpet_prefssa 이 데이터 파일은 carpetsa에 설명된 것과 동일한 예제를 기반으로 하지만 10 명의 고객 각각으로부터 수집한 실제 순위를 포함합니다 고객들에게 가장 선호하는 제품부터 가장 덜 선호하는 제품에 이르기까지 22개 제품 프로파일에 순위를 매기도록 요청하였습니다 변수 PREF1 부터 PREF22까지는 carpet_plansa에 정의된 관련 프로파일의 식별자를 포함합니다 catalogsa 이 데이터 파일에는 카탈로그 회사에서 판매한 세 가지 제품의 가설적인 월별 판매 수 치가 들어 있습니다 가능한 5 가지 예측변수에 대한 데이터도 포함되어 있습니다 catalog_seasfacsa 이 데이터 파일은 부수적인 날짜 변수와 함께 계절 분해 프로시저에서 계산한 계절 요인 그룹을 추가한 것을 제외하고는 catalogsa와 동일합니다 cellularsa 이것은 서비스 제공 사업자 이탈을 줄이려는 이동전화 회사의 시도와 관련이 있는 가 설 데이터 파일입니다 서비스 제공 사업자 이탈 성향 스코어가 0 ~ 100 범위로 계정에 적용됩니 다 스코어가 50이상인 계정은 서비스 제공업체를 변경할 것을 기대할 수 있습니다 ceramicssa 이것은 새로운 프리미엄급 합금이 표준 합금보다 내열성이 훨씬 큰지 여부를 판단하 기 위한 제조업체의 시도와 관련이 있는 가설 데이터 파일입니다 각 케이스는 합금 중 한 가지에 대한 별도의 검정을 나타냅니다 베어링이 파손되는 온도를 기록합니다 cerealsa 이것은 880명의 사람들을 대상으로 연령, 성별, 결혼 상태 및 활동적인 라이프스타일을 갖고 있는지 여부(1주에 적어도 두 번은 운동을 하고 있는지)와 함께 아침 식사 메뉴 선호도를 조 사한 여론조사와 관련이 있는 가설 데이터 파일입니다 각 케이스는 개별 반응자를 나타냅니다 4 McCullagh, P, and J A Nelder 1989 Generalized Linear Models, 2nd ed London: Chapman & Hall 5 Green, P E, and Y Wind 1973 Multiattribute decisions in marketing: A measurement approach Hinsdale, Ill: Dryden Press 제 10 장 표본 파일 93
clothing_defectssa 이것은 의류 공장에서 품질 관리 프로세스와 관련이 있는 가설 데이터 파일 입니다 공장에서 생산된 각 로트로부터 검사자들은 의복 표본을 선택하고 채택이 불가능한 의복 개 수를 셉니다 coffeesa 이 데이터 파일은 여섯 가지 아이스커피 브랜드에 대해 인지된 이미지에 관한 데이터 파일입니다6 23개의 아이스커피 이미지 속성 각각에 대해 해당 속성으로 설명할 수 있는 브랜드를 모두 선택하도록 사람들에게 요청했습니다 브랜드 이름이 노출되지 않도록 여섯 개의 브랜드에는 AA, BB, CC, DD, EE 및 FF라고 이름을 붙였습니다 contactssa 이것은 기업 컴퓨터 판매 대리점 그룹의 담당자 목록과 관련이 있는 가설 데이터 파 일입니다 각 담당자는 이들이 일하는 회사의 부서 및 그들의 회사내 지위별로 범주가 나누어졌습 니다 또한 마지막 판매량, 최종 판매 이후 시간 및 담당자 회사의 규모를 기록하였습니다 creditpromosa 이것은 최근 신용카드 판촉의 효과를 평가하기 위한 백화점의 시도와 관련이 있 는 가설 데이터 파일입니다 이러한 목적을 위하여 500명의 카드 소지자를 무작위로 선택하였습니 다 이중 절반은 다음 세 달 동안 구매에 대한 이자율을 줄여 주겠다는 판촉 광고물을 받았습니다 절반은 표준적인 시즌 광고물을 받았습니다 customer_dbasesa 이것은 데이터 웨어하우스의 정보를 사용하여 답변할 가능성이 가장 높은 고 객들에게 특가 제공을 지원하려는 회사의 시도와 관련 있는 가설 데이터 파일입니다 고객 층의 서 브세트를 무작위로 선택하여 특가 제공을 지원하고 그들의 반응을 기록하였습니다 customer_informationsa 이름 및 주소와 같은 고객 메일링 정보가 들어 있는 가설 데이터 파일 입니다 customer_subsetsa customer_dbasesa의 80개 케이스의 서브세트입니다 debatesa 이것은 정치적 토론의 참가자들을 대상으로 한 토론 전후 설문조사에서 대응반응과 관 련 있는 가설 데이터 파일입니다 각 케이스는 개별 반응자에 해당합니다 debate_aggregatesa 이것은 debatesa의 반응을 통합하는 가설 데이터 파일입니다 각 케이스는 토론 전후 선호도에 대한 교차 분류에 해당합니다 demosa 이것은 매달 메일을 발송할 목적으로 구매 고객 데이터베이스와 관련 있는 가설 데이터 파일입니다 다양한 인구 통계학 정보와 함께 고객이 제공에 반응했는지 여부가 기록됩니다 demo_cs_1sa 이것은 설문조사 정보 데이터베이스를 컴파일하려는 회사의 시도중 첫 단계와 관 련 있는 가설 데이터 파일입니다 각 케이스는 서로 다른 도시에 해당하며 지역, 지방, 구 및 도시 식별이 기록됩니다 demo_cs_2sa 이것은 설문조사 정보 데이터베이스를 컴파일하려는 회사의 시도중 두 번째 단계 와 관련 있는 가설 데이터 파일입니다 각 케이스는 첫 번째 단계에서 선정된 도시의 서로 다른 가 구 단위에 해당하며 지역, 지방, 구, 도시, 구역 및 단위 식별이 기록됩니다 계획 중 처음 두 단계 의 표본 추출 정보도 포함됩니다 6 Kennedy, R, C Riquier, and B Sharp 1996 Practical applications of correspondence analysis to categorical data in market research Journal of Targeting, Measurement, and Analysis for Marketing, 5, 56-70 94 IBM SPSS Statistics 25 요약 안내서
demo_cssa 이것은 복잡한 표본추출 계획을 사용하여 수집한 설문조사 정보를 포함하고 있는 가 설 데이터 파일입니다 각 케이스는 서로 다른 가구 단위에 해당하며 다양한 인구 통계학적 정보와 표본 추출 정보가 기록됩니다 diabetes_costssa 보험 회사가 당뇨병이 있는 보험 계약자에 대해 유지보수하는 정보가 포함된 가설 데이터 파일입니다 각 케이스는 서로 다른 보험 가입자에 해당합니다 dietstudysa 이것은 "스틸만 다이어트" 의 연구 결과를 포함하는 가설 데이터 파일입니다7 각 케 이스는 별도의 주제에 해당하며 파운드 단위로 다이어트 전후 체중을 기록하고 나무글리세이드 레 벨을 mg/100 ml 단위로 기록합니다 dmdatasa 다이렉트 마케팅 회사의 인구 통계학 및 구매 정보가 들어 있는 가설 데이터 파일입 니다 dmdata2sa에는 검정 메일링을 수신한 연락처 서브세트에 대한 정보가 들어 있으며, dmdata3sa에는 검정 메일을 수신하지 않은 나머지 연락처에 대한 정보가 들어 있습니다 ddplayersa 이것은 새 DVD 플레이어 개발과 관련 있는 가설 데이터 파일입니다 마케팅 팀은 프로토타입을 사용하여 집중 그룹 데이터를 수집하였습니다 각 케이스는 설문조사에 응한 각 사용 자에 해당하며 이들에 관한 몇 가지 인구 통계학적 정보와 프로토타입에 관한 앙케이트 반응을 기 록합니다 german_creditsa 이 데이터 파일은 Irine의 캘리포니아 대학 8 Repository of Machine Learning 데이터베이스의 "독일인의 신용(German credit)" 데이터 세트에서 추출했습니다 grocery_1monthsa 이것은 매주 "종합" 구매에 대한 grocery_couponssa 데이터 파일내의 가설 데이터 파일입니다 따라서 각 케이스는 각 고객에 해당합니다 결과적으로 매주 변하는 변수중 일 부는 사라지며 이제 기록된 소비 금액은 4주의 연구기간중 소비한 금액의 합계가 됩니다 grocery_couponssa 이것은 고객의 구매 습관에 관심 있는 식료품 체인점에서 수집한 설문조사 데이터를 포함한 가설 데이터 파일입니다 각 고객을 4주 동안 추적하며 각 케이스는 각각의 고객주에 해당합니다 고객이 그 주 동안 식료품 상점에서 소비한 금액을 포함하여 어디서 어떻게 쇼핑 했는지에 관한 정보를 기록합니다 guttmansa Bell9은 가능한 사회 그룹을 보여 주는 표를 제안했습니다 Guttman10은 이 표의 일 부를 사용했습니다 그 중 사회적 상호작용, 그룹 소속감, 멤버의 친밀감, 관계의 형식성 등을 설명 하는 다섯 개의 변수는 일곱 개의 이론적인 사회 그룹과 교차합니다 이 일곱 개의 그룹에는 군중 (예: 축구 시합 관중), 청중(예: 극장 관객 또는 강연회 방청객), 대중(예: 신문 구독자 또는 TV 시청 자), 폭도(군중과 비슷하지만 상호작용이 훨씬 더 강한 그룹), 일차그룹(친밀한 관계), 이차그룹(자발 적 관계), 현대 공동체(강한 친밀감과 특별한 서비스에 대한 필요의 결과로 발생한 느슨한 연합)가 있습니다 7 Rickman, R, N Mitchell, J Dingman, and J E Dalen 1974 Changes in serum cholesterol during the Stillman Diet Journal of the American Medical Association, 228:, 54-58 8 Blake, C L, and C J Merz 1998 "UCI Repository of machine learning databases" Aailable at http://wwwicsuciedu/ ~mlearn/mlrepositoryhtml 9 Bell, E H 1961 Social foundations of human behaior: Introduction to the study of sociology New York: Harper & Row 10 Guttman, L 1968 A general nonmetric technique for finding the smallest coordinate space for configurations of points Psychometrika, 33, 469-506 제 10 장 표본 파일 95