Microsoft Word - Chapter2.doc

Similar documents
Microsoft PowerPoint - chap02-C프로그램시작하기.pptx

[INPUT] 뒤에는변수와관련된정보를표기한다. [CARDS;] 뒤에는각각의변수가가지는관측값들을표기한다. >> 위의프로그램에서데이터셋명은 wghtclub 이고, 변수는 idno, name, team, strtwght, endwght 이다. 이중 name 과 team 은

Microsoft Word - src.doc

목차 1. 시스템요구사항 암호및힌트설정 ( 윈도우 ) JetFlash Vault 시작하기 ( 윈도우 ) JetFlash Vault 옵션 ( 윈도우 )... 9 JetFlash Vault 설정... 9 JetFlash Vault

Studuino소프트웨어 설치

Microsoft Word - ntasFrameBuilderInstallGuide2.5.doc

Windows 8에서 BioStar 1 설치하기

PowerPoint 프레젠테이션

PowerPoint Template

Convenience Timetable Design

강의 개요

Microsoft PowerPoint - chap06-1Array.ppt

1

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상

Data Sync Manager(DSM) Example Guide Data Sync Manager (DSM) Example Guide DSM Copyright 2003 Ari System, Inc. All Rights reserved. Data Sync Manager

C 프로그램의 기본

NTD36HD Manual

MySQL-.. 1

tiawPlot ac 사용방법

OCW_C언어 기초

PowerPoint 프레젠테이션

PowerPoint Presentation

Visual Basic 반복문

Microsoft PowerPoint - e pptx

<4D F736F F D D31312D30312D53572D30312DBBE7BFEBC0DABCB3B8EDBCAD5FBFDCBACEB9E8C6F7BFEB2E646F63>

슬라이드 1

SBR-100S User Manual

경우 1) 80GB( 원본 ) => 2TB( 복사본 ), 원본 80GB 는 MBR 로디스크초기화하고 NTFS 로포맷한경우 복사본 HDD 도 MBR 로디스크초기화되고 80GB 만큼포맷되고나머지영역 (80GB~ 나머지부분 ) 은할당되지않음 으로나온다. A. Window P

Microsoft PowerPoint Android-SDK설치.HelloAndroid(1.0h).pptx

1.1 SAS 시스템 제 1 장 SAS : Statistical Analysis System SAS 사용법 Strategic Application System SAS의주요소프트웨어 Base SAS : SAS 의가장기본적인소프트웨어 SAS/STAT : 통계자료분석소프트웨

게임 기획서 표준양식 연구보고서

Microsoft 을 열면 깔끔한 사용자 중심의 메뉴 및 레이아웃이 제일 먼저 눈에 띕니다. 또한 은 스마트폰, 테블릿 및 클라우드는 물론 가 설치되어 있지 않은 PC 에서도 사용할 수 있습니다. 따라서 장소와 디바이스에 관계 없이 언제, 어디서나 문서를 확인하고 편집

Microsoft Word - Chapter3.doc

Microsoft Word - Modelsim_QuartusII타이밍시뮬레이션.doc

Microsoft PowerPoint - chap01-C언어개요.pptx

다른 JSP 페이지호출 forward() 메서드 - 하나의 JSP 페이지실행이끝나고다른 JSP 페이지를호출할때사용한다. 예 ) <% RequestDispatcher dispatcher = request.getrequestdispatcher(" 실행할페이지.jsp");

Microsoft Word - Chapter5.doc

Microsoft PowerPoint 웹 연동 기술.pptx

Microsoft Word - windows server 2003 수동설치_non pro support_.doc

슬라이드 1

금오공대 컴퓨터공학전공 강의자료

Endpoint Protector - Active Directory Deployment Guide

UI TASK & KEY EVENT

Xcrypt 내장형 X211SCI 수신기 KBS World 채널 설정법

Microsoft Word - LTL-XL RSC vers Nov. 08 _Korean Version_.doc

문서의 제목 나눔고딕B, 54pt

학습목표 함수프로시저, 서브프로시저의의미를안다. 매개변수전달방식을학습한다. 함수를이용한프로그래밍한다. 2

Microsoft Word - PLC제어응용-2차시.doc

슬라이드 1

untitled

슬라이드 1

C. KHU-EE xmega Board 에서는 Button 을 2 개만사용하기때문에 GPIO_PUSH_BUTTON_2 과 GPIO_PUSH_BUTTON_3 define 을 Comment 처리 한다. D. AT45DBX 도사용하지않기때문에 Comment 처리한다. E.

윈도우즈프로그래밍(1)

슬라이드 제목 없음

Microsoft PowerPoint - chap06-2pointer.ppt

1

슬라이드 1

<4F E20C7C1B7CEB1D7B7A5C0BB20C0CCBFEBC7D120B5A5C0CCC5CD20BAD0BCAE20B9D720B1D7B7A1C7C120B1D7B8AEB1E F416E616C F616E645F47726

Microsoft PowerPoint - Perpect C 02.ppt [호환 모드]

System Recovery 사용자 매뉴얼

지도상 유의점 m 학생들이 어려워하는 낱말이 있으므로 자세히 설명해주도록 한다. m 버튼을 무리하게 조작하면 고장이 날 위험이 있으므로 수업 시작 부분에서 주의를 준다. m 활동지를 보고 어려워하는 학생에게는 영상자료를 접속하도록 안내한다. 평가 평가 유형 자기 평가

01장

Microsoft PowerPoint - 3ÀÏ°_º¯¼ö¿Í »ó¼ö.ppt

PowerPoint Presentation

vRealize Automation용 VMware Remote Console - VMware

목차 윈도우드라이버 1. 매뉴얼안내 운영체제 (OS) 환경 윈도우드라이버준비 윈도우드라이버설치 Windows XP/Server 2003 에서설치 Serial 또는 Parallel 포트의경우.

학습목차 2.1 다차원배열이란 차원배열의주소와값의참조

Microsoft PowerPoint - Java7.pptx

var answer = confirm(" 확인이나취소를누르세요."); // 확인창은사용자의의사를묻는데사용합니다. if(answer == true){ document.write(" 확인을눌렀습니다."); else { document.write(" 취소를눌렀습니다.");

1. 외국어 메뉴판 만들기 (상세 메뉴판) 외국어 메뉴판 만들기 서비스 중 상세 메뉴판 만들기 코너를 이용하기 위해서는, 먼저 한국관광공사 홈페이지 ( 회원가입을 해야 합니다. 상세 메뉴판 만들기 코너를 이용하면, 메뉴

Office 365 사용자 가이드

Microsoft PowerPoint - CPLD_수정1.pptx

Contents Activity Define Real s Activity Define Reports UI, and Storyboards Activity Refine System Architecture Activity Defin

신한은행 머니멘토 환경설정 매뉴얼

슬라이드 1

WebPACK 및 ModelSim 사용법.hwp

Microsoft PowerPoint SDK설치.HelloAndroid(1.5h).pptx

View Licenses and Services (customer)

Title Here

PowerPoint Presentation

(SW3704) Gingerbread Source Build & Working Guide

PowerPoint 프레젠테이션

Tcl의 문법

Tablespace On-Offline 테이블스페이스 온라인/오프라인

<4D F736F F F696E74202D20C1A C0E520B5B5C5A5B8D5C6AE20C6C4C0CF20C0D4C3E2B7C220B9D720B4D9BEE7C7D120BAE420C5ACB7A1BDBA2E BC8A3C8AF20B8F0B5E55D>

윈도우시스템프로그래밍

메뉴얼41페이지-2

Chapter 1

Install stm32cubemx and st-link utility

Microsoft PowerPoint - chap03-변수와데이터형.pptx

파일로입출력하기II - 파일출력클래스중에는데이터를일정한형태로출력하는기능을가지고있다. - PrintWriter와 PrintStream을사용해서원하는형태로출력할수있다. - PrintStream은구버전으로가능하면 PrintWriter 클래스를사용한다. PrintWriter

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

<B1E2C3E2B9AEC1A620BDC3B9C4B7B9C0CCBCC7204D B3BBB7C1B9DEB1E2BFCD20BCB3C4A1C7CFB1E E687770>

ISP and CodeVisionAVR C Compiler.hwp

server name>/arcgis/rest/services server name>/<web adaptor name>/rest/services ArcGIS 10.1 for Server System requirements - 지

Splentec V-WORM Quick Installation Guide Version: 1.0 Contact Information 올리브텍 주소 : 경기도성남시분당구구미로 11 ( 포인트타운 701호 ) URL: E-M

Slide 1

오빠두엑셀 E-Book [VBA 1-7] VBA Method 란무엇인가 >> VBA 개체 Method ( 함수 ) Copyright 2018 by 오빠두 0

Microsoft PowerPoint UNIX Shell.ppt

캘크 시작하기

Transcription:

CHAPTER 2. 데이터만들기 SAS를이용하여원하는분석 (PROC 이용 ) 을하려면 SAS 데이터가만들어져있어야한다. SAS 데이터를만드는방법은다음과같다. 이들방법중가장권하고싶은것은방법 3에서확장편집기의프로그램이용방법이다. 절차가간편하고가장많이사용되는방법이다. 1프로그램에디터 ( 확장편집기 ) 에서입력하기 2SAS 메뉴의분석창 (analyst) 에서입력하기 ( 스프레드시트형태데이터입력 ) 3외부데이터불러오기 ( 메뉴방법과확장편집기프로그램방법 )

22 Chapter2. 데이터만들기 2.1 프로그램구조 SAS 프로그램은데이터를만들거나변환하는데이터단계 (DATA step), 데이터를처리하여분석작업을실행하는 PROC(EDURE) 단계로구성되어있다. 각각은 DATA, PROC에의해시작되고끝은 RUN; 에의해단계가종료된다. RUN을매단계사용하지않고프로그램마지막에만사용되어도되나프로그램구조의이해를돕기위하여매단계사용하기를권장한다. 다음은 10명학생들의 IQ를조사한후이들의 IQ가전학생들의평균 IQ 120과같은지알아보기위하여작성한프로그램이다. 이프로그램은하나의데이터단계와하나의 PROC 단계로구성되어있다. SAS 프로그램작성규칙을정리하면다음과같다. ⑴/* 문장 */ 은주석문 (comment statement) 으로사이의문장은실행결과에영향을미치지않는다. 작성된프로그램을설명하기위해사용된다. ⑵모든문장은세미콜론 (;) 으로끝난다. 문장이여러행에걸쳐작성되더라도세미콜론이없다면하나의문장으로간주된다. ⑶PROC 단계에사용되는데이터는데이터단계를통해만들어져있어야한다. ⑷프로그램안에서대소문자구별은없다. 단관측치가문자인경우만구별된다.

23 ⑸데이터이름 (ONE), 변수이름 (IQ) 은영어, 숫자, 그리고특수문자 _ 로만구성되어야한다. 그리고반드시영어로시작해야한다. ⑹DATA, PROC, RUN은진한파란색, 데이터부분은노란색, 옵션은파란색, 숫자와주석문은초록색, 옵션지정내용은검정색으로나타난다. 오류옵션이나문장은빨간색으로표시된다. 2.2 데이터만들기 다음은실습을위해사용하게될예제데이터이다. 암종류 (Bronchus 기관지, Stomach 위 ) 에따른암환자생존시간 ( 일 ) 을조사한것이다. 2.2.1 확장편집기이용 수집된데이터를 SAS 데이터로만드는데이터단계 (DATA step) 이다. 확장편집기의프로그램명령어나변수이름은대소문자구별할필요는없으나입력된데이터의관측치는대소문자구별해야한다. DATA CANCER; 나 data cancer; 는서로동일하다. 또한 TIME과 time 역시동일하다. 그러나 Stomach 와 stomach 는 SAS에서는서로다르게인식됨을유의하기바란다. SAS 프로그램에서가장중요한것은문장의끝에는반드시세미콜론 (;) 으로끝맺어야한다는것이다. 세미콜론이빠지면 SAS는하나의문장으로인식하게된다. 확장편집기위에있는 CANCER.SAS는프로그램이름이다. 저장되지않은프로그램은 제목없음 으로표시된다. 프로그램을저장하려면 CTRL+S를누르거나 을

24 Chapter2. 데이터만들기 눌러저장을위한팝업창이나타나면폴더와파일이름을설정하고저장하면된다. 2.1 정에서언급하였듯이데이터를컴퓨터파일에입력할때는열은변수, 행은개체의관 측치를넣은것이일반적이다. 확장편집기에서자료를입력하는 ⑴DATA~RUN; SAS 데이터만드는단계의시작문장과끝문장이다. 데이터단계나 PROCEDURE 단계의시작인 DATA 나 PROCEDURE, 끝인 RUN은진하게파란색으로표시된다. 다른프로그램이이어지면 RUN; 을생략해도되나 ( 즉프로그램마지막에만이문장이있으면 OK) 프로그램작성의체계화를위하여매단계끝에사용하길권한다. DATA 뒤의 CANCER 는만들어지는 SAS 데이터이름이다. DATA 이름은문자, 숫자, 특수문자 (_ 정도사용가능 ) 혼용사용해도되나첫글자는반드시영어이고공백은사용해서는안된다. 예전에는이름으로 8자가최대였으나이제는 8자이상사용이가능하다. SAS는 WORK.CANCER라는데이터를만들고 WORK 라이브러리에임시저장한다. 임시저장의의미는 SAS 종료와동시에사라짐을의미한다. SAS 데이터만드는프로그램 (CANCER.SAS) 을저장하였으니이프로그램을다시불러와실행하면 CANCER SAS 데이터가만들어지므로굳이영구 SAS 데이터 (SAS 종료후에도남아있음 ) 를만들필요는없다. 영구 SAS 데이터만드는방법은 2.3.2절에서다룰것이다. ⑵INPUT~; 변수명과변수타입을정의하는문장으로변수명도데이터이름부여방법을따르면된

25 다. 읽어오는데이터가문자이면 $( 문자열구분 ) 를변수명다음에넣는다. 숫자는콤마없이, 문자는공백없이입력하는것이읽어오는데편리하다. 물론콤마가있는숫자, 공백이있는문자를읽어오는명령어도존재한다. 이것은 2.4절에서다룰것이다. 변수이름은영어와숫자, 그리고일부특수문자 _ 정도만된다. 물론변수이름에는공백이있으면안되고데이터이름과같이반드시숫자로시작해야한다. 그러므로 a~z 를사용하거나관측된변수에적절한영어이름을부여하면된다. 변수이름으로 8자이상가능하다. 위프로그램에서는시간을 TIME, 암환자종류를 TYPE이라는이름을부여하였다. 변수이름이길어지면프로그램내에다시사용하는것이다소번거롭고그렇다고알파벳을사용하면출력결과를이해하는데어려움이있다. 이때에는 LABEL 문을사용하면된다. LABEL 문을사용하면한글출력이가능하다. 아래프로그램을실행하면변수이름 T 는 시간 으로출력된다. 이처럼 LABEL 문은데이터설정단계이후에사용되는모든 PROCEDURE 결과에변수 T가 시간 으로출력되게한다. 변수사이에는하나의공백을둔다. 한개체에대한데이터는한줄에넣는것이원칙이다. 만약한줄에여러개체 ( 사람 ) 의데이터를넣는경우 @@ 을사용해야된다. 만약위의프로그램에서 @@ 을제외하면 CANCER 데이터에는 2개변수, 6개의관측치가생성된다. 다음결과는 @@ 없이프로그램을실행해생성한 CANCER 데이터출력결과이다.

26 Chapter2. 데이터만들기 ⑶CARDS; 데이터입력이시작되었다고 SAS에게알린다. DATALINES; 을사용해도된다. 입력된데이터는사용자가구별하기쉽도록노란바탕색으로표시된다. SAS는그부분만을데이터로받아들인다는의미이다. ⑷RUN; DATA 단계, PROCEDURE 단계의끝을알린다. 프로그램여러단계로구성된경우마지막단계에만 RUN; 을사용하면된다. 그러나프로그램체계화를위하여매단계사용하는것이효율적이다. 데이터생성프로그램 (CANCER.SAS) 이실행한후 SAS 데이터가성공적으로만들어졌는지다음방법을통해확인할수있다. 1LOG 창관측치 30개, 변수 2개인 SAS 데이터가 WORK 라이브러리안에 CANCER 이름으로성공적으로만들어졌음을알수있다.

27 2 탐색기폴더에서 만들어진 SAS 데이터는 WORK 라이브러리에임시적으로저장된다. WORK 라이브러리에저장된 SAS 데이터는 SAS 종료와함께사라진다. 이를임시데이터라 한다. SAS 데이터 CANCER 의내용을보려면 열리고데이터내용이출력된다. 을두번클릭하면 VIEWTABLE 창이 3 출력창에서 확장편집기에서다음프로그램을실행하면 ( 가장일반적인방법 ) 출력창에데이터내용이출력된다. 데이터단계첫행을보면에서으로바뀌어있음을알수 있다. 데이터단계의문장모두가한행에숨겨진경우프로그램이긴경우프로그램작업이편하도록 으로표시된다. 이것은

28 Chapter2. 데이터만들기 출력창제목바꾸기 출력결과제목의디폴트 (default) 는 SAS 시스템 이다. 같은행에시스템날짜와페이지번호가자동출력된다. 출력제목을바꾸려면 TITLE 문장을사용하면된다. 제목을두줄이상으로하려면 TITLE1과 TITLE2, 을사용하면된다. 날짜나페이지번호가제목에출력되지않게하려면 OPTIONS 문장을사용하면된다. NODATE 옵션은날짜, NONUMBER 옵션은페이지번호를출력하지말라는옵션이다. 제목문장은한번사용하면 SAS 종료할때까지다른 TITLE 문을설정하지않는한동일하게출력된다. 제목문을 Reset( 제목이출력되지않음 ) 하기원하면제목설정없이 TITLE; 문장을사용하면된다. 프로그램중일부만실행하고싶으면아래와같이마우스로선택한후실행하면된다. 아래프로그램은 TITLE문은없어지게하고 CANCER 데이터의 TIME 변수의평균, 분산, 최대값, 최소값이출력되는프로그램이다.

29 2.2.2 메뉴분석창이용 엑셀과같이스프레드시트형식으로데이터를입력하려면 SAS/ASSIST 제품에대한라이 센스가있어야한다. 라이센스가없는경우아래팝업창이뜨고실행되지않는다. SAS 메뉴서솔루션 (S) 데이터분석 (S) 을선택하면왼쪽화면에는제목, 오른쪽화면에 는자료를입력할수있는스프레드시트창이뜬다. 데이터입력은엑셀에서와같이하면 된다. 반드시열은변수, 행은개체의관측치를입력해야한다.

30 Chapter2. 데이터만들기 데이터입력이끝나면다음절차에의해 SAS 데이터에저장하면된다. WORK 라이브러 리에 CANCER 라는이름으로저장된다.

31 이미만들어진 ( 기존의 ) SAS 데이터를이용하여 ( 예를들어 CANCER 데이터 ) SAS/ASSIST 을이용하려면스프레드시트창에서오른쪽마우스를눌러팝업창이나타나도록한다. SAS 이름으로열기를선택하고이래와같이 CANCER 데이터를선택하면된다.

32 Chapter2. 데이터만들기 2.2.3 외부데이터불러오기 엑셀데이터 엑셀에데이터를입력하는경우열은변수, 행은개체에대한관측치를입력하면된다. 첫행은 SAS에서사용하게될변수이름을지정하는것이좋다. 엑셀의첫행에지정된변수이름이그대로 SAS 데이터변수이름으로사용되므로변수이름을부여할때 SAS 변수이름설정규칙을지켜야한다. 첫행을변수이름설정으로사용하지않았거나 SAS 변수이름설정규칙을따르지않는경우 SAS는변수이름으로 _COL1, _COL2, 로자동설정하게된다. 엑셀데이터가 C:\TEMP 폴더에 CANCER.XLS 이름으로저장되어있다고하자.

33 을선택하여다음과같이설정한다. 엑셀문서내시트 (sheet) 가 2 개이상이거 나첫행에변수이름을지정하지않은경우사용한다. 엑셀문서내데이터시트가하나이 고첫행을변수이름으로사용하였다면조건변경없이디폴트설정을이용하면된다. 에는만들어진 SAS 데이터를저장할라이브러리를설정하고에는 SAS 데이터이름을준다. 아래화면을실행하면 WORK 라이브러리에 CANCER0 SAS 데이터가저장된다. 다음화면에서는아무설정없이 Finish 옵션을누른다. SAS 데이터가성공적으로 만들어지면로그창에다음노트가출력된다. 탐색기폴더의 WORK 라이브러리에도

34 Chapter2. 데이터만들기 당연히 CANCER0 SAS 데이터가있다. 엑셀데이터 SAS 데이터만들기쉬운방법 확장편집기에서 SAS 데이터를생성하는것과는달리엑셀데이터불러오기의경우이런방법을사용하면 SAS 종료후에다시이데이터를이용하려면위과정을반복해야하는번거로움이있다. 이를해결하기위해서는다음 2가지방법이있다. 1영구데이터만들기 : 2.3.2절참고 2확장편집기에서프로그램실행 SHEET 옵션은엑셀데이터에시트가여러개있는경우사용한다. 시트가하나밖에없거나가장앞에있는시트데이터를사용하려면사용하지않아도된다. GETNAMES 옵션은엑셀데이터첫행을변수이름으로사용하느냐에대한설정이다. 첫행을변수이름으로사용한경우에는이옵션 (GETNAMES=YES) 을설정하지않아도된다. 이프로그램만저장해놓으면엑셀데이터불러오기작업없이엑셀데이터를 SAS 데이터로만들수있다. 엑셀데이터를 SAS 데이터로만들려면 SAS/ACCESS 라이센스가있어야한다. 라이센스가없는경우에는엑셀에서다음형식으로데이터파일을저장한후텍스트데이터 SAS

35 데이터만들기방법을사용하면된다. 1 2 텍스트데이터 (TAB 키를사용한경우 ) 첫행은변수명이있다. 다음화면을제외하고는엑셀데이터가져오기방법과동일하다. 첫행이변수명이었다. 로그창에다음메시지가나타난다.

36 Chapter2. 데이터만들기 텍스트데이터 ( 공백사용한경우 ) 텍스트형식의데이터이고변수사이에하나이상의공백을사용하여데이터가텍스트 형식으로입력된경우확장편집기에서프로그램을사용하는방법이가장편리한방법이다. 프로그램만저장해놓으면 SAS 데이터만들기는계속할수있다. (TAB 사용 ) ( 스페이스바사용 ) 스페이스바를이용하여데이터가입력한경우에는다음프로그램을사용하면된다. ⑴INFILE; 텍스트파일이있는위치를설정해준다. 위프로그램에서는텍스트데이터가 C:\TEMP 폴더아래 CENCER0.TXT 라는이름으로저장되어있다는것을의미한다. INPUT 문장은 2.2.1절과동일하다. 텍스트데이터이고 TAB 키를이용하여데이터가입력된경우에는 delimiter 옵션을사용하여 SAS 데이터를만들면된다.

37 2.3 데이터저장하기 2.3.1 프로그램저장하기 SAS 데이터는굳이저장할필요는없다. 2.2절에서확장편집기를이용하면내부입력은물론외부데이터 ( 엑셀데이터, 텍스트데이터 ) 등도읽어올수있음을알았다. 다음과같이데이터만들기프로그램만저장해놓고 SAS 실행후이프로그램을확장편집기로불러와실행해주면 SAS 데이터가만들어진다. 아래과정에의하면확장편집기에작성된프로그램이 C:\TEMP 폴더아래 CANCER.SAS로저장된다.

38 Chapter2. 데이터만들기 2.3.2 영구데이터만들기 WORK 라이브러리에있는저장된 SAS 데이터는임시데이터로 SAS가종료되면사라진다. 그러므로 SAS 종료후에도남아있는 SAS 데이터를영구데이터라하는데아래과정을거쳐만들어진다. 2.2절에서살펴보았듯이 SAS 데이터만들기는확장편집기에서가능하므로 DATA 단계프로그램만저장해했다가다시실행하면굳이영구 SAS 데이터를만들지않아도된다. SAS 영구데이터를만드는경우는이례적이다. 탐색기에서라이브러리이름이있는곳까지가서오른쪽마우스버튼을누르면팝업창이나타나는데여기서새로만들기메뉴를선택한다. 시작할때자동할당을체크하면 SAS 시작시 Se 이름의라이브러리가생기고

39 C:\TEMP 폴더가지정된다. Se 라이브러리에 CANCER2 데이터가저장된다. 윈도우탐색기 ( 창 +E) 를열어 C:\TEMP 폴더에가면다음파일이있다. SAS 데이터의확장자는 SAS7BDAT 이다. SAS 를종료하고다시시작하면탐색기에 SE 라이브러리가있고그안에 SAS 데이터

40 Chapter2. 데이터만들기 CANCER2 가있다. 2.3.3 데이터다른형식저장하기 SAS 데이터를다른형식으로저장하려면다음과같이실행한다. 위창에서 Next 를클릭하면다음과같이 Export Wizard 창이뜬다. 위창에서파일형식을엑셀형식으로지정하고 Next 를클릭하고저장하고싶은파일경

41 로와이름을지정해주면엑셀파일로변환된자료가생성된다. EXAMPLE: SAS 데이터엑셀저장 SASHELP 라이브러리에있는예제데이터 CLASS 를엑셀데이터로저장하여보자. 선택하면로그창에는다음메시지출력되고 D:\TEMP 폴더안에 CLASS.xls가저장되어있다.

42 Chapter2. 데이터만들기 CLASS.xls 를열어보자. EXAMPLE: SAS 데이터엑셀저장 ( 확장편집기에서 ) 엑셀데이터불러오는경우일반적으로 SAS 도구메뉴를이용하거나확장편집기에서 PROC IMPORT (2.2.3절) 이용하면된다. SAS 데이터를엑셀파일로저장할때도확장편집기를이용하면된다. 첫행과두번째행은하나의문장이므로첫행마지막에는세미콜론이없음에유의하기바란다. DBMS(Data Base Manage System) 옵션은파일형식을지정하는것이다. 변수사이에 TAB이있는텍스트파일로저장하려면 DBMS=DLM을사용하면된다. 만약 MS-ACESS 형식으로저장하려면 DBMS=ACCESS로하면된다.

43 엑셀파일이성공적으로만들어지면로그창에아래노트가출력되고 D:\TEMP 폴도 \ ㅓ 안에는 CLASS.xls 가저장된다. 2.4 특수한데이터읽어오기 텍스트형식의데이터에서숫자나공백없이입력된문자는데이터단계프로그램에서 INFILE, INPUT 문장에의해 SAS 데이터만드는데문제가없다.(2.2.3절참고 ) 그러나정형화되지않은데이터를읽어오려면다소어려움이있다. 이런문제들도입력된데이터를엑셀로보낸후셀서식에서적절한작업을거친후 SAS 데이터가져오기메뉴에서불러오면문제가해결된다. 훨씬간편하고시간효율적인방법이다. 그럼에도불구하고이절에서는정형화되지않은데이터를확장편집기프로그램을이용하여불러오는방법을설명하고자한다. 2.4.1 예제데이터 변수 : 국가명, 국민소득 ($, 1960 년 ), 날짜 1, 날짜 2, 시간 EXAMPLE_TAB.txt (tab 키사용 ) / EXAMPLE_BAR.txt(space bar 사용 )

44 Chapter2. 데이터만들기 정형화되지않은데이터를 SAS 데이터로만들때는우선엑셀파일로변환한후 SAS 에 서 2.2.2 절방법에의해 SAS 데이터를만드는것이편리하다. 2.4.2 엑셀로변환하기 EXAMPLE_BAR.txt 를엑셀파일로변환해보자. 두텍스트파일이 C:\TEMP 폴더에있 다고하자. 먼저스페이스바를사용하여입력한데이터를엑셀데이터로변환해보자. 탭과공백부분을표시하고다음을누른다. 그러나문자에공백이있는 U. KINGDOM

45 등은문제이다. 해결방법은수작업하는방법밖에없다. 텍스트마법사 - 3 단계중 1 단계 는다음을클릭한다. 여기서마침을클릭하면다음과같이엑셀데이터가생성된다.

46 Chapter2. 데이터만들기 문자에공백이있는경우에는하나씩수정해야하는문제가발생한다. TAB 키를이용하 여데이터를입력한 EXAMPLE_TAB.txt 를엑셀파일로변환해보자. 텍스트마법사 - 3 단계 중 1 단계는다음을클릭한다. 여기서마침을클릭하면다음과같은엑셀데이터가생성된다.

47 성공적으로변환되었다. 이제변환된엑셀데이터의셀서식을적절하게바꾸자. 바꾸고 싶은열이름을클릭하고오른쪽마우스버튼을클릭하면팝업창이드는데여기서셀서 식메뉴를선택한다.

48 Chapter2. 데이터만들기 확인을누르면셀서식이바뀐다. 날짜도동일한방법으로셀서식을지정한다.

49 동일한방법으로 D 열과 E 열 ( 시간에서한다 ) 을다음과같이바꾸면된다. 첫행의번호를선택하고오른쪽마우스버튼을눌러팝업창에서삽입을선택하면첫 행이한칸아래로밀리고행이삽입된다. 다음과같이각셀에적절한이름을적는다.

50 Chapter2. 데이터만들기 2.4.3 확장편집기프로그램 이제정형화되지않는외부데이터를확장편집기의프로그램으로한번에불러들이는

51 방법을설명해보자. 외부텍스트 (ASCII) 파일을 SAS 데이터만들기프로그램구조 (syntax) 는다음과같다. 확장편집기내에서데이터입력하기프로그램구조는다음과같다. 외부데이터가텍스트데이터의경우 INFILE 문을사용하기보다는데이터를확장편집기에복사한후 CARDS; 문이나 DATALINES; 문을사용하여 SAS 데이터를만드는것이편리하다. 그러나데이터가많아지면 ( 변수 10개이상, 행관측치 20~30개이상 ) 프로그램작성시입력반응속도가늦어지는단점이있다. INPUT 문장에서읽어들이는변수의형식을지정하는것은 INFORMAT 이라고하고출력 형식을지정하는것을 FORMAT 이라한다. 공백이있는문자열데이터

52 Chapter2. 데이터만들기 위프로그램을실행시키면다음과같은결과가출력되는데데이터가제대로읽히지않음 을알수있다. 1 열부터 12 열까지를변수 NAME 의관측치로읽는다. 이런방식을칼럼 (column) 지정방 식이라한다.

53 INPUT 부분을위와같이수정하고실행시키면결과는다음과같다. 문자열에공백이있는경우열이맞지않으면칼럼지정방식에의해서도불가능하다. 다 른방법이있기는하지만여기서는다루지않겠다. 위프로그램은스페이스바를이용하여입력한자료를읽는프로그램이다. [ 참고 ] @ 사용하기. 커서를강제로 2 번째열로이동하여관측치를읽기시작한다.

54 Chapter2. 데이터만들기 @ 를사용해도 BAR 데이터는문제를해결할수없다. 콤마 (,) 데이터읽기 COMMA가있는숫자데이터를읽을때는 COMMAw.d 옵션을사용한다. w(width) 는데이터길이를의미하며 d(digit) 는소수점자리수를지정한다. 다음은 13번째열부터 GNP 변수관측치를읽어들이되콤마가있는데이터 6자리 ( 소수점은없음 ) 로데이터를읽는프로그램이다.

55 날짜, 시간데이터읽기 날짜데이터를지정하는옵션은다음과같다. MMDDYYw. (MM 은월두자리, DD 는요일두 자리, YY 는년도두자리를의미한다. w 는데이터길이를의미한다. 8. 을사용한것은 나 / 을포함한데이터길이이다. date1 이나 date2 출력결과를보면날짜형식이아니라정수로되어있음에놀랄것이다. 우선정수의의미부터설명해보자. 1960 년 1 월 1 일을 0 으로하여매일 1 씩증가시켰다. 만 약출력결과도날짜로보이려면 FORMAT 을지정해주면된다. 10 이나 8 과같은숫자는날

56 Chapter2. 데이터만들기 짜길이를지정하는것이다. s 는 slash 의약어이고 d 는 dash 를의미한다. 2.4.4 형식맞게출력하기 만들어진 SAS 데이터를읽어들인형태대로출력하거나원하는형식으로출력하려면 FORMAT 문을사용하면된다. 다음은날짜형식으로읽어들인변수 DATE1, DATE2 를원 하는형식으로출력하는것이다. FORMAT 문은숫자나문자열에도사용할수있다. FORMAT 문은출력에관련된옵션이 다. GNP 변수는 8 자리 ( 소수점 2 자리포함 ) 콤마로출력된다. NAME 은문자열 2 자리이다. 출 력은이렇데되더라도 SAS 데이터내에는온전한데이터가저장되어있다.

57 시간은 TIMEw.d 형식으로읽으면된다. 00:00:00 은시간 : 분 : 초로 00:00 은시간 : 분으로인 식하면 00:00:00 을 d 으로하며 1 초에정수하나씩증가한다.

58 Chapter2. 데이터만들기 출력도시간형태로하려면다음과같이하면된다. 2.4.5 두행이상입력된데이터읽기 다음은이름, 전화번호, 월사용료를조사한자료가한개체에대해 2 행으로자료가입 력된경우 SAS 데이터만드는프로그램이다. 여러행인경우 / 을계속하여사용하면된다.

59 한편한행에여러개체의데이터입력된경우에는 @@ 옵션을사용하면된다. 2.4.6 연속하여입력한데이터 ( 설문데이터 ) 설문조사의경우데이터를입력할때는항목 ( 변수 ) 사이빈칸없이연속하여입력한다. 데이터연속하여입력하는이유는문자형변수가없고데이터의자리수가일정하므로입

60 Chapter2. 데이터만들기 력시간과오류를줄일수있기때문이다. 예제설문을통하여설문데이터입력방법, SAS 데이터만드는방법을알아보자. 설문예제데이터 설문지가수거된후우선부적절하고불성실하게응답된설문지를제외한다. 각설문지에일련번호를부여하고첫번째설문지문항에변수명을적고보기번호가없는항목에대해서는숫자번호를부여한다. 각문항에변수이름을부여할때문항내용에따라부여하는것이구별이용이하다. Q1 대신 GENDER, Q2 대신 MAJOR 등으로 그러나설문조사의경우문항수가많으므로변수이름설정이용이하지않고데이터읽기, 프로그램내에사용하기등에문제가있다. 이런목적이라면 LABEL문을사용하는것이적절하다. 그러므로변수이름은차례로 Q1, Q2, 이런식으로부여하는것이적절하다. 4번문항과같이복수선택인경우가장많이선택한응답자를골라그수만큼설정하거나분석자가임의로 2개로지정하여입력하면된다. 5번문항과같이우선순위문항은순위개수만큼변수를잡아주어야한다. Q5~QQ9

61 이렇게잡아주어도되나 _ 에의한서브번호를사용하는것이문항번호와변수번호가일치하여관리가용이하다. 1번문항 : 보기남자, 여자에번호가없으므로남자 =1, 여자 =2 번호부여 2번문항 : 보기가 11개이므로입력자리수는 2개이다. 그러므로 1번선택한경우에는 01로입력해야한다. 보기개수가 10개이면 10번보기를 0으로입력하면한자리만입력해도된다. 4번문항 : 최대선택한사람이 2개를선택하였다. 혹은분석자가 2개선택한것까지만유효하다고인정한경우이다. 2개만유효한데 (2개까지만선택 ) 3개를선택한경우는결측치처리한다. 응답하지않거나결측치처리문항은. ( 마침표 ) 으로입력한다. 5번문항 : 순위개수만큼변수를지정한다. 입력데이터는보기옆의우선순위이다. 입력한데이터보기이다.

62 Chapter2. 데이터만들기 데이터입력 내용설명 20152.14235 4번문항에서하나만선택했으므로나머지하나는결측치 11131221345 모든문항제대로응답된경우 2..24154321 2번문항무응답, 두자리입력문항이므로점을두번입력 209.2..12345 4번문항을 3개응답하여결측치처리하였음 10142.. 우선순위문항을제대로응답하지않은경우 입력된데이터가 C:\TEMP 폴더에텍스트형식으로 DATA.TXT로저장되어있다고하자. SAS 데이터만드는프로그램은다음과같다. 4번, 5번과같이연속된경우반드시 () 로묶어야한다. 이런형식은개별문항에대해서도사용할수있다. 6번문항부터 10번문항까지한자리씩입력하였다고하자. 그런경우 (Q6-Q10) (1.) 을사용하면된다. Q1, Q2, 변수가무엇인지구별하기위해서는 LABEL 문을사용하여 SAS 데이터를만들면 PROC 단계의결과에 Q1, Q2 옆에이름이출력된다. 각문항의보기에대한이름지정은 FORMAT 문을이용해야한다. 이는 3. 절에서다루기로한다.

63 시간 / 날짜 INFORMAT 및 FORMAT 문장형식