Monthly User Guide from JMP Korea 제 13 호 (2018 년 8 월 ) Excel 과 JMP, Excel 보다 JMP * 본 Guide 는매월세번째수요일에발행됩니다 (2018 년 7 월호부터는 JMP 14 Version 기준입니다 ) ** Monthly User Guide 지난호는다음 Site 를참조하세요 (https://www.jmp.com/ko_kr/newsletters.html) *** 본 Guide 의내용과관련한문의는 Ikju.Shin@jmp.com 으로연락바랍니다 Copyright SAS Institute Inc. All rights reser ved.
1. Excel 과 JMP JMP 를설치할경우 CPU, 언어지원등과함께 Excel 추가기능 을선택하게되면, Excel 에서 JMP 로바로연결할수 Platform 이형성됩니다. < 선택후 Excel 화면 > * JMP 13 version 이상의경우 Excel 2016, 2013 및 2010 에서 Available 합니다 1 / 10
2. Excel 에서의 JMP 1. Excel 에서아래와같이 data 입력후 3. 환경설정 아이콘클릭 5. Menu 에대한설명 Excel 과 JMP 의행 / 열구조차이를 Matching Excel 에저장된 Formula 기능을 JMP 에서 profiling Graph 로표현 몇번째행을 Column name 으로할것인지설정 2. 상단의 JMP Click 한후 4. 데이터테이블 아이콘클릭 JMP 로바로연결 1. Excel 상태에서자주사용하는 JMP 기능 2. 해당아이콘을 click 하면 JMP Data Table 과해당기능의 window 가 display 됨예 ) 분포 아이콘을클릭할경우 Excel 에서첫번째열이비어있을경우위와같이표시됨 2 / 10
3. JMP 에서의 Excel Import 1. 대부분의 JMP User 들은 Excel 에서 JMP 로 link 하기보다는 JMP 에서 Excel 파일을불러와서사용 4. Excel file 을 open 하면 JMP Data file 이바로열리는것이아니라아래와같이 Excel 과 JMP 간의행, 열및열이름차이등을조정하기위한 Excel Import Wizard 창이열림 6. 조정후 Import 를 click 하면아래와같이 JMP Data Table 이생성됨 2. 아래와같은 Excel Data 가있다고가정 3. JMP 에서 File / open 에들어가서 Excel file 을불러올수있음 * 참고 : JMP 에서 import 가능한 data file 5. individual Worksheet Settings 에서 Excel 과 JMP 의차이를조정 * 네가지 Option 의뜻은다음과같음 1) Excel 의몇번째 Row 가 Column Header? 2) 몇개의 Row 가 Column Name? 3) 몇번째 Row 부터 Data? 4) 몇번째 Column 부터 Data? 3 / 10
4. Excel 과 JMP 차이 Excel 과 JMP 는다음과같은차이가있습니다 (Data Table 의구조측면 ) Table Panel Column Panel Row Panel Column Name Items Excel JMP Formula 개별 Cell 단위로 Formula 생성 Column 단위로 Formula 생성 Column Names Tables & Worksheets Data Grid Analysis & Graph Reports Column Name 은 Data Grid* 의한부분 Modeling Type 이달라도같은 Column 에저장가능 하나의 Spreadsheet 에여러개의 Table 및 Worksheet 포함가능 Data 는 Data Grid 의아무곳에나위치가능 분석결과및그래프는 Data Grid 안에위치 Column Name 은 Data Grid 의부분이아님 숫자 (Numeric Data) 와글자 (Character) 가함께있으면해당 Column 을 Character Data 로인식 JMP 는 Worksheet 의개념이없음 각각의 Data Table 은 XXX.jmp file 로별도로저장 Data 는 Row 1 & Column 1 부터시작 분석결과및그래프는별도의윈도우에표시됨 Data Grid 4 / 10
5. Excel 보다 JMP Excel 과비교될수있는 JMP 의몇가지기능을살펴보겠습니다. 1. 쉽게표만들기및통계량계산하기 2. Formula 3. Categorization 4. 특정 Row 를숨기거나제외하는기능 5 / 10
5. Excel 보다 JMP 1) 쉽게표만들기및통계량계산하기 1. Sample data : big class.jmp 4. 변수 (Sex, Age) 를순차적으로선택하여 Drop Zone for Rows 에 Drop 1) Age 선택후 Drop, 그다음 Sex 를 Drag 하여 a) 처럼 Drop 하면변수추가가아닌변수변경, b) 처럼해야변수추가. 6. 소계 (Sub Total) 및합계등을구하고자한다면 Add Aggregate Statistics 선택하면아래와같이표가완성됨 2. 분석 ( 표만들고자하는 ) 하고자하는내용 : 성별, 나이별로키와몸무게의평균, 표준편차, 최소값, 최대값에대한표 3. Analyze / Tabulate a) b) c) 변수추가결과 5. 변수 (Height, Weight) 를선택한다음 N 의위치에 Drop. 구하고자하는통계량선택후 Sum 위치에 Drop 7. 만들어진표를 Excel 로보내기위해서는 1) Tabulate / make into data table 에들어가서 data table 을만든다음 2) file / save as 에들어가서 excel file 로저장하면됨 6 / 10
5. Excel 보다 JMP 2) Formula 1. JMP 에도 Excel 처럼강력한 formula 기능이있음 2. Excel 과 JMP 차이점 1) Excel : 개별 Cell 단위로 Formula 생성 2) JMP : Column 단위로 Formula 생성 3. 분석하고자하는내용 ( 예시 ) 1) Sample file : big class.jmp 2) 비만도를확인하기위해 - new column (Weight / Height) 를계산하고 column name 에 Other BMI 입력 - 또다른 new column 에 Other BMI 값을기준으로 High, Medium, Low 로범주화 4. Other BMI 계산 1) cols / new column 또는 data table 의 new column 에서우측마우스클릭한후 column properties / formula 선택 column info 에 Other BMI 입력, formula 창에 Weight / Height 입력 2) 4-1) 과 new column 생성한후, formula 창에우측과같이입력 (column 명 : Categorization) 5. 결과 1) Formula 를이용하여 new column 을만든결과 2) Formula 가들어있을경우왼쪽 column table 의 column 명칭에 (selection mark) 생성됨. Selection mark 를 click 하면해당 formula 창이 display 됨 6. Formula 에대한세부적인설명은 Help / books / Using JMP 의 formula editor(14 version 기준 349 page ~ ) 부분참조. 7 / 10
5. Excel 보다 JMP 3) Categorization 1. Categorization( 범주화, Discretization) 1) 연속형 data 를이산형 data 로만드는것 2) Continuous Nominal or Ordinal 3) Grouping 의개념 2. Categorization 의예 : 앞페이지의 4 번 3. Categorization 사유 1) Y( 특히, 연속형 Y) 에영향을미치는변수를좀더쉽게 Screening 하고자할때 2) 좀더단순한통계분석방법을사용하기위해 3) 1) 및 2) 의사유로 Big Data 등을다루는 Data Mining 분야에서많이활용 4. Categorization 방법 : 일반적으로 Excel 또는분석소프트웨어에서제공하는 formula 기능활용 5. JMP 에서도 Formula 기능을이용하여 Categorization 가능하지만 JMP 의상호작용 (Interaction) 기능을이용하여 Graphical 한측면에서 Categorization 하는방법을추천함 6. sample file : diabetes.jmp 7. Analyze / Distribution 에들어가서 Y 및 age ~ glucose 까지선택, OK 8. 도구모음의 Grabber 기능을이용 Grabber 클릭후 Y Data 에대한 Histogram 위에서마우스왼쪽눌러서위 / 아래로이동 1) 위로이동했을경우 2) 아래로이동했을경우 9. 8 번의방법을활용하여 Histogram 의 Bin( 막대그래프 ) 개수를일정개수로만든다음, 제일값이큰그래프와작은그래프선택후 ( 또는큰값, 중간값및작은값에해당하는그래프를각각선택후 ) 해당 data 만별도로추출하여분석할수있음 1) 히스토그램위에서마우스우측 Click Subset 2) Row Panel 의 Selected 에서 Data View Click 8 / 10
5. Excel 보다 JMP 4) 특정한 Row 를숨기거나제외하는기능 1. JMP 에서는특정한 Row 를숨기거나제외한후그래프를그리거나통계량계산을 Excel 보다쉽게할수있습니다. 2. 특정 Row 를선택후오른쪽마우스를 click 하면아래와같습니다. 이중에서많이사용하는 Hide, Exclude & Label 활용법에대해알아보겠습니다 3. 설명 구분설명 Icon Exclude Hide Label 말그대로분석에서제외하는기능 - 원래의미는그래프에서안보이게하는기능 - 통계량과함께표현될경우에는 Display 됨 ( 예 : Histogram) Graph 등으로표현시 Label ( 원래 Data) 를 Display 4. 아래와같이 Data 입력후 Row 선택 오른쪽마우스 Click 하여 Row 상태설정 9 / 10
5. Excel 보다 JMP 4) 특정한 Row 를숨기거나제외하는기능 5. Graph / Graph Builder 1) Row 1 & Row 2 : labeled 2) Exclude 및 Hide 된 4 개를제외하고 display 3) Exclude 된 2 개는 Exclude 되었다고표시 7. Analyze / Distribution 1) Exclude 된 2 개 row 제외하고 Histogram Plotting (Graph Builder 처럼 Hide Row 를숨기지않음 ) 2) Exclude 된 2 개 row 제외하고통계량이계산됨 6. Analyze / Tabulate 1) Exclude 된 2 개를제외하고합계계산 2) A Column 포함시 Missing 된 4 개의 Row 및 Exclude 된 2 개 Row 제외하고계산 10 / 10