EXCEL 을이용한임상자료다루기 김묘정 (BCU) 2013. 04. 30.
Contents Ø Data & Coding book Ø EXCEL tips! Ø Graphs 통계분석을위한자료의형태 Coding book 작성과 EXCEL tip: 선택하여붙여넣기 알아두면유용한 tips: 단축키 / 함수 시작하기전 : 빠른실행도구모음 / 틀고정 / 인쇄제목 / 필터 중복 ID 확인 : 중복된항목제거 / 정렬 / 행렬삽입 / 행렬삭제 / EXACT 함수 날짜서식 : 텍스트나누기 / 텍스트합치기 기간계산 : IF 함수 / 채우기 Scatter plot Bar graph Mean profile graph EXCEL 을이용한임상자료다루기 2
통계분석을위한자료의형태 Ø 개인식별번호 (ID) 일반적으로한행에는한 ID 에해당하는정보정리 Ø 원자료를보존하는것을권장 예 : ( 생존기간 ) 365( 일 ) à 시작일 : 2012-04-24 일 / 사망일 : 2013-04-24 일 Ø 개인정보보호를위해주민등록번호, 이름등의개인식별가능정보삭제 Ø 변수명 영문과숫자의조합이되영문으로시작 공백을포함한특수문자 (underbar 제외 ) 는사용할수없음 자료의값은수치의형태로정리 EXCEL 을이용한임상자료다루기 3
통계분석을위해정리된자료의예 ü 이름, 주민등록번호등개인정보삭제 ü 변수명은영문으로시작하는영문과숫자의조합 ü 공백을포함한특수문자사용 X (underbar는가능 ) ü 자료의값은수치의형태로정리 EXCEL 을이용한임상자료다루기 4
Coding book 의예 ü 누구나알아볼수있도록작성하는것이중요! EXCEL 을이용한임상자료다루기 5
Coding book: EXCEL tip ( 선택하여붙여넣기 à 행 / 열바꿈 ) 변수명선택하여복사 새로운 sheet 에서마우스오른쪽클릭후선택하여붙여넣기 EXCEL 을이용한임상자료다루기 6
Coding book: EXCEL tip ( 선택하여붙여넣기 à 행 / 열바꿈 ) ü Type: Nominal, Ordinal, Continuous Nominal: 분류에목적이있으며, 숫자자체는의미를가지지않고범주들간에크기나순위개념이없음 ( 예 : ID, 성별, 사망여부등 ) Ordinal: 숫자자체의의미는가지지않지만, 순서적인의미가있음 ( 예 : 통증정도등 ) Continuous: 변수의값사이의차이가의미가있으며연산이가능함 ( 예 : 키, 몸무게등 ) ü 변수명에대한설명 : 변수의의미를간략하게기술 ü 변수값의단위및범위, 변수값에대한설명 : 이상치를파악할수있으므로반드시정리 EXCEL 을이용한임상자료다루기 7
알아두면유용한 tips: 단축키 Ctrl + 1 단축키 (Ctrl + ) 설명 셀서식대화상자표시 Ctrl + (Shift) + 9 선택한행숨기기 (Shift: 숨기기취소 ) Ctrl + (Shift) + 0 선택한열숨기기 (Shift: 숨기기취소 ) Ctrl + 더하기 (+) Ctrl + 빼기 (-) Ctrl + Page Up Ctrl + Page Down Ctrl + ~ 셀추가 셀삭제 다음 ( 오른쪽 ) 시트로이동 이전 ( 왼쪽 ) 시트로이동 셀값표시와수식표시간의전환 Ctrl + X (C) 잘라내기 ( 복사하기 ) Ctrl + V Ctrl + D (R) 붙여넣기 Ctrl + F (H) 찾기 ( 찾아바꾸기 ) Ctrl + Ctrl + L Ctrl + 방향키 Ctrl + Shift + 방향키 빈셀지정 : 바로위 ( 왼쪽 ) 의셀복사범위지정 : 범위가장위 ( 왼쪽 ) 의셀복사 바로위의셀복사하고편집상태유지 표만들기 연속된자료의끝에서끝으로이동 연속된자료의시작부터끝까지모두선택 ( 참고 ) F2 수식입력줄로바로가기 EXCEL 을이용한임상자료다루기 8
알아두면유용한 tips: 함수 함수 설명 =IF() =SUMIF() =COUNTIF() =COUNTBLANK() =TRIM() =CONCATENATE() =MID() =SUBSTITUTE() =VLOOKUP() =HLOOKUP() =AVERAGE() =STDEV() =CORREL() 논리조건의결과 (TURE/FALSE) 에따른값 ( 함수 ) 지정 주어진조건에해당하는셀의합 범위내주어진조건에해당하는셀의개수 범위내에서비어있는셀의개수를반환 텍스트에서공백제거 여러텍스트항목을한텍스트로합치기 텍스트문자열의지정한위치로부터지정한개수의문자를표시 (LEFT, RIGHT: 각각텍스트문자열의왼쪽, 오른쪽으로부터지정한개수의문자를표시 ) 텍스트문자열에서기존텍스트를새텍스트로변환 배열의첫째열을찾아행쪽으로이동하여셀값을반환 배열의첫째행을찾아열쪽으로이동하여셀값을반환 평균 표본의표준편차 두데이터집합사이의상관계수 EXCEL 을이용한임상자료다루기 9
알아두면유용한 tips: 함수 ü F1 또는파일 à 도움말 ü 함수검색또는함수참조선택 ü 필요한함수에대해보다자세한정보열람가능 EXCEL 을이용한임상자료다루기 10
시작하기전 : 빠른실행도구모음 자주쓰는옵션을 < 마우스오른쪽 > 클릭후빠른실행도구모음에추가선택 빠른실행도구모음에추가한옵션은차례대로 <Alt+ 숫자 > 단축키를통해실행! EXCEL 을이용한임상자료다루기 11
시작하기전 : 틀고정과인쇄제목 자료일부를고정할수있어요! 인쇄시지정한행 / 열이반복! EXCEL 을이용한임상자료다루기 12
시작하기전 : 필터 각변수의값들을확인, 조건에따른선택가능! 이과정에서간략하게 Data cleaning 가능!! EXCEL 을이용한임상자료다루기 13
시작하기전 : 필터 ü 필터기능을이용하여 Death=1인환자선택 à 하단에전체 N수와선택된 N수확인가능! ü 수치형태의변수를선택 à 하단에평균, 개수, 합계확인가능! 별도의분석을하지않아도기본적인정보를 확인할수있어요! 상태표시줄에서마우스오른쪽클릭하면 표시정보를선택할수있어요! EXCEL 을이용한임상자료다루기 14
중복 ID 확인 : 중복된항목제거 (!) 어떤 ID 가중복, 제거되었는지알수없음 중복된 ID 가있는지여부를간단히파악하고자 할때사용 EXCEL 을이용한임상자료다루기 15
중복 ID 확인 : 정렬 à 행렬삽입 à EXACT 함수 정렬 열삽입 ü 정렬기준변수는환자개인을식별할수 있어야함 ü 열삽입 삽입하고자하는열위치선택 à 마우스오른쪽클릭 à 삽입 삽입하고자하는열위치선택 à Ctrl + 더하기 (+) EXCEL 을이용한임상자료다루기 16
중복 ID 확인 : 정렬 à 행렬삽입 à EXACT 함수 EXACT 함수 ü 수식입력줄에 =EXACT(A2,A3) 입력하는것과같음 채우기 골라쓰세요! ü 채우기핸들 ( 마우스끌어채우기 ) ü Ctrl + C à Ctrl + V ü 영역지정후수식입력 à Ctrl + Enter ü Ctrl + D ü 마우스로끌어채우거나더블클릭 ü Ctrl + C à Ctrl + V ( 복사하여붙여넣기 ) ü 값포함하여영역지정 à Ctrl + D ü 영역지정후수식입력 à Ctrl + Enter EXCEL 을이용한임상자료다루기 17
중복 ID 확인 : 정렬 à 행렬삽입 à EXACT 함수 ü EXACT 함수적용결과를복사 à 선택하여붙여넣기 à 값만붙여넣기 ü Ctrl + H ( 찾아바꾸기 ) 이용하여 FALSE 지움 TRUE는해당 ID가바로다음줄에중복됨을뜻함이를통해중복 ID를눈으로확인하며 data cleaning 가능 EXCEL 을이용한임상자료다루기 18
중복 ID 확인 : 정렬 à 행렬삽입 à EXACT 함수 ü 중복 ID 를확인하고삭제할 ID 는행삭제기능이용하여삭제 해당행선택 à 마우스오른쪽클릭 à 행삭제 해당행선택 à Ctrl + 빼기 (-) 중복 ID 제거된자료 EXCEL 을이용한임상자료다루기 19
날짜서식 : 텍스트나누기 à 텍스트합치기 ü 기간계산을위해서는날짜형식으로맞추어주어야함 ü 현재자료는 20120525 와같이날짜형식이아님 ü 20120525 à 2012-05-25 와같은형식으로수정할필요있음 STEP 1 Enroll_date 변수오른쪽에 3 개의열삽입 EXCEL 을이용한임상자료다루기 20
날짜서식 : 텍스트나누기 à 텍스트합치기 STEP 2-1 ü 텍스트나누기와같은기능 ü 이중함수를이용하면한번에변환가능 EXCEL 을이용한임상자료다루기 21
날짜서식 : 텍스트나누기 à 텍스트합치기 STEP 2-2 해당열선택 à 데이터 à 텍스트나누기 년 / 월 / 일을나누는구간에 구분선지정 EXCEL 을이용한임상자료다루기 22
날짜서식 : 텍스트나누기 à 텍스트합치기 년 / 월 / 일이각각의열에 나누어져있음 STEP 3 수식입력줄에 =G2&"-"&H2&"-"&I2 입력하는것과같음 EXCEL 을이용한임상자료다루기 23
날짜서식 : 텍스트나누기 à 텍스트합치기 STEP 4 ü 채우기기능이용하여다른날짜변수들도 Enroll_date 와같이만들기 à 날짜서식으로정리된자료 ü 생존자료분석을위한 duration 정의 ( 예 : Event 가 Death 일때 ) 연구종료시점이전에사망 à 생존기간 = Death date Enroll date 연구종료시점까지사망하지않음 à 생존기간 = Last f/u date Enroll date EXCEL 을이용한임상자료다루기 24
기간계산 : IF 함수 ü Logical_test: 조건 ü Value_if_true: 조건이참일때반환할값 ü Value_if_false: 조건이거짓일때반환할값 수식입력줄에 =IF(H2=1, I2-G2, J2-G2) 를입력하는것과같음 EXCEL 을이용한임상자료다루기 25
기간계산 : 필터 à 채우기 ü Death=1 을필터 à Survival_duration = Death_date Enroll_date ü Death=0 을필터 à Survival_duration = Last_fu_date Enroll_date EXCEL 을이용한임상자료다루기 26
Excel tips! 완성된자료! EXCEL 을이용한임상자료다루기 27
Graph: Scatter plot ü 삽입 à 분산형 ü 생성된그래프영역에마우스오른쪽클릭 데이터선택 à 데이터범위 or 범례항목 ( 계열 ) 에서변수지정 EXCEL 을이용한임상자료다루기 28
Graph: Scatter plot Plot 제목수정 선택 à 삭제 축에서마우스오른쪽클릭 à 축서식수정 가로축, 세로축 제목삽입 EXCEL 을이용한임상자료다루기 29
Graph: Bar graph ü 성별에따른 Death 확률을그래프로! Probability (%)=Frequency/Total N SE=SQRT(P*(1-P)/Total N) (SQRT: EXCEL에서 square root의계산식 ) EXCEL 을이용한임상자료다루기 30
Graph: Bar graph 데이터설정 가로축설정 축에서마우스오른쪽클릭 à 축서식수정 EXCEL 을이용한임상자료다루기 31
Graph: Bar graph ü 레이아웃 à 오차막대 à 기타오차막대옵션 ü 양의오류값과음의오류값에 SE 범위지정 ü 기타옵션에서그래프의모양수정할수있음 EXCEL 을이용한임상자료다루기 32
Graph: Mean profile graph ü 삽입 à 꺾은선형 à 해당스타일그래프선택 ü 데이터선택 à 계열이름, 값, 축레이블설정 EXCEL 을이용한임상자료다루기 33
Graph: Mean profile graph EXCEL 을이용한임상자료다루기 34
Graph: Mean profile graph Plot 제목삽입 선택 à 삭제 EXCEL 을이용한임상자료다루기 35
경청해주셔서 감사합니다!