STATA와 함께 춤을

Similar documents
BK21 플러스방법론워크숍 Data Management Using Stata 오욱찬 서울대사회복지학과 BK21 플러스사업팀

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

1) 주거이동과관련된이론적배경및선행연구들에대한자세한사항은조성진 (2014), 문근식 이현석 (2016) 등참고. 특정주거지 ( 주택 ) 에서의거주기간이아닌이주여부 / 계획을종속변수로하여로짓 (Logit) 이나프로빗 (Probit) 모형등을이용하여분석한연구들도많이있다 (

통계학 개론

II. 기존선행연구

- 2 -

ORANGE FOR ORACLE V4.0 INSTALLATION GUIDE (Online Upgrade) ORANGE CONFIGURATION ADMIN O

DocsPin_Korean.pages

통계학 개론

MATLAB and Numerical Analysis

PowerPoint 프레젠테이션

슬라이드 1

Monthly User Guide from JMP Korea 제 13 호 (2018 년 8 월 ) Excel 과 JMP, Excel 보다 JMP * 본 Guide 는매월세번째수요일에발행됩니다 (2018 년 7 월호부터는 JMP 14 Version 기준입니다 ) ** M

Microsoft PowerPoint - e pptx

01_피부과Part-01

MySQL-Ch10

Data Sync Manager(DSM) Example Guide Data Sync Manager (DSM) Example Guide DSM Copyright 2003 Ari System, Inc. All Rights reserved. Data Sync Manager

USER GUIDE

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

HWP Document

Microsoft PowerPoint - ICCAD_Analog_lec01.ppt [호환 모드]

DE1-SoC Board

Microsoft PowerPoint - 3ÀÏ°_º¯¼ö¿Í »ó¼ö.ppt

목차 포인터의개요 배열과포인터 포인터의구조 실무응용예제 C 2

Microsoft Word - [2017SMA][T8]OOPT_Stage_2040 ver2.docx


C# Programming Guide - Types

슬라이드 1

¾Ë·¹¸£±âÁöħ¼�1-ÃÖÁ¾

01....b

2007백서-001-특집

00목차

(291)본문7

EndNote X2 초급 분당차병원도서실사서최근영 ( )

Microsoft PowerPoint - chap06-5 [호환 모드]

Application TI-89 / Voyage TM 200 PLT application. application, application. APPLICATIONS :, N. 1. O application. 2. application : D C application,. a

Microsoft PowerPoint - chap06-2pointer.ppt

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

歯4차학술대회원고(장지연).PDF

민인식 / Revisiting Panel Data Analysis (1) : Stata 와 R 코딩 패널데이터개요와유형 패널데이터 는멀티레벨 의한종류라고말할수있 다 멀티레벨데이터는상위레벨 과하위레벨 의 구조로 되어있는경우가대표적인예이다 상위레벨내에속하는하위레벨관측치로구

APOGEE Insight_KR_Base_3P11

화판_미용성형시술 정보집.0305

Smart Power Scope Release Informations.pages

DBPIA-NURIMEDIA

CD-RW_Advanced.PDF

주제별로명령들이따로있는것을보면주제끼리의순서는상관없어도명령들의위치를지 켜야할지도모른다. 하지만실험은해보지않았으니심심하면체크해봐도된다. [CRAB] CRAB 을하기위한가장기본적인세팅이다. jobtype = cmssw scheduler = glite 등이있다. 보통 CRAB

해양모델링 2장5~ :26 AM 페이지6 6 오픈소스 소프트웨어를 이용한 해양 모델링 물리적 해석 식 (2.1)의 좌변은 어떤 물질의 단위 시간당 변화율을 나타내며, 우변은 그 양을 나타낸 다. k 5 0이면 C는 처음 값 그대로 농

PowerPoint Template

untitled

휠세미나3 ver0.4

Contents Activity Define Real s Activity Define Reports UI, and Storyboards Activity Refine System Architecture Activity Defin


1217 WebTrafMon II


동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

목차 BUG 문법에맞지않는질의문수행시, 에러메시지에질의문의일부만보여주는문제를수정합니다... 3 BUG ROUND, TRUNC 함수에서 DATE 포맷 IW 를추가지원합니다... 5 BUG ROLLUP/CUBE 절을포함하는질의는 SUBQUE

untitled

프로그램을 학교 등지에서 조금이라도 배운 사람들을 위한 프로그래밍 노트 입니다. 저 역시 그 사람들 중 하나 입니다. 중고등학교 시절 학교 도서관, 새로 생긴 시립 도서관 등을 다니며 책을 보 고 정리하며 어느정도 독학으르 공부하긴 했지만, 자주 안하다 보면 금방 잊어

Microsoft PowerPoint - [2009] 02.pptx

<C6F7C6AEB6F5B1B3C0E72E687770>

PowerPoint 프레젠테이션

지난시간에... 우리는 kernel compile을위하여 cross compile 환경을구축했음. UBUNTU 12.04에서 arm-2009q3를사용하여 간단한 c source를빌드함. 한번은 intel CPU를위한 gcc로, 한번은 ARM CPU를위한 gcc로. AR

슬라이드 1

2013마재교육(인쇄본).hwp

PowerPoint 프레젠테이션

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

Microsoft PowerPoint 세션.ppt


시스템경영과 구조방정식모형분석

WINDOW FUNCTION 의이해와활용방법 엑셈컨설팅본부 / DB 컨설팅팀정동기 개요 Window Function 이란행과행간의관계를쉽게정의할수있도록만든함수이다. 윈도우함수를활용하면복잡한 SQL 들을하나의 SQL 문장으로변경할수있으며반복적으로 ACCESS 하는비효율역

Convenience Timetable Design

1. What is AX1 AX1 Program은 WIZnet 사의 Hardwired TCP/IP Chip인 iinchip 들의성능평가및 Test를위해제작된 Windows 기반의 PC Program이다. AX1은 Internet을통해 iinchip Evaluation

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

달라진 프로엔지니어 와일드파이어 따라잡기 회전(Revolve) - 단면에 스케치한 첫 번째 중심선 주위로 지정 한 각도만큼 스케치 단면을 회전시켜 퀼트를 생성한다. 경계 블렌드(Boundary Blend) 등 고급 파라메트릭 서피스 도구가 있다. 가변 단면 스윕(Var


G5 G25 H5 I5 J5 K5 AVERAGE B5 F5 AVERAGE G5 G24 MAX B5 F5 MIN B5 F5 $G$ $H$25 $G$25 $G$ $H$25 G24 H25 H24 I24 J24 K24 A5 A24 G5 G24, I5

Observational Determinism for Concurrent Program Security

韓國開發硏究제 33 권제 3 호 ( 통권제 112 호 ) 재직자직업훈련관련공적재정의구조와성과 : 효과분석 이철인 ( 서울대학교사회과학대학경제학부교수 ) 유경준 ( 한국개발연구원선임연구위원 ) Training Incentives in the Korean Levy-Gran

untitled

<30352D30312D3120BFB5B9AEB0E8BEE0C0C720C0CCC7D82E687770>

歯mp3사용설명서

snu.pdf

b

199

Todo list Universal app

<C3D6C1BEBFCFBCBA2DBDC4C7B0C0AFC5EBC7D0C8B8C1F D31C8A3292E687770>

07Á¤Ã¥¸®Æ÷Æ®-pdf¿ë

184최종

200707Á¤Ã¥¸®Æ÷Æ®_³»Áö

OCW_C언어 기초

<443A5C4C C4B48555C B3E25C32C7D0B1E25CBCB3B0E8C7C1B7CEC1A7C6AE425CBED0C3E0C7C1B7CEB1D7B7A55C D616E2E637070>

歯PLSQL10.PDF

12-file.key

한국정책학회학회보

UI TASK & KEY EVENT

MySQL-.. 1

Java ...

s SINUMERIK 840C Service and User Manual DATA SAVING & LOADING & & /

슬라이드 1

Transcription:

stata 와함께춤을 김병권 July 14, 2015

table of contents Chapter1 - STATA 화면구성 Chapter2 - 데이터를 STATA 로 Chapter3 - 체험삶의현장 ; OLS Chapter4 - 체험삶의현장 ; PANEL Chapter5 - 알면유용한 Chapter5-1, help and findit and google Chapter5-2, 가계소득계산 Chapter5-3, 루프 Chapter5-4, user-written 1

chapter1 - stata 화면구성

stata 화면구성 1 3

stata 화면구성 2 4

stata 화면구성 3-1 5

stata 화면구성 3-2 6

stata 화면구성 3-3 7

stata 화면구성 3-4 8

stata 화면구성 4-1 9

stata 화면구성 4-2 10

stata 화면구성5 11

시작전확인사항 STATA 로무언가를하기전확인및준비사항 do-file과작업폴더위치확인 작업폴더확인을안하면파일을분실할수있음 pwd와 cd cd 작업폴더 cd D:\etc\2015\stata_15s\example 12

chapter2 - 데이터를 stata 로

이상과현실 자료구성의시작, 하지만대다수의책에서다루지않음 STATA 전용 (.dta) 으로제공되는경우는큰문제가없으나 현실은스프레드시트 (.txt, csv), 엑셀 (.xlsx,.xls), SPSS(.sav) 등으로제공됨 경제분석을위한 STATA, 우석진 14

첫번째현실, 스프레드시트 스프레드시트 (txt, csv) 는보통 non-fixed 와 fixed 로구분 non-fixed 는각변수가구분자 (delimiter) 로구분된경우 구분자는다양한값이존재하며, 대표적으로콤마혹은탭이있음 (a) 콤마 (b) 15

첫번째현실, non-fixed csv 혹은엑셀은복사 - 붙여넣기도가능함 insheet [varlist] using filename [, options] 구분자콤마 : insheet using auto1 구분자콤마 : insheet using auto1.txt 구분자 : insheet using auto2.txt 구분자 : insheet using auto2.txt, delimiter( ) clear 16

두번째현실, fixed-format 경제활동인구조사등데이터의위치가미리정해져있는경우 000219320610021894000077593600001976470000212463 000319810513021981000005729000005986120000021093 000419161124021437000080242800004843950000489279 코드북을꼭함께받아야함 17

두번째현실, fixed-format infile using fixedformat.dct, clear 핵심은 fixedformat.dct, 딕셔너리파일 딕셔너리파일에데이터를불러오는데필요한규칙이포함 18

알고만가자, 엑셀 STATA12 에서부터기능을제공 import excel 파일주소, sheet( 시트명 ) firstrow clear import excel auto_excel.xlsx, sheet( sheet1 ) firstrow clear 19

이상 -stata 용데이터 dta 파일, STATA 에서저장하거나, Stattransfer 로변환한파일 use 파일명 use auto, clear 20

현실에맞서는 tip 원자료를불러오면, stata 에서저장하고시작하자 21

chapter3 - 체험삶의현장 ; ols

체험삶의현장 - (pooled)ols mincer equation 추정 자료불러오고 -> 다듬고, 대화하고 -> 회귀분석 (pooled)ols 목표는아래의추정식에대한회귀분석결과도출 ln (wage) = α + β 1 edu + β 2 exp + β 3 exp 2 + β 4 male + β 5 region + ϵ 23

체험삶의현장 - (pooled)ols do-file 을열고, 작업폴더위치를확인! 자료를불러오자! use wage_1980, clear 위의명령어로단년도자료를불러온것 다년도자료를불러와하나로만들어야함 24

체험삶의현장 - (pooled)ols 1 차년도 2 차년도 3 차년도 4 차년도 5 차년도 2 가지방법을사용가능함 아래로쌓는 append 명령어를이용 옆으로붙이는 merge 와모양을바꾸는 reshape 을이용 25

체험삶의현장 - (pooled)ols 아래로쌓는 append 를이용 append using 파일명 현재데이터파일명데이터 1 파일명데이터 2 파일명데이터 3 26

체험삶의현장 - (pooled)ols 먼저각년도데이터가잘쌓일수있도록손을봐야함 변수명을통일시켜야함 wage_1980.dta : wage1980 -> wage wage_1981.dta : wage1981 -> wage wage_1982.dta : wage1982 -> wage 27

체험삶의현장 - (pooled)ols 변수명변경은 rename rename 현재변수명새변수명 rename wage1980 wage rename nr1980 nr rename exper1980 exper rename hours1980 hours 28

체험삶의현장 - (pooled)ols rename *1980 * nr 1980 exper 1980 hours 1980 educ 1980 male 1980 wage 1980 occ 1980 -> nr exper hours educ male wage occ 29

체험삶의현장 - (pooled)ols 연도를식별할수있는변수생성하기 generate [type] newvar[:lblname] = exp [if] [in] generate 변수명 = 값 generate year = 1980 30

체험삶의현장 - (pooled)ols 다음년도작업을위해 1 차년도자료를저장 save 파일명 save temp1980 save temp1980, replace 31

체험삶의현장 - (pooled)ols 2 차년도자료를준비할차례 동일한형태의데이터임. 따라서절차와방법도동일함 자료불러오기 - 변수명변경 - 연도변수생성 32

체험삶의현장 - (pooled)ols 자료를아래쪽으로붙이는명령어 append append using 파일명 append using 파일명파일명 append using temp1980 temp1981 33

체험삶의현장 - (pooled)ols 파일이잘붙었나확인 샘플수를세는 count 변수의빈도수를보여주는 tabulate count tabulate year 34

자료와대화하기 데이터의외형을살펴보는 describe stata 변수종류는크게숫자, 문자로나뉨 간혹숫자인데문자로취급되는경우도있음 문자를숫자로변경시켜주는 destring destring hours, replace 반대는 tostring tostring 변수, replace tostring hours, generate(hours1) 35

keep & drop 남기고싶으면 keep 버리고싶으면 drop keep nr exper hours hours1 educ male wage region year occ 연근로시간이 4500 시간미만만남기고싶다면 keep if hours < 4500 drop occ 연근로시간 700 시간미만을버리고싶다면 drop if hours < 700 36

요약 : summarize 변수를요약해주는 summarize summarize sum sum wage sum wage, detail sum wage, de 37

자료와대화하기 : 조건문 if 조건에해당하는경우만걸러주는 if sum if male == 1 sum wage if hours > 1000 sum wage if hours < 1000, detail sum wage if hours < 1000, de 38

자료와대화하기 : tabulate 성별, 학력, 거주지, 종사상지위등 tabulate 변수 tabulate educ tabulate male tabluate male, nolabel tab educ male 39

자료와대화하기 : 조건문 if 조건에해당하는경우만살펴보는 if tabulate educ if male == 1 tab educ male if hours > 3000 40

분석에필요한변수를만들자 회귀분석을위한 2 개의변수생성 시간당임금, 로그시간당임금변수를생성 gen hwage = wage / hours gen ln_hwage = ln(hwage) 바이너리변수를만드는 2가지방법 gen exper_5 = 1 if exper > 5 replace exper_5 = 0 if replace ==. gen exper1_5 = (exper > 5) 41

변수에설명을넣는 label 변수에설명넣기 label 변수명 설명 label ln_hwage 로그시간당임금 label values 변수명레이블명 위의명령어를사용하기전에먼저레이블을정의해야함 label define cha 1980 1차 1981 2차 1982 3차 label values year cha label values year 42

자료와대화하기 : 그래프 - 히스토그램 histogram ln_wage 남성의임금분포만보고싶다면 histogram ln_hwage if male == 1 여성의임금분포만보고싶다면 hist ln_hwage if male == 0 43

자료와대화하기 : 그래프 - 히스토그램 그래프를저장하는옵션 saving( 파일명 ) hist ln_hwage if male == 1, saving(wage_m, replace) hist ln_hwage if male == 0, saving(wage_f) 44

자료와대화하기 : 그래프다듬기 45

자료와대화하기 : 두변수의관계를보자 scatter y 변수 x 변수 scatter ln_wage exper 히스토그램과마찬가지로그래프옵션을사용가능 46

자료와대화하기 : 그래프다듬기 47

자료와대화하기 : 이도저도귀찮을때 scheme default s1color ln_hwage 1 0 1 2 3 0 5 10 15 labor mkt experience ln_hwage 1 0 1 2 3 0 5 10 15 labor mkt experience ln_hwage 1 0 1 2 3 s2mono 0 5 10 15 labor mkt experience economist 1 0 5 10 15 labor mkt experience 3 2 1 0 ln_hwage 48

자료와대화하기 : 여러그래프를한장에 graph combine 으로여러그래프를한화면에배치 twoway 는여러그래프를겹쳐서보여주는방식 경우에따라 graph combine 이나 twoway 를이용 49

자료와대화하기 : 여러그래프를한장에 1 Density 0.2.4.6.8 1 1 0 1 2 3 ln_hwage Density 0.2.4.6.8 2 0 2 4 ln_hwage 50

자료와대화하기 : 여러그래프를한장에 1 graph combine 은저장된그래프를한그래프로그려줌 단, 그래프를먼저저장해야함 histogram ln_hwage if male == 1, saving(wage_m, replace) histogram ln_hwage if male == 0, saving(wage_f, replace) graph combine wage_m.gph wage_f.gph 51

자료와대화하기 : 여러그래프를한장에 1 이번에는 scatter 를저장, graph combine 으로한화면에 scatter ln_wage exper if male == 1, saving(wage_m, replace) msymbol(oh) scatter ln_wage exper if male == 0, saving(wage_f, replace) m(th) graph combine wage_m.gph wage_f.gph 52

자료와대화하기 : 여러그래프를한장에 1 ln_hwage 1 0 1 2 3 0 5 10 15 labor mkt experience ln_hwage 2 0 2 4 0 5 10 15 labor mkt experience 53

자료와대화하기 : 여러그래프를한장에 2 여러그래프를오버랩시키는명령어는 twoway 54

자료와대화하기 : 여러그래프를한장에 2 twoway (1 번그래프 ) (2 번그래프 ), 옵션 twoway /// (hist ln_hwage if male == 1, lcolor(gs13) color(gs13) ) /// (hist ln_hwage if male == 0, lcolor(black) lpattern(dash) lwidth(2) color(none)) ///, legend(off) graphregion(color(white)) 55

자료와대화하기 : 여러그래프를한장에 2 Density 0.2.4.6.8 1 1 0 1 2 3 ln_hwage 56

자료와대화하기 : 여러그래프를한장에 2 twoway (1 번그래프 ) (2 번그래프 ), 옵션 twoway /// (scatter ln_hwage exper if male == 1, msymbol(oh) mcolor(black) msize(4)) /// (scatter ln_hwage exper if male == 0, msymbol(th) mcolor(red) msize(1)) ///, graphregion(color(white)) legend(label(1 male ) label(2 female )) xtitle( mkt experience ) ytitle( log hourly wage ) 57

자료와대화하기 : 여러그래프를한장에 2 log hourly wage 2 0 2 4 0 5 10 15 mkt experience male female 58

자료와대화하기 : 여러그래프를한장에 2 59

결전! 회귀분석 데이터도완성하고, 요약과그래프로큰그림도봤으니, 회귀분석을할차례 ln (wage) = α + β 1 edu + β 2 exp + β 3 exp 2 + β 4 male + β 5 region + ϵ xi: regress ln_hwage edu exper expersq i.male i.region 60

결전! 회귀분석 61

결전! 회귀분석 xi: regress ln_hwage edu exper expersq i.male i.region outreg2 using regress.txt, replace br VARIABLES -1 ln_hwage educ 0.105*** [0.00873] exper 0.115*** [0.0227] expersq -0.00414* [0.00221] male -0.0439* [0.0251] Constant -0.0975 [0.120] Observations 1,635 R-squared 0.1 Standard errors in brackets *** p<0.01, ** p<0.05, * p<0.1 62

결전! 회귀분석 xi: regress ln_hwage edu exper expersq i.male outreg2 using regress.txt, replace br xi: regress ln_hwage edu exper expersq i.male i.region outreg2 using regress.txt, append br xi: regress ln_hwage edu exper expersq i.male i.region, vce(robust) outreg2 using regress.txt, append br 63

결전! 회귀분석 MS 워드로저장도가능함 xi: regress ln_hwage edu exper expersq i.male outreg2 using regress, replace br word xi: regress ln_hwage edu exper expersq i.male i.region outreg2 using regress, append br word xi: regress ln_hwage edu exper expersq i.male i.region, vce(robust) outreg2 using regress, append br word 64

post estimation 회귀분석후오차 (e i ) 혹은예측치 (ŷ i ) 를구하고싶은경우 예측치 : predict 변수명 오차 : predict 변수명, r predict yhat predict res list ln_hwage yhat res 65

chapter4 - 체험삶의현장 ; panel

1 년전, 2 년전, 3 년전... 패널혹은종단면자료는한대상을여러번관찰한자료 조세재정패널, 여성가족패널, 노동패널등 67

목표 이번챕터목표 OLS 로추정했던 mincer euqation 을패널모형으로추정 ln (wage) = α + β 1 edu + β 2 exp + β 3 exp 2 + β 4 male + β 5 region + ϵ 노동패널을이용, merge & reshape 을이용 68

merge & reshape Do-file 을열고, 작업폴더를확인 13 차자료 klips13p 를불러오기 use klips13p, clear 69

merge & reshape pid 13차 14차 15차 18970 19847 27167 35328 47855 49443 50888 56050 70411 79508 80841 83496 88601 90374 98277 데이터 데이터 데이터 70

merge & reshape 필요한변수만남기고 reshape 을위한정리 keep pid p131642 p131006 p131012 p131013 p130110 p130101 p130107 p130121 p130102 rename jobtype jobtype13 14 차자료를머지 merge m:m pid using klips14p, /// keepusing( jobtype p141642 p141006 p141012 p141013 p140110 p140101 p140107 p140121 p140102) 71

merge & reshape Result # of obs. not matched 81 from master 10 (_merge==1) from using 71 (_merge==2) matched 143 (_merge==3) 머지후에는꼭결과를유심히봐야함 not matched는 pid를기준으로한쪽에만데이터가있는경우 from master는기존 stata에불러와있던자료 from using은 merge로불러온자료 matched는양쪽데이터에모두있는경우 72

merge & reshape 다음머지를위해생성된변수 _merge 를드랍 & 변수명변경 drop _merge rename jobtype jobtype14 15 차데이터도머지 merge m:m pid using klips15p, /// keepusing( jobtype p151642 p151006 p151012 p151013 p150110 p150101 p150107 p150121 p150102) drop _merge rename jobtype jobtype15 73

merge & reshape reshape 을위한조건에맞춰변수이름을정리해야함 ID 가있고변수 1 숫자 1 변수 1 숫자 2 변수 1 숫자 3 가령, PID var13 var14 var15 rename p13* p*13 rename p14* p*14 rename p15* p*15 74

merge & reshape merge 한데이터는 wide-form reshape 을통해 long-form 으로변환 reshape long jobtype p0101 p0102 p0107 p0110 p0121 p1006 p1012 p1013 p1642 pa5102, i(pid) j(year) 75

merge & reshape long-form 으로데이터형태가바뀌었는지확인 list pid year p1642, sepby(pid) 76

merge & reshape 패널분석을위한데이터작업이끝남 여기서다룬방법은한가지예시에불과 panel_1.do 파일을열어서다른예를사용 방법이다소다르지만결과는같음 77

패널은 xt 와함께 패널용명령어는일반명령어에 xt 를붙임 xtdescribe, xtsummarize, xtregress 등 위명령어를사용하기위해서는먼저패널선언을해줘야함 xtset panelvar timevar xtset pid year 78

패널은 xt 와함께 패널데이터의패턴을보여주는 xtdescribe xtdes 79

패널은 xt 와함께 변수를요약해주는 xtsummarize xtsum xtsum hours 80

분석에필요한변수생성 ge hours = p1006 * 4 label var hours 월정규근로시간 drop if hours ==. xtsum hours ge hwage = p1642 hours label var hwage 시간당임금 drop if hwage ==. ge ln_hwage = ln(hwage) label var ln_hwage 로그시간당임금 rename p0107 age ge agesqr = age*age 81

패널은 xt 와함께 패널모형은 xtregress 와 fe, be, re 등옵션에따라바뀜 xi : reg ln_hwage age agesqr i.p0101 i.p0110 Between Effects xi : xtreg ln_hwage age agesqr i.p0101 i.p0110, be Random Effects xi : xtreg ln_hwage age agesqr i.p0101 i.p0110, re Fixed Effects xi : xtreg ln_hwage age agesqr i.p0101 i.p0110, fe 82

패널은 xt 와함께 xi : reg ln_hwage age agesqr i.p0101 i.p0110 outreg2 using panel.txt, replace br 83

패널은 xt 와함께 xi : xtreg ln_hwage age agesqr i.p0101 i.p0110, be outreg2 using panel.txt, append br 84

패널은 xt 와함께 xi : xtreg ln_hwage age agesqr i.p0101 i.p0110,re outreg2 using panel.txt, append br 85

패널은 xt 와함께 xi : xtreg ln_hwage age agesqr i.p0101 i.p0110, fe outreg2 using panel.txt, append br 86

chapter5 - 알면유용한

도와줘요헬프, 구글 help reshape stata 에내장된다소불친절한설명 findit outreg2 stata 와웹등에서해당하는부분을검색해줌 google 에서 stata 블라블라검색 88

가계소득계산 4 흔히패널은가구조사, 개인조사, 특별조사로이루어져있음 가계소득이주어지는경우도있지만개인별소득으로만이루어져있는경우가구데이터를불러와직접계산해야함 소비, 저축도마찬가지의경우 reshape, egen, merge, keep, drop, bysort, generate 을이용 89

가계소득계산 테크닉 1; 임의의가구원번호생성 bysort hhid15: gen famnum = _n prefix by 를사용하기위해서는먼저 sort 를사용해야함 bysort 는두명령어를한번에처리해줌 _n 은시스템변수 (system variables) 로순번을매겨줌 _N 은전체관측수를의미 90

가계소득계산 long form 에서 wide form 으로 reshape wide p151703, i(hhid15) j(famnum) 앞서임의로생성한가구원번호가 4 장패널분석에서 year 변수의역할을함 stata 는가로합계산은쉬우나세로합계산이어려움 91

가계소득계산 함수와 generate 명령어의콜라보레이션 egen labor_income_fam = rowtotal(p1517031-p15170310) rowtotal 은괄호안의변수들의합을계산하는함수 egen 사용시주의할점 egen 으로변수생성후필히의도한대로변수가생성되었는지확인 92

도전! ( 특정조건에해당하는 ) 가구원수계산 25 세미만자녀수, 근로소득이있는가구원수 실습 : 만 25 세미만가구원수를계산하시오 egen 함수는 rownonmiss 를사용 자료불러오기 - 필요한변수만남기기 - 조건에부합하는경우만남기기 - 임의의가구원번호생성 - reshape - egen - 확인 93

독이거나약이거나 잘쓰면노가다를줄일수있는 loop foreach, while 94

독이거나약이거나 loop 는같은명령어를반복해서적용시켜야할경우유용함 가령 10 개년패널데이터를동일하게만들거나 10 개년패널을불러계산해야하는경우 여기서핵심은같은명령어와반복임 A+B+C=D 를계산하다고가정하면 10 개년모두동일한변수를가지고계산 7 차년에는 B 변수가없다면꽝 이럴경우는 7 차년을불러와 B 변수를 0 의값을갖는변수로생성 95

독이거나약이거나 loop 문을잘짜는방법은 1 개년자료만가지고테스트후적용시키는것 1 차년에서잘작동했다면 10 개년에적용시키는것은상대적으로쉬움 앞서만들었던패널자료를 foreach 를이용해제작 자료를불러오고 - 필요한변수만남기고 - 변수명을변경 - 저장 96

독이거나약이거나 foreach num of numlist 10 11 12 13 14 15 { u klips num p, clear keep pid jobtype p num 1642 p num 1006 p num 1012 p num 1013 /// p num 0110 p num 0101 p num 0107 p num 0121 p num 0102 rename p num * p* num rename jobtype jobtype num sa temp num, replace } 97

독이거나약이거나 foreach num of numlist 10 11 12 13 14 15 { u klips num p, clear keep pid jobtype p num 1642 p num 1006 p num 1012 p num 1013 /// p num 0110 p num 0101 p num 0107 p num 0121 p num 0102 rename p num * p* num rename jobtype jobtype num sa temp num, replace } 98

독이거나약이거나 foreach num of numlist 1 3/6 8 10 { display num } foreach cha in aa bb cc dd { display cha } 99

user-written STATA 는유저들이제작한명령어를추가할수있음 앞서사용한 outreg2 가 user-written program 에해당함 여기서는 user-written 을찾는방법과그래프와관련된한가지프로그램을사용 user-written 을찾는방법은크게구글과지인으로나뉨 구글에서키워드를이용해검색하거나지인에게이런게있느냐고물어봐야함 100

user-written user-written을설치하는방법은 ssc install outreg2 ssc install oaxaca findit outreg2 101

user-written graph combine 인데 legend 를 1 개만사용하는 user-written 명령어는 grc1leg findit grc1leg 가장위에검색되는내용을클릭. (click here to install) 을눌러설치 102

user-written syntax 및사용방법은 graph combine 과동일 그래프여러개를그려저장한후 grc1leg 그래프 1.gph 그래프 2.gph 그래프 3.gph 학력별시간당임금 - 연령의 scatter 를 1 개그래프로 do-file grc1leg 을이용 103