연세대학교학술정보원 2017.5.24. 수요일 국가통계의이해와활용 황현식 (hshwang2@korea.kr)
목표, 목차, 강사 국가통계의개념및활용방법이해 통계활용도제고 데이터분석에대한자신감확보 국가통계개요 KOSIS 자료활용 MDIS 자료활용 행정자료활용 Q/A 강사 : 황현식 이학박사 ( 통계학 ), 서기관 ( 전 ) 통계청통계교육원교수, 지역통계과장 현재, 보건복지부정책통계담당관 관심분야 : 국가통계, 통계교육, 데이터분석 2
국가통계란? 국가통계정의 국가통계작성기관이정부정책의수립ㆍ평가또는경제ㆍ사회현상의연구ㆍ분석등에활용목적으로, 산업 물가 인구 주택 문화 환경등특정의집단이나대상등에관하여작성하는수량적정보 국가통계는정부나사회의의사결정에기초자료로사용되는사회공공재 ( 신뢰성이중요 ) 국가통계는다른용어로승인통계 통계법에따라통계청장이작성을승인한통계 통계의중복방지, 응답자부담경감 3
국가통계유형 (1) 구분장점단점해당국가 집중형 균형적발전과체계화용이 객관성과신뢰성확보 전문인력과장비의효율적활용 업무분야전문지식활용곤란 통계수요에신속한대응이어려움 캐나다, 스웨덴, 핀란드, 네덜란드등 분산형 업무분야의전문지식활용 통계수요에신속한대응 통계작성중복에따른예산과인력낭비초래 미국, 영국, 일본, 한국등 4
국가통계제도유형 (2) 경영형태 국가행정기관 : 한국, 미국, 일본, 프랑스 독립법인 (agency) : 영국, 스웨덴, 노르웨이, 호주 통계시스템 중앙, 지방통계사무소 : 미국, 프랑스, 한국 지방행정기관 : 독일, 스위스, 일본 5
국가통계작성 국가통계작성기관 ( 분산형 ) 국가행정기관및지방자치단체 민간통계기관 ( 지정기관 ) : 한국은행, 대한건설협회등 국가통계작성방법별분류 조사통계 : 면접, 우편등을통하여직접조사한통계결과 경제활동인구조사, 사업체통계조사 보고 ( 정부 ) 통계 : 인허가, 신고등행정행위과정에서얻어지는통계결과 자동차면허상황, 재정통계, 지적통계, 주민등록인구 가공통계 : 조사또는보고통계를활용하여작성한통계결과 국민계정, 국제수지통계, 경기종합지수 6
국가통계는 UN 제정원칙준수 1) 이용자의수요를불편부당하게충족 2) 과학적인원칙과전문가의윤리에따라작성 3) 올바른활용을위해작성방법과절차를제시 4) 통계오 / 남용방지에노력 5) 통계는조사및행정기록자료등을모두활용하여작성 6) 개인별정보는최대한보호 7) 통계작성은법령에기초 8) 통계의일관성및효율성을위해기관간협조가필수 9) 통계는국제기준에부합되게작성 10) 외국과의교류협력을통해통계발전도모. 7
보통표나시각화된형태로제공.. 1. Based on 30-year period 1971 2000. 2. Includes ice pellets and sleet; data since April 1988 also include hail. 3. Based on years observed, indicated in final column. 4. Through 2003. Where two figures are shown, the first figure is for precipitation data, the second for snowfall data. Source: National Oceanic and Atmospheric Administration (NOAA). 8
시각화를하면 신뢰성이증가한다 9
최근 OECD 노동생산성 10
수치요약이통계 11
부분에서전체를
정확하냐고고민하지말것.. 과정이올바르면결과는뜻을반영하게된다. 통계는속성상정확보다는만드는과정과추세, 그리고시의성이중요하다. 13
14
통계는사회에경고내지는다양한방식의진단을내려준다. 요즈음통계표현의대세 : InfoGraphics
자살에관한몇가지통계 2014 년 10 만명당 27.3 명 ( 남 9,736 명, 여 4,100 명 ) 수단 : 목맴, 뛰어내림, 기타가스및휘발성물질순 연령이높을수록자살률증가 원인 ( 남 ) 경제생활문제, 정신문제, 육체적질병문제순 ( 여 ) 정신문제, 육체적질병문제, 경제생활문제순 장소 : 주택, 기타, 의료기관순 계절 : 봄, 여름, 가을, 겨울순 요일 : 월요일, 수요일, 화요일, 목요일, 금요일순 시간 : 10-16 시 특성 : 미혼, 유배우, 이혼순 직업 : 무직, 가사, 서비스업종사자순 지역 : 충남, 강원, 충북순
자살
자살 Question 1. 남녀의차이처럼자살에서차이가있는인자가더있을까? 2. 이러한통계는자살을예방하는정책과어떻게연결될까?
합계출산율 83 년 2.1 명 60 년대초 6.0 명
주요국가의합계출산율 ( 출처 : UN) 국가별한국중국일본미국프랑스스웨덴영국 남아프리카공화국 1970 4.71 5.94 2.02 2.55 2.65 2.16 2.57 5.70 1975 4.28 4.77 2.13 2.02 2.31 1.89 2.01 5.47 1980 2.92 2.93 1.83 1.79 1.86 1.66 1.73 5.00 1985 2.23 2.61 1.75 1.80 1.86 1.65 1.78 4.56 1990 1.60 2.63 1.66 1.89 1.80 1.91 1.84 4.00 1995 1.70 2.01 1.48 1.99 1.71 2.01 1.78 3.34 2000 1.51 1.80 1.37 1.96 1.76 1.56 1.74 2.95 2005 1.22 1.70 1.30 2.04 1.88 1.67 1.66 2.80 2010 1.29 1.64 1.32 2.07 1.97 1.90 1.83 2.55 2015 1.29 1.56 1.42 2.08 1.99 1.93 1.87 2.38 통계는역사이면서미래예측이일정한수식에의해가능하다. 또세계사로확장이가능하다. 이때기준이같아야한다.
고용 국제비교 자료 : http://stats.oecd.org 통계의속성은비교이다. 우리사회의모습중무엇을시사하는가?
서로다른해석? 주장 1 : 인구가줄어들면일자리는남아돌듯.. 당연히기업복지도좋아지고.. 주장 2 : 인구가줄어들면일자리자체가줄고고용형태가악화될듯.. 진실 : 인구자체보다는구조에주목할필요.. 미래 : 부양부담을지는소수의청년과다수의노인 현재 : 청년 3 명중 1 명이비정규직, 10 명중 1 명이실업자, 니트족 86 만명추산등
25
주요국가통계활용사이트 통계청 http://kosis.kr 한국은행경제통계시스템 http://ecos.bok.or.kr 국토교통부통계누리 http://stat.molit.go.kr/portal/main/portalmain.do 교육부교육통계서비스 http://cesi.kedi.re.kr/index 26
자료를활용할때에는 찾는자료와부합하는지확인 ( 년도, 기준등 ) 설명자료 ( 메타데이터 ) 활용 보도자료참고 통계연보참고 국제비교가필요한경우인지판단 Micro data가필요한경우인지판단 찾는자료가없을때는생산기관으로직접.. 27
분석 data(wrong) 28
분석 Data (good) 29
데이터의모습 오류값 (Error) : 변수가가질수없는값, 변수값의불가능한조합, 일관성없는코드값, 잘못된코드값. 특이값 (Outlier) : 정상이아닌자료값. 특이값은오류값일수도있고그렇지않을수도있다. 결측값 (Missing) : 원인과기록방법을정밀하게조사하여자료를정정하고기록방법을변경해야하며, 필요시에는자료를보정해야한다. 사례 x1 x2 x3 x4 x5 1 76.7 Good 9 2.06 7.7 2 73.6 Good 7 2.14 7.4 3 68.7 Bad 3 4.21 6.9 4 9999 Reject NA. 0 5 82.7 Good 9 2.00 0.8 6 73.4 Bad 10 1.34 7.3 7. Good 2 2.20 0 8 69.5 Good 7 2.37 7.0 9. Good 3 1.82 0 10 69.5 Good 7 23.7 7.0 30
자료의분류 원자료 (raw data) 통계조사자료에서최초입력한전산화일자료로서입력오류, 조사오류등이걸러지기이전단계의자료를말함 마이크로데이터 (microdata) : MDIS 원자료에서입력오류등을제거하여공표통계표작성등데이터가공의기초자료로사용되는자료로통계원시자료라고도함 매크로데이터 (macro data) : KOSIS 마이크로데이터를임의의기준에따라집계한자료로서집계의정도에따라세분된자료에서통합된자료까지다양하게제공하고있음 메타데이터 (metadata) 통계자료이용자의이해를돕기위한통계에대한설명자료 31
통계청자료 통계청은 50 종이상의통계를작성하고있으며, 작성된통계를다양한방법으로제공 공표자료 : 국가통계포털 (http://kosis.kr) 마이크로데이터 : 마이크로데이터서비스시스템 (MDIS, http://mdis.kostat.go.kr) 가공분류 : 국가주요지표, e- 나라지표, e- 지방지표 32
KOSIS( http://kosis.kr ) 국가통계포털 (KOSIS, KOrean Statistical Information Service) 국내 국제 북한의주요통계를한곳에모아이용자가원하는통계를한번에찾을수있도록통계청이제공하는 One-Stop 통계서비스 현재 300여개기관이작성하는경제 사회 환경에관한 800여종의국가승인통계를수록하고있으며, 국제금융 경제에관한 IMF, Worldbank, OECD 등의최신통계도제공 사용방법안내 : 서비스민원안내 KOSIS 길라잡이 KOSIS 구성내용, 통계표조회방법, 통합검색방법 PDF 형태로제공 33
KOSIS( http://kosis.kr ) 34
e- 지방지표 지자체의발전정도를통계로비교 35
해결문제 우리나라초. 중. 고등학생들의사교육비실태 조사목적, 법적근거, 조사주기, 사교육비의개념및조사범위, 조사항목, 조사체계를설명하라. 사교육비에관련한통계를산출하라. 지역별방과후학교참여율 학교급별 EBS 교재구입비및구입비율 시도별사교육비참여율 1 인당월평균사교육비등 고령자 (65 세이상 ) 통계를작성하고, 이를이용하여고령화에관련한대책을세워보라. 36
실제자료 (OECD 주요지표 ) 국가별 2014 년 GDP(10 억 US$) 1 인당 GD P( 달러 ) 경제성장률 (%) 수출 (100 만달러 ) 수입 (100 만달러 ) 총인구 ( 천명 ) 실업률 (%) 물가지수 (2010=100) 인터넷이용률 (%) 한국 1,411.0 27,983 3.3 572,665 525,515 50,424 3.5 109.0 87.9 이스라엘 305.7 37,206 2.6 68,553 75,483 7,939 5.9 107.3 75.0 일본 4,596.2 36,153 0.0 690,202 811,892 126,795 3.6 102.8 89.1 터키 798.8 10,304 3.0 157,614 242,177 77,524 9.9 135.7 51.0 37
MDIS 자료활용분석사례 - 사회조사로본수도권지역민의의식변화상
MDIS
MDIS
MDIS 이용방법 http://mdis.kostat.go.kr
MDIS 이용방법 http://mdis.kostat.go.kr
MDIS 활용사례 사회조사목적 사회적관심사항, 삶의질에관한사항등사회적구성원의 주관적관심사를파악하여사회개발정책의기초자료로제공 조사부문 총 10 개부문중 5 개부문으로나누어 2 년주기로실시 - 홀수년 : 복지, 사회참여, 문화와여가, 소득과소비, 노동 - 짝수년 : 가족, 교육, 보건, 환경, 안전 분석방향 사회조사로본수도권지역민의의식변화상 : 수도권 vs 비수도권 사회조사로본경인지역민의의식변화상 : 서울 vs 인천 vs 경기 전국사회조사마이크로데이터를수도권단위로재분석 분석방법 변화상을살펴보기위해연도별자료를분석 - 수도권지역민 ( 최근 6 개년 ), 경인지역민 ( 최근 3 개년 ) 인포그래픽활용하여통계자료시각화추진
MDIS 활용사례 사회조사표종류
MDIS 이용방법 1 2 3 5 4 6
MDIS 이용방법 2 선택다운로드결과 6 데이터다운로드결과 7
MDIS 이용방법 7 확인결과 8 9
MDIS 이용방법 8 데이터포맷 보기 결과 9 메모장결과
자료분석 Ⅰ(SPSS 활용 ) 1 단계 : 메모장의자료를 SPSS 로불러들임 2 단계 : 데이터포맷의 보기 자료 SPSS 의 설명 에갖다붙임 3 단계 : 파일설계서보고 SPSS 의 값 보충설명
자료분석 Ⅰ(SPSS 활용 ) 준비작업 1 변환 - 코딩변경 - 새로운변수로 - 시도 (V3)- 권역별 ( 수도권 (1)vs 비수도권 (2)) 변환 - 코딩변경 - 새로운변수로 - 시도 (V3)- 수도권별 ( 서울 (11) vs 인천 (23) vs 경기 (31))
자료분석 Ⅰ(SPSS 활용 ) 준비작업 2 데이터 - 가중케이스 - 가중케이스지정 - 승수 ( 가구원 )
Ⅲ 자료분석 Ⅰ(SPSS 활용 ) 분석 1 분석 - 표 - 통계표작성 - 열 : 생활여건의변화 ( 행 N%) 행 : 권역별, 수도권별 ( 합계지정 )=> Output( 결과 )
Ⅲ 자료분석 Ⅰ(SPSS 활용 ) 준비작업 3 데이터 - 케이스선택 - 권역별 ( 수도권 vs 비수도권 )=1 - 수도권 =1 이므로수도권만선택해서분석
Ⅲ 자료분석 Ⅰ(SPSS 활용 ) 분석 2 분석 - 표 - 통계표작성 - 열 : 생활여건의변화 ( 행 N%) 행 : 권역별, 성별, 나이별, 수도권별 ( 합계지정 )=> Output( 결과 )
자료분석 Ⅱ( 그래프그리기 ) SPSS 의 Output( 결과 ) 엑셀로정리 : 사회조사로본수도권지역민의의식변화상 연도별 권역별
Ⅳ 자료분석 Ⅱ( 그래프그리기 : PPT 활용 ) 3 단계까지마친그래프 완성그래프 연도별시계열분석위해꺽은선그래프활용 4단계 : 삽입-도형- 사각형추가 1 수도권, 비수도권범례넣어주기 2 단위 (%), 제목넣어주기
Ⅳ 자료분석 Ⅱ( 그래프그리기 : PPT 활용 ) 3 단계까지마친그래프 4 단계 : 삽입 - 도형 - 사각형추가 - 각범례넣어주기 ( 도형서식에서 범례별로계열색채우기 ) 완성그래프 항목별각범례값비교위해가로누적막대그래프활용
Ⅴ MDIS 활용사례 - 사회조사로본수도권지역민의의식변화상 각분야별로요약자료작성 1 수도권의비교년도vs2015년비교 - 증가, 감소 2 2015년의수도권vs비수도권비교 - 크다, 작다
MDIS 활용사례 - 사회조사로본수도권지역민의의식변화상
실제자료 ( 체력조사 from MDIS) 연령성별신장체중 신체질량지수 체지방률 악력 윗몸일으키기 앉아윗몸일으키기 10 1 148 49.5 22.6 27.6 19.2 0-7 10 1 160 55 21.5 13.1 30 10-3 10 1 160 52.2 20.4 19.3 20.7 5 15 10 1 160 52.2 20.4 19.6 28.3 0 21 10 1 161 55 21.2 12.6 33.2 13 21 10 1 161 60 23.1 29 38 10 20 10 1 161 55.1 21.3 13.3 32.1 18 21 10 1 161 56.3 21.7 23.3 34.3 34 8 10 1 163 65 24.5 23.4 40.6 39 12 10 1 163 70 26.3 21.5 42.5 16 14 10 1 163 76 28.6 23.5 23.7 10-6 60
보고서 (table) 61
외부기관 MDSS 주거실태조사 http://www.hnuri.go.kr 지역사회건강조사 https://chs.cdc.go.kr 공공데이터포털 공공기관이생성또는취득하여관리하고있는공공데이터를한곳에서제공하는통합창구 https://www.data.go.kr 지방자치단체에서인허가하는업종별데이터개방 지방자치단체가보유 관리하고있는국민생활과밀접한식품, 소상공인, 문화체육등 11 개분야 440 여종을데이터를개방함으로써국민이새로운서비스 http://www.localdata.kr 62
행정자료이용절차 승인 1 행정자료 이용자 2 자료이용신청 3 이용신청검토 ( 통계청 ) 4 이용자료추출 탑재 ( 통계청 ) 5 자료분석 ( 원격 SAS 서버 ) - 63 -
분석항목 사업자등록 & 종사자제공항목 읍면동별사업체생멸 ( 신생 소멸 활동 ) 현황 산업분류별개인 법인사업자현황 주요생활밀접업종현황 - 64 -
읍면동별사업체생멸 ( 신생 소멸 활동 ) 현황 - 성남시분당구지역 11~ 15 년추이분석 - 65 -
OUTPUT 11 년 12 년 13 년 14 년 15 년 - 66 -
분석결과 < 신생 > < 소멸 > < 활동 > - 67 -
분석결과 < 읍면동별사업체생멸현황 > 100% 활동소멸신생 판교신도시 ( 단위 : %) 80% 11 년 60% 40% 20% 0% 분당동수내동정자동율동서현동이매동야탑동판교동삼평동백현동금곡동궁내동동원동구미동운중동대장동석운동하산운동 100% 80% 15 년 60% 40% 20% 0% 분당동수내동정자동율동서현동이매동야탑동판교동삼평동백현동금곡동궁내동동원동구미동운중동대장동석운동하산운동 - 68 -
분석결과 < 삼평동 ( 판교테크노밸리 ) 사업체생멸추이 ( 11~ 15) > ( 단위 : %) 80.0 70.0 활동 67.9 67.0 67.0 73.9 60.0 50.0 44.5 40.0 30.0 20.0 10.0 0.0 45.8 23.8 20.7 21.5 17.7 9.7 8.3 12.2 11.5 8.5 '11 '12 '13 '14 '15 소멸 신생 - 69 -
산업분류별개인 법인사업자현황 - 성남시분당구지역 - 11~ 14 년추이분석 - 70 -
OUTPUT 11 년 12 년 13 년 14 년 - 71 -
분석결과 - 72 -
분석결과 < 14 년산업분류별개인 법인사업자현황 > S. 협회및단체, 수리및기타개인서비스업 R. 예술, 스포츠및여가관련서비스업 Q. 보건업및사회복지서비스업 P. 교육서비스업 N. 사업시설관리및사업지원서비스업 M. 전문, 과학및기술서비스업 L. 부동산업및임대업 K. 금융및보험업 J. 출판, 영상, 방송통신및정보서비스업 I. 숙박및음식점업 H. 운수업 G. 도매및소매업 F. 건설업 E. 하수폐기물처리, 원료재생및환경복원업 D. 전기, 가스증기및수도사업 C. 제조업 B. 광업 A. 농업, 임업및어업 법인 개인 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% - 73 -
주요생활밀접업종현황 - 성남시분당구지역, 개인사업자, 국세청업종코드 - 11~ 15 년추이분석 - 74 -
OUTPUT 11 년 12 년 13 년 14 년 15 년 - 75 -
분석결과 < 주요생활밀접업종 ( 음식점업 ) 추이 ( 11~ 15)> ( 단위 : 개 ) 450 400 350 300 250 200 150 중식음식점일식음식점서양식음식점피자, 햄버거, 샌드위치및유사음식점, 치킨전문점비알콜음료점 ( 커피등 ) 100 50 0 '11 '12 '13 '14 '15-76 -
경청해주셔서감사합니다. Data Saying.. 통계의다른이름입니다. Q&A 77