조사항목별로 조사된 사례에 가중값을 부여하였으며 가중값

Similar documents
통계적 표본조사론 소개

통계적 표본조사론 소개

14.04?? ???????????????? ?????? ??????.hwp

14.05?? ???????????????? ?????? ??????.hwp

14.07?? ???????????????? ?????? ??????.hwp

14.06?? ???????????????? ?????? ??????.hwp

발간등록번호

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

First Quarter 2013 Office Market Report COMPANY OVERVIEW

조사연구 권 호 DOI 연구논문 몽골의가축통계조사를위한표본설계연구 A Study on Sampling Design for the Mongolian Livestock Statistics Survey 주제어

Microsoft Word - SAS_Data Manipulate.docx

untitled

슬라이드 1

ePapyrus PDF Document

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

<4D F736F F F696E74202D20C1A636C1D620C7A5BABBC3DFC3E2B9E6B9FD20B0ADC0C72E >

< 차례 > Ⅰ. 조사개요 1 Ⅱ. 통계의작성목적및이용 6 Ⅲ. 조사설계 12 Ⅳ. 자료수집 50 Ⅴ. 행정자료활용 87 Ⅵ. 자료처리 91 Ⅶ. 통계추정및분석 99 Ⅷ. 통계공표관리및이용자서비스 115 Ⅸ. 통계기반및개선 132 Ⅹ. 참고문헌 141

자료의 이해 및 분석

[INPUT] 뒤에는변수와관련된정보를표기한다. [CARDS;] 뒤에는각각의변수가가지는관측값들을표기한다. >> 위의프로그램에서데이터셋명은 wghtclub 이고, 변수는 idno, name, team, strtwght, endwght 이다. 이중 name 과 team 은

10. ..

서울도시연구_13권4호.hwp

Microsoft PowerPoint - 27.pptx


< B3E2B1E2C1D85FC1D6B9CEB5EEB7CFC0CEB1B8C5EBB0E8BAB8B0EDBCAD2E687770>

조사연구 Key words: exit poll, sample size, primary sampling unit, secondary sampling unit, cluster, design effect, coefficient of variation Ⅰ. 서론 년 월의지방선

Microsoft PowerPoint - IPYYUIHNPGFU

발간등록번호

01....b

¾Ë·¹¸£±âÁöħ¼�1-ÃÖÁ¾

2007백서-001-특집

00목차

(291)본문7

1.PDF


3장

<C1B6BBE7B5BFC7E B9DAB9CEB1D45F B3E2BCADBFEFBCADBAA3C0CC2E687770>

WINDOW FUNCTION 의이해와활용방법 엑셈컨설팅본부 / DB 컨설팅팀정동기 개요 Window Function 이란행과행간의관계를쉽게정의할수있도록만든함수이다. 윈도우함수를활용하면복잡한 SQL 들을하나의 SQL 문장으로변경할수있으며반복적으로 ACCESS 하는비효율역


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

조사연구 권 호 연구노트 1) 가구방문조사에서무응답보정을위한파라데이터활용 * : 국제성인역량조사사례분석을중심으로 Using Paradata in Nonresponse Adjustment for a Household Interview Survey: Case Study o

BK21 플러스방법론워크숍 Data Management Using Stata 오욱찬 서울대사회복지학과 BK21 플러스사업팀

PowerPoint 프레젠테이션

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

슬라이드 1

슬라이드 1

메타분석: 통계적 방법의 기초


발간등록번호 정책연구용역사업최종결과보고서 청소년건강행태온라인조사 2017 년표본설계 Sample Design for 2017 Youth Health Behavior Online Survey 주관연구기관 : 한국조사연구학회 질병관리본

Microsoft PowerPoint - Java7.pptx

목 차

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

' 서울여성취업자수 ' 40~50 대가 20~30 대첫추월 - 1 -

05 ƯÁý

C# Programming Guide - Types

고객관계를 리드하는 서비스 리더십 전략

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각

유성감속기_K_170404

10김묘선


Ⅱ 모집단및표본추출틀 모집단정의 목표모집단 조사시점기준전국의만 세이상모든가구원 조사모집단 조사하기어려운기숙시설 특수사회시설 외국인거주 표본추출틀작성 지역에거주하는사람을제외한일반가구의가구원 년인총 표본조사구및 년세종시특별센서스의보통조사구 아파트조사구 와 년 월까지의신축아


(001~006)개념RPM3-2(부속)

?? (N=800) ~5.1(%) (%) 1 반드시투표할것이다 (72.4%) 2 가능하면투표할것이다 (18.7%) 3 별로투표할생각이없다 ( 2.5%) 4 전혀투표할생각이없다 ( 1.6%) 9 결정못했다 / 모름 / 무응답 ( 4.8%)

Microsoft PowerPoint - 알고리즘_5주차_1차시.pptx

목차 BUG 문법에맞지않는질의문수행시, 에러메시지에질의문의일부만보여주는문제를수정합니다... 3 BUG ROUND, TRUNC 함수에서 DATE 포맷 IW 를추가지원합니다... 5 BUG ROLLUP/CUBE 절을포함하는질의는 SUBQUE

( 단위 : 가수, %) 응답수,,-,,-,,-,,-,, 만원이상 무응답 평균 ( 만원 ) 자녀상태 < 유 자 녀 > 미 취 학 초 등 학 생 중 학 생 고 등 학 생 대 학 생 대 학 원 생 군 복 무 직 장 인 무 직 < 무 자 녀 >,,.,.,.,.,.,.,.,.

<C1B6BBE7BFACB1B82032B1C72031C8A BFACB1B8B3EDB9AE29202D20C0CCB1E2C0E72E687770>

발간등록번호

<BAB8B5B5C0DAB7E128C6EDC1FD292E687770>

제1장부산 18개선거구 ( 통합 ) 3 제2장중구 동구 8 제3장서구 13 제4장영도구 18 제5장부산진구 ( 갑 ) 23 제6장부산진구 ( 을 ) 28 제7장동래구 33 제8장남구 ( 갑 ) 38 제9장남구 ( 을 ) 43 제10장북구강서구 ( 갑 ) 48 제11장북

제 2 기 (2011 년 ~2014 년 ) 지역사회복지계획

Microsoft PowerPoint Predicates and Quantifiers.ppt

지방선거투표의향 문 1. 선생님께서는올해 6 월 13 일치러지는지방선거에서투표하실생각이십니까? 투표하지않으실생각이십니까? 1 반드시투표할것이다 (70.8%) 2 가능하면투표할것이다 (21.3%) 3 별로투표할생각이없다 ( 2.1%) 적극적투표의향 : 70.8 소극적투표


중간고사

untitled

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>


게임백서-상하-색인 목차

게임백서-상하-색인 목차

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

게임백서-상하-색인 목차

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

청소년 위기, 함께 나서야 합니다 작년부터 여성가족위원회 활동을 하며 우리 사회 문제 중 위기 청소년에 대한 문 제가 심각함을 느끼고 이 문제에 대한 종합적 대책이 필요하다는 생각을 하게 되었 습니다. 청소년을 보호하고 성장시키는데 있어서 가정에서 담당하던 청소년 교육

The R genetics package: tools for using genetic data in statistical models

SRC PLUS 제어기 MANUAL

*부평구_길라잡이_내지칼라

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -


Modern Javascript


UDI 이슈리포트제 18 호 고용없는성장과울산의대응방안 경제산업연구실김문연책임연구원 052) / < 목차 > 요약 1 Ⅰ. 연구배경및목적 2 Ⅱ. 한국경제의취업구조및취업계수 3 Ⅲ. 울산경제의고용계수 9

조사연구 sampling error of polling sites and the additional error which comes from non-response, early voting and second stage sampling error of voters in

조사연구 aim of this study is to find main cause of the forecasting error and bias of telephone survey. We use the telephone survey paradata released by N

조사연구 whether this expansive monitoring system might basically achieve the improvement in statistical quality capturing problems in survey research. Ba

Transcription:

지역사회건강조사에서소지역추정법으로 동읍면흡연율계산. 서언 지역사회건강조사는보건소단위로주민의주요건강지표를생산하기위하여보건소별로 세이상성인 여명을층화집락추출법으로선정하여 CAPI(computer assissted personal interviewing) 를이용한조사이다. 보건소내의동읍면과주택유형을층화변수로사용하여보건소별표본크기 명을동읍면에대해서비례배분한후에동읍면내에서주택유형 ( 아파트와단독주택 ) 에대해서비례배분하고표본지점인통반리를가구수를기준으로확률비례추출법으로선정한다. 그후에선정된표본지점에서평균적으로 가구를계통추출법으로선정하고추출된조사대상가구에서는 세이상모든성인을대상으로개별방문면접조사롤통해서주민의건강실태를조사한다 ( 이계오외인, ). 보건소단위에서는일정수준의정도 (precision) 를갖는건강지표를생산하고있으나보건소내동읍면단위로주요건강지표생산의요구가많아지고있다. 동읍면단위의조사된표본규모는적게는 여명에서많게는수백명에이르고있으므로표본규모가 명이하인동읍면의흡연율과같은건강지표를전통적인통계추정법으로생산할경우에는추정치의표본분산이너무커서이용할수없으므로 Ghosh and Rao() 가설명한소지역추정법 (small area estimation) 과같은특별한추정법으로동읍면단위통계치의계산이필요하여 SAS를이용한계산방법을설명하고자한다.. 소지역추정법 표본설계당시에통계생산단위로고려되지않았으나조사후에소영역에대한통계를생산하고자할때소영역에할당된표본규모가작기때문에추정값의분산이커지게되므로이를보완하기위해서주변의조사정보를이용하거나다른 source의보조정보를이용또는모집단의통계적모형구조를이용하는추정기법을소지역추정법 (small area estimation) 이라한다 ( 이계오외인, ; Gonzalez, Placek and Scott, ). 지역사회건강조사에서도보건소단위로건강지표를산출하기위한표본설계를하 --

였으나조사완료후에소영역인동읍면단위의건강지표를안정적으로생산하기위 해서는소지역추정법을적용할필요가있으며보건소내의동읍면별건강지표를산 출하는데적용할수있는소지역추정법을설명하겠다 ( 이계오, ). () 직접추정량 ( Direct estimator) 지역사회건강조사에서수집한자료중에서동읍면별로해당되는자료만을이용하여건강지표를추정하는것이며조사된데이터세트에조사항목별로조사된사례에가중치가부여되었으므로가중값 ( ) 와관찰값 ( ) 를이용한표본설계기반의직접추정량과분산의추정식을아래와같이나타낼수있다. () 여기서, 는동읍면표본수이고는추출률과응답률을고려한승수이며 는관찰값이다. 식 () 에주어진추정량의분산추정식은식 () 로나타낼수있다. () 여기서이고, 이다. () 합성추정량 (Synthetic estimator) 보건소내동읍면별성별과연령대별주민등록인구를보조정보로사용하여동읍면별흡연율의추정치를좀더정확하게산출하는추정량이합성추정량 (synthetic estimator) 이다 ( 이계오, ; Ghosh and Rao, ). 보건소내의동읍면의사회생활환경과인구구성비를집락변수 (clustering variable) 로사용하여동읍면들을 -개의동질적인집락으로구분한후에각집락별로집락내의동읍면들은성별과연령대별로흡연율과같은건강지표가유사할것이라는가정을할수있으므로성별 * 연령대별흡연율과동읍면의주민등록인구수를결합하여동읍면의흡연율을아래와같이계산할수있다. --

() 여기서 는그룹내범주의평균추정값을, 는그룹내동읍 면, 범주의주민등록인구를, 는그룹내의범주표본수를, 는그룹내의범 주의수를의미한다. 식 () 에주어진추정량의분산의추정식은식 () 와같다. () 여기서이다. 합성추정량은일종의편향추정량이지만보건소내의동읍면별로집락화를잘했을경우에는각집락 ( 그룹 ) 내에서동읍면별로성별-연령대별범주의특성이유사하게될것이므로이경우에는편향을무시해도될것이다. 만일에편향이무시할정도가아니라면식 () 에주어진분산의추정식은식 () 의추정량의추정오차를과소추정하게될가능성이있기때문에집락화를통한그룹의구분에유의해야한다. () 복합추정량 (composite estimator) 식 () 에주어진직접추정량은불편추정량이지만표본크기가크지않기때문에표준오차가클뿐만아니라추정값이불안정하고, 식 () 에주어진합성추정량은편향을갖기때문에두추정량의문제점을보완하여보다안정된추정량을얻는방법은두추정량의가중평균형식의추정법을고려할수있다. 식 () 과식 () 에주어진추정량들의가중평균형식을복합추정량 (composite estimator) 이라하고아래와같이계산할수있다. --

() 여기서는를최소화하는가중값이되어야하므로다음과같이계산된다. () 의최적값은의평균제곱오차를최소화하는값이되어야하지만합성추정량의편향의크기가무시될정도로동읍면의집락화가잘되고직접추정량과합성추정량이서로독립이라는가정에서식 () 에의해서를계산한다. --

. SAS 이용흡연율계산 년지역사회건강조사자료를이용하여보건소내동읍면단위의흡연율을추 정하는방법을설명하기위해서앞에서설명한소지역추정법을서울시강남구 개동별흡연율계산에적용하여계산과정을설명하겠다. () 직접추정량 년에조사된강남구보건소의데이터에서 개동별표본수의분포를보면표본수가가장작은동은개포동으로 명이고가장많은동은역삼동으로 명이다. 개별로흡연율을식 () 에주어진직접추정량과식 () 에주어진분산추정식으로계산하기위해서아래와같은 SAS코드를사용하였다 (R코드프로그램은이계오 () 연구보고서참조 ). /* 서울시강남구보건소데이터구성-연령그룹및흡연여부변수생성 */ data abc.seoul_gangnam_data; set abc.chs; length age_group $. keep josa_year dong sm_a sma_z sma_z age age_group sex wt; rename dong= 읍면동 ;;\ if <=age<= then age_group="-세 "; if <=age<= then age_group="-세 "; if <=age then age_group="세이상 "; **. 현재흡연율 ( 다른조사항목변수설명은질병관리본부 () 참조 ) ========================================= 변수명 : sm_a ( 현재흡연율산출변수 ) 분석데이터변수명 : sma_z( 평생흡연여부 ) sma_z( 현재흡연여부 ) =========================================; if sma_z = then do ; if sma_z in (,) then sm_a = ; else if sma_z = then sm_a = ; end ; else if sma_z = then do ; sm_a = ; --

end ; if bogun_cd=; ( 강남구보건소코드 ) /* 서울시강남구직접추정량과분산추정 */ proc surveymeans data=abc.seoul_gangnam_data; var sm_a; ( 현재흡연율산출변수 ) domain 읍면동 ; weight wt; ( 표본설계가중치 ) ods output Domain=abc.direct_estimator; () 합성추정량 동별흡연율의합성추정량을계산하기위해서는강남구의 개동을 개의집락으로구분하고각집락별로성별 * 연령대별 (-세, -세, 세이상 ) 의흡연율을계산한다음에동별흡연율과분산을각각식 () 과식 () 를이용하여계산하는데세부적인계산과정은아래와같다. 동별 년 월말기준성별 * 연령대별주민등록인구소아구성비를계산한다. < 표 > 동별성별연령대의주민등록인구구성비 동 남 _ 세 남 _ 세 남 세이상 여 _ 세 여 _ 세 여 세이상 신사동...... 논현 동...... 논현 동...... 압구정동...... 청담동...... 삼성 동...... 삼성 동...... 대치 동...... 대치 동...... 대치 동...... 역삼 동...... 역삼 동...... --

도곡동...... 도곡동...... 개포동...... 개포동...... 개포동...... 세곡동...... 일원본동...... 일원동...... 일원동...... 수서동...... 개동을성별 * 연령대별인구구성비와흡연율등을집락화변수로사용하여 k-means 방법으로집락화한다. 개집락으로구분된결과를주민등록인구수와사 회생활환경여건의유사성등을고려하여집락구분을검토한후에확정한다. /* 서울시강남구 년성별 _ 연령대별인구구성비흡연율을통한군집분석 */ /* 데이터불러오기 */ proc import out=abc.seoul_gangnam_cluster_data datafile="d:\연구활동 \sas강의\ 서울강남구 _ 군집화데이터 " datafiel=dbms=excel replace; rage=" 서울 $ getnames=yes; mixed=no; scantext=yes; usedate=ye; scantime=yes; /*k-평균집락화 */ proc fastclus data=abc.seoul_gangnam_cluster_data maxc= out=abc.seoul_gangnam_kcluster; var 남 세남 세남_세이상여 세여 세여_세이상 ; id 읍면동 ; /* 군집엑셀로보내기 */ proc exprot data=abc.seoul_gangnam_kcluster OUTFILE= "D:\ 연구활 동 \sas 강의 \ 서울강남구 _ 군집분석 " label dbms=excel replace; --

/* 군집수정하기 */ proc import out=abc.seoul_gangnam_rcluster datafile="d:\연구활동 \sas 강의 \ 서울강남구 _ 수정군집화 " dmbs=excel replace; rage=" 서울 $" getnames=yes; mixed=no; scantext=yes; usedate=yes; scantime=yes; 개집락별로집락내의성별 * 연령대별흡연율을계산한다. /* 서울시강남구데이터에수정군집통합 */ proc sort data=abc.seoul_gangnam_data; by 읍면동 ; run proc sort data=abc.seoul_gangnam_rcluster; by 읍면동 ; run data abc.seoul_gangnam_data; merge abc.seoul_gangnam_data abc.seoul_gangnam_rcluster; by 읍면동 ; group= 수정군집 "_" sex "_" age_group; group=compress(group); proc print data=abc.seoul_gangnam_data; < 표 > 수정군집, 성별과연령대와흡연율산출변수포함데이터구조예시 OBS 읍면동 se x sma _z sma _z ag e wt age_gro up sm_a Clu ste r 수정군집 group 논현 동. - 세 - 세 논현 동. - 세 - 세 논현 동. - 세 - 세 논현 동. - 세 - 세 논현 동.. - 세 - 세 논현 동.. - 세 - 세 논현 동. - 세 - 세 논현 동. - 세 - 세 --

/* 집락내성별 * 연령대별흡연율추정치계산 */ proc surveymeans data=abc.seoul_gangnam_data mean; var sm_a; domain group; weight wt; ods output Domain=abc.com_estimator_r; < 표 > 그룹별 ( 군집, 성별과연령대 ) 현재흡연율추정치와표준오차 group Variable Mean Std Error of Mean -세 sm_a.. -세 sm_a.. 세이상 sm_a.. -세 sm_a.. -세 sm_a.. 세이상 sm_a.. -세 sm_a.. -세 sm_a.. 세이상 sm_a.. -세 sm_a.. -세 sm_a.. 세이상 sm_a -세 sm_a.. -세 sm_a.. 세이상 sm_a.. -세 sm_a.. -세 sm_a 세이상 sm_a.. 개동별흡연율의합성추정치와분산을계산한다. --

/* 집락내성별 * 연령대별흡연율추정치계산데이터준비 */ /* 서울시강남구데이터에수정군집통합 */ proc sort data=abc.seoul_gangnam_data; by 읍면동 ; run proc sort data=abc.seoul_gangnam_rcluster; by 읍면동 ; run data abc.seoul_gangnam_data; merge abc.seoul_gangnam_data abc.seoul_gangnam_rcluster; by 읍면동 ; group= 수정군집 "_" sex "_" age_group; group=compress(group); /* 서울강남구 개동별합성추정량 */ proc surveymeans data=abc.seoul_gangnam_com mean; domain 읍면동 ; var mean; weight 인구 ; ods output Domain=abc.seoul_gangnam_comestimator_mean; < 표 > 동별현재흡연율의합성추정치와표준오차 동 Mean Std Error of Mean 개포동.. 개포동.. 개포동.. 논현동.. 논현동.. 대치동.. 대치동.. 대치동.. 도곡동.. 도곡동.. 삼성동.. --

삼성동.. 세곡동.. 수서동.. 신사동.. 압구정동.. 역삼동.. 역삼동.. 일원동.. 일원동.. 일원본동.. 청담동.. /* 개동별합성추정량의분산추정 */ proc sort data=abc.seoul_gangnam_data; by group; run data abc.seoul_gangnam_comvar; merge abc.seoul_gangnam_data abc.com_estimator_r; by group; sum_wj_yj_rj=((wt*wt)*((sm_a-mean)*(sm_a-mean))); /* 그룹내 k범주의가중치의합 */ proc surveymeans data=abc.seoul_gangnam_comvar; domain group; var wt; ods output domain=abc.seoul_gangnam_comvar_; /* 그룹내 k 범주의분산을위한합 */ proc tabulate data=abc.seoul_gangnam_comvar; class group; var sum_wj_yj_rj; table group*sum_wj_yj_rj; ods output table=abc.seoul_gangnam_comvar_; --

data abc.seoul_gangnam_comvar_data; merge abc.seoul_gangnam_pop abc.seoul_gangnam_comvar_ abc.seoul_gangnam_comvar_; by group; keep 읍면동 수정군집 성별 연령그룹 인구 N Mean sum_wj_yj_rj_sum group; < 표 > 그룹별 ( 군집, 성별과연령대 ) 합성추정치의분산 OBS 읍면동 수정 군집 성별 연령그룹 인구 group N Mean (wt) sum_wj_yj_ rj_sum 신사동 - 세 - 세. 논현 동 - 세 - 세. 논현 동 - 세 - 세. 압구정동 - 세 - 세. 청담동 - 세 - 세. 삼성 동 - 세 - 세. 삼성 동 - 세 - 세. 신사동 - 세 - 세. 논현 동 - 세 - 세. 논현 동 - 세 - 세. 압구정동 - 세 - 세. 청담동 - 세 - 세. 삼성 동 - 세 - 세. 삼성 동 - 세 - 세. 신사동 세이상 세이상.. 논현 동 세이상 세이상.. 논현 동 세이상 세이상.. 압구정동 세이상 세이상.. 청담동 세이상 세이상.. proc surveymeans data=abc.seoul_gangnam_comvar_data sum; domain 읍면동 ; var 인구 ; --

ods output domain=abc.seoul_gangnam_comvar_data; proc sort data=abc.seoul_gangnam_comvar_data; by 읍면동 ; proc sort data=abc.seoul_gangnam_comvar_data; by 읍면동 ; /* 합성추정량분산추정 */ data abc.seoul_gangnam_comvar_data; merge abc.seoul_gangnam_comvar_data abc.seoul_gangnam_comvar_data; by 읍면동 ; drop varname varlabel stddev DomainLabel; Zjk= 인구 /Sum; Var=((Zjk*Zjk)/((N*(N-))*(mean*mean)))*sum_wj_yj_rj_sum; < 표 > 동별그룹별합성추정치의분산계산 OB S 읍면동 수정군집 성별 연령그룹 개포 동 - 세 개포 동 - 세 개포 동 세이상 개포 동 - 세 개포 동 - 세 개포 동 세이상 개포 동 - 세 개포 동 - 세 개포 동 세이상 인구 group N Mean sum_wj _yj_rj_s um - 세 - 세 세이상 - 세 - 세 세이상 - 세 - 세 세이상.......... Sum Zjk Var............E-.E-.E-...E- --

개포 동 - 세 - 세...E- 개포 동 - 세 - 세.. 개포 동 세이상 세이상....E- proc surveymeans data=abc.seoul_gangnam_comvar_data sum; domain 읍면동 ; var var; ods output domain=abc.seoul_gangnam_comvariance; /* 동별합성치와분산추정치의통합데이터세트 */ /* 합성추정량과분산 */ data abc.seoul_gangnam_estimator_com; merge abc.seoul_gangnam_comestimator_mean abc.seoul_gangnam_comvariance; by 읍면동 ; drop DomainLabel VarName stderr StdDev; rename mean=y_s sum=var_y_s; () 복합추정량 앞에서계산한동별흡연율의직접추정치와합성추정치를가중평균으로결합하 여복합추정치를계산하는데가중치를계산하는방법으로다음 가지를적용한다. 먼저식 () 로주어진복합추정량의평균제곱오차를최소화하는는아 래와같다. () --

최적가중값의추정값은다음식으로계산된다. () 모든소영역에공통가중값을부여하는방법으로써초기공통가중값 하여들의평균을최소화하는가중값은아래와같다. 을이용 () 각소영역에배정된표본크기에의존하는가중값은다음과같이계산된다. 그외 () 단, 는소영역의크기이며이다. 는직접추정량이며는합성추정량의기여도를조정하는값이므로주관적으로결정한값이다. 예를들어캐나다노동력통계조사에서는 = /을사용하므로본계산에서도 = /을사용한다 (Singh, Gambino and Mantel, ). 위에서주어진 종의가중치별로동별흡연율의복합추정치를계산한후에적 합한추정방법을선택할것이며복합추정치의세부계산절차는아래와같다. 개동별로계산된직접추정치 (Y_d) 와합성추정치 (Y_s) 를통합하여데이터 세트를구성한다. /* 직접추정량합성추정량 ( 추정치와분산 )*/ data abc.seoul_gangnam_estimators; merge abc.seoul_gangnam_estimator_direct abc.seoul_gangnam_estimator_com; by 읍면동 ; --

< 표 > 동별현재흡연율의직접추정치와합성추정치계산결과 OBS 읍면동 N Y_d Var_Y_d 수정군집 Y_s var_y_s 개포동.... 개포동.... 개포동.... 논현동.... 논현동.... 대치동.... 대치동.... 대치동.... 도곡동.... 도곡동.... 삼성동.... 삼성동.... 세곡동.... 수서동.... 신사동.... 압구정동.... 역삼동.... 역삼동.... 일원동.... 일원동.... 일원본동.... 청담동.... 첫번째가중치를사용한복합추정치 (Y_c) 을계산한다. /* 복합추정량*/ data abc.seoul_gangnam_estimator_c; set abc.seoul_gangnam_estimators; alpha=var_y_s/(var_y_d+var_y_s); Y_c=(alpha*Y_d)+((-alpha)*Y_s); --

Var_Y_c=((alpha*alpha)*Var_y_d)+(((-alpha)*(- alpha))*var_y_s); sumvar_ys_yd=(var_y_s+var_y_d); /* 수정군집별직접추정량의분산과직접추정량분산 + 합성추정량 */ proc surveymeans data=abc.seoul_gangnam_estimator_c sum; domain 수정군집 ; var Var_Y_d; ods output domain=abc; data abc; set abc; rename sum=sum; proc surveymeans data=abc.seoul_gangnam_estimator_c sum; domain 수정군집 ; var sumvar_ys_yd; ods output domain=abc; data abc; merge abc abc; by 수정군집 ; alpha=-(sum/sum); keep 수정군집 alpha; proc sort data=abc.seoul_gangnam_estimator_c; by 수정군집 ; --

두번째가중치를사용한복합추정치 (Y_c) 을계산한다. /* 복합추정량*/ data abc.seoul_gangnam_estimator_c; merge abc.seoul_gangnam_estimator_c abc; by 수정군집 ; Y_c=(alpha*Y_d)+((-alpha)*Y_s); Var_Y_c=((alpha*alpha)*Var_y_d)+(((-alpha)*(- alpha))*var_y_s); proc surveymeans data=abc.seoul_gangnam_pop sum; domain 읍면동 ; var 인구 ; ods output domain=abc; proc surveymeans data=abc.seoul_gangnam_pop sum; domain 수정군집 ; var 인구 ; ods output domain=abc; proc surveymeans data=abc.seoul_gangnam_estimator_c sum; domain 수정군집 ; var N; ods output domain=abc; proc sort data=abc; by 읍면동 ; data abc; set abc; rename Sum= 집락인구수 ; proc sort data=abc; by 수정군집 ; data abc; set abc; rename Sum= 집락표본수 ; proc sort data=abc; by 수정군집 ; proc sort data=abc.seoul_gangnam_estimator_c; by 읍면동 ; data abc.seoul_gangnam_estimator_c_; merge abc.seoul_gangnam_estimator_c abc; by 읍면동 ; drop DomainLabel VarName VarLabel StdDev; rename sum= 주민등록인구수 ; proc sort data=abc.seoul_gangnam_estimator_c_; by 수정군집 ; data abc.seoul_gangnam_estimator_c_; merge abc.seoul_gangnam_estimator_c_ abc abc; by 수정군집 ; drop DomainLabel VarName VarLabel StdDev; --

세번째가중치를사용한복합추정치 (Y_c) 을계산한다. 첫번째가중치와세번째가중치의평균가중치를사용한복합추정치 (Y_c) 를계산한다. /* 복합추정량*/ data abc.seoul_gangnam_estimator_c; set abc.seoul_gangnam_estimator_c_; hat_n_i= 집락인구수 *(N/ 집락표본수 ); if hat_n_i>=((/)* 주민등록인구수 ) then alpha= else alpha=hat_n_i/((/)* 주민등록인구수 ); Y_c=(alpha*Y_d)+((-alpha)*Y_s); Var_Y_c=((alpha*alpha)*Var_y_d)+(((-alpha)*(- alpha))*var_y_s); /* 복합추정량*/ data abc.seoul_gangnam_estimator_c; set abc.seoul_gangnam_estimator_c; alpha=(alpha+alpha)/ Y_c=(alpha*Y_d)+((-alpha)*Y_s); Var_Y_c=((alpha*alpha)*Var_y_d)+(((-alpha)*(- alpha))*var_y_s); /* 직접추정량 _ 합성추정량 _ 복합추정량 */ data abc.estimator_total; set abc.seoul_gangnam_estimator_c; keep 읍면동 Y_d Var_Y_d Y_s var_y_s alpha Y_c var_y_c alpha Y_c var_y_c Y_c var_y_c; proc print data=abc.estimator_total; --

종의복합추정법에따른추정결과요약 < 표 > 동별현재흡연율의 종복합추정치의계산결과 읍면동표본수 Y_d V_d Y_c V_c Y_c V_c Y_c V_c Y_c V_c 논현 동.......... 논현 동.......... 삼성 동.......... 삼성 동.......... 신사동.......... 압구정동.......... 청담동.......... 대치 동.......... 대치 동.......... 대치 동.......... 도곡 동.......... 도곡 동.......... 역삼 동.......... 역삼 동.......... 개포 동.......... 개포 동.......... 개포 동.......... 세곡동.......... 수서동.......... 일원 동.......... 일원 동.......... 일원본동.......... < 표 > 에동별현재흡연율의 종복합추정치계산결과를정리하였는데직접추 --

정치에비해서모두분산을작아졌으나현재흡연율추정치가동별표본크기에따라서변화가크게나타났는데이는복합추정방법의특징이추정치를안정화시키기때문이다. 따라서직접추정치의분산은줄이고합성추정치의편향을보정하는관점에서볼때 번째복합추정량이동별추정치의안정화에서유용한것으로생각된다. 보건소단위로건강지표를산출할목적으로조사를설계하여자료를수집한후에소영역인동읍면별건강지표를소지역추정법으로산출하는수치적인사례를설명하였는데다양한분야에서광역단위의통계를산출할목적으로조사한후에소영역이나세부영역의통계를생산할필요가있을경우에응용할수있는계산과정을 SAS코드로예시하였으므로앞으로소영역의통계생산에도움이될수있기를바란다.. 참고문헌 [] 이계오외 인 (), 년지역사회건강조사전국표본설계및표본관리, 최종결과보고서 [] 이계오 (), 시군구실업자추정을위한소지역추정법, 응용통계연구, 제권 호, - [] 이계오외 인 (), 소지역통계추정법, 통계청연구결과보고서 [] 이계오외 인 (), 지역사회건강조사동읍면단위통계생산프로그램 ( 알고리즘 ) 개발연구, 질병관리본부연구결과보고서 [] 질병관리본부 (), 지역사회건강조사원시자료이용지침서, 질병관리본부 [] J.F. Gonzalez, P.J.Placek, and C.Scott(), "Synthetic estimation in followback surveys at the national center for health statistics", Statistical Policy Working Paper, Chapter. [] Ghosh, M. and Rao, J.N.K () Small area estimation: an appraisal. Statistical Science,, - [] Singh, M.P., Gambino, J. and Mantel, H.J. () Issues and strategies for small area data. Survey Methodology,, - --