ICPSR DB 이용매뉴얼 한 국 사 회 과 학 데 이 터 센 터
1. 원자료(Raw Data)란? 1.1. 원자료 소개 원자료(Raw Data)는 수치화된 데이터(numeric data)로서 연구결과를 도출하기 위해 사용되는 연구 생산 물의 재료(인프라)를 말합니다. 수치데이터의 경우 연구수행을 위해 수집, 획득, 정리된 수량화된 데이터 를 지칭하며 문자데이터와 상반된 개념입니다. 특히 학술적으로는 통계자료, 여론조사자료, 실험자료 등 의 연구 기초자료를 의미합니다. 1.2. 원자료의 필요성 사회현상에 대한 정확한 현황파악 복잡한 사회 속에서 현상을 정확히 파악하는 것은 실로 중요한 일입니다. 인구, 국민소득, 교육수준, 정당 지지도 등 복잡한 사회현상을 정확히 진단하기 위해서는 기초통계자료가 필수적으로 요구됩니다. 현상에 대한 정확한 판 단이 선행되어야 정책수립, 의사결정 및 올바른 연구결과를 도출할 수 있습니다. 연구자나 학습자는 스스로 기초 자료의 분석을 통하여 새로운 해석 등을 제시하고, 사회적 현상의 이해 및 문제 점 파악, 해결책 도출 등을 가능하게 함으로써, 새로운 지식정보를 재창출할 수 있게 됩니다. 사회현상 발현에 작용하는 원인규명 사회 현상에 대한 정확한 파악과 더불어, 현상의 배후에서 작용하는 원인을 발견해내기 위해서도 통계자료는 실로 중요합니다. 사회현상간의 정확한 인과관계의 연결고리를 발견해 내는 핵심이 바로 통계자료입니다. 과학적 검증을 통한 미래예측 통계자료를 통해 사회현상에 대한 정확한 해석과 사회현상 발현에 작용하는 원인을 정확히 규명함으로써, 미래를 예측 할 수 있게 합니다. '통계를 알면 미래가 보인다' 는 말과 같이, 통계는 자료 속에 포함된 여러 가지 특성을 분석함으로써 미래를 예측할 수 있는 수단이 되는 것입니다. 1.3. 원자료의 종류 집합자료 (aggregate data ; 통계자료) 집합자료란 집단의 특성을 자료화한 것입니다. 예를 들어 한 집단을 대상으로 취업률, 혼인률 등의 특성을 자료화 할 때 그 자료를 집합자료라 말합니다. 이러한 집합자료는 분산되어 존재하거나, 자료의 형식이 서로 상이하여 분 석에 바로 사용하기에는 어려움이 많습니다. 개인수준의 자료(individual level data ; 설문조사자료) 개인수준의 자료는 개인의 특성을 자료화한 것입니다. 개개인의 혈액형, 신장에서부터 삶의 만족도, 업무성취도 등 의 자료가 개인 수준의 자료가 됩니다. 개인수준의 자료 중에 현대사회에서 가장 광범위하게 이용되는 자료가 여 론조사자료(survey data)입니다. - 1 -
2. ICPSR DB 2.1. ICPSR DB 소개 ICPSR(The Inter-University Consortium for Political and Social Research)은 미국 미시건 대학(University of Michigan)소재의 연구기관으로 1962년에 설립된 미국의 최대 사회과학 데이터보관소입니다. 통계 및 여론조사자료, 연구보고서, 저널을 서비스하고 있으며, 현재 미국, 캐나다, 유럽, 오세아니아, 아시 아, 아프리카, 라틴 아메리카 등 700여 개 이상의 대학과 연구기관 등이 컨소시엄으로 구성되어 있습니다. 1400년대부터 세계 각국에서부터 수집된 정치, 경제, 사회, 문화, 행정, 국제관계, 보건의학, 인구학, 노 인학, 교육, 지리와 환경, 시민단체, 정부조직 등 약 19개 주제 분야의 8,000여건에 해당하는 통계 설문 조사자료(title)와 500,000개 이상의 관련 수치자료(numeric data) 파일 및 서지 자료를 서비스하고 있 습니다. 매년 ICPSR Summer Program을 통해 세계 각국의 학생들에게 리서치 디자인, 통계, 데이터분석, 사회 과학 방법론에 관한 교육을 실시하고 있습니다. 전 세계적으로 200개의 대학이 참여하며 또한, 통계 및 여론조사 자료와 관련이 있는 대학 및 대학원 강좌에 소개하여 실질적인 수업에 활용가능 하도록 하고 있습니다. 2.2. CONTENTS 2.2.1 소장자료 ICPSR은 세계 각국에서 수집된 19개 주제 분야의 8,000여 건 조사자료와 500,000여 개의 수치파일을 제 공하고 있습니다. 인 구 지역 / 도시문제 정 치 행정 / 정책 경영 / 리더십 경 제 지리 / 환경 국제관계 법 범 죄 전쟁 / 사회갈등 사회 / 사회지표 집단행동 교 육 교수학습 보건복지 노인학 정신의학 문화 - - 2 -
- 3 -
2.2.2 주요 시리즈 자료 지속적으로 수집되는 시계열 국제비교자료로써 종단연구, 횡단연구에 사용될 수 있습니다. 세계 사회 과학 연구자들이 선호하는 200여 건 시리즈 데이터 및 각종 연구자료를 제공하고 있습니다. Demographic Data(인구통계) Health and Mental Health(보건의학) Census of Governments Series National Health Interview Survey Series Census of Population and Housing National Medical Expenditure Survey Series National Survey of Family Growth Series 등 National Nursing Home Survey Series 등 Education(교육) Social Problems(사회문제) National Survey of Adolescents Series General Social Survey Series Education Longitudinal Study(ELS) Series International Social Survet Program Series Vocational Education Series 등 Afrobarometer Survey Series 등 Criminal Justice(범죄, 형사정책) Economics(경제) National Crime Victimization Survey Balance of Payments Series International Crime Victimization Survey International Financial Statistics Series National Survey on Drug Use and Health 등 World Debt Tables Series 등 <주제별 시리즈조사자료 예시> 2.2.3 테마별 조사 콜렉션 외부후원을 통해 여저 주제 영역의 데이터 콜렉션(보관소)을 별도로 구축하여 서비스하고 있습니다. 각 분 야의 전문적이고 심화된 원자료(raw data), 정책자료, 연구자료를 검색할 수 있습니다. - 4 -
2.3. SERVICE 2.3.1 Social Science Variables Database (SSVD) 조사자료의 설문항(질문항, 보기항 등)을 키워드로 검색하여 경험적 연구에 참고할 수 있습니다. 검색 결 과로 설문항의 개요정보, 빈도분석 결과, 그래프 등을 확인할 수 있습니다. 2.3.2 Online Data Analysis 온라인 데이터 분석 시스템인 Survey Documentation Analysis(SDA)를 통해 원자료(rawdata) 파일 다운로 드 필요없이 온라인 상에서 데이터 분석이 가능합니다. 2.3.3 Browse by topic / geography / investigator 주제별, 조사지역별, 조사자별 열람 기능을 통해 조건에 맞추어 열람이 가능하며 검색결과 필터링 기능을 통해 카데고리에 따른 상세검색이 가능합니다 2.3.4 Bibliography of Data-Related Literature ICPSR DB에서 소장하고 있는 데이터를 인용한 수천 개의 문헌의 개요정보를 제공하고 있습니다. 인용문 헌은 단행본, 연속간행물, 정부 및 기관보고서, 학술논문, 회의자료 뿐만 아니라 뉴스, 시청각자료 등 다 양한 유형을 포괄합니다. - 5 -
2.4. ICPSR 이용법 2.4.1. ICPSR DB 접근 방법 ICPSR 본사이트는 상위 6개의 대메뉴로 구성되어 있으며, 공지사항을 제공합니다. http://www.icpsr.umich.edu http://www.icpsr.com Find & Analyze Data : 데이터 검색 기능에 대한 설명을 제공하며, 다양한 자료 접근점을 제시하고 있습니다. 메인페이지의 키워드 검색 이외에 보다 효율적인 자료 접근을 원하신다면, 본 메뉴를 선택 하십시오. Membership in ICPSR : 기관회원 리스트, ICPSR 소개, 공지사항, 기관연혁 등 ICPSR과 관련된 전반 적인 내용을 안내하고 있습니다. Deposit Data : 자료기탁 및 기밀자료의 보존에 대해 안내하고 있습니다. ICPSR Summer Program : ICPSR에서 운영하고 있는 사회과학 양적연구 교육프로그램인 Summer Program을 소개하고 있습니다. Resources for Instructors : Online Learning Center, Undergraduate Research Paper Competition, Webinar Library, Instructional Resources 등 교육과 교수-학습에 관련된 내용을 상세하게 소개하 고 있습니다. Data Management : ICPSR의 자료수집 및 평가과정, 데이터 보존 및 활용, 데이터 손실의 최소화를 위한 방법 등에 대해서 안내하고 있습니다. - 6 -
2.4.2. ICPSR DB 회원가입 ICPSR의 데이터를 다운로드받 고 활용하기 위해서는 개별적인 회원가입이 필요합니다. Find & Analyze Data 화면의 좌 측 상 단 에 L o g i n / C r e a t e Account 를 선택하십시오. ICPSR은 구글, 페이스북과 연 동하여 동일 아이디로 로그인을 할 수 있습니다. 별도의 회원가입을 원한다면 ICPSR My Data 를 선택하 십시오. - 7 -
MyData Login화면에서 우측하 단의 Create Account 를 선 택하십시오. 개인정보를 기재하여 주십시오. 작성을 완료하여 하단의 Submit 을 클릭하면 기재한 Email주소 로 승인메일이 발송됩니다. - 8 -
해당 이메일 계정으로 로그 인하여 승인메일을 확인합니 다. 메일내용의 주소를 복사 하여 주소창에 붙여넣기 한 후 엔터를 누르십시오. 승인 절차가 완료되면 개인회원으 로 로그인할 수 있습니다. 간혹 네크워크 사정으로 승 인메일 수신이 지연되거나 스 팸메일로 분류되는 경우가 있 으므로 참고하시기 바랍니다. - 9 -
2.4.3. 데이터 검색법 데이터 검색 준비과정 다양한 자료검색을 하기위해서는 ICPSR 상위 메인메뉴에서 Find & Analyze Data 메뉴를 선택합니다. 메뉴를 선택하면 아래 우측 그림과 같이 다양한 자료검색도구가 제시되며, 이용자의 검색목적에 따라 해 당 검색도구를 선택합니다. 키워드 검색 ICPSR 소장자료를 가장 신속하고 용이하게 검색할 수 있는 방법입니다. 통계 및 설문조사자료, 보고서, 서지정보를 검색할 수 있습니다. [단계1] 검색어 입력 찾고자 하는 키워드를 입력창에 기입 하여 검색하는 단계입니다. 예시) 'north korea' 키워드검색 검색어 입력창 아래 More Search Options 중 택일하여 주제별 검색, 지역검색 등 다양한 경로로 데이터를 검색할 수 있습니다. - 10 -
[단계2] 검색결과확인 키워드와 매칭된 결과리스트가 출력됩니다. 여기서 'Sort by'를 통해 결과리스트를 정렬할 수 있습니다. Relevance'는 키워드와의 매칭도를 기준으로, 'Title A-Z'는 자료 첫글자를 알파벳 순으로, 'Release Date'는 ICPSR에서 자료를 업데이트한 날짜를 기준으로, 'Time Period'는 자료의 조사기간을 기준으로 정렬하여 조회할 수 있습니다. 또한 좌측의 'Filter Results'는 결과리스트 중 불필요한 자료를 제거함으로써 보다 정확한 검색을 지원합니다. 검색된 자료 중 4135 Global Views 2004: South Korean Public Opinion and Foreign Policy 자료를 선택하여 다음단계로 진행합니다. [단계3] 자료별 페이지 확인 선택한 자료의 개요정보를 조회하고 다운로드를 받을 수 있는 페이지 입니다. Dataset(s) 메뉴 안에 배치된 다양한 포맷의 원자료를 다운로드 받을 수 있습니다. - 11 -
[단계4] 자료 다운로드 이용약관에 대한 동의를 묻는 화면 (Terms of Use)입니다. 'I Agree'를 선 택해주십시오. 'I Agree'를 선택하시면 파일을 열거 나 저장할 수 있는 다운로드 창이 뜹니다. 선택자료의 파일을 열거나 저장하면 다운로드과정은 완료됩니다. 시리즈데이터 검색(Series Data) 연속적으로 통계 및 설문조사자료가 수정 생산되는 자료를 묶어, Series Data Archive로 구성하여 제공하고 있습니다. 시리즈 데이터는 시계열 비교연구 혹은 국가간의 비교연구 등에 매우 유용하며 수집되는 데이터에 대한 신뢰도가 높기 때문에 필수적으로 검색해보는 것이 좋습니다. 알파벳순으로 정렬되어 있는 시리즈 데이터 중 특정 시리즈를 선택할 경우 시리즈에 대한 개요정보 (Description), 해당 시리즈에서 실시한 조사 리스트(View Studies in the Series), 연관 서지자료(Related Literature)를 확인해볼 수 있습니다. [단계1] Find Data 페이지에서 시리즈데이터 검색 선택 Find Data 페이지에서 검색창 하단 More Search Options의 두 번째 메뉴 Briowse by series를 선택하십시오 - 12 -
[단계2] 시리즈데이터 페이지 확인 후 선택 변수 검색 (Search/Compare Variables) 통계 및 조사 자료에 속한 다양한 변수 및 수치데이터를 데이터베이스화하여, 이용자가 알고자하는 변수에 대한 빈도 값을 바로 확인할 수 있습니다. 또한 설문항 간 데이터를 비교할 수 있도록 설문항 비교 기능이 있습니다. [단계1] 자료별 페이지 좌측에서 메뉴 선택 Find & Analyze Data 페이지의 상단에서 두 번째 Search/Compare Variables' 를 선택하십시오 - 13 -
[단계2] 검색어 입력 검색하고자 하는 변수명을 기입하고 GO 버튼을 클릭합니다. 예시) korea 라는 키워드를 선정하여 검색을 합니다. 하단의 링크를 통해 변수DB의 모든 조 사자료와 시리즈 리스트를 조회할 수 있습니다. [단계3] 검색결과확인 검색결과로 해당 자료별로 변수명(예 : Q13L-E)과 변수레이블(예 : SOUTH KOREA), 질문내용, 조사타이틀 등의 개요정보를 확인할 수 있습니다. 'Sort by' 선택창에서 Relevance를 선 택하면 키워드와의 매칭도를 기준으로, 'Title A-Z'를 선택하면 자료 첫글자를 알파벳순으로 정렬할 수 있습니다. 개요정보를 참고하여 변수를 선택합니다. - 14 -
[단계4] 변수 선택 시 변수명, 변수레이블, 질문, 응답률, 통계개 요, 출처 등의 정보를 확인할 수 있습니다. 하단의 검색창을 통해 해당 조사자료 및 데이터셋에 제한하여 다시 키워드 검색을 진행할 수 있습니다. 검색창 아래 링크를 통해 해당 조사자료 의 모든 변수들을 조회해 보거나 자료별 페이지로 이동할 수 있습니다. [기타] 설문항 비교하기 -1 설문항 좌측 체크박스를 이용하여 설문항 비교가 가능합니다. 비교하고자 하는 설문항을 체크하고 상단 의 Compare 버튼을 누릅니다 - 15 -
[기타] 설문항 비교하기 -2 2개의 설문항에 대해 비교할 수 있도록 질문과 응답 빈도를 확인할 수 있습니다. 최대 5개의 설문항을 비교할 수 있습니다. 관련 문헌 검색 (Find Publications) ICPSR의 통계 및 설문자료와 연관된 저널, 서적, 회의자료, 뉴스, 시리즈 데이터 등 문헌자료의 메타정보를 구축 서비스하고 있으며 키워드 검색을 통해 자료를 확인할 수 있습니다. [단계1] 자료별 페이지 좌측에서 메뉴 선택 Find & Analyze Data 페이지의 상단 메뉴 세번째 Find Publications를 선택하십시오. - 16 -
[단계2] 검색어 입력 찾고자 하는 키워드를 입력창에 기입하여 검색하는 단계입니다. 예시) korea 라는 키워드를 선정하여 검색합니다. 하단의 링크를 통해 전체자료를 열람하거 나 저자별, 저널별 브라우즈를 진행할 수 있습니다. [단계3] 검색결과확인 키워드와 일치하는 서지자료 가 검색됩니다. 기본 서지정 보 및 Full_Text 파일 다운로 드를 링크서비스하고 있습니 다. 타이틀 링크를 선택하면 자료의 상세정보와 관련된 ICPSR 통계 및 조사자료를 확인할 수 있습니다. DOI, Google Scholar, PDF 등 옵션을 선택하여 원문 전체를 열람하거나, EndNote를 통해 기본서지정보를 확인해볼 수 있습니다. 이후 진행사항은 기타검색방법과 동일합니다. - 17 -
테마별 조사 콜렉션 (Thematic Collections) 외부후원을 통해 여러 주제영역의 데이터 콜렉션을 별도로 구축하여 서비스 하고 있습니다. 각 분야의 전문 적이고 심화된 원자료(raw data), 정책자료, 연구자료를 검색할 수 있습니다. [단계1] Membership in ICPSR 선택 메인페이지의 메뉴 중 Membership in ICPSR을 선택하십시오. [단계2] Membership in ICPSR 선택 상단 메뉴 중 Partners를 선택하십시오. - 18 -
[단계3] Thematic Collections Core Partners 하단 Thematic Collertion을 선택하십시오 [단계4] 각 주제별 Collection 선택 Thematic Collections는 8개 주제 분야로 구분되어 있으며 해당 collection 선택시 관련 사이트로 이동하게 됩니다. - 19 -
[참고] ICPSR 조사자료 메타데이터(Description & Citation) 설명 Description List ICPSR Study No Persistent URL Title Series Name & Description Keyword(s) Principal Investigator(s) Funding Agency Summary Time Period Sampling Universe Extent of Processing Related Publications Data Added Data Updated Date of Collection Data Type Bibliographic Citation Data Source Data Format Collection Notes Variable count File Structure Geographic Coverage Geographic Unit LRECL Records per Case Response Rates Restrictions Subject Term Unit of Observations Variable Count Version History 연구번호 해당 자료의 고유 URL 연구제목 설 명 데이터가 시리즈로 제공되는 경우, 시리즈에 대한 설명 본 연구와 연관이 있는 주제어 주연구자 후원자 연구의 동기와 목적, 내용, 결과에 대한 개략적인 설명 조사대상의 기간에 대한 설명 표본추출방법 모집단 각각의 데이터 수집에서 수행된 관리와 일련의 활동이 진행되는 것을 묘사한 함축적 의미 데이터와 관련된 서지자료 정보 추가 등록일 자료 등록일 자료 수집일 설문/통계자료의 형태와 용도에 관한 설명 연구 자료의 출처에 대한 명시 및 설명 조사방법 예)면접조사, 전화조사 등 자료의 형태 및 개수 예)SPSS 1개, SAS 2개 다른 분야에서는 쓰이지 않을 수 있는 자료수집의 기술적인 부분, 특성 등에 대한 설명 연구와 관련된 변수 개수에 대한 설명 자료의 파일, 분야 구조 설명 자료수집의 지정학적 설명 데이터에 사용된 가장 작은 지리학적 단위 각각의 파일의 고유번호 사례들에 대한 기록 (수치) 응답률 자료접근제한여부 데이터의 keyword를 의미 연구대상 단위 각각의 파일마다의 변수번호 발표이후의 수정/개선사항 - 20 -
KSDC Home KSDC DB ICPSR DB www.ksdc.re.kr www.ksdcdb.kr www.icpsr.com 문의: 02-760-1207-21 -