연구보고서 2013-37 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 -빅데이터 활용방안을 중심으로- 송태민 진달래 이중순 안지영 박대순
책임연구자 송태민 한국보건사회연구원 연구위원 주요저서 빅데이터 분석 방법론 한나래아카데미, 2013(공저) 보건복지연구를 위한 구조방정식 모형 한나래아카데미, 2012(공저) 공동연구진 진달래 한국보건사회연구원 연구원 이중순 동경공업대학교 교수 안지영 인제대학교 교수 박대순 한국보건사회연구원 선임전문원 연구보고서 2013-37 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 발행일 저 자 발행인 발행처 주 소 전 화 홈페이지 등 록 인쇄처 가 격 2013년 송 태 민 외 최 병 호 한국보건사회연구원 서울특별시 은평구 진흥로 235(우:122-705) 대표전화: 02)380-8000 http://www.kihasa.re.kr 1994년 7월 1일 (제8-142호) 한디자인 10,000원 c 한국보건사회연구원 2013 ISBN 978-89-6827-096-3 93510
발간사 << 인터넷을 포함한 정보기술은 사회 모든 분야에서 새로운 변혁을 일으 키며 정보사회를 만들어가고 있는 가운데, 보건의료분야의 건강관리분야 에서도 정보기술 도입은 기존의 서비스를 변화시키고 새로운 서비스가 창출되는 새로운 패러다임으로 시도되고 있다. 특히, 소비자 중심의 건강 정보는 기존 유선 인터넷은 물론 인터넷에 기반을 둔 스마트폰, 태블릿 PC, 스마트TV 등 보다 지능화 된 기기를 이용한 서비스가 증가함에 따라 보다 편리한 건강정보서비스에 대한 소비자 욕구 및 수요는 더욱 증가할 것으로 예상된다. 인터넷상의 건강정보는 새로운 건강정보원으로 자리매 김하고 있으나, 정보의 급증은 오히려 적절한 정보에의 접근성을 떨어뜨 리고 신뢰할 수 없는 무분별한 정보제공의 우려를 낳고 있으며, 급속한 전파속도를 가지는 모바일의 특성상 잘못된 건강정보의 모바일 유통은 인간의 생명과 건강한 삶을 위협하는 치명적인 원인이 될 수 있다. 이러 한 이유에서 건강정보에 대한 무분별한 제공 가능성과 그에 따른 위험성 을 방지하고 보다 신뢰할 만한 건강 및 질병정보 제공에 대하여 국가 또 는 공공의 개입이 필요하다. 한편, 유무선 통신기술과 센싱기술의 발전으로 u-health 기기나 스마 트TV 등을 통하여 개인의 건강정보를 기록하는 전자의무기록을 통해 환 자의 건강상태를 실시간으로 관찰할 수 있게 되었다. 최근 이러한 스마트 기기를 통해 생산되는 건강정보 관련 빅데이터의 관리와 활용에 대한 논 의가 활발히 진행되고 있다. 특히, 보건의료 분야에서는 생애주기별로 맞 춤형 보건의료서비스를 제공하기 위해서 빅데이터를 활용하고 있으며 질
병의 예측이나 자살 등 위험요인의 예측에도 활용하고 있다. 이에 본 연구는 인터넷 상에서 신뢰할만한 건강정보를 제공하여 국민 의 건강생활을 유도하고 건강증진을 촉진하기 위한 목적을 달성하기 위 하여 인터넷 건강정보 평가시스템 의 운영현황과 평가를 실시하였으며, 향후 다양한 채널을 통해 수집될 수 있는 빅데이터의 활용방안을 제시하 였다. 본 연구는 한국보건사회연구원의 송태민 연구위원의 주관하에 원내의 진달래 연구원, 박대순 선임전문원, 일본 동경공업대학 이중순 교수, 인 제대학교 u-healthcare 디자인연구소 안지영 교수의 참여로 수행되었 다. 연구진은 본 연구에 대해 귀중한 조언을 아끼지 않으신 보건복지부 박두희 팀장님과 인제대학원대학교 류시원 교수님, 원내의 정보기술융합 센터 정영철 센터장과 보건정책연구본부 최은진 연구위원께 사의를 표한 다. 그리고 빅데이터 수집과 분석에 참여한 SK텔레콤과 사이트의 개편 을 담당한 엠114에게 감사하며, 본 사업에 많은 도움을 주신 학계 및 보건의료계 전문가 여러분과 정보제공 협력기관에 감사한다. 끝으로 본 보고서에 수록된 모든 내용은 우리 연구원의 공식적인 견해는 아니며 어 디까지나 참여한 연구진의 의견임을 밝힌다. 2013년 11월 한국보건사회연구원장 최 병 호
목 차 Abstract 1 요약 3 제1장 서론 13 제1절 연구의 배경 및 목적 15 제2절 연구목적 19 제3절 연구내용 및 방법 20 제2장 국내 외 보건복지 빅데이터 활용 현황 23 제1절 우리나라 보건복지 빅데이터 동향 및 활용방안 25 제2절 일본의 보건복지 빅데이터 활용현황 41 제3장 보건복지 빅데이터 분석사례 65 제1절 소셜 빅데이터를 활용한 자살/왕따 담론분석 67 제2절 소셜 빅데이터 분석을 통한 자살검색 예측모형 개발 108 제4장 빅데이터 프라이버시 보호방안 125 제5장 인터넷 사용자의 정신건강 척도개발 165 제6장 건강정보 광장 자료구축 181 제1절 건강정보 광장 추가 구축 183 제2절 건강정보 광장 자료구축 현황 189
제3절 건강정보광장 시스템 구성도 208 제7장 건강정보광장 평가 215 제1절 정량적평가 217 제2절 정성적평가 229 제8장 결론 및 정책제언 283 제1절 결론 285 제2절 정책제언 287 참고문헌 299 부록 307
Korea Institute for Health and Social Affairs 표 목차 <표 1-1> 국내 주요 공공 건강정보사이트 별 정보 및 서비스 제공현황 17 <표 1-2> 국외 주요 공공 건강정보사이트 별 정보 및 서비스 제공현황 18 <표 2-1> 빅데이터의 4가지 구성요소 29 <표 2-2> 빅데이터 처리 프로세스별 기술 영역 31 <표 2-3> 단기계획 (2013년도~2015년) 50 <표 2-4> 중기계획(2016년도~2018년도) 51 <표 2-5> 장기계획(2019년도~2021년도) 51 <표 2-6> IT 벤더에 의한 서비스 이용 동향 56 <표 2-7> 일본의 빅데이터 동향 조사 결과 60 <표 3-1> 소셜 빅데이터 활용한 자살/왕따 담론 분석 조사설계 68 <표 3-2> 2013년 청소년 자살 관련 주요 확산 컨텐츠 75 <표 3-3> 2013년 자살 관련 주요 확산 컨텐츠 77 <표 3-4> 2012년 청소년자살 관련 주요 확산 컨텐츠 78 <표 3-5> 2013년 청소년자살 관련 주요 확산 컨텐츠 80 <표 3-6> 2011년~2013년 자살 관련 버즈 최다 게시 카페 82 <표 3-7> 자살에 대한 긍정 언급 표현 Top 10 89 <표 3-8> 자살에 대한 부정적 언급 표현 Top 10 90 <표 3-9> 2012년 왕따 관련 주요 확산 컨텐츠 95 <표 3-10> 2013년 왕따 관련 주요 확산 컨텐츠 97 <표 3-11> 왕따에 대한 긍정적 언급 표현 Top 20 101 <표 3-12> 왕따에 대한 부정적 언급 표현 Top 20 103 <표 3-13> 왕따 가해자 긍정 표현어 104 <표 3-14> 성인의 자살 검색 예측모형 115 <표 3-15> 성인의 자살 검색 예측모형(1 주간 time lag 적용) 116 <표 3-16> 청소년의 자살 검색 예측모형 118 <표 3-17> 자살 검색 다중집단(성인, 청소년) 구조모형의 경로계수 119
<표 3-18> 음주 검색과 운동 검색의 매개효과 분석 120 <표 3-19> 청소년의 자살 검색 결정요인의 다층모형 분석 121 <표 4-1> PPDM의 분류 162 <표 5-1> 정신건강 측정을 위한 관련척도 169 <표 5-2> 일반적인 사항 174 <표 5-3> 한국판 일반정신건강척도 176 <표 5-4> 일반적 특성에 따른 한국판 일반정신건강척도 177 <표 5-5> 인터넷 중독 자가진단 178 <표 5-6> 일반적 특성에 따른 인터넷 중독 자가진단 179 <표 6-1> 2013년 건강정보광장 개발 내용 184 <표 6-2> 건강소식 메뉴구성 189 <표 6-3> 건강정보광장 연도별 건강소식 콘텐츠 현황 190 <표 6-4> 건강콘텐츠 메뉴 구성 192 <표 6-5> 건강정보광장 연도별 건강콘텐츠 현황 193 <표 6-6> 건강정보광장 건강정책연구 콘텐츠 현황 195 <표 6-7> 건강정보광장 건강통계 분류별 콘텐츠 현황 195 <표 6-8> 건강정보광장 연도별 건강교육 콘텐츠 현황 197 <표 6-9> 건강정보광장 건강동영상 분류별 콘텐츠 현황 198 <표 6-10> 건강정보광장 연도별 건강지식검색 콘텐츠 현황 199 <표 6-11> 건강정보광장 의 신체부위별, 연령대별 건강정보 자료구축 현황 200 <표 6-12> 건강정보광장 의 건강생활정보 자료구축 현황 201 <표 6-13> 건강정보광장 의 질병정보 자료구축 현황 203 <표 6-14> 2013년 건강정보광장 시스템 구성 상세 211 <표 6-15> 2013년 건강정보광장 네트워크 구성 상세 213 <표 6-16> 건강정보광장 소프트웨어 내역 214 <표 7-1> 2013년 건강정보광장 방문건수 218 <표 7-2> 2013년 건강정보광장 열람 페이지 수 218 <표 7-3> 2013년 건강정보광장 유입키워드 219
Korea Institute for Health and Social Affairs <표 7-4> 2013년 건강정보광장 시작 페이지 점유율 현황 220 <표 7-5> 2013년 건강정보광장 탈출 페이지 점유율 현황 221 <표 7-6> 2013년 건강정보광장 월별 방문 건수 222 <표 7-7> 2013년 건강정보광장 월별 방문자 수 222 <표 7-8> 2013년 건강정보광장 월별 열람 페이지 수 223 <표 7-9> 2013년 건강정보광장 월별 방문 국가 224 <표 7-10> 2013년 건강정보광장 국가별 방문 구성비 225 <표 7-11> 2013년 건강정보광장 월별 시작페이지 현황 226 <표 7-12> 2013년 건강정보광장 월별 탈출페이지 현황 227 <표 7-13 2013년 건강정보광장 월별 이용자 만족도 조사 참여자 현황 230 <표 7-14> 2013년 건강정보광장 이용자 실태 및 수요조사 항목 230 <표 7-15> 2013년 건강정보광장 월별 이용자 만족도 조사 항목 231 <표 7-16> 2013년 건강정보광장 이용자실태 및 수요조사 응답자의 일반사항 233 <표 7-17> 2013년 건강정보광장 월별 이용자 만족도 참여자 일반적 사항 234 <표 7-18> 2013년 건강정보광장 을 알게 된 계기 236 <표 7-19> 2013년 건강정보광장 이용빈도 237 <표 7-20> 2013년 건강정보광장 이용자의 머무르는 시간 238 <표 7-21> 2013년 건강정보광장 월별 이용자의 머무르는 시간 239 <표 7-22> 2013년 건강정보광장 이용실태 240 <표 7-23> 2013년 건강정보광장 응답자 특성별 주요 이용정보 1순위 241 <표 7-24> 2013년 건강정보광장 월별 이용자의 주 이용 정보 243 <표 7-25> 2013년 건강정보광장 만족도 및 수요조사 응답자 특성별 RSS 이용여부 245 <표 7-26> 2013년 건강정보광장 월별 이용자의 이용만족도 247 <표 7-27> 2013년 건강정보광장 응답자 특성별 건강정보내용의 충분성 251 <표 7-28> 2013년 건강정보광장 응답자 특성별 건강정보내용의 유용성 252 <표 7-29> 2013년 건강정보광장 응답자 특성별 건강정보내용의 이해용이성 253 <표 7-30> 2013년 건강정보광장 응답자 특성별 건강정보내용의 신뢰성 254 <표 7-31> 2013년 건강정보광장 응답자 특성별 건강정보내용의 시의성 256
<표 7-32> 2013년 건강정보광장 응답자 특성별 주의사항 게시여부 257 <표 7-33> 2013년 건강정보광장 응답자 특성별 건강정보내용의 편리성 258 <표 7-34> 2013년 건강정보광장 응답자 특성별 건강정보 서비스 만족도 261 <표 7-35> 2013년 건강정보광장 응답자 특성별 건강정보의 접근성 262 <표 7-36> 2013년 건강정보광장 응답자 특성별 건강정보 항해용이성 263 <표 7-37> 2013년 건강정보광장 조사결과 건강정보 품질 만족도 및 이용수준 264 <표 7-38> 2013년 건강정보광장 응답자 특성별 건강정보에 의한 행동변화 265 <표 7-39> 2013년 건강정보광장 응답자 특성별 건강정보로 인한 병원방문 정도 266 <표 7-40> 2013년 건강정보광장 조사결과 획득한 건강정보 이용현황 267 <표 7-41> 2013년 건강정보광장 응답자 특성별 건강정보제공 주체 269 <표 7-42> 2013년 건강정보광장 응답자 특성별 건강정보를 얻기 위해 접속하는 평균 사 이트 수 270 <표 7-43> 2013년 건강정보광장 만족도 및 수요조사 응답자의 지난 1년간 인터넷에서 검색한 건강정보(복수응답) 271 <표 7-44> 2013년 건강정보광장 응답자 특성별 인터넷 이용 시간 272 <표 7-45> 2013년 건강정보광장 스마트폰 이용자 특성별 인터넷 사용 시간 274 <표 7-46> 2013년 건강정보광장 스마트폰 이용자 특성별 건강/의학관련 어플리케이션 보유개수 현황 275 <표 7-47> 2013년 건강정보광장 스마트폰 이용자의 건강/의학관련 어플리케이션 보유 분야(복수응답) 276 <표 7-48> 2013년 건강정보광장 에서 향후 제공되었으면 하는 서비스(중복응답) 277
Korea Institute for Health and Social Affairs 그림 목차 그림 2-1 데이터의 진화단계 29 그림 2-2 빅데이터 플랫폼 30 그림 2-3 Map & Reduce 사례 32 그림 2-4 자살 관련 버즈량 일별 추이 38 그림 2-5 청소년 자살 검색 확산 예측모형 39 그림 2-6 소셜 빅데이터 분석 절차 및 방법(자살Buzz 사례) 40 그림 2-7 소프트웨어와 아키텍쳐 47 그림 2-8 웨더 리포트(http://weathernews.jp/report) 55 그림 2-9 일본의 개인정보보호 법 체계 63 그림 3-1 소셜 빅데이터를 활용한 자살/왕따 담론 분석 조사목적과 기대효과 67 그림 3-2 자살관련 버즈량 일별 추이 70 그림 3-3 자살관련 버즈량 요일별 추이 71 그림 3-4 자살관련 요일별 버즈량 구성비 추이 71 그림 3-5 시간대별 자살 버즈량 72 그림 3-6 시간대별 년도별 자살 버즈량 72 그림 3-7 자살 채널 별 버즈 점유율 73 그림 3-8 자살 채널 별 순계정 비중 73 그림 3-9 청소년자살 채널 별 순계정 비중 74 그림 3-10 트위터 언급 형태 74 그림 3-11 주요 빈출 키워드 82 그림 3-12 연도별 자살관련 주요 빈출 키워드 83 그림 3-13 연도별 청소년자살관련 주요 빈출 키워드 83 그림 3-14 전 기간 주요 자살 원인 84 그림 3-15 주요 자살 원인 월별 추이 85 그림 3-16 주요 청소년 자살 원인 월별 추이 85 그림 3-17 주요 자살 유형 및 방법 86
그림 3-18 주요 자살 유형 및 방법 월별 추이 86 그림 3-19 주요 청소년자살 유형 및 방법 월별 추이 87 그림 3-20 자살에 대한 인식 분석 88 그림 3-21 자살에 대한 인식의 연도별 변화 88 그림 3-22 자살에 대한 긍정적 인식 표현 89 그림 3-23 자살 사고에 대한 안타까운 인식 표현 90 그림 3-24 왕따 관련 버즈량 일별 추이 91 그림 3-25] 왕따 관련 요일별 버즈량 92 그림 3-26] 왕따관련 요일별 버즈량 추이 92 그림 3-27] 왕따관련 시간대별 버즈량 93 그림 3-28] 최근 3년간 왕따관련 시간대 별 버즈량 구성비 비교 93 그림 3-29] 채널 별 버즈 점유율 94 그림 3-30] 채널별 순계정 비중 94 그림 3-31] 채널별 년도별 순계정 비중 95 그림 3-32 왕따관련 주요 빈출 키워드 98 그림 3-33 왕따관련 연도별 주요 빈출 키워드 99 그림 3-34 왕따 관련 문서 심리 구분 100 그림 3-35 왕따관련 피해자 측면의 심리 100 그림 3-36 왕따 피해자의 인식 표현 101 그림 3-37 왕따 피해자의 측면 심리 102 그림 3-38 왕따 가해자 심리 언급 문서 103 그림 3-39 왕따 가해자의 당위성에 대한 표현 104 그림 3-40 왕따에 관한 제 3자의 심리언급 105 그림 3-41 연구모형1(다중집단 구조모형) 111 그림 3-42 연구모형2(다층 모형) 111 그림 3-43 성인의 자살 검색 예측 모형 115 그림 3-44 성인의 자살 검색 예측 모형(1주간의 time lag 적용) 117 그림 3-45 청소년 자살 검색 예측 모형 118
Korea Institute for Health and Social Affairs 그림 3-46 자살 검색 다중집단 구조모형(성인(청소년)) 120 그림 4-1 환자정보와 투표인 명부의 개인정보의 결합 132 그림 4-2 지놈연구의 기본정보와 투표인 명부의 개인정보의 결합 135 그림 4-3 시카고시의 살인 사건 DB의 피해자 측의 샘플 데이터 137 그림 4-4 SSDI 샘플 데이터(내용이 편집됨) 137 그림 4-5 AOL이 공개한 이용자의 검색어 기록 (이용자 ID 441779의 예) 139 그림 4-6 AOL 4417749의 신원을 공개한 뉴욕타임즈 인터넷 판 기사 140 그림 4-7 Netflix Prize의 공모 홈페이지 화면 142 그림 4-8 개인에 관한 정보와 개인정보 및 프라이버시의 관계 145 그림 4-9 개인정보 식별성과 공개성 146 그림 4-10 개인정보와 프라이버시권에 해당하는 정보의 관계 148 그림 4-11 개인정보(의료정보 예)의 보호를 위한 법적 규제 149 그림 4-12 연결가능성과 연결불능성 152 그림 4-13 연결가능성, 알림성과 익명성의 강도 153 그림 6-1 2013년 건강정보광장 팝업 기능 개선 화면 185 그림 6-2 2013년 건강정보광장 건강관련 통계서비스 기능 구현 화면 186 그림 6-3 2013년 건강정보광장 건강연구보고서 기능 구현 화면 187 그림 6-4 2013년 건강정보광장 Feedback 기능 개선 구현 화면 188 그림 6-5 2013년 건강정보광장 건강뉴스 제공 서비스화면 190 그림 6-6 2013년 건강정보광장 건강강좌 및 행사 서비스화면 191 그림 6-7 2013년 건강정보광장 건강웹진 서비스화면 191 그림 6-8 2013년 건강정보광장 건강정보 서비스화면 193 그림 6-9 2013년 건강정보광장 환우회 정보 서비스화면 194 그림 6-10 2013년 건강정보광장 자가진단 서비스화면 194 그림 6-11 2013년 건강정보광장 건강통계 서비스화면 196 그림 6-12 2013년 건강정보광장 건강연구보고서 서비스화면 196 그림 6-13 2013년 건강정보광장 건강수칙 서비스화면 198 그림 6-14 2013년 건강정보광장 건강동영상 서비스화면 198
그림 6-15 2013년 건강정보광장 의료서비스 정보 서비스화면 206 그림 6-16 2013년 건강정보광장 건강App 서비스화면 207 그림 6-17 건강정보광장 시스템 및 네트워크 구성도 208 그림 6-18 하드웨어 구성도 209 그림 6-19 소프트웨어 구성도 210 그림 7-1 2013년 건강정보광장 월별피드백조사 전체 만족도 비율 248 그림 7-2 2013년 건강정보광장 월별 피드백조사 만족도 비율 249 그림 7-3 2013년 건강정보광장 조사결과 건강정보 품질만족도 비율 264 그림 7-4 2012년 2013년 건강정보광장 품질 이용 만족도 수준 비교 279 그림 7-5 2013년 건강정보광장 수요조사 및 피드백조사 참여자 현황 280 그림 7-6 2013년 건강정보광장 피드백조사 응답자의 지역별 현황 281 그림 8-1 위험분석센터 설립을 통한 빅데이터 활용 방안 289 그림 8-2 복지 분야의 빅테이터 활용 방안 290 그림 8-3 건강정보광장 온톨로지 검색 시스템(HONRS) 296
Abstract << 2013 Development and Operation of Gateway system for Internet Health Information The Health Park(healthpark.or.kr) was developed in 2001, and since then, it has been operated as an internet-based gateway system designed to promote public use of up-to-date and reliable health information. The system is aimed at providing broader health information and increasing user convenience by creating a database. This study draws implications for measures to manage health information more efficiently, provide big data-based health information and encourage the elderly to utilize health information, develop more health information apps for smart phone users, improve the quality of websites providing health information, and protect personal information on the web. As of 2013, the Health Park is a one-stop information storehouse that provides 9,021 newspaper/broadcast reports, 142 health contents (recommended items, self-diagnosis articles, patient group information pieces), 11,690 healthy lifestyle articles(12 topics), 15,558 pieces of information on dis-
2 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - eases(17 topics), 7,948 health articles on different body parts, and 4,667 health information pieces for different age groups. The Health Park in 2013 has drawn a total of 247,741 visits (a daily average of 817 visits), and a total of 1,499,225 page views (a daily average of 4,947 page views). The Health Information Utilization Satisfaction Survey (2013.06.25.~07.15) shows that the 3 most viewed information was about health contents (32.7%), self-diagnosis articles (24.7%), and newspaper/ broadcast reports (21.3%). In another user survey, the Health Information Park and the information posted on it were rated highly in terms of usability (4.81 out of 6), reliability (4.80), profusion (4.76), and satisfaction (4.64).
요 약 << 1. 연구의 배경 및 목적 최근 저출산 고령사회의 급속한 진전과 더불어 국민의 생활수준 향 상 및 의학기술의 발달은 보건의료서비스에 대한 소비자의 인식변 화를 가져와 기존의 공급자 중심, 치료위주 서비스에서 환자 및 가 족에 대한 예방과 건강증진에 중점을 둔 수요자 중심의 보다 능동 적 서비스로 전환되고 있음. 보건의료분야의 건강관리분야에서도 정보기술 도입은 기존의 서 비스를 변화시키고 새로운 서비스가 창출되는 새로운 패러다임으 로 시도되고 있음. 소비자 중심의 건강정보는 기존 유선 인터넷은 물론 인터넷에 기 반을 둔 스마트폰, 태블릿PC, 스마트TV 등 보다 지능화 된 기기 를 이용한 서비스가 증가함에 따라 보다 편리한 건강정보서비스 에 대한 소비자 욕구 및 수요는 더욱 증가할 것으로 예상됨. 본 연구는 인터넷 상에서 신뢰할만한 건강정보를 제공하여 국민의 건강생활을 유도하고 건강증진을 촉진하기 위한 목적을 달성하기 위하여 인터넷 건강정보 평가시스템(건강정보광장) 의 운영현황과 평가를 실시하였으며, 향후 다양한 채널을 통해 수집될 수 있는 빅 데이터의 활용방안을 제시하는 것을 주목적으로 함.
4 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 2. 주요 연구결과 빅데이터 동향 및 활용방안 보건 분야의 빅데이터 국외 활용 사례로 미국 국립보건원은 다양 한 질병을 연구하기 위해 유전자 데이터를 공유 분석할 수 있는 유전자 데이터 공유를 통한 질병치료체계를 마련하여 주요 관리 대상에 해당하는 질병에 대한 관리 및 예측을 실시하고 있으며, 관리 대상에 해당하는 질병에 대한 관리 및 예측을 하고, 현재 1,700명의 유전자 정보를 아마존 클라우드에 저장하여 누구나 데이터를 이용 가능하게 구축 미국 국립보건원 산하 국립의학도서관에서는 사용자가 요구하는 다양한 약에 대한 정보를 제공하고 제조사와 사용자 간의 쌍방향 상호작용을 통해 약의 정보를 제공하는 Pillbox 프로젝트를 통한 의료개혁을 추진 미국 퇴역군인국(U.S. Department of Veterans Affairs)에서 는 퇴역군인의 전자의료기록 분석을 통한 맞춤형 의료서비스를 지원하는 빅데이터 분석을 위해 2년간 25개의 DW를 배치하여 2,200만 퇴역군인에게 의료서비스를 제공 소셜 빅데이터를 활용한 자살 및 왕따 담론 분석 자살 관련 사회이슈 발생 시 자살 관련 버즈량이 급증 - 연예인 자살 이슈 발생 시 온라인 버즈 반응은 폭발적으로 증 가하였다. 이는 연예인 등 유명인 자살 이슈 발생 시 베르테르 효과로 인해 모방 자살을 차단 할 수 있는 자살 예방 활동 강화 가 필요
요약 5 온라인 버즈 발생패턴에 따른 효율적인 자살 예방 시스템 설계가 필요 자살 예방 정책 수립에 있어서 소셜 빅데이터 분석의 활용이 강구 되어야 함. - 상시 모니터링 및 자살 Context 분석을 통한 위험 징후 대응 체계를 수립하고, 온라인 및 SNS상의 확산 URL 분석을 통해 유해 Context와 사이트 모니터링 체계 구축이 필요 최근 몇 년 사이 주요한 사회 병폐로 대두된 자살 문제에 대한 효 과적인 대응 정책 마련을 위하여 다양한 온라인 채널에서 발생하 는 자살 관련 버즈에 대한 지속적인 연구가 필요함. - 자살관련 온라인 버즈 실태 진단, 온라인 버즈 발생패턴에 따 른 효율적인 예방시스템 설계, 자살 예방 정책 수립에 있어 소 셜 빅데이터 분석의 활용이 강구되어 함. 소셜 빅데이터를 활용한 자살 및 왕따 담론 분석을 통한 예측모형 개발 2011년 1월 1일부터 2011년 12월 31일까지의 국내의 온라인 뉴스 사이트, 블로그, 카페, 소셜 네트워크 등의 인터넷을 통 해 수집된 소셜 빅데이터를 대상으로 토픽을 수집 추출하여 분석한 결과 - 일일 자살자 수가 많을수록, 음주 검색이 많을수록, 이혼율이 높을수록, 출산율이 낮을수록, 평균습도가 높을수록 성인의 자살 검색은 증가
6 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - - 일일 청소년의 자살자 수가 많을수록, 스트레스 검색이 많을수 록, 음주 검색이 많을수록, 미세 먼지량이 적을수록 청소년의 자살 검색은 증가 - 성인과 청소년의 자살 검색의 구조모형 분석결과, 두 집단 모 두 스트레스 검색에서 운동/음주/자살 검색으로 가는 경로와 자살 검색에서 자살률로 가는 대분분의 경로가 정적(+)으로 유의한 영향을 미치고 있고 스트레스 검색에서 음주 운동 자 살 검색으로 가는 경로에 청소년이 더 강하게 영향을 받고 있 으며, 음주 검색에서 자살 검색으로 가는 경로는 성인만 유의 한 영향을 미치는 것으로 나타남. 성인 청소년은 온라인상에서 자살과 관련한 담론을 주고받고 있 으며 이러한 언급이 실제적인 자살과 관련된 심리적 행동적 특성 으로 노출될 수 있기 때문에 자살 예측모형에 따른 위험징후가 예 측되면 실시간으로 개입할 수 있는 애플리케이션(가칭: 생명존중 온라인 게이트키퍼(Gate Keeper))이 개발되어져야 함. 빅데이터 프라이버시 보호방안 빅데이터의 활용에 있어서의 가장 논란이 되고 있는 것은 개인의 각종 기록 정보를 수집하여 분석함으로 해서 생길 수 있는 프라이 버시의 침해에 대한 위험성의 문제 - 이는 외부로부터의 침입에 의한 데이터의 유출의 위험성과 데 이터 취급자의 부적절한 업무처리로 인한 무의식적인 공개와 같은 잠재적 위험성, 그리고 내부자의 불법적인 열람 행위 등 에서 비롯되는 위험성을 내포
요약 7 인터넷과 사회네트워크서비스(Social Network Service)의 역 기능으로 초래될 될 수 있는 인터넷 사용자의 정신건강문제를 파 악하고, 이에 대한 관리 및 개입이 가능한 중점 부분에 초점을 두 어 인터넷 사용자의 정신건강을 측정할 수 있는 도구를 선별하여 제안하였음. - 정신건강척도로는 한국판으로 표준화한 KGHQ-20문항형을, 인터넷 중독 자가진단 척도로는 인터넷 중독 자가진단법 (Young s Internet addiction test: YIAT20) 을 사용하여 인터넷 중독에 해당하는 경우를 선별함. 2013년 8월 한국보건사회연구원에서 인터넷을 통한 설문조사를 실시하였으며, 설문에 응답한 1,214명의 자료를 분석 결과 - 척도의 신뢰도는 Cronbach s α를 통해 분석하였으며, KGHQ-20은.705, YIAT20은.948로 두 척도 모두 높은 신 뢰도를 보였으며, 두 척도간 상관관계는 통계적으로 유의한 것 으로 나타남. 건강정보광장 자료 구축 현황 2013년 건강정보광장 주요 개발 내용 구분 팝업 기능 개선 보건복지통계포털의 건강관련 통계 서비스 개발내용 - 일반 팝업을 레이어 팝업으로 개선하되 최대 2개의 레 이어 팝업이 오픈 될 수 있도록 개발 추진 - 한국보건사회연구원에서 운영하는 보건복지통계 (hawelsis.kihasa.re.kr)포얼에서 제공하고 있는 건강 관련 통계(금연, 절주, 영양, 운동, 암, 비만 등)통계를 건강정보광장 서비스 될 수 있도록 기능 추가 - 관리자 기능 구현
8 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 구분 한국보건사회연구원의 발간자료 링크 서비스 Feedback 기능 개선 데드링크 확인 및 처리 개발내용 - 한국보건사회연구원의 본원 홈페이지의 발간자료>연구 보고서, 정기간행물 등의 보건 및 건강 정책관련 연구 보고서를 건강정보광장 의 건강정책 메뉴를 시설하여 링크 서비스 기능 구현 - 관리자 기능 구현 - 건강정보광장 내 Feedback 설문 조사 상단 및 하단에 주요 SNS버튼 링크 삽입 - SNS URL을 남길 수 있는 기능 추가 - 건강정보광장 내 데드링크 확인 및 처리 2013년 건강정보광장 콘텐츠 관리운영 현황 - 건강정보광장 은 건강소식, 건강콘텐츠, 건강정책연구, 건강 교육, 건강지식검색, 의료서비스 정보, 건강App 등의 컨텐츠 를 제공하고 있으며, RSS 및 건강웹진 등의 부가서비스를 제공 - 2013년 건강정보광장 에 누적된 콘텐츠 현황은 건강뉴스 4,193건, 건강강좌 및 행사 4,440건, 건강웹진 385건, 건강 정보 11종, 환우회 정보 30종, 자가진단 134건, 건강통계 74 건, 건강정책연구보고서 87건, 건강수칙 2,263건, 전문가 칼 럼 227건, 건강동영상 938건을 누적하여 제공하고 있음. - 건강지식검색은 연령대별, 신체부위별, 건강생활정보, 질병정 보로 분류하여 서비스하고 있으며 건강생활정보는 11,670건, 질병정보는 15,558건, 신체부위별 정보는 7,948건, 연령대별 정보는 4,667건을 누적제공하고 있음. 건강정보광장 평가 정량적 평가(이용자 로그 분석)
요약 9-2013년 1월 1일부터 2013년 10월 31일까지 분석한 결과 누 적 방문 건수는 247,741건, 일일 평균 방문건수는 817건, 열 람 페이지 뷰 수는 1,499,225건, 1일 평균 열람 페이지 수는 4,947건, 방문 당 평균 열람 페이지 수는 6,05건으로 나타남 - 건강정보광장 을 이용하는 이용자들의 검색 유입 키워드로는 2012년도에는 건강정보광장, 건강정보 로 유입이 되었으나 2013년부터는 질병 명으로 건강정보광장에 유입하는 것으로 나타남. - 건강정보광장 을 이용하는 이용자들 중 국외에서 유입한 경 우가 매월 꾸준히 증가하는 것으로 나타남 정성적평가(월별 피드백 조사 및 이용실태 및 만족도 조사) - 건강정보광장 에서 제공하고 있는 건강관련 콘텐츠 및 서비 스에 대한 사용자측면의 만족도, 정보요구 및 이용자 실태를 조사 분석하여 향후 건강정보광장 운영 및 개선방안을 마련 하는데 활용하고자 실시함. - 건강정보광장의 품질 및 만족도 이용 수준을 6점 척도로 조사 한 결과 신뢰성 4.81, 유용성 4.80점, 충분성 4.76점, 만족도 4.64점, 이해용이성 4.62점, 시의성 4.52점, 주의사항 게시 정도 4.51점, 항해용이성 4.44점, 접근성 4.39점 순으로 나 타났음. - 4월부터 9월까지의 피드백 조사 결과에서도 만족도 수준을 5 점 척도로 조사한 결과 신뢰성 4.16, 내용의 유용성 4.13, 내 용의 충분성 4.08, 이해용이성 3.96, 이용용이성 3.96, 서비 스 만족도 3.86 순으로 나타났음.
10 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 3. 결론 및 시사점 보건복지 빅데이터 효율적 활용방안 보건복지영역과 빅데이터의 관계는 매우 밀접 - 보건의료 분야에서는 생애주기별로 맞춤형 보건의료서비스를 제공하기 위해서는 보건의료뿐만 아니라 사회현안이나 미래 중요이슈를 중심으로 빅데이터를 활용한 미래전망 및 정책의 사 결정모델을 도출할 필요가 있으며, 이를 위해서는 사회공동 자산인 데이터의 부가가치를 높기 위한 위험분석센터 의 설 립이 필요함. - 위험분석센터에서 질병관리 및 예측, 다양한 사용자의 질병에 대한 통계데이터를 활용하여 주요 질병의 분포 및 추세를 예측 함으로써 국가 차원의 조기대응이 가능할 것으로 판단됨. 빅데이터 프라이버시 대응방안 현행 개인정보보호 법제가 빅데이터의 활용을 저해한다는 의견이 강하게 제기되면서 개인 식별 가능성 요건을 완화하는 문제에 대한 단계적 접근을 통해 공감대를 형성해 나가갈 필요성이 있음. 분산된 개별 정보보호 법률들의 소관 부처들의 감독 및 규제 기응 을 통합 또는 일원화 할 수 있는 감독기구와 관련한 체계정비가 요구됨. 장기적인 관점에서 민간영역의 자율규제를 촉진하고 이 과정에서 형성된 법적 판단기준들을 검토하여 관련 법령을 개정할 수 있을 것으로 판단됨.
요약 11 소비자 중심 건강정보 품질향상 방안 Web3.0과 빅데이터의 등장에 따른 IT 환경 변화는 공급자 위주 의 정보제공에서 국민중심(사용자)의 정보제공으로 패러다임으 로 변화로 인터넷에서 제공되는 건강정보의 품질관리를 위한 제 도적 장치 마련이 요구됨. 단순히 웹사이트의 품질을 평가(접속용이성 등)하는 도구가 아닌 웹사이트에서 제공되는 건강정보의 이해도, 제공시점, 정보의 깊 이와 범위, 정보의 최신성, 전문성, 제공기관, 수집체계 등을 고려 한 표준화된 품질평가 기준과 절차를 마련하고 표준화된 품질평 가모형 개발과 콘텐츠 제공자 스스로가 평가할 수 있도록 표준화 된 평가 툴을 개발하여 제공되어야 함. *주요용어: 건강정보, 소비자중심 건강정보, 정신건강척도, 빅데이터, 개인정보보호방안
제1장 서론 제1절 연구의 배경 및 목적 제2절 연구목적 제3절 연구내용 및 방법
1 서론 << 제1절 연구의 배경 및 목적 최근 저출산 고령사회의 급속한 진전과 더불어 국민의 생활수준 향상 및 의학기술의 발달은 보건의료서비스에 대한 소비자의 인식변화를 가져 와 기존의 공급자 중심, 치료위주 서비스에서 환자 및 가족에 대한 예방 과 건강증진에 중점을 둔 수요자 중심의 보다 능동적 서비스로 전환되고 있다. 인터넷을 포함한 정보기술(IT)은 사회 모든 분야에서 새로운 변혁 을 일으키며 정보사회를 만들어가고 있는 가운데, 보건의료분야의 건강 관리분야에서도 정보기술 도입은 기존의 서비스를 변화시키고 새로운 서 비스가 창출되는 새로운 패러다임으로 시도되고 있다. 2012년 2월 국내 스마트폰 보급은 2,474만 명으로 매달 100만 명씩 증가하여 하반기 국 내 스마트폰 보급률은 전체인구의 79%에 달할 것으로 전망되며(방송통 신위원회 한국인터넷 진흥원, 2012) 1), 소비자 중심의 건강정보는 기존 유선 인터넷은 물론 인터넷에 기반을 둔 스마트폰, 태블릿PC, 스마트TV 등 보다 지능화 된 기기를 이용한 서비스가 증가함에 따라 보다 편리한 건강정보서비스에 대한 소비자 욕구 및 수요는 더욱 증가할 것으로 예상 된다(송태민외, 2012). 이와 같이 스마트폰, 태블릿 PC, 스마트 TV등의 이용 증가는 사회 모든 분야, 특히 실생활에 많은 영향을 끼치고 있다. 미 국 퓨리서치센터에 따르면 2013년 5월 현재 성인의 85%가 인터넷을 이 1) 2013년 7월 현재 국내 스마트폰 가입자는 3,550만명으로 전체 모바일 기기 기입자 의 65%에 달하고 있다(정보화진흥원, 2013).
16 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 용하고 있으며 그중 72%가 인터넷 상에서 건강정보를 찾고 있으며, 휴대 전화(cell phone) 사용자의 31%, 스마트폰(smartphone) 사용자의 52%가 건강과 의료정보를 모바일 기기에서 찾는 것으로 나타났다. 국내 의 건강/질병정보 획득의 주 정보원은 인터넷이 88.3%로 가장 높고, 이 중 건강정보 검색이 79.8%로 나타났다(정영철 등, 2010). 그리고 무선인 터넷을 통해 자료 및 정보 습득 중 날씨, 건강, 요리, 교통 등 생활정보 가 45.3%로 높은 비중을 처지하고 있는 것으로 나타났다(한국인터넷진 흥원, 2012). 이와 같이 다양한 모바일 매체로 검색되는 인터넷상의 건강정보는 새 로운 건강정보원으로 자리매김하고 있으나, 정보의 급증은 오히려 적절 한 정보에의 접근성을 떨어뜨리고 신뢰할 수 없는 무분별한 정보제공의 우려를 낳고 있으며, 급속한 전파속도를 가지는 모바일의 특성상 잘못된 건강정보의 모바일 유통은 걷잡을 수 없는 결과를 초래할 수 있다. 인터 넷은 언제든지 유용한 정보를 편리하게 얻을 수 있는 장점이 있지만 잘못 된 정보로 인한 폐해를 간과하지 말아야 한다. 특히 보건의료 영역에 있 어서 잘못된 정보는 인간의 생명과 건강한 삶을 위협하는 치명적인 원인 이 될 수 있다. 이러한 이유에서 건강정보에 대한 무분별한 제공 가능성 과 그에 따른 위험성을 방지하고 보다 신뢰할 만한 건강 및 질병정보 제 공에 대하여 국가 또는 공공의 개입이 필요하다. 건강정보가 무분별하게 제공될 가능성, 올바르지 못한 정보가 제공되고 활용 될 수 있는 가능성 등의 이유로 조정이 필요하다. 이에 세계 각국의 정부 또는 공공조직에서 국민들의 건강생활 및 의료 이용을 직접 또는 간접적으로 신뢰성 있는 건 강정보를 제공하고 있는 인터넷 사이트를 운영하고 있으며, 특히 인터넷 상의 건강정보 질을 평가하기 위하여 많은 노력을 기울이고 있다. 국내 주요 공공 기관의 건강정보사이트의 건강정보 서비스 현황은
제1장 서 론 17 <표 1-1>과 같이 공통적으로 건강 및 질병정보를 주요 서비스로 제공하 고 있으며, 약물정보 서비스, 자가진단 서비스. 건강 정책에 관한 법률, 건강통계, 동영상 건강 정보, 온라인 민원 서비스, 약국기관 및 약국정보, 건강 웹진을 부가적으로 제공하고 있다. 국외의 주요 공공 건강정보 사이 트의 건강정보 서비스 현황은 <표 1-2>와 같이 건강 및 질병정보, 약국 정보, 자가진단, 의학용어, 의료인 및 기관검색을 주요 서비스로 제공하 고 있으며 이들 사이트에서는 정보의 명확성을 확보하여 이용자들이 이 용함에 있어서 신뢰성을 제공하고자 노력하고 있다. <표 1-1> 국내 주요 공공 건강정보사이트 별 정보 및 서비스 제공현황 사이트명 건강/ 질병정보 약물정보 자가진단 법률/통계/ 동영상정보 온라인 민원 의료기관/ 약국정보 건강 웹진 모바일 페이지 건강iN - 공공 보건포털 건강보험 심사평가원 질병 관리본부 건강 길라잡이 국가건강 정보포털 건강 정보광장 - - - - - - - - - - -
18 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 1-2> 국외 주요 공공 건강정보사이트 별 정보 및 서비스 제공현황 사이트명 건강/질병 정보 약물정보 자가진단 백과사전 의학용어 의료인/ 기관검색 NHS Dircet - Medline Plus Health Finder HealthInsite - HON - - 건강정보광장 한편, 유무선 통신기술과 센싱기술의 발전으로 u-health 기기나 스마 트TV 등을 통하여 의사의 건강 상담 및 진료가 가능한 의료서비스를 이 용할 수 있으며 개인의 건강정보를 기록하는 전자의무기록(EHR)을 통해 환자의 건강상태를 실시간으로 관찰할 수 있게 되었다. 스마트센서들이 수집한 환자의 의료정보나 건강정보는 다양한 형태로 분석 처리되어 개인 의료정보에 저장되고 병원의 의사나 간호사 등에 전송되어 활용될 수 있 다. 최근 이러한 스마트 기기를 통해 생산되는 건강정보 관련 빅데이터의 관리와 활용에 대한 논의가 활발히 진행되고 있다. 특히, 보건의료 분야 에서는 생애주기별로 맞춤형 보건의료서비스를 제공하기 위해서는 빅데 이터를 활용하고 있으며 질병의 예측이나 자살 등 위험요인의 예측에도 활용할 수 있다. 본 연구는 인터넷 상에서 신뢰할만한 건강정보를 제공하여 국민의 건 강생활을 유도하고 건강증진을 촉진하기 위한 목적을 달성하기 위하여 인터넷 건강정보 평가시스템(건강정보광장) 의 운영현황과 평가를 실시 하였으며, 향후 다양한 채널을 통해 수집될 수 있는 빅데이터의 활용방안 을 제시하였다.
제1장 서 론 19 제2절 연구목적 본 연구는 인터넷상에서 올바른 건강정보의 활용을 유도하기 위하여 인터넷 건강정보 게이트웨이시스템(gateway system)인 건강정보광장 (www.healthpark.or.kr) 의 개발 운영을 주 내용으로 하고 있으며, 신 뢰할 수 있는 소비자 중심 건강정보서비스 제공하기 위한 빅데이터 활용 방안을 제시하는 것을 목적으로 하고 있다. 2013년도 세부목표는 다음과 같다. 첫째, 국가 또는 공공차원에 구축하여 관리하고 있는 신뢰할 수 있는 우수한 건강정보를 수요자 중심으로 연계하여 제공하는 방향을 제시 한다. 둘째, 수요자 중심의 자기 주도적 건강관리를 위한 필요 콘텐츠 및 서 비스를 규정하고 국민의 건강생활실천 및 건강증진에 기여할 수 있는 대 상자별 맞춤형 건강정보 제공을 위한 고도화 방안을 제시한다. 셋째, 사례중심 건강정보 빅데이터 분석을 통하여 건강정보 빅데이터 활용방안을 제시한다. 넷째, 인터넷 건강정보의 수집의 용이성을 증대시키기 위한 빅데이터 프라이버시 보호방안을 제시한다. 다섯째, 건강정보광장을 통하여 건강정보를 획득하는 사용자들의 건강 정보 이용실태와 수요를 조사하여 사용자 요구에 부응하는 정보를 제공 한다. 여섯째, 신뢰성 있는 건강정보를 지속적 제공하고 보건복지 빅데이터 의 효율적 활용을 위한 발전방안을 제시한다.
20 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 제3절 연구내용 및 방법 본 연구는 2013년 건강정보광장 의 구축 및 운영과 빅데이터 활용방 안에 대한 결과보고서로 총 8장으로 구성하였다. 제1장 서론 에서는 인터넷 상의 건강정보를 제공하는 국내외 건강관 련사이트의 주요 건강관련콘텐츠 및 서비스동향을 제시하고 연구목적 및 방법 등을 제시하였다. 제2장 국내외 보건복지 빅데이터 활용 현황 에서는 우리나라 보건복 지 빅데이터 동향과 국내외 빅데이터 활용사례를 문헌고찰과 전문가 자 문을 통해 살펴보았고, 우리나라와 경제적, 사회적 현상이 유사한 일본의 빅데이터 동향에 대해 현지 세미나 및 조사를 통해 알아보았다. 제3장 보건복지 빅데이터 분석사례 에서는 2011년부터 2013년 3월 까지 SNS에서 수집된 자살과 왕따 관련 빅데이터에 대한 담론 분석결과 와 수집된 소셜 빅데이터 분석을 통한 자살검색 예측모형을 개발하여 제 시하였다. 자살검색 예측모형의 개발에는 구조방정식모형과 다층모형이 사용되었다. 제4장 빅데이터 프라이버시 보호방안 에서는 빅데이터 활용에 있어 프라이버시 문제와 개인정보와 프라이버시에 대한 정의, 그리고 빅데이 터 활용에 있어서의 프라이버시 보호기술에 대해 문헌고찰 등을 통해 정 리하였다. 제5장 인터넷 사용자의 정신건강 척도개발 은 인터넷과 SNS의 역기 능으로 초래될 수 있는 인터넷 사용자의 정신건강문제를 파악하고 인터 넷 사용자의 정신건강을 측정할 수 있는 도구를 개발하였다. 척도의 개발 은 2013년 8월 한국보건사회연구에서 인터넷 설문조사을 통해 응답한 1,214명의 자료를 분석하였다.
제1장 서 론 21 제6장 건강정보광장 자료구축 에서는 건강정보광장의 추가개발 내용 (팝업기능개선, 관련 사이트와의 연계, 데드링크 처리 등) 및 시스템 구성 과 협력기관의 건강소식, 건강콘텐츠, 건강지식검색, 의료서비스 정보 등 에 대해 메타데이터 구축 현황을 정리하였다. 제7장 건강정보광장 평가 에서는 건강정보광장 을 이용하는 이용자 들을 대상으로 사이트 이용 및 콘텐츠의 만족도와 수요를 분석한 월별, 연별 온라인 설문조사의 결과와 건강정보광장 의 이용자 로그파일을 분 석하여 방문자 수와 페이지뷰를 분석하였다. 제8장 결론 및 정책제언 에서는 건강정보광장 을 운영함에 있어 문제 점을 진단하고, 보건복지 빅데이터를 효율적 활용하기 위한정책제언을 제시하였다.
제2장 국내 외 보건복지 빅데이터 활용 현황 제1절 우리나라 보건복지 빅데이터 활용현황 제2절 일본의 빅데이터 활용현황
2 국내 외 보건복지 빅데이터 활용 현황 << 제1절 우리나라 보건복지 빅데이터 활용현황 2) 1. 서론 최근 스마트폰, 스마트TV, RFID, 센서 등의 급속한 보급과 모바일 인 터넷과 소셜미디어의 확산으로 데이터량이 기하급수적으로 증가하고 데 이터의 생산, 유통, 소비 체계에 큰 변화를 주면서 데이터가 경제적 자산 이 될 수 있는 빅데이터 시대를 맞이하게 되었다. 특히, 정보통신기술 (Information Communication Technology: ICT)이 다른 산업들과 융복합되면서 방대한 양의 데이터들이 생산되고 있는 가운데 사회변화에 따른 삶의 질에 대한 욕구 및 현안해결에 빅데이터의 활용은 매우 중요한 과제로 떠오르고 있다(이성훈 이동우, 2013). 빅데이터 생산의 주된 원인 은 기존의 레거시 시스템의 성공적 구축과 함께 스마트기기의 보급으로 사용자의 위치정보와 온라인 및 모바일 사용기록과 SNS에서 사용자의 일상생활과 의견이 어딘가에 모두 저장됨에 따라 정보량이 폭증하는 것 이다. 이러한 정보량은 2012년에 연간 2.7제타바이트(2조 7천억 Giga bytes) 3) 를 넘어서고, 페이스북 가입자가 8억 명을 돌파하고, 카카오톡의 하루 전송 메시지가 10억 건, 모바일 기기 1조 대 이상, M2M 센서 20억 2) 본 절은 송태민(2013). 우리나라 보건복지 빅데이터 동향 및 활용방안. 과학기술정책 제 23권 제3호(통권 제192호), pp.56 73.'의 내용을 수정 보완함. 3) 2012년 쏟아질 데이터는 2.7제타바이트이고 매일 쏟아지는 데이터는 평균 7.7엑사바이 트로 이를 저장하려면 1테라바이트 PC용 HDD가 하루에 750만 개가 필요
26 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 대 이상 보급, 1분에 유튜브 동영상이 60시간 분량 이상 업로드됨에 따라 서 빅데이터는 폭발적으로 증가할 것으로 예측하고 있다(함유근 채승병, 2012; 윤형중, 2012). 세계 각국의 정부와 기업들은 빅데이터가 향후 국 가와 기업의 성패를 가름할 새로운 경제적 가치의 원천이 될 것으로 기대 하고 있으며, McKinsey, The Economist, Gartner 등은 빅데이터를 활용한 시장변동 예측과 신사업 발굴 등 경제적 가치창출 사례 및 효과를 제시하고 있다. The Economist(2010)는 빅데이터를 제대로 활용하면 전 세계가 직면한 환경, 에너지, 식량, 의료문제를 상당부분 해결할 것으 로 전망하고 있고, Gartner(2011)는 빅데이터가 미래 경쟁력을 좌우하 는 21세기의 원유이며, Mckinsey(2011)는 빅데이터의 활용에 따라 기 업/공공분야의 경쟁력 확보와 생산성 향상, 사업혁신/신규 사업 발굴의 차이가 생길 것이라고 보고 있다. 또한, Mckinsey(2011)는 빅데이터 활 용 시 미국 의료분야에서 연 3,000억 달러, 유럽 공공분야에서 연 2,500 억 달러의 경제적 효과가 있으며, 우리나라는 약 10.7조의 정부지출을 감 소시킬 것으로 예측하고 있다. 일본 총무성(2012)은 빅데이터의 활용이 촉진되면 부가가치의 창출이나 사회적 비용의 절감에서 총 16조 원 이상 의 경제적인 효과가 얻어질 것으로 예상하고 있다. 한편 인구 고령화와 만성질환 유병률의 증가로 의료비 문제와 의료서 비스의 접근성 및 질에 관한 문제가 논의되면서 많은 국가에서 IT와 의료 기술을 접목한 u-health 도입을 추진하여 왔다. u-health는 의료비 절 감 등의 사회경제적 비용감소 효과와 공공보건 의료서비스와 예방관리 보건 등의 사회 정책적 효과를 기대할 수 있는 가장 효과적인 대안으로 각광받고 있다. u-health의 보급은 의료분야에서 많은 변화를 가져올 것 으로 보고 있다. 유무선 통신기술과 센싱기술의 발전으로 u-health 기기 나 스마트TV 등을 통하여 의사의 건강 상담 및 진료가 가능한 의료서비
제2장 국내 외 보건복지 빅데이터 활용 현황 27 스를 이용할 수 있으며 개인의 건강정보를 기록하는 전자의무기록(EHR) 을 통해 환자의 건강상태를 실시간으로 관찰할 수 있게 되었다. u-health 서비스는 다양한 생체정보를 수집하기 위해 다양한 스마트센 서들의 네트워크가 필수적이다. 스마트센서들이 수집한 환자의 의료정보 나 건강정보는 다양한 형태로 분석 처리되어 개인의료정보에 저장되고 병 원의 의사나 간호사 등에 전송되어 활용될 수 있다. 최근 이러한 u-health 서비스를 통해 생산되는 건강정보 관련 빅데이터의 관리와 활 용에 대한 논의가 활발히 진행되고 있다. 따라서 본고에서는 빅데이터의 개념과 보건복지 분야의 빅데이터 적용사례에 대해 살펴봄으로써 보건복 지 빅데이터의 효율적 관리와 활용을 위한 방안을 제시하고자 한다. 2. 관련 연구 가. 빅데이터 개념 빅데이터(Big Data)는 Wikipedia(2013. 5. 30.)에서 기존 데이터베 이스 관리도구로 데이터를 수집 저장 관리 분석의 역량을 넘어서는 대량 의 정형 또는 비정형 데이터 세트 및 이러한 데이터로부터 가치를 추출하 고 결과를 분석하는 기술 로 정의하고 있으며, 국가정보화전략위원회에 서는 대용량 데이터를 활용, 분석하여 가치 있는 정보를 추출하고, 생성 된 지식을 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보 화 기술 이라고 정의하고 있다(국가정보화전략위원회, 2011). 삼성경제 연구소는 빅데이터란 수십에서 수천 데라바이트 정도의 거대한 크기를 갖고 여러 가지 다양한 비정형 데이터를 포함하고 있으며, 생성, 유통, 소 비가 몇 초에서 몇 시간 단위로 일어나 기존의 관리 및 분석 체계로는 감
28 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 당할 수 없을 정도의 거대한 데이터의 집합으로 대규모 데이터와 관계된 인력, 조직, 기술 및 도구(수집, 저장, 검색, 공유, 분석, 시각화 등)까지 모두 포함하는 개념 으로 정의하고 있다(함유근 채승병, 2012). 이와 같 은 정의를 살펴볼 때 빅데이터란 엄청나게 많은 데이터로 양적인 의미를 벗어나 데이터 분석과 활용을 포괄하는 개념으로 사용되고 있다. 인터넷 이 일상화된 최근 10년 사이, 인류는 디지털 데이터가 폭증하는 데이터 홍수(Data Deluge)(IDC, 2011) 현상에 직면하여 2011년 전 세계 데이 터에서 생성될 디지털 정보량이 1.8ZB(제타바이트)에 달하는 제타바이 트 시대 4) 로 진입 5) 함에 따라 빅데이터의 용어가 등장하기 시작하였다(정 지선, 2011). 빅데이터의 주요특성은 일반적으로 3V(Volume, Variety, Velocity)를 기본으로 1V(Value)나 1C(Complexity)의 특성을 추가하 여 설명하고 있다. 6) 빅데이터 4가지 구성요소는 <표 2-1>과 같다. 비즈 니스 분석 솔루션 기업인 SAS는 데이터의 가치(Value)에 중점을 두어 가 치를 창출하기 위한 비즈니스 예측 및 최적화 주제를 선정하여 빅데이터 로부터 어떤 가치 있는 정보를 얻을 것인가에 분석 관점을 가지고 있다 (김근태, 2012). 4) 1ZB(제타바이트)는 1조 GB(기가바이트)에 해당하는 양으로 미의회도서관 저장정보(235 테라바이트; 11. 4월 현재)의 4백만 배에 해당. 5) IDC(2011), Digital Universe study. 6) 정지선(2012), 성공적인 빅데이터 활용을 위한 3대요소: 자원, 기술, 인력, IT & Future Strategy, 제3호.
제2장 국내 외 보건복지 빅데이터 활용 현황 29 <표 2-1> 빅데이터의 4가지 구성요소 구분 규모(Volume)의 증가 다양성(Variety)의 증가 복잡성(Complexity)의 증가 속도(Velocity)의 증가 주요내용 기술적인 발전과 IT의 일상화가 진행되면서 해마다 디지털 정보량 이 기하급수적으로 폭증하여 제타바이트(ZB)시대로 진입 로그기록, 소셜, 위치, 소비, 현실데이터 등 데이터의 종류의 증가 와 멀티미디어 등 비정형화된 데이터 유형의 다양화 구조화되지 않은 데이터, 저장방식의 차이, 중복성 문제, 데이터의 종류 확대, 데이터 관리 및 처리의 복잡성이 심화 사물정보(센서, 모니터링), 스트리밍 정보 등 실시간 정보의 증가 로 데이터의 생성과 이동(유통) 속도가 증가, 대규모 데이터 처리 와 정보의 활용을 위한 데이터 처리 및 분석 속도가 중요 자료: 정지선(2011), 新 가치창출 엔진, 빅데이터의 새로운 가능성과 대응 전략. 나. 빅데이터 기술 정보통신기술 주도권이 인프라, 기술, SW 등에서 데이터로 이동됨에 따라 빅데이터의 역할은 분석과 추론(전망)의 방향으로 진화되어 가치창 출의 원천요소로 작용하고 있다(그림 2-1 참조). 그림 2-1 데이터의 진화단계 자료: 정지선(2011), 新 가치창출 엔진, 빅데이터의 새로운 가능성과 대응 전략. 빅데이터 기술은 생성 수집 저장 분석 표현 의 처리 전 과정을 거치면서 요구되는 개념으로 분석기술과 인프라는 <표 2>와 같다. 빅데 이터 분석기술은 통계, 데이터마이닝, 기계학습, 자연어처리, 패턴인식, 소셜네트워크 분석, 비디오 오디오 이미지 프로세싱 등이 해당된다. 빅데
30 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 이터의 활용, 분석, 처리 등을 포함하는 인프라에는 BI(Business Intelligence), DW(Data Warehouse), 클라우드 컴퓨팅, 분산데이터베 이스(NoSQL), 분산 병렬처리, 하둡(Hadoop) 7) 분산파일시스템(HDFS), MapReduce 등이 해당된다. 8)9) 그리고 다양한 데이터 소스에서 수집된 빅데이터를 처리 분석하여 지식을 추출하고 이를 기반으로 지능화된 서비 스를 제공하기 위해서는 빅데이터 플랫폼이 필요하다. 그림 2-2 빅데이터 플랫폼 자료: 황승구 외(2013), 빅데이터 플랫폼 전략, 전자신문사, p. 81. 데이터 수집에는 ETL(Extraction Transformation Loading)과 크 롤링엔진(Crawling Engine)을 사용한다. ETL은 다양한 소스시스템으 7) 하둡은 대용량 데이터 처리 분석을 위한 대규모 분산 컴퓨팅 지원 프레임워크로 하 둡 분산파일시스템(HDFS)과 분산처리를 위한 맵리듀스가 핵심요소이며 그 외 분산 DB인 Hbase, 검색엔진(Nutch), 쿼리 언어(Pig) 등을 포함한다. 8) Peter Warden(2011), Big Data Glossary, O Reilly Media. 9) 장상현(2012), 빅데이터와 스마트교육, 한국정보과학회지, 제30권 제6호(통권 제277호), pp. 59~64.
제2장 국내 외 보건복지 빅데이터 활용 현황 31 로부터 필요한 데이터를 추출하여 변환작업을 거쳐 저장하거나 분석을 담당하는 시스템으로 전송 및 적재하는 모든 과정을 포함한다. 크롤링엔 진은 로봇이 거미줄처럼 얽혀있는 인터넷 링크를 따라다니며 방문한 사 이트의 모든 페이지의 복사본을 생성함으로 문서를 수집한다. 하둡 분산 파일시스템을 이용하여 수천 대의 노드들을 연결하여 수 페타바이트급의 저장용량을 제공하고, 다이나모(Dynamo) 분산데이터 관리시스템은 데 이터를 분할하여 노드들을 배치함으로써 대용량의 데이터를 관리할 수 있다. 인메모리컴퓨팅은 데이터베이스 자체를 메모리에 올려서 입출력을 빠르게 하여 데이터의 분석과 저장, 제공을 빠르게 지원한다. <표 2-2> 빅데이터 처리 프로세스별 기술 영역 흐름 영역 개요 소스 수집 저장 처리 분석 표현 내부데이터 Database. File Management System 외부데이터 File, Multimedia Streaming 크룰링(crawling) 검색엔진의 로봇을 이용한 데이터 수집 ETL(Extraction, Transformation, Loading) 소스데이터의 추출, 전송, 변환, 적재 NoSQL Databases 비정형 데이터 관리 Storage 빅데이터 관리 Servers 초경량 서버 Map & Reduce 데이터의 추출 Processing 다중업무처리 NLP(Neuro Linguistic Programming) 자연어처리 Machine Learning 기계 학습을 통해 데이터의 패턴 발견 Serialization 데이터 건의 순서화 Visualization 데이터를 도표나 그래픽적으로 표현 Acquisition 데이터의 획득 및 재해석 자료: Pete Warden(2011), Big Data Glossary, O Reilly Media. 빅데이터 분야에서는 소셜 애널리틱스(Social Analytics) 가 페이스 북, 트위터, SNS 등에서 수집되는 비정형 데이터를 신속하게 분석을 한
32 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 다. 소셜미디어에서 정보를 뽑아내고 분석하는 방법은 크게 3가지로 나 눌 수 있다. 첫째, 텍스트마이닝(Text Mining)은 인간이 언어로 쓰인 비정형 텍스 트에서 자연어처리기술을 이용하여 유용한 정보를 추출하거나, 연계성을 파악, 분류 혹은 군집화, 요약 등 빅데이터의 숨겨진 의미 있는 정보를 발 견하는 것이다. 둘째, 오피니언마이닝(Opinion Mining)은 소셜미디어 의 텍스트 문장을 대상으로 자연어처리기술과 감성분석 기술을 적용하여 사용자의 의견을 분석하는 것으로 마케팅에서는 버즈(Buzz; 입소문)분석 이라고도 한다. 셋째, 네트워크분석(Network Analytics)은 네트워크 연 결구조와 연결강도를 분석하여 어떤 메시지가 어떤 경로를 통해 전파가 되는지, 누구에게 영향을 미칠 수 있는지를 파악하는 것이다. 빅데이터의 주요 기술로는 구글에서 개발한 비구조적 데이터의 획득, 조직화, 분석을 하기 위한 기술인 맵리듀스(Map & Reduce)가 있다. 그림 2-3 Map & Reduce 사례 (감자, 1) (가지, 1) (안데스 산맥, (감자, 1) (원산지, 1) (감자, 1) (기후, 1) (가지, 1) (감자, 5) (기후, 1) (안데스 (원산지, 1) (잡초, 1) (파종, 1) (감자, 1) (파종, 1) (감자, 1) (잡초, 1) 자료: 함유근 채승병(2012), 빅데이터 경영을 바꾸다, 삼성경제연구소, p. 81.
제2장 국내 외 보건복지 빅데이터 활용 현황 33 3. 본론 가. 보건복지 빅데이터 활용 사례 및 수요 10) 보건 분야의 빅데이터 국외 활용 사례로 미국 국립보건원은 다양한 질 병을 연구하기 위해 유전자 데이터를 공유 분석할 수 있는 유전자 데이터 공유를 통한 질병치료체계를 마련하여 주요 관리 대상에 해당하는 질병 에 대한 관리 및 예측을 실시하고 있다. 현재 1,700명의 유전자 정보를 아마존 클라우드에 저장하여 누구나 데이터를 이용 가능하게 구축하였다 (www.1000genomes.org/). 미국 국립보건원 산하 국립의학도서관에 서는 사용자가 요구하는 다양한 약에 대한 정보를 제공하고 제조사와 사 용자 간의 쌍방향 상호작용을 통해 약의 정보를 제공하는 Pillbox 프로젝 트를 통한 의료개혁을 추진하고 있다. Pillbox 서비스(pillbox.nlm.nih.gov/)로 미국 국립보건원에 접수되 는 알약의 기능이나 유효기간을 문의하는 민원 수는 100만 건 이상으로 평균 한 건당 확인하는 소요 비용 50달러를 감안하면 연간 5,000만 달러 의 비용 절감효과가 있는 것으로 전망하고 있다. 미국 퇴역군인국(U.S. Department of Veterans Affairs)에서는 퇴역군인의 전자의료기록 분 석을 통한 맞춤형 의료서비스를 지원하는 빅데이터 분석을 위해 2년간 25개의 DW를 배치하여 2,200만 퇴역군인에게 의료서비스를 제공하고 있다. 퇴역군인 전자의무기록(EHR)을 분석하여 의사가 개별 환자를 쉽게 진료할 수 있도록 지원하고 있다. 싱가포르 PA(People s Association) 는 1,800개 이상의 주민위원회 센터(커뮤니케이션 센터)에서 진행되는 10) 본 절은 일부 내용은 한국정보화진흥원(2012), 빅데이터로 진화하는 세상(Big Data 글 로벌 선진 사례) 에서 보건(건강한 사회)과 복지(안전한 사회)의 사례를 분석 재정리함.
34 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 다양한 활동들을 공유하기 위해 주민위원회센터 네트워크 기반의 맞춤형 복지사회를 구현하였다. 싱가포르 PA는 빅데이터 처리를 위하여 다양한 인종, 나이, 문화, 소득, 연령에 따른 주민의 데이터를 수집 분석하여 개인 별 맞춤형 서비스를 제공하고 있다. 캐나다 온타리오 공과대병원은 인큐베이터 내 미숙아에 대한 다양한 데이터를 분석하여 병원균 감염을 예측할 수 있는 시스템을 개발하여 미 숙아 모니터링을 통한 감염예방 및 예측, 감염징후 등을 조기에 발견하 고 다른 미숙아 등에 대한 감염을 예방하며 퇴원 후 무선센서를 이용하 여 병원 밖에서도 환자들을 실시간으로 체크를 할 수 있는 시스템을 구 축하였다. IBM과 미국 건강보험회사인 웰포인트(Wellpoint)는 의사와 다른 의 료진들이 진단과 환자치료에 이용할 수 있는 애플리케이션(왓슨)을 개발 하여 제공하고 있다. 왓슨은 임상실험 및 우수 치료사례 등 과거 데이터 를 분석하여 환자에게 가장 적절한 치료방법을 제공하고 최신 정보를 과 학적인 방법으로 제시하고 있다. 구글(Google)은 감기와 관련된 검색어 분석을 통하여 독감예보 서비스 제공하고 있다. 구글 독감예보 서비스(구 글 플루 트렌드; www.google.org/flutrends/)는 다양한 사용자의 검색 어 분석을 통하여 사용자에게 다시 유의미한 데이터로 가공하여 정확한 정보를 실시간으로 제공하고 있다. 보건 분야 국내 활용 사례로 질병관리 본부에서 운영하는 한국인체자원은행네트워크(kbn.cdc.go.kr/)는 16개 병원을 통해 36만 명의 인체자원 확보하여 질병지표 발굴 및 질병조기 진 단을 위해 활용하고 있다. 한국인체자원은행네트워크는 생명연구자원의 체계적 수집과 정보 표준화, 정보공유를 통하여 질병의 예방과 진단, 맞 춤치료, 신약-신기술을 위한 미래 바이오산업의 신 성장 동력으로서 기반 을 마련하고 있다. 분당서울대병원은 빅데이터 도입을 통해 업무효율성
제2장 국내 외 보건복지 빅데이터 활용 현황 35 및 생산성향상을 위한 임상의사결정지원시스템을 개발하였다. 임상의사 결정지원시스템은 환자 개인의 특이사항을 입력하여 임상적 의사결정을 지원하기 위한 서비스로 시스템이 도입된 후, 부적절한 용량의 신독성 약 물 처방률이 30.6%로 감소하는 효과를 가져왔다. 임상의사결정지원시스 템은 빅데이터를 분석하여 자연어 검색을 지원하고 의약품의 처방과 조 제 시 의약품 안정성과 관련된 정보를 실시간으로 제공하여 부적절한 약 물사용을 사전에 검사할 수 있도록 확대하고 있다. DNA Link (dnalink.com/)에서는 질병관리 분석과 개인의 유전체 염기서열 분석 으로 맞춤형 건강진단 서비스를 제공하는 유전자 분석시스템을 제공하 고 있다. 연세대학교의료원에서는 u-health를 이용하여 언제 어디서나 질병예방, 진단, 치료가 가능한 후(H H) 헬스케어 시스템을 제공하고 있다. 복지 분야 국외 사례로는 주로 안전과 관련한 빅데이터 활용이 주를 이 루고 있다. 싱가포르에서는 국가위험관리시스템(Risk Assessment Horizon Scanning)을 구축하여 질병, 금융위기 등 모든 국가적 위험을 수집 및 분석을 하고 있다. RAHS(hsc.gov.sg)는 2004년부터 빅데이터 를 기반으로 한 위험관리 계획을 추진하여 수집된 정보는 시뮬레이션, 시 나리오 기법을 통해 분석하여 사전 위험 예측 및 대응 방안을 모색하고 있다. FBI는 유전자 색인 시스템 활용하여 단시간 범인을 검거하는 체계 를 구축하고 있다. FBI의 유전자 정보은행 CODIS(Combined, DNA Index System)은 미제사건 용의자 및 실종자에 대한 DNA 정보 1만 3,000건을 포함하여 12만 명의 범죄자 DNA 정보가 저장되고 매년 2,200만 명의 DNA 샘플을 추가하여 범죄 수사에 활용하며 약 350만 개 의 DNA 분석표가 내장되어 있다. 샌프란시스코 경찰청은 범죄발생지역 및 시각을 예측하여 범죄를 미연에 방지하기 위한 범죄예방시스템을 구
36 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 축하였다(www.crimemapping.com). 범죄예방시스템은 과거 범죄를 분석하여 효율적으로 경찰을 배치하고 과거 범죄자 및 범죄유형을 SNS 를 통해 지속적으로 관찰함으로써 그와 관련된 조직 및 범죄에 대한 예방 을 하고 있다. 복지 분야 국내 활용현황으로는 보건복지부가 사회복지통합관리망(행 복e음)을 개발하여 수요자 중심의 복지서비스 구현하였다. 사회복지통합 관리망은 지자체 공무원들의 복지행정 처리를 지원하는 정보시스템으로 지자체에서 집행하는 120여 가지의 복지급여 및 서비스 이력 데이터를 이용하여 복지대상자 선정과 맞춤형 서비스를 제공하고 있다. 근로복지 공단은 공공부문 고객관계관리(CRM)를 구축하여 찾아가는 서비스 를 통한 맞춤형 서비스를 제공하고 있다. 한국정보화진흥원 빅데이터 국가 전략포럼 분석 팀에서는 2012년 1월부터 10월 18일까지 자살로 언급된 빅데이터 자료를 뉴스(온라인에서 게재되는 214개 웹사이트), 블로그(네 이트, 네이버, 이글루스, 다음, 티스토리, 야후), 카페(네이버, 다음, 뽐뿌, 카드고릴라, SLR 클럽), SNS(트위터, 미투데이), 게시판(네이버 지식인, 네이트 지식, 다음 신지식 등) 등에서 수집하여 청소년이 작성했다고 추 정되는 6만 9,886건을 분석하였다. 이를 통해 청소년들은 자살과 관련하 여 온라인상에 많은 Buzz를 생성하고 있으며 Buzz의 발생패턴에 따라 보다 체계적으로 대응할 수 있는 자살예방체계를 설계할 수 있다는 가능 성을 보였다. 11) 한편, 2013년 현재, 보건의료 분야 빅데이터 시범사업으로 진행 중인 과제는 다음과 같다. 첫째, 국민건강 주의예보 시범서비스 구축사업은 국 민건강공단의 건강보험 DB와 SNS 정보를 융합하여 홍역, 조류독감, 11) 한국정보화진흥원 빅데이터국가전략포럼(2012. 10. 29.), 대한민국 사회현안과 빅데이 터 전략, 제3차 빅데이터 국가전략 포럼.
제2장 국내 외 보건복지 빅데이터 활용 현황 37 SAS 등 감염별 발생 예측 모델링을 개발하고, 이를 상시 모니터링 하여 위험징후 시 주의예보 서비스를 제공한다. 둘째, 빅데이터 기반 의약품 안전성 조기경보 서비스는 유해사례 DB, 치료기록, SNS 등을 연계 분석 하여, 유의의약품을 추출하고, 이들의 위험도를 예측하여 병의원, 제약회 사 및 유관기관 등과 정보공유를 하는 사업이다. 셋째, 보건의료 빅데이 터 활용 시범사업은 포털과 질병관리본부 등과 협의된 데이터 외 병원자 체 데이터를 활용하여 독감유행 예측, 심실부정맥 예측, 입원 병상배정 최적화, 신종 마약류 인지 및 감시 서비스를 제공한다. 나. 빅데이터 분석 사례 12) 우리나라는 급격한 사회 경제적 변화 속에 자살률이 2004년부터 OECD 국가 중 최고의 수준이며, 특히 청소년계층의 자살문제가 사회적 이슈로 대두되면서 정부 차원의 대책이 시급한 실정이다. 그동안 자살의 연구는 국가 간 자살률 비교나 패널 데이터의 분석을 통한 자살 원인에 대한 연구가 진행되어 왔으나 데이터 수집의 제한으로 인하여 개인과 집 단의 다양한 자살 원인에 대한 분석은 미흡한 실정이다. 따라서 빅데이터 분석을 통하여 다양한 자살의 원인과 자살에 대한 위험징후를 예측할 수 있을 것으로 본다. 본 연구는 2011년 1월 1일 2013년 3월 31일까지 인 터넷 뉴스, 블로그, 카페, 게시판, SNS(트위터, 미투데이) 등의 온라인 채 널에서 발생한 청소년 자살 관련 온라인 Buzz(본문, 댓글 포함)를 분석 대상으로 하였다. 청소년 자살, 유명인 자살 등 자살과 관련된 사회적 이 슈 발생 시에 자살과 관련한 커뮤니케이션이 급증하는 양상을 보이고 있 으며 특히 연예인 자살 이슈 발생 시 버즈량이 급증하는 것으로 나타났다 12) 본 분석사례는 한국보건사회연구원과 (주)SK telecom이 공동으로 연구한 내용임을 밝힘.
38 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - (그림 2-4 참조). 청소년 버즈 확산의 위험도를 측정하기 위한 데이터마이닝의 의사결정 나무 분석결과 사망이혼요인이 가장 큰 확산 위험요인으로 나타났으며, 사망이혼요인의 검색이 높은 집단은 우울질병요인, 걱정얼굴요인, 폭력 요인 순으로 위험의 영향이 높은 것으로 나타났다. 그리고 사망이혼요인 이 낮은 집단은 폭력요인, (걱정얼굴요인, 수능성적요인), (고통열등감요 인, 성폭행충격요인) 순으로 위험의 영향이 높은 것으로 나타났다(그림 2-5 참조). 그림 2-4 자살 관련 버즈량 일별 추이
제2장 국내 외 보건복지 빅데이터 활용 현황 39 그림 2-5 청소년 자살 검색 확산 예측모형 다. 빅데이터 분석 방법 소셜 빅데이터 분석 절차 및 방법은 그림 2-6 과 같다. 첫째, 해당 Buzz(자살)분석 모델링을 통해 수집대상과 수집범위를 설정한 후, 대상 채널(뉴스, 블로그, 카페, 게시판, SNS 등)에서 크롤러(Crawler) 등 수집 엔진(로봇)을 이용하여 수집한다. 이때 자살 관련 키워드 그룹(원인, 유 형, 대상, 성별, 장소, 지역, 방법 등)과 자살 토픽에 대한 불용어 등을 지 정하여 수집한다. 둘째, 수집된 비정형 데이터를 분석한다. 비정형 데이 터는 Buzz 분석, 키워드 분석, 감성분석, 계정분석 등으로 진행된다. [그 림 8]의 청소년 자살Buzz 수집 사례와 같이 비정형 데이터를 연구자가 분 석하기는 수집된 상태로는 어렵다. 따라서 수집된 비정형 데이터는 Text
40 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - Mining, Opinion Mining, Network Analysis를 통하여 비정형 데이 터를 분류하는 절차가 필요하다. 셋째, 비정형 빅데이터를 정형 빅데이터 로 변환해야 한다. 자살Buzz 사례를 살펴보면, 자살Buzz 각각의 문서는 ID로 Code화 되어야 하고, Buzz 내 키워드나 방법 등도 모두 Code화 되어야 한다. 넷째, 사회현상과 연계하여 분석하기 위하여 정형화된 빅데 이터를 오프라인 통계(조사) 자료와 연계해야 한다. 오프라인 통계(조사) 자료는 대부분 정부나 공공기관에서 유료 또는 무료로 제공하고 있기 때 문에 연계대상 자료와 함께 연계 가능한 ID(일별, 월별, 연별, 지역별)를 확인한 후, 오프라인 자료를 수집하여 연계(Merge)할 수 있다. 다섯째, 오프라인 통계(조사) 자료와 연계된 정형화된 빅데이터의 분석은 요인간 의 인과관계나 시간별 변화궤적을 분석할 수 있는 구조방정식모형이나 일별(월별, 연별), 지역별 사회현상과 관련된 요인과의 관계를 분석할 수 있는 다층분석, 그리고 수집된 키워드의 분류과정을 통해 새로운 현상을 발견할 수 있는 데이터마이닝 분석을 실시할 수 있다. 그림 2-6 소셜 빅데이터 분석 절차 및 방법(자살Buzz 사례)
제2장 국내 외 보건복지 빅데이터 활용 현황 41 제2절 일본의 보건복지 빅데이터 활용현황 13) 최근 빅데이터가 주목을 받고 그 활용에 대한 기대감이 높아지게 된 것 은 종래의 데이터베이스 시스템이 단지 거대해졌기 때문이 아니다. 인터 넷과 웹이 사회전반에서 널리 보급되어 일상 생활속에서 활발하게 사용 됨에 따라 종래의 데이터베이스시스템에는 포함되지 않았던 비정형적인 구조를 가진 방대한 양의 데이터가 발생하고, 이를 폭넓고 심도있게 그리 고 신속히 분석하여 활용하는 기술이 개발 된 것이 계기가 되었다. 사회 적 또는 경제적인 문제를 해결하거나 업무의 새로운 가치를 창조하는데 있어 빅데이터가 담당할 수 있는 역할은 크게 세 가지로 꼽을 수 있다. 첫 번째는 시스템 로그 및 축적된 데이터에서 이변을 감지하여 위험의 발생 가능성과 영향도를 측정하여 위험을 방지하거나 최소화한다는 것이다. 이는 비즈니스의 분야에서뿐만 아니라 사회적 위험에도 적용할 수 있다. 두 번째는 소셜미디어에서 발생된 방대한 의견을 분석함으로써 최신 고 객의 요구와 시장동향을 파악하고 기존 사업에서의 보다 앞선 대응과 신 규 사업의 개발에 연결하는 것이다. 세 번째는 도시계획에 있어 데이터의 분석과 사회문제에 대한 시뮬레이션을 수행하여 최적의 사회환경을 실현 하는 것이다. 예를 들어 센서 데이터를 활용하여 에너지효율을 높일 수 있으며 교통상황의 실시간 분석을 바탕으로 특정지역에 대해 피크 시간 대의 교통 혼잡료를 부과함으로써 정체완화를 도모하는 것 등이다. 이러 한 점에서 빅데이터 활용의 이점은 보다 빠르고 상세하게 한층 다면적으 로 데이터를 분석함으로써 최적의 의사결정에 기여하는데 있다고 할 수 있다. 그리고 빅데이터의 의미는 지금까지 해결하지 못한 사회적 과제를 극복하고 더 나은 사회를 형성하며, 지금까지 불가능했던 것을 가능하게 13) 본 절은 송태민(2013. 10). 일본의 빅데이터 동향. 보건복지포럼 의 내용을 이기함.
42 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 함으로써 새로운 비즈니스의 기회를 낳는 것으로 그 가치를 정리할 수 있 다. 본고에서는 우리나라와 경제적, 사회적 현상이 유사한 일본의 빅데이 터 동향에 대해 알아보고 시사점을 논의코자 한다. 1. 일본의 빅데이터 가치 빅데이터 활용에 의한 효과는 다음의 3가지 면에서 크게 구분할 수 있 다. 업무의 효율화와 부가가치창출, 개인정보를 기반으로 한 시장의 창 출, 데이터 활용에 따른 새로운 ICT 기술 솔루션의 창출이다. 첫째, 빅데 이터 이용에 의한 업무 효율화와 부가가치 창출에 관해서는 헬스케어 분 야에서의 의료비 최적화, 행정 분야의 업무효율화 및 사회보장 혜택의 시 정에 의한 조세 증수, 소매분야에서의 이익 증가, 제조분야에서의 개발비 용 절감, 교통 분야에서 프로브(Probe) 교통정보 도입에 의한 정체해소 효과 등으로 약 총 10 조엔 이상이 창출되는 것으로 보고하고 있다 14) (총 무성, 2012). 둘째, 개인정보를 기반으로 한 시장의 창출로 시장규모가 전체적으로 약 1.2조 엔에 달하며 15) (일본정보처리개발협회, 2012) 그중 에서도 특히 유망한 분야가 금융 및 소매업으로 전망되고 있다. 금융 분 야의 대표적인 서비스로는 신용위험을 분산하기 위한 데이터 분석, 금융 상품의 익명화 무역정보 활용서비스 등이 있다. 또한 소매분야의 대표적 인 서비스로 효율적인 판매촉진을 위한 고객행동패턴이나 구매행동 분 석, 실제매장의 POS정보를 가상점포 소매업에 제공 등의 서비스이다. 셋 째, 빅데이터 활용에 따른 새로운 ICT 기술 솔루션 창출에 관해서는 데이 터 수집과 관련된 M2M (Machine to Machine), 정보관리와 관련한 클 14) 総 務 省 2012 平 成 24 年 度 版 年 度 版 情 報 通 信 白 書 15) 独 立 行 政 法 人 情 報 処 理 推 進 機 構 (2012, 8), くらしと 経 済 の 基 盤 としてのITを 考 える 研 究 会 報 告 書, つながるITがもたらす 豊 かなくらしと 経 済, p.26.
제2장 국내 외 보건복지 빅데이터 활용 현황 43 라우드 서비스, 스토리지 소프트웨어, 데이터 분석과 관련한 비즈니스 인 텔리전스툴과 같은 사업에서 2020 년까지 약 5.4조원의 사업규모가 될 것으로 예상하고 있다(총무성, 2012). 이와 같이 일본의 빅데이터의 활용 이 촉진되면 부가가치의 창출이나 사회적 비용의 절감에서 총 16조원 이 상의 경제적인 효과가 얻어질 것으로 예상되어 기대가 모아지고 있다. 세 계에서 일본의 국내 총 생산이 점유하는 비율이 오랜 기간 하락하고 있는 상황에서 빅데이터의 활용은 일본의 경제성장의 기폭제가 될 수 있다고 해도 과언이 아니다. McKinsey Global Institute (2011) 16) 에 따르면 일본의 정보축적량은 북미의 약 9 분의1, 유럽의 약 5분의1 수준이다. ICT 기업경영 측면에서의 활용은 일본은 세계 주요국에 비해 뒤처지고 있는 실정이지만, 향후 방대한 데이터를 최대한 활용해 나가는 것은 상기 의 추산에서 보는 바와 같이 상당한 경제적인 가치를 낳는다는 점에서 유 익하다고 할 수 있다. 또한 일본은 현재 세계에 유례가 드문 저출산과 초 고령화 사회로 진입하고 있고 동시에 다양한 사회문제들도 가지고 있어 앞으로 변화가 없이는 더 이상 지속가능한 사회를 유지할 수 없는 상황에 몰려있다. 이러한 상황에서 비약적으로 증가하는 정보를 충분히 활용하 는 것이야 말로 혁신 창출과 그에 따른 사회적 문제해결에 크게 기여하게 될 것이라 보인다. 따라서 사회구조 개혁을 위한 빅데이터 활용방안을 조 속히 검토해 나가고 있다. 16) McKinsey Global Institute( 2011), Big Data: The Next Frontier for Innovation, for Innovation, Competition, and Productivity, McKinsey Inc.
44 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 2. 일본의 빅데이터 기술 동향 가. 대규모 처리에 있어서의 이론적 기술 빅데이터의 대규모 처리를 지원하는데 있어서 현재의 WSC (Warehouse Scale Computer)을 가지고 지금까지의 계산 모델과 같이 각 계산의 순간, 순간에서 일체의 일관성을 유지하고 엄밀하게 처리하는 방식으로는 빠른 주기로 시스템의 스케일을 확장시켜 나갈 수가 없다. 따 라서 이를 보완하는 이론으로 CAP정리, 에러망각형컴퓨팅(Failure-oblivious Computing), 결과적 일관성(Eventual Consistency) 등의 기 술이 논의되고 있다. CAP정리는 버클리 대학의 Eric Brewer 교수가 Inktomi의 운영에서 얻은 경험과 통찰력을 바탕으로 얻어진 이론으로, 높은 확장성을 가진 분산컴퓨팅 시스템을 만들기 위해 시스템 요건의 균 형을 찾는데 적용되는 정리이다. CAP은 모든 노드에서 동시에 동일한 데이터를 볼 수 있게 하는 데이터 무결성(Consistency), 장애가 발생한 노드가 다른 정상 노드의 기능에 영향을 주지 않는 시스템가용성 (Availability), 그리고 통신장애 등에 의해 일부 메시지가 손실되더라도 시스템은 정상작동을 해야 하는 네트워크분단 허용성( tolerance to network Partitions)을 의미하는 것이다. 상기의 세 가지의 모두를 보장 하는 것은 불가능하며 이중 어느 두 가지에 중점을 두고 시스템을 설계하 느냐가 중요하다는 것이다. 이 법칙의 예로 네트워크 분단에 대한 허용성 (P)을 고려하지 않는 시스템으로서의 클러스터 데이터베이스, 가용성(A) 을 고려하지 않는 시스템으로서의 분산데이터베이스, 일관성(C)을 고려 하지 않는 시스템으로서의 DNS를 들고 있다. 에러망각형컴퓨팅 (Failure-oblivious Computing)은 MIT의 Martin Rinard 교수 등이
제2장 국내 외 보건복지 빅데이터 활용 현황 45 OSDI (Operating Systems Design and Implementation)의 학회에 서 2004 년에 발표한 서버의 가용성을 높이는 개념으로, 일반적으로 오 류가 발생하면 데이터 처리를 도중에 중단시키지만 에러망각형컴퓨팅에 서는 처리의 불일치가 발생해도 그 로그 만 남기고 처리를 계속한다. 이 렇게 하면 서버의 가용성을 높일 수 있을 뿐만이 아니라 서버가 공격을 받고 있는 상황에서는 공격자들이 예상한 오류의 반응을 서버가 보여주 지 않음으로 해서 보안능력도 향상 할 수 있다. 대규모 데이터처리에 있 어서 오류처리를 사후에 실시하여 전체 시스템의 효율성을 유지하는데 중요함을 보여주고 있다. 결과적 일관성(Eventual Consistency)은 시스 템 전체에 걸쳐 엄밀하게 일관성을 요구하는 것이 아니라 결과적으로 일 관성이 유지되면 되는 데이터에 대해 일관성을 유지하는 모델이다. 많은 관계 데이터베이스에서는 데이터의 무결성을 보장하기 위해 중간 무결성 을 유지하기 위한 제약조건이 있다. 그러나 대규모 데이터처리의 서비스 에서는 모든 상태에서 일관성을 가지도록 하면 시스템의 확장이 어려워 진다. 따라서 DNS와 같이 중간 상태에서 일관성이 결여되어도 결과적으 로 유용한 상태가 되면 유용하다고 보는 것이다. 나. 하드웨어와 소프트웨어 기술 빅데이터를 처리하기 위해서는 WSC (Warehouse Scale Computer) 규모의 하드웨어시스템이 필요하며, CPU 대수와 저장용량이 대규모로 커짐으로 해서 지금까지 드러나지 않았던 전력문제와 신뢰성의 문제가 표면화되게 된다. 네트워크에 대해서도 대용량 전송이 요구되지만, 빅데 이터 수준의 것을 간단히 전송하기는 쉬운일이 아니다. 첫째, CPU 처리 능력으로 2010년 현재 Google의 SOCC (Symposium of Cloud
46 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - Computing) 데이터처리 용량은 하루 24 페타바이트 정도로 보고 있다 (Google, 2010). 현재 생성되는 데이터의 80%가 영상이미지이거나 센 서 등에서 수집되는 것이라 보고 있어 이러한 비정형 데이터의 변환이 필 요하며, 빅데이터의 특성에 따른 빠른 컴퓨팅 기술 필요하다. 둘째, 스토 리지 능력으로 빅데이터를 유지하기 위해 스토리지는 전체 용량도 중요 하지만 견고성과 가용성이 중요하다. 여기에는 하드웨어 장애뿐만이 아 니라 네트워크 장애로 인한 지역 분단 등에 대해 글로벌한 대처가 필요하 다. 소프트웨어 이중화는 파일시스템 등의 기술로 이루어지고 있지만, 지 리적 분산에 의한 견고성과 가용성은 하드웨어(데이터센터) 수준에서 이 루어지고 있다. 셋째, 데이터 전송능력으로 빅데이터를 수집하기 위해 인 터넷을 사용하는 것은 필수가 되고 있다. 인터넷 자체는 공유 인프라로서 어느 기업이나 국가가 독점하는 것이 아니지만, 2010년의 시점에 인터넷 트래픽의 최대 12%가 YouTube를 포함한 Google사의 것으로 보고되 고 있다. 인터넷에서 대용량의 데이터를 수집하고 있는 것은 사실이지만, 인터넷은 그 구조상 하나의 사이트에서 대량의 데이터를 보내는 데는 적 합하지 않다. 넷째, 소프트웨어 아키텍처 기술능력으로 빅데이터를 처리 하는 소프트웨어는 요구되는 처리의 특성을 살리면서, 데이터웨어하우스 규모의 컴퓨터를 충분히 활용할 수 있는 형태로 구성되어 있다. 구조화되 지 않은 데이터가 검색되도록 처리하는 과정을 나타낸다. 여기에는 대용 량 데이터를 지원하는 분산스토리지 시스템, 데이터처리를 담당하는 소 프트웨어 프레임워크인 MapReduce, 데이터 검색을 다루기 위한 NoSQL 데이터베이스가 포함되어 있다(그림 2-7 참조). 다섯째, 비 구조화 데이터를 구조화 데이터로 바꾸는 기술 능력으로, 빅데이터에는 매출정보와 고객정보 등과 같이 정형화된 포맷에 따라 표 형식으로 집약된 구조화 데이터와 자연적인 문장의 텍스트, 영상 이미지
제2장 국내 외 보건복지 빅데이터 활용 현황 47 및 음향 등 비구조화 데이터가 있다. 일반적으로 빅데이터의 80%는 비 정형데이터로 추정되고 있으며, 이러한 다양한 형태의 데이터를 구조화 된 데이터로 바꾸는데 있어 음성인식, 로그분석기술, 네트워크기술, 패턴 인식기술, 그리고 데이터마이닝의 기술이 주목을 받고 있다. 그림 2-7 소프트웨어와 아키텍쳐 마지막으로 보안기술 능력으로 악의를 가진 공격자가 공개된 정보에서 개인정보를 추론하는 것을 방지하는 기술인 PPDM(Privacy Preserving Data Mining) 혹은 PPDP(Privacy-Preserving Data Publishing)이 최근 활발히 연구되고 있다. 여기서는 사용자의 의도하지 않은 암호의 노 출 문제와 정보의 유출, 손실, 삭제오류 등과 같이 시스템의 입장에서의 보안문제를 다룬다. 암호의 노출문제에 있어서는 빅데이터 환경에서 인 터넷에 올려 진 데이터는 무엇이든 기본적으로 아무에게나 사용되어질 수 있다고 볼 수 있다. 웹에 올라온 모든 데이터를 저장하는 기술도 개발 되고 있어, 일단 공개된 정보는 영원히 어딘가에 남아 있을 위험이 있다. 따라서 중요한 데이터를 은닉하는 기술의 요구는 지속적으로 증가하고 있다. 데이터를 은닉하는 경우에도 여기에 사용되는 암호의 강도에 주의
48 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 할 필요가 있다. 일본 국내의 전자정부에서 권장하는 암호의 안전성을 평 가하는 CRYPTREC는 슈퍼컴퓨터의 성능향상과 암호노출의 관계를 나 타낸 그래프를 공개하고, 1024 비트 RSA의 소인수 분해 문제는 2015 년 에서 2020 년경에 풀릴 것으로 예측하고 있다. 따라서 암호 키를 2048 비트 방식으로 변경하기를 권장하고 있지만, 컴퓨팅리소스에 제한이 있 는 기기에서는 사용하기 어려운 것이 실상이다. 서버로 부터의 정보유출 은 오래된 중요한 문제이지만 여전히 해결되지 않고 있다. 특히 관리자에 의한 악의적인 유출은 방지가 어렵다. 보안에 대해 매우 엄격한 것으로 여겨지고 있는 Google 에서도 2010년 간부 엔지니어가 Gmail 의 내용 을 도청하여 악용한 사건이 발생했다. 또한 악의가 없다하더라도 설정 실 수나 버그에 의한 정보유출의 우려도 있다. 정보손실은 본래 저장되어 있 어야 할 데이터가 서버에서 사라지는 문제이다. 이 사례로는 개인정보를 기억하는 서비스의 Evernote 에서 6,323 명의 신규로 편집한 데이터가 손실된 사건이 있었다. 이것은 1 대의 서버에서 발생한 장애가 원인인 것 으로 보고되었다. 삭제오류는 정보손실의 반대로 사용자가 데이터를 삭 제했음에도 불구하고 서버에 남아 있는 문제이다. 예를 들어 Facebook 이나 Google+에서 사용자가 이미지 데이터를 지웠음에도 불구하고, 서 버에서 사라지지 않아 문제가 지적되었다. 이러한 이미지 데이터는 보통 의 URL로 누구나 접근할 수 있다는 더 큰 문제의 소지가 있는 것이다. 이 러한 문제로 인하여 정보유출, 손실, 삭제오류는 시스템 장애, 소프트웨 어 버그 또는 관리자나 사용자의 악의적인 행위에 의해 여러 형태로 발생 하기 때문에 현재로서 근본적인 해결방법이 없어 제 삼자 기관의 감사에 의한 지적과 각종 보안정보를 수집하고 문제가 있으면 대처해 가는 평소 의 관리가 매우 중요하다.
제2장 국내 외 보건복지 빅데이터 활용 현황 49 3. 일본의 빅데이터 추진전략 일본 정부의 빅데이터 추진전략은 2013년 6월 고도 정보통신 네트워 크 사회추진 전략본부(약칭 IT종합전략본부(본부장: 수상))가 발표한 세계 최첨단 IT 국가 창조 선언 (이하 창조적 선언 )의 공정표에 잘 나 타나 있다. IT종합 전략 본부는 IT 정보자원을 활용하여 미래를 창조하 는 국가비전으로서 창조적 선언 (2013년6 월14일 내각 결정)을 수립했 다. 이 선언에는 향후 2020년까지 세계 최고수준의 IT활용 사회를 실현 하는 것을 목표로 1 혁신적인 신산업 신서비스의 창출과 전체 산업의 성장을 촉진하는 사회의 실현, 2 국민이 건강하고 안심하고 쾌적하게 생활하는 세계에서 가장 안전하고 재해에 강한 사회의 실현, 3 공공서 비스를 누구나 언제 어디서나 원스톱으로 받을 수 있는 사회의 실현의 3 항목에 대한 지향해야 할 사회모습을 제시하였다. 이 공정표는 어느 부 처가 언제까지 구체적으로 무엇을 실시하는지를 밝히고, 각 부처 간 연 계가 필요한 시책에 대해서는 개별 역할분담과 달성해야 할 사항을 명확 히 하여 꾸준히 구체적인 성과로 연결시키는 것을 목적으로 책정한 것이 다. 공정표에는 창조적 선언 에 나타난 전략과 목표에 대해 단기, 중기, 장기로 나누어 각 부처가 실시할 시책이 명시되어 있다. 오픈데이터 빅 데이터의 활용의 추진 시책은 상기의 첫째 목표인 혁신적인 신산업 신 서비스의 창출과 전체 산업의 성장을 촉진하는 사회의 실현 의 실현사항 으로 제시되어있으며, 다음은 단기, 중기, 장기별로 나누어 추진할 계획 이다.
50 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 2-3> 단기계획 (2013년도~2015년) 계획 제도정비 활용촉진 인재육성 기술개발 세부계획 - 개인 데이터의 취급에 대해 IT종합 전략 본부 아래에 새로운 검토조직을 설치(6 월중)하고 검토를 시작한다(내각관방). - 개인정보 및 프라이버시 보호를 배려한 개인 데이터의 활용규칙을 명확히 한 후, 개인정보보호 가이드라인의 재검토 동의의 취득 절차의 표준화 등 의 작업을 연내의 가능한 빠른 시기에 착수하고 2015 년말 까지의 검토 를 바탕으로 필요에 따라 개인정보보호 가이드라인의 검토 및 동의 취득절 차의 표준화 등을 실시한다(내각관방). - 규제개혁 실시계획에 따라 소비자청은 빅데이터의 이용에 참고를 목적으로 개인정보보호법에 대해 자주 묻는 질문과 답변(Q & A) 의 개정을 2013 년 상반기에 실시한다. 또한 내각관방과 소비자청은 협력하여 합리적인 익 명화조치의 내용을 명확하게 한 가이드라인을 2014년 상반기에 수립한다. 개인정보보호법의 사업 등 분야별 가이드라인등 소관부처는 합리적인 익명 화조치의 내용 사업등 분야별 가이드라인 등을 2014년 중에 명확히 제시 한다(내각관방, 소비자청, 사업분야별 가이드라인의 소관부처). - 제 삼자기관의 설치를 포함하여 새로운 법적 조치도 염두에 둔 제도 재검 토의 방침을 연내에 수립하고, 제도 재검토의 방침에 따라 국제적인 협력 도 배려하면서 각 시책을 실시한다(내각관방, 관계부처). - (선행적 조치의 추진) 선행적으로 규정이 책정된 스마트폰의 이용자 정보 의취급분야에 대해 관계부처, 업계단체, 사업자가 함께 규정의 보급을 추 진한다. 또한 2국가 간 혹은 다 국가 간의 회합의 기회를 활용하여 국제적 인 정보공유와 협력을 추진한다(총무성, 관계부처). - 빅데이터를 활용한 새로운 비즈니스의 창업에 대한 지원을 실시하여 민간 부문에 있어서의 새로운 부가가치 창출을 추진한다(총무성, 경제산업성) - 각 분야 (지역활성화, 대중교통, 방재, 의료 건강, 에너지 등)의 실증 프로 젝트 등을 통하여 빅데이터의 활용을 검토하고 새로운 부가가치의 창출을 위한 지식을 얻는다(내각관방, 내각부, 총무성, 후생노동성, 농림수산성, 경제산업성, 국토교통성, 문부과학성) - 새로운 서비스, 새로운 사업전략 입안과 신기술의 창출에 빅데이터를 활용 할 수 있는 인재(데이터 사이언티스트 등)의 육성에 착수한다(문부과학성). - 빅데이터의 활용을 촉진하기 위해 데이터와 네트워크의 안전성 신뢰성 향상 및 상호운용성 확보, 대규모 데이터의 축적 처리기술의 고도화 등 공통기 술의 조기 확립을 도모함과 동시에 새로운 비즈니스 새로운 서비스의 창출 로 이어지는 새로운 데이터 활용기술의 연구개발과 그 활용을 추진한다. - 구체적으로는 빅데이터의 활용기술 (수집, 전송, 처리, 활용 분석 등)에대 한 각 부처의 역할을 명확히하고 나아가 각 부처가 연계하여 다른 목적으 로 수집된 다양한 데이터에서 유용한 정보 지식을 실시간으로 추출할 수 있는 기초 기술, 광통신 기술(400Gbps 급) 네트워크 가상화 기술 등의 연구개발을 실시함과 동시에 정보를 유통 순환시켜, 분야의 경계를 넘어서 정보가 활용됨으로써, 신사업 신서비스의 창출을 촉진한다(총무성, 문부 과학성, 경제산업성). 자료: 高 度 情 報 通 信 ネットワーク 社 会 推 進 戦 略 本 部, 世 界 最 先 端 IT 国 家 創 造 宣 言 工 程 表
제2장 국내 외 보건복지 빅데이터 활용 현황 51 <표 2-4> 중기계획(2016년도~2018년도) 계획 제도정비 활용촉진 인재육성 기술개발 세부계획 - 퍼스널 데이터의 활용 규정을 바탕으로 한 검토에 따라 필요에 의해 개인 보보호가이드라인을 수정하고 동의 취득 절차의 표준화 등을 실시한다(내 각관방, 소비자청, 사업 분야별 가이드라인의 소관부처) - IT종합 전략본부 아래에 설치된 새로운 검토 조직에서 정리된 제도 재검토 방침에 따라 국제협력도 배려하면서 각 시책을 실시한다(내각관방, 관계부처). - 빅데이터를 활용한 새로운 비즈니스의 창업에 대한 지원을 실시하여 민간 부문에 있어서의 새로운 부가가치 창출을 추진한다(총무성, 경제산업성). - 각 분야 (지역활성화, 대중교통, 방재, 의료 건강, 에너지 등)의 실증 프로젝 트 등을 통하여 빅데이터의 활용을 검토하고 새로운 부가가치의 창출을 위 한 지식을 얻는다. (내각관방, 내각부, 총무성, 후생노동성, 농림수산성, 경 제산업성, 국토교통성, 문부과학성). - 새로운 서비스, 새로운 사업전략 입안과 신기술의 창출에 빅데이터를 활용 할 수 있는 인재(데이터 사이언티스트 등)의 육성에 착수한다(문부과학성). - 빅데이터의 활용을 촉진하기 위해데 데이터와 네트워크의 안전성 신뢰성 향 상 및 상호운용성 확보, 대규모 데이터의 축적 처리기술의 고도화 등 공통 기술의 조기확립을 도모함과 동시에 새로운 비즈니스 새로운 서비스의 창출 로 이어지는 새로운 데이터 활용기술의 연구개발과 그 활용을 추진한다. - 구체적으로는 데이터 활용 기술 (수집 전송, 처리, 활용 분석 등)에 대한 각 부처의 역할을 명확히 하고 나아가 각 부처가 연계하여 다른 목적으로 수집된 다양한 데이터에서 유용한 정보 지식을 실시간으로 추출할 수 있 는 응용 기술을 확립하고 구축된 기술의 시장전개를 도모하면서 국제표준 화 기구에 제안하여 일본의 개발 기술확립을 추진함과 동시에 정보를 유통 순환시켜, 분야의 경계를 넘어서 정보가 활용됨으로써, 신사업 신서비스 의 창출을 촉진한다(총무성, 문부과학성, 경제산업) 자료: 高 度 情 報 通 信 ネットワーク 社 会 推 進 戦 略 本 部, 世 界 最 先 端 IT 国 家 創 造 宣 言 工 程 表 <표 2-5> 장기계획(2019년도~2021년도) 계획 제도정비 활용촉진 세부계획 - IT종합 전략본부 아래에 설치된 새로운 검토 조직에서 정리된 제도 재검토의 방침에 따라 국제협력도 배려하면서 각 시책을 실시한다(내각관방, 관계부처). - 각 분야 (지역 활성화, 대중교통, 방재, 의료 건강, 에너지 등)의 실증 프로젝 젝트 등의 성과를 살려, 새로운 서비스의 창출을 촉진한다(내각관방, 내각 부, 총무성, 후생노동성, 농림수산성, 경제산업성, 국토교통성, 문부과학성).
52 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 계획 인재육성 기술개발 세부계획 - 새로운 서비스, 새로운 사업전략 입안과 신기술의 창출에 빅데이터를 활용 할수 있는 인재(데이터 사이언티스트 등)의 육성에 착수한다(문부과학성). - 빅데이터의 활용을 촉진하기 위해 데이터 및 네트워크의 안전성 신뢰성 향 상 및 상호운용성 확보, 대규모 데이터의 축적 처리기술의 고도화 등 공통 기술의 조기 확립을 도모함과 동시에 새로운 비즈니스 새로운 서비스의 창 출로 이어지는 새로운 데이터 활용기술의 연구개발 및 그 활용을 추진한다. - 구체적으로는 데이터 활용기술(수집 전송, 처리, 활용 분석 등)에 대한 각 부처의 역할을 명확히하고 나아가 각 부처가 연계하여 다른 목적으로 수집된 다양한 데이터에서 유용한 정보 지식을 실시간으로 추출할 수 있는 기술을 실용화하고, 정보를 유통 순환시켜, 분야의 경계를 넘어 정보가 활용됨으로 써, 신사업 신서비스의 창출을 촉진한다(총무성, 문부과학성, 경제산업성) 자료: 高 度 情 報 通 信 ネットワーク 社 会 推 進 戦 略 本 部, 世 界 最 先 端 IT 国 家 創 造 宣 言 工 程 表 4. 일본의 빅데이터 활용 사례 및 동향 가. 일본의 빅데이터 활용 사례 혼다자동차를 생산하는 혼다기연공업은 드라이버의 쾌적한 카라이프 를 실현하기 위한 드라이브 정보 네트워크로서 internavi 서비스를 2002년부터 제공하고 있다. 안전, 안심, 방재, 날씨, 연료절약 루트 등의 정보를 제공하여 2012년 5월 현재 회원수 145만명을 확보하고 있다. 이 서비스는 2003 년회원으로 부터 매 5분 간격으로 수집된 장착차량의 주 행데이터 (Floating Car Data : FCD)를 공유함으로써 교통체증을 피하 고 목적지까지 보다 빠른 경로를 안내하는 Floating car system 을 도 입하고 있다. 이를 통해 주요 간선을 대상으로 하는 VICS (Vehicle Information & Communication System)가 보완되고 있으며 현재 매 월 1억 km의 데이터가 업로드 되어, 2012년 5월말 현재 누적 주행데이 터는 25억 km에 달한다. 본 시스템의 효과로는 1 VICS와 FCD을 융합한 정체예측의 효과를
제2장 국내 외 보건복지 빅데이터 활용 현황 53 검증한 결과, 동경-오사카 간의 고속도로의 100샘플의 시뮬레이션에서 약 20%의 빠른 경로를 안내하고, CO2로 환산하여 약 16%의 절감효과 가 있었다. 2 사이타마현의 도로관리 행정업무에 정보를 제공하여, FCD 로 부터 급브레이크의 다발지점을 추출하여 그 지점에서의 가로수 정리 와 도로면의 표식을 정비함으로써 급브레이크횟수가 약 70% 감소되었 다. 3 2006년의 NPO법인 방위추진 기구의 연구에 협력하여 2007년 니 가타현의 나카고에서 발생한 지진, 2008년 이와테미야기 내륙의 지진에 서 FCD을 활용한 통행실적 맵이 작성되어 공개되었다. 2011년 3월 동일 본대지진에서 동일한 맵을 다음날 아침에 공개함과 동시에 Google과 NPO 법인 ITS-Japan을 비롯한 각종 행정기관이나 연구기관에 제공하 여 활용되었다. 4 목적지의 주행경로에 대해 일본 기상협회에서 제공되 는 동결예측 등의 기상정보와 연계하여 노면 동결 발생의 예측시간과 예 측시점 등을 자동차 내비게이션 화면에 표시하고 음성경고 등으로 기상 재해 방지정보를 제공하고 있다. 동일본 철도회사(JR East Japan)의 자판기 활용사례에는 동일본 철도 회사의 자회사인 JR 동일본 워터 비즈니스 사가 2010년 8월부터 전개 하고 있는 청량음료의 자동판매기에는 보통 상품 견본을 두는 곳에 대형 디스플레이를 설치하여 제품 정보 광고 등의 다양한 정보를 제공하고 있 다. 이 자판기의 흥미로운 점은 디스플레이의 바로 위에 카메라를 갖추고 자판기 앞에 서 있는 손님의 외모를 인식하는 기능을 가지고 있다는 점이 다. 카메라의 이미지를 분석하여 성별, 연령을 추측하고, 그날의 기온이 나 날씨에 따라 상품을 추천한다. 자료에 따르면 10대 이하에서 60대 이 상까지 연령대와 성별의 14패턴의 특성을 판별하는 것으로 되어 있다. 기상 정보 서비스의 활용사례에서는 모바일 단말을 가진 사용자가 실 제 공간에 일어나는 상황을 위치정보와 함께 발신함으로써 이용자 자신
54 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 이 센서 로서의 역할을 할 수 있다. 하드웨어 센서를 여러 곳에 설치한다 는 것은 유지보수에 큰 비용이 들며, 그렇다고 필요에 따라 인원을 파견 하여 수동으로 상황과 시간장소를 기록하게 하는 것은 비용과 효율 면에 서 더욱 현실적이지 못하다. 서비스 이용자가 자신의 위치에서 어느 순간 의 사진을 시간과 장소 정보와 함께 제공한다면 센서 에서 획득한 정보 이상으로 매우 유용하게 이용될 수 있을 것이다. 이용자가 발신한 정보를 활용하고 있는 예로는 웨더뉴스(http://weathernews.jp/gensai/)가 제공하는 기상 콘텐츠가 있다. 서비스 이용자가 웨더리포터 가 되어 자 신의 위치에서 사진을 찍어 위치 정보와 함께 코멘트를 전송하면 홈페이 지의 지도상에 게시되어 실시간의 기상정보가 표시되는 것이다. 현재 웨 더리포터는 유료회원 중에서 30만 명으로 구성되어 있으며, 그 중에서 특 히 8만 명이 게릴라 뇌우 방어대원 으로 활동하고 있다. 이용자가 보내 온 정보에는 사진과 함께 습한 바람이 불기 시작했다 라든가 혹은 갑자 기 비구름이 몰려오고 있다 라든가 혹은 체감온도 와 같이 인간의 오감 으로 느낀 정보가 코멘트로 들어 있어 종래의 관측에서 얻어 내기 어려운 내용까지 실시간으로 제공되고 있다. 특히 예측이 어려운 게릴라성 폭우 정보의 제공에 효과를 발휘하여, 도쿄에서는 90% 이상의 확률로 게릴라 성 폭우가 발생되기 42.4분 전에 회원들에게 메일로 전달되고 있다. 이렇 게 하여 얻어진 데이터는 방재 데이터베이스에 축적되고 있다. 리포터의 리포터 작성은 1일 3 회까지 제한되어 있으며, 리포터가 제공한 과거 정 보를 리포터 단위로 정리해서 볼 수 없도록 하여 이용자가 특정 리포터의 이동을 추적할 수 없게 했다. 리포터는 유료회원이며 서비스 공급자 측면 에서는 동일인물로 식별되고 있지만, 이용자 간에는 공개하지 않고 링크 가 불가능한 상태로 하여 데이터의 식별과 익명성을 양립하여 프라이버 시를 보호하고 있다.
제2장 국내 외 보건복지 빅데이터 활용 현황 55 그림 2-8 웨더 리포트(http://weathernews.jp/report) 나. 일본의 빅데이터 이용 동향 일본 국내에서의 빅데이터 이용은 크게 IT 벤더에 의한 서비스, 플랫폼 사업자에 의한 서비스, 자사 내에서의 데이터 이용, 데이터분석 지원, 데 이터의 사외에서의 2차이용으로 대분하고 있다. (1) IT 벤더에 의한 서비스 국내외를 막론하고 모든 IT업체가 빅데이터의 활용과 지원서비스에 주 력하고 있다. 미국의 IT벤더는 2009년 이후 빅데이터 관련 기업을 인수 합병하거나 제품과 서비스를 계속해서 투입하고 있다. 일본 국내에서도
56 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 2010년 이후 주요 IT사업자가 Hadoop의 인테그레이션 사업을 전개하 고 있고, 복합 이벤트처리 기술과 강화된 탐색 기술의 개발에 경쟁을 벌 이고 있다. <표 2-6> IT 벤더에 의한 서비스 이용 동향 회사명 시기 주요시책 히타치제작소 일본IBM NEC 일본HP 후지쯔 NTT데이터 2011년11월 2011년11월 2011년11월 2011년12월 2012년1월 2012 년1월 클라우드 컴퓨팅사업 HarmoniousCloud 서비스에 빅데이터 활용 서비스 와 스마트 인프라 서비스 의 서 비스 메뉴를 추가했다. 일본기업의 글로벌 진출과 현지 비즈니스 강화를 지원 하기 위해,고객의 방대한 정보를 경영전략에 활용하기 위한 기반을 제공하는 클라우드 서비스를 개시했다. 분 석대상은 중국어, 영어, 스페인어, 불어, 독일어 등 11 개 언어에 대응 센서 등에서 수집 빅데이터를 실시간으로 분석하여 사 용자에게제공함과 동시에 분석 시스템에서 사용하는 분산 스토리지의 소비전력을 기존대비 2/3로 줄일 빅 데이터 처리 기반기술을 개발 했다. 기업의 빅데이터 활용을 위한 IT 인프라 구축을 지원 하는 솔루션인 HPHadoopHBase서비스 를 발표했다. 이 솔루션은 Hadoop 에 각종 서비스를 원스톱으로 제공한다. 빅데이터를 활용하기 위한 기반 클라우드서비스인 데 이터활용기반 서비스 를 제공하기 시작했다. 대량의 센 싱 데이터를 수집, 축적, 통합하고 실시간으로 처리하 고 일괄처리에 의한 장래예측등을 실시하는 정보관리 통합서비스, 통신제어 서비스 등을 제공한다. 비 정형데이터를 활용하는 분석솔루션을 제공하기 위 하여, 미국 MarkLogic 사와의 협력에 합의했다. 이 제 휴로, 비 정형데이터 분석에 효과적인 네이티브 형 XML 데이터베이스 를 활용한 빅데이터 활용 솔루션을 제공할수 있게 되었다 자료: 独 立 行 政 法 人 情 報 処 理 推 進 機 構 (2012, 8), くらしと 経 済 の 基 盤 としてのITを 考 える 研 究 会 報 告 書, つながるITがもたらす 豊 かなくらしと 経 済, p.136.
제2장 국내 외 보건복지 빅데이터 활용 현황 57 (2) 플랫폼 사업자에 의한 서비스 모바일 통신 사업자를 대표하는 델레콤 분야와 인터넷 접속 사업 분야 에서는 통신 로그와 웹 액세스 로그와 같은 빅데이터가 대량으로 발생하 고 있다. 특히 모바일 통신사는 스마트폰의 급속한 보급으로 위치 정보를 비롯한 라이프 로그 (소비자의 행동 이력을 포함한 데이터)를 분석하는 수요가 급속히 늘어나 이에 대한 분석을 시작하고 있다. 모바일 통신사업 자 이외에도 플랫폼 사업을 하는 업체가 빅데이터를 수집 활용하려는 움 직임이 있다. 예를 들어 츠타야 를 비롯한 엔터테이먼트 사업과 T포인 트 사업을 운영하고 있는 컬쳐컨비니언스클럽 은 약 4,500만명의 회원 데이터베이스를 기반으로, T 회원 의 데이터와 편의점 체인 로손 과의 공동 포인트 프로그램인 Ponta 의 회원 데이터를 마케팅에 활용하는 시 도를 하고 있다. 리크루트 사도 전사적으로 100 대의 Hadoop서버를 가 동하여 자사의 데이터를 분석하려고 하고 있다. 여기에는 자사의 주택정 보지 스모 의 약 200만건의 정적인 데이터뿐만이 아니라 트윗트와 같은 동적인 데이터에 대해서도 실시간으로 처리 분석하고 있다. (3) 자사 내에서의 빅데이터 이용 축적된 데이터를 자사의 업무에 활용하는 이른바 유저 기업 의 빅데이 터의 활용에는 1 제품 개발, 업무 개선, 판매 촉진, 예상 고객의 획득 2 성능 모니터링, 품질관리, 이상 감지 3 유지보수 지원의 강화, 고장이나 피해 예방 등의 목적이 있다. JR 동일본 워터비즈니스 는 자사가 전개하 는 자동판매기를 지능화하고 고객정보의 분석에서 매출을 올림과 동시에 고객의 행동에서 패트병의 떨어지지 않는 캡 을 장착한 제품을 판매하기 시작했다. 일식 레스토랑 체인인 간코우(고집쟁이)푸드 서비스 는 점원
58 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 에 센서를 장착하고 오랜 전통을 지낸 온천지역인 기노사키 온샌 은 IC 카드로된 욕탕 권 을 발행하는 등 점원과 이용자의 행동을 수집하여 업 무개선과 판매 촉진에 활용하고 있다. 히타치 플랜트 테크놀러지 는 크 레인의 가동 상황을 모니터링하고 이상을 감지하면 즉시 통보하는 서비 스를 제공하고 있고, 후지제록스시즈오카 는 복합 복사기에 장착된 센서 를 통해 기기의 문제 발생 데이터를 수집 분석하고 그 결과를 현장의 기 술자에게 피드백하고 있다. (4) 데이터 분석 지원 기업의 데이터 활용을 위한 분석 업무를 지원하는 사업도 이미 시작되 고 있다. 미츠이정보 는 SAP재팬이 제공하는 인메모리 소프트웨어 SAPHANA 를 이용한 데이터 분석의 실증 실험 에 착수했다. 그 첫째 작 업으로 암 연구에서 게놈 분석과 약물 개발의 프로세서에 있어서 화합물 의 데이터 해석에 빅데이터 분석을 이용하는 것이다. 또한 고객이 경영전 략을 수립하는 프로세스를 지원하기 위해, SAPHANA를 데이터 기반으 로 한 실시간 정보 분석방법을 확립하여 빅데이터분석에 적용하고 있다. 브레인패드는 빅데이터 분석 소프트웨어로 급성장한 회사로 대기업을 중 심으로 99개사에 실적을 가지고 있다. 웹 사이트 방문자의 성별이나 연령 대 등의 특성이나 검색기록 데이터 등을 바탕으로 기업의 사이트가 수익 에 기여하고 있는지 등을 검증하고 이를 효과적인 사이트 구축과 인터넷 광고 제작에 활용하고 있다.
제2장 국내 외 보건복지 빅데이터 활용 현황 59 (5) 빅데이터의 외부 재이용 수집된 데이터를 분석하여 이를 이차적으로 이용하기 위해 제공하는 움직임도 있다. 주택개발 사업의 마케팅 전문회사인 아트랙터스 연구소 는 인터넷 상에 공개된 국내 부동산 리스트를 크롤러에서 자동으로 수집 축적하고 고객이 요구하는 정형과 비정형의 분석 요구에 응하여 ASP/클 라우드 서비스의 형태로 제공하고 있다. 스포츠 데이터를 분석하여 발신 하고 있는 데이터스타디움 은 야구, 축구, 럭비, 농구의 경기를 데이터화 하여 신문사 등의 매스컴에 제공하고 팀의 경기력 강화를 위한 컨설팅 사 업도 전개하고 있다. 다. 일본의 빅데이터 활용 조사 결과 일본 IPA(독립행정법인 정보처리 추진기구)는 일본 빅데이터 이용동향 조사의 일환으로 웹 설문조사의 방식에 의해 IT벤더가 아닌 일반 기업들 을 대상으로 빅데이터를 활용하는데 대한 의식조사를 실시하였다. 조사 개요는 다음과 같다. 1 조사목적: 기업의 빅데이터 이용에 관한 의식조사 2 조사대상: ITpro 독자 중 닛케이 BP 컨설팅이 모니터 관리를 실시 하고 있는 9만7000명 3 조사시기: 2012 년 1 월 4 조사방법: 웹 설문조사 (닛케이 BP컨설팅웹조사시스템 AIDA ) 5 유효화 응답수: 4,005명
60 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 2-7>와 같이 비 IT 벤더기업에서의 빅데이터 활용이 현 시점에서는 아직 발전단계인 것으로 보인다. 빅데이터의 이용목적은 대체로 사업성과 에 직접적인 향상이나 개선을 목적으로 한 것이 상위를 차지하고 있다. 그 리고 이용 목적으로 하위의 항목에 대해서는 아직 충분한 분석방법이 확립 되어 있지 않고 연구단계에 머물러 있기 때문에 이 분야에서 획기적인 분 석방법이 개발되면 보다 크게 성장 할 가능성이 있다고 보고 있다. 빅데이터를 이용하는 있어서 문제가 되는 요인으로는 대량 데이터를 분석하는 인재의 확보가 가장 큰 과제이며 또한 그 필요성이 높게 인식되 고 있는 것으로 나타났다. 그리고 사내에 대량 데이터를 처리하는 시스템 기반을 강화할 필요가 있으며, 대량 데이터를 이용 활용하기 위한 권리 관계에 대한 명확한 규정이 없다는 의견이 있는 것으로 나타났다. <표 2-7> 일본의 빅데이터 동향 조사 결과 비 IT벤더 기업의 빅데이터 대처 상황 (n=2,485) - 빅데이터를 이미 보유하고 업무에 활용하고 있음: 22.9 %, 빅데이터를 이미 보유하고 있지만 아직 활용하지 못하고있음:17.7 %, 빅데이터가 업무 상 발생하고 있지만 보유하거나 축척하지 않음: 4.9% 빅데이터라고 부를만한 데이터양이 발생하지 않음: 42.5 % 기타 혹은 잘 모름: 각각 0.4%, 11.5% 빅데이터 이용 목적 (n=570) 경영전략, 사업전략수립: 44.4 % 고객서비스개선: 44.4 % 판매촉진, 예상고객의 획득: 39.3 % 제품개발: 34.6 % 회계 업무의 강화: 27.7 % 의사결정의 자동화, 실시간처리 촉진: 23.9 % 보수 유지의 강화, 장애발생 예방: 23.2 % 기초 연구: 19.5 % 내부 통제, 부정 방지: 19.1 % 고객 로열티 향상, 회원탈퇴 방지: 16.5 % 광고 효과의 측정: 9.1 % EC 사이트의 동선 분석, 행동 마케팅: 7.5 % EC 사이트 외의 동선분석,행동마케팅: 6.1 % 블로그, SNS에 있어서의 평판 파악: 3.9 % 기타 혹은 잘 모름: 각각 5.8%, 3.2% 자료: 独 立 行 政 法 人 情 報 処 理 推 進 機 構 (2012, 8), くらしと 経 済 の 基 盤 としてのITを 考 える 研 究 会 報 告 書, つながるITがもたらす 豊 かなくらしと 経 済, p.144.
제2장 국내 외 보건복지 빅데이터 활용 현황 61 5. 일본의 빅데이터 활용을 위한 프라이버시 보호 제도 17) 빅데이터를 활용하는데 있어서는 개인의 각종 기록정보를 수집하여 분 석함으로 개인의 프라이버시를 침해할 우려 가 있다. 또한 외부로 부터의 침입에 의한 데이터의 유출의 위험성과 데이터 취급자의 부적절한 업무 처리로 인한 무의식적인 공개와 같은 잠재적 위험도 있다. 프라이버시가 노출되거나 개인정보가 악용된 경우 경제적인 면에서 다음과 같은 3가지 국면에서의 비용 발생이 상정된다. 1 대책비용의 발생 2 손해배상에 대 한 대응 3 사업 활동의 자숙 혹은 신용저하에 따른 매출감소이다. 실제로 2010 년에 연간 약 1,700 건의 개인정보유출과 1,000 억엔 이상의 손해 배상이 있다고 보고하고 있다(일본 네트워크 보안 협회, 2012) 18). 이러 한 프라이버시 보호를 위한 다양한 기술적인 기법이 도입되고 있고 조직 적인 방책 그리고 법제도적인 대책 등이 검토되고 있다. 기술적으로는 프 라이버시보호 데이터마이닝(PPDM; Privacy-Preserving Data Mining) 등의 연구가 진행되고 있고 조직적인 방책으로는 사업자의 자주 적인 행동 의지를 바탕으로 행동규범의 확립이 무엇보다 중요하다는 인 식하에 시스템 운용과 관리상의 각종 기법이 소개되고 있다. 법제도의 측 면에서는 미국의 소비자 프라이버시 권리장전 (Consumer Privacy Bill of Rights) 이나 유럽의 EU 데이터보호 규정 (General Data Protection Regulation) 이 정비되어 있으며, 일본에서는 개인정보보 호법 이 이를 제도화 하고 있다. 그러나 개인정보보호에 중점을 두면 빅 데이터의 활용을 저해하게 될 우려가 있다. 이는 소비자와 공급자의 양자 17) 본 내용은 2013 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 연구보고서에 게재 예정인 빅데이터 활용을 위한 프라이버시 보호방안(저자: 동경공업대학 이중순교수) 논 문에서 발취한 것임을 밝힌다. 18) 日 本 ネットワークセキュリティ 協 会 (2012. 12. 7) 2012 年 情 報 セキュリティインシデント に 関 する 調 査 報 告 書 - 個 人 情 報 漏 えい 編 -
62 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 가 상호간에 다양한 효용성을 얻을 수 있는 기회를 놓치는 것이 된다. 법 률상의 취급규정이 불명확한 경우 모험하지 않는 일본기업의 특성을 감 안할 때 법제도 상에서 개인정보의 취급에 방법을 명확하게 할 필요가 있 다. 일본의 개인정보보호에 관한 법률 은 국가 및 지방공공단체 일반기 업의 개인정보취급에 관련된 법률 (약칭 개인정보보호법 )으로 2003 년 5 월 23 일에 수립하여 2005 년 4 월 1 일 전면 시행되었다. 일본의 개인 정보 보호법은 민간 사업자의 개인 정보 취급에 관한 규정을 정하고 있지 만 각 사업 분야에 있어 공통되는 최소한의 규정에 국한되고 있다. 이런 상황을 감안하여 각 사업 분야를 소관 하는 주무 부처가 각 분야의 실정 에 맞는 개인정보 보호에 관한 가이드라인 을 책정하고 있다. 이는 사업 분야마다 취급하는 개인 정보 의 내용이나 성질, 용도가 다르기 때문이 다. 각 사업자가 사업 활동을 함에 있어 개인정보를 취급하는 경우에는 개인정보보호법 외에도 그 사업 분야의 가이드라인을 준수해야 한다. 가 이드라인이 법률은 아니지만 그 내용에 주무 대신(장관)의 지도, 권고, 명 령 등이 포함되어 있어 각 사업자는 자신이 소속된 업종의 가이드라인을 잘 이해하고 바르게 적용해야한다. 가이드라인은 재판에 있어 법률 해석 의 근거가 되기도 한다. 2009년 3 월 31일 현재 24 분야에 37개의 가이 드라인이 각 담당 부처에 의해 책정되어 있다. 일본 정부는 2008년 7월 개인정보보호 관계부처 연락회의를 개최하여 개인정보보호에 관한 가이 드라인의 공통화를 추진키로 하였다. 가이드라인의 공통화는 각 부처가 수립한 가이드라인에 차이가 있는 항목을 면밀히 검토하여 각 사업 분야 의 특성이나 유일성에 의거하는 부분을 제외하고 통일되지 않은 부분에 대해서는 개인정보보호를 정부가 종합적이고 일체적으로 추진하는 관점 에서 내각부의 방침에 따라 개정하도록 한 것이다. 분야별 특수한 상황을 감안하면서도 가능한 가이드라인 사이의 차이를 축소하려는 노력의 일환
제2장 국내 외 보건복지 빅데이터 활용 현황 63 이다. 이러한 노력은 가이드라인 명칭의 공통화 등 형식적인 정리를 촉진 하고 민간분야의 개인정보보호제도를 대외적으로 이해하기 쉽게 함을 목 적으로 한 것이다. 그림 2-9 일본의 개인정보보호 법 체계 19) 6. 향후 과제와 시사점 빅데이터의 기술적인 측면에서는 일단 빅데이터를 정제하는 기술은 확 립되어 있으며, 각종 센서에서 실시간으로 대규모 데이터를 수집하는 방 법론도 가닥을 잡아가고 있다. 향후 이러한 데이터를 어 떻게 효율적으로 분석하느냐가 관건이다. 기존에 연구된 데이터마이닝과 클러스터링 기술 등의 통계적 분석기술이 필요하지만 이러한 기술은 컴퓨터자원을 다량으 로 필요로 하는 것이어서 빅데이터를 처리하는 데는 개선의 여지가 많다. 빅데이터의 미래예측 측면에서는 빅데이터는 현재 상태를 나타내는 데이 19) 消 費 者 庁 (2012), 個 人 情 報 保 護 法 体 系 イメージ
64 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 터로부터 미래의 추세를 판단한다는 점에서 의미가 있지만 장기적인 예 측에는 한계가 있을 것으로 보인다. 이는 과거부터 빅데이터를 분석하여 단기 예보와 장기 예보를 하는 기상 예측의 예 에서와 같이 어떤 현상이 어느 일정기간 계속되는 모델이라면 데이터 분석에서 어느 정도의 단기 예측은 가능하다. 그러나 장기적으로는 아주 사소한 현상이 큰 현상으로 발달하는 나비효과(북경에서 나비가 날갯짓을 하면 뉴욕에서 폭풍이 일 어난다는 현상 등으로 설명되는 카오스 이론)와 같은 혼돈요인이 잠재하 면 장기예측을 정확히 하기는 어려운 것이다. 이러한 효과들이 그대로 모 든 빅데이터에 적용되는지는 불분명하지만, 그러한 현상이 가지는 특이 성을 염두 해 두고 빅데이터 분석의 한계를 이해 할 필요가 있을 것이다. 인적 자원의 측면에서는 앞 절의 인터넷 설문 조사에서도 밝혀진 바와 같 이 빅데이터를 활용하는 하는데 있어 가장 큰 과제는 대량의 데이터를 취 급할 수 있는 인재의 부족이다. 빅데이터 인재는 빅데이터 분석에 정통한 데이터 사이언티스트 라는 분석가로서의 기량을 가진 사람과 그 분석결 과를 응용할 수 있는 경영책임자의 양자를 가리킨다. 현재 급성장하는 빅 데이터시장의 수요에 비해 공급이 부족하다. 대학과정에서 빅데이터분석 에 필요한 지식을 가르치게 된 것이 최근 1년 정도이므로 앞으로 몇 년 동 안에 걸쳐 개선될 것으로 보인다. 또한 빅데이터를 활용해야 하는 경영책 임자는 교육을 통해 데이터 활용의 장점을 배우고 직감과 경험뿐만이 아 니라 데이터에 근거한 합리적인 경영판단을 하는 일의 중요성을 습득함 으로써 한층 더 빅데이터의 활용을 기대할 수 있을 것으로 본다.
제3장 보건복지 빅데이터 분석사례 제1절 소셜 빅데이터를 활용한 자살/왕따 담론 분석 제2절 소셜 빅데이터를 활용한 자살검색 예측모형 개발
3 보건복지 빅데이터 분석사례 << 제1절 소셜 빅데이터를 활용한 자살/왕따 담론분석 20) 우리나라는 급격한 사회 경제적 변화 속에 2004년 이후 자살률이 OECD 국가 중 최고 수준이며, 청소년 계층의 자살문제가 사회적 이슈로 대두되면서 정부차원의 적극적인 대책이 시급한 실정이다. 자살 연구는 국가 간 자살률 비교나 패널 데이터 분석을 통한 자살원인의 요인 등에 초점을 맞추어 개인과 집단의 다양한 자살 원인에 대한 분석은 미흡한 실 정이다. 자살 원인에는 사회 심리적 이용이 광범위하게 작용하여 그에 대 한 예측 및 관리를 위해서는 빅데이터의 활용 및 분석이 요구된다. 본 연 구의 조사목적과 기대효과는 그림 3-1 과 같다. 그림 3-1 소셜 빅데이터를 활용한 자살/왕따 담론 분석 조사목적과 기대효과 20) 본 연구는 한국보건사회연구원과 SK telecom이 공동으로 연구한 내용임.
68 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 1. 조사설계 본 연구는 2011년 1월 1일부터 2013년 3월 31일까지 인터넷 뉴스, 블로그, SNS(트위터, 미투데이) 등의 온라인 채널에서 발생한 청소년 자살, 및 자살 관련 온라인 Buzz 21) (본문, 댓글 포함)등을 분석대상으로 하였다. <표 3-1> 소셜 빅데이터 활용한 자살/왕따 담론 분석 조사설계 기간 2011.01.01~2013.03.31 자살 총 1,392,068 토픽 22) 청소년 자살 총 223,346 왕따 총 436,883 불용어 23) 자살 청소년자살 객참여형,교미해라,권지용,그루비즈,기니피그,긴파치,김민기,김삼 순,김응수,꼬꼬양이,나쁜좌석,노란복수초,달마도,대동여지도,러브 셔플,레드라이언,레오나르도,로데오극장,로마카톨릭,로키산맥,리하 르트,마돈나역할,마로니에,마법사,마인크래프트,막공일,메이퀸,모 딜리아니,문예회관,뭉크,미군마짱,미키짱,바그다드판,박인배,베케 트,별들의고향,불카누스,블랙워치,비포크리,빈센트,사뮈엘,사치코, 스타탄생,씨어터,아트센터,안경태,안전거래,안지지,알래스카,앤디 워홀,야작실,엄기준,에드먼드,엘리엇,엘리자벳,영어번역,예술극장, 워터하우스,유랑단,윤한솔,이건희,이경규,이명준,이지매,이훈국,임 마누엘,자베르,자살연구소,자살토끼,장성희,정물화,정미소,죽자살 자,지식노마드,채시라,천불사,체사레,케빈,케이케이,코믹뮤지컬,콘 돔,택배,이벤트,토치사,티아라,평행우주,하야마,하일소경,해리스,헌 혈증,헬로우고스트,휴거백성,히로아키,히틀러,필로우맨,프리드리히 대왕,양말의자살,헤다가블러,명동예술극장,타카네에네화,시지프의 신화,알베르까뮈,다크섀도우,헤라클레스,수목드라마,착한남자9회, 대풍수,MBC 수목드라마아 등등 자살골,NLL,싸이,김장훈,문재인,노무현,안철수,공방,민정수석,대통 령,김주익,악어새,의혹,박정희,박근혜,김대중,후보,민심장악,신경 전,무소속,대선후보,여당,야당,아랑,아랑사또전,강문영,신민아,무 21) 온라인Buzz: 온라인에서 작성된 Test 기반의 모든 문서를 의미함
제3장 보건복지 빅데이터 분석사례 69 영,무연,이준기,광해,이병헌,베르테르,영화광해,알랭드보통,장편소 설,소설,영화,혼자살,이명박,혼자살께,돌고래쇼,혼자살 @kagepro_info,1화,2화,3화,가블러,각시탈,계시록,교향악,귀신, 그레고리,김민기,기승전붕,김광석,김민종,김전일,김종욱,김지원, 나쁜자석,나츠미,낙서화,남보라,넌센스, 다빈치,단편,드라큘라,디 즈니사,렌트팀,로큰롤,루돌프,마들레,만년필,만병통치,메이퀸,모노 드라마,모차르트,모퉁이,바보레옹,박보영,배고파4탄,뱀파이어,뱃놀 이,뱃사공,부작,북카페,브로드웨이,블랙코미디,빈센트,빨간약,빨래, 사도행전,생리불순,생활연극,서현진,성웅,세금,폭탄,소극장,손현주, 수학자,슬옹오빠,시낭송로스타임,헤킹,리뷰보기,엑소시스트,뽀빠 이,장현승,세븐스타,아오쿠로,상황문답,디엠비젼,유용생정,워킹홀 리,랭소주의,애니판,팬텀,쿄유이,금삐까,신의퀴즈,거륵하오,명작,취 미글,Fatdoo,폴모리,중편,훈녀생정,H.O.T,악마퇴치 등등 지식채널 왕따 점프3대,호야왕따,왕따소설,왕따만화,카따마르카,푸켓,푸껫,카페왕 따,힌디어,전따소설,맥주,카스온라인,카운터스트라아크,온라인게 임,버전따,윤서인,새해인사,박준형,김영애,수상소감,지자체,산소탱 크,감독,영화평,영화,뮤지컬,소설,드라마,연극,한국영화계,뉴저지 주,홍효식,준오헤어,준오맨,레이먼드,민주노동당,원천연구,구속기 소,상임고문,신샛별,김종옥,몬스터 섬의 비밀,김병만,안민석,이근 안,별세소식,연착륙,세무조사,김진숙,철밥통,군사력,선거운동,다우 지수,내륙지방,애니,유인나,신춘문예,제작비화,쇠고기,애널리스트, 아토피,이근안,새해복왕따시,왕따시뾰루지,@kimssu5345,4관왕따 위,하얀고양이,@2_sleep,한방신경정신,박지연,소교리,관세음보살, 독후감,우월허상,아그네스,훈련병,까오,수낙카따,별보고,동유럽,대 법원,오은영,평화샘,근무평정,그리스도,간곡희,스이카,비품,재정규 제,동정녀,십중팔구,번안곡,윤서인,골짜기,공카,디펜스,영겁,천년 성,살인미소,연재,고혈압,테마도시,여강이,파출부,쩌리방,도플갱어, 영종대교,소년법,닭다리,인권기자,애기봉,쥴리아,아리스토텔레스, 북한,쥐새끼,유태인,고니,방관,조전혁,복덕방,최민환,전설,기도할 래,귀촌,,영웅호걸 등등 1. 뉴스: 온라인 상에 게재되는 214개 뉴스 사이트 2. 블로그: 네이트 블로그, 네이버 블로그, 이글루스, 다음블로그, 티스토리, 야후 블로그 3. 카페: 네이버카페, 다음 카페, 뽐뿌, 카드 고릴라, SLR 클럽 4. SNS: 트위터, 미투데이 5. 게시판: 네이버 지식인, 네이트 지식, 다음 지식인, 네이트톡, 네이트판, 다음 아고라, 다음 미즈넷, 다음텔존, 디스 이즈게임 커뮤니티/자유게시판, 인권운동사랑방 22) 소셜 분석 및 모니터링의 대상이 되는 주제어를 의미함. 23) 유의미한 온라인 Buzz 수집을 위한 제외 단어로써, Buzz수집 시 해당 단어가 포함된
70 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 2. 조사분석결과 가. 자살 담론 분석 (1) 버즈량 분석 청소년 자살의 경우 유명인 자살 등 자살과 관련된 사회적 이슈 발생 시에 자살과 관련한 커뮤니케이션이 급증하는 양상을 보이고 있으며 특 히 연예인 관련 자살 이슈 발생 시 버즈량이 급증하였다(그림 3-2 참조). 그림 3-2 자살관련 버즈량 일별 추이 청소년 자살과 관련하여 요일별 분석한 결과 자살 과 청소년 자살 관 련 버즈 모두 월요일부터 수요일까지 버즈량이 증가하다가 목요일부터 감소하는 추이를 보였다. 특히 청소년 자살의 경우 수요일 버즈량 집중도 가 전체 자살보다 상대적으로 높았다. 이는 자살 사건이 주로 화요일, 수 요일에 발생한 것에 영향을 받은 것으로 보인다. 전체 자살 버즈량의 경 우에도 토요일이 가장 낮은 수치를 보이다 일요일에 증가하였다. 문서는 수집 대상에서 제외
제3장 보건복지 빅데이터 분석사례 71 그림 3-3 자살관련 버즈량 요일별 추이 최근 3년간 자살 관련 버즈량은 수요일과 일요일에 지속적으로 증가 한 반면에 금요일에는 감소추이를 보였으며, 청소년 자살 관련 버즈량은 월요일과 목요일, 일요일에 증가 추이를 보인 반면에 수요일, 금요일, 토 요일에는 감소 추이를 보였다. 그림 3-4 자살관련 요일별 버즈량 구성비 추이 시간대별 분석 결과에서는 자살 과 청소년 자살 관련 버즈 모두 저녁 8시부터 새벽 12시 사이에 버즈량이 가장 많았으며, 특히 오후 10시 이
72 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 후 새벽 12시에 집중적으로 발생하였다. 자살 과 청소년 자살 의 시간대 별 버즈량 추이는 유사한 패턴으로 나타났다. 그림 3-5 시간대별 자살 버즈량 반면에, 전체 자살 관련 버즈의 시간대 별 버즈량에는 큰 변화가 없는 것으로 나타났으며, 청소년 자살 의 경우 2013년 들어 새벽 0시부터 2 시 사이의 버즈량이 전년 대비 2배 이상 증가한 것으로 나타났다. 그림 3-6 시간대별 년도별 자살 버즈량
제3장 보건복지 빅데이터 분석사례 73 (2) 버즈 확산 분석 전체 자살 버즈의 경우 SNS에서 발생이 절대적인 비중으로 나타난 반 면에 청소년 자살 은 상대적으로 SNS외 채널에서도 커뮤니케이션이 활 발하였다. 청소년 자살의 경우 2012년과 비교하여 2013년 카페의 버즈 점유일이 크게 증가하였다(그림 3-7 참조). 트위터의 순계정 비중이 타 채널 대비 매우 낮게 나타났는데 이는 트위터의 경우 상대적으로 소수 이 용자가 자살 관련 버즈를 생성하는 경향이 높은 것을 의미한다. 2013년 트위터 순 계정 비중이 2012년의 약 2배정도로 증가하여 트위터 상의 실 질적인 버즈 생성 이용자가 증가하는 추세를 나타난다(그림 3-8 참조). 그림 3-7 자살 채널 별 버즈 점유율 그림 3-8 자살 채널 별 순계정 비중
74 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 3-9 는 트위터를 포함하여 주요 사이트의 순 계정 비중이 증가 함을 알 수 있다. 특히 전체 자살 과 마찬가지로 청소년 자살 에서도 2012년 대비 2013년 트위터 순계정 비중이 급증하여 매우 높은 수준을 보이고 있다. 이는 트위터 상에서 실제로 직접 자살 을 언급하는 이용자 가 늘어난 것을 의미한다. 자살 과 청소년 자살 관련 트윗 언급 형태는 전파형(Retweet)과 독백형(Public mention)이 주류를 이루고 있으며, 청소년 자살 관련 트윗 언급형태는 전파형(Retweet)의 비중이 상대적으 로 높았다. 자살 과 청소년 자살 과 관련 트윗 언급 형태 모두 2012년 대비 전파형의 비중이 2013년도에는 높아졌다(그림 3-10 참조). 그림 3-9 청소년자살 채널 별 순계정 비중 그림 3-10 트위터 언급 형태
제3장 보건복지 빅데이터 분석사례 75 2012년 주요 확산 콘텐츠로는 <표 3-2>와 같다. 2012년에 가장 많이 확산된 자살 관련 버즈 컨텐츠 1-10위는 모두 트위터에서 언급되었으며, 이 중 7건이 일반 이용자에 의해 생성된 트윗 이었다(미디어(기자 포함) 3건, 정치인 1건). 자살 관련 트윗은 유력자보 다는 트윗 내용 중심으로 확산되는 경향을 보였으며, 청소년 자살 관련 정책을 비판한 트윗이 최다 확산을 기록했다. 자살 관련사건, 사실을 공 유하는 트윗은 6건으로 나타났다. <표 3-2> 2013년 청소년 자살 관련 주요 확산 컨텐츠 순위 문서 제목 내용 유형 문서수 매체 게시자 1 청소년이 고카페인 음료 마신다고 제한하고, 밤에 게임하고 게임 중독 된다고 제한하고, 자살하면 자살 방지한다며 창문에 쇠창살 다 는 돌대가리들. 청소년이 왜 카페인 음료 마 시며 공부하고, 게임밖에 할 게 없고, 왜 자 살하는 지에는 관심 없는 정책 정책 비판 4,486 트위터 @Ex_**** (일반 이용자) 2 또 40대 엄마가 두 아들과 아파트에서 투신 자살했어요. 그리스 자살자가 한달 50명이 넘었다고 토픽에 나왔는데 한국은 하루 42 명. 이라크전9년간 미군사망 4,474명인데, 2010년 한 해동안 대한민국 자살15,666명 입니다. 사실 공유 2,366 트위터 @win**** (일반 이용자) 3 30년전 중3 여학생이 '행복은 성적순이 아 니잖아요'란 유서를 남기고 자살했다.학생을 짓눌렀던 성적지상주의에 대한 거부의 몸짓 이었다.이말은 우리 사회에 큰 파장을 불러 일으켰다.30년이 지났다.어젯밤 성적 비관한 중2 여학생이 15층에서 뛰어 내렸다. 사실 공유 2,277 트위터 @medi****u (1인 미디어) 4 RT기부 "딸이 자살할까 겁난다"는 이가족을 위해 RT부탁드립니다. http://t.co/op2fcjfx RT 1000개가 모이면 길바닦에 나 앉을 세 가족에게 전세보증금 500만원이 지원됩니다 #happystock 기타 2,253 트위터 @gom**** (일반 이용자)
76 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 순위 문서 제목 내용 유형 문서수 매체 게시자 5 JTBC(중앙 케이블)보조 출연자 자매를 스탭 들10명이 돌아가면서 성폭행하여 자매가 자 살한 사건 http://bit.ly/rhc6rn 묻히는 분위기 입니다 # tb_kor 성폭행일기에 적힌 실명 당사자들은 전부 "합의하"라는군요? 널 리 퍼뜨려주세요 사실 공유 1,983 트위터 @ph_**** (일반 이용자) 6 7 오늘자 경향신문 1면. 월 15만원의 노령연 금으로 생활해 오다 동반자살한 노부부의 유 서 첫 문장이 마음을 울린다 "우리는 그동안 무엇을 향해 그토록 억척같이 살아왔는지 모 르겠다" 오늘 나에게도 던져 볼 질문. 한국 청소년 행복지수는 세계 최하위, 자살 율과 공부시간은 세계 1위다. 수면시간은 세 계 최하위이고, 운동과 여가, TV시청 시간은 타국가의 절반이하다. 이정도면 교육 문제가 아니라 인권 문제로 봐야 한다고 생각하는 데, 그런 후보는 없는 것 같다. 사실 공유 1,679 트위터 @_ru**** (일반 이용자) 의견 주장 1,440 트위터 @iy**** (일반 이용자) 8 100일간 6명이 어느 영구임대아파트의 자 살행렬 사실 공유 1,387 트위터 @media**** (미디어) 9 10 2011 연령별 사망원인 1위. 1-19세:자살, 20세-29세:자살, 30세-39세:자살. 40대, 50대는 자살이 2위. 이게 나라냐... 아이들아, 청소년사망원인 1위가 자살이라 는 통계앞에 마음이 꺼지는구나. 너무나 힘 들고 겁나는데 막상 주변엔 믿고 의지할 어 른이 하나도 없다는 얘기니까. 이걸 바꾸마. 마음 놓고 기댈 수 있는 학교안 전문상담체 제를 만들도록 하마. 꼬옥. 사실 공유 정책 공유 1360 트위터 @newspr**** (기자) 1,306 트위터 @nohyu**** (정치인/****) 2013년 가장 많이 확산된 자살 관련 버즈 컨텐츠로는 트위터 8건, 미 투데이가 2건으로 SNS컨텐츠가 주로 확산되었으며, 자살에 대한 우려 및 희망을 주고자 하는 의도의 트윗이 전체 10건 중 4건을 차지하였다 (표 3-3 참조)
제3장 보건복지 빅데이터 분석사례 77 <표 3-3> 2013년 자살 관련 주요 확산 컨텐츠 순위 문서 제목 내용 유형 문서수 매체 게시자 1 한명이 자살하면 그 주위사람 평균5명이 심 한 우울증에 걸린다고 한다. 당신이 살아있 다는 사실이 주위사람들에게 희망을 주고 있 는 것을 잊지 말라 자살 방지 3,448 트위터 @soo**** (Bot) 2 '자살' 을 거꾸로 읽으면 '살자' 가 되고,'인 연' 을 거꾸로 읽으면 '연인' 이 되고,'내 힘 들다' 를 거꾸로 읽으면 '다들 힘내' 가 된다. 자살 방지 2,200 미투데이 dbejr**** 3 석달 돈 모아 산 아이돌 콘서트 티켓을 엄마 가 찢어버려 자살한 여학생을 두고 한심한 자살이라고 말하는 사람을 봤다. 그럼 뭐 집 과 학원 학교가 세상인 어린애가 대자연을 경외해서 혹은 국가에 한 몸 바쳐 죽기라도 해야 한심하지 않단 말인가? 웃기시네. 의견 주장 1,838 트위터 @sia**** (일반 이용자) 4 청소년이 고카페인 음료 마신다고 제한하고, 밤에 게임하고 게임 중독 된다고 제한하고, 자살하면 자살 방지한다며 창문에 쇠창살 다 는 돌대가리들. 청소년이 왜 카페인 음료 마 시며 공부하고, 게임밖에 할 게 없고, 왜 자 살하는지에는 관심 없는 정책. 정책 비판 1,105 트위터 @Ex_ar**** (일반 이용자) 5 여러분 자살하게되면그사람이들어갔던사이 트 컴퓨터하드 등등 모두다확인한대요클라 우드앤드라이브 외장하드 유에스비.. 우리죽 지말아야할이유가또생겼어요 자살 방지 989 트위터 @Terrif**** (일반 이용자) 6 <경북 문경 선관위서 30대 男 자살,하루만에 화장. 경찰 유서에 선거 관련 내용 없다 공개는 거부 사실 공유 938 트위터 @wdl**** (일반 이용자) 7 드디어 대한민국이 세계1위를 차지했습니다!! OECD국가중에선 항상1위였지만 전세계 를 기준으로 봤을때는 만년2위였는데 드디 어 전세계에서 1위를 차지했네여!! '자살률' 로요. 알티합시다 사실 공유 857 트위터 @hsh**** (일반 이용자) 8 @dooyoung1 동체가 파괴된 최악의 상황 입니다!"@ 2day22: RT @ kennedian3: 한국의 자살률이 외환위기 이후 얼마나 지속 적으로 증가했는지 한 번 살펴보십시오. 이 추세를 바꿔야 하는데...정말 눈물 납니다. 사실 공유 755 트위터 @dooy**** (일반 이용자)
78 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 순위 문서 제목 내용 유형 문서수 매체 게시자 9 애쓰셨네요.. 어색해서 더 실감나요.. 감사! ㅎㅎ"@ policemadam: http://www.youtube.com/watch?v=hx wngqz9eku&sns=tw 우리나라 청소년 자살율 세계1위. 이런 기막힌 현실을 바꿔보 기위한 노력으로 현직경찰들이 7일간 밤새 워 만든영화입니다." 자살 방지 730 트위터 @kimm**** (방송인/****) 10 자살률 OECD 1위. 이유야 어쨌든 사회의 비 극입니다. 유명인의 자살이든 보통사람의 자 살이든 그리고 최근 잇따랐던 노동자들의 자 살이든 우리 사회가 또 저희 언론이 미리 손 내밀어 막아줄 수는 없었는지 반성해 봅니다 기타 590 미투데이 SBS뉴스 (미디어) 2012년에 가장 많이 확산된 청소년 자살 관련 버즈는 모두 SNS(트위 터 7건, 미투데이 2건)였으며 주로 일반 이용자에 의해 확산되었다. 청소 년 자살 관련 정책을 비판한 미투데이 글이 최다 확산되었으며, 청소년의 높은 자살률을 개탄하고 대안하는 글이 확산 되었다. <표 3-4> 2012년 청소년자살 관련 주요 확산 컨텐츠 순위 문서 제목 내용 유형 문서수 매체 게시자 1 청소년이 고카페인 음료 마신다고 제한하고, 밤에 게임하고 게임 중독 된다고 제한하고, 자살하면 자살 방지한다며 창문에 쇠창살 다 는 돌대가리들. 청소년이 왜 카페인 음료 마 시며 공부하고, 게임밖에 할 게 없고, 왜 자 살하는지에는 관심 없는 정책. 정책 비판 2,261 미투데이 cyan_**** (일반 이용자) 2 30년전 중3 여학생이 '행복은 성적순이 아 니잖아요'란 유서를 남기고 자살했다.학생을 짓눌렀던 성적지상주의에 대한 거부의 몸짓 이었다.이말은 우리 사회에 큰 파장을 불러 일으켰다. 30년이 지났다.어젯밤 성적 비관 한 중2 여학생이 15층에서 뛰어 내렸다. 사실 공유 2,208 트위터 @media**** (1인 미디어)
제3장 보건복지 빅데이터 분석사례 79 순위 3 4 5 6 7 8 9 문서 제목 한국 청소년 행복지수는 세계 최하위, 자살 율과 공부시간은 세계 1위다. 수면시간은 세 계 최하위이고, 운동과 여가, TV시청 시간은 타국가의 절반이하다. 이정도면 교육 문제가 아니라 인권 문제로 봐야 한다고 생각하는 데, 그런 후보는 없는 것 같다. 청소년이 카톡방에서 왕따를 당해 자살했으 니 '스마트폰 사용'을 금하자는 의견을 내신 분이 계신다고요. 에이즈 예방을 위해 모든 남자들의 고추를 다 제거해 버리자고 주장하 실 분이네요. 제발 평소에 뇌를 좀 장착하고 다니세요. -이외수- 아이들아, 청소년사망원인 1위가 자살이라 는 통계앞에 마음이 꺼지는구나. 너무나 힘 들고 겁나는데 막상 주변엔 믿고 의지할 어 른이 하나도 없다는 얘기니까. 이걸 바꾸마. 마음 놓고 기댈 수 있는 학교안 전문상담체 제를 만들도록 하마. 꼬옥. 한국 학생들은 하루 8시간을 공부하고 1시간 반 게임을 합니다. http://bit.ly/owu66c 북미 학생들은 5시간 공부를 하고 7시간 반 게임/TV시청을 하죠. http://lat.ms/bym3wu 청소년 자살율1위가 게임 때문이라고요? 이게 자살청소년 1위의 대한민국 등교시간 이 성인출근시간보다 빠르고 하교시간이 성 인퇴근시간보다 늦습니다. 대한민국은 OECD 국가들 중에서, 국민 자 살률 1위, 청소년 자살률 1위, 노인 자살률 1위, 불명예스러운 3관왕을 차지하고 있습 니다. 그만큼 사회가 척박합니다. 감성이 절 실하게 필요한 시대지요. 사랑은 감성입니 다. 독서를 통해 얻을 수 있습니다. "게임 중독이 문제입니다." "접속을 막읍시 다." "청소년들의 준비없는 성관계가 문제입 니다." "출입을 막읍시다." "학생들의 자살이 문제입니다." "창문을 막읍시다." "무조건 막 기만 하는 정책이 문제입니다." "그런 말을 하는 입을 막읍시다." 10 청소년 자살을 줄이는 방법 내용 유형 문서수 매체 게시자 기타 1,357 트위터 @iyo**** (일반 이용자) 기타 683 미투데이 Com2**** (일반 이용자) 정책 공유 655 트위터 @nohyun**** (정치인/****) 사실 공유 535 트위터 @iyo**** (일반 이용자) 사실 공유 494 트위터 @kyr**** (일반 이용자) 의견 주장 366 트위터 @ois**** (소설가/****) 정책 비판 331 트위터 @Se**** (일반 이용자) 자살 방지 323 네이버 블로그 Jml9**** (일반 이용자)
80 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 2013년에 확산된 청소년 자살 관련 버즈는 1위부터 10위까지 모두 트위터 컨텐츠이다. 청소년 자살 문제 해결에 대한 대안 제시 글들이 주 로 확산되었으며, 여학생 자살 관련 여론을 비판한 트윗 멘션이 최다 확 산되었다. <표 3-5> 2013년 청소년자살 관련 주요 확산 컨텐츠 순위 문서 제목 내용 유형 문서수 매체 게시자 1 석달 돈 모아 산 아이돌 콘서트 티켓을 엄마 가 찢어버려 자살한 여학생을 두고 한심한 자살이라고 말하는 사람을 봤다. 그럼 뭐 집 과 학원 학교가 세상인 어린애가 대자연을 경외해서 혹은 국가에 한 몸 바쳐 죽기라도 해야 한심하지 않단 말인가? 웃기시네. 기타 1,708 트위터 @sia**** (일반 이용자) 2 @ jungyo42: 1등만 기억하는 사회라.@ sinbi2010:교통사고 사망률 1위,이혼율 1 위,자살률 1위,저출산율1위,노령화 1위,입양 아 수출 1위,청년층 결핵 감염율1위,청소년 안경 착용... 사실 공유 1,013 트위터 @yzzung**** (일반 이용자) 3 청소년이 고카페인 음료 마신다고 제한하고, 밤에 게임하고 게임 중독 된다고 제한하고, 자살하면 자살 방지한다며 창문에 쇠창살 다 는 돌대가리들. 청소년이 왜 카페인 음료 마 시며 공부하고, 게임밖에 할 게 없고, 왜 자 살하는지에는 관심 없는 정책. 정책 비판 1,000 트위터 @Ex_ar**** (일반 이용자) 4 5 같은 학생을 자살로까지 몰아가는 청소년 폭 력. 잘못된 영웅심리와 잘못된 가치관도 문 제지만 감성과 낭만의 결여도 문제라는 생각 입니다. 정부가 심각성을 깨닫고 개선을 적 극적으로 모색할 때입니다. 부모들은 내 아이가 따돌림을 안 당하면 그 만이지 따돌린 것은 대수롭지 않게 생각합니 다. 커가는 과정이라 생각하죠. 하지만 최근 의 대규모 청소년 연구를 보면 왕따 가해자 의 자살 위험성이나 성인기에 정신과 질병에 걸릴 위험성은 피해자와 비슷하게 높습니다. 의견 주장 137 트위터 @ois**** (소설가/****) 의견 주장 104 트위터 @s**** (의사/****)
제3장 보건복지 빅데이터 분석사례 81 순위 문서 제목 내용 유형 문서수 매체 게시자 6 메가스터디는 아이들을 코너로 몰고있다.얘 들아 공부보다 마음을 나누는 친구가 중요 해!어른들에게 상술에 속지마!청소년들이 자 살하는 이유가 뭔것같아?속마음을 트고 얘기 할 사람이 없잖아 외롭잖아.두렵잖아. 의견 주장 104 트위터 @kittys**** (일반 이용자) 7 빅뱅의 '천국'은 청소년들에게 천국의 궁금 증을 심어 청소년들의 자살을 불러일으킬 수 있어 금지곡으로 설정해야 합니다. 기타 92 트위터 @Mogef**** (Bot) 8 청소년 자살의 가장 큰 원인을 성적, 진로 고 민으로 통계를 내고 있는데 공부 못한다해서 무시하고 겁주고 기회를 박탈하는 일이 없다 면 자살할까? 결별의 예를 갖춘 해고라면 단 순히 생활고 때문에 노동자들이 자살할까? 의견 주장 87 트위터 @act**** (일반이용자) 9 "@hangillo: 취임식 특사로 온 독일 재무차 관이 한국의 성공적인 교육제도를 높이 평가 하자, 누군가 우리 청소년 자살율과 우울증 이 세계 최고수준이며, 독일TV에서 한국의 우수한 교육제도를 취재하러왔다가 학생인 권침해 특집을 꾸몄었다고 답하더군요." 사실 공유 85 트위터 @verit**** (일반이용자) 10 중학교 성적 상위 2%만 진학 가능한 명문고 전교1등생이 처지를 비관, 자살했다... 머리 가 심장을 갉아먹어 더 이상 못 버티겠다 고... ㅠㅠ 우리 교육, 정말 이대로 가면 안 된다. 스펙 좋은 파이터이기 이전에 우리는 영혼을 가진 인간인 것을... 사실 공유 74 트위터 @minam**** (아나운서/***) 청소년이 주로 활동하는 게임, 애니 커뮤니티 카페에서 자살 관련 버즈 가 가장 많이 언급되고 게시되었으며 자살 관련 버즈 최다 게시 카페는 <표 3-6>과 같다. 최다 게시 카페에 자살 방지 카페의 활동도 활발하여 자살 방지 카페도 3곳이 포함되었다.
82 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 3-6> 2011년~2013년 자살 관련 버즈 최다 게시 카페 순위 카페명 카페 URL 비고 1 수만휘닷컴 http://cafe.naver.com/suhui 수학스터디카페 2 애니정보카페 http://cafe.naver.com/bestani 애니 커뮤니티 3 코믹메이플 http://cafe.naver.com/comixrpg 게임 커뮤니티 4 자살방지카페 http://cafe.naver.com/244454 자살 방지 카페 5 갯엠프드콤보수록 http://cafe.naver.com 게임 커뮤니티 6 토토인사이드 http://cafe.naver.com/etcroom 토토 커뮤니티 6 뱀파이어검사 공식팬카페 http://cafe.naver.com/vampiregumsa 드라마 팬카페 8 크아인 http://cafe.naver.com/ysm5828 게임 커뮤니티 8 임사체험 http://cafe.naver.com/neardeath 기타 8 명품보험 http://cafe.naver.com/jaehongpark 기타 8 생명지킴이 연구소 http://cafe.naver.com/gatekeeper 자살 방지 카페 12 자살방지한국협회 http://cafe.naver.com/lifetree6532 자살 방지 카페 13 바이오헤저드 특수청소 http://cafe.naver.com/biohazardyupum 기타 13 법사회로 http://cafe.naver.com/lovelaw112 기타 (3) 빈출 키워드 및 자살 원인/유형 분석 전체 자살 에서는 한국의 자살율 통계와 관련된 키워드가 가장 많이 출현하였으며, 청소년 자살 에서는 학교, 공부 등 학업/성적/진학과 관련한 키워드가 눈에 띄며 대구 청소년 자살 사건의 여파로 지역 대구 가 많이 출현하였다(그림 3-11 참조). 그림 3-11 주요 빈출 키워드
제3장 보건복지 빅데이터 분석사례 83 2011년에는 대구 청소년 자살 사건의 파급으로 학생, 대구, 중학 생 등의 연관키워드가 다수 출현하였으며, 2012년과 2013년에는 자살 률, 1위 등 자살통계와 관련된 연관키워드가 주로 도출되었다(그림 3-12 참조). 반면 청소년의 경우 2011년에는 대구 청소년 자살 사건의 파급으로 중학생, 학교, 대구 등의 연관키워드가 주로 도출되었으며, 2012년에는 학교폭력 공부, 왕따 등 청소년 자살의 원인과 관련된 키워드가 출현하였고 2013년에도 계속해서 청소년 자살에 대한 관심이 이어진 것으로 나타났다(그림 3-13 참조). 그림 3-12 연도별 자살관련 주요 빈출 키워드 그림 3-13 연도별 청소년자살관련 주요 빈출 키워드
84 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 주요 자살 원인으로는 학업/성적/진학 이 자살과 청소년 자살 관련 버 즈 모두에서 자살 원인 1위로 나타났다. 이는 학업/성적/진학 의 스트레 스로 인한 청소년 자살이 우리 사회의 자살 관련 담론에서 가장 큰 사회 적 이슈가 되고 있음을 보여주고 있으며, 전체 자살 관련 버즈에서의 자 살 원인 2, 3위는 우울/고독/불안, 성폭력 으로 나타났다. 청소년 자살 관련 버즈에서는 학교폭력, 우울/고독/불안 이 학업/ 성적/진학 의 뒤를 잇고 있다(그림 3-14 참조). 그림 3-14 전 기간 주요 자살 원인 월별로 차이는 있으나 학업/성적/진학 과 우울/고독/불안 이 자살 원 인 1, 2위로 번갈아 나타났다. 특히 수능이 다가오는 10-11월에 학업/ 성적/진학 의 자살 원인 비중이 높았으며, 2012년 1월에 학교폭력 이 청 소년 자살의 주요 원인 중 하나로 등장하여 지속적으로 이야기되었다. 이 는 6월부터 8월의 여름철 한시적으로 성폭력 의 자살 원인 비중이 높아 지는 특징을 보인다(그림 3-15 참조).
제3장 보건복지 빅데이터 분석사례 85 그림 3-15 주요 자살 원인 월별 추이 거의 모든 기간에서 학업/성적/진학 이 청소년 자살 원인 1위로 나타 나고 있다. 2011년 11월까지 미미했던 학교폭력 과 왕따 가 2011년 12월부터 지속적으로 주요 청소년 자살 원인으로 나타나고 있으며, 우 울, 고독, 불안 은 청소년 자살에서도 지속적으로 주요 자살 원인으로 나 타나고 있다(그림 3-16 참조). 그림 3-16 주요 청소년 자살 원인 월별 추이
86 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 전체 자살 과 청소년 자살 의 주요 유형 및 방법으로 투신자살 이 가 장 높게 나타남. 특히 청소년 자살 관련 버즈에서 투신자살 의 비중은 86.5%로 압도적으로 높았다. 전체 자살 에서 2, 3위는 분신자살, 동반 자살 이며 청소년 자살 에서는 목매달기 와 음독자살 이 투신자살의 뒤 를 이었다(그림 3-17 참조). 그림 3-17 주요 자살 유형 및 방법 거의 모든 기간에서 투신자살 이 자살유형 및 방법 1위로 나타났으며, 2011년 10월에는 분신자살 의 비중이 높아지면서 자살유형 및 방법 1 위로 나타났다(그림 3-18 참조). 그림 3-18 주요 자살 유형 및 방법 월별 추이
제3장 보건복지 빅데이터 분석사례 87 전체 자살 과 마찬가지로 대부분의 기간에서 투신자살 이 청소년 자 살 유형 및 방법 1위로 나타났다. 2011년 1-5월, 2012년 3월, 2013년 1-2월에 음독자살 의 비중이 높았으며, 2012년 12월에 목매달기 의 자 살 유형 및 방법 비중이 일시적으로 높았다(그림 3-19 참조). 그림 3-19 주요 청소년자살 유형 및 방법 월별 추이 (4) 감성 분석 그림 3-20 은 자살에 대한 감성 분석 결과로 자살 관련 버즈와 청 소년 자살 관련 버즈 모두 자살에 대해 부정적인 인식의 문서보다는 긍 정적 인식의 문서가 더 많게 나타났으며, 청소년자살 관련 버즈도 전체 자살 관련 버즈에 비교하여 상대적으로 부정적 인식의 문서 비중이 높 게 나타났다. 이는 청소년 자살에 대한 사회적인 우려가 보다 더 엄중함 을 보여 주고 있다. 그림 3-21 은 전체 자살과 청소년 자살에 대한 연도별 감석 분석 결 과로 전체 자살 과 청소년 자살 관련 버즈 모두 최근 3년 간 긍정적 인 식 문서의 비중이 지속적으로 높아지는 추이를 보이고 있다.
88 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 3-20 자살에 대한 인식 분석 그림 3-21 자살에 대한 인식의 연도별 변화 그림 3-22 는 자살에 대하여 긍정적으로 인식하여 표현한 경우로 일 상적으로 대수롭지 않게 자살 에 대하여 언급하고 표현한 경우이며, 이 들 이용자들은 자살에 대하여 지나치게 가벼운 인식을 보여주고 있다. <표 3-7>은 자살에 대하여 긍정적으로 인식하여 표현한 언어로 1위가 자살 할 거다, 2위는 자살 선택하다, 3위는 자살 택하다, 4위는 자살 좋다, 5위는 자살 쉽다, 6위는 자살 심각하지 않다, 7위는 자살 나쁘 지 않다, 8위는 하고 싶은 자살, 9위는 자살 손쉽다, 10위는 자살 충 격적이지 않다 라는 순으로 나타났다. 이처럼 감성분석결과 자살에 대하 여 가볍게 인식하는 것으로 분석되었다.
제3장 보건복지 빅데이터 분석사례 89 그림 3-22 자살에 대한 긍정적 인식 표현 <표 3-7> 자살에 대한 긍정 언급 표현 Top 10 자살 1 자살 할 거다 2 자살 선택하다 3 자살 택하다 4 자살 좋다 5 자살 쉽다 6 자살 심각하지 않다 7 자살 나쁘지 않다 8 하고 싶은 자살 9 자살 손쉽다 10 자살 충격적이지 않다 그림 3-22 는 자살 사고에 대하여 안타까운 심정을 표현한 경우로 감 성분석 결과 학교 폭력이 원인이 된 일련의 청소년 자살 사고에 대한 안 타까운 심정을 표현한 언급한 경우가 많았다. <표 3-8>은 자살에 대한 부 정적 언급 표현 언어로 1위는 자살 안타깝다, 2위는 자살 나쁘다, 3위 는 자살 심각하다, 4위는 자살 금지하다, 5위는 자살 실패하다, 6위 는 자살 억울하다, 7위는 자살 충격적이다, 8위는 자살 좋지 않다, 9 위는 자살 쉽지 않다, 10위는 자살해서는 안 되다 순으로 나타났다.
90 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 3-23 자살 사고에 대한 안타까운 인식 표현 <표 3-8> 자살에 대한 부정적 언급 표현 Top 10 자살 1 자살 안타깝다 2 자살 나쁘다 3 자살 심각하다 4 자살 금지하다 5 자살 실패하다 6 자살 억울하다 7 자살 충격적이다 8 자살 좋지 않다 9 자살 쉽지 않다 10 자살해서는 안 되다
제3장 보건복지 빅데이터 분석사례 91 나. 왕따 담론 분석 (1) 버즈량 분석 그림 3-24 는 왕따 담론 분석 결과에 대한 버즈량 분석 결과이로 왕 따와 관련한 온라인 커뮤니케이션은 일평균 742건으로 나타났다. 그림 3-24 와 같이 7월과 8월에 버즈량이 급격이 증가하였다. 이는 걸그룹 티 아라의 왕따 설이 사회적으로 이슈가 되면서 SNS상에 이에 대한 커뮤니 케이션이 매우 활발해 진 것으로 분석되었다. 그림 3-24 왕따 관련 버즈량 일별 추이 반면에, 요일별 왕따 관련 버즈량은 큰 편차는 없었다. 그림 3-25 와 같이 요일별 버즈량에 큰 편차는 없었지만, 월요일과 화요일, 주초에 다소 버즈량이 많이 발생한 것으로 분석되었다. 사회적으 로 큰 이슈가 되었던 티아라 왕따 설이 공개된 2012년 7월 30일~31 일의 영향으로 월요일, 화요일에 버즈량이 집중된 것으로 나타났다.
92 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 3-25] 왕따 관련 요일별 버즈량 그림 3-26 은 최근 3년간 전체 왕따 관련 요일별 버즈량 추이를 분석 한 결과로 왕따 관련 버즈량은 화요일과 일요일에 지속적으로 증가한 반 면에 금요일과 토요일에는 감소 추이를 보였다. 그림 3-26] 왕따관련 요일별 버즈량 추이 그림 3-27 은 왕따 관련 시간대별 버즈량에 대하여 분석한 결과로 왕 따 관련 버즈량은 오후 8시부터 새벽 12시 사이에 주로 발생하였으며, 특히 오후 10시 이후 새벽 12시에 집중적 발생한 것으로 분석되었다. 왕 따 관련 시간대 별 버즈량 추이는 자살 과 유사한 패턴을 보이는 것으로 분석되었다.
제3장 보건복지 빅데이터 분석사례 93 그림 3-27] 왕따관련 시간대별 버즈량 그림 3-28 은 최근 3년간 왕따 관련 시간대 별 버즈량 구성비를 비교 한 것로 왕따 버즈의 시간대 별 버즈량 추이는 최근 3년간 유사한 패턴으 로 큰 변화가 없었으나, 2013년 들어 심야 시간대 및 새벽 시간대에 왕다 버즈량이 증가한 것으로 분석되었다. 그림 3-28] 최근 3년간 왕따관련 시간대 별 버즈량 구성비 비교 (2) 버즈 확산 분석 그림 3-29 는 왕따 관련 채널별 버즈 점유율에 대하여 분석한 것으로 왕따 관련 온라인 커뮤니케이션에서 2012년과 2013년에 SNS 버즈 점유
94 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 율이 75% 이상으로 절대적인 비중을 차지하고 있으며, 2012년 게시판의 버즈 점유율이 6.9%에서 2013년에 들어오면서 게시판 버즈 점유율이 0.9%로 크게 줄어든 반면에, 2012년 카페 점유율은 4.9%였으나 2013 년에 들어오면서 카페 점유율이 11.5%로 2배 이상 큰 폭으로 증가하였 다. 특히, 그림 3-30 과 같이 왕따 버즈 주요 채널에서의 순계정 비중 이 50% 이상으로 실질적인 버즈 생성 이용자가 상당수임을 보여주었으 며, 가장 많은 버즈가 발생하는 트위터의 경우, 2013년 들어 순계정 비중 이 8.7%p 증가하였다. 그림 3-29] 채널 별 버즈 점유율 그림 3-30] 채널별 순계정 비중
제3장 보건복지 빅데이터 분석사례 95 왕따 담론 분석도 자살 담론 분석과 마찬가지로 전파형(Retweet)이 커뮤니케이션의 주류였다. 특히 티아라 왕따 설이 있었던 2012년 7월에 서부터 8월 사이에는 전파형(Retweet)과 독백형(Publicmention)의 비 중이 매우 높았음을 알 수 있다(그림 3-31 참조). 그림 3-31] 채널별 년도별 순계정 비중 2012년에 가장 많이 확산된 왕따 관련 버즈 컨텐츠 10위 중 9건이 트위터 멘션이었다. 왕따 관련 방송인 김제동의 왕따 비판 언급을 인용한 트윗이 최다 확산을 기록하는 등 주로 왕따 비판 및 이와 관련하여 사회 를 비판하는 버즈 컨텐츠가 주로 확산되었다. <표 3-9> 2012년 왕따 관련 주요 확산 컨텐츠 순위 1 문서 제목 김제동의 따뜻한 말, 우리가 자랄 땐 좀 모 자란 친구가 있으면 놀 때 '깍두기'라며 끼워 주고 함께 놀았다. 승리의 기쁨은 함께 나눴 지만 패배의 책임은 묻지 않았다. 그런데 요 즘 아이들은 이런 아이들을 '왕따'라 부른다 독설닷컴(@dogsul) 내용 유형 왕따 비판 2 티아라 지연 왕따인가요? 이슈 1,149 문서수 매체 게시자 3,701 트위터 @hee_**** (일반 이용자) 지식 검색 비공개 (일반 이용자)
96 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 순위 3 4 5 6 7 8 9 10 문서 제목 왕따 경험이 있는 사람은 평생 후유증이 남는 다고 한다, 대인기피증, 피해망상증, 소심함, 팔 랑귀 등등, 남한테 미움받기 싫어서 무조건 대 중들에게 맞추거나 주윗사람의 말에 무조건 동 조하는 등. 심각한 후유증이 남는다. - 김서화 청소년이 카톡방에서 왕따를 당해 자살했으니 '스마트폰 사용'을 금하자는 의견을 내신 분이 계신다고요. 에이즈 예방을 위해 모든 남자들 의 고추를 다 제거해 버리자고 주장하실 분이 네요. 제발 평소에 뇌를 좀 장착하고 다니세요. 더불어 알고 가시라@dogsul: 미국에서 왕따 가해학생을 칼로 찔러 죽인 피해학생에게 정 당방위라며 무죄 판결을 내려 화제. 함부로 친구 왕따 놓는 찌질이들이 참고할 기사네 요. 니들 그러다 개죽음 당하는 수가 있다. 티아라 왕따에 이리도 분노하는 정의감 넘치 는 국민들이 용역깡패에게 곤죽이 되서 두들 겨 맞은 노동자들에게 이리도 무심한 것은 국제펜싱연맹의 1초보다 더한 미스테리다 이른바 "왕따 마케팅". 왕따 당하지 않도록 돕는다는 학원 광고들이 출몰한단다. 해병대 는 일진 퇴치용 캠프 프로그램을 홍보하고, 성형외과는 왕따방지용 수술을 권장한단다. 저 음란한 한국의 자본주의는 구조적 비극과 아이들 고통을 일용할 양식으로 삼는다. 나경원 보좌진 놀이했던 다른 멤버들과 비교되 며 무개념vs개념 구도까지? RT @ welovehani: 티아라에서왕따논란에 휩싸인 류화영씨. 올 바른 역사관을 갖고 이런 트위터글도 남기는 아이돌이었군요. 요즘 초등학생들 사이에서 '티아라놀이'가 유행이라고 합니다. 한명을왕따역할로 정해 서 왕따가 아닌 친구들이 왕따역할 친구에게 '넌 이제부터 우리가 시키는것 다해' 이런 식 으로 따돌리는 놀이라는데요, 막아야합니다. 제발 퍼뜨려주세요. 한국 남자들이 나이가 들수록 가족들한테 왕 따당하고 외로운 이유는 듣는 법을 잊어버렸 기 때문입니다. 한번 돌아봅시다. 아이들, 부 인의 말을 듣는지 아니면 내 이야기만 주로 해 버리고 마는지 내용 유형 문서수 매체 게시자 왕따 피해 962 트위터 @so**** (일반 이용자) 기타 689 트위터 왕따 비판 **** (작가) 691 트위터 Hongsuk**** (일반 이용자) 기타 669 트위터 사회 비판 @san**** (일반 이용자) 591 트위터 @leeson**** (일반 이용자) 기타 421 트위터 @dog**** (미디어) 왕따 비판 386 트위터 @idolr**** (일반 이용자) 기타 348 트위터 @sun**** (혜민 스님)
제3장 보건복지 빅데이터 분석사례 97 2013년에 가장 많이 확산된 왕따 관련 버즈 컨텐츠 1~10위 모두 트 위터 멘션이었으며, 주요 확산 버즈 컨텐츠는 주로 왕따 비판 및 왕따 피 해의 심각성을 알리는 내용이었다. <표 3-10> 2013년 왕따 관련 주요 확산 컨텐츠 순위 문서 제목 1 요즘 아이들은 이런 아이들을 '왕따'라 부른다. 내용 유형 왕따 비판 문서수 매체 게시자 1,284 트위터 @soo**** (Bot) 2 RT @Todayhumor: 오늘의유머- 왕따와 구겨진 종이의 공통점.JPG http://t.co/islcmx3i 왕따 비판 872 트위터 @Today**** (오늘의유머) 3 4 5 RT @b2uty980502: 왕따만안당하게 해 주 세요. http://t.co/pixngbchb8 교육부 장관에게 눈물로 동생의 왕따문제를 호소했던 누나 기억하는 분? http://news.chosun.com/site/data/ html_dir/2012/05/17/2012051700217. html?dep0=twitter 결국 자퇴했대. http://news.chosun.com/site/data/htm l_dir/2013/02/06/2013020600094.html 유양이 자퇴한 학교 교감은 "기사 때문에 학교가 정말 골치 아팠다"...할 말이 없다... RT @BAP_youngjaeS2: RT) 저희학교 어 떤 아이가 왕따당해서 장애인이 됐어요. 그 애 힘내라고 알티 한번씩만 눌러주세요! 보 여줄려구요 이렇게 널 생각하고 걱정하는 사 람이 많다는 걸 알려주고 싶어요 왕따 피해 763 트위터 @Jun**** (일반 이용자) 기타 579 트위터 @henry_**** (일반 이용자) 왕따 피해 355 트위터 비공개 (일반 이용자) 6 RT @bburu_market: "@chanhee878: 내 일 하루 친구들 마니 사귀고 번호 마니 따고 밥같이 먹고 1년 동안 왕따 안당하고 재밋게 지낼수 있게 해 주세요. http://t.co/udhv9s94xb"제발...ㅠ 왕따 피해 277 트위터 비공개 (일반 이용자) 7 RT @qkrwldus1424: 새친구 마니 사귀고 왕따 안 당하게 해 주세요. http://t.co/tqugvumqmt 왕따 피해 221 트위터 비공개 (일반 이용자)
98 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 순위 문서 제목 내용 유형 문서수 매체 게시자 8 9 왕따는 그 이유가 뭐든 간에 잘못된거다' 얘 가 이래서 우리가 왕따 시키는 건데여? 우린 잘못 없어요. 왕따 당할만한 짓을 한 사람 잘 못이죠' 이게 할말임? 절대 아니지 만약 왕따 당한 애가 잘못을 했다면 그 잘못을 짚어주고 주의를 주는 게 가장 적절하다고 생각한다. 이제부터는 학생들 인성교육을 제대로 해야 한다. 학생들이 사회적 약자, 나와 다른 개성 을 지닌 사람을 대하는 법을 알지 못하니, 학 생들은 그런 학생들을 내팽개치고, 결국에는 내팽개쳐진 학생들이 왕따가 되지 않는가? 왕따 비판 사회 비판 276 트위터 @fun_ep**** (일반 이용자) 206 트위터 @2025_**** (일반 이용자) 10 울면서 자기는 왕따 당하는 애가 이렇게 힘든 줄 몰랐다고 다시는 왕따 안 시킨다고 그랬음. 기타 120 트위터 @scat**** (일반 이용자) (3) 빈출 키워드 그림 3-32 는 왕따 관련 빈출 키워드 분석결과로 왕따 관련 연관키워 드 중 빵셔틀 과 학교폭력 과 같은 왕따의 방법이 10위안에 위치하고 있 다. 걸 그룹 티아라가 연관키워드 7위를 차지하여 왕따 관련 큰 사회적 이 슈였음을 보여주었으며, 자살이 주요 연관 키워드로 상위에 출현하여 왕 따 문제의 심각성을 보여주고 있는 것이다(그림 3-32 참조). 그림 3-32 왕따관련 주요 빈출 키워드
제3장 보건복지 빅데이터 분석사례 99 그림 3-33은 연도별 주요 빈출 키워드 분석 결과로 학교 와 친구 가 공통으로 연관키워드 상위에 위치하여 왕따가 주로 청소년들의 교우 관계에서 발생하였으며, 왕따 방법으로 빵셔틀 과 학교폭력 이 주로 언 급됐으며 자살도 많이 언급되어 왕따의 심각한 후유증을 보여주고 있다. 2012년에는 걸 그룹 티아라 와 티아라 멤버인 화영 이 연관키워드 10위 내로 분석되었다. 왕따 관련하여 티아라의 왕따 설 이 큰 사회적 이 슈와 파장을 불러 일으켰음을 알 수 있다. 그림 3-33 왕따관련 연도별 주요 빈출 키워드 (4) 감성 분석 피해자 측면에서의 문서가 약 70%이며 가해자, 제3자 측면에서의 문 서가 각각 20%와 10% 정도로 나타났다(그림 3-34 참조). 왕따 피해자 입장에서는 상처 입게 된다, 가슴 아프다 등 부정적 심 리 진술의 비중이 70% 이상의 높은 비중으로 나타났으며, 자신이 왕따임 을 부정하거나(왕따 아니다) 친구를 사귄다 등의 긍정적 심리도 일부 진 술되었다(그림 3-35 참조).
100 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 3-34 왕따 관련 문서 심리 구분 그림 3-35 왕따관련 피해자 측면의 심리 그림 3-36 은 왕따 피해자들의 왕따임을 부정하는 언급 맨션이다. 왕따 아니다 와 같이 왕따임을 직접적으로 부정하거나 친구 있다 와 친 구 사귀다 와 같은 표현으로 나타났다. <표 3-11>은 왕따 피해자의 긍정 적은 표현어 Top 20이다.
제3장 보건복지 빅데이터 분석사례 101 그림 3-36 왕따 피해자의 인식 표현 <표 3-11> 왕따에 대한 긍정적 언급 표현 Top 20 순위 왕따 1 왕따 아니다 2 친구 있다 3 기쁨 나누다 4 친구 사귀다 5 왕따 당하지 않다 6 왕따 안 당하다 7 문제 해결하다 8 왕따 안 되다 9 욕 안하다 10 제안하는 왕따 아님 11 소외되지 않는 학생 12 왕따 되지 않다 13 왕따 당하지 않다 14 없는 왕따 15 왕따 비겁하지 않다 16 왕따 방지하다 17 친구 친하다 18 행복한 학교 19 빵셔틀하지 않다 20 왕따 당할만하지 않다
102 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 왕따 피해로 인한 상처와 스트레스가 크며 이로 인해 일부 자살까지 생 각한 경험이 표현되었다. 그림 3-37 은 왕따 피해자들의 심리를 표현을 언급한 것이며, <표 3-12>는 왕따 피해자의 부정적 언급 표현어 Top 20 을 정리한 것이다. 왕따 가해자 입장에서의 긍정/부정 심리 표현은 모두 1% 미만으로 미 미한 결과가 나타났다. 이는 왕따 가해자의 죄책감 및 왕따 가해자에 대 한 사회적 비난의 시선을 보여 주고 있음을 알 수 있다(그림 3-38 참조). 티아라 왕따설과 관련하여 피해 멤버가 왕따 당할만 하다 는 언급이 그림 3-39 와 같이 일부 나타났으며, <표 3-13>은 왕따 가해자의 긍적 적 표현 심리를 정리한 표이다. 그림 3-37 왕따 피해자의 측면 심리
제3장 보건복지 빅데이터 분석사례 103 <표 3-12> 왕따에 대한 부정적 언급 표현 Top 20 1 왕따 당하다 2 왕따다 3 왕따 되다 4 욕 하다 5 왕따 같다 6 따돌림 당하다 7 빵셔틀 하다 8 왕따 당하고 있다 9 친구가 없다 10 괴롭힘 당하다 11 상처받다 12 기분 나쁘다 13 빵셔틀 되다 14 심각한 문제 15 경험 있다 16 왕따 이다 17 빵셔틀 투표 하다 18 빵셔틀 자처하지 말다 19 빵셔틀 시키다 20 문제 심각하다 왕따 그림 3-38 왕따 가해자 심리 언급 문서
104 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 3-39 왕따 가해자의 당위성에 대한 표현 <표 3-13> 왕따 가해자 긍정 표현어 왕따 1 지지하는 친구 2 왕따 당할만하다 3 왕따 쉽다 4 왕따 당할 만하다 5 왕따 이용하다 6 왕따 정당하다 7 정당한 왕따 8 학생 징계하지 않다 9 당할만한 왕따 10 왕따 쉽다 11 정당화될 수 있는 폭력 12 친구 지지하다 그림 3-40 은 왕따에 관한 제 3자의 심리언급에 대하여 분석한 것이 다. 제 3자의 심리로는 왕따는 어리석은 행동이다, 학교폭력 심각하다 와 같은 왕따 현상에 대한 우려를 담은 부정적 언급이 70%에 육박하였으 며, 학교폭력 해결하다, 학생 보듬다 등 왕따 문제 해결을 위한 노력 등 긍정적 언급도 일부 표현되었다.
제3장 보건복지 빅데이터 분석사례 105 그림 3-40 왕따에 관한 제 3자의 심리언급 3. 요약 및 결론 가. 조사 결과 요약 자살 담론분석에 대한 조사결과는 다음과 같다. 첫째, 자살 관련 사회이슈 발생 시 자살 관련 버즈량이 급증하였다. 특 히 연예인 자살 이슈 발생 시 온라인 버즈 반응은 폭발적으로 증가하였 다. 이는 연예인 등 유명인 자살 이슈 발생 시 베르테르 효과로 인해 모방 자살을 차단 할 수 있는 자살 예방 활동 강화가 필요하다. 둘째, 요일별로는 일주일 중 수요일이 자살 관련 커뮤니케이션이 활발 하였으며 시간대별로는 20시에서 24시 사이에 가장 활발한 것으로 나타 났다. 자살 관련 온라인 버즈 발생 시 시계열적 패턴을 활용한 자살 예방 활동의 선택적 집중이 필요하다. 이를 예방하기 위해서는 자살 관련 상담 센터의 운영을 버즈 집중 발생 시간대에 탄력적으로 재편하여 예방을 강 화하는 것이 필요하다. 셋째, 자살 관련 온라인 커뮤니케이션 중심 채널은 SNS로 분석되었다. 자살과 청소년 자살 두 토픽 모두 SNS의 버즈 점유일이 가장 높았으며,
106 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 특히 청소년 자살의 경우 자살 대비 상대적으로 SNS 외 채널 상의 커뮤니 케이션도 활발하였다. 2013년 청소년 자살의 경우 카페 버즈 점유일이 크게 증가하였는데 주로 게임 및 애니메이션 커뮤니티 카페에서 자살 관 련 버즈가 다수 발생하였다. 자살 관련 커뮤니케이션이 활발한 온라인 채 널을 특정하고 이들 채널에 대해서는 자살 징후 포착 등 모니터링 활동 강화가 필요하다. 넷째, 온라인버즈 중 자살 원인 1위로는 학업, 성적, 진학 스트레 스로 인한 자살이 큰 이슈로 나타났다. 자살 토픽에서는 성폭력이, 청소 년 자살 토픽에서는 왕따의 비중이 상대적으로 높게 나타났다. 주요 자살 원인에 대한 심층적인 온라인 버즈 분석을 통하여 현상에 대한 구체화 명 확화가 필요하며, 온라인상에서 언급되는 주요 자살 원인에 대한 대응 정 책을 우선적으로 수립하여야 한다. 뿐만 아니라 자살 원인의 변화를 주기 적 지속적으로 모니터링하여 변화 트렌드에 대한 선저젝 정책 마련이 필 요하다. 다섯째, 온라인 버즈 중 자살유형 및 방법으로는 투신자살 이 가낭 높 은 비중으로 나타났다. 자살과 청소년 자살 두 토픽 모두에서 투신자살이 자살 유형 및 방법 1위로 나타났다. 특히 청소년 자살에서 투신자살의 비 중은 87%로 절대적으로 높은 비율을 보였으며, 자살에서는 분신자살과 동반자살이, 청소년 자살에서는 목매달기, 음독자살이 2위와 3위를 차지 하였다. 청소년 자살의 경우 투신자살과 관련된 환경 접근의 사전적 차단 이 필요하다. 여섯째, 자살을 긍정적으로 인식하는 문서의 비중이 증가한 것으로 나 타났다. 전체 수집문서 중 자살에 대한 긍정적 부정적 인식이 명확한 표 현적 문서만을 분석한 결과 긍정적 인식 문서의 비중이 부정적 인식 문서 보다 높게 나타났다. 자살과 청소년 자살 두 토픽 모두 3년간 긍정적으로
제3장 보건복지 빅데이터 분석사례 107 인식 문서의 비중이 지속적으로 증가하였다. 이는 일상적으로 가볍게 자 살 관련 표현이 온라인 상 언급이 증가하고 있음을 보여주고 있다. 자살에 대한 사회적 인식의 건전성 회복을 위한 캠페인 등 사전적 활동 이 필요하며 향후 자살에 선행되는 감정 패턴 연구를 통한 자살 징후의 기준 수립이 필요하다. 나. 결론 및 시사점 최근 몇 년 사이 주요한 사회 병폐로 대두된 자살 문제에 대한 효과적 인 대응 정책 마련을 위하여 다양한 온라인 채널에서 발생하는 자살 관련 버즈에 대한 지속적인 연구가 필요하다. 첫째, 자살관련 온라인 버즈 실태 진단이 필요하다. 자살관련 사회 이슈의 확산, 습관적 자살 언급, 자살 심경 토로 등 자살 과 관련된 다양한 내용의 온라인 버즈가 상시적으로 발생하고 있다. 더불 어 최근 3년간 자살을 긍정적으로 인식하여 표현한 언급이 지속적으로 증가하고 있다. 보다 다양한 관점의 소셜 커뮤니케이션 분석을 통해 풍부 한 시사점을 도출하는 것이 필요하다. 둘째, 온라인 버즈 발생패턴에 따른 효율적인 자살 예방 시스템 설계가 필요하다. 시간대별, 일별, 주별, 월별 단위의 자살 언급 온라인 버즈량의 패턴을 분석하여 커뮤니케이션이 활발한 주기에 대한 특별한 대응이 필 요하다. 자살 관련 커뮤니케이션이 활발한 온라인 채널을 특정하고 이에 대한 적극적인 관리 방안 마련이 모색되어야 한다. 주요 자살 원이과 방 법, 자살 관련 감성 표현 등 자살 징후와 연관된 소셜 분석의 고도화가 함 게 모색되어야 한다. 셋째, 자살 예방 정책 수립에 있어서 소셜 빅데이터 분석의 활용이
108 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 강구되어야 한다. 상시 모니터링 및 자살 Context 분석을 통한 위험 징후 대응 체계를 수립하고, 온라인 및 SNS상의 확산 URL 분석을 통해 유해 Context와 사이트 모니터링 체계 구축이 필요하다. 제2절 소셜 빅데이터 분석을 통한 자살검색 예측모형 개발 24) 우리나라는 최근 스마트폰 보급의 확산에 따라 모바일 인터넷과 SNS 이용이 급속히 증가하고 있다. 2011년 7월 현재 우리나라의 만 3세 이상 인구의 인터넷 이용률은 78.0%이며 이중 만 6세 이상 인터넷 이용자의 66.5%가 1년 이내 SNS을 이용하고 있으며, 만 6세 19세의 인터넷 이 용자 중 78.9% 25) 가 친구관계를 강화하거나 일상의 스트레스를 해소하기 위해 SNS를 이용하고 있다 26). SNS는 개인, 집단, 사회의 관계를 네트워 크로 파악하는 사회관계망 서비스 27) 로 실시간성과 가속성이라는 특징을 지녔기 때문에 어떠한 매체보다 이슈에 대한 확산속도가 빨라, 개개인의 단순한 생활내용 뿐만 아니라 정치, 경제, 사회 문화 등 사회전반의 문제 에 대한 이슈가 SNS를 통해 확산되고 있다 28). 이러한 SNS를 통하여 전송되는 데이터양이 기하급수적으로 증가하 면서 많은 국가와 기업에서 새로운 경제적 효과와 일자리 창출, 그리고 사회적 문제의 해결을 위해 빅데이터의 활용과 분석을 적극적으로 시도 24) 본 절은 송태민, 송주영, 안지영, 진달래(2013). 소셜 빅데이터를 활용한 자살검색 요인 다변량분석. 보건교육건강증진학회 30(3), pp 59-73' 게재된 내용을 요약함. 25) 방송통신위원회 한국인터넷진흥원(2012). 2011년 인터넷 실태조사. 26) 이창호(2012). 청소년의 소셜미디어 이용실태조사, 한국청소년정책연구원. 27) http://ko.wikipedia.org/wiki/. 2013. 7. 14. 28) 한국정보화진흥원(2011). 국정운영 선진화를 위한 소셜미디어 분석 기반의 국민공감 정 책수립 방안, 2면.
제3장 보건복지 빅데이터 분석사례 109 하고 있다. 공공부문에서 유전자와 생명연구자원 공유를 통한 질병 예방 및 예측, 치료, 그리고 환자 관리 등에 활용하고 있으며, 다국적 IT(information technology) 기업들과 웹(web) 검색 포털(portal) 사이트들 은 서버에 저장된 빅데이터를 분석함으로써 다양한 가치 정보를 생산하 고 있다 29). SNS는 청소년들이 일상생활 속에서 갖는 우울한 감정이나 스트레스, 고민을 들을 수 있고 행태를 이해할 수 있는 공간으로 SNS 상에서 나타나 는 자살에 대한 감정표현이나 심리적 위기 행태들을 분석하게 되면 위험 징후와 유의미한 패턴을 감지하여 자살을 예방하는데 긍정적 효과를 발 휘할 수 있다 30). 우리나라의 보건복지 분야에서는 이미 수많은 정형화된 빅데이터가 정부 및 공공기관에서 관리되고 있으나 정보 접근의 어려움 으로 활용이 미흡한 반면, 민간기관의 검색포털이나 SNS에서 관리되고 있는 비 정형화된 빅데이터의 분석과 활용은 활발히 이루어지고 있다. 한편, 우리나라는 급격한 사회 경제적 변화속에 자살률이 2004년부 터 OECD 국가중 최고의 수준이며, 특히 청소년계층의 자살 문제가 사회 적 이슈로 대두되면서 정부차원의 적극적인 대책이 시급한 실정이다. 그 동안 자살의 연구는 통계자료와 조사데이터의 분석을 통하여 국가 간 자 살률 비교나 자살요인 등에 초점을 맞춘 연구가 진행되어 왔으나 이러한 연구는 자살에 대한 개별적 변인을 보는 데에는 장점이 있으나, 개별 대 상자로부터 파악한 변수들이 지역변수나 사회 환경적인 변수와 얼마나 어 떻게 관련되는 지는 불분명하며, 실시간으로 원인을 분석하는 데는 한계 가 있다. 본 연구는 소셜 빅데이터를 활용하여 자살 검색의 개인별 요인과 지 29) Policy Exchange (2012). The Big Data Opportunity: Making government faster, smarter and more personal. 30) 한국정보화진흥원(2012). 소셜 분석으로 살펴본 청소년 자살예방정책의 시사점. 7면.
110 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 역/환경적 요인을 검증함으로써 자살과 관련된 실질적인 행동을 예측하 여 정부차원의 온라인 자살예방 대응체계를 마련하고자 한다. 1. 연구방법 가. 연구모형 및 연구 가설 본 연구는 소셜 빅데이터를 활용하여 우리나라의 자살검색 요인과 자 살검색 예측모형 개발을 위한 다변량 분석을 실시하였다. 성인과 청소년 집단의 자살요인의 비교 분석은 다중집단 구조모형 31) 으로 구성하였고(그 림 3-41 참조), 월별 자살률, 기후, 경제활동과 일별 스트레스, 음주, 운 동 검색량이 청소년 자살 검색의 결정요인에 미치는 영향을 분석하기 위 하여 다층모형(Multi-level Model)으로 구성하였다(그림 3-42 참조). 본 연구모형에 따른 구체적은 연구가설은 다음과 같다. 1) 성인과 청소년의 자살검색의 예측요인은 무엇인가? 2) 성인과 청소년의 자살요인 구조모형은 차이가 있는가? 3) 성인과 청소년의 자살요인의 구조모형에서 건강생활실천요인(음주, 운동)의 매개효과는 있는가? 4) 청소년의 자살검색에 영향을 주는 일별 요인과 월별 요인은 무엇 인가? 31) 본 연구의 구조모형은 그동안의 연구에서 제안된 스트레스가 건강생활실천요인(음주, 운 동)을 매개하여 자살에 영향을 미칠 것이라는 스트레스 취약모형을 적용함.
제3장 보건복지 빅데이터 분석사례 111 그림 3-41 연구모형1(다중집단 구조모형) 그림 3-42 연구모형2(다층 모형)
112 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 나. 연구대상 및 측정도구 본 연구는 국내의 온라인 뉴스 사이트, 블로그, 카페, 소셜 네트워크 서 비스, 게시판 등 인터넷을 통해 수집된 소셜 빅데이터 32) 를 대상으로 하였 다. 2011. 1. 1 2011. 12. 31(365일)까지 해당 채널에서 자살관련 토 픽(성인추정 Buzz: 321,506건, 청소년 추정 Buzz: 67,742건)을 수집하 였으며, 수집된 토픽 중 스트레스(성인 Buzz: 14,504건, 청소년 Buzz: 9,232건), 음주(성인 Buzz: 2,241, 청소년 Buzz: 2,818건), 운동(성인 Buzz: 6,256, 청소년 Buzz: 6,629건) 토픽을 추출하여 분석하였다 33). 본 연구의 측정도구 중 종속변수로는 소셜 빅데이터에서 수집된 자살 검 색량을 사용하였으며 독립변수로는 소셜 빅데이터에서 수집된 스트레스 음주 운동 검색량과 통계청 사망원인 통계자료의 2011년 일별 전체 자 살자 수와 청소년(19세 미만) 자살자 수, 기상청의 일별 평균습도와 미세 먼지량을 사용하였다. 그리고 자살검색 예측모형과 다층분석의 일별 독 립변수로는 스트레스 운동 음주 검색량을 사용하였으며, 월별 독립변 수 34) 로는 통계청의 2011년 월별 전체 자살자 수, 경제활동 참가율, 이혼 자 수, 출산아 수 통계자료와 기상청의 2011년 월별 평균습도를 사용하 였다. 32) 본 분석에서는 214개의 온라인 뉴스사이트, 4개의 블로그(네이버, 네이트, 다음, 티스토 리), 2개의 카페(네이버, 다음), 2개의 SNS(트위터, 미투데이), 6개의 게시판(네이버지식 인, 네이트지식, 다음지식, 네이트톡, 네이트판, 뽐뿌) 등 온라인 채널을 통해 수집 가능 한 텍스트 기반의 웹문서를 소셜 빅데이터로 정의함. 33) 본 연구를 위한 소셜 빅데이터의 수집 및 토픽 분류는 SK텔레콤 스마트 인사이트 에서 수행함. 34) 본 연구의 자살검색 예측 모형에 사용된 독립변수 중, 자살률은 일일 자살자 수를 의미 하며, 이혼율과 출산율은 각각 월별 이혼자 수와 출산아 수를 일별 단위로 공동으로 적 용하였음.
제3장 보건복지 빅데이터 분석사례 113 다. 통계분석 본 연구의 구조모형 적합도 비교에는 증분적합지수인 NFI, CFI와 절 대적합지수인 RMSEA를 사용하였다. 모형추정은 최대우도법 (Maximum Likelihood: ML)을 사용하였으며, 결측치 문제의 해결은 완전정보최대우도법(Full Information Maximum Likelihood: FIML) 을 사용하였다. 본 연구의 간접효과에 대한 유의성 검증은 모든 자료가 정규성 분포를 따른다는 가정하에 유의성을 검증하는 Sobel Test 35) 를 실시하였다. 그리고 본 연구의 다층모형의 모수 추정방식은 한정최대우 도추정법(Restricted Maximum Likelihood: REML)을 사용하였다. 고 정효과의 최종추정은 종속변수의 분포를 정상분포로 가정하지 않는 표준 오차(Robust Standard Error)를 적용하였다. 본 연구의 기술분석과 자 살검색 예측모형 개발은 SPSS 20.0을 사용하였고, 구조모형과 다중집단 분석은 AMOS 20.0을 사용하였다. 그리고 청소년 자살검색 결정요인의 다층모형 분석은 HLM 7.0을 사용하였다. 2. 연구결과 가. 자살 검색 예측모형 본 연구에서는 성인 자살 검색의 예측을 위하여 전체 자살률, 음주 검 색, 이혼율, 출산율, 평균습도를 사용하였으며 청소년 자살 검색을 예측 하기 위하여 청소년 자살률, 스트레스 검색, 음주 검색, 미세먼지량을 사 35) Preacher, K. J., & Hayes, A. F (2004). SPSS and SAS procedures for estimating indirect effects in simple mediation models. Behavior Research Methods, Instruments, & Computers, 36, 717-731.
114 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 용하였다 36). 성인자살 검색의 예측모형은 <표 3-13>과 같다. [모형 1]은 2011년 일별 전체 자살률이 성인 자살검색에 미치는 영향을 예측하는 것 으로 성인 자살자 수가 많을수록(자살률이 높을수록) 성인의 자살 검색은 증가하는 것으로 나타났다. [모형 2]는 일별 전체 자살률과 음주 검색이 자살검색에 미치는 영향을 예측하는 것으로 자살자 수가 많을수록, 음주 검색이 많을수록 성인의 자살 검색은 증가하는 것으로 나타났다. [모형 3] 은 일별 전체 자살률, 음주 검색, 이혼율이 자살검색에 미치는 영향을 예 측하는 것으로 자살자 수가 많을수록, 음주 검색이 많을수록, 이혼율이 높을수록 성인의 자살 검색은 증가하는 것으로 나타났다. [모형 4]는 일 별 전체 자살률, 음주 검색, 이혼율, 출산율이 자살검색에 미치는 영향을 예측하는 것으로 자살자 수가 많을수록, 음주 검색이 많을수록, 이혼율이 높을수록, 출산율이 낮을수록 성인의 자살 검색은 증가하는 것으로 나타 났다. [모형 5]는 일별 전체 자살률, 음주 검색, 이혼율, 출산율, 평균습도 가 자살검색에 미치는 영향을 예측하는 것으로 자살자 수가 많을수록, 음 주 검색이 많을수록, 이혼율이 높을수록, 출산율이 낮을수록, 평균습도가 높을수록 성인의 자살 검색은 증가하는 것으로 나타났다. 성인의 자살검 색을 예측하는 모형의 그래프는 그림 3-43 과 같다. 36) 본 연구의 자살예측 모형의 개발을 위하여 사용된 변인들은 모델링 과정을 거쳐 유의미 한 변인들만 모형에 적용하였음.
제3장 보건복지 빅데이터 분석사례 115 <표 3-14> 성인의 자살 검색 예측모형 독립변수 Model 1 Model 2 Model 3 Model 4 Model 5 t t t t t (상수) 1.409 4.21 *** 1.736 5.91 *** -25.351-9.91 *** 4.421 1.01 2.574.59 자살률.827 4.03 ***.448 2.47 **.503 3.20 ***.329 2.26 **.249 1.70 * 음주검색량.526 10.34 ***.407 8.98 ***.373 8.96 ***.347 8.18 *** 이혼율 6.802 10.64 *** 4.436 6.78 *** 4.346 6.70 *** 출산율 -4.368-8.06 *** -4.063-7.41 *** 평균습도.522 2.73 *** 수정된 R 2.040.270.457.546.555 F 16.212 *** 61.901 *** 93.121 *** 99.787 *** 82.916 *** 주: *** p<0.01, ** p<0.05, * p<0.1 그림 3-43 성인의 자살 검색 예측 모형 Model 1 Model 2 Model 3
116 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - Model 4 Model 5 자살관련 Buzz가 급속히 전파되는 1 주간의 시차(time lag)를 적용하 여 37) 자살률에 미치는 영향을 살펴본 결과, <표 3-14>, 그림 3-44 와 같이 예측도가 조금 향상된 것으로 나타났다. 38) <표 3-15> 성인의 자살 검색 예측모형(1 주간 time lag 적용) 독립변수 Model 1 Model 2 Model 3 Model 4 Model 5 t t t t t (상수) 1.326 3.98 *** 1.423 4.80 *** -24.590-9.68 *** 1.716.393 -.699 -.16 자살률 4.261 4.26 ***.626 3.50 ***.744 4.75 ***.559 3.78 ***.475 3.21 *** 음주검색량.531 10.81 ***.416 9.45 ***.382 9.28 ***.351 8.39 *** 이혼율 6.508 10.30 *** 4.513 6.94 *** 4.358 6.78 *** 출산율 -3.929-7.16 *** -3.481-6.23 *** 평균습도.619 3.19 *** 수정된 R2.046.297.470.543.555 F 18.153 *** 68.897 *** 96.334 *** 96.479 *** 81.442 *** 주: *** p<0.01, ** p<0.05, * p<0.1 37) URL을 통해 확산되는 자살관련 Buzz는 약 3주 정도의 생명주기를 가지며, 발생 후, 첫 주에 급속히 전파되는 경향을 보이고 있음[한국정보화진흥원(2012). 앞의 보고서, 19면]. 38) Table 1과 Table 2에서 모델 5의 경우, 예측도는 89.59%에서 89.64%로 조금 증가한 것으로 나타남.
제3장 보건복지 빅데이터 분석사례 117 그림 3-44 성인의 자살 검색 예측 모형(1주간의 time lag 적용) Model 3 Model 4 Model 5 청소년 자살 검색의 예측모형은 <표 3-15>과 같다. [모형 1]은 2011년 일별 청소년(19세 이하) 자살률이 청소년 자살 검색에 미치는 영향을 예 측하는 것으로 청소년 자살자 수가 많을수록(자살률이 높을수록) 청소년 의 자살 검색은 증가하는 것으로 나타났다. [모형 2]는 일별 청소년 자살 률과 스트레스 검색이 자살검색이 미치는 영향을 예측하는 것으로 자살 자 수가 많을수록, 스트레스 검색이 많을수록 청소년의 자살 검색은 증가 하는 것으로 나타났다. [모형 3]은 일별 청소년 자살률, 스트레스 검색, 음 주 검색이 청소년 자살 검색에 미치는 영향을 예측하는 것으로 자살자 수 가 많을수록, 스트레스 검색이 많을수록, 음주 검색이 많을수록 청소년의 자살 검색은 증가하는 것으로 나타났다. [모형 4]는 일별 청소년 자살률, 스트레스 검색, 음주 검색, 미세 먼지량이 청소년 자살 검색에 미치는 영 향을 예측하는 것으로 자살자 수가 많을수록, 스트레스 검색이 많을수록,
118 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 음주 검색이 많을수록, 미세 먼지량이 적을수록 청소년의 자살 검색은 증 가하는 것으로 나타났다. 청소년의 자살검색을 예측하는 모형의 그래프 는 그림 3-45 와 같다. <표 3-16> 청소년의 자살 검색 예측모형 Model 1 Model 2 Model 3 Model 4 독립변수 t t t t (상수) 1.957 68.86 ***.648 6.48 ***.624 6.22 ***.939 5.75 *** 자살률.290 2.53 **.187 2.17 **.173 2.01 **.192 2.24 ** 스트레스검색량 1.003 13.40 ***.913 10.94 ***.935 11.25 *** 음주검색량.178 2.34 **.176 2.34 ** 미세먼지량 -.214-2.43 ** 수정된 R2.023.448.456.467 F 6.421 *** 95.430 *** 65.464 *** 51.629 *** 주: *** p<0.01, ** p<0.05, * p<0.1 그림 3-45 청소년 자살 검색 예측 모형 Model 3 Model 4
제3장 보건복지 빅데이터 분석사례 119 나. 다중집단 구조모형 분석 자살요인의 다중집단 구조모형 분석은 연구모형의 적합성을 검증한 후, 집단 간 등가제약 과정을 거쳐 경로계수 간 유의미한 차이를 검증하였다. 다중집단 구조모형 분석을 위한 연구모형의 적합도는 (, p)=59.411(8, p<.000), NFI=0.954(양호), TLI=0.847(보통), CFI=.959 (양호), RMSEA=0.094(보통)으로 대부분의 적합도에서 적합한 것으로 나 타났다. 성인과 청소년 두 집단 모두 스트레스 검색에서 운동 음주 자살 검색으로 가는 경로와 자살 검색에서 자살률로 가는 경로가 청소년의 경 우 음주 검색에서 자살 검색으로 가는 경로를 제외하고 모든 경로에서 정 적(+)으로 유의한 영향을 미치는 것으로 나타났다(표 3-16, 그림 3-46). <표 3-17> 자살 검색 다중집단(성인, 청소년) 구조모형의 경로계수 Adult Youth Path B( ) C.R. P B( ) C.R. P Stress Drinking.335(.385) 7.610 **.572(.513) 11.347 ** Stress Suicide.432(.457) 10.986 **.808(.525) 8.749 ** Stress Exercise.599(.555) 12.468 **.721(.761) 22.379 ** Drinking Suicide.247(.228) 6.257 **.051(.037).868.385 Exercise Suicide.271(.310) 7.830 **.348(.214) 3.827 ** Suicide Suicide Rate.052(.204) 3.980 **.093(.172) 2.671 ** 주: ** p<0.01, * p<0.05 스트레스 검색과 자살 검색의 경로에 음주 검색과 운동 검색의 매개효 과를 살펴보기 위해 효과분해를 실시한 결과, 성인과 청소년 모두 부분 매개효과(partial mediation)가 있는 것으로 나타났다. 따라서 우리나라 성인과 청소년 모두 스트레스를 경험할 경우 건강생활실천요인(음주, 운
120 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 동)을 많이 찾게 되고 이러한 건강생활실천요인이 자살 검색에 영향을 미 치고 궁극적으로 자살률에 영향을 주는 것으로 나타났다(표 3-17 참조). 그림 3-46 자살 검색 다중집단 구조모형(성인(청소년)) 주: ** p<0.01, * p<0.05 <표 3-18> 음주 검색과 운동 검색의 매개효과 분석 경로 성인 청소년 총효과 직접효과 간접효과 1) 총효과 직접효과 간접효과 1) 음주매개효과 스트레스 자살.708.593.115***.706.669.038 * DP MP 2).708 ***.593 ***.708 ***.669 *** 운동매개효과 스트레스 자살.708.503.204***.706.535.171 *** DP MP 2).708 ***.503 ***.708 ***.535 *** 주: 1) Sobel Test: *** p<0.01 ** p<0.05 * p<0.1 2) Mediator Effect: DP(Direct Path coefficient), MP(Mediator Path coefficient)
제3장 보건복지 빅데이터 분석사례 121 다. 청소년 자살 검색요인 다층모형 분석 청소년의 자살검색의 결정요인에 대한 다층분석은 <표 3-18>과 같이 3개의 분석 모형으로 검증하였다. <표 3-19> 청소년의 자살 검색 결정요인의 다층모형 분석 Model Model 1 Unconditional Model 2 Unconditional Model 3 Conditional Parameter model Slope model model Fixed effect Coef. S.E. Coef. S.E. Coef. S.E. Level 1 Level 2 Intercept ( ) 2.00.07 *** 1.11.19 *** -39.89 14.07 * STSV.37.14 *.37.15 * DSV.07.05.09.05 * ESV.27.11 *.28.08 *** TSUICIDE -1.96.97 # CLIMATE 1.28.67 # ECOPART 24.72 8.72 * Random effect level 2,.07.34.28 208.03 *** 45.58 *** level 1,.06.03.03 45.35 *** STSV.17 20.49 *.20 68.87 *** DSV.02 6.65 ESV.06 14.23 ICC.538.918.903 주: *** p<.001, ** p<.01, * p<.05, # p<.1 기초모형(Model 1)에서 청소년의 일별 평균 자살 검색량은 181.82건 으로 자살 검색량은 월별로 상당한 변량이 있는 것으로 나타났다. 따라서 일별 자살 검색량에 대한 총 분산 중 월별 수준의 분산이 차지하는 비율 이 53.8%로 자살 검색량이 일별 요인에 의해서도 영향을 받지만 월별 요 인에도 영향을 받는 것으로 나타났다. 무조건적 기울기모형(Model 2)에
122 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 서 음주 검색량은 자살 검색량에 영향을 주지 않는 것으로 나타났고 스트 레스 검색량과 운동 검색량은 통계적으로 유의미하여 자살 검색량에 영 향을 주는 것으로 나타났으며, 일별 특성에서 스트레스 검색량이 높아질 수록 자살 검색량이 높아지며, 이러한 효과는 월별에 따라서 차이가 있는 것으로 나타났다. 조건적 모형(Model 3)에서 모든 일별 요인은 유의미한 차이를 보이고 있어 청소년이 스트레스를 많이 검색하고 스트레스 해결 을 위한 음주와 운동을 많이 검색할 경우 자살 검색에 영향을 주는 것으 로 나타났다. 그리고, 월별 전체 자살률은 자살 검색량에 부(-)적 영향을 미치는 것으로 나타나, 청소년의 자살검색은 청소년의 자살률에는 영향 을 받지만 전체 자살률에는 영향을 받지 않는 것으로 나타났다. 평균습도 는 자살 검색량에 정(+)적 영향을 미치는 것으로 나타나, 월별 평균습도 가 증가하면 자살검색은 증가하며, 월별 경제활동 참가율은 자살 검색에 정(+)적 영향을 미치는 것으로 나타나, 월별 경제활동 참가율이 높을수록 자살 검색은 증가하는 것으로 나타났다. 3. 결론 및 정책제언 본 연구는 소셜 빅데이터를 활용하여 우리나라의 자살 검색 요인과 자 살 검색 예측모형을 개발하기 위해 다변량 분석을 실시하였으며, 분석결 과를 요약하면 다음과 같다. 첫째, 일일 자살자 수가 많을수록, 음주 검색이 많을수록, 이혼율이 높 을수록, 출산율이 낮을수록, 평균습도가 높을수록 성인의 자살 검색은 증 가하는 것으로 나타났다. 이는 스트레스로 인해 우울이나 알코올 중독이 발생하고, 배우자의 이혼이나 사별한 경우 자살률이 높고, 대기오염이 높 으면 자살률이 높다는 기존의 연구 39) 들을 지지하는 것으로 각각의 요인 에 대한 정부차원의 효과적인 대책이 강구되어야 할 것이다. 둘째, 일일
제3장 보건복지 빅데이터 분석사례 123 청소년의 자살자 수가 많을수록, 스트레스 검색이 많을수록, 음주 검색이 많을수록, 미세먼지량이 적을수록 청소년의 자살 검색은 증가하는 것으 로 나타났다. 셋째, 성인과 청소년의 자살 검색의 구조모형 분석결과, 두 집단 모두 스트레스 검색에서 운동/음주/자살 검색으로 가는 경로와 자 살 검색에서 자살률로 가는 대분분의 경로가 정적(+)으로 유의한 영향을 미치고 있고 스트레스 검색에서 음주 운동 자살 검색으로 가는 경로에 청소년이 더 강하게 영향을 받고 있으며, 음주 검색에서 자살 검색으로 가는 경로는 성인만 유의한 영향을 미치는 것으로 나타났다. 이는 청소년 은 학업문제, 학교폭력, 취업, 경제문제 등의 다양한 문제로 인해 성인보 다 생활 스트레스가 더욱 심각하다는 것을 나타내는 것으로 청소년의 스 트레스를 해소할 수 있는 학교차원의 다양한 프로그램이 마련되어야 할 것이다. 넷째, 스트레스 취약요인(음주, 운동) 매개효과를 분석한 결과 성 인과 청소년 모두 스트레스 취약요인의 부분 매개효과(partial mediation)가 있는 것으로 나타났다. 다섯째, 청소년 자살 검색의 결정요인에 대한 다층모형 분석결과, 모든 일별 요인(스트레스 음주 운동 검색)은 유 의미한 차이가 있는 것으로 나타났으며, 월별 전체 자살률은 자살 검색에 부(-)적 영향을 미치고, 평균습도는 자살 검색에 정(+)적 영향을 미치며, 월별 경제활동 참가율은 자살 검색에 정(+)적영향을 미치는 것으로 나타 났다. 특히, 경제활동 참가율이 높을수록 자살 검색이 많아지는 것은 인 간관계가 빈번하고 사회생활이 집중될 때 자살이 많이 발생한다는 기존 39) Izadinia, N., Amiri, M., Jahromi, R. G., & Hamidi, S. (2010). A study of relationship between suicidal ideas, depression, anxiety, resiliency, daily stresses and mental health among Teheran university students. Procedia-Social and Behavioral Sciences, 5, 1615-1619., Stack, S. (1981). Divorce and Suicide. Journal of family Issues 2, 77-90., Biermann, Teresa, Nikolaos Stilianakis, Stefan Bleich, Norbert Thurauf, Johannes KOrnhuber and Udo Reulbach(2009), The hypothesis of an impact of ozone on the occurrence of completed and attempted suicides, Medical Hypotheses, 72, 338-341.
124 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 의 연구 40) 를 지지하는 것으로 경제활동으로 인한 스트레스를 해소 시킬 수 있는 직장차원의 프로그램이 개발되어져야 할 것이다. 본 연구를 바탕으로 우리나라의 자살예방과 관련한 정책적 함의는 다 음과 같다. 첫째, 성인과 청소년은 온라인상에서 자살과 관련한 담론을 주고받고 있으며 이러한 언급이 실제적인 자살과 관련된 심리적 행동적 특성으로 노출될 수 있기 때문에 자살 예측모형에 따른 위험징후가 예측되면 실시 간으로 개입할 수 있는 애플리케이션(가칭: 생명존중 온라인 게이트키퍼 (Gate Keeper))이 개발되어져야 할 것이다. 생명존중 온라인 게이트키 퍼 는 자살에 대한 위험징후가 예측되면 소셜 담론의 분석에서 추측된 위 험요인을 줄일 수 있는 맞춤형 프로그램을 실시간으로 제공할 수 있도록 개발되어야 할 것이다. 둘째, 지역별 소셜 빅데이터와 지역 요인의 연계 를 통한 지역별 자살 예측모형을 개발하여 실시간으로 자살을 사전에 방 지할 수 있는 시스템(가칭: 지역 생명존중 예보시스템)을 구축하여야 할 것이다. 지역 생명존중 예보시스템 은 지역별 생명존중 관련기관에 지역 별 자살예보를 1주 또는 월 단위로 제공하여 지역별 자살행동의 원인에 대해 적극적 대응을 위한 대국민 홍보활동을 지속적으로 실시함으로써 지역 주민의 생명존중 인식을 강화할 수 있을 것이다. 셋째, SNS에서 주 고 받는 자살관련 소셜 담론은 개인이 일상생활에서 갖는 우울한 감정이 나 고민이 기록되는 온라인 심리적 부검보고서 라 할 수 있으며, 핀란드 가 오프라인 심리적 부검보고서 를 바탕으로 국가 차원의 자살예방대책 을 마련하여 자살률을 줄였다면, 우리나라는 세계 최고수준의 IT 기술과 소셜 빅데이터의 활용과 분석으로 국가 차원의 자살예방 대책의 마련이 가능할 것으로 본다. 40) Durkhim E. Suidide: A study in sociology, Chungabook, 2008. (Korean).
제4장 빅데이터 프라이버시 보호방안
4 빅데이터 프라이버시 보호방안 << 세계적으로 빅데이터의 활용에 대한 논의가 본격적으로 시작된 것은 지난 2012년부터라고 볼 수 있다. 이 해1월에 열린 세계경제포럼(WEF) 에서는 빅데이터를 미래의 새로운 가능성을 여는 2012년의 가장 중요한 기술로 지목하였다. 이제 각국은 국가전략으로 빅데이터에 관련한 기술 개발과 서비스 발굴의 계획을 세우고 자국의 자원과 행정 역량을 집중하 여 국가 주도적인 민관 공동사업을 추진하기에 이르렀다(2012년 세계경 제포럼). 최근 빅데이터가 주목을 받게 된 것은 종래의 데이터베이스 시스템이 단지 거대해졌기 때문이 아니다. 인터넷과 웹이 사회 전반에 널리 보급되 어 일상생활 속에 파고들어 옴에 따라 종래의 데이터베이스 시스템에는 포함되지 않았던 다양한 형태의 비정형적인 구조를 가진 방대한 양의 데 이터가 발생하면서, 이를 폭넓고 심도 있게 그리고 신속히 분석하여 활용 하는 기술이 개발 된 것이 계기가 되었던 것이다. Google사의 검색 엔진 의 구축은 그 일례이며, Amazon사는 다종 소량의 소위 롱테일(Long tail) 시장에서 소비자의 행동을 폭넓고 빠르게 분석하여 새로운 시장 영 역을 넓혀가는 길을 열었다. 한편 네트워크에 연결된 각종 기기와 센서는 M2M (Machine -to-machine)으로 통신하여 서로 상호작용을 구사하는 사물의 인터넷 (Interne-of-Things)를 이루고 있다. 이렇게 하여 축적된 막대한 정보를 신속하고 깊이 있게 분석하여 유용한 정보를 도출함으로써 새로운 비즈 니스 기회를 얻을 수 있게 되었다.
128 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 반면 빅데이터의 등장과 함께 일각에서는 개인의 정보 유출과 프라이 버시 침해에 대한 우려가 높아지고 있다. 개인에 관련된 정보들이 전자화 되어 축적되고 있는 가운데 이를 복제 하고 가공 분석하여 유통하기가 한 층 용이하게 되었기 때문이다. 복수의 정보 소스로부터 수집되는 단편적 인 정보를 모아 개인정보의 데이터 뱅크를 구축하는 일이 더 이상 어려운 일이 아니다. 인터넷 상에 산재한 개인의 정보들 긁어모아 정리해서 상품 으로 매매하는 일조차 벌어지고 있다. 이처럼 빅데이터의 시대에 있어서 는 외부의 데이터 소스가 증가함에 따라 지금까지 비개인정보로 취급되 었던 내용들이 다른 정보와 결합하여 개인을 특정 지울 수 있는 정보로 바뀌기도 한다. 또한 이러한 개인에 관한 정보들이 행동 타겟팅 광고 등을 통하여 빈번 히 비즈니스에서 이용되고 있다. 기업에서의 빅데이터 파워의 원천은 고 객의 개인정보와 행동 정보(구매 행동, GPS에 의한 위치 정보등)를 조합 하는 것부터 발생한다. 이로부터 일련의 추론데이터(inferred data)가 생산되어 개인의 욕구를 예측할 수 있게 된다. 개인이 자신의 데이터를 기업 측에 제공하는 양과 종류가 늘어날수록 그 예측은 더 정확성을 가 지게 된다. 세계경제 포럼에서 언급된 것처럼 이 추론데이터는 국민을 감시카메라로 지켜보고 있는 전지(all-knowing)의 독재자와 같은 감이 있다. 최근 미 중앙정보국(CIA)의 직원이었던 컴퓨터 기술자 에드워드 스 노덴이 미국정부가 인터넷과 통신망을 통해 세계 사람들의 프라이버시와 기본권을 침해하고 있다고 폭로했다. 이 문제와 관련하여 영국 파이낸셜 타임즈는 2013년 6월 12일자 사설에서 빅데이터(Big data)가 빅브라더 (Big Brother)와 다르다는 것을 보여야 한다. 라고 제목의 기사를 실었다 (영국 파이낸셜 타임즈 2013년 6월 12일 인터넷판). 여기서 빅브라더는
제4장 빅데이터 프라이버시 보호방안 129 물론 감시 사회의 악몽을 그린 조지오웰의 소설 1984 에 등장하는 독재 자다. 파이낸셜 타임즈의 기사에서는 미국 국민의 87%가 우편번호, 성 별, 생년월일 등의 세 가지 정보에 의해 개인적으로 식별될 수 있다는 하 버드대Sweeney교수의 연구가 언급되었다. 사람들이 독재자를 좋아할 리는 없지만, 한편에서는 안전을 위해서라 면 어느 정도 프라이버시를 양보하는 선에서 타협해야 한다는 의견도 적 지 않다. 시민들 스스로가 자신들의 거주 지역에 감시 카메라를 설치하거 나 경찰의 손이 미치기 어려운 곳에 카메라의 설치를 지자체에 요청하고 있는 상황이다. 곳곳에 치안유지를 목적으로 도입된 감시 카메라가 범죄 방지와 사고 예방에 성과를 거두고 있다고 평가되고 있기 때문이다. 영국 의 Hull시의 경우, 2005년 범죄 발생 등으로 영국에서 가장 살기 나쁜 곳 으로 선정된 적이 있다. 그 후 도입한 감시 카메라와 범죄감시 시스템의 도움으로 2012년 기준 최근 3년간 6,500명의 범죄 용의자를 체포할 수 있었다고 한다. 이 감시 시스템이 범죄 예방에도 기여하고 있다고 보고되 고 있다. 기존의 사건에 관련된 여러 영상 데이터들을 분석하여 얻은 특 정의 장면을 미리 등록하고 카메라에서 얻어지는 실시간 영상과 비교하 여 범죄 행위의 전조를 자동으로 파악하는 것이다. 이상이 감지되면 즉시 감시자에게 통보하고 원격으로 경고를 발신함과 동시에 가장 근접한 경 찰관에 연락하여 출동하게 하는 방식이다. 향후 연간 약 8,700건의 사건 에 이 감시 카메라의 영상이 결정적인 증거가 될 것이라는 전망이 나오고 있다. 이에 대한 시민들의 반응도 긍정적이다. 한편 미국 증권거래위원회(SEC)는 증권 시장에서 빈발하는 부정행위 에 신속하게 대응하기 위하여 기존에 축척된 빅데이터를 증권거래를 감 시하는 데 활용하고 있다. 이전 문제가 된 거래 패턴을 여러 각도에서 분 석하여 등록하고 이를 현재 진행되고 있는 거래 내용과 리얼타임으로 비
130 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 교하여 부정의 소지가 있는가를 모니터링 하는 것이다. 이상이 검출되면 자동으로 즉각 감사관에 통지하여 대응하도록 하는 조치하고 있다. 이러한 일련의 일들은 개인에 관련된 정보를 정부나 공공기관 혹은 서 비스 제공자가 실시간으로 감시하는 하는 행위이지만, 사회 전체의 안전 이라는 공통의 가치를 위해 개인은 자신의 프라이버시를 부분적으로 포 기한다고 암묵적으로 동의한 것으로 여겨지고 있다. 그러나 그것이 실제 적으로는 개인의 가치를 다양하게 반영한 선택적인 계약에 의한 것이 아 니라 일률적인 점이 아이러니를 낳고 있다. 정부가 흔히 이야기하는 빅데 이터에 분석에 의한 개인별 맞춤형 서비스라는 것이 여기서는 적용될 수 없다는 사실이다. 정부의 개인 데이터의 분석조차 공공의 복지를 위하여 임의의 암묵적인 동의를 전제로 한 것이다. 이제 빅데이터의 물결은 현대 정보사회의 저변에 흘러들기 시작한 거 부할 수 없는 거대한 흐름이다. 이를 피하거나 거스르기보다 오히려 그 흐름을 잘 타서 시대의 변화에 맞추어 발전적인 방향으로 나아가는 길만 이 개인과 사회가 취할 수 있는 지혜로운 선택이라고 할 수 있겠다. 즉, 빅데이터의 존재를 긍정적으로 인식하는 것에서부터 출발하여 이를 적극 적으로 활용함으로써, 개인과 사회의 안전을 확보하고, 사회의 효율성을 높이며 지금까지 해결하지 못한 사회적 과제를 극복하고자 노력하는 길 이다. 이러한 노력 가운데 빅데이터는 개개인을 위한 혹은 개개인이 새로 운 비즈니스의 기회를 창출하는데 없어서는 안 되는 획기적인 자원으로 서 그 가치를 더해 갈 것이다. 위와 같은 이상적인 상황 전개를 위해서는 우선 빅데이터의 이용으로 인해 발생할 수 있는 부작용과 이에 대한 대책을 검토하고 개개인의 존중 을 기본으로 하는 사회전체의 공정한 규칙을 마련해야 할 것이다. 그 중 에서 가장 시급하고 큰 문제 중의 하나가 빅데이터의 활용에 있어서의 프
제4장 빅데이터 프라이버시 보호방안 131 라이버시의 보호 방안이다. 본 연구에서는 빅데이터의 활용을 위한 프라 이버시 보호방안에 대해 법제도적인 측면, 사회 조직적인 측면, 기술적인 측면에서 검토하고 다각적인 논의를 소개하고자 한다. 특히 우리나라와 사회 제도면 에서 유사한 점이 많은 일본의 예를 많이 참고로 인용하였 다. 또한 기술적인 면에서의 검토를 상세히 하여 기존의 논의에서와 다른 방향에서의 깊이 있는 접근을 시도하였다. 현재 국내에서는 기술적인 면 에서의 연구가 부족하다는 사실을 논문 데이터베이스의 검색을 통해 알 수 있었다. 이러한 논의가 빅데이터의 활용에 있어 장벽이 되고 있는 요 인들을 제거하는 연구에 일조할 것을 기대한다. 1. 빅데이터 활용에 있어서의 프라이버시 문제 가. 프라이버시 문제의 사례 (1) Latanya Sweeney의 연구 현재 하버드 대학의 교수로 있는 Latanya Sweeney는 1997년 당시 MIT박사 과정의 연구에서, 익명 처리된 공개 정보로부터 Massachusetts주지사의 병원진단 기록을 추론해 냈다는 연구결과를 발 표하여 사회적으로 큰 반향을 일으켰다(L. Sweeney, 2000). 현재 미국의 40개 이상의 주에서는 주법에 의해 병원이 환자정보(병 명, 생년월일, 인종, 성별, 우편번호, 내원일자, 비용 등)를 보험회사와 연 구자에게 제공하도록 의무화하고 있다. Massachusetts주에서는 주공무 원의 보험을 담당하고 있는 GIC (Group Insurance Commission; 단 체보험위원회)가 계약 병원으로부터 수집된 환자정보를 익명 처리한 복
132 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 사본을 연구용으로 판매하고 있었다. 여기에는 주지사를 포함한135,000 여명에 달하는 주공무원과 그 가족의 병원진원 정보가 포함되어 있다. 당 시의 주지사 William Weld는 Cambridge시에 살고 있다는 사실이 알 려져 있었고, Cambridge시는 시의 투표인 명부를 20달러에 판매하고 있었다. 이 명부에는 투표자의 이름과 주소, 우편번호, 생년월일, 성별이 포함되어 있다. GIC의 데이터에는 주지사와 같은 생년월일을 가진 사람 이 6명, 그 중에 3명이 남성이었다. 이들 남성의 우편번호를 투표인 명부 와 대조하여 주지사의 환자정보를 정확히 추론할 수 있었다. 그림 4-1 환자정보와 투표인 명부의 개인정보의 결합 Latanya Sweeney는 위의 연구와 같은 시기에 인구조사국이 공개한 1990년 미국 인구조사 요약파일(1990 Census Summary File)을 분석 하여 개인에 관련된 일부 적은 량의 정보만으로도 개개인을 식별할 수 있 다는 결과를 발표하였다. 즉, 다섯 자리의 우편번호, 성별, 생년월일 등의 세 가지 정보만으로도 전 인구의 87%(당시 2.48억 중의 2.16억)에 해당 하는 수의 주민의 개인 식별이 가능하며, 우편번호 대신에 시 군 단위의 넓은 범위의 주소인 지역명을 포함한 {지역명, 성별, 생년월일}의 정보만
제4장 빅데이터 프라이버시 보호방안 133 으로 인구의 53%(1.32억)의 개인 식별이 가능하다는 것이다. 또한 전인 구의 18%는 더 넓은 범위의 지역인 카운티(County)명이 포함된 {지역 명, 성별, 생년월일}의 정보만으로 식별될 수 있다는 사실을 보였다(L. Sweeney, 2000). Sweeney의 연구 결과는 많은 주목을 받으면서 여러 다른 연구에 인용 되었다. 이로 인해 인구조사 결과를 비롯한 건강정보 등 개인의 프라이버 시와 관련된 통계결과를 발표하는데 있어 보다 강화된 프라이버시 보호 대책을 강구하게 하는 계기가 되었다. 또한 개인의 프라이버시 정보의 취 급 행태에도 큰 영향을 미쳤으며, 이때부터 안전하고 효율적으로 개인의 정보를 익명화하는 알고리즘의 연구 개발이 활기를 띠기 시작하였다. 2006년 발표된 다른 연구자의 연구에서도 위와 유사한 경향의 결과를 얻 어내어, 2000년 미국 인구조사의 공개 파일로부터 우편번호, 성별, 생년 월일 등의 세 가지 정보만으로 인구의 63%를 개별적으로 식별할 수 있다 는 것과, 1990년의 데이터로부터는61%의 국민을 식별할 수 있다는 사실 을 보여주었다. 이 새로운 연구에서는 방법론의 차이로 인해Sweeney의 연구결과보다는 다소 수치가 떨어지지만, Sweeney의 연구 결과의 신빙 성과 중요성이 확인되는 또 하나의 의미 있는 연구로 평가되었다 (Philippe Golle, 2006). 최근Sweeney교수는 미국의 인간 지놈 연구 지원 프로젝트인 Personal Genome Project에 익명으로 참가한 지원자 그룹의 익명화된 데이터 샘플에서 40%이상의 이름을 밝히는데 성공하고 이를 통해, 인터 넷에서 유통되고 있는 유전자 정보로부터 개인의 치명적인 비밀이 누설 될 수 있는 위험성을 알렸다. 유전자 정보는 개인정보 중에서도 가장 기 밀성이 요구되는 센시티브한 것으로 정보유출은 매우 심각한 프라이버시 문제를 일으킬 수 있다. DNA정보를 해독함으로 해서 선천적인 유전병은
134 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 물론 특정 질병에 걸릴 확률까지도 유추하는 기술이 확립된 현시점에서 는 본인은 물론이고 가족과 친척까지도 불이익을 당할 수 있는 것이다. 현재 PGP 프로젝트에서는 지원자 2,800여명의 DNA정보가 인터넷 상에 공개되어 연구자들로 하여금 인간 건강과 질병 연구에 활용될 수 있 도록 유통되고 있다. 여기에는 인종, 혈액형, 체중, 키, 등의 기본정보가 포함된 것이 있는 가하면, 유산이나 낙태 경험, 복용 중인 약, 알코올 의 존증, 우울증, 성병 등의 개인 의료정보가 DNA정보와 함께 들어 있다. Sweeney교수 팀은 이 중1,130명의 익명 데이터를 입수하고 이들 중 579명에 대해서는 우편번호, 성별, 생년월일의 정보를 얻을 수 있었다 (https://my.personalgenomes.org/public_genetic_data). 이와 함 께 일반적으로 입수 가능한 유권자 명부와 다른 인터넷 상의 공개 정보를 바탕으로 241명의 이름을 추론하고, 이를Personal Genome Project 사무국에 조회한 결과 97%가 일치한다는 사실을 확인했다. Sweeney교수는 인터넷 구글 검색과 연동되어 표시되는 구글의 광고 가 인종적인 편견을 야기한다는 연구 결과를 발표하여 다시 세간의 관심 을 불러 일으켰다. 즉, 아프리카계의 미국인에게 많은 이름을 검색할 때 이와 연관되어 나타나는 광고가 범죄와 관련되거나 연상하게 하는 정보 서비스일 확률이 크다는 것이다.
제4장 빅데이터 프라이버시 보호방안 135 그림 4-2 지놈연구의 기본정보와 투표인 명부의 개인정보의 결합 그녀 자신이 흑인인 Sweeney교수는 흑인 여성에게 많은 Latanya라 는 이름을 가진 여성은 Jill이라는 이름의 여성보다 감옥에 있을 확률이 높은 것으로 나타나며, 또한 흑인에게 남성에게 많은 DeShawn Darnel l Jermaine이라는 이름은 검색의 81~86%에서 범죄와 연상된 인종 편 견적인 광고가 발생한다는 것이다. 이는 구글의 의도와는 달리 수많은 흑 인 시민과 그들의 이름이 인종차별적 광고와 함께 표시됨으로써 본인들 은 물론 이를 본 고용자들에게 커다란 심리적 영향을 줄 것이라고 Sweeney교수는 지적했다. 그리고 자신들이 인종적 편견과 차별을 받고 있다고 생각하고 있는 흑인학생의 경우가 그렇게 생각하지 않는 학생의 경우보다 지능검사와 학업능력검사의 결과가 낮은 경향이 보인다는 사실 도 상기 시켰다. Sweeney교수의 연구는 인터넷 상에서 빅데이터의 기계 적인 분석을 바탕으로 형성된 논리가 예측하기 어려운 새로운 문제점을 야기할 수 있다는 사실을 드러내 보인 것이다.
136 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - (2) 미국 시카고시의 살인사건 피해자 명단 사례 시카고시의 살인 사건 데이터베이스 (CHD: Chicago Homicide Database)에는 살인 사건에 대한 기록이 모두 등록되어 있다. CHD는 NACJD (National Archive of Criminal Justice Data)에 의해 관리되 고, 연구 목적으로 DB의 일부가 익명화되어 Web 상에 공개되어 있다. 이 DB를 열람하려면 Data use Restriction Agreement에 동의하여야 하는데2001 년 이전에는 동의를 하지 않고도 열람이 가능했다. 그런데 2001 년에 발표 된 연구 결과에 의해 CHD가의 데이터세트가 보험사회 국이 작성하여 배포하는 Social Security Death Index (SSDI)을 결합 하면 살인 피해자의 약 35 %의 실명을 복원 할 수 있다는 사실이 밝혀졌 다(S Ochoa, J Rasmussen, C Robson, and M Salib, 2001). 살인사건 DB에는 가해자와 피해자의 정보가 익명화 처리되어 실려있 다. 특히 피해자의 사망 일 연령, 성별, 인종, 사건 현장의 정보 (집 또는 근무지 또는) 외에도 피해자와 가해자의 관계, 양자의 이전 범죄 기록, 살 인의 동기, 사건과 약물 사용 또는 가정 폭력, 아동 학대 등과 관계가 있 는지 등의 정보가 포함되어 있다(그림 4-3 참조). 한편 미국의 사회보장번호 (Social Security Number : SSN)을 가지 고 있던 사람이 사망 하여 사회보험 국에 신고하게 되면 US Social Security Administration s Death Master File 에 등재된다. 이 Death Master File으로부터 SSDI가 만들어져 그 복사본을 온라인에서 구할 수 있다. 미국의 족보학자와 전기작가들이 SSDI를 자주 이용하는 것으로 알려져 있다. SSDI에는 이름과 생년월일, 사망일, 최종 거주지의 우편번호, 사회보장번호, 발행지 등이 기재되어 있다. 성별은 기재되어 있지 않지만 이름으로부터 유추할 수 있고 인종 (스패닉, 아시아, 러시아 계 등)도 어느 정도 추정이 가능하다(그림 4-4 참조).
제4장 빅데이터 프라이버시 보호방안 137 그림 4-3 시카고시의 살인 사건 DB의 피해자 측의 샘플 데이터 그림 4-4 SSDI 샘플 데이터(내용이 편집됨) SSDI 데이터 조합을 살인사건 DB와 결합하여 피해자의 사망일 등을 단서로Sweeney의 연구방법을 구사하면 피해자의 실명을 복원하고 개인 정보와 가정상황 등을 추론할 수 있게 된 것이다. 이 연구 결과에 따라 살 인사건 DB의 공개는 중단되었고 익명화 데이터베이스에의 액세스에 대 한 규정이 변경되게 되었다.
138 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - (3) AOL 4417749 사건 2006년7월말 미국 최대의 인터넷 정보서비스 회사인AOL(America OnLine)은 자회사인 AOL Research 통해 자사의 검색 엔진에 입력 된 이용자의 검색어 기록의 일부를 연구 목적으로 공개하고, 8월3일 이를 연 구자 그룹의 뉴스레터를 통해 알렸다. 공개된 기록은 2006년3월부터 5 월까지 3 달 동안의 검색어 중에서 무작위로 추출된2,100 만 건의 방대 한 양으로, 2GB의 데이터를 438MB로 압축한 파일에 담아 누구라도 접 근이 가능한 새로운 검색 사이트에 올린 것이다. 여기에는65 만8천명 분 의 익명화 된 이용자 ID, 검색키워드, 검색일자와 시간, 검색결과에 사용 자가 클릭 한 항목의 검색순위, 검색결과에 사용자가 클릭 한 도메인의 URL이 포함되었다. 담당자의 의도는 단순히 검색 연구자들이 이러한 빅 데이터를 분석함으로써 새롭고 재미있는 사실을 발견하게 되리라는 생각 의 선의에 의한 것이었고, 이용자의 이름이 공개되지 않으면 별 문제가 없을 것으로 판단한 것이다. 데이터의 공개 사실이 알려지자 프라이버시 보호단체 들은AOL을 비 난하고 개인정보 노출의 위험을 초래했다는 이유로 연방거래위원회 (FTC: Federal Trade Commission)에 조사를 요구했다. 이에 8월7일 AOL은 사태의 심각성을 깨닫고 해당 데이터를 삭제하는 동시에 사과문 을 발표하였다. 그러나 10일 간이나 일반에 노출된 문제의 파일은 여러 사이트로 복사되어 퍼져 나갔고 현재까지도 그 중 일부를 미러 사이트 (http://www.gregsadetsky.com/aol-data/)에서 구할 수 있다. 그러나 문제는 뉴욕타임즈의 기자가 이 데이터를 사용하여 한 이용자 의 신원을 파악하는데 성공하고 이를 기사화함으로써 더욱 확대 되었다. 검색 키워드에 포함된 지명과 인명을 전화번호부 등에서 조회하고 다시
제4장 빅데이터 프라이버시 보호방안 139 외부의 공개된 정보와 결합하여 이용자를 어렵지 않게 추론할 수 있었던 것이다. 기자는 이 사실을 뒷받침하고자 이용자 ID 441779가 조지아 Lilburn에 사는 62 세의 미망인으로 이름이 Thelma Arnold 씨라고 밝 히고 당사자가 개를 안고 있는 사진을 인터넷 판에 게재했다(The New York Times A Face Is Exposed for AOL Searcher No. 4417749 August 9, 2006). 그림 4-5 AOL이 공개한 이용자의 검색어 기록 (이용자 ID 441779의 예) 이 문제로 인해 AOL의 담당자와 그의 상사가 해고되고 최고기술책임 자(CTO)는 책임을 물어 사임하는 한편, 회사는 50 억 달러에 이르는 집 단 소송에 휘말렸다.
140 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 4-6 AOL 4417749의 신원을 공개한 뉴욕타임즈 인터넷 판 기사 (4) Netflix Prize의 사례 2006년10월2일 미국 최대의 온라인 영화와 DVD 렌탈 사업자인 Netflix사는 자사의 영화 추천 시스템인 Cinematch의 성능을 개선할 목적으로 100만 달러의 현상금을 걸어 고객의 기호에 맞는 적절한 영화 를 추천하는 알고리즘을 공모했다 41). 186개국의 4만여 팀이 참가한 사 상 최대의 알고리즘 콘테스트로 화제를 불러 모은 Netflix Prize (http://www.netflixprize.com/)였다. 당시의 Cinematch를 기준으 로 성능 개선 율 10%이상을 달성하는 것을 목표로 2011년10월까지 대 회를 진행하는 것으로 하였다. 참가자들에게는 Netflix의 고객 48만여 41) And if you liked the movie, a Netflix contest may reward you handsomely. New YorkTimes, Oct 2 2006
제4장 빅데이터 프라이버시 보호방안 141 명이 1998년10월부터 2005년 12월까지 6년간 작성한 1억 여건의 영화 평점 데이터가 제공되었다. 2005년 당시 고객 4백만 명의 8분의1에 달 하는 수이다. 참가자들이 이를 분석하여 새로운 알고리즘을 개발하고 추 천데이터를 만들어 투고하면, Netflix사는 고객이 실제 감상한 영화의 데 이터와 투고된 추천데이터를 비교하여 알고리즘의 성능을 평가하는 것이 다. Web상의 leaderboard에는 참가자들의 성적이 기존의 Cinematch 보다 개선된 비율로 게시되었다. 개발자들에게 공개된 데이터 세트에는, 고객의 이름을 삭제해 익명화한 ID번호와 시청한 영화명, 영화평점(레이 팅)이 포함되었다. Netflix사는 이 데이터가 익명화 되었으므로 고객의 프라이버시가 침해될 일은 없다는 설명이었다. 2009년 7월 마침내 마의 10%라고 불리는 알고리즘 성능 개선 율은 다양한 국적을 가진 7인의 합 동 팀에 의해 달성되었고 이들에게는 제1회 우승상금 100만 달러가 지불 되었다. 그러나 2007년 텍사스 대학의 연구팀이, Netflix사의 공개 정보 와 인터넷상의 다른 영화평점 데이터가 결합되면 특정한 한 고객의 정보 를 추론할 있다는 연구결과를 발표하면서부터 고객의 프라이버시에 대한 우려가 대두되기 시작했다. 연구결과는 특정 고객의 시청 이력을 유추 할 수 있다는 사실과 해당 사이트에서 공개하지 않는 영화평점을 다른 사 이트에서 익명으로 공개한 데이터로부터 알 수 있다는 것도 보여 주었 다 42). 특히 The Internet Movie Database(IMDb)의 영화평점 데이터 와 결합되면, Netflix사 공개 정보에 있는84%의 고객 이름을 특정할 수 있다고 계산했다. IMDb는 배우, 영화, TV프로와 비디오 게임에 관한 정 보의 온라인 데이타베이스로 1998년부터는 아마존에 의해서 제공되고 있다. IMDb도 고객이 관람한 영화나 프로에 대한 레이팅(Rating)을 실 시하고 있다. 42) http://www.igvita.com/2007/01/27/correlating-netflix-and-imdb-datasets
142 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 4-7 Netflix Prize의 공모 홈페이지 화면 이 문제로 인해 Netflix사는 목표가 달성된 해인 2009년 집단소송에 말려들었고, 연방거래위원회의 권고를 받아 웹에 공개했던 데이터 세트 를 내렸다. 이로써 사전에 예정되었던 2번째의 콘테스트는 더 이상 치룰 수 없게 되었다. 나. 개인정보와 프라이버시 (1) 개인정보 등의 정의 개인정보의 법률상의 정의로는 개인정보법 과 정보통신망 이용촉진 및 정보보호 등에 관한 법률 에서 살아 있는 개인에 관한 정보로서 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보(해당 정 보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함한다)를 말한다. 로 규정되어 있다.
제4장 빅데이터 프라이버시 보호방안 143 OECD는 개인정보보호지침 (Guidelines on the Protection of Privacy and Transborder Flows of Personal Data)에서 개인데이터 (Personal Data)는 식별되거나 식별될 수 있는 개인에 관한 모든 정보를 지칭한다고 정의하고 있다. EU도 개인정보보호지침 (Directive95/46EC) 에서 개인 데이터(PersonalData)는 식별되거나 식별될 수있는 자연인에 관한 모든 정보를 지칭한다고 규정하고, 식별 가능한 개인이란 직접 또는 간접적으로 신원확인 번호, 신체적, 생리적, 정신적, 경제적, 사회적 동일 성(identity)을 나타내는 요소를 참조하여 그 신원이 확인될 수 있는 사람 을 지칭한다고 정의하고 있다. 한편, 미국의 프라이버시법(Privacy Act, 1974)에서의 개인정보는 행정기관이 보유하는 개인기록(Record)에서 개인에 관한 정보(information about an individual)의 개개 항목 또 는 그 집합을 의미하며, 여기에는 개인의 이름, 식별번호, 부호, 지문, 성 문 등이 있고 특정 개인과 연결 지을 수 있는(Linkable) 정보가 포함되어 있다. 최근에는 스마트폰의 ID와 같이 해당 개인의 고유한 식별자 (identifying particular)까지 확대되어 개인정보로 취급되고 있다. 일본 의 개인정보의보호에 관한 법률 상에 정의 된 개인정보는 생존하는 개 인에 관한 정보로서, 해당 정보에 포함된 성명, 생년월일과 그 외 개인을 식별할 수 있는 것 (타의 정보와 쉽게 결합하여 그에 의해 특정의 개인을 식별할 수 있는 것을 포함한다.) 라고 규정되어 있어 우리나라의 개인정 보 법에서와 표현이 유사하다. 위에서 보는 바와 같이 각국에서 개인정보의 법적인 정의는 대동소이 하다고 볼 수 있는데 우리나라의 것을 기준으로 망라하여 열거하면, 성 명, 주민등록번호를 비롯하여 주소, 성별, 본적, 가족관계와 여권번호, 운 전면허증 번호 등 신상에 관한 기본정보와, 신장, 체중, 장애정도, 생체인 식 정보, DDA, 혈액형, 지병 등과 같이 신체의 특징을 나타내거나 건강
144 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 의료에 관련된 정보, 소득, 재산, 보험가입 현황, 신용정보, 채권 채무 등 의 경제관계 정보, 병역, 직업 경력, 사회활동 경력, 전과기록 및 법률위 반 기록 등의 사회경력 정보, 친구, 선후배, 애인 등의 인적 관계 정보, 종 교, 취미, 사상, 신조, 가치관, 정치적 성향 등의 내면 정보를 비롯하여 기 타 통신 내역, 위치정보, 음주 흡연량 등의 정보가 포함된다. 개인정보는 본인확인 정보로서의 식별정보와 본인에 부속된 속성정보 로 대별할 수 있다. 식별정보에는 성명, 주민등록번호, 여권번호와 얼굴 사진, 지문, 성문, 홍체, 유전자 등의 생체정보가 있다. 이는 그 자체로서 개인을 식별하거나 특정 지을 수 있는 정보이다. 성명의 경우 동명이인이 존재하는 경우도 있지만 사회 통념상 독립적으로 개인을 특정 하는데 사 용되고 있음으로 식별정보로서 분류된다. 한편 주소, 생년월일, 성별, 인 종, 국적 등은 단독으로 특정 개인을 식별할 수는 없지만 조합에 의해 본 인을 식별할 수 있는 준식별 정보이다. 속성정보에는 건강의료 정보, 경 제상황 정보, 개인의 신용정보, 학력과 경력정보 등이 있다. 반면, 신용정 보와 학력, 경력정보에 포함된 신용카드번호나 학번, 사번과 같은 개인ID 정보는 일반적으로 기본 식별정보와 준식별 정보를 근거로 발행되어 개 인을 특정 하는데 사용됨으로 식별정보로 분류할 수 있다. 법률상에서 정의된 개인정보 와 이를 기술하는데 사용된 개인에 관한 정보 를 비교해 보면 후자가 전자를 포함하는 개념임을 내포하고 있다. 즉 개인에 관한 정보가 보다 넒은 개념의 집합으로 그 중 일부가 개인정 보인 것이다. 개인에 관한 정보 중에는 법률적으로 개인정보에 포함되지 않는 것들이 있다. 개인의 식별로 연결되기가 어려운 정보 들이다. 따라 서 이러한 정보는 개인에 관한 정보로서의 그 중요성이나 의미와 가치가 적은 것으로 취급되어 왔다. 경우에 따라서는 개인에 관한 정보 에서 제 외되었다. 그러나 정보통신 기술의 발전과 인터넷의 등장으로 지금까지
제4장 빅데이터 프라이버시 보호방안 145 비개인정보로 취급되었던 사항들이 다른 정보와 결합하여 개인을 특정 지을 수 있게 사회가 변화해 감에 따라 개인정보가 차지하는 영역이 점차 확대 되어 가고 있는 상황이다. 과거에는 혼잡한 길거리의 사진에 찍힌 사람들의 정보는 개인에 관한 정보 에서 제외되었고 도서관 자료의 열람 정보와 같은 행동 이력 등은 사회적인 상식의 범위에서 개인정보로 간주 하지 않았던 사항들이었다. 최근 들어 인터넷 상의 프라이버시 보호에 대 한 논의와 함께 그러한 정보 들이 개인정보의 범주에 포함되고 있다. 특 히 데이터의 분석 기술의 발달과 함께 그러한 경향은 더욱 가속되고 있으 며, 그 동안 의미나 존재 가치가 희박했던 비개인 정보들이 활용을 전제 로 새로운 가치를 창출하는 빅데이터로서 재평가 받고 있는 것이다. 그림 4-8 개인에 관한 정보와 개인정보 및 프라이버시의 관계 자료: 노무라연구소 小 林 慎 太 郎 ビッグデータ 社 会 におけるプライバシー~ 個 人 情 報 から プラ イバシー の 保 護 へ~ 第 176 回 NRIメディアフォーラム 資 料 2012년11월26일
146 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 4-9 개인정보 식별성과 공개성 자료: 노무라연구소 小 林 慎 太 郎 ビッグデータ 社 会 におけるプライバシー~ 個 人 情 報 から プラ イバシー の 保 護 へ~ 第 176 回 NRIメディアフォーラム 資 料 2012년11월26일 (2) 프라이버시 정의와 법적 보호 대책 개인에 관한 정보 중에는 사생활에 관계되는 프라이버시(Privacy)의 부분이 있다. 프라이버시의 사전적인 의미로서는 개인의 사생활이나 사 적인 일, 또는 그것을 남에게 알려지지 않거나 간섭받지 않을 권리를 가 리킨다. 사생활( 私 生 活 )로 번역하기도 하지만 프라이버시는 권리를 포함 한 더 큰 범주에 속한다. 프라이버시를 내용에 따라 분류하면, 결정프라 이버시(Decisional privacy), 공간프라이버시(Spatial privacy 혹은 Locational privacy), 의도프라이버시(Intentional privacy), 정보프라 이버시 (Informational privacy), 통신프라이버시(Communicational privacy), 물리적정신적 프라이버시(Physical and psychological privacy) 43) 등으로 나눌 수 있다. 정보보호와 관련해서는 개인의 정보가 부 당하게 처리되는 것을 통제하는 개인의 권리로서의 정보프라이버시에 대 해 논의된다. 프라이버시의 기원은 1890년 미국의 S.D.Warren와L.D.Brandeis의 43) http://itlaw.wikia.com/wiki/right_of_privacy
제4장 빅데이터 프라이버시 보호방안 147 논문 The Right to Privacy 에서 혼자 있을 권리 (the right to be left alone) 로 정의 된 것이 그 효시라는 것이 정설이다. 이 후 자기 자신에 관한 정보가 남에게 함부로 공개되거나 침해되지 않는 권리의 소극적인 개념을 거쳐, 근년에는 정보화의 물결과 함께 자신의 정보를 통제할 수 있는 권리 (the right to control information about oneself) 로 발전 하게 되었다(http://en.wikipedia.org/wiki/Right_to_privacy). 즉 자신의 정보를 수집, 가공, 유통 및 제공하는 데에 있어 접근권 및 통제 권을 가지고, 언제, 무슨 정보를, 어느 범위까지, 누구에게 유통시키느냐 를 스스로 결정하는 정보의 자기결정권 을 의미하게 된 것이다. 이처럼 프라이버시 권리는 당초의 소극적인 개념에서 시작하여 정보사회에서는 정보의 자기결정권 과 같은 적극적이고 능동적인 권리의 개념으로 바뀐 것이다. 프라이버시권의 법적 지위는 유엔에 있어서의 세계인권 선언 44) 을 비 롯하여 각국은 헌법과 법률에 국민의 의해 기본권으로 보호하고 있다. 세 계 인권선언(Universal Declaration of Human Rights)12조에는 어 느 누구도 자신의 사생활, 가족, 가정 또는 통신에 대하여 자의적인 간섭 을 받지 않으며, 자신의 명예와 신용에 대하여 공격을 받지 아니한다. 모 든 사람은 그러한 간섭과 공격에 대하여 법률의 보호를 받을 권리를 가진 다. 라고 규정하고 있다. 우리나라 헌법에서는 제16조 공간에 대한 프라 이버시, 제17조 사생활의 비밀과 자유로서의 프라이버시, 제18조 통신에 대한 프라이버시를 국민의 기본권으로 보장하고 있다. 이를 침해하였을 때는 민법에서 불법적 행위에 의한 침해로서 제750조(불법행위의 내용) 에 의해 대한 손해를 배상할 책임이 있고, 제751조(재산 이외의 손해의 44)http://www.humanrights.com/what-are-human-rights/universal-declaration-ofhuman-rights.html
148 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 배상)에서 자유 또는 명예를 해하거나 기타 정신상의 고통에 대해 배상할 책임이 발생한다. 그림 4-10 개인정보와 프라이버시권에 해당하는 정보의 관계 자료: 鈴 木 正 朝 プライバシーの 権 利 と 個 人 情 報 保 護 法 総 務 省 マイナンバーシンポジウム 資 料 2012년11월 프라이버시권이 성립되기 위해서는 일반적으로 다음과 같은 요건이 필 요하다(안용교, 1980). 첫째, 공표된 내용이 사생활의 사실 또는 사생활 의 사실처럼 받아들여질 우려가 있어야 하고, 둘째, 일반인의 감수성을 기준으로 하여 공개됨으로써 심리적 부담이나 불만을 갖게 될 수 있는 것 이어야 한다. 셋째 일반인에게는 아직 공개되지 않은 것으로써 그 공개로 인하여 당해 개인이 실제적 불쾌감이나 불안감을 가졌어야 한다. 넷째, 공개된 사적 사항이 피해자에 관한 것이라는 증명이 필요하다. 다섯째, 공표된 사상의 진실성이나 공개자의 악의의 결여는 항변이 될 수 없으나 당해 당사자의 문서에 의한 사전 동의가 있는 경우에는 그 권리 가 소멸 된다. 그림3-11은 개인정보 보호를 위한 법적 규제의 구조로 의료정보
제4장 빅데이터 프라이버시 보호방안 149 의 경우에 있어서의 예시를 나타낸 것이다. 개인의 의료정보는 기밀성이 높은 개인정보로서 이를 취급하는 데는 개인정보보호법상의 의무규정을 지켜야 함은 물론, 정보 누출 시에는 형법 (제317조)에 의해 비밀누설죄 가 적용되어 형사처벌을 받을 수 있고, 불벌행위에 의한 프라이버시 침 해, 의료 계약상의 책무 불이행 등으로 민사상의 손해배상을 청구 당할 수 있다. 그림 4-11 개인정보(의료정보 예)의 보호를 위한 법적 규제 자료: 안용교, "프라이버시권, 월간고시, 1980년 5월, pp.47-62. (3) 익명성의 정의 익명의 사전적 의미는 자신의 본래 이름 혹은 아이덴티티를 밝혀 드러 내지 않고 숨기는 것 을 말한다. 영어의 Anonymous의 어원은 그리스어 의 an-(=without) + onymous(=name) 즉, 이름이 없다는 뜻이다. 그 런 의미에서 익명성(anonymity)의 반대 개념은 실명 이 되겠으나, 이름 에 국한하지 않고 개인정보의 법률 상의 정의에 의해 다른 정보와 쉽게 결합하여 개인을 알아볼 수 있는 것 으로서 식별요소성 혹은 본인에의
150 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 도달 가능성 을 가진 신원 정보의 총체 라고 볼 수 있다. 익명화(Anomymize) 된 정보는 개인정보보호법 상의 개인정보에는 해당하지 않는다는 인식이 일반적이다. 그러나 현재까지 익명화가 어떻 게 처리되어야 하는 지에 대한 명확한 설명이나 구체적인 기준이 없는 실 정이다. 익명화란 식별요소를 1대 다 의 관계를 유지하면서 본인에의 1대 1 의 도달 가능성을 없애는 작업이라고 볼 수 있다 45). 한편 개인정보에 대한 처리의 한 형태로 가명화 (Pseudonymity)가 있다. 가명화란 일반적인 식별요소를 상대적인 식별요소로 치환한 것이 다. 예를 들어 <이름+상품구입 이력>로 구성된 정보를 <회원ID+상품구 입 이력>으로 바꾸는 것이다. 해당 회원 ID에 상대적인 본인 도달 가능성 이 인정되는 한 익명화가 아니다. 익명화된 정보는 식별 요소성이 부족해 서 타 보와의 용이한 조합 가능성이 인정되지 않음으로 해서 개인정보에 서 벗어 날 수 있다. 이에 비해 가명화된 정보는 특정의 사업자와의 관계 에서는 여전히 개인정보인 것이다. 한편 웹서비스를 이용하는 데 있어 프 라이버시를 보호하는 차원에서 가명을 사용하기도 한다. 그러나 사업자 의 입장에서는 이용자에 대한 계속적이고 부가적인 서비스 등에 있어서 의 편의성을 위해 혹은 이용자를 식별하고 추적하거나 부정행위를 막을 목적으로 ID등록을 요구하고 있다. 또한 연락수단으로서 메일주소를 요 구하고 있기도 하다. 이런 관계에서 일단 ID를 취득하게 되면 비록 가명 에 의한 회원등록이라고 할지라도 본인 도달가능성이 어느 정도 실현된 다고 볼 수 있다. 현재 공학적인 입장으로부터 프라이버시 보호를 위한 여러 가지 기술 들이 활발히 연구되고 있는 가운데 익명성이나 프라이버시 등의 정의가 45) 中 田 響, 個 人 情 報 性 の 判 断 講 造 慶 藤 義 塾 大 学 メディア コミュニケーション 研 究 所 紀 要 No.57, pp.145-161,2007
제4장 빅데이터 프라이버시 보호방안 151 각각의 연구 내에서 이루어지고 있다. 그러나 복수의 연구 성과를 비교 해 익명성의 강도를 비교한다든가, 여러 기술 중에서 필요로 하는 기술 을 찾고자 할 때 용어 등이 달라 상호간의 관계가 명확하지 않은 경우가 많다 46). 이러한 용어 통일의 실현을 목표로 한 활동으로서A. Pfitzmann과 M. Hansen의 용어집이 잘 알려져 있다(A. Pfitzmann and M. Hansen,, 2010). 여기서는 프라이버시 보호에 관한 개념 어구 등을 망라해 일관성 이 있게 정의하고 이를 연구자들 사이에서 공유하는 것을 목적으로, 2000년 이래 거듭되는 개정판이 공개되고 있다. 다음은 Pfitzmann의 용 어집을 바탕으로 익명화에 있어서의 몇 가지 요소를 정의한다. (4) 익명성의 요소와 익명화 강도 Pfitzmann의 용어집에서 익명성(Anonymity)은 자신의 속성을 공개 하지 않고 서비스나 자원을 이용할 수 있는 상태라고 정의한다. 익명성을 결정하는 것은 정보 제공자와 수신자의 관계인 관찰불능성 (Unobservability), 연결불능성 (Unlinkability), 가명성 (Pseudonymity) 의 요소로 설명된다 47). 관찰불능성(Unobservability)란, 정보의 제공자와 수신자, 혹은 커뮤 니케이션 자체의 관찰이 불가능한 상태를 나타낸다. 관찰불능성을 만족 하면 해당 존재가 발견되지 않는 상태(undetectable)에 놓여진다. 연결불능성(Unlinkability)이란 복수의 세션이 동일 인물에 의한 것인 46) 真 野 健 匿 名 性 プライバシーの 工 学 的 定 式 化 とその 学 際 的 応 用 電 子 情 報 通 信 学 会 誌 Vol. 94, No. 9, p.788-794, 2011 47) 新 田 明 子, 江 木 啓 訓, リンク 不 能 性 および 一 覧 性 の 観 点 による 匿 名 性 の 分 類, 日 本 情 報 処 理 学 会 SIG Technical Report p.153-158 2007.9.21
152 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 지가 판정 되지 않는 것을 의미하고 세션끼리의 관련성을 맺기가 불가능 한 상태를 나타낸다. 복수의 세션이 동일인에 의한 것인지가 분명하면, 세션 간을 관련(링크)지을 수 있고, 관련지어진 대상에 대해서는 식별자 를 가명(Pseudonym)의 형태로 발행할 수 있다. 관련지을 수 있는 정보 가 많아질수록 가명으로 연결된 정보가 축적되어 간다. 물론 복수의 세션 을 관련지을 수 없는 상태(링크 불능)를 유지할 수 있으면 세션에 대응하 는 가명에 의한 본인 도달 가능성은 생기지 않는다. 가명에 의해 실명을 은닉 하더라도 세션이 어느 행위자에 의한 것일까를 판정할 수 있는 경우 가 있다. 그림 4-12 연결가능성과 연결불능성 자료: 新 田 明 子, 江 木 啓 訓, リンク 不 能 性 および 一 覧 性 の 観 点 による 匿 名 性 の 分 類, 日 本 情 報 処 理 学 会 SIG Technical Report p.153-158 2007.9.21 익명성의 강도 면에서 본다면 대상이 관찰불능(Unobservable)인 상 태가 가장 익명성이 강하다고 할 수 있다. 관찰불능(Unobservable)이면 링크불능의 상태가 되며 가명도 발생하지 않는다. 관찰가능한 상태가 되 면 세션의 행위자에 대해 가명이 발생한다. 그러나 연결불능
제4장 빅데이터 프라이버시 보호방안 153 (Unlinkable)이면 여전히 익명성이 높다고 할 수 있다. 세션의 행위자가 가명을 사용하는 경우 이미 언급한 바와 같이 일의적인 의미를 지닌 가명 으로 인해 연결불능성(Unlinkability)이 충족되지 못하고 익명성은 약하 게 된다. 복수의 세션이 연결 가능한 경우, 제삼자에 의해서 연결 가능한 세션이 일람 할 수 있는 상태가 될 때 이를 일람성 이라고 정의한다. 이 는 Pfitzmann의 용어집에 정의된 개념은 아니다. 가명과 같이 일의적인 ID에 의해 복수의 세션을 관련지을 수 있다고 해도 이를 제삼자가 일람 할 수 없으면 외관상 링크 불능성이 성립한다고 볼 수이다 그러나 가명에 의해 행한 댓글의 이력이나 구매 이력 등이 검색에 의해서 링크 가능한 형태로 모아지게 되면 일람성이 성립될 수 있고 익명성을 잃게 된다. 그림 4-13 연결가능성, 알림성과 익명성의 강도 자료: 新 田 明 子, 江 木 啓 訓, リンク 不 能 性 および 一 覧 性 の 観 点 による 匿 名 性 の 分 類, 日 本 情 報 処 理 学 会 SIG Technical Report p.153-158 2007.9.21 (5) 정보주체의 동의 취득 방식 기업이나 단체가 개인정보를 수집하거나 이용하는데 있어 정보주체의 동의를 구하는 과정에서 의사를 확인하는 데는 옵트인(Opt-in)과 옵트아
154 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 웃(Opt-out)의 두 가지 방식이 있다. 옵트인은 흔히 사전동의라고 하고 명시적으로 사전에 동의를 취득하는 방식이며 옵트아웃은 암묵적 동의를 전제로 사후에 거부의사를 표시하지 않는 한 동의를 취득한 것으로 간주 하는 방식이다. 이들 단어는 이미 여러 전문분야에서 사용되고 있는 용어 이다. 예를 들어 장기기증 의사 표시를 운전면허증이나 장기기증카드 혹 은 의료보험증(일본의 예)에 사전에 의사표시를 하는 것은 옵트인 방식이 다. 그러나 스페인 등 유럽의 일부 국가는 장기기증 거부 의사를 밝히지 았았다면 잠재적인 기증자로 추정하는 옵트아웃 제도를 채택하고 있다. 또 다른 예로 유럽연합(EU)에 있어 유럽법이나 협약들이 모든 회원국들 에게 동일하게 적용되지만, 회원국은 선택적으로 이러한 정책에서 이탈 할 수 있는 선택적 이탈권 즉 옵트아웃을 행사할 수 있다. 영국과 덴마크 가 유럽공식 화폐인 유로를 사용하지 않고 자국의 독자적인 화폐를 유지 하는 예이다. 즉, 옵트인은 개인정보를 수집하거나 이용하는 것에 대해 정보 주체자 가 사전에 등록하는 것을 말한다. 본인의 의사가 명시적으로 표시되지 않 는 한 사업자는 개인정보를 이용할 수 없다. 기업이 다이렉트 메일(DM) 를 보내는 데 있어서도 사전에 동의를 표시하여 서비스에 참가하겠다는 의사를 밝힌 이용자에 한에 발송하는 것이 옵트인 메일서비스이다. 주로 유럽의 사업자에 많은 방식이다. 한편, 옵트아웃은 개인정보의 제공이나 이용허가을 거부하는 의사를 서비스 사업자에게 등록하는 것이다. 정보 주체자가 본인의 개인정보의 사용을 거부할 권리를 가지고 있으나 이에 대한 의사 표시를 하지 않는 한 사업자는 해당 정보를 이용할 수 있게 된 다. 미국에서 일반적인 방식이다. 우리나라에서2005년 4월 31일부터 전화와 팩스 광고에 옵트인 제도 가 도입되었다. 전화로 광고를 하기 위해서는 수신자에게 사전 동의를 받
제4장 빅데이터 프라이버시 보호방안 155 아야 하며, 사전 동의를 받았다 하더라도 저녁 9시부터 오전 8시까지 광 고를하기 위해서는 추가적으로 동의를 받아야 한다. 한편 광고성 전자 우 편에 대해서는 현행 정보통신망 법에서 수신거부 의사를 표시하지 않는 한 발송이 자유로운 것으로 해석되고 있다. 따라서 광고 메일의 말미에 광고 송신을 거절하거나 등록된 개인정보의 파기 등을 서비스 개시 후에 요구할 수 있는 설명이 첨부되고 있는 경우가 대부분이다. 그러나 스팸메 일 방지를 위해 광고성 전자 우편의 옵트인 제도를 도입하자는 여론이 끊 이지 않고 있다. 일본의 경우 2008년 6월에 개정된 특정전자메일법 과 특정상거래법 에서 인터넷 통신판매 사업자 등에게 전자 우편 광고의 옵 트인을 의무화 하였다. 최근 인터넷 상에서 광고 노출의 효과를 높이기 위해 사용되고 있는 행 동 타게팅 광고 (BTA: Behavioral Targeting Advertising)에 대해 프 라이버시 문제가 자주 거론되고 있다. 고객의 과거 행동이력을 수집하여 해석하는 것은 고객 측의 프라이버시 를 침해할 소지가 있다는 것이다. 그러나 BTA가 이용자의 인터넷 사용상의 이력을 이용하지만 그것이 어 떠한 형태로 이용자의 권리를 침해 할 수 있는지는 반드시 명확하지 않 다. 이에 대해 미국에서는 업계 단체의 자주 규제에 맡기며 EU에서는 옵 트인 방식의 직접 규제를 채택하고 있다. 또한 유럽 인터넷 광고 협회 Interactive Advertising Bureau (IAB) Europe에서는 홈 페이지 Your Online Choices (http://www.youronlinechoices.eu/)를 통 해 각국의 행동 타겟팅 광고를 실시하는 사업자가 일람화 되고 하고 사용 자는 이를 통해 자신에 대한 사업자의 행동정보의 취득을 승인 또는 거부 할 수 있게 하였다. 정보주체의 동의를 구하는 방식에 대해 현재까지는 주로 미국은 민간 의 자주규제 중시, EU은 법률에 의한 규제 중시, 따라서 미국은 옵트아웃
156 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 이 주류, EU은 옵트인이 주류하는 것이 기본적인 흐름이었다. 그러나 최 근 들어 미국에서도 정부당국의 역할의 증대되는 반면, EU에서는 특히 영국이 자주 규제와 그에 대한 정부당국의 관여의 양쪽을 중시한 방향으 로 가고 있는 경향을 보이고 있다. 현재 각종 센서나 카메라 등에 의해 개인과 관련된 정보 수집이 행해지 고 있다. 스마트폰이나 태블릿단말기와 같은 스마트 디바이스로부터의 정보 수집에 대해서는 옵트인이지만 공공장소나 점포 등에 설치한 기기 에 의한 정보 수집에 대해서는 충분한 고지가 이루어지고 있는 상황이 아 니다 48). 유저의 수용성의 면에서는 어떠한 데이터가 수집되고 있는지 모 름으로 해서 불안감이 있을 수 있다. 특히 병원이나 경찰서, 숙박시설과 같은 장소 혹은 센시티브한 상품과 관련된 경우는 저항감이 높을 수 있 다. 이러한 상황을 고려하여, 앞으로 서비스업의 진전과 함께 기술의 고 도화에 의해 각종 센서의 이용이 보다 활발해 질 것을 대비해 어떤 적극 적인 형태의 고지 방법(환경 옵트인)이 필요할 것으로 보인다. 특히 정보 이용의 목적이 방범 대책이나 재해 대책 등의 경우는 일반적인 경우보다 한층 더 제한이 완화되거나 경감될 가능성이 있을 것이다. 사업자와 이용자의 사이에는 정보의 비대칭성이 존재한다. 이러한 비 대칭성을 메우기 위해 옵트인 방식으로 사전 동의를 얻은 후 정보 취득을 실시하고 있는 것이 현실이다. 그러나 서비스의 약관이 전문가가 아니고 서는 이해하기 없는 내용의 것들이 있으며, 일반적으로 이용자가 그 내용 을 숙독한 다음 동의한다고 보기는 어렵다. 그 결과 기존의 서비스 사업 자는 형식적으로 이용자의 동의를 얻는 경우가 적지 않다. 때로는 그러한 형식적인 동의 절차를 생략함으로 해서 소송 위험을 질 수도 있다. 반면 새로운 서비스를 실시하는 사업자에 있어서는 이용자의 동의를 얻는 것 48) 財 団 法 人 日 本 情 報 処 理 開 発 協 会 パーソナル 情 報 の 利 用 のための 調 査 研 究 報 告 書 2011.3
제4장 빅데이터 프라이버시 보호방안 157 이 한층 더 어려워져 새로운 서비스의 창출이 저해될 가능성도 있다. 사업자는 이용자로부터 사전 승낙을 얻기만 하면 아무 문제가 없다고 할 수 있는 것만은 아니다. 마케팅 회사가 소비자로부터 개인정보를 수집 하는 것은 정상적인 사업 활동이며, 자사의 영업 재료를 모으기 위해서 정보 제공자에게 사례를 지불하는 것도 당연하지만, 이용자가 본인의 개 인정보에 대해 안이하게 생각하고 응답을 하는 위험성도 있다. 정보를 제 공함으로써 할인을 받는다든가 무료 서비스를 받을 수 있다는 유인에 쉽 게 넘어 가는 경우이다. 이를 모두 이용자의 자기 책임이라고 주장하는 것은 기업으로서 사회적 책임을 저버리는 처사라 할 수 있다. 개인정보를 수집하고 이용함에 있어서는 비록 이용자가 사전 승인을 한 건이라 해도 서비스 목적 외의 사용을 철저히 금지하고, 서비스에 이용되지 않는 정보 는 수집 자체를 금하는 것이 당연하며 이에 대한 명확한 규제가 필요하다 고 보인다. 2. 빅데이터 활용에 있어서의 프라이버시 보호기술 빅데이터의 활용에 있어서의 가장 논란이 되고 있는 것은 개인의 각종 기록 정보를 수집하여 분석함으로 해서 생길 수 있는 프라이버시의 침해 에 대한 위험성의 문제이다. 이는 외부로부터의 침입에 의한 데이터의 유 출의 위험성과 데이터 취급자의 부적절한 업무처리로 인한 무의식적인 공개와 같은 잠재적 위험성, 그리고 내부자의 불법적인 열람 행위 등에서 비롯되는 위험성을 내포하고 있다. 프라이버시가 노출되거나 개인 정보가 악용된 경우 사회적으로 큰 파 장이 일어남은 물론 경제적인 면에서도 손해 배상과 대책 비용의 발생, 사업 활동의 자숙 혹은 신용 저하에 따른 매출 감소 등의 비용이 발생한
158 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 다. 실제적인 예로 일본의 경우 일본네트워크 보안 협회의 보고서에 따르 면 2011 년에 연간 약 1,551 건의 개인 정보 유출과 1,900 억 엔(약 2조 원) 이상의 손해 배상이 있다고 한다 49). 이런 점을 보아도 여전히 정보보 안 문제는 그 경제적인 영향도 큰 것이다. 이러한 문제에 대해 적절히 대 처하기 위해 사회적인 큰 틀에 있어서의 법제도적인 대책에서부터 비롯 하여 조직적인 대책, 기술적인 대책 등이 검토되고 있다. 법제도의 측면에서는 한국과 일본에서는 개인정보법이 제정되어 있으 며, 미국에는 옵트아웃을 기반으로 한 소비자 프라이버시 권리 장전 (Consumer Privacy Bill of Rights), 유럽의 옵트아웃을 기반으로 한 EU 데이터 보호 규정 (General Data Protection Regulation) 등 이 정비 되어 있다. 조직적인 대책으로는 법에서 규정한 안전관리 조치를 준수하는 차원에서 정보보호관리체계(ISMS)와 프라이버시 영향평가 (PIA) 등의 시스템 운용과 관리상의 각종 기법이 도입되고 있다. 또한 기 술적인 면에서도 여러 가지 기법이 연구 개발되어 적용되고 있다. 그러나 개인정보 보호를 과도하게 중시하면, 빅데이터의 활용을 저해 하게 될 우려가 있다. 이는 서비스 공급자와 이용자의 양자가 상호간에 다양한 효용성을 얻을 수 있는 기회를 놓치는 것이 된다. 이러한 점에서 법제도적, 제도적, 기술적 대책을 적절히 운용하여 정보 주체가 안심하고 자신의 데이터를 제공하게 하고 빅데이터가 적극적으로 활용되게 하는 일이 중요하다. 그런 의미에서 이 장에서는 프라이버시 보호를 위한 제도 적 대책을 개괄하고 기술적인 기법에 대해 소상히 살펴보도록 한다. 49) 日 本 ネットワークセキュリティ 協 会 2012 年 情 報 セキュリティインシデントに 関 する 調 査 報 告 書 - 個 人 情 報 漏 えい 編 - 2012 年 12 月 7 日
제4장 빅데이터 프라이버시 보호방안 159 가. 정보보호관리체계(ISMS) 정보보호관리체계(ISMS: Information Security Management System)는 기업이나 조직이 정보보호 활동을 체계적이고 지속적으로 수 행하기 위해, 보안정책을 수립하고 이에 근거한 계획의 작성, 실시, 운영, 그리고 일정 기간 후의 보안 방침과 계획의 재검토 등을 포함한 전체적인 위험 관리를 지속적으로 수행하는 체계를 말한다 (http://isms.kisa.or.kr/kor/intro/intro01.jsp). 기업이나 조직이 ISMS를 보유하고 유지하고 있는 지에 대해서는 ISMS 인증제도 를 통하 여 제도적으로 보증 받는다. 이는 제삼자 기관에 의한 인증 심사에 의해 정보보안 관리체계의 국제규격인 ISO/IEC17799:2000 및 BS7799-2:1999에 입각한 평가를 받는 것이다. ISMS에 요구되는 범위 는, ISO/IEC 15408등이 정하는 기술적인 정보보안 대책의 레벨이 아니 라 조직 전체에 있어서 보안 관리 체제를 구축 감사하고 위기관리를 실 시하는 것이다. ISMS는 개별적인 문제에 대한 기술 대책 외에도 조직 관 리의 일환으로서 스스로의 위험을 평가하여 필요한 보안 레벨을 정하고 계획에 따라 자원을 배분해서 시스템을 운용하는 것이다. 조직이 보호해 야 할 정보 자산에 대해서, 기밀성, 완전성, 가용성을 균형 있게 유지하고 개선하는 것이 ISMS의 기본 컨셉이다. 나. 프라이버시 영향평가 (PIA) 프라이버시 영향평가(PIA: Privacy Impact Assessment)는 개인정보 를 수집하여 취급하는 정보 시스템의 기획, 구축, 보수 유지 과정에 있어 서 개인정보 제공자의 프라이버시에의 영향을 사전 에 평가하는 일련의
160 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 프로세스를 말한다. 이를 통하여 잠재적인 프라이버시 침해 위험성을 분 석하고 대안적인 방법이나 보호방안을 검증하는 등 정보 시스템의 구 축 운용을 적정하게 실시할 수 있도록 하는 과정을 포함한다. 설계 단계 에서부터 프라이버시 보호 대책을 검토함으로써, 정보시스템 가동 후의 프라이버시 리스크를 최소한으로 억제할 수 있어 향후 시스템의 개보수 에 따르는 추가 비용의 발생을 막을 수있다. PIA는 2008년 4월 ISO22307 (Financial services Privacy impact assessment)로서 표 준화 되었다. 부제의 타이틀에서 의미하는 바와 같이 금융 서비스를 제공 하는 기업이 고객과 거래처 등의 재무 데이터의 처리와 관련된 프라이버 시 보호와 리스크에 대처하기 위한 방법론이 정의되어 있다. 그러나 그 내용이 금융 관련 서비스에 특화한 것이 아니고 민간부문 및 공공부문을 불문하고 다양한 분야에 적용 가능한 것이다. 또, 요구 사양이 각국의 법 체계나 사회제도에 의존하지 않는 최대공약수적인 내용이다. 실제적으로 법령상의 해석이나 익명화와 같은 기술적인 대책만으로는 개인정보의 이용을 정당화 하는데 충분한 근거를 마련할 수 없는 상황이 생길 때가 많다. 이런 상황을 해소하는데 있어 PIA의 프로세스로서 활용 하는 것이 유효할 수 있다. 즉 개인정보의 보호와 이용의 균형을 도모하 기 위해 개인정보의 이용에 수반되는 프라이버시에의 영향(리스크)을 평 가해서 정보 이용에 의해 초래되는 편익과 비교한다. 이를 토대로 정보 주체자를 비롯한 이해관계자들의 의향을 파악하여 이를 반영한 적절한 조치를 강구함으로써 정보 이용에 대한 정당성을 확보하는 것이다. 이용 자의 의향을 존중하는 마켓 어프로치 에 의한 개인정보의 이용이다 50). 예를 들면, 지자체가 주민(소비자)에게 새로운 서비스를 제공하기 위해 50) 小 林 慎 太 郎, プライパシー 影 響 評 価 (P1 A) に 基 づく 個 人 情 報 の 有 効 活 用 を 考 える NRIパブ リックマネジメントレビュー 2012 Dec. Vol.113p.1-6
제4장 빅데이터 프라이버시 보호방안 161 서 개인정보의 이용이 필요하게 되었을 때를 가정하자. 이 때 주민 각자 로부터 동의를 취득하려면 막대한 비용과 시간이 걸리므로 옵트아웃 방 식의 서비스를 실시하기로 검토한다고 하자. 사전에 가능한 수의 다양한 층의 이용자에게 설문조사나 인터뷰 조사를 실시하여 주민의 의향을 수 집하고 예견되는 리스크를 회피 경감하는 조치를 강구하는 프로세스를 수립하여 주민으로 하여금 서비스를 위해 개인정보를 이용하는데 대한 판단 재료로 삼게 한다. 게다가 PIA의 실시 결과를 공표하면 투명성이 높 아져 주민(소비자)으로부터 신뢰를 얻을 수 있어 원활한 서비스 운영에 기여할 것으로 기대된다. 다. 프라이버시 보호기술의 분류 개인과 관계되는 정보를 유통함에 있어서 법제도적인 대책과 조직적인 대책을 완수하기 위해서는 기술적인 대책이 뒷받침되어야 한다. 프라이 버시 보호를 위해 정보 유통에 강한 제약 조건을 두게 되면 정보의 가치 를 잃게 되거나 손상되어 사회적으로는 물론 정보 주체자가 본인에게도 손실을 가져 오게 된다. 서비스를 개인화하는데 있어 개인 정보는 불가결 한 요소이기 때문이다. 이러한 문제를 기술적으로 보완하기 위하여 최근 개인 정보의 이용과 프라이버시 보호의 밸런스를 취하는 방안이 연구되 고 있다. 그 중에서도 특히 프라이버시 보호 데이터 마이닝(PPDM: Privacy-Preserving Data Mining)에 관한 연구가 많은 주목을 받고 있 다. 이는 명확히 정의된 것은 아니나, 개인정보나 기밀정보의 안전성을 유지하고 개인의 프라이버시를 보호하면서 대규모의 데이터로부터 특징 이나 규칙성 등을 추출하고 새로운 지식을 발견하는 데 활용하기 위한 기 술을 총칭하는 것이다.
162 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - PPDM에는 데이터가 가진 정보의 일부를 누락시키거나 개인을 특정할 수 있는 요소를 삭제 은폐하는 등의 익명화 수법과, 통계학적인 처리에 의해 DB에 잡음을 첨가하여 통계적인 성질을 유지하면서 데이터의 누설 을 막는 교란 수법, 데이터가 가진 정보에 손상을 입히지 않고 당사자 간 에 정보를 주고받는 암호화 수법 등이 있다. 현재는 정보 공개에 일반적 으로 활용될 수 있는 익명화 기술이 많이 연구되고 있다. 그러나 데이터 의 익명화는 정보의 손실을 초래하여 데이터 마이닝(data mining)의 결 과에 영향을 미치게 됨으로 활용 용도에 따라 프라이버시 보호 수준을 고 려하여 익명화 처리에 특히 주의를 기울일 필요가 있다. 한편, 암호화 수 법 중에는 데이터를 복수의 그룹에 나누어서 분리 보관하고, 그룹사이의 공개키 암호로 데이터를 암호화한 채로 필요에 따라 데이터 마이닝(data mining)을 위한 계산을 실시하여 그 결과만을 전체 그룹 사이에 공유하 는 비밀 계산 기술도 최근 연구되고 있다. <표 3-1>은 PPDM의 수법을 분류한 것이다. <표 4-1> PPDM의 분류 익명화 수법 교란수법 DB의 공개에 대한 프라이버시 보호 - 단순 익명화(식별자의 삭제) - 통합적 익명화 (k-익명성, L-다양성, t-근사성) - Random화된 잡음의 가산 (Perturbation) 출력데이터(Query응답)에 대한 프라이버시 보호 - Query추론의 억제 (Query감사, Query응답 의 모호화 등) - 교란에 의한 차분 프라이버시 (Differential Privacy)의 실현 암호화수업 - SMC(Security Management Center)에 의한 프라이버시 보호 - 준동형 암호(Homomorphic Encryption Schemes) 자료: 独 立 行 政 法 人 情 報 処 理 機 構 パーソナル 情 報 保 護 とIT 技 術 に 関 する 調 査 調 査 報 告 書 p.99 2012.8
제4장 빅데이터 프라이버시 보호방안 163 익명화 수법은 데이터의 공개에 의해서도 데이터 속에 포함된 개인이 식별되지 않는 것을 보증하는 것을 주된 목적으로 한다. 따라서 프라이버 시 보호 데이터 마이닝(Data Mining)과는 다소 입장이 달라 이를 구별하 여 Privacy-Preserving Data Publishing이나 Statistical Disclosure 등으로 불리기도 한다. 본 보고서에서는 현재 가장 활발히 연구되고 있는 익명화 기술에 대해 상세히 기술하도록 한다. k-익명성(k-anonymity)은 공개된 데이터 테 이블 내에서 개개인을 특정할 수 있는 확률이 낮아 지도록 (k값의 역수) 정보의 일부를 은폐함으로써 개인 식별의 리스크에 대해 안전성을 확보 하는 것이다. L-다양성 (L-Diversity)은 k-익명성의 취약점을 보완하기 위해 도입된 개념으로서 개인의 속성 정보가 추론되기 어렵도록 익명화 하는 수법이다. t-근사성은 L-다양성의 취약점을 더욱 보완하여 개인의 속성 정보가 확률적으로 추론되는 것을 어렵도록 하는 수법이다.
제5장 인터넷 사용자의 정신건강 척도개발
5 인터넷 사용자의 정신건강 척도개발 << 지식정보화 사회의 진전과 경제위기와 글로벌 금융위기 등으로 인한 실업 및 생활고로 인한 정신질환이 날로 증가하고, 인구의 노령화와 핵가 족화 등 인구구조 및 가족구조의 변화로 정신질환자에 대한 가족부양능 력이 감소됨에 따라 국가차원의 정신건강증진을 통한 사전예방활동의 중 요성이 강조되고 있다. 또한 지나친 인터넷 사용의 위험성과 그 피해 정 도에 대한 연구가 시도되고는 있으나, 이에 대한 경과 및 특성 연구의 미 비와 더불어 인터넷 정신건강에 대한 일관된 선별기준의 부재로 인해 체 계적인 연구가 이루어 지지 못하고 있는 상태이다. 인터넷과 사회네트워 크서비스(Social Network Service: SNS)의 급속한 보급은 온라인상에 서 불특정 타인과 관계를 맺음으로써 경제기회의 창출과 함께 사회갈등 해소 등의 장점이 있으나, 개인정보의 유출과 범죄에 악용되면서 피해자 의 심신의 고통과 자살충동을 유발하는 등의 부작용도 대두되고 있다. 우리 생활의 일부가 되어 있는 인터넷은 유용한 도구로 역할하고 있음 에는 틀림없으나, 그에 못지않게 인터넷 사용 문제에 대한 경각심 또한 높아지고 있다. 억제하지 못할 정도로 인터넷에 몰두하거나, 당초 예상보 다 훨씬 많은 시간을 온라인에서 소비하는 등 과도한 인터넷 사용이나 몰 두로 인해 임상적으로도 손상이 초래되는 경우가 보고되면서(Shapira, Lessig, Goldsmith, Szabo, Lazoritz, Gold, & Stein, 2003) 급기야는 사회 전반에 인터넷 중독이라는 신조어가 등장하기에 이르렀다(한국정보 문화진흥원, 2002, 2005, 2006; 한국정보화진흥원, 2011). 우리나라에서는 한국정보화진흥원이 인터넷 중독 실태조사를 매년 시
168 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 행함으로써 인터넷 사용 문제 실태에 대한 전수조사를 통해 주요 지표를 제공하고 있다. 청소년용 인터넷 중독 진단척도는 인터넷 중독에 대해 인터넷 사용에 대한 금단과 내성을 지니고 있으며, 이로 인해 일상생활 의 장애가 유발되는 것을 말한다. 고 정의하면서 다음과 같은 진단기준을 제안하였다(한국정보문화진흥원, 2002): (1) 일상생활 장애, (2) 현실구 분 장애, (3) 긍정적 기대, (4) 금단, (5) 가상 대인관계 지향성, (6) 일탈행 동, (7) 내성. 성인용 인터넷 중독 진단척도는 인터넷 중독을 개인적인 만족감을 얻기 위하여 시작된 인터넷 사용 행동이 점차 사용시간이 증가 되어 동일한 만족을 얻기 위해서는 더 많은 시간을 지속하게 되고, 중단 했을 때 신체적, 심리적으로 불쾌감과 불 만족감을 초래하여 분명하게 사 회적, 심리적, 신체적으로 부정적인 영향이 발생되고 있음에도 불구하고 자기 통제력을 상실하고 부적응적인 인터넷 사용 행동이 지속되고 있을 것을 말한다. 고 정의하였고(한국정보문화진흥원, 2005), 다음과 같은 진 단기준을 제안하였다: (1) 가상세계 지향, (2) 긍정적 기대, (3) 내성 및 몰 입, (4) 인터넷에 대한 자기인식. 인터넷 중독의 사회적 비용은 연간 최대 5조4천570억 원 51) 에 육박하 며, 고위험군은 계속 증가하고 있다( 11년 1.4% 12년 1.7%). 이는 인 터넷 중독의 사회적 영향력을 보여주는 일례라 할 수 있겠으며, 따라서 정부의 체계적 대응 마련이 필요하다(KBS 뉴스, 2011). 현재 복지부 행 정안전부 여성가족부 등의 타 부처 협력을 통해 인터넷 중독 해소를 추 진 중이나( 12년 91억 원) 인터넷 사용자의 정신건강 실태를 파악하고 인 터넷 중독에 개입하여 그 효과를 입증할 만한 프로그램은 부재한 실정이 다. 따라서 본 연구는 인터넷과 사회네트워크서비스(Social Network 51) 이 같은 손실비용은 인터넷 중독으로 발생하는 질병에 대한 직간접 보건의료비용과 실 제 인터넷 사용에 따르는 화폐비용, 인터넷 중독으로 인한 작업ㆍ학업 손실비용 등을 포함한다(한국일보, 2011).
제5장 인터넷 사용자의 정신건강 척도개발 169 Service)의 역기능으로 초래될 될 수 있는 인터넷 사용자의 정신건강문 제를 파악하고, 이에 대한 관리 및 개입이 가능한 중점 부분에 초점을 두 어 인터넷 사용자의 정신건강을 측정할 수 있는 도구를 선별하여 제안하 고자 하였다. 1. 연구내용 가. 정신건강 측정을 위한 관련 척도 <표 5-1> 정신건강 측정을 위한 관련척도 구분 자아개념 척도 심리 및 정신건강 척도 척도 (개발자) 1. 자기유능감 척도 (박현선) 2. 자기효능감 척도 (Shere 외) 3. 자기효능감 척도 (Tipton & Worthington) 4. 자아정체감 척도 (Dignan) 5. 자아정체성 척도 (최정훈 외) 6. 자아존중감 척도 (최보가, 전귀연) 7. 자아존중감척도 (Coopersmith) 8. 자아존중감 검사도구 (김경연) 9. 자아존중감 척도 (Hudson) 10. 자아존중감 척도 (Rosenberg) 1. 경제적 스트레스 척도 (Conger 외) 2. 내외통제성 척도 (Rotter) 3. 상태 특성 불안 척도 (Spielberger) 4. 생활사건 질문지 (Brugha) 5. 섭식태도 검사 (Garner & Garfinkel) 6. 스트레스 척도 (Holmes & Rahe) 7. 시험불안 측정도구 (Sarason) 8. 역기능적 태도 척도 (Weissman) 9. 외적 통재소 성향 (Berrenberg) 10. 일상적 스트레스 척도 (유안진, 한미현) 11. 자기평가 우울반응 척도 (Zung) 12. 정서적 및 사회적 고립 척도 (Vincenzi & Garabosky) 13. 증상 체크리스트 (Bartone 외) 14. 표출정서수준 측정도구 (Cole & Kazarian) 15. 한국판 일반정신건강 척도 (신선인, 2001)
170 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 구분 사회적 기능 척도 가족관련 척도 척도 (개발자) 1. 공격성 척도 (Buss & Perry) 2. 공격성 척도 (연진영) 3. 공격성 척도 (Buss & Durkee) 4. 권위행동 척도 (Rigby) 5. 대담성 척도 (Bartone, Ursan, Wright & Lngraham) 6. 대인관계변화 척도 (Schlein & Guerney) 7. 대처기제 척도 (Carver) 8. 대처기제 척도 (Lazarus & Folkman) 9. 또래 애착 척도 (Armsden & Greenberg) 10. 문제해결 척도 (Hellner & Petersen) 11. 사회적 문제해결 척도 (D'Zurilla & Nezu) 12. 사회행동 척도 (Trower) 13. 성인 애착 질문지 (Bartholomew & Horowitz) 14. 아동 행동경향 척도 (Deluty) 15. 일상생활동작수행 평가도구 (Granger) 16. 자기관리기술 측정도구 (유숙자) 17. 주장성 척도 (Rathus) 18. 청소년 대처 척도 (Alva) 19. 청소년 문제대처행동 척도 (Patterson & McCubbin) 20. 학교적응 유연성 (박현선) 1. 가정환경 자극검사 (Syracuss 대학 연구팀) 2. 가족 관계 척도 (Hudson) 3. 가족사정 척도 (Epstein 외) 4. 가족 생활사건 및 변화 척도 (McCubbin 외) 5. 가족위기지향 개인평가 척도 (McCubbin 외) 6. 가족 응집력과 가족 적응성 척도 (Antonovsky & Sourani) 7. 가족 적응성과 응집력 평가 척도 (Olson 외) 8. 갈등전술 척도 (Straus) 9. Kansas 결혼 만족도 척도 (Schumm) 10. 결혼 불안정성 지수 (Edward 외) 11. 부모의 건강대처 목록 (McCubbin 외) 12. 부모 양육태도 척도 (이시형 외) 13. 부모 양육행동 척도 (김혜영) 14. 부모 애착 척도 (Armsdem & Greenberg 외, 1987), (Leathers, 2000) 15. 부모 유대 척도 (Parker 외) 16. 부부 적응 척도 (Spanier) 17. 양육 스트레스 척도 (Abidin) 18. 원가족 척도 (최현미) 19. 가족기능 조사서 (Feetham)
제5장 인터넷 사용자의 정신건강 척도개발 171 구분 사회적 관계망 척도 척도 (개발자) 1. 나의 가족과 친구들 척도 (Abery & Fahnestock) 2. 다차원 지지 척도 (Winefield 외) 3. 대인관계 지지 평가 척도 (Cohen 외) 4. 사회적 갈등 척도 (유조안) 5. 사회적 지지 지각 척도 (한미현) 6. 사회적 지지 척도 (박지원) 7. 사회적 지지 척도 (Hermandez) 8. 지각된 사회적 지지에 대한 다차원 척도 (Zimet 외) 9. 부모의 스트레스 척도 (Green) 조직, 직무관련 척도 기타 1. 사회복지사 임파워먼트 척도 (Leslie, Holzhalb, Holland) 2. 소진 척도 (Maslach & Jackson) 3. 업무환경 척도 (Jayaratne & Chess) 4. 의사결정 참여 척도 (Ramsdell) 5. 조직헌신 척도 (Porter, Seers, Mowday & Boulian) 6. 직무기술 척도 (Smith, Kendall & Hulin) 7. 직무진단 척도 (Hackman & Oldman) 1. 노인의 생활만족도 척도 (최성재) 2. 삶의 만족 척도 (양옥경) 3. 생활만족도 척도 (Neugarten 외) 4. 수용성 척도 (Voeltz) 5. 장애태도요인분석 척도 (McHale & Simeonsson) 6. 정신질환자에 대한 가족의 태도척도 (Cohen & Srtuening) 7. 인터넷중독 자가진단척도 (Young) 2. 인터넷 사용자의 정신건강 측정을 위한 도구 가. 한국판 일반정신건강척도 : KGHQ-20(Korean General Health Questionnaire-20) General Health Questionnaire(GHQ)는 1972년 영국에서 개발되 어 영국문화권 뿐 아니라 중국과 일본을 포함한 약 40여개 이상의 언어로 번역되어 사용되어 오고 있다(Goldberg & Williams, 1991; 신선인, 2001). GHQ 원문은 60문항으로 이루어져 있으나, 선행연구에서는 30
172 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 문항, 28문항, 20문항 등 여러 형태를 사용하고 있다. GHQ는 응답자의 건강상태에 나쁜 영향을 주는 사회 심리적 요인을 측정함과 동시에 전체 도구를 구성하고 있는 하위요인들을 분석해 냄으 로써 질환의 유형을 유추할 수 있는 도구로 보고되고 있다(Goldberg & Williams, 1991). 특히 GHQ는 비의료전문가들이 지역사회주민의 일반 적 정신건강수준을 간편한 방식으로 보다 쉽게 측정, 정신건강 문제를 지 닌 대상자를 일차적으로 선별 가능하도록 하였다(신선인, 2001). 우리나 라에서는 20문항형의 GHQ가 번역되어 사용된 바 있으나(남정자 최정 수, 1993), 도구에 대한 표준화 작업이 선행되지 않은 채 연구에 사용되 었다는 제한이 보고되었다(신선인, 2001). 따라서 신선인(2001)은 한국 판 일반정신건강척도(Korean General Health Questionnaire: KGHQ)를 표준화하여 개발함으로써 척도의 신뢰도 및 타당도를 검증하 였으며, KGHQ-20의 하위요인으로 불안, 우울, 사회적 부적응 및 외출 빈도의 4가지로 분류하여 보고하였다. 본 연구에서는 신선인(2001)이 한 국판으로 표준화한 KGHQ-20문항형을 이용하였으며, 척도의 응답 값을 4점 척도로 평정하여 최저 20점에서 최고 80점 사이의 점수분포를 보이 며, 획득된 점수가 높을수록 정신건강수준이 좋지 않음을 의미한다. 나. 인터넷 중독 자가진단척도 인터넷 사용 문제에 대한 연구와 함께 인터넷 중독이라는 용어를 제안 한 Kimberly Young(1996, 2004)은 인터넷 중독에 해당되는 경우를 인터넷 의존자(Dependent Internet User)라고 하였으며, 인터넷 사용 에 있어서도 물질, 알코올, 담배, 그리고 도박 등과 마찬가지로 행동중 독 의 범주로 취급될 수 있는 가능성을 보고하였다(Young, 1996).
제5장 인터넷 사용자의 정신건강 척도개발 173 Young은 인터넷 의존자들이 인터넷 사용을 통제하거나 조절할 수 없다 는 점에서 병적 도박과 같은 상태라고 보았으며, 인터넷 사용 행동을 계 속하려는 충동이나 유혹에 저항하지 못한다는 측면에서 충동조절장애의 한 종류로 보았다. 이러한 논리에 따라 Young(1996)은 인터넷 DSM-IV의 병적 도박의 진단기준을 적용하여, 오랜 시간 온라인의 접 속, 인터넷을 못할 시의 금단 현상, 의도했던 것보다 자주 또는 오랫동안 접속, 접속을 줄이려는 시도의 실패, 온라인 접속시간을 늘리기 위한 시 도, 사회생활, 직장생활 또는 여가활동에 대한 흥미 상실, 인터넷 이용으 로 생활상의 문제 발생 및 인터넷을 사용하지 않을 때에도 빨리 접속해 지고 싶어 함 등의 8가지 진단 준거를 제시하였다. 본 연구에서는 Young(1996)이 개발한 인터넷 중독 자가진단법(Young s Internet addiction test: YIAT20) 을 사용하여 인터넷 중독에 해당하는 경우를 선별하였으며, 각 문항에 대하여 1점~5점으로 나누어 점수를 매긴 뒤, 이를 합산하여 인터넷 중독경향을 측정하였다. 최저 20점에서 최고 100 점 사이의 점수분포를 보이며, 점수가 높을수록 인터넷 사용에 문제가 있음을 의미한다(Young, 1998). 3. 연구방법 2013년 8월 한국보건사회연구원에서 인터넷을 통한 설문조사를 실시 하였으며, 설문에 응답한 1,214명의 자료를 분석하였다. 통계분석을 위 해 SPSS v. 20을 사용하였으며, 분석방법으로는 기술통계, 신뢰도 분석, 교차분석(χ2) 및 분산분석(ANOVA)을 실시하였다.
174 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 4. 연구결과 가. 일반적 특성 본 설문에 응답한 대상자는 남자가 56.3%, 여자가 46.7%로 남자가 많 았으며, 연령별로는 30대가 44.2%, 20대가 28.2%로 나타났다. 학력별 로는 중학교 졸업(66.7%)과 고등학교 졸업(22.8%)이 전체의 대다수를 차지하였다. 전문사무직이 44.1%, 미혼이 58.1%, 주관적으로 본인이 건 강한 편이라고 대답한 응답자가 41.0%, 매우 건강하다고 응답한 경우도 11.9%로 나타났다. 만성질환을 앓고 있는 응답자가 22.3%, 그렇지 않은 경우가 66.2%로 나타났으며, 본인의 만성질환 유무에 대해 모르고 있는 경우도 11.4%나 되었다<표 5-2>. <표 5-2> 일반적인 사항 (단위: 명, %) 성별 합계 남자 여자 계 1,214 (100.0) 684 ( 56.3) 530 (46.7) 연령 10대 30 ( 2.5) 16 ( 2.3) 14 ( 2.6) 20대 342 ( 28.2) 177 ( 25.9) 165 ( 31.1) 30대 536 ( 44.2) 302 ( 44.2) 234 ( 44.2) 40대 221 ( 18.2) 148 ( 21.6) 73 ( 13.8) 50대 이상 85 ( 7.0) 41 ( 6.0) 44 ( 8.3) 최종학력 초졸 88 ( 7.2) 56 ( 8.2) 32 ( 6.0) 중졸 810 ( 66.7) 469 ( 68.6) 341 ( 64.3) 고졸 277 ( 22.8) 140 ( 20.5) 137 ( 25.8) 대학교 졸업 이상 39 ( 3.2) 19 ( 2.8) 20 ( 3.8)
제5장 인터넷 사용자의 정신건강 척도개발 175 성별 합계 남자 여자 직업 전문사무직 535 ( 44.1) 312 ( 45.6) 223 ( 42.1) 서비스판매직 181 ( 14.9) 97 ( 14.2) 84 ( 15.8) 생산직 66 ( 5.4) 59 ( 8.6) 7 ( 1.3) 농수축산 13 ( 1.1) 11 ( 1.6) 2 ( 0.4) 공무원 36 ( 3.0) 26 ( 3.8) 10 ( 1.9) 교사 및 교수 29 ( 2.4) 15 ( 2.2) 14 ( 2.6) 학생 132 ( 10.9) 83 ( 12.1) 49 ( 9.2) 무직 142 ( 11.7) 49 ( 7.2) 93 ( 17.5) 기타 80 ( 6.6) 32 ( 4.7) 48 ( 9.1) 혼인상태 미혼 705 ( 58.1) 410 ( 59.9) 295 ( 55.7) 기혼 500 ( 41.2) 266 ( 38.9) 234 ( 44.2) 기타 9 ( 0.7) 8 ( 1.2) 1 ( 0.2) 건강상태 매우건강 145 ( 11.9) 105 ( 15.4) 40 ( 7.5) 건강한 편 498 ( 41.0) 209 ( 43.1) 203 ( 41.0) 보통 391 ( 32.2) 206 ( 30.1) 185 ( 32.2) 건강하지 못함 167 ( 13.8) 72 ( 10.5) 95 ( 13.8) 매우 건강하지 못함 13 ( 1.1) 6 ( 0.9) 7 ( 1.1) 만성질환 유무 있음 271 ( 22.3) 149 ( 21.8) 122 ( 23.0) 없음 804 ( 66.2) 466 ( 68.1) 338 ( 63.8) 모름 139 ( 11.4) 69 ( 10.1) 70 ( 13.2) 나. 척도의 신뢰도 및 상관관계 척도의 신뢰도는 Cronbach s α를 통해 분석하였으며, KGHQ-20은.705, YIAT20은.948로 두 척도 모두 높은 신뢰도를 보였다. 두 척도간 상관관계는 통계적으로 유의한 것으로 나타났다(Pearson r=.268, p<.01).
176 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 다. 한국판 일반정신건강척도 (KGHQ-20) 각 문항과 그에 따른 평균은 <표5-3>와 같으며, 일반적 특성에 따른 분 석결과는 <표 5-4>과 같다. 정신건강척도는 연령(F=3.654, p<0.05) 및 주관적 건강상태(F=8.944, p<0.001)에 따라 통계적으로 유의한 차이가 보였다. <표 5-3> 한국판 일반정신건강척도 문항 평균 (S.D.) 하고 있는 일에 잘 집중할 수 있었습니까? 2.0(0.6) 걱정 때문에 잠을 잘 못 잔 적이 많았습니까? 2.4(0.9) 자신이 여러면에서 쓸모 있는 역할을 잘 하고 있다고 느꼈습니까? 2.2(0.7) 매사에 올바른 결정을 잘 내릴 수 있었습니까? 2.3(0.7) 계속해서 긴장감을 느낀 적이 자주 있었습니까? 2.4(0.8) 어려움을 극복할 수 없다고 느낀 적이 있습니까? 2.4(0.8) 일상적인 활동을 즐겁게 할 수 있었습니까? 2.1(0.7) 문제가 생기면 그것을 피하지 않고 맞서서 해결하려고 하였습니까? 2.3(0.8) 우울감과 불행감을 느낀 적이 많습니까? 2.4(0.9) 자신감이 없어졌다고 느꼈습니까? 2.3(0.8) 그 전과 같은 정도로 외출을 하였습니까? 2.3(0.8) 인생이 절망적이라고 느낀 적이 있습니까? 2.5(0.9) 신경이 쓰여서 힘들게 느껴진 일이 많았습니까? 2.3(0.8) 밤에 잠을 잘 못 이루거나 많이 설치곤 합니까? 2.6(0.9) 어떤 일을 할 때 대부분의 다른 사람들이 하는 만큼 그 일을 잘 처리할 수 있었습니까? 2.1(0.7) 당신과 가까운 사람들에게 따뜻함과 애정을 느낄 수 있었습니까? 2.1(0.7) 자신의 미래를 희망적으로 느꼈습니까? 2.3(0.8) 부지런히 생활하며 일에 전념할 수 있었습니까? 2.2(0.7) 다른 사람들과 잘 지내는 것이 어렵지 않게 느껴졌습니까? 2.3(0.8) 전반적으로 자신이 일을 잘 하고 있다고 느꼈습니까? 2.2(0.7) 매우 그렇다 1, 그렇다 2, 아니다 3, 매우 아니다 4
제5장 인터넷 사용자의 정신건강 척도개발 177 <표 5-4> 일반적 특성에 따른 한국판 일반정신건강척도 총점 통계량 유의수준 성별 남자 45.8 t=0.374 p=0.708 여자 45.7 연령 10대 43.9 20대 45.9 30대 46.1 F=3.654 p<0.05 40대 46.6 50대 이상 45.8 최종학력 초졸 45.1 중졸 45.7 F=0.932 p=0.424 고졸 46.2 대학교 졸업 이상 45.5 직업 전문사무직 45.6 서비스판매직 46.0 생산직 46.7 농수축산 47.3 공무원 43.6 F=1.683 p=0.098 교사 및 교수 44.1 학생 45.4 무직 46.6 기타 45.3 혼인상태 미혼 45.8 t=0.117 p=0.907 기혼 45.7 건강상태 매우건강 43.5 건강한 편 45.7 보통 46.1 F=8.944 p<0.001 건강하지 못함 46.4 매우 건강하지 못함 51.5 만성질환 유무 있음 46.1 없음 45.7 F=0.540 p=0.583 모름 45.6
178 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 라. 인터넷 중독 자가진단 (YIAT20) 각 문항과 그에 따른 평균은 <표 5-5>와 같으며, 일반적 특성에 따른 분석결과는 <표 5-6>와 같다. 인터넷 중독척도는 성별(t=2.421, p<0.05), 직업(F=3.295, p<0.05) 및 주관적 건강상태(F=2.713, p<0.05)에 따라 통계적으로 유의한 차이가 보였다. <표 5-5> 인터넷 중독 자가진단 문항 평균 (S.D.) 예정보다 오래 인터넷에 접속한 적이 있다. 2.0(1.2) 인터넷 때문에 자기 할 일을 소홀히 한 적이 있다. 1.8(1.1) 가족과의 생활보다 인터넷에 더 흥미를 느낀 적이 있다. 1.7(1.2) 온라인상의 친구를 만들어 본 적이 있다. 1.4(1.2) 온라인 접속 때문에 다른 사람이 불평한 적이 있다. 1.3(1.2) 인터넷 때문에 성적이나 학교생활에 문제가 있다. 1.3(1.2) 다른 일을 하기 전에 먼저 메일을 점검한 적이 있다. 1.8(1.2) 인터넷 때문에 능률이나 생산성에 문제가 있다. 1.5(1.1) 누군가가 인터넷에서 무엇을 했느냐고 물으면 숨기거나 변명한 적이 있다. 1.3(1.2) 인터넷에 빠져 현실에서의 어려운 문제를 생각하지 못했던 적이 있다. 1.3(1.2) 인터넷 사용 후 다시 접속할 때까지의 기간을 손꼽아 기다린 적이 있다. 1.3(1.2) 인터넷 없는 생활은 따분하고 재미없을 것이라고 두려워 한 적이 있다. 1.5(1.2) 온라인 접속 중 누군가가 방해하면 화를 내거나 귀찮은 듯이 행동한 적이 있다. 1.4(1.2) 밤늦게까지 접속해 있느라 잠을 못 잔 적이 있다. 1.5(1.2) 현실 생활에서도 인터넷에 접속해 있는 듯한 환상에 빠진 적이 있다. 1.1(1.3) 몇 분만 더 라며 시간을 허비한 적이 있다. 1.6(1.2) 사용시간을 줄이려고 노력했지만 실패한 적이 있다. 1.5(1.2) 사용시간을 숨겨본 적이 있다. 1.3(1.2) 밖으로 외출하려하기 보다 인터넷에 접속해 있는 것이 좋다. 1.5(1.2) 오프라인 상태에서는 침울하며 신경질적이다가 온라인상에 오면 모두 사라진다. 1.2(1.2) 전혀 아니다 0 - 항상 있다 4
제5장 인터넷 사용자의 정신건강 척도개발 179 <표 5-6> 일반적 특성에 따른 인터넷 중독 자가진단 총점 통계량 유의수준 성별 남자 45.8 t=0.374 p=0.708 여자 45.7 연령 10대 43.9 20대 45.9 30대 46.1 F=3.654 p<0.05 40대 46.6 50대 이상 45.8 최종학력 초졸 45.1 중졸 45.7 F=0.932 p=0.424 고졸 46.2 대학교 졸업 이상 45.5 직업 전문사무직 45.6 서비스판매직 46.0 생산직 46.7 농수축산 47.3 공무원 43.6 F=1.683 p=0.098 교사 및 교수 44.1 학생 45.4 무직 46.6 기타 45.3 혼인상태 미혼 45.8 t=0.117 p=0.907 기혼 45.7 건강상태 매우건강 43.5 건강한 편 45.7 보통 46.1 F=8.944 p<0.001 건강하지 못함 46.4 매우 건강하지 못함 51.5 만성질환 유무 있음 46.1 없음 45.7 F=0.540 p=0.583 모름 45.6
180 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 5. 결론 본 연구는 인터넷 사용자의 정신건강 수준을 파악하기 위하여 선행연 구를 고찰함으로써 측정도구를 선별하였으며, 선별된 도구를 이용하여 인터넷 사용자의 정신건강 수준을 측정하고자 하였다. 따라서 우선적으 로 비의료전문가로서 일반 대상자의 정신건강상의 문제를 선별해 내기 위해 선행연구고찰을 통해 관련 측정도구들을 정리하였다. 그 결과, 자아 개념(10개), 심리 및 정신건강(15개), 사회적 기능(20개), 가족 관련(19 개), 사회적 관계망(9개), 조직 및 직무 관련(7개), 그리고 기타 관련 척도 (7개) 가운데 본 연구를 위하여 일반인을 대상으로 정신건강상의 문제가 있는 대상자를 선별해 내기 위한 일차적 도구로 KGHQ-20를 선별하였 으며, 인터넷 사용자를 대상으로 한 인터넷 중독 자가진단척도로 YIAT20를 선별하였다. 추후 연구를 위한 제언으로, 본 연구결과의 학문 적 활용을 위하여 정신질환 위험군 선별 및 정신건강 수준 측정을 위해 KGHQ와 YIAT20의 채점방법을 다양화하여 타당도를 재검증함과 동시 에 조사 대상자의 특성에 따른 분할 점을 결정하기 위한 노력이 필요하다 하겠다.
제6장 건강정보광장 자료구축 제1절 건강정보 추가개발 제2절 건강정보광장 자료구축 현황 제3절 건강정보광장 시스템 구성도
6 건강정보광장 자료구축 << 제1절 건강정보 광장 추가 구축 1. 개발 목표 및 전략 본 절에서는 건강정보광장 의 2013년도 개발에 대한 목표와 전략, 개 발과전에 대하여 기술하고자 한다. 인터넷 건강정보 게이트웨이 시스템인 건강정보광장 의 2013년도 개 발 추진 목표는 소비자 중심의 건강정보 서비스를 신뢰 할 수 있는 인터 넷 건강 정보의 수집 용이성을 증대시키고, 이용자 맞춤형 건강정보의 서 비스의 연속성을 확보함과 더불어 서비스를 극대화하기 위한 환경 마련 과 기능 개선에 목적을 두었다. 2. 추가개발 내용 2013년 건강정보광장 의 개발 내용은 <표 6-1>과 같이 팝업기능 개 선, 한국보건사회연구원 보건복지통계포털에서 운영하는 건강관련 통계 기능 구현 서비스, 한국보건사회연구원의 건강관련 정책 연구 보고서 및 정기간행물 등의 기능 구현, 건강정보광장 의 Feedback 설문조사 기능 개선 및 사이트 내 데드링크를 보완하는 작업을 추진 진행하였다.
184 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 6-1> 2013년 건강정보광장 개발 내용 구분 팝업 기능 개선 보건복지통계포털의 건강관련 통계 서비스 한국보건사회연구원의 발간자료 링크 서비스 Feedback 기능 개선 데드링크 확인 및 처리 개발내용 - 일반 팝업을 레이어 팝업으로 개선하되 최대 2개의 레이어 팝업이 오픈 될 수 있도록 개발 추진 - 한국보건사회연구원에서 운영하는 보건복지통계 (hawelsis.kihasa.re.kr)포얼에서 제공하고 있는 건강관련 통계(금연, 절주, 영양, 운동, 암, 비만 등)통계를 건강정보광 장 서비스 될 수 있도록 기능 추가 - 관리자 기능 구현 - 한국보건사회연구원의 본원 홈페이지의 발간자료>연구보고 서, 정기간행물 등의 보건 및 건강 정책관련 연구보고서를 건강정보광장 의 건강정책 메뉴를 시설하여 링크 서비스 기 능 구현 - 관리자 기능 구현 - 건강정보광장 내 Feedback 설문 조사 상단 및 하단에 주요 SNS버튼 링크 삽입 - SNS URL을 남길 수 있는 기능 추가 - 건강정보광장 내 데드링크 확인 및 처리 가. 팝업 기능 개선 브라우저의 팝업 차단 기능으로 인하여 팝업 창의 효과가 반감되고 있 어 2013년 건강정보광장 추가 개발을 통하여 팝업 창 차단 기능에서 레이어 팝업 기능으로 구현 하였다. 더불어 팝업 개제 시 오늘 하루 안 보기 기능을 구현하였으며, 팝업 오픈 기준을 최대 2개 까지 가능하도록 기능을 보완하였다. 팝업 기능 개선 화면은 그림 6-1 과 같다.
제6장 건강정보광장 자료구축 185 그림 6-1 2013년 건강정보광장 팝업 기능 개선 화면 나. 보건복지통계포털의 건강관련 통계서비스 기능 구현 건강정보광장 에서는 한국보건사회연구원 에서 운영하는 보건복지 통계(hawelsis.kihasa.re.kr) 포털 시스템의 통계와 연계 기능을 구현 한 페이지로 흡연, 음주, 영양, 운동, 구강보건, 비만 등의 세부 카테고리 별로 구분하여 통계 정보가 조회가 가능한 페이지를 구현하였다. 등록된 통계표는 보건 복지 통계 포털의 팝업 창을 띄워서 보여 주며, 보건 복지 통계표 리스트는 관리자가 수정 및 삭제가 가능하도록 기능을 구현하였다. 건강통계는 건강정책연구 메뉴를 신설하여 서비스 하도록 하였다. 건강통계 개발 화면은 그림 6-2 와 같다.
186 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 6-2 2013년 건강정보광장 건강관련 통계서비스 기능 구현 화면 다. 한국보건사회연구원의 발간자료 링크서비스 구현 건강정보광장 에서는 한국보건사회연구원 의 본원 홈페이지의 발간 자료>연구보고서, 정기간행물 등의 메뉴에서 제공하고 있는 보건 및 건 강 정책 관련 보고서를 연계하여 링크서비스로 이용자들에게 제공하고자 기능을 구현하였으며, 명칭은 건강연구보고서 로 하였다. 건강연구보고서 메뉴에서는 연구보고서 제목, 요약 내용, 발행 년도 및 저자 정보를 제공하고 있으며 관리자 기능을 추가 구현하여 등록 및 수정이 가능하도록 구축하였다. 건강연구보고서 개발 화면은 그림 6-3 과 같다.
제6장 건강정보광장 자료구축 187 그림 6-3 2013년 건강정보광장 건강연구보고서 기능 구현 화면 라. Feedback 기능 개선 건강정보광장 이용 후 이용 만족도 Feedback은 이용자들이 자신의 SNS에 글을 남기고 해당 URL을 사용 할 수 있는 필드 기능을 추가하였 으며 Feedback 페이지의 상단 우측과 하단에 SNS 아이콘을 추가하였 다. 기능 보완 화면은 그림 6-4 와 같다.
188 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 6-4 2013년 건강정보광장 Feedback 기능 개선 구현 화면
제6장 건강정보광장 자료구축 189 제2절 건강정보 광장 자료구축 현황 1. 건강소식 건강소식 메뉴는 건강뉴스, 건강강좌 및 행사. 건강 웹진 소개, 건강 정보 RSS로 구성되어 있으며, 건강소식 메뉴 구성은 <표 6-2>과 같다. <표 6-2> 건강소식 메뉴구성 메뉴 건강뉴스 건강강좌 및 행사 건강웹진소개 건강정보 RSS 세부분류 - 연합뉴스 및 헬스포커스의 건강관련 기사를 제공 - 국내의 국공립병원 및 종합 전문 요양기관 등에서 제공하는 건 강강좌 및 행사 정보를 수집하여 제공 - 국내의 공공기관, 국공립병원, 협회 등에서 제공하는 건강관련 웹진을 수집하여 제공 - 건강정보광장 내 건강강좌 및 행사, 건강뉴스, 웹진 정보를 실시간으로 확인 할 수 있도록 RSS서비스를 제공 2013년 건강정보광장 내 건강소식 메뉴에서 제공하는 건강뉴스 는 2010년부터 연합뉴스와 헬스포커스의 건강관련 기사 전문을 제공하 고 있으며, 2013년 새로이 수집된 445건이 누적되어 현재 4,193건의 건 강관련 기사를 서비스 하고 있다. 건강강좌 및 행사 에서는 2013년 356 건을 수집하여 제공하고 있으며, 건강웹진 에서는 140건을 수집하여 서 비스 하고 있다. 건강정보 RSS 에서는 건강정보광장 내 건강강좌 및 행사, 건강뉴스, 웹진 정보를 홈페이지에 접속하지 않고 RSS URL을 북마크를 통해서 접속 할 경우 실시간으로 건강소식 메뉴 정보를 확인 할 수 있는 서비스이다. 건강정보광장의 연도별 건강소식 콘텐츠 현황 은 <표 6-3>와 같으며, 화면 구성은 그림 6-5, 그림 6-6, 그림 6-7 과 같다.
190 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 6-3> 건강정보광장 연도별 건강소식 콘텐츠 현황 계 ~2009년 1) 2010년 2011년 2012년 2013년 건강뉴스 4,193 1889 766 602 491 445 건강강좌/행사 4,440 2,461 162 874 587 356 건강웹진 385 - - 187 58 140 건강정보RSS 3 - - 3 3 3 주: 1) 2005년부터 2009년까지 누적된 건강정보DB를 누적하여 표기 그림 6-5 2013년 건강정보광장 건강뉴스 제공 서비스화면
제6장 건강정보광장 자료구축 191 그림 6-6 2013년 건강정보광장 건강강좌 및 행사 서비스화면 그림 6-7 2013년 건강정보광장 건강웹진 서비스화면
192 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 2. 건강콘텐츠 건강콘텐츠 의 주요 콘텐츠는 건강속설 올바로 알기, 노인건강 바로 알기, 노인 건강관리, 자주하는 질문과 답변, 생활안전 정보, 성과 다이어 트, 식이요법, 건강한 진단, 해외여행 의학, 자가진단 등을 서비스 하고 있으며, 건강기사모니터링 소개, 추천/문제성 기사 정보를 제공 하고 있 다. 건강콘텐츠 메뉴 구성은 <표 6-4>과 같다. <표 6-4> 건강콘텐츠 메뉴 구성 메뉴 건강정보 환우회정보 자가진단 건강기사모니터링소개 추천/문제성기사 세부분류 - 건강정보광장과 건강정보 우수기관과 협력하여 서비스 제공 - 노인건강, 운동, 의료이용에 관한 정보, 해외여행시 의학정보, 전염병 관리 등의 건강정보 서비스를 링크하여 제공 - 건강정보광장과 정보 협약을 통해 30여개 환우회 정보를 제공 - 금연, 절주, 영양, 운동, 구강관리 등의 자가진단 측정 정보를 서비스 하고 있음 - 대한의사협회에서 제공하는 건강모니티링 서비스에 대한 소개 페이지 - 대한의사협회에서 제공하는 추천 및 문제성 기사를 링크서비스 로 제공 2013년 건강정보광장 내 건강콘텐츠 메뉴에서 제공하는 건강정 보 는 11개 주제를 제공하고 있으며, 자가진단 메뉴에서는 22건의 자가 진단을 수집하여 134건이 누적되어 서비스 되고 있다. 환우회 정보 메뉴에서는 섬유통증증후군, 만성피로증후군 환자모임, 한국펭귄회 환우회, 근이영양증 환우 보호자회, 담도 폐쇄증 환우회, 루 푸스를 이기는 사람들, 한국 백혈병 환우회 등 30여개 환우회 정보를 제 공하고 있다. 건강기사모니터링소개 와 추천/문제성 기사 메뉴에서는
제6장 건강정보광장 자료구축 193 대한의사협회에서 제공하는 건강모니터링단 소개와 언론 및 인터넷을 포 함한 모든 매체에서 보도되는 각종 의료 기사와 보도를 모니터링하여 기 사에 대한 유용성 및 문제점을 해당 기관 담당자에게 피드백을 시킴으로 써 국민들에게 정확한 의사 지식을 전달하는 서비스이다. 건강정보광장의 연도별 건강콘텐츠 자료구축 현황은 <표 6-5>와 같 으며, 화면 구성은 그림 6-8, 그림 6-9, 그림 6-10 과 같다. <표 6-5> 건강정보광장 연도별 건강콘텐츠 현황 항목 ~2009년 1) 2010년 2011년 2012년 2013년 건강정보(종, 누적) 10 11 11 11 11 환우회정보(건, 누적) - 30 30 30 30 자가진단(건, 누적) 99 99 101 101 134 주: 1) 2005년부터 2009년까지 누적된 건강정보DB를 누적하여 표기 그림 6-8 2013년 건강정보광장 건강정보 서비스화면
194 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 6-9 2013년 건강정보광장 환우회 정보 서비스화면 그림 6-10 2013년 건강정보광장 자가진단 서비스화면
제6장 건강정보광장 자료구축 195 3. 건강정책연구 건강정책연구 의 주요 콘텐츠는 건강통계, 건강연구보고서 이다. 건강통계 메뉴에서는 한국보건사회연구원이 운영하는 보건복지통계 (hawelsis.kihasa.re.kr) 포털에서 제공하고 있는 건강관련(흡연, 음주, 영양, 운동, 구강보건, 비만, 스트레스, 우울증, 헌혈율, 암관리, 만성질 환, AIDS, 아동건강, 여성건강, 노인건강, 장애인 건강, 응급의료, 보건의 료시설 및 인력) 통계를 분류하여 링크서비스로 제공하고 있다. 건강연구보고서 메뉴에서는 한국보건사회연구원 본원 홈페이지의 발간 자료물 중 보건 및 건강정책 관련된 연구보고서를 이용자들이 쉽게 접근 할 수 있도록 메뉴를 신설하여 링크서비스로 제공하고 있으며, 건 강정책연구 콘텐츠 현황은 <표 6-6>, <표 6-7>와 같다. 서비스 제공 화 면은 그림 6-11, 그림 6-12 과 같다. <표 6-6> 건강정보광장 건강정책연구 콘텐츠 현황 항목 계 건강통계 74 건강연구보고서 87 <표 6-7> 건강정보광장 건강통계 분류별 콘텐츠 현황 흡연 음주 영양 운동 구강보건 비만 스트레스 우울증 헌혈율 9 12 5 10 11 6 7 5 5 암관리 만성질환 AIDS 아동건강 여성건강 노인건강 장애인건강 응급의료 보건의료인력 4 - - - - - - - -
196 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 6-11 2013년 건강정보광장 건강통계 서비스화면 그림 6-12 2013년 건강정보광장 건강연구보고서 서비스화면
제6장 건강정보광장 자료구축 197 4. 건강교육 건강교육 의 주요 콘텐츠는 건강소식, 전문가 칼람, 건강동영상으로 구성되어 서비스하고 있다. 그 중에서 건강수칙은 일상생활에서 질병 예 방 및 건강생활 유지를 위한 생활 지침을 제공하는 것으로 2013년 10월 현재 132건을 수집하여 2,263건을 제공하고 있으며, 건강동영상 메뉴 에서는 강북삼성병원, 분당서울대학교병원, 영남대학교 의료원, 가천의 대 길병원, 서울아산병원 등 종합전문요양기관과의 협약을 통해 링크 서 비스를 제공하고 있다. 2013년 10월 308건의 수집하여 938건의 건강동 영상을 누적되어 서비스되고 있다. 건강동영상에서 제공하는 동영상은 심혈관계, 호흡기계, 근골격계, 소화기계, 당뇨, 피부, 정신건 강, 암, 금연, 절주, 구강, 운동, 기타 로 분류하여 제공하고 있으 며, 기타 분류를 제외하면 암 관련 동영상이 201건으로 가장 많이 서비 스 되고 있다. 이와 같이 건강교육 콘텐츠에서 제공되고 있는 콘텐츠 현 황 및 구성화면은 <표 6-8>, <표 6-9>과 같다. 건강교육 메뉴의 서비스 화면은 그림 6-13, 그림 6-14 와 같다. <표 6-8> 건강정보광장 연도별 건강교육 콘텐츠 현황 항목 계 ~2009년 1) 2010년 2011년 2012년 2013년 건강수칙 2,263 149 555 1,353 74 132 전문가칼럼 227 195 32 - 건강동영상 938 320 191 97 22 308 주: 1) 2005년부터 2009년까지 누적된 건강정보DB를 누적하여 표기
198 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 6-9> 건강정보광장 건강동영상 분류별 콘텐츠 현황 계 심혈관계 호흡기계 근골격계 소화기계 당뇨 피부 938 73 39 67 72 20 27 정신건강 암 금연 절주 구강 운동 기타 35 201 111 4 12 11 266 그림 6-13 2013년 건강정보광장 건강수칙 서비스화면 그림 6-14 2013년 건강정보광장 건강동영상 서비스화면
제6장 건강정보광장 자료구축 199 5. 건강지식검색 건강지식검색 에서는 건강정보광장 의 협력기관의 건강정보 링크서 비스, 전문가 칼럼, 건강수칙, 자가진단의 정보를 통합적으로 검색 할 수 있도록 서비스를 하고 있다. 건강지식검색 에서는 건강정보를 연령대별, 신체부위별, 건강생활 정보, 질병정보 로 분류하여 제공하고 있다. 2013년 건강정보광장 의 콘텐츠 현황은 <표 6-10>와 같이, 건강생활정보 11,670건, 질병정보 15,558건, 신체부위별 정보 7,948건, 연령대별 정보 4,667건을 누적 제 공 하고 있다. <표 6-10> 건강정보광장 연도별 건강지식검색 콘텐츠 현황 ~2009년 1) 2010년 2011년 2012년 2013년 건강생활정보 2,051 1,406 13,466 8,077 11,670 질병정보 4,232 2,431 11,996 10,559 15,558 신체부위별정보 1,383 2,337 6,750 6,496 7,948 연령대별정보 1,441 2,007 6,107 4,666 4,667 주: 1) 2005년부터 2009년까지 누적된 건강정보DB를 누적하여 표기 <표 6-11>은 건강정보광장 의 건강지식검색 내 신체부위별 및 연령 대별로 구축한 자료현황이다. 머리 관련 건강정보는 393건, 눈, 코, 입, 귀, 목 관련 건강정보는 1,407건, 흉부 관련 건강정보는 591건, 소화 기 관련 건강정보는 1,376건, 근골격 관련 건강정보는 1,042건, 비뇨 생식기 관련 건강정보는 1,281건, 피부 관련 건강정보는 1,578건, 호 르몬 관련 건강정보는 280건을 제공하고 있다. 연령대별 건강정보로는 신생아 가 446건, 유아 는 934건, 아동 은
200 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 634건, 청소년 은 336건, 성인 관련 건강정보는 1,424건, 중년 관련 건강정보는 257건, 노인 관련 건강정보는 636건을 수집하여 서비스 하 고 있다. <표 6-11> 건강정보광장 의 신체부위별, 연령대별 건강정보 자료구축 현황 (단위: 건) 신체부위별검색 연령대별검색 구분 계 합계 7,948 머리 393 눈,코,입,귀,목 1,407 흉부 591 소화기 1,376 근골격 1,042 비뇨생식기 1,281 피부 1,578 호르몬 280 합계 4,667 신생아 446 유아 934 아동 634 청소년 336 성인 1,424 중년 257 노인 636 <표 6-12>은 건강정보광장 의 건강지식검색 건강생활정보에 대한 수집한 자료 현황이다. 건강생활정보는 13개 범주로 분류 하였으며, 건강 일반(4,276건), 구강관리(321건), 비만(211건), 성 및 AIDS(133건), 안 전 및 사고(1,044건), 약물 남용(1,909건), 영양 및 식이(1,375건), 예방 접종 및 건강검진(550건), 운동(305건), 음주(258건), 정신건강(952건), 피부건강(119건), 흡연(217건)을 서비스 하고 있다.
제6장 건강정보광장 자료구축 201 <표 6-12> 건강정보광장 의 건강생활정보 자료구축 현황 중분류 소분류 합계 (단위: 건) 건강일반 (4,276) 구강관리 (321) 비만 (211) 성 및 AIDS (133) 안전 및 사고 (1,044) 약물남용 (1,909) 영양 및 식이 (1,375) 예방접종 및 건강검진 (550) 운동 (305) 계 11,670 건강생활 4,174 식중독예방 102 구강건강 205 부정교합 51 충치 46 칫솔질 19 비만과 건강 65 소아비만 52 체중관리 94 성교육 61 피임 72 각종사고 62 교통사고 18 손상 35 안전 504 응급처치 132 중독 236 추락 23 화상 34 마약 914 약물남용 995 식생활 513 식이조절 및 다이어트 86 영양과 건강 및 건강식단 608 영양소 및 칼로리 168 예방접종 550 운동과 건강 280 유산소운동 25
202 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 중분류 소분류 합계 음주 (258) 정신건강 (952) 피부건강 (119) 흡연 (217) 술과 건강 48 알코올 112 알코올중독 59 절주 39 스트레스 93 자살 37 정신건강 822 가려움증 16 건조증 26 아토피 42 여드름 16 주부습진 19 간접흡연 11 금연 85 담배 44 흡연과 건강 77 <표 6-13>은 건강정보광장 의 건강지식검색 질병정보에 대해 수집 한 자료 현황이다. 질병정보는 16개 범주로 분류하여 제공하고 있다. 감염성 질환 정보는 1,114건, 근골격계 및 결합조직 질환은 852건, 눈 및 부속기 질환은 678건, 비뇨생식기 질환은 1,111건, 선청성 기형 질환 은 1,077건, 소화기계 질환은 1,277건, 순환기계 질환은 954건, 신경계 질환 325건, 신생물 관련 질환 정보 1,821건, 영양 및 대사질환은 590 건, 임신 출산 및 산욕기 질환은 801건, 정신 및 행동장애 질환 정보는 847건, 증상 및 징후 관련 질환 정보는 2,613건, 피부 및 피하조직 질환 은 455건, 혈액 질환은 430건, 호흡기계 질환은 611건을 수집하여 서비 스 하고 있다.
제6장 건강정보광장 자료구축 203 <표 6-13> 건강정보광장 의 질병정보 자료구축 현황 (단위: 건) 중분류 소분류 합계 계 15,558 감영성질환 (1,114) 근골격계 및 결합조직질환 (852) 눈 및 부속기 질환 (678) 비뇨생식기질환 (1,111) 간염 41 감염성 질환 일반정보 446 결핵 50 바이러스성 뇌질환 32 바이러스성 피부질환 134 신종감염병 8 성병 87 세균성질환 169 에이즈 71 장관감염 58 홍역 18 골다공증 64 골병증 52 관절병 242 근골격 일반정보 231 근육질환 148 척추질환 115 귀 및 부속기질환 146 난청 및 기타 14 기타 안 질환 288 백내장 44 안과 일반정보 99 염증성 질환 87 남성생식기 203 불임증 57 비뇨기 기타질환 134 비뇨생식기 일반정보 254 신부전 55 신장염 25 여성생식기질환 367 요로결석증 16
204 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 중분류 소분류 합계 선천성기형 (1,077) 소화기계질환 (1,277) 순환기계질환 (954) 신경계질환 325 신생물 (1,821) 영양 및 대사질환 (590) 구개열 및 토순 13 선천성 기형 일반정보 54 심장기형 12 유전 및 희귀질환 998 간의질환 241 구강질환 294 담도계질환 62 대장질환 318 소화기계 일반정보 163 식도질환 55 위장질환 146 기타 순환기질환 165 심부전 26 정맥질환 29 허혈성 심장질환 71 혈압 255 뇌졸중 87 동맥질환 127 순환기일반정보 194 마비 49 발작성장애 67 수막염 36 신경계 일반정보 104 신경병 29 파키슨병 40 기티암 592 뇌종양 63 림프 및 혈액암 130 소화기관암 384 신생물 일반정보 157 호흡기관암 103 비뇨생식기암 392 내분비질환 213
제6장 건강정보광장 자료구축 205 중분류 소분류 합계 당뇨병 282 대사장애 일반정보 54 영양장애 41 임신 출산 및 산욕기질환 (801) 정신 및 행동장애 (847) 산모병태관리 68 산후기질환 42 유산된임신 29 임신, 분만 및 일반정보 577 임신성 고혈압 18 임신성 당뇨 18 진통 및 분만 49 기타 정신질환 120 신경증적장애 23 우울증 143 정신분열증 39 정신장애 일반정보 187 치매 335 증상 및 징후 1,816 증상 및 징후 (2,613) 피부 및 피하조직질환 (455) 혈액질환 (430) 호흡기계질환 (611) 증상일반정보 342 기타 피부질환 263 피부 부속기질환 7 피부염 및 두드러기 71 피부 및 일방정도 114 기타 피부질환 263 피부 부속기 질환 7 피부염 및 두드러기 71 피부 일반정보 114 빈혈 89 혈액질환 341 기관지염 및 폐질환 181 기타 호흡기질환 147 인두후질환 108 인플루엔자 및 폐렴 83 호흡기 일반정보 92
206 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 6. 의료서비스정보 의료서비스 정보 에서는 의료서비스 이용정보, 병의원 이용정보, 의료 사전 등으로 구분하여 제공하고 있는 바, 협력기관에서 제공하고 있는 콘 텐츠에 변화 없이 기존 구축현황과 동일하다. 의료서비스 이용정보 메뉴에서는 질병, 수술, 처치 등의 검사정보, 질 병 및 수술별 진료 정보, 약물 복용 관련 정보를 서비스 하고 있으며, 병 의원 이용 정보 메뉴에서는 인터넷 온라인 예약, 인터넷 상담, 병원 및 약국 이용정보, 병원 평가 결과 정보, 건강검진 기관 안내 등의 정보를 수 집하여 제공 하고 있다. 의료사전 메뉴에서는 전문 의학 용어 사전, 의약품 정보, 건강검진 종 목 해석, 건강검진 관련 서식 정보 등을 제공 하고 있으며, 의료서비스 정보 제공 화면은 그림 6-15 과 같다. 그림 6-15 2013년 건강정보광장 의료서비스 정보 서비스화면
제6장 건강정보광장 자료구축 207 7. 건강App 건강App 는 스마트폰의 이용증대에 따라 어플리케이션을 활용한 건 강정보 서비스가 증가하고 있으며 건강정보광장 의 일반 이용자를 대상 으로 공공기관 중심의 제공하는 건강관련 어플리케이션을 생활건강에서 서비스 하고 있다. 2010년부터 건강정보광장 에서 제공하고 있는 건강 App은 공공기관이 제공하는 의학 및 건강 어플리케이션 리뷰정보, 어플 리케이션 뷰페이지 및 세부화면 설명정보와 기능 의 정보를 안내하고 있 다. 건강App 제공 화면은 그림 6-16 과 같다. 그림 6-16 2013년 건강정보광장 건강App 서비스화면
208 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 제3절 건강정보광장 시스템 구성도 1. 시스템 및 네트워크 구성도 건강정보광장 은 국가보안기술연구소의 보안관제 대상기관인 한국보 건사회연구원의 네트워크에 웹서비스를 위한 인프라를 구성하고 있다. 보안관제 대상기관은 24시간 365일 정보보안 관련 관제가 진행되고 있 어 웹해킹이나 APT(Advanced persistent threat), DDoS(Distributed Denial of Service), DRDOS(Distributed Reflection Denial of Service) 공격 등의 징후를 재빨리 파악할 수 있고, 이에 대한 트랜트 및 패턴 분석 등으로 예방 및 신속대응이 가능하여 보다 안정적인 시스템 운 영과 서비스 제공이 가능하다. 건강정보광장 의 웹서비스를 위한 시스 템 및 네트워크 구성은 그림 6-17 과 같다. 그림 6-17 건강정보광장 시스템 및 네트워크 구성도
제6장 건강정보광장 자료구축 209 2. 하드웨어 구성도 건강정보광장 은 접근 용이성 및 신속성을 높이기 위하여 웹서버와 DB서버를 물리적으로 분리하였으며 제공되는 정보의 무결성 및 안정성 확보를 위하여 데이터베이스를 오라클로 이관하는 등 시스템 성능향상과 안정성 및 신뢰성을 보장할 수 있도록 관련 인프라를 새롭게 구성하여 성 능을 향상시켰다. 건강정보광장 의 웹사이트 운영을 위한 하드웨어 구 성도는 그림 6-18 과 같다. 그림 6-18 하드웨어 구성도 3. 소프트웨어 구성도 건강정보광장 은 각 시스템 특성에 맞는 적합한 운영체제와 소프트웨 어를 활용하고 있다. 웹서비스 구현에 적합한 DB서버와의 유기적인 결합 등 관련 시스템과의 연계ㆍ연동을 위하여 소프트웨어 및 응용프로그램을
210 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 효율적으로 구성하였다. 건강정보광장 의 소프트웨어 구성은 그림 6-19 와 같다. 그림 6-19 소프트웨어 구성도 4. 건강정보광장 시스템 및 네트워크 구성 상세 건강정보광장 은 웹서비스의 안정성 및 연속성을 위하여 웹서버와 DB서버를 물리적으로 분리하여 성능을 향상시켰으며 통합로그관리시스 템을 도입하여 시스템 운영관리에 대한 정보수집과 장애요인에 대한 사 전 예방 및 사후 장애발생 원인을 파악하는데 주력하였다. 건강정보광 장 의 하드웨어 및 네트워크 구성의 상세내역은 <표 6-14>, <표 6-15> 와 같다.
제6장 건강정보광장 자료구축 211 <표 6-14> 2013년 건강정보광장 시스템 구성 상세 항목 사양 수량 웹서버 DB서버 연구중복성검증 서버 건강정보검색 서버 DNS IPS DDoS차단 서버 IBM P710 - CPU: Power7 3GHz 4 - Memory: 8G - Disks: 300GB 2 - AIX 6.1 IBM X3650M2 - CPU: Xeon E5530 QC2.4Ghz x 2 - Memory: 8G - Disks: 146GB 8 - Windows 2008 SE SP2 64bit IBM X3650 M3 - CPU: 2.40GHz 쿼드코어 - Memory: 4GB (1GB 4) - Disk: 300GB 2 - UNIX Solaris 8 Repia Search Appliance S1003 - CPU :Intel 3.0 Ghz 2 - Memory: 1GB (512MB 2) - Disk: 73GB SCSI - Red Hat 5.5 ORACLE V210 - CPU: 1GHz 1 - Mem: 1G (512MB 2 ) - Disk: 73GB 1 - UNIX Solaris 10 Secui NXG2000 - CPU: Xeon 3.2GHz 2 - Memory: 1G - Disks: 40G AhnLab TrusGuard DPX 2000 - CPU: Intel Core Quad 2.66GHz - Memory: 2G - 전원 및 FAN: 이중화 1 1 1 1 1 1 1
212 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 항목 사양 수량 방화벽 웹 방화벽 Oullim IPSWALL 2000 - CPU: dualcore 2.8GHz - Mem: 1G - Disks: 320G Penta Security wapples1000 - CPU: 2.33GHz (쿼드 2) - Memory: 8G 1 1 개인정보보호 (웹) 네트워크접근제어 (NAC) 통합로그관리 백업 - Disks: 500G SATA Comtrue PrivacyCenter 1000 - CPU: 2.33GHz(쿼드 E5410) - Memory: 3.6G - Disks: 450G Genian Policy Center - GPC-1100-T20 - GNS-950-T40 LCA-7010 - CPU: 2.13GHz(쿼드) - Memory: 8G - Disks: 1TB 4 IBM X3650 M3 - CPU: Xeon 3GHz - Memory: 8G (1GB 8) - Disks: 146GB 4 - Windows Server 2008 R2 Std - SAN Switch: IBM 2498-B24 - 스토리지: DS5020 - LTO: IBM TS3200 HP DL140 - CPU: Xeon 3GHz - Memory: 1G - Disks: 80GB (IDE ) - Windows Server 2003 SE - 스토리지: Dell-EMC iscsi AX 100 - LTO: Quantum M1500SX 1 1 1 1 1
제6장 건강정보광장 자료구축 213 <표 6-15> 2013년 건강정보광장 네트워크 구성 상세 항목 사양 수량 보안관제 라우터 Switching KVM TESS TAS2000NS ESM 네스-AGT-SS Cisco C1721 Cisco C1700 netsteer 5000 3COM 7754 3COM 4200 3COM 17300 3COM 17304 Aten KN2132-AX-K - kvm switch1 - kvm switch2 - kvm Module 1 1 1 1 1 1 2 16 1 1 1 38 5. 소프트웨어 건강정보광장 은 2012년도에 이미 운용중인 소프트웨어 인프라를 비 롯하여 2013년도에도 새롭게 소프트웨어를 확충하였다. 오픈소스(open source)인 MySQL을 DBMS(DataBase Management System)로 사용하였으나 트랜잭션 관리 향상 등을 위하여 오라클 (Oracle)로 데이터베이스를 이관하였다. 또한 현재 운용중인 방화벽, IPS, 서버보안, DDoS 차단 시스템, NAC 장비 등 정보보안 솔루션들의 정책을 강화하였으며 서버 및 네트워크의 시스템 로그 관리가 가능한 통 합로그관리시스템 및 서버취약점 점검을 위한 취약점 점검 스캐너를 도 입하여 정보보안 부문의 경쟁력을 강화하였다. 건강정보광장 의 소프트 웨어 내역은 <표 6-16>과 같다.
214 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 표 6-16 건강정보광장 소프트웨어 내역 구분 설명 Web Apache/Tomcat 인터넷 Web Server DBMS Oracle 10g 데이터베이스내의 데이터 제어 중복검증 xten Search Clone 연구 중복성 검증 건강정보검색 REPIA Search Engine 검색엔진(RSA 3.3/RWDS-2.0) DNS BIND 도메인 네임서버 웹사이트분석 Webtrend Log Analyzer 8.5 인터넷서비스 이용현황 분석 IPS NXG IPS 악의적인 해킹 및 불법공격 탐지 및 사전차단 방화벽 Secure Works 불량 패킷 및 포트 차단 웹방화벽 Wapples 웹의 구조적 취약점을 이용한 공격 차단 개인정보보호 PrivacyCenter 게시판 등 개인정보 및 블랙 키워드 등록 차단 서버보안 Secuve TOS 웹 및 DB 서버의 접속통제 등 서버보안 시스템로그분석 LCM 서버 및 네트워크 장비의 로그파일 분석 서버취약점점점 Secuguard SSE 웹 및 DB서버의 서버취약점 점검 스캐너 백업 Symc NETBACKUP NetVault 유사시 서비스 중단 최소화 대비를 위한 데이 터 안정성 확보
제7장 건강정보광장 평가 제1절 정량적평가 제2절 정성적평가
7 건강정보광장 평가 << 제1절 정량적 평가 웹 로그 분석은 사이트 방문자 데이터를 로그분석 툴을 사용하여 각 조 건(월별/일별/시간별)에 의하여 정리한 것으로 방문자 개개인에 대한 단 순한 방문 기록 정보 현황에 대해 본 절에서 제시하고자 한다. 건강정보광장 의 2012년 운영실적을 정략적으로 평가하기 위하여 웹 트랜드(Webtrends Log Analyzer)버전 8.5를 이용한 이용자 로그(log) 파일분석과 구글 대시보드(dashboard)분석을 하였으며 분석기간은 2013년 1월 1일부터 2013년 9월 30일까지로 하였다. 1. 전체 분석 결과 가. 방문수 2013년 건강정보광장 총 방문건수는 <표 6-1>과 같다. 웹트렌드 분 석한 방문건수는 247,741건, 1일 평균 방문건수는 817건으로 나타났다. 전년보다 방문건수가 줄어든 이유는 2013년 1월 1일부터 2013년 4월 25일까지 운영시스템상의 문제로 4개월간 웹로그가 쌓이지 않아 4개월 간 유입한 건수가 현저하게 방문건수가 줄어들었다. 대시보드 분석 결과 로는 방문건수가 245,003건, 1일 평균 방문 건수는 806건으로 웹트렌드 와 대시보드 분석결과가 유사하게 나타났다.
218 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-1> 2013년 건강정보광장 방문건수 구분 2012년 2013 웹트렌즈 대시보드 방문건수 718,912 247,741 1일 평균방문건수 2,357 817 방문건수 709,032 245,003 1일 평균방문건수 2,412 806 나. 열람페이지 수 분석기간 동안 이용자가 이용한 열람페이지 수는(HTML, DB문 수 등) 웹트렌즈 분석결과 총 열람 페이지 수는 1,499,225건, 1일 평균 열람페 이지 수는 4,947건, 방문 당 평균 열람 페이지 수는 6.05건으로 나타났으 며, 대시보드로 분석한 결과로는 총 열람 페이지 수가 1,492,792건, 1일 평균 열람페이지 수는 4,911건, 방문 당 평균 열람 페이지 수는 6.01건으 로 나타났다(표 7-2 참조). <표 7-2> 2013년 건강정보광장 열람 페이지 수 구분 2012년 2013년 열람 페이지 수 2,694,418 1,499,225 웹트렌즈 1일 평균 열람 페이지 수 8,834 4,947 방문당 평균 열람 페이지 수 3.75 6.05 열람 페이지 수 1,997,303 1,492,792 대시보드 1일 평균 열람 페이지 수 6,570 4,911 방문당 평균 열람 페이지 수 2.82 6.01
제7장 건강정보광장 평가 219 다. 유입 키워드 2013년 건강정보광장 의 키워드를 통한 유입은 <표 7-3>과 같다. 유 입키워드 1위는 정계정맥류증상, 2위는 섬유근통증후군 만성피로증후 군 환자 모임, 3위는 갑상선 암 수술 후 관리, 4위는 황반병변 증상, 5위 는 욕창치료 순으로 나타났다. 2012년 건강정보광장 유입 키워드는 건강정보광장, 건강정보, 건강강좌 가 주로 검색 되었던 반면에 2013 년 유입 키워드는 질병 명을 검색하여 유입한 것으로 나타났다. 하지만 평균 방문 시간은 1분미만으로 페이지를 열어 본 후 바로 종료한 것으로 보인다. <표 7-3> 2013년 건강정보광장 유입키워드 1) (단위: 건. 분, %) 구분 유입키워드 방문수 평균방문시간 1위 건강정보광장 47,350 00:09:32 2위 건강정보 22,100 00:03:32 2011년 3위 스트레스 자가진단 7,767 00:02:45 4위 어지럼증원인 7,267 00:00:09 5위 우울증 자가진단 4,350 00:01:51 1위 건강정보광장 68,103 00:10:47 2위 건강정보 11,690 00:03:24 2012년 3위 스트레스 자가진단 8,968 00:02:47 4위 건강 7,168 00:03:07 5위 건강강좌 4,943 00:03:40 1위 정계정맥류증상 577 00:00:25 2위 섬유근통증후군 만성피로증후군 환자 모임 478 00:00:44 2013년 3위 갑상선암 수술 후 관리 312 00:00:24 4위 황반병변 증상 312 00:00:15 5위 욕창치료 260 00:01:29 주: 1) 유입키워드 분석은 구글 대시보드를 통하여 분석 함.
220 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 라. 시작페이지 시작페이지는 이용자들이 사이트 방문 시 최초로 방문하는 페이지 또 는 입장 페이지를 의미한다. 대부분 사이트에서 일반적인 사이트는 메인 페이지긴 하나 사이트 내에서도 이용자들이 자주 찾는 페이지를 따로 즐 겨찾기를 통해 방문하거나 타 사이트를 통해 방문하는 참조페이지들도 사용되고 있어 이용자들의 시작페이지를 분석해 보면 이용자의 입장 경 로를 파악해 볼 수 있다. 2013 건강정보광장 에서의 시작페이지는 건강지식검색 페이지로 32.99%, 건강소식 19%, 메인페이지 18.40%, 순으로 나타났다. 2013년 건강정보광장 의 시작 페이지 점유율 현황은 <표 7-4>와 같다. <표 7-4> 2013년 건강정보광장 시작 페이지 점유율 현황 (단위: %) 2011년 2012년 2013년 페이지명 점유율 페이지명 점유율 페이지명 점유율 건강App 43.17 건강App 29.29 건강지식검색 32.99 건강소식 15.36 건강소식 20.98 건강소식 19.00 메인페이지 11.77 건강교육 12.07 메인페이지 18.40 건강교육 9.67 메인페이지 11.02 건강교육 11.12 건강지식검색 8.29 건강지식검색 9.17 RSS페이지 7.69 마. 탈출페이지 탈출페이지는 건강정보광장 이용자들이 사이트 이용을 종료하기 전 최종페이지 또는 퇴장페이지로 방문 시 가장 자주 사용되는 페이지를 의 미하며 향후 사이트 기획 및 운영에 유용한 지표로 활용될 수 있다. 2013 건강정보광장 의 탈출(이탈) 페이지로는 건강지식검색
제7장 건강정보광장 평가 221 (25.43%) 페이지로 분석되었다. 건강정보광장을 이용하는 이용자들이 건강지식검색에서 탈출(이탈)하는 것으로 가장 높게 나타났으며, 메인페 이지가 14.58%, 건강소식 페이지가 12.85%, 건강교육 페이지가 11.41%, RSS 페이지는 8.20% 순으로 나타났다. 2013년 건강정보광 장 의 탈출(이탈)페이지 점유율 현황은 <표 7-5>와 같다. <표 7-5> 2013년 건강정보광장 탈출 페이지 점유율 현황 (단위: %) 2011년 2012년 2013년 페이지명 점유율 페이지명 점유율 페이지명 점유율 메이페이지 49.32 메인페이지 34.83 건강지식검색 25.43 건강소식 15.76 건강소식 21.48 메인페이지 14.58 건강교육 9.80 건강교육 12.08 건강소식 12.85 건강지식검색 7.91 건강지식검색 8.74 건강교육 11.41 RSS페이지 5.57 RSS페이지 8.40 RSS페이지 8.20 2. 월별 분석 결과 가. 월별 방문 건수 2013년 건강정보광장 의 월별 방문건수를 살펴보면 9월 방문자 건수 가 46,208건으로 가장 높은 것으로 나타났다. 2012년 7월부터 건강정보 광장의 월별 방문 건수가 현저하게 줄어들었다. 건강정보광장 의 협력 기관의 개편으로 인해 줄어든 것으로 판단되며 2013년 1월부터 4월 25 일까지 건강정보광장의 운영 시스템상의 문제로 방문자 웹로그가 쌓이지 않아 방문 건수가 줄어든 것으로 나타났다. 5월 방문자 수는 24,706건, 6월 방문자 수는 25,587건, 7월 방문자 수는 30,390건, 8월 방문자 수는 34,296건, 9월 방문자 수는 46,208건
222 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 으로 매달 방문자 수가 증가추세를 보이고 있으며, 방문자 수가 늘어남에 따라 1일 평균 방문 건수도 증가한 것으로 보인다(그림 7-6 참조). <표 7-6> 2013년 건강정보광장 월별 방문 건수 기간 방문건수 2012년 1일평균 방문건수 평균방문길이 방문건수 2013년 1일평균 방문건수 평균방문길이 1월 94,923 3,062 00:03:48 12,880 415 00:16:23 2월 91,884 3,168 00:04:12 7,288 260 00:28:56 3월 93,473 3,015 00:03:48 13,313 429 00:08:55 4월 82,261 2,472 00:03:55 16,400 546 00:09:12 5월 77,177 2,489 00:04:17 24,706 829 00:15:10 6월 85,080 2,836 00:03:51 25,587 852 00:15:53 7월 61,272 1,976 00:04:52 30,390 980 00:10:54 8월 42,859 1,382 00:07:32 34,296 1,106 00:10:45 9월 41,864 1,395 00:09:31 46,208 1,540 00:07:41 10월 48,119 1,552 00:06:30 58,026 1,934 00:06:57 나. 월별 방문자 수 건강정보광장 을 방문한 이용자 수를 나타내는 월 별 방문자수는 8월 이 가장 많이 방문하였으며, 6월, 4월 순으로 나타났다. 반면에 1월부터 4월까지는 한 번 방문(처음 방문)한 빈도가 높았으며 5월 이후 부터는 두 번 이상 방문한 방문자의 비율이 증가한 것으로 나타났다(표 7-7 참조). <표 7-7> 2013년 건강정보광장 월별 방문자 수 기간 방문자 수 한번 방문자 수 두 번 이상 방문자 수 명 % 명 % 명 % 2013.0101~01.31 3,007 100.0 2,460 81.81 547 18.19 2013.02.01~02.28 2,170 100.0 1,836 84.61 334 15.39 2013.03.01~03.31 4,033 100.0 3,349 83.04 684 16.96
제7장 건강정보광장 평가 223 기간 방문자 수 한번 방문자 수 두 번 이상 방문자 수 명 % 명 % 명 % 2013.04.01~04.30 4,413 100.0 3,211 72.76 1,202 27.24 2013.05.01~05.31 5,647 100.0 1,174 20.79 4,473 79.21 2013.06.01~06.30 6,402 100.0 1,343 20.98 5,059 79.02 2013.07.01~07.31 6,179 100.0 1,786 28.90 4,393 71.10 2013.08.01~08.31 6,914 100.0 1,937 28.02 4,977 71.98 2013.09.01~09.30 5,647 100.0 1,747 30.94 4,473 69.06 2013.10.01~10.31 7,981 100.0 1,493 18.71 6,488 81.29 다. 월별 열람 페이지 수 2013년 건강정보광장 의 월별 열람페이지 분석 결과 8월이 290,375 건으로 가장 높게 나타났으며, 8월의 1일 평균 열람수는 9,366건이었으 며, 그 다음이 9월 열람페이지 분석 결과 198,087건으로 높았다. 9월 1 일 평균 열람 수는 6,602건이었으며, 1회 방문당 열람 수는 4.29 페이지 인 것으로 분석되었다(표 7-8 참조) <표 7-8> 2013년 건강정보광장 월별 열람 페이지 수 웹트렌즈 기간 페이지열람수 1일평균 열람수 1회 방문당 열람 수 1월 102,000 3,290 7.92 2월 78,942 2,819 10.83 3월 77,024 2,484 5.79 4월 93,027 3,100 5.67 5월 252,270 8,137 9.81 6월 229,284 7,642 8.96 7월 197,412 6,386 6.5 8월 290,375 9,366 8.47 9월 198,087 6,602 4.29 10월 199,266 6,642 3.43
224 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 라. 월별 방문 국가 2013년 건강정보광장 의 국가별 월별 방문수를 분석한 결과 국외 이 용자가 꾸준히 증가한 것으로 분석되었다. 9월의 경우 국외에서 유입한 빈도가 73.73%를 기록하였다(표 7-9 참조). <표 7-10>은 전체 방문 구 성비를 정리한 표이다. 전체 방문자 중 한국인의 방문이 44.36%, 미국이 31.30%, 알 수 없는 국가 출처에서 12.43%, 오스트레일리아 8.20%, 일 본이 1.33% 순으로 나타났으며, 그 외 국가는 1% 미만이 건강정보광 장 에 방문 한 것으로 나타났다. <표 7-9> 2013년 건강정보광장 월별 방문 국가 (단위: %) 웹트렌즈 기간 국내 국외 기타 1월 54.21 45.53 0.26 2월 55.86 44.41 0.73 3월 60.23 36.09 3.67 4월 63.43 33.87 2.71 5월 49.59 49.19 1.21 6월 57.79 41.57 0.64 7월 54.72 44.62 0.66 8월 49.08 50.08 0.84 9월 26.06 73.73 0.21 10월 32.99 68.81 0.20
제7장 건강정보광장 평가 225 <표 7-10> 2013년 건강정보광장 국가별 방문 구성비 순위 국가 1 한국(44.36) 2 미국(31.30) 3 알 수 없는 국가(12.43) 4 오스트레일리아(8.20) 5 일본(1.33) 6 중국(0.54) 7 캐나다(0.31) 8 네델란드(0.21) 9 독일(0.05) 10 싱가포르(0.04) 마. 월별 시작 페이지 2013년도 건강정보광장 의 월별 시작페이지는 1월부터 4월 25일까 지 건강정보광장 의 운영시스템의 문제로 이용자 로그정보가 구축되지 않았다. 4월 26일 이후부터 이용자 방문 로그가 저장이 되어 분석이 가능 하게 되었다. 1월부터 4월까지의 월별 시작 페이지는 건강지식검색 이 높은 것으로 분석되었으나 이는 전체 페이지 분석이 아닌 건강지식검색 페이지만 분석이 되어 방문 비중이 높은 것으로 나타났다. 5월에는 이용자들의 시작 페이지는 건강소식(37.5%), 메인페이지 (14.8%), 건강교육(12.2%) 순으로 방문하였으며, 6월부터 8월까지는 메인페이지를 통한 방문 비율이 높았으며, 9월 이용자의 경우 건강소식 페이지를 통해 건강정보광장 에 유입하는 것으로 분석되었다(표 6-10 참조).
226 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-11> 2013년 건강정보광장 월별 시작페이지 현황 1위 2위 3위 4위 5위 (단위: %) 1월 건강지식검색 (37.7) 건강콘텐츠 (32.3) 메인페이지 (17.8) 의료서비스정보 (3.4) 건강소식 (3.0) 2월 건강지식검색 (85.0) 메인페이지 (14.0) 자가진단 (0.3) 의료서비스정보 (0.2) - 3월 건강지식검색 (91.3) 메인페이지 (8.1) 의료서비스 (0.1) 자가진단 (0.1) RSS페이지 (0.1) 4월 건강지식검색 (78.2) 메인페이지 (9.52) 건강교육 (4.5) RSS페이지 (2.1) 건강소식 (1.2) 5월 건강소식 (37.5) 메인페이지 (14.8) 건강교육 (12.2) 건강지식검색 (10.8) RSS페이지 (7.1) 6월 메인페이지 (27.8) 건강교육 (20.1) 건강지식검색 (18.7) RSS페이지 (11.7) 피드백설문 (5.7) 7월 메인페이지 (20.9) 건강교육 (16.7) RSS페이지 (15.9) 건강지식검색 (12.9) 피드백설문 (7.1) 8월 메인페이지 (20.9) 건강교육 (14.5) RSS페이지 (13.5) 건강지식검색 (12.4) 피드백설문 (8.9) 9월 건강소식 (37.5) 메인페이지 (14.8) 건강교육 (12.2) 건강지식검색 (10.8) RSS페이지 (7.1) 10월 메인페이지 (23.55) 건강소식 (15.61) 건강교육 (13.20) 건강지식검색 (10.39) RSS페이지 (7.2) 바. 월별 탈출 페이지 2013년도 건강정보광장 의 월별 탈출(이탈)페이지는 <표 7-12>과 같다. 1월부터 4월까지의 탈출(이탈) 페이지 현황 분석 결과 건강지식검 색 이 1위로 가장 높게 나타났으며, 다음에 메인페이지에서 이탈 하는 것 으로 분석되었다. 5월의 경우 건강지식검색 페이지에서 이탈한 경우가 29.5%, 메인페이지에서 이탈한 경우가 19.4%로 4월과 비교하여 건강지 식검색 페이지에서 이탈한 비율이 줄어 든 것으로 나타났다. 이는 <표
제7장 건강정보광장 평가 227 7-11>과 같이 건강정보광장 의 운영 시스템상의 문제로 4개월간 이용 자 로그 문제가 구축되지 않아 비율이 높게 나타난 것이다. 6월부터 8월까지는 건강교육 페이지에서 이탈한 경우가 가장 높게 나 타났으며, 다음이 메인페이지 혹은 RSS 페이지에서 이탈한 것으로 분석 되었으며, 4월, 5월, 6월, 8월에는 건강정보광장 사이트를 이용하고 만 족도 조사를 하는 피드백 설문 페이지를 통한 이탈도 나타났다. <표 7-12> 2013년 건강정보광장 월별 탈출페이지 현황 1위 2위 3위 4위 5위 (단위: %) 1월 건강지식검색 (39.5) 메인페이지 (23.3) 건강교육 (12.4) 건강콘텐츠 (11.8) 의료서비스정보 (2.0) 2월 건강지식검색 (86.3) 메인페이지 (13.7) - - - 3월 건강지식검색 (90.9) 메인페이지 (7.6) 건강소식 (1.4) 건강교육 (0.1) - 4월 건강지식검색 (77.6) 메인페이지 (8.1) 건강교육 (4.7) RSS페이지 (2.0) 피드백설문 (1.4) 5월 건강지식검색 (29.5) 건강교육 (19.4) 메인페이지 (14.7) RSS페이지 (8.6) 피드백설문 (6.3) 6월 건강교육 (20.0) 메인페이지 (19.1) 건강지식검색 (18.2) RSS페이지 (13.0) 피드백설문 (8.7) 7월 건강교육 (16.7) RSS페이지 (16.4) 메인페이지 (15.3) 건강지식검색 (12.3) 피드백설문조사 (8.6) 8월 건강교육 (14.8) RSS페이지 (14.4) 피드백설문 (13.1) 메인페이지 (12.4) 건강지식검색 (12.4) 9월 건강소식 (37.5) 메인페이지 (12.6) 건강교육 (12.5) 건강지식검색 (11.3) RSS페이지 (7.7) 10월 메인페이지 (23.55) 건강소식 (15.61) 건강교육 (13.20) 건강지식검색 (10.39) RSS페이지 (7.52)
228 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 3. 요약 및 시사점 본 평가는 건강정보광장 이용자들이 건강정보광장에서 이용하는 정 보에 대하여 운영실적을 평가하기 위한 분석 결과이다. 2013년 총 방문 자 수는 웹트렌드 분석결과 211,068건, 일일 평균 방문 건수는 733건으 로 분석되었으며, 대시보드 방문건수 분석 결과에서도 총 방문자 수가 213,242건, 일일 평균 방문 건수가 773건으로 나타났다. 2013년 열람 페이지 수도 웹트렌드 분석결과 1,518,421건, 일일 평균 열람 페이지 수 는 8,855건으로 분석되었으며, 대시보드 분석결과 총 열람 페이지 수는 1,471,015건, 일일 평균 열람 페이지 수는 6,959건으로 분석되었다. 2012년도에 비하여 총 방문자 수 및 일일평균 방문 건수가 현저하게 줄어들었다. 이는 2013년 1월 1일부터 4월 25일까지 운영시스템상의 문 제로 4개월간 분석 결과 값이 없어 현저하게 줄어 든 것으로 판단된다. 건강정보광장 을 이용하는 이용자의 유입 키워드를 분석한 결과 2012년에는 건강정보광장, 건강정보, 건강 이라는 키워드로 유입 비 율이 높았던 반면 2013년에는 질병명 을 검색하여 건강정보광장에 유입 한 비율이 높게 나타났다. 특히 건강정보광장 을 이용하는 이용자의 해 외 유입 비율이 매월 증가하는 것으로 분석되었으며, 국가별 방문 구성비 를 분석한 결과 한국이 45.1%, 미국이 31.4%, 오스트레일리아 7.28% 순 으로 나타났다. 최근 9월의 방문 국가 비율을 분석한 결과 국내 방문 유입 의 경우 20.6%였던 반면 국외 방문 비율이 73.73%로 비율이 증가한 것 으로 나타났다. 국내 이용자뿐만 아니라 국외 이용자의 접근성 향상을 위 한 노력을 기울여야 할 것 이다. 해외에 거주하고 있는 교민들을 위한 각 국의 건강정책 및 건강보장시스템에 대한 정책 현황과 건강정보 제공을 통해 해외 교민의 이용 접근이 증가할 것으로 판단된다.
제7장 건강정보광장 평가 229 제2절 정성적 평가 본 절에서는 건강정보광장 에 대한 이용자 실태 및 수요조사 평가를 이용한 결과를 제시하였다. 1. 조사개요. 가. 조사배경 및 목적 건강정보광장 에서 제공하고 있는 건강관련 콘텐츠 및 서비스에 대한 사용자측면의 만족도, 정보요구 및 이용자 실태를 조사 분석하여 향후 건강정보광장 운영 및 개선방안을 마련하는데 활용하고자 실시하였다. 나. 자료수집 방법 본 조사는 건강정보광장 을 이용하는 국민들을 대상으로 2013년 6월 25일부터 7월 15일까지 3주간 건강정보광장 홈페이지 (healthpark.or.kr), 내에서 온라인 설문조사형태로 실시하였으며 총 2,094명이 참여하였다. 또한 이용자를 대상으로 2013년 4월 1일부터 2013년 9월 30일까지 6개월 동안 건강정보광장 홈페이지 (healthpark.or.kr)내에서 온라인 설문조사 형태로 실시하였다. 건강정 보광장 월별 이용자 만족도 조사는 4월부터 9월까지 총 2,190명이 참여 하였다. 4월에는 188명, 5월 327명, 6월 572명, 7월 270명, 8월 655명, 9월 223명이 참여하였다(표 7-13 참조).
230 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-13 2013년 건강정보광장 월별 이용자 만족도 조사 참여자 현황 (단위: 명) 계 4월 5월 6월 7월 8월 9월 참여자 2,190 188 327 527 270 655 223 온라인 설문조사 공지는 건강정보광장 의 메인페이지 팝업(pop-up) 안내, 한국보사회연구원에서 운영하고 있는 보건복지통계 포털의 통계 웹진발송 등을 통해 공지하여 참여할 수 있도록 하였다. 다. 조사내용 설문도구는 일반적 사항 4문항, 이용실태 6문항, 품질 및 만족도 10문항, 건강정보에 대한 행동변화 2문항, 인터넷 건강정보이용에 대 한 행태 3문항, 인터넷 사용 1문항, 스마트폰을 통한 건강정보 이용 행 태 6문항, 건강정보광장의 이용자 건강수요조사 1문항 등으로 구성하 였다(표 7-14 참조). 그리고 월별 조사의 설문도구는 일반적 사항 3문항, 이용실태 5문 항, 품질 및 만족도 7문항으로 구성하였으며 2013년 건강정보광장 의 월별 건강정보 만족도 조사의 조사 항목은 <표 7-15>과 같다. <표 7-14> 2013년 건강정보광장 이용자 실태 및 수요조사 항목 구분 문항 수 내용 비고 일반적 사항 4 성별, 출생년도, 교육정도, 직업 이용실태 6 인지경로, 방문빈도, 방문시간, 주로이용하는 정보, 가장 유익한 정보, RSS 이용여부
제7장 건강정보광장 평가 231 구분 문항 수 내용 비고 품질, 만족도 10 건강정보에 대한 행동변화 인터넷 건강정보 이용 행태 2 3 내용의 충분성, 정보의 유용성, 이해용이성, 건강정보의 신뢰성, 정보의 시의성, 이용에 대 한 주의사항 게시, 이용의 편리성, 서비스 만 족도, 이용자 접근성, 항해용이성, 건강정보에 의한 행동변화, 병원 방문에 대한 영향 정도 건강정보제공 주체, 건강정보를 얻기 위하여 접속하는 사이트 수, 지난 1년간 이용한 건강 정보 6점척도 6점척도 인터넷 사용 1 평균 인터넷 사용 시간 스마트폰을 통한 건강정보 이용행태 건강정보 이용자 수요조사 6 1 스마트폰(태플릿PC 포함) 사용 여부, 스마트 폰을 통한 건강정보 검색 여부, 건강 및 의학 관련 어플리케이션 설치여부 및 분야 향후 건강정보광장에 제공되었으면 하는 서비 스 및 기능 <표 7-15> 2013년 건강정보광장 월별 이용자 만족도 조사 항목 구분 문항 수 내용 비고 일반적 사항 3 성별, 연령, 거주 지역 이용실태 5 품질, 만족도 7 인지경로, 방문빈도, 방문시간, 주로 이용하는 정보, 가장 유익한 정보 내용의 충분성, 정보의 유용성, 이해용이성, 건 강정보의 신뢰성, 편리성, 시의성, 서비스 만족도 5점척도 라. 자료분석 수집된 자료는 SPSS 12.0.1 프로그램을 활용하여 빈도분석, 교차분석, 기술통계 분석, Chi-Square Test, 다중응답분석 등의 통계분석을 수행 하였다.
232 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 2. 조사결과 가. 응답자의 일반적 특성 응답자의 일반적 특성은 성별, 연령, 최종학력, 직업, 스마트폰 사용 유 무로 구분하였다(표 1 참조). 설문응답자 총 2, 094명 가운데 남자가 1175명(56.1%), 여자가 919명(43.9%)으로 남자의 응답비율이 높았으 며, 연령대별로는 30대가 43.7%, 20대가 31.7%, 40대가 16.9%, 50대 가 6.2%, 10대가 2.2% 순으로 나타났다. 최종학력으로는 대학교 졸업(67.9%)이 가장 응답률이 많았으며, 그 다음이 고등학교 졸업 이하(25.6%), 대학원 이상(4.7%) 순으로 조사되 었다. 직업별로는 비보건의료계열과 보건의료계열로 구분하였을 때 비보건 의료계열은 전체 응답자 중 92.8%를 차지하였으며 보건의료계열 응답자 는 7.3%로 나타났다. 비보건의료계열중 사무직이 37.7%로 가장 많았으 며, 그 다음이 학생(14.3%), 서비스판매직(12.2%) 등 순으로 나타났다. 보건의료계열 중 의사, 간호사 등의 보건의료인이 4.4%의 응답율을 보였 으며 그 다음이 보건의료계열 학생이 1.5% 응답율을 보였다. 전체 응답자 중 스마트폰을 사용하고 있는 응답자는 전체의 87.3%가 스마트폰을 사용하고 있는 것으로 나타났다(표 7-16 참조). 건강정보광 장 월별 이용자 만족도 참여자 일반적 사항은 <표 7-17>과 같다. 전체 응 답자 중 30대가 40.3%(882명), 20대가 29.2%(639명), 40대가 19.0%(416명), 50대 이상이 6.2%(135명), 10대가 5.4%(118명) 순으로 응답하였다. 조사 참여자자의 거주 지역을 분석한 결과 서울이 26.8%, 경기 23.0% 순으로 나타났다.
제7장 건강정보광장 평가 233 <표 7-16> 2013년 건강정보광장 이용자실태 및 수요조사 응답자의 일반사항 (단위: %, 명) 성별 구분 합계 남자 여자 연령 2,094(100.0) 1175( 56.1) 919( 43.9) 10대 33( 1.6) 14( 1.2) 19( 2.1) 20대 663( 31.7) 356( 30.3) 307( 33.4) 30대 915( 43.7) 517( 44.0) 398( 43.3) 40대 354( 16.9) 228( 19.4) 126( 13.7) 50대 이상 129( 6.2) 60( 5.1) 69( 7.5) 최종학력 고등학교 이하 537( 25.6) 280( 23.8) 257( 28.0) 대학교 1,422( 67.9) 803( 68.3) 619( 67.4) 대학원이상 135( 6.4) 92( 7.8) 43( 4.7) 직업 비보건의료계열 전문사무직 789( 37.7) 489( 41.6).300( 32.6) 서비스판매직 255( 12.2) 170( 14.5) 85( 9.2) 생산 관련직 99( 4.7) 91( 7.7) 8( 0.9) 학생 300( 14.3) 173( 14.7) 127( 13.8) 주부 198( 9.5) 0 198( 21.5) 농수축산 14( 0.7) 12( 1.0) 2( 0.2) 교사 및 교수 35( 1.7) 13( 1.1) 22( 2.4) 연구원 31( 1.5) 25( 2.1) 6( 0.7) 무직 69( 3.3) 47( 4.0) 22( 2.4) 기타 150( 7.2) 88( 7.5) 62( 6.7) 보건의료계열 보건의료인 93( 4.4) 39( 3.3) 54( 5.9) 연구자 19( 0.9) 13( 1.1) 6( 0.7) 학생 32( 1.5) 12( 1.0) 20( 2.2) 기타 10( 0.5) 3( 0.3) 7( 0.8) 스마트폰사용 사용 1,829( 87.3) 1031( 87.7) 798( 86.8) 사용하지 않음 265( 12.7) 144( 12.3) 121( 13.2)
234 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-17> 2013년 건강정보광장 월별 이용자 만족도 참여자 일반적 사항 (단위: 명: %) 성별 구분 합계 남자 여자 10대 118( 5.4) 59( 4.8) 59( 6.1) 20대 639(29.2) 337(27.5) 302(31.3) 연령 30대 882(40.3) 477(38.9) 405(42.0) 40대 416(19.0) 275(22.4) 141(14.6) 50대이상 135( 6.2) 77( 6.3) 58( 6.0) 강원 50( 2.1) 26( 2.5) 24( 2.3) 경기 521(23.0) 282(24.8) 239(23.8) 경남 97( 4.7) 58( 4.0) 39( 4.4) 경북 76( 3.5) 43( 3.4) 33( 3.5) 광주 61( 2.7) 33( 2.9) 28( 2.8) 대구 143( 6.4) 78( 6.7) 65( 6.5) 대전 102( 4.9) 60( 4.4) 42( 4.7) 거주지역 부산 179( 7.9) 97( 8.5) 82( 8.2) 서울 568(26.8) 328(24.9) 240(25.9) 울산 30( 1.1) 14( 1.7) 16( 1.4) 인천 116( 5.9) 72( 4.6) 44( 5.3) 전남 58( 2.3) 28( 3.1) 30( 2.6) 전북 62( 3.0) 37( 2.6) 25( 2.8) 제주 16( 1.2) 15( 0.1) 1( 0.7) 충남 70( 3.1) 38( 3.3) 32( 3.2) 충북 41( 1.3) 16( 2.6) 25( 1.9) 나. 건강정보광장 이용실태 건강정보광장 이용실태로는 인지경로, 방문빈도, 머무르는 시간, 주 로 이용하는 정보, 유익한 건강정보, RSS 사용여부를 묻는 문항으로 총 6 개 문항에 있어 건강정보광장을 알게 된 계기와 이용빈도에 대한 문항은 전체 응답자 2,094명을 대상으로 분석하였으며, 머무르는 시간, 주로 이
제7장 건강정보광장 평가 235 용하는 정보, 유익한 건강정보, RSS 사용여부를 묻는 4개 문항은 문항 특 성상 설문조사 응답 시 처음 방문한 809명을 제외하고 1,285명을 대상 으로 분석하였다. (1) 건강정보광장을 알게 된 계기 건강정보광장 의 인지경로는 이벤트광고 를 통한 방문이 전체의 38.9%로 가장 높았으며, 그 다음이 검색엔진 을 통한 방문이 36.6% 순 이었다. 다른 사이트를 통한 방문은 21.3%, 주변사람을 통한 방문이 3.2% 순으로 나타났다 (표 7-18 참조). (2) 이용빈도 건강정보광장 의 방문빈도는 처음방문 하는 경우가 전체 응답자 중 38.6%로 가장 높았으며 한 달에 1번 이상 방문하는 응답자는 33.5%, 일주일에 1번 이상 방문하는 응답자는 24.3%, 매일 방문 하는 응답자 는 전체 응답자 중 3.6%에 불과하였다(표 7-19 참조). (3) 머무르는 시간 건강정보광장 의 머무르는 시간은 처음 방문한 809명을 제외하고 1, 285명을 대상으로 분석하였으며, 5~10분 이내 가 전체 응답자의 41.6%로 가장 높았으며, 10~20분 이내 가 32.3%, 5분 이내 14.3% 순이었다(표 7-20 참조).
236 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-18> 2013년 건강정보광장 을 알게 된 계기 (단위: %, 명) 이벤트광고 검색 엔진 다른 사이트 주변 사람 합계 P 전체 38.9 36.6 21.3 3.2 100.0(2,094) 성별 0.149 남자 40.6 36.0 20.8 2.6 100.0(1,175) 여자 36.7 37.4 22.0 3.9 100.0( 919) 연령 0.000*** 10대 66.7 21.2 9.1 3.0 100.0( 33) 20대 43.3 30.9 23.2 2.6 100.0( 663) 30대 37.5 38.6 20.8 3.2 100.0( 915) 40대 34.5 40.4 21.5 3.7 100.0( 354) 50대 이상 31.0 45.7 17.8 5.4 100.0( 129) 최종학력 0.124 고등학교이하 42.5 34.6 19.9 3.0 100.0( 537) 대학교 37.5 37.6 22.0 3.0 100.0(1,422) 대학원이상 39.3 34.8 19.3 6.7 100.0( 135) 직업 0.025** 비보건의료계열 전문사무직 37.5 38.7 20.7 3.2 100.0( 789) 서비스판매직 35.7 43.1 19.2 2.0 100.0( 255) 생산 관련직 40.4 42.4 17.2 100.0( 99) 학생 43.3 29.0 23.7 4.0 100.0( 300) 주부 33.8 36.9 24.2 5.1 100.0( 198) 농수축산 64.3 21.4 7.1 7.1 100.0( 14) 교사 및 교수 40.0 31.4 22.9 5.7 100.0( 35) 연구원 51.6 32.3 12.9 3.2 100.0( 31) 무직 37.7 30.4 29.0 2.9 100.0( 69) 기타 49.3 26.7 22.7 1.3 100.0( 150) 보건의료계열 보건의료인 35.5 36.6 23.7 4.3 100.0( 93) 연구자 21.1 52.6 15.8 10.5 100.0( 19) 학생 34.4 50.0 15.6 100.0( 32) 기타 30.0 50.0 10.0 10.0 100.0( 10) 스마트폰사용 0.463 사용 39.1 36.0 21.7 3.2 100.0(1,829) 사용하지 않음 37.0 40.8 18.9 3.4 100.0( 265) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 237 <표 7-19> 2013년 건강정보광장 이용빈도 (단위: %, 명) 매일 일주일에 1번이상 한달에 1번이상 처음 방문 합계 P 전체 3.6 24.3 33.5 38.6 100.0(2,094) 성별 0.012** 남자 4.3 25.4 34.6 35.8 100.0(1,175) 여자 2.7 23.0 32.1 42.2 100.0( 919) 연령 0.000*** 10대 3.0 6.1 18.2 72.7 100.0( 33) 20대 3.3 17.3 30.6 48.7 100.0( 663) 30대 3.4 25.9 34.3 36.4 100.0( 915) 40대 3.1 31.6 38.7 26.6 100.0( 354) 50대 이상 7.8 33.3 31.8 27.1 100.0( 129) 최종학력 0.000*** 고등학교 2.6 18.6 31.3 47.5 100.0( 537) 대학교 3.4 26.7 34.5 35.4 100.0(1,422) 대학원이상 8.9 22.2 31.9 37.0 100.0( 135) 직업 0.000*** 비보건의료계열 전문사무직 4.3 26.0 35.9 33.8 100.0( 789) 서비스판매직 2.7 31.8 37.3 28.2 100.0( 255) 생산 관련직 4.0 30.3 33.3 32.3 100.0( 99) 학생 2.3 16.3 26.7 54.7 100.0( 300) 주부 1.5 21.7 37.4 39.4 100.0( 198) 농수축산 7.1 28.6 28.6 35.7 100.0( 14) 교사 및 교수 5.7 28.6 28.6 37.1 100.0( 35) 연구원 6.5 16.1 32.3 45.2 100.0( 31) 무직 4.3 14.5 34.8 46.4 100.0( 69) 기타 1.3 14.7 27.3 56.7 100.0( 150) 보건의료계열 보건의료인 10.8 34.4 30.1 24.7 100.0( 93) 연구자 36.8 52.6 10.5 100.0( 19) 학생 28.1 21.9 50.0 100.0( 32) 기타 20.0 20.0 60.0 100.0( 10) 스마트폰사용 0.998 사용 3.6 24.3 33.5 38.7 100.0(1,829) 사용하지 않음 3.4 24.5 33.6 38.5 100.0( 265) 주: * P<0.1, ** p<0.005, *** p<0.001
238 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-20> 2013년 건강정보광장 이용자의 머무르는 시간 5분 이내 5~10분 이내 10~20분 이내 (단위: %, 명) 20이상 합계 P 전체 14.3 41.6 32.3 11.8 100.0(1,285) 성별 0.001** 남자 16.2 43.8 30.8 9.3 100.0( 754) 여자 11.7 38.6 34.5 15.3 100.0( 531) 연령 0.000*** 10대 33.3 33.3 22.2 11.1 100.0( 9) 20대 15.6 42.4 34.1 7.9 100.0( 340) 30대 15.8 46.2 29.7 8.2 100.0( 582) 40대 10.0 34.6 36.2 19.2 100.0( 260) 50대 이상 10.6 30.9 31.9 26.6 100.0( 94) 최종학력 0.493 고등학교 14.9 39.4 33.7 12.1 100.0 (282) 대학교 13.8 42.3 32.7 11.2 100.0( 918) 대학원이상 17.6 42.4 23.5 16.5 100.0( 85) 직업 0.136 비보건의료계열 전문사무직 15.3 37.4 34.3 13.0 100.0( 522) 서비스판매직 10.4 43.2 36.6 9.8 100.0( 183) 생산 관련직 7.5 55.2 26.9 10.4 100.0( 67) 학생 16.9 39.0 33.8 10.3 100.0( 136) 주부 12.5 36.7 31.7 19.2 100.0( 120) 농수축산 22.2 33.3 22.2 22.2 100.0( 9) 교사 및 교수 9.1 50.0 31.8 9.1 100.0( 22) 연구원 11.8 52.9 35.3 100.0( 17) 무직 18.9 32.4 35.1 13.5 100.0( 37) 기타 21.5 52.3 20.0 6.2 100.0( 65) 보건의료계열 보건의료인 15.7 51.4 22.9 10.0 100.0( 70) 연구자 11.8 52.9 35.3 100.0( 17) 학생 12.5 62.5 18.8 6.3 100.0( 16) 기타 75.0 25.0 100.0( 4) 스마트폰사용 0.230 사용 14.1 40.8 32.9 12.2 100.0(1,122) 사용하지 않음 16.0 47.2 28.2 8.6 100.0( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 239 건강정보광장 의 월별 만족도 조사에서는 건강정보광장 홈페이지 에 유입하여 이용하는 시간에 대한 분석 결과 5분 이내의 응답자가 33.9%, 5분에서 10분 정도 머무르는 응답자는 28.2%, 10분에서 20분 이내 건강정보광장을 이용하는 응답자는 24.9%, 20분에서 30분 이내 이 용하는 응답자는 13.1% 순으로 나타났다. 전체 연령대별 분석 결과에서 도 10대부터 30대까지는 5분 이내 머무르는 비율이 가장 높았으며 40대 의 경우 4분에서 10분 이상 머무르는 비율이 28.1%로 가장 높았다. 반면 에 50대의 경우 5분 이내 건강정보광장에 머무르는 비율이 가장 높은 것 으로 분석되었다(표 7-21 참조). <표 7-21> 2013년 건강정보광장 월별 이용자의 머무르는 시간 (단위: %) 5분이내 5~10분이내 10~20분이내 20~30분이내 전체 33.9 28.2 24.9 13.1 성별 연령 남자 34.5 27.7 24.4 13.4 여자 33.1 28.8 25.5 12.6 10대 45.8 37.3 14.4 2.5 20대 39.3 27.9 23.5 9.4 30대 33.1 27.2 26.5 13.2 40대 25.5 28.1 26.7 19.7 50대이상 28.9 28.1 24.4 18.5 (4) 주로 이용하는/유익한 정보 건강정보광장 을 이용하는 이용자 중 처음 방문한 809명을 제외한 1,285명의 사이트 방문자들이 건강정보광장 에서 주로 이용하는 정보에
240 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 대한 문항에서는 1순위 건강콘텐츠 가 32.7%로 가장 높았으며 그 다음 이 자가진단, 건강소식, 건강지식검색, 건강정책연구, 의료서비스 순으로 나타났다. 이러한 경향은 연령, 최종학력, 직업군에서 유의한 영 향이 나타났다. 주요이용정보 2순위에서는 건강소식 이 23.3%, 건강지 식검색 이 20.9% 순으로 조사되었다. 또한 건강정보광장 에서 가장 유익한 정보로 답한 콘텐츠는 자가진 단 이 39.5%로 가장 높게 나타났으며 다음이 건강콘텐츠, 건강소식. 건강지식검색 순이라고 응답하였다(표 7-22. 7-23참조). <표 7-22> 2013년 건강정보광장 이용실태 1순위 2순위 3순위 유익한 정보 건강콘텐츠 32.7 건강소식 23.3 건강지식검색 19.8 자가진단 29.4 자가진단 24.7 건강지식검색 20.9 의료서비스정보 19.1 건강콘텐츠 25.1 건강소식 21.3 자가진단 19.9 자가진단 14.6 건강소식 19.5 건강지식검색 9.5 건강콘텐츠 15.2 건강콘텐츠 14.2 건강지식검색 14.4 건강정책연구 6.1 의료서비스정보 9.3 건강소식 14.0 건강정책연구 4.9 의료서비스정보 4.3 건강정책연구 7.4 건강App 8.3 의료서비스정보 4.9
제7장 건강정보광장 평가 241 <표 7-23> 2013년 건강정보광장 응답자 특성별 주요 이용정보 1순위 (단위: %, 명) 건강콘텐츠 자가진단 건강소식 건강정책연구 건강지식검색 전체 32.7 24.7 21.3 6.1 9.5 성별 남자 34.0 24.3 20.8 8.0 7.6 여자 30.9 25.2 22.0 3.6 12.2 연령 10대 44.4 33.3 11.1 11.1 20대 32.9 27.1 17.9 10.3 7.4 30대 33.3 24.6 22.2 5.2 10.3 40대 31.2 22.7 23.1 5.0 9.2 50대 이상 30.9 21.3 25.5 12.8 최종학력 고등학교 34.0 22.3 22.0 3.2 10.6 대학교 31.5 25.6 21.9 6.5 9.3 대학원이상 41.2 22.4 12.9 11.8 8.2 직업 비보건의료계열 전문사무직 31.6 24.7 21.1 7.9 9.2 서비스판매직 31.7 21.3 23.5 5.5 12.0 생산 관련직 32.8 23.9 25.4 3.0 9.0 학생 33.8 29.4 16.2 4.4 8.8 주부 30.8 24.2 23.3 2.5 15.8 농수축산 33.3 11.1 33.3 교사 및 교수 36.4 27.3 18.2 4.5 연구원 52.9 11.8 17.6 5.9 5.9 무직 29.7 32.4 16.2 2.7 5.4 기타 32.3 30.8 18.5 6.2 7.7 보건의료계열 보건의료인 40.0 21.4 24.3 8.6 4.3 연구자 11.8 35.3 23.5 17.6 11.8 학생 56.3 12.5 12.5 12.5 6.3 기타 25.0 75.0 스마트폰사용 사용 33.6 23.9 21.4 6.1 9.8 사용하지 않음 26.4 30.1 20.9 6.7 7.4 주: * P<0.1, ** p<0.005, *** p<0.001
242 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-23> 계속 (단위: %, 명) 의료 서비스정보 건강App 기타 합계 P 전체 4.3 0.9 0.5 100.0(1,285) 성별 0.005** 남자 4.1 1.1 0.3 100.0( 754) 여자 4.5 0.8 0.8 100.0( 531) 연령 0.048** 10대 100.0( 9) 20대 2.9 0.9 0.6 100.0( 340) 30대 3.4 0.5 0.5 100.0( 582) 40대 6.9 1.5 0.4 100.0( 260) 50대 이상 7.4 2.1 100.0( 94) 최종학력 0.042** 고등학교 6.0 1.8 100.0( 282) 대학교 3.9 0.8 0.5 100.0( 918) 대학원이상 2.4 1.2 100.0( 85) 직업 0.000*** 비보건의료계열 전문사무직 4.8 0.6 0.2 100.0( 522) 서비스판매직 4.9 0.5 0.5 100.0( 183) 생산 관련직 6.0 100.0( 67) 학생 4.4 2.2 0.7 100.0( 136) 주부 3.3 100.0( 120) 농수축산 22.2 100.0( 9) 교사 및 교수 4.5 4.5 4.5 100.0( 22) 연구원 5.9 100.0( 17) 무직 8.1 5.4 100.0( 37) 기타 3.1 1.5 100.0( 65) 보건의료계열 보건의료인 1.4 100.0( 70) 연구자 100.0( 17) 학생 100.0( 16) 기타 100.0( 4) 스마트폰사용 0.154 사용 3.9 0.8 0.5 100.0(1,122) 사용하지 않음 6.7 1.8 100.0( 163)
제7장 건강정보광장 평가 243 월별 만족도 조사에서는 건강정보광장 을 유입하여 주로 이용하는 정 보에 대한 질문 분석 결과 응답자의 33.5%가 건강콘텐츠를 이용하는 것 으로 분석되었으며, 자가진단이 27.8%, 건강기사가 10.0% 순으로 나타 났다(표 7-24 참조). <표 7-24> 2013년 건강정보광장 월별 이용자의 주 이용 정보 (단위: %) 구분 1순위 2순위 3순위 전체 4월 5월 6월 건강콘텐츠 (33.5) 자가진단 (16.2) 자가진단 (5.8) 자가진단 (27.8) 건강기사 (10.4) 건강수칙 (5.3) 건강기사 (10.0) 의료서비스정보 (8.9) 건강기사 (5.1) 건강정보검색 (5.9) 건강정보검색 (7.3) 의료서비스정보 (5.0) 병의원정보 (5.2) 병의원정보 (6.6) 건강지식검색 (4.8) 의료서비스정보 (4.0) 건강수칙 (6.6) 건강정보검색 (4.3) 건강강좌행사 (3.2) 건강콘텐츠 (6.2) 건강웹진 (4.2) 건강콘텐츠 (29.7) 자가진단 (16.7) 건강수칙 (14.4) 자가진단 (28.6) 의료서비스정보 (14.6) 자가진단 (13.3) 건강정보검색 (8.6) 건강정보검색 (11.8) 건강기사 (12.2) 건강기사 (8.0) 건강기사 (9.7) 건강정보검색 (11.1) 병의원정보 (5.7) 건강수칙 (9.7) 의료서비스정보 (10.0) 의료서비스정보 (4.6) 건강지식검색 (8.3) 건강지식검색 (8.9) 건강강좌/행사 (3.4) 건강콘텐츠 (7.6) 병의원정보 (7.8) 건강콘텐츠 (37.0) 자가진단 (20.9) 자가진단 (19.0) 자가진단 (26.9) 건강기사 (14.8) 건강기사 (12.9) 건강기사 (8.9) 건강정보검색 (12.2) 건강수칙 (10.4) 건강정보검색 (6.7) 의료서비스정보 (9.5) 건강정보검색 (9.8) 병의원정보 (4.3) 건강수칙 (8.0) 건강웹진 (9.8) 의료서비스정보 (3.7) 병의원정보 (7.6) 의료서비스정보 (8.0) 건강강좌/행사 (2.8) 건강웹진 (7.2) 병의원정보 (7.4) 건강콘텐츠 (33.6) 자가진단 (12.8) 건강정보검색 (16.0) 자가진단 (30.9) 건강정보검색 (11.7) 건강콘텐츠 (12.8) 건강기사 (8.2) 의료서비스정보 (10.9) 의료서비스정보 (12.8) 병의원정보 (7.0) 건강수칙 (10.2) 자가진단 (12.0)
244 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 구분 1순위 2순위 3순위 7월 8월 9월 건강정보검색 (4.9) 건강지식검색 (10.2) 병의원정보 (9.6) 건강강좌/행사 (3.8) 병의원정보 (8.3) 건강수칙 (8.8) 의료서비스정보 (3.6) 건강웹진 (8.3) 건강웹진 (8.0) 건강콘텐츠 (31.9) 자가진단 (13.0) 건강웹진 (7.8) 자가진단 (25.9) 건강기사 (12.2) 자가진단 (7.0) 건강기사 (11.9) 의료서비스정보 (8.9) 의료서비스정보 (5.9) 건강정보검색 (7.0) 병의원정보 (7.0) 건강지식검색 (5.9) 의료서비스정보 (5.9) 건강수칙 (7.0) 건강기사 (4.8) 병의원정보 (5.2) 건강지식검색 (7.0) 건강수칙 (4.8) 건강강좌행사 (3.3) 건강콘텐츠 (6.3) 건강콘텐츠 (4.4) 건강콘텐츠 (35.9) 자가진단 (18.2) 건강수칙 (6.7) 자가진단 (27.0) 건강기사 (10.4) 자가진단 (6.6) 건강기사 (11.5) 의료서비스정보 (7.6) 건강지식검색 (5.0) 건강정보검색 (5.2) 건강콘텐츠 (7.2) 건강기사 (4.9) 병의원정보 (4.9) 건강정보검색 (6.9) 병의원정보 (4.4) 의료서비스정보 (3.2) 병의원정보 (6.9) 의료서비스정보 (3.8) 건강웹진 (3.1) 건강app (2.4) 건강콘텐츠 (3.7) 건강콘텐츠 (28.3) 자가진단 (19.3) 건강콘텐츠 (4.5) 자가진단 (27.4) 건강콘텐츠 (9.0) 건강기사 (4.5) 건강기사 (11.2) 건강기사 (9.0) 의료서비스정보 (4.5) 건강정보검색 (6.3) 의료서비스정보 (6.7) 건강지식검색 (3.6) 의료서비스정보 (4.9) 건강정보검색 (5.4) 건강정보검색 (3.1) 시스템 결측값 (4.9) 병의원정보 (5.4) 병의원정보 (3.1) 병의원정보 (4.0) 건강수칙 (4.5) 건강수칙 (3.1) (5) RSS 이용여부 건강정보광장 에서 서비스되고 있는 RSS사용여부를 묻는 문항에서 전체 응답자의 63.1%가 이용하지 않는 것으로 나타낫으며, 응답자의 36.9%만이 사용하는 것으로 조사되었다. 그러나 이러한 결과는 2012년 도 조사결과보다는 약간 높은 수치로 RSS 이용현황에 대해 다소 변화가
제7장 건강정보광장 평가 245 일어난다고 볼 수 있다. RSS 이용여부에 있어서 연령, 직업군에서 통계적 으로 유의한 차이를 보였다(표 7-25 참조). <표 7-25> 2013년 건강정보광장 만족도 및 수요조사 응답자 특성별 RSS 이용여부 (단위: %, 명) RSS 사용함 RSS 사용하지 않음 합계 P 전체 36.9 63.1 100.0 (1,285) 성별 0.472 남자 36.1 63.9 100.0 ( 754) 여자 38.0 62.0 100.0 ( 531) 연령 0.001 10대 33.3 66.7 100.0 ( 9) 20대 28.8 71.2 100.0 ( 340) 30대 38.1 61.9 100.0 ( 582) 40대 40.0 60.0 100.0 ( 260) 50대 이상 50.0 50.0 100.0 ( 94) 최종학력 0.518 고등학교 34.0 66.0 100.0 ( 282) 대학교 37.8 62.2 100.0 ( 918) 대학원이상 36.5 63.5 100.0 ( 85) 직업 0.069 비보건의료계열 전문사무직 36.2 63.8 100.0 ( 522) 서비스판매직 44.3 55.7 100.0 ( 183) 생산 관련직 41.8 58.2 100.0 ( 67) 학생 31.6 68.4 100.0 ( 136) 주부 37.5 62.5 100.0 ( 120) 농수축산 44.4 55.6 100.0 ( 9) 교사 및 교수 22.7 77.3 100.0 ( 22) 연구원 35.3 64.7 100.0 ( 17) 무직 32.4 67.6 100.0 ( 37) 기타 20.0 80.0 100.0 ( 65) 보건의료계열 보건의료인 44.3 55.7 100.0 ( 70) 연구자 52.9 47.1 100.0 ( 17) 학생 43.8 56.3 100.0 ( 16) 기타 25.0 75.0 100.0 ( 4) 스마트폰사용 0.119 사용 37.7 62.3 100.0 (1,122) 사용하지 않음 31.3 68.7 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
246 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 다. 건강정보 품질 및 만족도 월별 만족도 조사분석 결과 건강장보광장 에서 건강정보 품질 및 만 족도 등에 대한 조사내용은 건강정보 내용의 충분성, 정보의 유용성, 이 해의 용이성, 건강정보의 신뢰성, 정보의 시의성, 이용에 대한 주의사항 게시여부, 이용의 편리성, 서비스에 대한 만족도, 이용자 접근성, 항해의 용이성, 건강정보에 의한 행동변화, 병원방문에 대한 영향정도 등이며 매우 동의함 에서부터 매우 동의하지 않음 까지 6점 척도 분석으로 이 루어져 있다. 분석 자료는 통계분석 신뢰도를 고려하여 건강정보광장 을 주기적으로 이용하는 이용자를 대상으로 분석하였다. 본 설문에 응답 한 2,094명 중 처음방문 한 809명을 제외한 1,285명을 대상으로 분석 하였다. 건강정보광장 을 이용하는 이용자들의 월별 만족도를 분석한 경과 신 뢰성(4.16), 내용의 유용성(4.13), 내용의 충분성(4.08), 이해용이성 (3.96), 이용용이성(3.96), 서비스 만족도(3.86) 순으로 나타났다. 4월에 는 내용의 유용성(4.16), 내용의 신뢰성(4.16), 내용의 충분성(4.05) 순이 었으며, 5월은 내용의 유용성(4.09), 신뢰성(4.08), 내용의 충분성(4.03) 순으로 나타났다. 6월에는 신뢰성(4.17)점으로 가장 만족도 점수가 높게 분석 되었으며, 유용성(4.12), 충분성(4.06) 순으로 분석되었다. 7월에는 신뢰성(4.20), 내용의 충분성(4.13), 유용성(4.13) 순으로 나 타났으며, 8월에는 신뢰성이(4.20), 유용성(4.14), 충분성(4.09) 순으로 분석되었다. 9월의 이용 만족도는 유용성이(4.12), 내용의 충분성(4.10), 신뢰성(4.04)로 나타났다(표 7-26, 그림 7-1 참조).
제7장 건강정보광장 평가 247 <표 7-26> 2013년 건강정보광장 월별 이용자의 이용만족도 (단위: %) 항목 Mean±SD 내용의충분성 4.08±0.69 유용성 4.13±0.70 전체 이해용이성 3.96±0.76 신뢰성 4.16±0.75 이용용이성 3.96±0.78 서비스만족도 3.86±0.82 내용의충분성 4.05±0.79 유용성 4.16±0.76 4월 이해용이성 4.00±0.85 신뢰성 4.15±0.87 이용용이성 3.96±0.86 서비스만족도 3.89±0.87 내용의충분성 4.03±0.71 유용성 4.09±0.77 5월 이해용이성 3.87±0.78 신뢰성 4.08±0.75 이용용이성 3.93±0.78 서비스만족도 3.81±0.85 내용의충분성 4.06±0.73 유용성 4.12±0.72 6월 이해용이성 3.96±0.79 신뢰성 4.17±0.76 이용용이성 3.92±0.84 서비스만족도 3.82±0.86 내용의충분성 4.13±0.69 유용성 4.13±0.71 이해용이성 3.99±0.74 7월 신뢰성 4.20±0.76 이용용이성 4.00±0.76 서비스만족도 3.89±0.84 8월 내용의충분성 4.09±0.65
248 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 항목 Mean±SD 9월 유용성 4.14±0.69 이해용이성 3.96±0.76 신뢰성 4.20±0.74 이용용이성 3.98±0.78 서비스만족도 3.86±0.82 내용의충분성 4.10±0.69 유용성 4.12±0.68 이해용이성 3.97±0.74 신뢰성 4.04±0.73 이용용이성 3.94±0.75 서비스만족도 3.85±0.8. 그림 7-1 2013년 건강정보광장 월별피드백조사 전체 만족도 비율
제7장 건강정보광장 평가 249 그림 7-2 2013년 건강정보광장 월별 피드백조사 만족도 비율 (1) 건강정보의 충분성 건강정보의 충분성은 건강정보광장은 개가 필요로 하는 내용을 충분 히 포함하고 있다 라는 물음에 전체 대상자의 48.6%가 대체로 동의함 을, 22.3%가 약간 동의함, 19.5%가 매우 동의함 으로 긍정적인 응답 이 많은 것으로 나타났다. 건강정보의 충분성에 대해 긍정적인 응답 비율 이 높은 것으로 나타났으며 스마트폰 사용여부가 통계적으로 유의한 차 이를 보였다(표 7-27 참조).
250 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - (2) 건강정보의 유용성 건강정보의 유용성은 건강정보광장에서 찾은 건강정보는 유용하다 라 는 질문에 대한 것으로 전체 대상자의 42.3%가 대체로 동의함 이라고 응답하였으며 다음으로는 매우 동의함 24.9%, 약간 동의함 이 23.8% 라고 응답한 것으로 나타났다. 응답자특성별로 직업군에서 농수축산에 종사하고 있는 응답자의 66.7%가 대체로 동의함 이라고 응답한 비율이 과반수로 나타났으며, 주부의 경우도 50.8% 가 대체로 동의함 이라고 응답하였다(표 7-28 참조). (3) 건강정보의 이해용이성 건강정보의 이해용이성은 건강정보광장에서 찾은 건강정보는 이해하 기 쉽다 라는 질문에 대한 것으로 전체 응답자의 40.3%가 대체로 동의 함 이라고 응답하였으며, 다음으로 30.8%가 약간 동의함, 18.2%가 매 우 동의함 이라고 긍정적인 응답을 하였으며, 응답자 특성별로 모두 통계 적으로 유의한 차이가 나타나지 않았다(표 7-29 참조). (4) 건강정보의 신뢰성 건강정보의 신뢰성은 건강정보광장에서 찾은 건강정보는 믿을만하다 라는 질문으로 유도하였으며 전체 응답자의 37.6%가 대체로 동의함 이 라고 응답하였으며 매우 동의함 이 29.6%, 약간 동의함 이 21.2%로 긍 정적인 응답을 하였다. 건강정보의 신뢰성에 있어서는 스마트폰 사용여 부가 통계적으로 유의한 차이를 보였다(표 7-30 참조).
제7장 건강정보광장 평가 251 <표 7-27> 2013년 건강정보광장 응답자 특성별 건강정보내용의 충분성 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 19.5 48.6 23.3 6.0 1.9 0.6 100.0 (1,285) 성별 0.511 남자 20.2 49.6 22.4 5.3 1.7 0.8 100.0 ( 754) 여자 18.5 47.3 24.7 7.0 2.3 0.4 100.0 ( 531) 연령 0.225 10대 33.3 33.3 22.2 11.1 100.0 ( 9) 20대 19.1 46.5 25.0 6.8 2.4 0.3 100.0 ( 340) 30대 16.5 52.4 22.7 5.8 1.7 0.9 100.0 ( 582) 40대 22.3 46.9 23.8 5.0 1.2 0.8 100.0 ( 260) 50대 이상 29.8 39.4 20.2 7.4 3.2 100.0 ( 94) 최종학력 0.673 고등학교 19.1 47.2 25.5 6.0 2.1 100.0 ( 282) 대학교 19.6 48.8 23.0 6.0 2.0 0.7 100.0 ( 918) 대학원이상 18.8 51.8 20.0 5.9 1.2 2.4 100.0 ( 85) 직업 0.981 비보건의료계열 전문사무직 18.4 49.0 22.8 6.5 2.1 1.1 100.0 ( 522) 서비스판매직 23.5 45.4 21.3 7.7 1.6 0.5 100.0 ( 183) 생산 관련직 28.4 38.8 31.3 1.5 100.0 ( 67) 학생 17.6 47.8 26.5 4.4 2.9 0.7 100.0 ( 136) 주부 21.7 50.8 20.8 4.2 2.5 100.0 ( 120) 농수축산 11.1 66.7 11.1 11.1 100.0 ( 9) 교사 및 교수 18.2 54.5 18.2 9.1 100.0 ( 22) 연구원 11.8 58.8 17.6 11.8 100.0 ( 17) 무직 16.2 59.5 18.9 2.7 2.7 100.0 ( 37) 기타 10.8 46.2 30.8 9.2 3.1 100.0 ( 65) 보건의료계열 보건의료인 22.9 52.9 18.6 4.3 1.4 100.0 ( 70) 연구자 11.8 47.1 41.2 100.0 ( 17) 학생 18.8 43.8 25.0 12.5 100.0 ( 16) 기타 25.0 50.0 25.0 100.0 ( 4) 스마트폰사용 0.005** 사용 20.1 49.8 21.8 5.7 1.8 0.7 100.0 (1,122) 사용하지 않음 14.7 40.5 33.7 8.0 3.1 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
252 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-28> 2013년 건강정보광장 응답자 특성별 건강정보내용의 유용성 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 24.9 42.3 23.8 6.2 1.9 0.9 100.0 (1,285) 성별 0.939 남자 25.1 42.4 23.2 6.4 1.9 1.1 100.0 ( 754) 여자 24.7 42.2 24.7 6.0 1.9 0.6 100.0 ( 531) 연령 0.252 10대 22.2 22.2 33.3 22.2 100.0 ( 9) 20대 25.0 43.5 22.6 7.1 1.2 0.6 100.0 ( 340) 30대 22.3 41.8 25.9 7.0 1.7 1.2 100.0 ( 582) 40대 28.8 44.6 19.2 3.8 3.1 0.4 100.0 ( 260) 50대 이상 29.8 37.2 26.6 3.2 2.1 1.1 100.0 ( 94) 최종학력 0.528 고등학교 23.4 44.0 26.2 4.3 2.1 100.0 ( 282) 대학교 25.5 41.6 23.0 6.9 2.0 1.1 100.0 ( 918) 대학원이상 23.5 44.7 24.7 5.9 1.2 100.0 ( 85) 직업 0.559 비보건의료계열 전문사무직 26.1 40.0 23.0 7.5 2.1 1.3 100.0 ( 522) 서비스판매직 27.9 42.6 19.7 6.0 3.3 0.5 100.0 ( 183) 생산 관련직 29.9 37.3 26.9 4.5 1.5 100.0 ( 67) 학생 20.6 47.1 25.0 6.6 0.7 100.0 ( 136) 주부 26.7 41.7 26.7 3.3 1.7 100.0 ( 120) 농수축산 11.1 66.7 11.1 11.1 100.0 ( 9) 교사 및 교수 27.3 45.5 27.3 100.0 ( 22) 연구원 11.8 58.8 23.5 5.9 100.0 ( 17) 무직 27.0 54.1 10.8 5.4 2.7 100.0 ( 37) 기타 12.3 41.5 36.9 7.7 1.5 100.0 ( 65) 보건의료계열 보건의료인 25.7 44.3 22.9 4.3 2.9 100.0 ( 70) 연구자 17.6 29.4 47.1 5.9 100.0 ( 17) 학생 25.0 43.8 18.8 6.3 6.3 100.0 ( 16) 기타 25.0 50.0 25.0 100.0 ( 4) 스마트폰사용 0.003** 사용 25.4 43.7 22.5 5.8 1.6 1.0 100.0 (1,122) 사용하지 않음 21.5 33.1 32.5 9.2 3.7 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 253 <표 7-29> 2013년 건강정보광장 응답자 특성별 건강정보내용의 이해용이성 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 18.2 40.3 30.8 7.5 2.4 0.7 100.0(1,285) 성별 0.375 남자 18.0 40.3 30.5 8.4 1.9 0.9 100.0( 754) 여자 18.5 40.3 31.3 6.4 3.2 0.4 100.0( 531) 연령 0.406 10대 22.2 22.2 22.2 33.3 100.0( 9) 20대 17.1 39.1 33.2 7.9 2.1 0.6 100.0( 340) 30대 17.7 38.7 32.6 7.9 2.4 0.7 100.0( 582) 40대 19.2 46.2 25.4 6.2 2.3 0.8 100.0( 260) 50대 이상 22.3 40.4 26.6 5.3 4.3 1.1 100.0( 94) 최종학력 0.242 고등학교 16.7 41.5 33.3 5.7 2.8 100.0( 282) 대학교 18.2 39.9 30.8 7.7 2.5 0.9 100.0( 918) 대학원이상 23.5 41.2 22.4 11.8 1.2 100.0( 85) 직업 0.824 비보건의료계열 전문사무직 17.8 37.5 31.6 9.0 2.9 1.1 100.0( 522) 서비스판매직 23.5 36.6 31.1 5.5 2.7 0.5 100.0( 183) 생산 관련직 23.9 40.3 23.9 10.4 1.5 100.0( 67) 학생 17.6 38.2 36.0 5.9 2.2 100.0( 136) 주부 14.2 48.3 30.0 5.0 1.7 0.8 100.0( 120) 농수축산 11.1 55.6 22.2 11.1 100.0( 9) 교사 및 교수 22.7 54.5 13.6 4.5 4.5 100.0( 22) 연구원 5.9 52.9 41.2 100.0( 17) 무직 16.2 51.4 18.9 10.8 2.7 100.0( 37) 기타 10.8 35.4 43.1 7.7 1.5 1.5 100.0( 65) 보건의료계열 보건의료인 24.3 48.6 18.6 7.1 1.4 100.0( 70) 연구자 52.9 35.3 11.8 100.0( 17) 학생 18.8 37.5 31.3 6.3 6.3 100.0( 16) 기타 25.0 25.0 50.0 100.0( 4) 스마트폰사용 0.685 사용 18.5 40.6 30.3 7.5 2.3 0.8 100.0(1,122) 사용하지 않음 16.0 38.7 34.4 8.0 3.1 100.0( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
254 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-30> 2013년 건강정보광장 응답자 특성별 건강정보내용의 신뢰성 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 29.6 37.6 21.2 8.2 2.6 0.7 100.0 (1,285) 성별 0.609 남자 30.0 36.6 21.5 8.8 2.3 0.9 100.0 ( 754) 여자 29.2 39.0 20.7 7.5 3.2 0.4 100.0 ( 531) 연령 0.340 10대 11.1 33.3 44.4 11.1 100.0 ( 9) 20대 29.7 32.6 23.8 10.3 2.6 0.9 100.0 ( 340) 30대 28.5 38.1 21.3 8.4 3.1 0.5 100.0 ( 582) 40대 32.3 39.2 20.4 5.4 1.9 0.8 100.0 ( 260) 50대 이상 30.9 47.9 10.6 7.4 2.1 1.1 100.0 ( 94) 최종학력 0.887 고등학교 31.2 38.3 21.6 7.1 1.8 100.0 ( 282) 대학교 29.2 37.3 21.2 8.6 2.8 0.9 100.0 ( 918) 대학원이상 29.4 38.8 18.8 8.2 3.5 1.2 100.0 ( 85) 직업 0.434 비보건의료계열 전문사무직 28.9 37.2 22.4 7.3 2.9 1.3 100.0 ( 522) 서비스판매직 34.4 35.0 15.8 11.5 2.7 0.5 100.0 ( 183) 생산 관련직 35.8 40.3 17.9 6.0 100.0 ( 67) 학생 27.2 33.8 29.4 7.4 2.2 100.0 ( 136) 주부 27.5 49.2 16.7 4.2 2.5 100.0 ( 120) 농수축산 55.6 22.2 22.2 100.0 ( 9) 교사 및 교수 31.8 40.9 18.2 9.1 100.0 ( 22) 연구원 29.4 29.4 29.4 11.8 100.0 ( 17) 무직 29.7 51.4 10.8 5.4 2.7 100.0 ( 37) 기타 18.5 38.5 26.2 10.8 6.2 100.0 ( 65) 보건의료계열 보건의료인 34.3 30.0 22.9 8.6 4.3 100.0 ( 70) 연구자 23.5 29.4 17.6 23.5 5.9 100.0 ( 17) 학생 25.0 37.5 25.0 12.5 100.0 ( 16) 기타 25.0 25.0 25.0 25.0 100.0 ( 4) 스마트폰사용 0.005 사용 30.7 38.1 20.8 7.4 2.3 0.8 100.0 (1,122) 사용하지 않음 22.7 34.4 23.9 14.1 4.9 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 255 (5) 건강정보의 시의성 건강정보의 시의성은 건강정보의 정보가 시기적절하다 라는 질문에 대한 것으로 전체 응답자의 38.8%가 대체로 동의함, 28.6%가 약간 동 의함, 16.6%가 매우 동의함 순으로 나타나 긍정적인 응답비율이 높게 나타났다. 반면 별로 동의하지 않음 이 12.5%, 대체로 동의하지 않음 이 2.8%, 매우 동의안함 이 0.8% 순으로 부정적인 응답을 한 비율이 전 체 응답이 16.6%를 차지하였다(표 7-31 참조). (6) 건강정보 이용에 대한 주의사항 게시 여부 건강정보 이용에 대한 주의사항 게시여부는 건강정보광장에서 정보 이용에 대한 주의사항을 제시하고 있다 라는 질문에 대한 것으로 전체 응답자중 긍정적인 응답을 한 비율이 84.5%로 만족도가 높게 나타났으 며, 반면 부정적인 응답을 한 비율은 15.5%의 응답율을 보였다(표 7-32 참조). (7) 건강정보 이용의 편리성 건강정보 이용 편리성은 건강정보광장은 이용하기 편리하다 라는 질 문에 대한 것으로 전체 응답자의 37.8%가 대체로 동의함, 27.4%가 약 간 동의함, 18.8%가 매우 동의함 이라고 응답하였다. 건강정보 이용의 편리성 에 대한 질문은 응답자의 일반적인 특성과 통계적으로 유의한 것 이 없는 것으로 나타났다(표 7-33 참조).
256 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-31> 2013년 건강정보광장 응답자 특성별 건강정보내용의 시의성 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 16.6 38.8 28.6 12.5 2.8 0.8 100.0 (1,285) 성별 0.511 남자 15.6 39.3 27.7 13.7 2.8 0.9 100.0 ( 754) 여자 17.9 38.0 29.9 10.7 2.8 0.6 100.0 ( 531) 연령 0.888 10대 22.2 33.3 22.2 11.1 11.1 100.0 ( 9) 20대 15.6 35.0 31.8 15.0 2.1 0.6 100.0 ( 340) 30대 16.5 40.2 27.3 11.7 3.3 1.0 100.0 ( 582) 40대 18.5 40.0 28.1 10.4 2.3 0.8 100.0 ( 260) 50대 이상 14.9 40.4 27.7 13.8 3.2 100.0 ( 94) 최종학력 0.543 고등학교 14.5 40.4 29.8 13.5 1.8 100.0 ( 282) 대학교 17.3 37.7 28.6 12.4 2.9 1.0 100.0 ( 918) 대학원이상 15.3 44.7 24.7 9.4 4.7 1.2 100.0 ( 85) 직업 0.276 비보건의료계열 전문사무직 14.6 39.8 28.7 13.0 2.7 1.1 100.0 ( 522) 서비스판매직 20.2 37.2 28.4 7.7 4.9 1.6 100.0 ( 183) 생산 관련직 22.4 41.8 19.4 14.9 1.5 100.0 ( 67) 학생 15.4 30.9 33.1 16.9 3.7 100.0 ( 136) 주부 17.5 38.3 33.3 8.3 1.7 0.8 100.0 ( 120) 농수축산 22.2 22.2 22.2 11.1 22.2 100.0 ( 9) 교사 및 교수 22.7 18.2 45.5 9.1 4.5 100.0 ( 22) 연구원 11.8 41.2 29.4 17.6 100.0 ( 17) 무직 13.5 54.1 24.3 5.4 2.7 100.0 ( 37) 기타 12.3 43.1 23.1 21.5 100.0 ( 65) 보건의료계열 보건의료인 20.0 45.7 21.4 11.4 1.4 100.0 ( 70) 연구자 11.8 35.3 41.2 11.8 100.0 ( 17) 학생 25.0 25.0 31.3 18.8 100.0 ( 16) 기타 25.0 75.0 100.0 ( 4) 스마트폰사용 0.053 사용 16.1 40.0 28.6 12.0 2.4 0.8 100.0 (1,122) 사용하지 않음 19.6 30.1 28.8 15.3 5.5 0.6 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 257 <표 7-32> 2013년 건강정보광장 응답자 특성별 주의사항 게시여부 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 17.8 35.5 31.2 11.4 3.3 0.8 100.0 (1,285) 0.782 성별 남자 17.9 35.1 31.8 10.6 3.6 0.9 100.0 ( 754) 여자 17.7 36.0 30.3 12.6 2.8 0.6 100.0 ( 531) 연령 0.580 10대 11.1 22.2 44.4 22.2 100.0 ( 9) 20대 18.5 32.6 33.8 11.5 3.2 0.3 100.0 ( 340) 30대 16.2 34.7 32.0 12.4 3.8 1.0 100.0 ( 582) 40대 18.1 41.9 27.7 8.8 2.7 0.8 100.0 ( 260) 50대 이상 25.5 34.0 25.5 11.7 2.1 1.1 100.0 ( 94) 최종학력 0.791 고등학교 16.7 34.0 33.0 12.8 3.2 0.4 100.0 ( 282) 대학교 18.3 35.4 31.0 11.2 3.3 0.8 100.0 ( 918) 대학원이상 16.5 41.2 27.1 9.4 3.5 2.4 100.0 ( 85) 직업 0.715 비보건의료계열 전문사무직 18.6 34.3 30.1 12.8 3.1 1.1 100.0 ( 522) 서비스판매직 18.0 37.7 27.9 8.7 7.1 0.5 100.0 ( 183) 생산 관련직 16.4 40.3 32.8 6.0 4.5 100.0 ( 67) 학생 16.2 31.6 33.1 15.4 2.2 1.5 100.0 ( 136) 주부 18.3 38.3 33.3 8.3 0.8 0.8 100.0 ( 120) 농수축산 11.1 55.6 33.3 100.0 ( 9) 교사 및 교수 18.2 27.3 50.0 4.5 100.0 ( 22) 연구원 5.9 64.7 29.4 100.0 ( 17) 무직 16.2 35.1 32.4 13.5 2.7 100.0 ( 37) 기타 7.7 35.4 41.5 12.3 3.1 100.0 ( 65) 보건의료계열 보건의료인 24.3 34.3 25.7 11.4 4.3 100.0 ( 70) 연구자 23.5 29.4 29.4 17.6 100.0 ( 17) 학생 25.0 25.0 31.3 18.8 100.0 ( 16) 기타 50.0 25.0 25.0 100.0 ( 4) 스마트폰사용 0.598 사용 18.1 36.0 30.4 11.6 3.2 0.7 100.0 (1,122) 사용하지 않음 16.0 31.9 36.8 10.4 3.7 1.2 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
258 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-33> 2013년 건강정보광장 응답자 특성별 건강정보내용의 편리성 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 18.8 37.8 27.4 11.1 4.0 0.9 100.0 (1,285) 성별 0.132 남자 19.6 37.1 25.5 12.3 4.2 1.2 100.0 ( 754) 여자 17.7 38.8 30.1 9.4 3.6 0.4 100.0 ( 531) 연령 0.084 10대 22.2 11.1 33.3 11.1 22.2 100.0 ( 9) 20대 17.4 32.6 30.3 14.7 4.4 0.6 100.0 ( 340) 30대 17.9 38.8 28.5 10.1 3.4 1.2 100.0 ( 582) 40대 21.2 43.1 21.5 9.6 3.8 0.8 100.0 ( 260) 50대 이상 23.4 38.3 25.5 8.5 4.3 100.0 ( 94) 최종학력 0.499 고등학교 18.4 36.5 31.2 9.9 3.2 0.7 100.0 ( 282) 대학교 18.5 38.5 26.0 12.1 4.0 0.9 100.0 ( 918) 대학원이상 23.5 35.3 29.4 4.7 5.9 1.2 100.0 ( 85) 직업 0.724 비보건의료계열 전문사무직 17.2 37.5 28.0 12.5 3.4 1.3 100.0 ( 522) 서비스판매직 21.9 38.8 23.0 11.5 4.4 0.5 100.0 ( 183) 생산 관련직 29.9 35.8 17.9 10.4 4.5 1.5 100.0 ( 67) 학생 14.0 33.8 33.8 11.0 5.9 1.5 100.0 ( 136) 주부 23.3 41.7 25.8 5.0 4.2 100.0 ( 120) 농수축산 22.2 33.3 44.4 100.0 ( 9) 교사 및 교수 22.7 45.5 13.6 18.2 100.0 ( 22) 연구원 11.8 52.9 17.6 11.8 5.9 100.0 ( 17) 무직 16.2 43.2 21.6 13.5 5.4 100.0 ( 37) 기타 12.3 40.0 33.8 10.8 3.1 100.0 ( 65) 보건의료계열 보건의료인 21.4 38.6 30.0 10.0 100.0 ( 70) 연구자 11.8 29.4 35.3 11.8 11.8 100.0 ( 17) 학생 18.8 18.8 37.5 12.5 12.5 100.0 ( 16) 기타 50.0 50.0 100.0 ( 4) 스마트폰사용 0.871 사용 19.0 37.8 27.4 11.3 3.7 0.8 100.0 (1,122) 사용하지 않음 17.8 38.0 27.6 9.8 5.5 1.2 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 259 (8) 건강정보 서비스 만족도 건강정보의 서비스 만족도는 건강정보광장의 서비스에 만족한다 라는 질문에 대한 것으로 전체 응답자의 39.9%가 대체로 동의함, 26.7%가 약간 동의함, 20.5%가 매우 동의함 이라고 응답하였으며, 건강정보 서비스 만족도 는 응답자의 일반적인 특성과 통계적으로 유의한 것이 없 는 것으로 나타났다(표 7-34 참조). (9) 건강정보의 접근성 건강정보의 접근성은 건강정보광장 에 접속하기 쉬운 정도를 알아보 는 것으로 낮은 수준의 접근 환경에 있는 이용자들도 접속 할 수 있다 라 는 질문에 대하여 전체 응답자의 33.9%가 대체로 동의함, 29.6%가 약 간 동의함, 16.2%가 매우 동의함; 순으로 응답하였다. 건강정보의 접근성은 모든 계열에서 통계적으로 유의한 것이 없는 것 으로 나타났다(표 7-35 참조). (10) 건강정보의 항해 용이성 건강정보의 항해용이성은 건강정보광장에서 찾고자 하는 정보를 빠른 시간 내에 찾을 수 있다 라는 질문으로 유도하였으며 전체 응답자 중 36.2%가 대체로 동의함, 30.6%가 약간 동의함, 15.3%가 매우 동의 함 순으로 응답하였다. 이는 연령, 스마트폰 사용이 통계적으로 유의한 차이가 있는 것으로 나타났으며, 성별, 최종학력, 직업은 통계적으로 유 의한 차이가 없는 것으로 나타났다(표 7-36 참조).
260 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 건강정보광장 에서 조사한 항목들을 기술통계방식으로 분석한 결과 각 문항에 대한 응답평균에서 신뢰성이 4.81점으로 가장 높게 나타났으 며 유용성이 4.80점, 충분성이 4.76점, 만족도가 4.64점, 이해용이성이 4.62점, 시의성이 4.52점, 주의사항 게시정도가 4.51점, 항해용이성이 4.44점, 접근성이 4.39점으로 나타났다(표 7-37 참조). 이는 2012년도 결과와도 매우 유사한 내용으로 건강정보광장 은 공공의 성격을 띠고 있 으므로 신뢰성과, 유용성, 충분성 측면에서 높은 만족도를 보임을 알 수 있다. (11) 건강정보에 의한 행동변화 건강정보에 의한 행동변화는 건강정보광장 에서 얻은 건강정보가 자 신의 건강행동에 영향을 주었는지, 어느 정도로 활용되고 있는지에 대한 항목으로 건강정보광장에서 찾은 건강정보로 인해 건강과 관련된 행동 에 영향을 받은 적이 있다 는 질문으로 유도하였다, 전체 응답자의 38%가 대체로 동의함, 28%가 약간 동의함, 20.9% 가 매우 동의함 순으로 응답하였다(표 7-38 참조). 또한 이로 인한 병원 방문에 대한 영향에 대한 항목으로 건강정보광장에서 찾은 건강정보로 인해 의사나 병원을 찾은 적이 있다 라는 질문으로 유도한 결과 전체 응 답자의 33.3%가 약간 동의함, 29.5%는 대체로 동의함 이 17.6%는 매 우 동의함 순으로 응답하였다(표 7-39 참조).
제7장 건강정보광장 평가 261 <표 7-34> 2013년 건강정보광장 응답자 특성별 건강정보 서비스 만족도 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 20.5 39.9 26.7 10.0 2.1 0.8 100.0 (1,285) 성별 0.865 남자 20.3 40.5 26.0 10.5 1.9 0.9 100.0 ( 754) 여자 20.7 39.2 27.7 9.4 2.4 0.6 100.0 ( 531) 연령 0.454 10대 11.1 55.6 33.3 100.0 ( 9) 20대 21.5 36.5 27.4 11.8 2.4 0.6 100.0 ( 340) 30대 18.2 41.2 27.3 9.8 2.6 0.9 100.0 ( 582) 40대 23.5 42.3 23.8 8.5 1.2 0.8 100.0 ( 260) 50대 이상 23.4 36.2 30.9 7.4 1.1 1.1 100.0 ( 94) 최종학력 0.611 고등학교 18.8 41.5 28.0 9.6 2.1 100.0 ( 282) 대학교 21.1 39.0 26.0 10.7 2.2 1.0 100.0 ( 918) 대학원이상 18.8 44.7 29.4 4.7 1.2 1.2 100.0 ( 85) 직업 0.715 비보건의료계열 전문사무직 18.8 39.3 27.4 10.9 2.3 1.3 100.0 ( 522) 서비스판매직 22.4 41.0 23.5 9.8 1.6 1.6 100.0 ( 183) 생산 관련직 26.9 41.8 16.4 13.4 1.5 100.0 ( 67) 학생 19.9 35.3 30.9 10.3 3.7 100.0 ( 136) 주부 25.0 41.7 29.2 3.3 0.8 100.0 ( 120) 농수축산 11.1 66.7 11.1 11.1 100.0 ( 9) 교사 및 교수 27.3 45.5 22.7 4.5 100.0 ( 22) 연구원 11.8 58.8 29.4 100.0 ( 17) 무직 21.6 43.2 24.3 8.1 2.7 100.0 ( 37) 기타 12.3 38.5 33.8 12.3 3.1 100.0 ( 65) 보건의료계열 보건의료인 24.3 41.4 25.7 8.6 100.0 ( 70) 연구자 11.8 35.3 23.5 23.5 5.9 100.0 ( 17) 학생 18.8 31.3 18.8 25.0 6.3 100.0 ( 16) 기타 50.0 50.0 100.0 ( 4) 스마트폰사용 0.421 사용 21.0 40.3 25.8 10.1 2.0 0.8 100.0 (1,122) 사용하지 않음 16.6 37.4 32.5 9.8 3.1 0.6 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
262 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-35> 2013년 건강정보광장 응답자 특성별 건강정보의 접근성 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 16.2 33.9 29.6 14.3 5.0 1.0 100.0 (1,285) 0.647 성별 남자 16.4 34.1 28.9 13.8 5.4 1.3 100.0 ( 754) 여자 15.8 33.5 30.7 15.1 4.3 0.6 100.0 ( 531) 연령 0.289 10대 11.1 11.1 66.7 11.1 100.0 ( 9) 20대 17.4 29.7 28.5 17.6 5.3 1.5 100.0 ( 340) 30대 15.6 34.5 29.0 14.6 5.0 1.2 100.0 ( 582) 40대 14.2 36.9 32.7 10.4 5.4 0.4 100.0 ( 260) 50대 이상 21.3 38.3 25.5 11.7 3.2 100.0 ( 94) 최종학력 0.373 고등학교 14.9 31.9 34.4 15.2 2.8 0.7 100.0 ( 282) 대학교 16.2 34.6 28.1 14.4 5.7 1.0 100.0 ( 918) 대학원이상 20.0 31.8 30.6 10.6 4.7 2.4 100.0 ( 85) 직업 0.634 비보건의료계열 전문사무직 13.6 37.2 28.4 14.4 5.2 1.3 100.0 ( 522) 서비스판매직 17.5 31.7 36.1 8.7 5.5 0.5 100.0 ( 183) 생산 관련직 26.9 25.4 28.4 14.9 4.5 100.0 ( 67) 학생 16.2 26.5 30.1 19.9 5.1 2.2 100.0 ( 136) 주부 18.3 35.0 30.8 12.5 3.3 100.0 ( 120) 농수축산 22.2 22.2 33.3 11.1 11.1 100.0 ( 9) 교사 및 교수 27.3 31.8 22.7 13.6 4.5 100.0 ( 22) 연구원 17.6 35.3 23.5 11.8 11.8 100.0 ( 17) 무직 13.5 27.0 37.8 18.9 2.7 100.0 ( 37) 기타 12.3 35.4 27.7 18.5 6.2 100.0 ( 65) 보건의료계열 보건의료인 17.1 41.4 24.3 12.9 2.9 1.4 100.0 ( 70) 연구자 23.5 35.3 5.9 23.5 11.8 100.0 ( 17) 학생 6.3 25.0 43.8 18.8 6.3 100.0 ( 16) 기타 50.0 25.0 25.0 100.0 ( 4) 스마트폰사용 0.781 사용 16.7 34.0 29.1 14.3 4.9 1.1 100.0 (1,122) 사용하지 않음 12.9 33.1 33.1 14.7 5.5 0.6 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 263 <표 7-36> 2013년 건강정보광장 응답자 특성별 건강정보 항해용이성 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 15.3 36.2 30.6 13.5 3.8 0.6 100.0 (1,285) 성별 0.248 남자 14.3 37.9 29.3 13.8 3.7 0.9 100.0 ( 754) 여자 16.8 33.7 32.4 13.0 4.0 0.2 100.0 ( 531) 연령 0.059 10대 33.3 11.1 11.1 22.2 22.2 100.0 ( 9) 20대 12.9 33.2 32.9 15.6 4.7 0.6 100.0 ( 340) 30대 15.6 35.1 31.6 13.6 3.4 0.7 100.0 ( 582) 40대 15.0 42.7 26.9 12.3 2.3 0.8 100.0 ( 260) 50대 이상 21.3 38.3 27.7 7.4 5.3 100.0 ( 94) 최종학력 0.130 고등학교 16.3 34.0 33.3 12.8 3.2 0.4 100.0 ( 282) 대학교 14.8 37.4 28.6 14.5 3.9 0.8 100.0 ( 918) 대학원이상 17.6 30.6 42.4 4.7 4.7 100.0 ( 85) 직업 0.879 비보건의료계열 전문사무직 14.0 35.8 30.1 15.1 4.0 1.0 100.0 ( 522) 서비스판매직 19.1 38.8 26.2 11.5 3.8 0.5 100.0 ( 183) 생산 관련직 25.4 37.3 22.4 11.9 3.0 100.0 ( 67) 학생 15.4 32.4 32.4 14.0 4.4 1.5 100.0 ( 136) 주부 16.7 35.0 35.0 10.0 3.3 100.0 ( 120) 농수축산 11.1 44.4 44.4 100.0 ( 9) 교사 및 교수 13.6 45.5 31.8 9.1 100.0 ( 22) 연구원 5.9 58.8 23.5 5.9 5.9 100.0 ( 17) 무직 8.1 43.2 29.7 16.2 2.7 100.0 ( 37) 기타 9.2 27.7 40.0 18.5 4.6 100.0 ( 65) 보건의료계열 보건의료인 12.9 38.6 35.7 10.0 2.9 100.0 ( 70) 연구자 17.6 47.1 17.6 17.6 100.0 ( 17) 학생 25.0 18.8 25.0 18.8 12.5 100.0 ( 16) 기타 25.0 75.0 100.0 ( 4) 스마트폰사용 0.087 사용 15.5 37.3 30.1 13.0 3.4 0.6 100.0 (1,122) 사용하지 않음 14.1 28.2 33.7 16.6 6.7 0.6 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
264 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-37> 2013년 건강정보광장 조사결과 건강정보 품질 만족도 및 이용수준 항목 내용 Mean±SD 충분성 건강정보광장은 내가 필요로 하는 내용을 충분히 포함하고 있다 4.76±0.94 유용성 건강정보광장에서 찾은 건강정보는 유용하다 4.80±1.00 이해용이성 건강정보광장에서 찾은 건강정보는 이해하기가 쉽다 4.62±0.99 신뢰성 건강정보광장에서 찾은 건강정보는 믿을만 하다 4.81±1.07 시의성 건강정보광장의 건강정보는 시기적절하다 4.52±1.05 주의사항 게시정도 건강정보광장은 정보이용에 대한 주의사항을 제시하고 있다. 4.51±1.06 편리성 건강정보광장은 이용하기가 편리하다 4.54±1.09 만족도 건강정보광장의 서비스에 만족한다 4.64±1.03 접근성 낮은 수준의 접근환경에 있는 이용자들도 접속할 수 있다. 4.39±1.13 항해용이성 건강정보광장에서 찾고자 하는 정보를 빠른 시간 내에 찾을 수 있다. 4.44±1.06 그림 7-3 2013년 건강정보광장 조사결과 건강정보 품질만족도 비율
제7장 건강정보광장 평가 265 <표 7-38> 2013년 건강정보광장 응답자 특성별 건강정보에 의한 행동변화 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 20.9 38.0 28.0 9.0 3.3 0.9 100.0 (1,285) 0.619 성별 남자 21.4 39.5 26.7 8.5 3.1 0.9 100.0 ( 754) 여자 20.2 35.8 29.9 9.8 3.6 0.8 100.0 ( 531) 연령 0.651 10대 22.2 11.1 44.4 22.2 100.0 ( 9) 20대 21.8 36.5 25.9 10.3 3.8 1.8 100.0 ( 340) 30대 19.9 37.8 30.4 8.1 3.1 0.7 100.0 ( 582) 40대 20.8 42.3 25.0 8.8 3.1 100.0 ( 260) 50대 이상 23.4 35.1 27.7 9.6 3.2 1.1 100.0 ( 94) 최종학력 0.532 고등학교 20.6 33.7 32.3 8.5 4.6 0.4 100.0 ( 282) 대학교 20.7 39.1 27.1 9.0 3.1 1.0 100.0 ( 918) 대학원이상 23.5 40.0 23.5 10.6 1.2 1.2 100.0 ( 85) 직업 0.902 비보건의료계열 전문사무직 20.5 37.7 27.0 10.3 3.3 1.1 100.0 ( 522) 서비스판매직 23.5 35.5 29.0 7.7 3.8 0.5 100.0 ( 183) 생산 관련직 23.9 35.8 32.8 6.0 1.5 100.0 ( 67) 학생 21.3 33.1 30.1 11.0 3.7 0.7 100.0 ( 136) 주부 16.7 39.2 34.2 6.7 2.5 0.8 100.0 ( 120) 농수축산 22.2 66.7 11.1 100.0 ( 9) 교사 및 교수 27.3 45.5 18.2 4.5 4.5 100.0 ( 22) 연구원 23.5 47.1 29.4 100.0 ( 17) 무직 29.7 40.5 21.6 5.4 2.7 100.0 ( 37) 기타 16.9 40.0 27.7 12.3 3.1 100.0 ( 65) 보건의료계열 보건의료인 15.7 47.1 21.4 10.0 5.7 100.0 ( 70) 연구자 23.5 29.4 29.4 11.8 5.9 100.0 ( 17) 학생 18.8 31.3 37.5 6.3 6.3 100.0 ( 16) 기타 25.0 50.0 25.0 100.0 ( 4) 스마트폰사용 0.026** 사용 21.4 39.2 26.6 8.8 3.0 0.9 100.0 (1,122) 사용하지 않음 17.2 29.4 37.4 10.4 4.9 0.6 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
266 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-39> 2013년 건강정보광장 응답자 특성별 건강정보로 인한 병원방문 정도 (단위: %, 명) 매우 대체로 약간 별로 대체로 매우 동의함 동의함 동의함 동의안함 동의안함 동의안함 합계 p 전체 17.6 33.3 29.5 12.5 5.8 1.3 100.0 (1,285) 0.285 성별 남자 18.6 34.0 28.2 11.4 6.1 1.7 100.0 ( 754) 여자 16.2 32.4 31.3 13.9 5.5 0.8 100.0 ( 531) 연령 0.090* 10대 44.4 11.1 22.2 22.2 100.0 ( 9) 20대 22.4 27.4 29.7 11.2 7.4 2.1 100.0 ( 340) 30대 15.6 34.2 30.2 13.6 5.3 1.0 100.0 ( 582) 40대 14.2 38.8 30.0 10.4 5.8 0.8 100.0 ( 260) 50대 이상 19.1 36.2 23.4 14.9 4.3 2.1 100.0 ( 94) 최종학력 0.737 고등학교 317.4 29.4 32.3 12.4 7.1 1.4 100.0 ( 282) 대학교 17.4 35.1 28.1 12.5 5.6 1.3 100.0 ( 918) 대학원이상 20.0 27.1 35.3 11.8 4.7 1.2 100.0 ( 85) 직업 0.758 비보건의료계열 전문사무직 16.3 33.7 30.1 12.5 5.9 1.5 100.0 ( 522) 서비스판매직 19.7 33.3 28.4 9.8 8.2 0.5 100.0 ( 183) 생산 관련직 25.4 28.4 32.8 9.0 3.0 1.5 100.0 ( 67) 학생 18.4 29.4 33.1 12.5 5.1 1.5 100.0 ( 136) 주부 13.3 37.5 30.8 13.3 4.2 0.8 100.0 ( 120) 농수축산 11.1 22.2 33.3 11.1 11.1 11.1 100.0 ( 9) 교사 및 교수 27.3 31.8 22.7 9.1 4.5 4.5 100.0 ( 22) 연구원 17.6 35.3 35.3 5.9 5.9 100.0 ( 17) 무직 21.6 37.8 18.9 13.5 5.4 2.7 100.0 ( 37) 기타 12.3 35.4 30.8 15.4 4.6 1.5 100.0 ( 65) 보건의료계열 보건의료인 14.3 37.1 25.7 17.1 5.7 100.0 ( 70) 연구자 17.6 35.3 29.4 17.6 100.0 ( 17) 학생 31.3 12.5 12.5 25.0 18.8 100.0 ( 16) 기타 75.0 25.0 100.0 ( 4) 스마트폰사용 0.816 사용 17.5 33.8 29.3 12.4 5.6 1.4 100.0 (1,122) 사용하지 않음 18.4 30.1 30.7 12.9 7.4 0.6 100.0 ( 163) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 267 건강정보광장 에서 획득한 건강정보로 인해 행동에 변화가 있었는지 에 대한 응답평균은 4.62점이었으며, 병원방문 경험에 대한 질문의 응답 평균은 4.40점으로 높게 조사되었다(표 7-40 참조) <표 7-40> 2013년 건강정보광장 조사결과 획득한 건강정보 이용현황 행동변화영향 병원방문경험 구분 건강정보광장에서 찾은 건강정보로 인해 행동에 영향 을 받은 적이 있다. 건강정보광장에서 찾은 건강정보로 인해 의사나 병원 을 찾은 적이 있다. Mean±SD 4.62±1.06 4.40±1.16 라. 건강정보 수요 건강정보광장 에서 이용자들의 건강정보 수요조사를 통하여 향후 서 비스개선과 운영에 적극 반영하기 위하여 건강정보 제공주체, 평균적으 로 접속하는 건강관련 접속 사이트 수, 지난 1년간 이용한 건강정보 등을 묻는 문항으로 전체 응답자 2,904명을 대상으로 분석하였다. (1) 건강정보제공 주체 건강정보 제공주체는 응답자가 건강정보를 얻기 위하여 주로 이용하는 건강정보의 제공주체를 묻는 항목으로 구성되어 있으며, 조사 결과 전체 응답자 중 48.3%가 의료기관을 통하여 건강정보를 획득하는 것으로 나 타났다. 그 다음이 공공기관(28.1%), 환자커뮤니티(12.3%) 순으로 나타 났으며, 응답자 특성에 따라 성별, 연령, 직업, 스마트폰 사용군에서 모두 통계적으로 유의한 차이가 있는 것으로 조사되었다(표 22 참조).
268 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - (2) 건강정보를 이용시 평균적으로 접속하는 사이트 수 응답자들이 건강정보를 획득하기 위하여 평균적으로 접속하는 사이트 수를 묻는 질문에서는 응답자의 64.2%가 2~3개의 사이트를 통하여 건강 정보를 찾아보는 것으로 나타났으며 1개 이상이 27.3%, 5ro 이상이 3.1%로 나타났다. 응답자 특성별로 성별, 연령, 최종학력, 직업군에서 모 두 통계적으로 유의한 차이가 있는 것으로 나타났다(표 7-41 참조). (3) 지난 1년간 인터넷을 통한 건강정보 검색 내용 현황 건강정보광장을 이용하는 이용자들이 지난 1년간 인터넷을 통하여 검 색한 건강정보에는 묻는 항목에서는 운동체력이 46.5%로 응답율이 가장 높았으며 식이 및 영양(25.2%), 스트레스 및 우울(20.8%), 질병 및 질환 (19.6%), 자가진단체크(17.9%), 의료기관 및 보건소 정보(12.2%), 예방 접종(7.5%), 건강강좌(6.4%), 임신, 성 및 생식 보건(6.1%) 등의 순으로 조사되었으며. 건강정보광장 을 이용하는 이용자 중 건강 및 식이 영양 에 대한 관심이 많은 것으로 나타났다. 이에 따라 건강정보광장 에서도 전반적인 서비스 개선을 향후 고려할 필요가 있다는 것을 나타낸다고 볼 수 있다(표 7-42 참조).
제7장 건강정보광장 평가 269 <표 7-41> 2013년 건강정보광장 응답자 특성별 건강정보제공 주체 공공 기관 의료 기관 제약 회사 (단위: %, 명) 환자 학회 기업체 기타 합계 P 커뮤니티 전체 28.1 48.3 1.8 1.3 1.4 12.3 6.7 100.0 (2,094) 성별 0.020** 남자 30.0 47.4 2.0 1.4 1.5 12.4 5.2 100.0 (1,175) 여자 25.7 49.5 1.4 1.3 1.2 12.2 8.7 100.0 ( 919) 연령 0.009** 10대 24.2 54.5 3.0 6.1 12.1 100.0 ( 33) 20대 22.0 51.0 1.5 1.8 0.9 13.1 9.7 100.0 ( 663) 30대 30.5 47.1 1.7 1.1 1.4 12.7 5.5 100.0 ( 915) 40대 30.2 47.2 2.0 1.1 2.3 11.6 5.6 100.0 ( 354) 50대 이상 38.0 45.0 2.3 1.6 1.6 9.3 2.3 100.0 ( 129) 최종학력 0.744 고등학교 27.0 49.7 2.2 0.7 0.9 12.5 6.9 100.0 ( 537) 대학교 28.2 48.0 1.5 1.5 1.5 12.5 6.8 100.0 (1,422) 대학원이상 31.9 46.7 3.0 1.5 2.2 9.6 5.2 100.0 ( 135) 직업 0.000*** 비보건의료계열 전문사무직 27.8 48.4 1.5 1.1 2.0 12.9 6.2 100.0 ( 789) 서비스판매직 33.3 46.3 2.7 1.2 12.9 3.5 100.0 ( 255) 생산 관련직 29.3 55.6 1.0 1.0 11.1 2.0 100.0 ( 99) 학생 22.0 51.0 1.3 2.0 0.7 11.7 11.3 100.0 ( 300) 주부 30.3 46.5 0.5 1.0 2.0 13.6 6.1 100.0 ( 198) 농수축산 28.6 57.1 7.1 7.1 100.0 ( 14) 교사 및 교수 25.7 60.0 11.4 2.9 100.0 ( 35) 연구원 25.8 51.6 3.2 16.1 3.2 100.0 ( 31) 무직 26.1 49.3 1.4 13.0 10.1 100.0 ( 69) 기타 31.3 34.7 4.7 0.7 1.3 15.3 12.0 100.0 ( 150) 보건의료계열 보건의료인 22.6 62.4 1.1 7.5 5.4 1.1 100.0 ( 93) 연구자 47.4 36.8 10.5 5.3 100.0 ( 19) 학생 31.3 40.6 3.1 3.1 6.3 15.6 100.0 ( 32) 기타 40.0 30.0 10.0 20.0 100.0 ( 10) 스마트폰사용 0.065* 사용 28.6 48.0 1.4 1.4 1.4 12.4 6.9 100.0 (1,829) 사용하지 않음 24.9 50.6 4.2 1.1 1.5 12.1 5.7 100.0 ( 265) 주: * P<0.1, ** p<0.005, *** p<0.001
270 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-42> 2013년 건강정보광장 응답자 특성별 건강정보를 얻기 위해 접속하는 평균 사이트 수 (단위: %, 명) 1개 2~3개 4개 5개 이상 합계 P 전체 27.3 64.2 5.4 3.1 100.0 (2,094) 성별 0.050* 남자 27.7 63.4 6.4 2.6 100.0 (1,175) 여자 26.9 65.2 4.1 3.8 100.0 ( 919) 연령 0.000*** 10대 66.7 33.3 100.0 ( 33) 20대 37.0 54.9 6.2 2.0 100.0 ( 663) 30대 23.5 67.9 5.0 3.6 100.0 ( 915) 40대 16.4 75.4 5.1 3.1 100.0 ( 354) 50대 이상 24.8 62.8 6.2 6.2 100.0 ( 129) 최종학력 0.000*** 고등학교 36.7 57.4 3.5 2.4 100.0 ( 537) 대학교 24.0 66.8 5.9 3.3 100.0 (1,422) 대학원이상 25.2 63.7 7.4 3.7 100.0 ( 135) 직업 0.000*** 비보건의료계열 전문사무직 24.5 66.3 6.1 3.2 100.0 ( 789) 서비스판매직 18.8 70.6 7.1 3.5 100.0 ( 255) 생산 관련직 22.2 69.7 8.1 100.0 ( 99) 학생 40.7 52.7 3.7 3.0 100.0 ( 300) 주부 23.2 67.7 4.0 5.1 100.0 ( 198) 농수축산 42.9 57.1 100.0 ( 14) 교사 및 교수 17.1 74.3 8.6 100.0 ( 35) 연구원 22.6 67.7 6.5 3.2 100.0 ( 31) 무직 30.4 69.6 100.0 ( 69) 기타 45.3 51.3 1.3 2.0 100.0 ( 150) 보건의료계열 보건의료인 22.6 66.7 4.3 6.5 100.0 ( 93) 연구자 5.3 73.7 21.1 100.0 ( 19) 학생 28.1 56.3 9.4 6.3 100.0 ( 32) 기타 20.0 60.0 20.0 100.0 ( 10) 스마트폰사용 0.492 사용 26.9 64.8 5.2 3.1 100.0 (1,829) 사용하지 않음 30.2 60.0 6.4 3.4 100.0 ( 265) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 271 <표 7-43> 2013년 건강정보광장 만족도 및 수요조사 응답자의 지난 1년간 인터넷에서 검색한 건강정보(복수응답) (단위: 명, %) 건강정보 응답자 수 운동체력 1350(46.5) 식이 및 영양 733(25.2) 스트레스 및 우울 603(20.8) 질병 및 질환 570(19.6) 자가진단체크 520(17.9) 의료기관 및 보건소 정보 353(12.2) 예방접종 218( 7.5) 건강강좌 185( 6.4) 임신,성 및 생식보건 176( 6.1) 금연 158( 5.4) 절주 및 음주 149( 5.1) 건강정책 92( 3.2) 마약 및 약물중독 32( 1.1) 기타 7( 0.2) 마. 인터넷 사용 인테넛 사용에서는 일주일동안 인터넷 사용을 평균 몇시간 정도 이용 하는지에 대하여 질문을 하였으며 전체 응답자의 36.2%가 1~5시간 미 만, 5~10시간 미만(20.4%), 20시간 이상(19.5%) 순으로 조사되었다. 조사결과에서 연령, 직업, 스마트폰 사용 여부에서 통계적으로 유의한 차 이가 있는 것으로 나타났다(표 7-44 참조).
272 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-44> 2013년 건강정보광장 응답자 특성별 인터넷 이용 시간 1H 미만 1-5H 미만 5~10H10~15H 15~20 미만 미만 H미만 20H 이상 전체 6.9 36.2 20.4 9.2 7.7 19.5 100.0 (2,094) 성별 0.910 남자 7.0 36.6 19.8 9.4 7.3 19.9 100.0 (1,175) 여자 6.7 35.8 21.2 8.9 8.3 19.0 100.0 ( 919) 연령 0.000*** 10대 18.2 30.3 21.2 21.2 6.1 3.0 100.0 ( 33) 20대 4.2 40.4 21.7 10.0 8.1 15.5 100.0 ( 663) 30대 6.9 36.7 20.2 7.2 7.7 21.3 100.0 ( 915) 40대 7.1 31.4 18.9 10.7 8.2 23.7 100.0 ( 354) 50대 이상 17.1 26.4 19.4 11.6 5.4 20.2 100.0 ( 129) 최종학력 0.181 고등학교 8.9 37.6 19.6 9.5 7.3 17.1 100.0 ( 537) 대학교 6.0 35.7 20.7 9.5 8.1 20.0 100.0 (1,422) 대학원이상 8.1 36.3 20.7 4.4 5.9 24.4 100.0 ( 135) 직업 0.003** 비보건의료계열 전문사무직 5.7 33.3 20.7 8.0 9.3 23.1 100.0 ( 789) 서비스판매직 9.4 33.7 21.6 9.8 7.5 18.0 100.0 ( 255) 생산 관련직 5.1 42.4 19.2 8.1 4.0 21.2 100.0 ( 99) 학생 3.7 43.7 21.7 12.3 6.0 12.7 100.0 ( 300) 주부 10.6 33.8 22.7 9.1 5.1 18.7 100.0 ( 198) 농수축산 28.6 28.6 7.1 35.7 100.0 ( 14) 교사 및 교수 5.7 31.4 20.0 5.7 8.6 28.6 100.0 ( 35) 연구원 3.2 35.5 19.4 9.7 9.7 22.6 100.0 ( 31) 무직 8.7 33.3 14.5 14.5 7.2 21.7 100.0 ( 69) 기타 5.3 37.3 16.7 9.3 12.0 19.3 100.0 ( 150) 보건의료계열 보건의료인 14.0 39.8 23.7 8.6 4.3 9.7 100.0 ( 93) 연구자 57.9 10.5 10.5 10.5 10.5 100.0 ( 19) 학생 12.5 43.8 12.5 6.3 6.3 18.8 100.0 ( 32) 기타 30.0 40.0 10.0 20.0 100.0 ( 10) 스마트폰사용 0.001** 사용 6.1 35.9 20.7 9.2 7.6 20.5 100.0 (1,829) 사용하지 않음 12.5 38.5 18.5 9.1 8.7 12.8 100.0 ( 265) 주: * P<0.1, ** p<0.005, *** p<0.001 합계 (단위: %, 명) P
제7장 건강정보광장 평가 273 바. 스마트폰을 통한 건강정보 수요 건강정보광장 에서는 스마트폰의 대중화로 인하여 향후 이용자들에 게 효율적인 서비스를 위하여 전체 응답자 중 스마트폰을 사용하고 있는 이용자 1,829명을 대상으로 분석하였다. (1) 스마트폰을 통한 인터넷 사용 시간 스마트폰을 통해 일주일동안 인터넷 사용을 평균 몇 시간 정도 이용하 는지에 대한 질문에 전체 응답자의 44.8%가 1시~5시간미만이 스마트폰 을 사용하여 인터넷을 이용하는 것으로 나타났으며, 5~10시간미만 (18.7%), 1시간미만(15.7%), 20시간 이상(8.9%) 순으로 나타났다(표 7-45 참조). (2) 건강/의학관련 어플리케이션 보유 현황 스마트폰(태블릿PC 포함)을 이용하고 있는 응답자 중에 건강/의학 관 련 어플리케이션을 몇 개 정도 보유하고 있는지에 대한 질문에는 전체 응 답자의 54.8%가 2~3개 정도 보유 하고 있는 것으로 나타났으며, 어플리 케이션을 1개 보유(40.5%), 4개 보유(3.6%), 5개 이상 보유(1.1%) 순으 로 나타났다(표 7-46 참조).
274 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <표 7-45> 2013년 건강정보광장 스마트폰 이용자 특성별 인터넷 사용 시간 (단위: %, 명) 1H 미만 1-5H 미만 5~10H10~15H 15~20 미만 미만 H미만 20H 이상 합계 P 전체 15.7 44.8 18.7 6.0 5.8 8.9 100.0(1,829) 성별 0.328 남자 16.3 46.6 17.6 5.5 5.8 8.2 100.0(1,031) 여자 15.0 42.6 20.2 6.6 5.8 9.8 100.0( 798) 연령 0.000*** 10대 11.5 34.6 30.8 3.8 7.7 11.5 100.0( 26) 20대 13.0 40.7 21.3 8.7 6.6 9.7 100.0( 607) 30대 14.6 49.8 15.9 5.3 5.0 9.4 100.0( 816) 40대 21.8 41.3 20.1 3.1 6.5 7.2 100.0( 293) 50대 이상 26.4 42.5 18.4 4.6 4.6 3.4 100.0( 87) 최종학력 0.265 고등학교 16.1 41.8 19.5 7.7 4.3 10.5 100.0( 440) 대학교 15.1 46.1 18.8 5.5 6.1 8.4 100.0(1,264) 대학원이상 20.8 42.4 15.2 4.8 8.0 8.8 100.0( 125) 직업 0.001*** 보건의료계열 전문사무직 15.9 47.6 17.6 4.1 6.7 8.1 100.0( 712) 서비스판매직 15.0 47.3 19.8 5.3 4.3 8.2 100.0( 207) 생산 관련직 19.1 43.8 19.1 4.5 6.7 6.7 100.0( 89) 학생 9.1 38.0 26.1 10.1 5.4 11.2 100.0( 276) 주부 20.3 43.5 17.5 5.6 5.1 7.9 100.0( 177) 농수축산 71.4 14.3 14.3 100.0( 7) 교사 및 교수 12.9 32.3 12.9 12.9 12.9 16.1 100.0( 31) 연구원 26.9 38.5 30.8 3.8 100.0( 26) 무직 17.9 33.9 14.3 7.1 5.4 21.4 100.0( 56) 기타 21.0 48.7 11.8 6.7 5.0 6.7 100.0( 119) 보건의료계열 보건의료인 21.1 48.7 15.8 6.6 3.9 3.9 100.0( 76) 연구자 52.9 23.5 11.8 5.9 5.9 100.0( 17) 학생 11.5 26.9 15.4 11.5 7.7 26.9 100.0( 26) 기타 10.0 70.0 10.0 10.0 100.0( 10) 스마트폰을 이용한 건강정보 검색여부 0.000*** 있다 13.4 45.2 19.5 6.2 6.2 9.5 100.0(1,613) 없다 28.6 42.9 14.3 5.2 3.5 5.6 100.0( 481) 스마트폰 이용자의 건강관련 어플리케이션 설치 유무 0.710 있다 15.5 44.4 18.5 5.9 5.6 10.1 100.0( 894) 없다 15.9 45.2 18.9 6.1 6.0 7.8 100.0( 935) 주: * P<0.1, ** p<0.005, *** p<0.001
제7장 건강정보광장 평가 275 <표 7-46> 2013년 건강정보광장 스마트폰 이용자 특성별 건강/의학관련 어플리케이션 보유개수 현황 (단위: %, 명) 1개 2~3개 4개 5개 이상 합계 P 전체 40.5 54.8 3.6 1.1 100.0(894) 성별 0.443 남자 42.5 53.0 3.7 0.8 100.0(498) 여자 38.0 57.0 3.5 1.5 100.0(405) 연령 0.242 10대 77.8 22.2 100.0( 9) 20대 43.9 51.7 3.7 0.7 100.0(294) 30대 41.1 54.6 2.8 1.5 100.0(392) 40대 32.4 61.4 5.5 0.7 100.0(145) 50대 이상 33.3 61.1 3.7 1.9 100.0( 54) 최종학력 0.913 고등학교 41.2 55.4 2.8 0.6 100.0(177) 대학교 40.0 54.8 3.9 1.2 100.0(660) 대학원이상 43.9 52.6 1.8 1.8 100.0( 57) 직업 0.161 비보건의료계열 전문사무직 41.1 55.6 2.5 0.8 100.0(365) 서비스판매직 28.3 67.9 3.8 100.0(106) 생산 관련직 37.2 55.8 7.0 100.0( 43) 학생 46.4 46.4 6.4 0.9 100.0(110) 주부 43.8 50.6 2.2 3.4 100.0( 89) 농수축산 100.0 100.0( 4) 교사 및 교수 31.6 57.9 5.3 5.3 100.0( 19) 연구원 23.1 76.9 100.0( 13) 무직 52.0 44.0 4.0 100.0( 25) 기타 46.3 51.2 2.4 100.0( 41) 보건의료계열 보건의료인 46.9 42.9 8.2 2.0 100.0( 49) 연구자 30.0 60.0 10.0 100.0( 10) 학생 33.3 66.7 100.0( 15) 기타 80.0 20.0 100.0( 5) 스마트폰을 이용한 건강정보 검색여부 0.155 있다 39.9 55.4 3.6 1.0 100.0(864) 없다 56.7 36.7 3.3 3.3 100.0( 30) 주: * P<0.1, ** p<0.005, *** p<0.001
276 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 스마트폰이용자가 보유하고 있는 건강/의학 관련 어플리케이션은 병 원정보 어플리케이션이 38.8%, 운동 및 다이어트 어플리케이션이 31.5%, 식이 및 영양관련 어플리케이션이 29.4%, 질병 및 질환 어플리케 이션이 26.0%, 자가진단 관련 어플리케이션이 15.4% 순으로 나타났다 (표 7-47 참조) <표 7-47> 2013년 건강정보광장 스마트폰 이용자의 건강/의학관련 어플리케이션 보 유 분야(복수응답) (단휘: 명, %) 보유 어플리케이션 분류 응답자 수(N=894) 병원정보어플 347 38.8 운동 및 다이어트 282 31.5 식이 및 영양 263 29.4 질병 및 질환 232 26.0 자가진단 138 15.4 육아정보 94 10.5 임신, 성 및 생식보건 59 6.6 구강 41 4.6 기타 21 2.3 사. 건강정보광장 이용자 수요 건강정보광장 에서 향후 제공되었으면 하는 서비스와 보완되었으면 하는 기능에 대한 질문으로 전체 응답자 2,094명을 대상으로 분석하였 다. 향후 건강정보광장 에 제공되었으면 하는 서비스로는 영양 및 다이 어트(54.1%), 생애주기별 보건교육 자료(40.4%), 국내외 건강 웹 사이트 정보(33.6%) 순으로 나타났다(표 7-48 참조).
제7장 건강정보광장 평가 277 <표 7-48> 2013년 건강정보광장 에서 향후 제공되었으면 하는 서비스(중복응답) (단위: 명. %) 향후 제공되었으면 하는 서비스 응답자 수(N=2,094) 영양 및 다이어트 1,132 54.1 생애주기별 보건교육자료 847 40.4 국내외 건강웹사이트 703 33.6 3. 요약 및 시사점 본 조사는 건강정보광장 이용자들이 건강정보광장에서 제공하는 건 강정보에 대하여 어떻게 생각하고 있는지, 어떤 수요를 가지는지에 대한 이용자들의 정보욕구와 이용 실태를 조사 분석하여 콘텐츠 구성 및 내용 을 지속적으로 개선하고자 실시하였으며, 매 월 이용자의 이용 만족도를 분석하여 운영에 반영하기 위하여 월 별 피드백 조사도 함께 실시하였다. 조사 결과는 다음과 같다. 건강정보광장 이용자 실태 및 만족도 조사에 참가한 참가자는 총 2, 190명이 참가하였으며 남자가 56.1%, 여자가 43.9% 가 참여하였다. 연 령별로는 30대가 915명(43.7%)로 가장 많았으며, 그 다음이 20대가 663명(31.7%)이 응답하였다. 최종 학력별로는 대학교 1,422명(67.9%) 가 가장 많았으며, 고등학교 이하 학력이 537명(25.6%), 대학원 이상 학 력이 136명(6.4%)로 나타났다. 직업에서는 전문사무직이 789명(37.7%), 학생 300명(14.3%) 의 응답 이 가장 높았으며, 보건의료계열에서는 보건의료인이 93명(4.4%), 학생 32명(1.5%), 연구자 19명(0.9%) 순으로 응답하였다. 건강정보광장 의 이용 빈도를 묻는 질문에는 처음 방문한 이용자가 38.6%로 가장 높은 비율을 보였으며, 한 달에 1번 이상 방문하는 이용자
278 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 가 33.5%, 일주일에 한 번 이상 방문하는 이용자는 24.3%로 조사되었다. 건강정보광장 이용 시 가장 주로 이용하는 정보를 묻는 질문에는 1순위 로 건강콘텐츠 가 32.7%로 가장 높은 비율을 보였으며, 자가진단 이 24.7%, 건강소식 이 23.1%로 분석되었다. 건강정보광장 에서 제공하는 정보에 대한 품질 및 만족도에 대한 항 목들은 9개 항목으로 6점 척도로 이루어져 있으며, 항해용이성, 접근성, 서비스 만족도, 이용 편리성, 시의성, 신뢰성, 이해용이성, 유용성, 충분 성에 대하여 모두 평균(3.5)보다 높은 결과를 나타냈다(그림 7-4 참조). 신뢰성 4.81, 유용성 4.80점, 충분성 4.76점, 만족도 4.64점, 이해용 이성 4.62점, 시의성 4.52점, 주의사항 게시정도 4.51점, 항해용이성 4.44점, 접근성 4.39점 순으로 나타났다. 이는 2012년도 결과와도 매우 유사한 결과로 나타났다. 그 이유는 건강정보광장 은 공공의 성격을 띠고 있으므로 신뢰성, 유 용성, 충분성 측면에서 높은 만족도를 보이고 있음을 알 수 있다. 건강정 보광장 에서 획득한 건강정보의 이용에 대한 질문으로 자신의 행동 변화 여부에 대한 질문에 응답 평균이 4.62점이 나타났으며, 의료기관 방문 여 부에 대한 질문에는 응답 평균이 4.40점으로 나타났다. 2012년 조사결과인 행동여부 변화 에 대한 응답 평균은 4.59점, 의 료기관 방문 여부 에 대한 응답 평균은 4.33점보다 높아진 것으로 확인하 였다. 이는 획득한 건강정보로 의사나 병원을 방문하여 전문적인 조언이 나 관리(또는 치료)를 받기보다 획득한 정보를 바탕으로 자신의 생활습관 을 개선하고자 하는 자기관리 경향이 또렷하게 나타나, 인터넷 상에서 제 공하고 있는 건강정보의 질 관리에 대한 중요성을 보여준다고 판단된다.
제7장 건강정보광장 평가 279 그림 7-4 2012년 2013년 건강정보광장 품질 이용 만족도 수준 비교 건강정보를 획득하기 위하여 평균적으로 접속하는 사이트 수를 묻는 질문에는 응답자의 64.2%가 2~3개 사이트를 통하여 건강정보를 획득하 는 것으로 분석되었으며, 전체 이용자 중 지난 1년간 인터넷을 통해서 검 색한 건강정보를 묻는 항목에서는 운동체력 관련 검색이 46.5%로 나타 났다. 그 다음이 식이 및 영양 25.2%, 스트레스 및 우울 관련 검색이 20.8% 순으로 분석되었다. 스마트폰을 통한 건강정보 수요를 묻는 질문에는 전체 응답자 중 83%(1,829명)가 스마트폰을 사용하는 것으로 나타났으며, 이 중 인터넷 을 1시간에서 5시간미만으로 사용하는 이용자가 44.8%로 가장 높게 분 석되었다. 20시간 이상 이용하는 이용자의 비율은 8.9%순으로 조사되었 다. 스마트폰을 가지고 있는 이용자 중 건강 및 의학 관련 어플리케이션 보유 개수를 묻는 질문에는 2~3개 정도 보유하고 있는 이용자가 54.8% 로 분석되었다. 스마트폰 이용자가 보유하고 있는 건강 및 의학 관련 어 플리케이션 종류로는 병원관련 어플리케이션이 38.8%(347명), 운동 및
280 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 다이어트 관련 어플리케이션이 31.5%(282명), 식이 및 영양 관련 어플리 케이션이 29.4%(263명), 질병 밀 질환 관련 어플리케이션이 26%(232 명), 자가진단 관련 어플리케이션이 15.4%(138명) 순으로 조사되었다. 건강정보광장 을 이용하는 전체 이용자에게 향후 건강정보광장 에서 제공되었으면 하는 서비스를 묻는 질문에 전체 응답자의 54.1%가 영양 및 다이어트 관련 정보가 보완 되었으면 좋겠다는 응답 비율이 가장 높았 으며, 그 다음이 생애주기별 보건교육자료가 40.4%, 국내외 건강정보 웹 사이트 정보 서비스가 33.6% 순으로 나타났다. 월별 피드백 설문조사에서는 4월부터 9월까지 총 2,190명이 응답하 였으며, 4월에는 188명, 5월 327명, 6월 572명, 7월 270명, 8월 655명, 9월 223명이 참여하였다(그림 7-5 참조) 그림 7-5 2013년 건강정보광장 수요조사 및 피드백조사 참여자 현황 참여자의 특성을 분석한 결과 30대가 882명(40.3%), 20대는 639명 (29.2%), 40대는 416명(19.0%) 순으로 응답률이 높았으며, 거주 지역별 로는 서울 거주자가 26.8%(568명)로 가장 높은 응답률을 보였다. 그 다
제7장 건강정보광장 평가 281 음이 경기도 23.0%, 부산 7.9%, 대구 6.4%, 인천 5.9%, 대전 4.9%, 경 남 4.7% 순으로 나타났다(그림 7-6 참조). 그림 7-6 2013년 건강정보광장 피드백조사 응답자의 지역별 현황 건강정보광장 을 이용하는 이용자들의 월 별 주로 이용하는 정보를 분석한 결과 1순위가 건강콘텐츠 가 33.5%로 가장 높은 비율을 보였으 며, 자가진단 이 27.8%, 건강기사 가 10% 순으로 나타났다. 이 결과는 건강정보광장 의 이용자 실태 및 만족도 조사 결과와도 일치한 것으로 나타났다. 건강정보광장 에서 제공하는 정보에 대한 품질 및 만족도에 대한 질문은 5점 척도로 이루어져 있으며, 월 별 만족도를 분석 한 결과 신뢰성(4.16), 내용의 유용성(4.13), 내용의 충분성(4.08), 이해용이성 (3.96), 이용용이성(3.96), 서비스 만족도(3.86) 순으로 나타났으며, 매 월 서비스 만족도 점수가 가장 낮은 것으로 분석되었지만 모든 항목에서 평균 (2.5) 이상의 높은 평가결과를 확인 할 수 있었다. 사이트 전반적으로 종합하여 평가하면 이용자 실태 및 수요조사 결과,
282 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 월별 피드백 조사에서도 나타나듯 건강정보광장 정보의 질에 대해서는 양호한 만족감을 보였으나 이용 서비스 측면에서는 다소 만족감이 떨어 지는 것으로 나타나 이에 대해 추가적으로 보완해 나아가야 할 것이다.
제8장 결론 및 정책제언 제1절 결론 제2절 정책제언
8 결론 및 정책제언 << 제1절 결론 보건의료 분야에서는 기존의 치료위주의 공급자 중심 서비스에서 예방 건강관리 위주의 소비자 중심의 서비스로 변화됨에 따라 보건의료기술과 IT기술이 융합된 다양한 스마트기기를 통하여 건강정보를 실시간으로 서비스 받게 되었다(송태민, 2012). 다양한 스마트 기기로 쉽고 편리하게 검색할 수 있는 건강정보는 새로운 건강정보원으로 이용이 확산되고 있 으나 정보의 급증은 오히려 적절한 정보에의 접근성을 떨어뜨리고 신뢰 할 수 없는 무분별한 정보제공의 우려를 낳고 있고 있다. 인터넷과 SNS 를 통해 제공되는 건강정보는 언제든지 유용한 정보를 편리하게 얻을 수 있는 장점이 있지만 잘못된 정보는 인간의 생명과 건강한 삶을 위협하는 치명적인 원인이 될 수 있다. 이러한 이유에서 건강정보에 대한 무분별한 제공 가능성과 그에 따른 위험성을 방지하고 보다 신뢰할 만한 건강 및 질병정보 제공하기 위하여 세계 각국의 정부 또는 공공조직에서 국민들 의 건강생활 및 의료 이용을 직접 또는 간접적으로 신뢰성 있는 건강정보 를 제공하고 있는 인터넷 사이트를 운영하고 있으며, 특히 인터넷 상의 건강정보 질을 평가하기 위하여 많은 노력을 기울이고 있다. 국내에서도 2000년도부터 인터넷 건강정보 평가와 관련된 논의를 시작하여 2004년 부터 인터넷 건강정보 평가시스템 구축하여 국가차원의 신뢰성 있는 건 강정보를 제공하기 위한 대국민서비스를 실시하였다. 본 보고서에서는 운영 9년차인 2013년 인터넷 건강정보 게이트웨이 시스템인 건강정보광 장의 운영결과와 빅데이터 활용방안을 분석해본 결과 다음과 같이 요약
286 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 할 수 있다. 첫째, 국내의 주요 공공기관에서 운영하는 사이트들은 공통적으로 약 물정보 서비스, 자가진단 서비스, 건강통계, 동영상 건강정보, 온라인민 원 서비스, 약국정보, 건강웹진을 주로 제공하고 있으며, 국외 공공기관 에서 운영하고 있는 건강정보 사이트 들은 질병정보, 약국정보, 자가진 단, 의학용어 등을 제공하고 있는 것으로 나타났다. 국내외 건강정보 사 이트 모두 정보의 명확성을 확보하여 이용자들이 이용함에 있어서 신뢰 성을 제공하려는 노력을 기울이고 있다. 둘째, 보건 분야 국외 활용사례로는 유전자 데이터 공유를 통한 질병 체 계 구축, 제조사와 이용자를 실시간으로 연경하여 약에 대한 정보를 제공, 퇴역 군인의 전자의료기록 뷴석을 통한 맞춤형 의료서비스 지원체계구축 등에 활용하고 있으며, 국내에서는 생명연구자원의 수집과 정보제공체계 구축, 업무의 효율성과 생산성향상을 위한 임상의사결정지원시스템 개발, u-health를 이용한 생체정보 분석 체계구축 등에 활용하고 있다. 셋째, 소셜 빅데이터를 활용한 자살검색예측모형 개발을 통하여 성인 과 청소년은 온라인상에서 자살과 관련한 담론을 주고받고 있으며, 이러 한 언급이 실제적인 자갈과 관련된 심리적 행동적 특성으로 노출될 수 있 기 때문에 자살예측모형에 따른 위험징후가 예측되면 실시간으로 개입할 수 있는 애플리케이션의 개발이 필요하며, 지역별 위험징후를 예측하여 자역별 자살을 사전에 예방할 수 있는 지역 생명존중예보시스템의 구축 을 제안하였다. 넷째, 개인정보 보호법이 사생활의 비밀 등을 보호함으로써 국민의 권 리와 이익을 증진하고는 있지만 개인정보와 비개인정보를 명확히 구분하 기가 곤란하며 특히, 자동적으로 수집되는 빅데이터가 비개인정보 라도 할지라도 프라이버시를 침해할 가능성이 있다. 해외에서는 법적인 관점
제8장 결론 및 정책제언 287 에서의 개인정보 보호보다는 사회적인 관점에서의 프라이버시 보호가 중 시되는 경향으로 흐르고 있다. 우리나라는 선진국에서 비해 아직 프라이 버시 침해에 대해 관대한 편이나, 빅데이터 수집에 있어 사전에 이용자의 동의를 구해야 한다면 현실적으로 불가능하여 빅데이터의 활용을 저해할 것으로 보인다. 다섯째, 건강정보광장의 이용자의 이용실태 및 서비스 만족도, 정보수 요를 파악하기 위하여 정성적 정량적 평가를 실시하였다. 정량적평가결 과 일일평균방문자 수가 773명으로 2012년 2,412명로 70%저도 감소한 것으로 나타났으나, 이는 협력기관의 개편으로 방문자수가 줄어들었으며 건강정보광장 운영시스템의 문제로 인해 2013년 1월 - 4월 방문자 웹로 그가 저장되지 않은 결과로 보인다. 이용자 실태조사 결과 건강정보광장 정보의 질에 대해서는 양호만 만족감을 보였으나 이용서비스 측면에서 는 다소 만족감이 떨어지는 것으로 나타나 이에 대한 추가적인 보완이 있 어야 할 것으로 본다. 이상의 본 연구결과와 문제점 및 개선방안 등을 종합하여 본장에서 다 음과 같은 정책제언을 제시하고자 한다. 제2절 정책제언 1. 보건복지 빅데이터 효율적 활용방안 52) 빅데이터는 신가치 창출의 엔진으로 보건복지 서비스에 새로운 패러다 임을 제공할 수 있다. 국내의 보건복지 분야에서는 기존 레거시 시스템의 52) 본 연구에서 제안한 전략은 송태민. 보건복지 빅데이터 효율적 활용방안. 보건복지포럼 (2012. 11) 의 내용을 수정보완 한 것임을 밝힘.
288 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 안정적인 구축으로 이미 수많은 빅데이터가 저장 관리되고 있다. 보건 분 야에서 국민건강보험공단의 데이터웨어하우스는 보험료 시뮬레이션, 보 험료 및 보험급여비 상승 추계 등의 정보를 제공하고 있다. 건강보험심사 평가원 데이터웨어하우스는 적시에 정보를 분석할 수 있도록 각 주제영 역에 대한 통계분석, 시계열분석, 다차원분석, 추이분석 등과 같은 다양 한 분석기법을 적용하고 있다. 국립암센터에서는 암 등록 자료의 데이터 웨어하우스를 구축하여 운영하고 있다. 복지 분야에서는 사회복지통합관 리망에 대부분의 복지정보가 통합 관리되고 있다. 그 외 식품의약품안전 처에서는 수입식품현황이나 식품 관련 DB를 운영하고 있으며, 통계청과 국책연구기관들은 보건복지 관련 각종 통계생산을 위한 패널 데이터를 구축하고 있다. 상기에 서술한 바와 같이 공공부분에서는 이미 수많은 정 형화된 빅데이터가 저장 관리 되고 있을 뿐만 아니라 각 기관의 홈페이지 나 SNS 서비스를 통해서도 많은 비정형 데이터가 관리되고 있다. 한편, 개인건강기록(Personal Health Record: PHR)이 의료서비스 소비자에 게 다양한 건강정보를 제공하고 그들의 건강을 스스로 통제 관리할 수 있 는 수단을 제공함에 따라 공공과 민간 차원의 PHR 구축이 지속적으로 추 진되고 있다. PHR은 혈압과 같은 객관적인 자료를 수집할 수 있고 이런 자료는 측정되어 환자가 수동으로 입력하거나 u-health 기기를 통해 직 접 전송될 수도 있다. 즉, 24시간 원격 건강관리 모니터링을 위해 u-health 기기를 통하여 전송된 PHR 정보는 건강생활습관(금연, 절주, 영양, 운동)의 확립과 자가건강관리 능력의 함양으로 국민 건강수명을 연 장시키며 삶의 질을 향상시키고 만성질환에 대한 치료에서 예방 중심의 건강관리를 통한 의료비 절감의 효과를 기대할 수 있다(송태민 외, 2011). 앞에서 살펴본 바와 같이 보건복지영역과 빅데이터의 관계는 매 우 밀접하다. 보건의료 분야에서는 생애주기별로 맞춤형 보건의료서비스
제8장 결론 및 정책제언 289 를 제공하기 위해서는 보건의료뿐만 아니라 사회현안이나 미래중요이슈 를 중심으로 빅데이터를 활용한 미래전망 및 정책의사 결정모델을 도출 할 필요가 있으며, 이를 위해서는 사회공동자산인 데이터의 부가가치를 높기 위한 위험분석센터 의 설립이 필요하다. 위험분석센터에서 질병관 리 및 예측, 다양한 사용자의 질병에 대한 통계데이터를 활용하여 주요 질병의 분포 및 추세를 예측함으로써 국가 차원의 조기대응이 가능할 것 으로 본다(고숙자 정영호, 2012). 그림 8-1 위험분석센터 설립을 통한 빅데이터 활용 방안 자료: 고숙자 정영호(2012. 11), 국민건강 미래예측 시스템 구축방안, 보건복지포럼, 통권 제 193호, 한국보건사회연구원. 복지 분야에서는 2010년 2월부터 보건복지부를 포함한 각 부처의 공 공기관이 수행하는 복지사업과 수혜자정보를 통합 관리하는 사회복지통 합관리망(행복e음)을 가동하고 있다. 복지사각지대를 해소하고 생애주기 별로 개인 맞춤형 복지서비스를 제공하려면 현재의 사회복지통합망을 전 ( 全 ) 정부부처의 정보시스템과 통합 연동하는 국가 빅데이터 인프라로 확 장하여야 할 것이다(황승구 외, 2013).
290 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 8-2 복지 분야의 빅테이터 활용 방안 자료: 황승구 외(2013), 빅데이터 플랫폼 전략, 전자신문사, p. 201. 2. 빅데이터 프라이버시 보호방안 현재 상황에서 어느 나라를 막론하여 빅데이터의 활용에 가장 큰 과제 로 되어있는 것은 개인의 사생활 비밀보호 및 개인정보보호 이다. 앞에서 이미 언급한 바와 같이 개인정보보호에 중점을 두면, 빅데이터의 활용을 저해하게 될 우려가 있다. 개인정보보호법 등 관련 법률을 자의적으로 해 석하여 수집된 개인 데이터를 공공의 목적으로 활용하기 위해 제삼에 제 공하는데 소극적인 기업이 적지 않다. 특히 의료 현장의 경우 정보의 기 밀성을 이유로 그러한 현상이 두드러진다. 법률상의 취급 규정이 불명확 한 경우 모험하지 않는 기업의 특성을 감안할 때, 법제도 상에서 개인정 보의 취급에 방법을 명확하게 할 필요가 있다. 일본의 경우 개인정보 보호법의 시행된 지가 10년이 넘었다. 아직도 법령의 과도한 해석에 따라 개인정보 보호에 과잉반응을 보이는 사례가 끊이지 않고 있다는 보고가 있다. 학교에서 학생 명부를 만들 수 없다든 지 졸업앨범을 제작할 수 없다고 한다든가, 의료기관에서 개인정보의 제
제8장 결론 및 정책제언 291 공을 거부하는 등의 예이다. 2005년 개인정보보호법이 전면적으로 시행 되었던 시점에 107명의 목숨을 앗아간 희대의 JR열차의 탈선 사고가 발 생했다. 평소 열차를 이용하는 수많은 지역 주민들이 가족의 안부를 확인 하기 위하여 병원으로 사고 대책 본부로 혹은 철도회사로 연락을 취했지 만 개인정보보호를 이유로 제대로 응답해 주지 않는 사례는 일본 사회에 충격을 안겨 주었다(일본 소비자청, 2005) 53). 앞에서 소개된 프라이버 시 보호 데이터마이닝 (PPDM; Privacy-Preserving Data Mining) 등 의 개인정보와 프라이버시 보호 기술 들은 2000년대에 들어 와 학술적 차원에서 연구가 진행되어 왔다. 그러나 기술의 성숙도와 정밀도가 실용 화 단계에 와 있지 못하고 있는 것이 실상이다. 캐나다의 예에서와 같이 일부 의료기관에 서 사용되고 있는 것도 있지만, 이는 극히 제한적인 예 이다. 심지어 미국에서도 빅데이터 이용자로부터 강한 수요가 없기에 당 분간은 이러한 솔루션의 출현은 기대 할 수 없을 것으로 예상하고 있다. 시장 수요 없이는 실용화 연구의 활성화를 기대하기 어렵다. 이러한 상 황에 맞추어 미국연방정부는 정부 각 기관과 민간기업의 대표를 소집하 여 빅데이터의 대응 방침을 발표하고 연구위원회를 설립하여 정책책정을 위한 관련제도를 검토하고 있다. 시장 수요가 정보보안의 제도의 엄격한 적용에서 비롯된 것이라면 빅데이터의 활용은 오히려 위축의 악순환에 빠져들 우려가 있다. 자율적인 개인보호의 분위기를 유도해야 하는 이유 가 여기에 있다. 과거 미국은 자율 규제, 유럽은 법제 강화를 지향하는 방 향으로 가고 있었지만 같은 문제의식을 바탕으로 최근 비슷한 접근법을 띄는 양상을 보이고 있다. 우리는 이 양자를 잘 판단해서 우리실정에 맞 는 우리의 해법을 찾는 데 있어, 시장이라는 생태계의 속성이 자율을 영 양으로 커간다는 기본적인 사실을 염두해 필요가 있다고 보인다. 53) 消 費 者 庁,http://www.kokusen.go.jp/pdf/n-20051107_2.pdf
292 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 개인정보 보호법의 목적이 개인정보의 수집 유출 오용 남용으로부터 사생활의 비밀 등을 보호함으로써 국민의 권리와 이익을 증진하고 로 되 어 있지만 개인정보와 비개인정보를 명확히 구분하기가 곤란하고 비즈니 스에 있어 자동적으로 수집되는 데이터가 비개인정보 라도 할지라도 프 라이버시을 침해할 가능성이 있다는 사실은 이미 언급한 한 바 있다. 법 의 목적인 국민의 권리와 이익이 증진이 정보 보호로 해서 지켜지는 부분 과 보호의 완화와 활용에 의해 새로 창출될 수 있는 것 사이의 경중을 어 떻게 가름할 것인가가 과제이다. 물론 선택은 어디가지나 이용자 자신에 게 맡겨야 할 것이다. 그러나 이용자가 올바르고 적정한 판단을 내릴 수 있는 합리적인 자료를 제공해야 되는 것은 정보 제공자의 의무요 이를 지 도하는 것은 정부의 역할일 것이다. 개인 정보의 흐름이 이미 국경을 넘 어 선 지가 오래다. 구글, 트위트, 유튜브 등의 글로벌 기업의 서비스에 국내법상에 문제가 있는 부분이 있더라도 이를 국내에서 국내법의 규정 에 따라 재제를 가할 수는 없는 노릇이다. 이제 국제협력을 도모하면서 선진국 수준에 부응하는 프라이버시 보호와 개인 정보 보호 제도를 정착 시켜야 할 시점에 와 있다. 해외에서 이미 법적인 관점에서의 개인정보 보호보다는 사회적인 관점에서의 프라이버시 보호가 중시되는 경향으로 흐르고 있다. 우리나라는 선진국에서 비해 아직도 프라이버시 침해에 대 해 관대한 편이라 보인다. 국내 기업이 선진국에 진출하여 서비스를 제공 하려면 이러한 국제적 관점에 맞는 운용에 익숙해져야 할 것이다. 최근 국회입법조사처에서 검토한 우리나라의 빅데이터 활용에 있어 개 인정보보호의 쟁점으로 개인식별가능성, 개인정보자기결정권과 동의 권, 개인정보 감독 및 규제 체계 로 보고 있다(국회입법조사처, 201 3) 54). 개인식별 가능성의 쟁점은 빅데이터의 분석은 다양한 정보간의 결 54) 세부쟁점사항은 심우민(2013. 10. 11). 빅데이터 활용과 개인정보보호. 이슈와 논점.
제8장 결론 및 정책제언 293 합이 전제되어 있기 때문에 개인 식별가능성을 직접적으로 가지는 정보 는 물론 익명성을 가지는 정보들 간의 결합을 통해 개인 식별이 가능한 정보가 생성될 수 있다. 개인정보자기결정권과 동의권의 쟁점은 현행 개 인정보보호 법제들은 기본권으로서의 개인정보자기 결정권을 보장하기 위하여 자신의 정보 활용에 대한 동의권 등을 규정하고 있으나 언제 어떠 한 방식으로 개인식별 가능성을 가질지 알수 없는 모든 정보들에 대해 사 전에 이용자들의 동의를 구하는 것은 현실적으로 불가능하기 때문에, 만 약 동의를 받아야 한다면 빅데이터 활용을 저해하는 결과를 불러일으킬 수 있다. 개인정보 감독 및 규제 체계에 대한 쟁점은 개인정보 보호 법제 는 개인정보보호법 을 일반법으로 하여 각 영역별(예를 들면, 정보통신 망 이용촉진 정보보호 등에 관한 법률, 위치정보의 보호 및 이용 등에 관 한 법률, 신용정보의 이용 및 보호에 관한 법률, 의료법 등)로 개별적인 개인정보보호 관련 법률이 시행되고 있기 때문에 빅데이터의 활용은 물 론이고, 다양한 정보의 융합현상이 예견되는 상황에서 영역별 규제체계 가 급증하는 개인정보 침해사안에 대응하는데 있어 효과적일 수 있는지 에 대한 논의가 필요할 것이다. 따라서 빅데이터 활용에 있어 개인정보보 고 법제의 대응방안으로 첫째, 현행 개인정보보호 법제가 빅데이터의 활 용을 저해한다는 의견이 강하게 제기되면서 개인 식별 가능성 요건을 완화하는 문제에 대한 단계적 접근을 통해 공감대를 형성해 나가야할 필 요가 있다. 둘째, 분산된 개별 정보보호 법률들의 소관 부처들의 감독 및 규제 기능을 통합 또는 일원화 할 수 있는 감독기구와 관련한 체계정비가 요구된다. 셋째, 장기적인 관점에서 민간영역의 자율규제를 촉진하고 이 과정에서 형성된 법적 판단기준들을 검토하여 관련 법령을 개정할 수 있 을 것으로 본다. 국회입법조사처 의 내용을 정리한 것임을 밝힌다.
294 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 3. 건강정보 온톨로지 구축방안 인터넷에서 제공되는 건강정보는 다양한 기관에서 일반인에서 전문가 까지 다양한 하여 콘텐츠가 제공되며 제공되는 정보의 형태도 매우 다양 하여 이러한 이질적인 환경에서 일반인들이 자신의 건강 문제와 관련된 적절하고 신뢰할만한 정보를 인터넷에서 찾는 것이 쉽지 않다. 이러한 문제를 해결하기 위해 많은 포털 사이트가 운영되고 있어나 정보 이용자 가 원하는 가장 적합한 정보를 신속하게 제공하지 못하고 있는 실정이 다. 인터넷을 통하여 제공되는 정보는 정보사용자와 정보생산자로 구분 될 수 있다. 정보사용자는 인터넷 건강정보 이용시 콘텐츠검색, 연결문 제, 콘텐츠취합, 콘텐츠질, 전문성수준 등 다양한 부분에서 어려움을 경 험한다. 정보생산자들도 인터넷 건강정보를 생산할 때, 반복작업, 콘텐 츠 재사용, 내부와 외부의 링크유지, 색인문제, 콘텐츠 질관리, 상호운용 성 보장 등 다양한 부분에서 어려움을 경험한다. 이러한 배경하에 메타 데이터 온톨로지 기반 건강정보 검색엔진 의 개발은 정보생산자와 정보 사용자에게 신뢰할 수 있는 건강정보를 신속하게 제공할 수 있는 방안이 될 수 있을 것으로 본다. 그동안 건강정보 온톨로지 구축을 위해 다양한 연구가 진행되어 왔다. 특히, 국민건강증진정보시스템 기반구축의 일환 으로 추진된 온톨로지 기반 건강정보질의시스템 은 건강정보 데이터베 이스 시스템에 대한 검색을 강화하기 위한 온톨로지를 구축한바 있으나 온톨로지 구축을 위한 방법론에 국한되어 실질적으로 서비스 되지 못하 였다. 2012년에 개발된 건강정보 온톨로지 검색시스템 은 그림 8-6 과 같이 건강정보광장(healthpark.or.kr) 에 연결된 국민건강보험공단의 건강iN(http://hi.nhic.or.kr) 사이트 내 건강질병정보> 질병/수술/
제8장 결론 및 정책제언 295 처치/검사정보 메뉴의 제목/내용 만을 수집하여 DB로 구축하였으며, 수집된 DB제목과 내용을 분석 한 후 구축된 온톨로지 메타데이터와 비 교하여 건강정보를 분류하여 검색시스템을 개발하였다. HONRS는 인터넷에서 일반인들을 위해 제공되는 건강정보의 교환 및 교류에서 상호운용성 문제를 해결하기 위해 메타데이터 스키마와 온톨로 지에 기반으로 콘텐트를 생성하고, 수집하여 사용자들에게 제공하는 시 멘틱 웹 모델과 포탈을 개발하여 건강정보광장 검색엔진에 적용해보는 데 있다. HONRS에서 제안한 메타데이터 스키마는 이미 널리 알려진 Dublin Core Metadata Element Set의 15개 메타데이터 요소에 건강 정보의 주요 대상자가 누구인지 기술하기 위해 Target Audience를 추 가하였다. 이들 16개 메타데이터 요소 중 식별자, 제목, 주제어를 필수 요소로 제 안하였다. 또한 건강정보 온톨로지를 크게 질병정보, 건강증진/질병예방 정보, 진단/치료관리 정보로 구분하고, 질병정보의 경우 신체부위계통별, 질병상태별, 성별, 연령별로 재구성하여 개념을 제시하였다. 건강증진/질 병예방정보의 경우 건강을 유지하고 질병을 예방하기 위해 개인이 취해 야 할 행위, 가정이나 사회가 안고 있는 문제를 기술하는 개념을 포함하 고 있으며, 진단/치료관리 정보의 경우 건강문제가 발생한 경우 필요한 진단검사, 증상관리, 각종 치료와 관련된 내용을 기술하는 개념을 포함하 고 있다.
296 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 그림 8-3 건강정보광장 온톨로지 검색 시스템(HONRS) 이러한 온톨로지 용어체계를 SNOMED CT로 매핑하여 인터넷에서 제 공되는 건강정보의 주제를 기술하는데 사용되는 주제 온톨로지와 주제 온톨로지를 표현하는 데 사용되는 약 1,500개의 용어체계를 제안하였다. HONRS에서는 온톨로지 검색엔진을 개발하기 위하여 건강정보광장의 협력기관인 보건복지부 건강IN(http://hi.nhic.or.kr/)사이트 내의 건 강질병정보>질병/수술/처치/검사 정보 자료 중 제목/내용만 수집하여 DB를 구축하였다. 또한, 수집 DB의 제목과 내용을 형태소 분석한 후 기 구축된 온톨로지 메타데이터 DB와 비교하여 건강 정보 분류기를 개발하 였다. 개발된 검색엔진 적용결과 기존 검색엔진에서는 구강+암 의 12건
제8장 결론 및 정책제언 297 의 검색결과가 나타났으나, 개발된 온톨로1지 검색엔진에서는 건강행태 소분류(구강)+암 의 4건의 정확한 검색결과가 추출되었다. 따라서 본 연 구에서 개발된 메타온톨로지 기반 건강정보 검색엔진 은 정보생산자과 정보사용자에게 신뢰할 수 있는 건강정보를 신속하게 제공할 수 있는 방 안이 될 수 있을 것으로 본다. 4. 소비자 중심 건강정보 품질향상 방안 최근 건강에 대한 관심이 높아지면서 인터넷 상에서 건강과 관련된 정 보를 제공하는 웹사이트도 꾸준한 증가를 보이고 있다. 그러나 웹사이트 에서 제공되는 건강정보들은 품질관리 및 신뢰성, 유용성, 영향력 등의 인증이 제대로 이루어지지 않아 사용결과에 따라 도리어 건강에 악영향 을 끼칠 수 있다. 건강정보는 공급자를 위한 전문 의학정보에서부터 소비자를 위한 광의 의 건강정보까지 광범위하고 대상도 다양하다. 품질(Quality)은 다양한 의미를 내포하고 있으나 이 중에서 품질의 가 장 중심적인 내용은 소비자 기대수준에 부응 이라고 할 수 있다. 정보품 질은 정보시스템의 결과물인 정보와 콘텐츠에 대한 품질이다. 정보시스 템 성공에 영향을 주는 주된 요소로 웹사이트를 통해 제공되는 정보는 이 해가 쉽고 품질이 적절하여야 하며 정보의 제공시점, 정보의 깊이와 범 위, 정보의 최신성 등도 고려되어야 한다. 1990년대 중반에 인터넷 건강 정보의 질 확보를 위한 평가기준의 개발 및 인증은 HON(Health on the Net) 등과 같이 전문가 및 연구기관을 중심으로 추진되었으며, 2000년대 초반으로 접어들면서 각 국가의 정부에서 인터넷을 통한 소비자 건강정 보의 유용성과 유해성을 인식하면서 이에 대한 평가체계, 평가도구, 인증
298 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 및 검증된 정보의 제공서비스 등을 개발하고 실행하게 되었다. 그러나 인터넷 웹사이트에서 제공되고 있는 건강정보는 정보제공 기관 이나 해당 웹사이트에 대해 정보품질을 검증하는 절차나 의무가 마련되 어 있지 않다. Web3.0과 빅데이터의 등장에 따른 IT 환경 변화는 공급자 위주의 정 보제공에서 국민중심(사용자)의 정보제공으로 패러다임을 변화시키고 있 다. 이러한 패러다임의 변화는 인터넷에서 제공되는 건강정보의 품질관 리를 위한 제도적 장치 마련이 요구된다. 단순히 웹사이트의 품질을 평가(접속용이성 등)하는 도구가 아닌 웹사 이트에서 제공되는 건강정보의 이해도, 제공시점, 정보의 깊이와 범위, 정보의 최신성, 전문성, 제공기관, 수집체계 등을 고려한 표준화된 품질 평가 기준과 절차를 마련하고 표준화된 품질평가모형 개발과 콘텐츠 제 공자 스스로가 평가할 수 있도록 표준화된 평가 툴을 개발하여 제공하여 야 한다. 그리고 반드시 이를 준수할 수 있도록 의무화하는 정책 수립과 품질인증마크 획득을 위한 인증기준 및 인증절차 등을 수립하여 시행하 여야 한다. 이러한 제도적 장치는 대국민중심의 적극적이고 능동적인 공개를 지향 하는 정부3.0의 개방, 공유, 소통, 협력 의 핵심가치를 중심으로 국 민에게 맞춤형 서비스를 제공한다는 취지에도 부합될 것이다.
참고문헌 << 고숙자 정영호(2012). 국민건강미래예측시스템구축방안, 보건복지포럼(193), 한국 보건사회연구원. 국가정보화전략위원회(2011), 지식정보 개방과 협력으로 스마트 정부 구현. 김근태(2012). 빅데이터 분석을 위한 기업의 BigAnalytics 환경변화, 정보처리학 회지, 19(2), pp.70~78. 남정자 최정수(1993). 지역사회정신보건 시행방안연구, 한국보건사회연구원 정책 보고서. 93(19). 송태민(2012). 보건복지 빅데이터의 효율적 활용방안 보건복지포럼(193), 한국보 건사회연구원. 송태민(2013). 소셜 빅데이터 분석을 통한 자살검색 예측모형 개발 보건복지포럼 (202), 한국보건사회연구원. 송태민, 이연희, 박대순, 진달래, 류시원, 안지영(2012). 2012 인터넷 건강정보 게이트웨이 시스템 구축 및 운영. 한국보건사회연구원 송태민 이상영 이기호 박대순 진달래 류시원 장상현(2011), u-health현황과정책 과제,한국보건사회연구원. 신선인(2001). 한국판 일반정신건강척도(KGHQ)의 개발에 관한 연구 I:KGHQ-20과 KGHQ-30을 중심으로, 한국사회복지학, 46(9), 210-235. 신현산, 김평중(2012). 건강정보 웹사이트의 소비자 중심 품질요인에 대한 연구, 한국컴퓨터정보학회지, 17(7). 안용교(1980). 프라이버시권, 월간고시, 21, pp.47-62. (김동길 권리와 프라이버시 1985년 통권21 여름호 재인용) http://www.pac.or.kr/press/webzine_db/webzine_db_4.asp?seqid= 283&page=167&cur_pack=16&bbs_category=&title=&writer_name= &book_year=&book_season=&volume_no= 영국 파이낸셜 타임즈 2013년6월12일 인터넷판 John Gapper,
300 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - Big data has to show that it s not like Big Brother http://www.ft.com/intl/cms/s/0/5af52e98-d2a5-11e2-88ed-0014 4feab7de.html#axzz2efoGaTPc 윤미영 권정은(2012), 빅데이터로진화하는세상-빅데이터글로벌선진사례, 한국정보화진흥원빅데이터전략연구센터. 윤형중(2012), 이제는빅데이터시대, 비즈북스. 이성훈 이동우(2013), 빅데이터의국내 외활용고찰및시사점, 디지털정책연구, 11(2), pp.229~233. 이자성, 양기근(2008). 경상남도 행정서비스 품질평가결과의 수용도 제고방안. 경남발전연구원. 장상현(2012). 빅데이터와스마트교육, 한국정보과학회지, 30(6), pp.59~64. 전자통신기술연구소(2012). 보건의료 Big Data R&D 사업 기획 연구계획서. 정보화진흥원(2013). 13년도 스카프폰기반의 모바일 전자정보구축 사업 제안요청서. 정영철, 이기호, 유주헌, 김수진, 김석일, 이견직, 주지홍(2010). 수요자 중심의 건강정보 연계모델 및 활용방안에 관한 연구. 한국보건사회연구원 건강증진사업지원단. 정지선(2011). 新 가치 창출엔진, 빅데이터의 새로운 가능성과 대응전략, IT&FutureStrategy(18). 정지선(2012). 성공적인 빅데이터 활용을 위한 3대요소: 자원,기술,인력, IT&FutureStrategy(3). 한국인터넷진흥원(2012). 2011년무선인터넷이용실태조사. 한국인터넷진흥원 ISMS인증제도 소개 http://isms.kisa.or.kr/kor/intro/intro01.jsp 한국일보 뉴스(2011.3.6.). http://news.hankooki.com/lpage/economy/201103/h20110306174 043111720.htm 한국정보문화진흥원(2002). 인터넷 중독 상담 및 예방 프로그램 개발 연구.
참고문헌 301 서울: 한국정보문화진흥원. 한국정보문화진흥원(2005). 성인 인터넷중독 진단 척도 개발연구. 서울: 한국정보문화진흥원(연구보고 05-21). 한국정보문화진흥원(2006). 2006 인터넷중독 실태 조사. 한국정보화진흥원(2011). 2011년도 인터넷중독 실태조사. 한국정보화진흥원(2012). 대한민국 사회현안과 빅데이터 전략, 제3차 빅데이터 국가전략 포럼. 함유근 채승병(2012), 빅데이터 경영을 바꾸다, 삼성경제연구소. 황승구 최완 허성진 장명길 이미영 박종열 원희선 김달(2013), 빅데이터 플랫폼 전략, 전자신문사. AOL 검색어 파일 입수를 위한 미러 사이트 http://www.gregsadetsky.com/aol-data/ 공유 자원 포털 http://www.data.go.kr 구글 검색 트렌드 http://www.google.org/trends/ 구글 독감 예보 http://www.google.org/flutrends 샌프란시스코 범죄예방 http://www.crimemapping.com 유럽 인터넷광고 협회 Interactive Advertising Bureau(IAB) http://www.youronlinechoices.eu/ 유전자 정보 제공 http://www.1000genomes.org/ 인터내셔날 비즈니스타임즈 2013년6월 http://www.ibtimes.co.uk/articles/477262/20130611/george-orwe ll-sales-1984-rise-edward-snowden.htm 퓨리서치센터 http://www.pewinternet.org/commentary/2011/november/pew-i nternet-health.aspx 프라이버시의 종류 http://itlaw.wikia.com/wiki/right_of_privacy 한국인체자원은행 http://kbn.cdc.go.kr/
302 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 日 本 ネットワークセキュリティ 協 会 (2012). 2012 年 情 報 セキュリティインシデン トに 関 する 調 査 報 告 書 - 個 人 情 報 漏 えい 編 http://www.jnsa.org/result/incident/data/2011incident_survey_ver 1.2.pdf 小 林 慎 太 郎,プライパシー 影 響 評 価 (P1A)に 基 づく 個 人 情 報 の 有 効 活 用 を 考 える (2012). NRIパブリックマネジメントレビュー, 2012(113), pp.1-6. http://www.nri.co.jp/opinion/region/2012/pdf/ck20121203.pdf 新 田 明 子, 江 木 啓 訓 (2007). リンク 不 能 性 および 一 覧 性 の 観 点 による 匿 名 性 の 分 類, 日 本 情 報 処 理 学 会, SIGTechnicalReportp, pp.153-158. 財 団 法 人 日 本 情 報 処 理 開 発 協 会 (2011). パーソナル 情 報 の 利 用 のための 調 査 研 究 報 告 書. 2011.3http://www.jipdec.or.jp/pdf/project/jka/2010/22-h006report.pdf 中 田 響 (2007). 個 人 情 報 性 の 判 断 講 造 慶 藤 義 塾 大 学 メディア コミュニケーショ ン 研 究 所 紀 要, 57, pp.145-161. 真 野 健 (2011). 匿 名 性 プライバシーの 工 学 的 定 式 化 とその 学 際 的 応 用 電 子 情 報 通 信 学 会 誌, 94(9), pp.788-794. 総 務 省 (2012). 平 成 24 年 度 版 年 度 版 情 報 通 信 白 書. 独 立 行 政 法 人 情 報 処 理 機 構. (2012). パーソナル 情 報 保 護 とIT 技 術 に 関 する 調 査 調 査 報 告 書, pp.99. http://www.ipa.go.jp/files/000024428.pdf Nomura Research Institute(2012). 小 林 慎 太 郎 ビッグデータ 社 会 における プライバシー~ 個 人 情 報 から プライバシー の 保 護 へ~ 第 176 回 NRIメ ディアフォーラム 資 料. http://www.nri.co.jp/publicity/mediaforum/2012/pdf/forum176.pdf DNA Link http://dnalink.com/ Gartner. (2011). http://ww.gartner.com/newsroom/id/1731916/
참고문헌 303 IDC. (2011). Digital Universe study. KBS News (2011.3.6.). http://news.kbs.co.kr/news/newsview.do?search_news_code =2253248&retRef=Y&source=http://www.kma.org/board2/view.ph p%3fw_seq=291641%26page=39%26kind_code=3 L. Sweeney. (2000). Simple Demographics Often Identify People Uniquely, Carnegie Mellon University, Data Privacy Working Paper 3. Pittsburgh 2000. Llya Grigorik. (2007). Correlating Netflix and IMDB Datasets. http://www.igvita.com/2007/01/27/correlating-netflix-and-imdb-datasets/ McKinsey Global Institute. (2011). BigData:The Next Frontier for Innovation, forinnovation, Competition, and Productivity, McKinseyInc. McKinsey Global Institute. (2001). Big Data: The Next Frontier for Innovation, for Innovation, Competition, and Productivity, McKinsey. Inc.http://www.mckinsey.com/insights/business_technology/big_d ata_the_next_frontier_for_innovation Ministry of Internal Affairs and Communications of Japan http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/ Netflix Prize http://www.netflixprize.com/ Personal Genome Project s Open data https://my.personalgenomes.org/public_genetic_data Peter Warden. (2011), Big Data Glossary, O Reilly Media. Pfitzmann A. (2010). Pfitzmann and M. Hansen, A terminology for talking about privacy by data minimization: Anonymity, unlinkability, undetectability, unobservability, pseudonymity, and
304 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - identity management (v.3.4), 2010. http://dud.inf.tu-dresden.de/anon_terminology.shtml Pillbox service http://pillbox.nlm.nih.gov/ RAHS http://hsc.gov.sg Right to privacy http://en.wikipedia.org/wiki/right_to_privacy S Ochoa, J Rasmussen, C Robson, and M Salib. (2001). Reidentification of Individuals in Chicago's Homicide Database: A Technical and Legal Study, http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.15.7467 The New York Times. (2006). And if you liked the movie, a Netflix contest may reward you handsomely. New York Times, Oct 2 2006.http://www.nytimes.com/2006/10/02/technology/02netflix.h tml?_r=0 The New York Times. (2006). A Face Is Exposed for AOL Searcher No. 4417749 August 9,2006 http://www.nytimes.com/2006/08/09/technology/09aol.html?page wanted=all The World Economic Forum. (2012), Rethinking Personal Data: Strengthening Trusthttp://www3.weforum.org/docs/WEF_IT_RethinkingPersonalD ata_report_2012.pdf The Economist. (2010). http://www.economist.com/node/15557443/ Young, K. S. (1996a). Internet addiction: The emergence of a new clinical disorder. Paper presented at the 104th annual meeting of the American Psychological Association, August 11, 1996. Toronto, Canada. Young, K. S. (1996b). Pathological Internet Use: A case that breaks
참고문헌 305 the stereotype. Psychological Reports, 79, 899-902. Young, K. S. (1998a). Internet addiction: The emergence of a new clinical disorder. CyberPsychology & Behavior, 1(3), pp.237-244. Young, K. S. (1998b). Caught in the Net: How to Recognize the Signs of Internet Addiction - and A Winning Strategy For Recovery, New York, Wiley. Young, K. S. (2004). Internet addiction a new clinical phenomenon and its consequences. American Behavioral Scientist, 48(4), 402-415.
부 록 << <부록 1> 2013 건강정보광장 이용자 실태 및 수요조사 안녕하십니까? 건강정보광장(Healthpark) 을 찾아 주셔서 감사합니다. 건강정보광장에서는 이용자들에게 보다 편리하고 신속하게 믿을 수 있는 건강정보를 제공하기 위해 이용자 만족도 및 수요조사 를 실시하고 있습니다. (본 조사의 자료는 건강정보광장 의 개선 및 운영을 위한 자료로만 사용됩니다.) 다음 질문에 답하여 주십시오. 1. 건강정보광장 은 어떻게 알게 되었습니까? 1 이벤트광고 2 검색엔진(네이버, 다음 등) 3 다른 사이트(블로그, SNS 포함) 4 주변사람 5 책자 2. 얼마나 자주 건강정보광장 에 방문하십니까? 1 매일 2 일주일에 1번 이상 3 한달에 1번 이상 4 처음방문입니다(8번 문항으로 이동) 3. 한 번 방문 시 건강정보광장 에 머무르는 시간은 어느 정도입니까? 1 5분 이내 2 5~10분 이내 3 10~20분 이내 4 20~30분 이내 5 30분 이상 4. 건강정보광장 에서 주로 이용하는 정보는 무엇입니까? (가장 자주 이용하는 3가지를 순서대로 선택해 주십시오) 1순위: 2순위: 3순위: 1 건강 콘텐츠(전문가칼럼, 건강수칙, 추천 건강 콘텐츠, 건강정보 RSS 등) 2 자가진단(14종 100여개의 건강관련 자가진단 서비스 등) 3 건강소식(건강기사, 건강강좌/행사 등) 4 건강지식검색(통합검색, 건강생활정보 검색, 질병정보 검색, ㄱ/ㄴ/ㄷ순검색, 신체부위별 검색, 연령대별검색 등) 5 의료서비스정보(의료서비스 이용정보, 병의원 이용정보, 의료사전 등) 6 건강App(생활건강, 의학) 7 기타(건강위젯, 블로그, 북마크, 관련사이트 등) 5. 건강정보광장 에서 이용한 정보 중에서 어떤 정보가 가장 유익하였습니까? 1 건강 콘텐츠(전문가칼럼, 건강수칙, 추천 건강 콘텐츠, 건강정보 RSS 등)
308 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 2 자가진단(14종 100여개의 건강관련 자가진단 서비스 등) 3 건강소식(건강기사, 건강강좌/행사 등) 4 건강지식검색(통합검색, 건강생활정보 검색, 질병정보 검색, ㄱ/ㄴ/ㄷ순검색, 신체부위별 검색, 연령대별검색 등) 5 의료서비스정보(의료서비스 이용정보, 병의원 이용정보, 의료사전 등) 6 건강App(생활건강, 의학) 7 기타(건강위젯, 블로그, 북마크, 관련사이트 등) 6. 귀하께서는 건강정보광장 에서 제공하고 있는 RSS(Really Simple Syndication)를 사용하십니까? 1 예 2 아니오 7. 다음은 건강정보광장에서 제공하는 건강정보(품질, 만족도, 이용)데 관한 질문입니다. 각 문항에 1 매우 동의함 2 대체로 동의함 3 약간 동의함 4 별로 동의안함 5 대체로 동의안함 6 절대 동의안함 으로 대답하여 주십시오. 항목 7.1 내가 필요로 하는 내용을 충분히 포함하고 있다. 7.2 이곳에서 찾은 건강정보는 유용하다. 7.3 이곳에서 찾은 건강정보는 이해하기 쉽다. 7.4 이곳에서 찾은 건강정보는 믿을만하다. 7.5 정보가 시기적절하다. 7.6 정보이용에 대한 주의사항을 제시하고 있다. 7.7 건강정보광장은 이용하기 편리하다. 7.8 건강정보광장의 서비스에 만족한다. 7.9 낮은 수준의 접근환경에 있는 이용자들도 접속할 수 있다. 찾고자 하는 정보를 빠른 시간 7.10 내에 찾을 수 있다. 7.11 7.12 이곳에서 찾은 건강정보로 인해 건강과 관련된 자신의 행동에 영향을 받은 적이 있다. 이곳에서 찾은 건강정보로 인해 의사나 병원을 찾은 적이 있다. 매우 동의함 대체로 동의함 약간 동의함 별로 동의 안함 대체로 동의 안함 절대 동의 안함 1 2 3 4 5 6
부록 309 8. 건강정보를 얻기 위하여 주로 이용하는 건강정보제공 주체는 어디입니까? 1 공공기관 및 협회 2 의료기관 3 제약회사 4 학회 5 기업체 6 환자커뮤니티 7 기타: 9. 건강정보를 얻기 위하여 평균적으로 접속하는 사이트 수는 몇 개 정도 되십니까? 1 1개 2 2개~3개 3 4개 4 5개 이상 10. 지난 1년간 인터넷에서 이용한 건강정보가 있습니까? 있다면 어떤 건강정보를 이용하였습니까? (복수응답가능) 스마트폰이나 태블릿PC상의 인터넷 사용 포함 o 없다 1 운동/체력 2 식이/영양 3 절주/음주 4 금연 5 마약/약물중독 6 스트레스/우울 7 임신/성/생식보건 8 질병/질환 9 예방접종 10 의료기관/보건소정보 11 자가진단체크 12 건강강좌 13 건강정책 14 기타: 11. 평균적으로 일주일에 몇 시간 정도 인터넷을 이용합니까? 1 1시간미만 2 1~5시간미만 3 5~10시간미만 4 10~15시간미만 5 15~20시간미만 6 20시간이상 12. 귀하는 스마트폰(태플릿 포함)을 사용하고 계십니까? 1 예 (12.1번 문항으로 이동) 2 아니오 (13번 문항으로 이동) 12.1. 그렇다면 스마트폰(태플릿 포함)으로 인터넷을 사용하는 시간은 일주일에 평균 몇 시간 입니까? 1 1시간미만 2 1~5시간미만 3 5~10시간미만 4 10~15시간미만 5 15~20시간미만 6 20시간이상 13. 귀하는 스마트폰(태블릿 포함)을 통하여 건강정보를 검색한 적이 있습니까? 1 예 2 아니오 14.1 귀하의 스마트폰에 건강/의학 관련 앱(어플리케이션)이 설치되어 있습니까? 1 예 2 아니오 (15번 문항으로 이동) 14.2. 귀하의 스마트폰에 건강/의학 관련 앱(어플리케이션)이 있다면 몇 개를 보유하고 있습니까? 1 1개 2 2개~3개 3 4개 4 5개 이상 14.3 귀하가 보유하고 있는 건강/의학 관련 앱(어플리케이션은) 어느 분야입니까? (복수응답가능) 1 병원정보 2 운동/다이어트 3 식이/영양 4 구강정보
310 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 5 육아정보 6 질병/질환 7 임신/성/생식보건 8 자가진단 9 기타: 15. 향후 건강정보광장 에서 추가적으로 제공되었으면 하는 서비스는 무엇입니까? (복수응답가능) 1 국내외 건강웹사이트 2 생애주기별 보건교육자료 3 영양/다이어트 4 건강/의학도서 5 온라인 커뮤니티 6 기타: 다음은 일반적인 사항에 대한 질문입니다. 16. 귀하의 성별은 무엇입니까? 1 남자 2 여자 17. 귀하는 몇 년도에 태어났습니까? 년 18. 귀하의 교육정도는 어떠하십니까? 1 대학원 이상 2 대학교 졸업 3 고등학교 졸업 4 중학교 졸업 5 초등학교 졸업이하 19. 귀하는 어떤 일을 하고 계십니까? 보건의료계열이 아닌 경우 1 전문 사무직 2 서비스 판매직 3 생산관련직 4 학생(보건의료계열 제외) 5 주부 6 농수 축산 7 교사 및 교수 8 연구원 9 무직 10 기타: 보건의료계열인 경우 11 의사 간호사 등 보건의료인 12 보건의료분야연구자(교수, 연구원 등) 13 보건의료관련학과 학생 14 기타: 20. 건강정보광장 에 관한 어떠한 의견도 감사히 받겠습니다. 의견이 있으시면 아래의 의견란에 말씀해 주시기 바랍니다.
부록 311 <부록 2> 2013 건강정보광장 인터넷 정신건강 측정도구 안녕하십니까? 이 설문지는 정신건강과 관련된 여러 가지 요인들의 특성들을 알아보기 위한 것입니다. 자료의 내용들은 오직 정신건강 행동에 대한 연구, 치료, 예방의 목적으로만 사용됩니다. 되도록 한 문항도 빠짐없이 응답해 주셔야 연구에 사용 가능하므로 모두 응답해 주시기 바랍니다. 다음은 일반적인 사항에 대한 질문입니다. 1. 귀하의 성별은 무엇입니까? 1 남자 2 여자 2. 귀하는 연령은 어떻게 되십니까? 만 세 3.. 귀하의 학력은 어떻게 되십니까? 1 초등학교 졸업 2 중학교 졸업 3 고등학교 졸업 4 대학/대학교 졸업 5 대학원졸업 6 기타 4. 귀하는 직업은 무엇입니까? 1 전문 사무직 2 서비스 판매직 3 생산관련직 4 농수 축산 5 공무원 6 교사 및 교수 7 학생 8 무직 9 기타: 5. 귀하의 혼인상태는 어떻게 되십니까? 1 미혼 2 기혼 3 기타 6. 평상시 자신의 건강상태가 어떻다고 생각하십니까? 1 매우 건강한 편이다 2 건강한 편이다 3 보통이다 4 건강하지 못한 편이다 5 매우 건강하지 못한 편이다 7. 귀하는 만성질환이 있습니까? 1 있다 2 없다 3 모른다
312 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 문항 매우 그렇다 그렇다 아니다 매우 아니다 8 하고 있는 일에 잘 집중할 수 있었습니까? 9 걱정 때문에 잠을 잘 못 잔 적이 많았습니까? 10 자신이 여러면에서 쓸모있는 역할을 잘 하고 있다고 느꼈습니까? 11 매사에 올바른 결정을 잘 내릴 수 있었습니까? 12 계속해서 긴장감을 느낀 적이 자주 있었습니까? 13 어려움을 극복할 수 없다고 느낀 적이 있습니까? 14 일상적인 활동을 즐겁게 할 수 있었습니까? 15 문제가 생기면 그것을 피하지 않고 맞서서 해결하려고 하였습니까? 16 우울감과 불행감을 느낀 적이 많습니까? 17 자신감이 없어졌다고 느꼈습니까? 18 그 전과 같은 정도로 외출을 하였습니까? 19 인생이 절망적이라고 느낀 적이 있습니까? 20 21 22 23 신경이 쓰여서 힘들게 느껴진 일이 많았습니까? 밤에 잠을 잘 못 이루거나 많이 설치곤 합니까? 어떤 일을 할 때 대부분의 다른 사람들이 하는 만큼 그 일을 잘 처리할 수 있었습니까? 당신과 가까운 사람들에게 따뜻함과 애정을 느낄 수 있었습니까? 24 자신의 미래를 희망적으로 느꼈습니까? 25 부지런히 생활하며 일에 전념할 수 있었습니까? 26 27 다른 사람들과 잘 지내는 것이 어렵지 않게 느껴졌습니까? 전반적으로 자신이 일을 잘 하고 있다고 느꼈습니까?
부록 313 전혀아니다------항상있다 문항 0 1 2 3 4 28 예정보다 오래 인터넷에 접속한 적이 있다. 29 인터넷 때문에 자기 할 일을 소홀히 한 적이 있다. 30 가족과의 생활보다 인터넷에 더 흥미를 느낀 적이 있다. 31 온라인상의 친구를 만들어 본 적이 있다. 32 온라인 접속 때문에 다른 사람이 불평한 적이 있다. 33 인터넷 때문에 성적이나 학교생활에 문제가 있다. 34 다른 일을 하기 전에 먼저 메일을 점검한 적이 있다. 35 인터넷 때문에 능률이나 생산성에 문제가 있다. 36 37 38 39 40 누군가가 인터넷에서 무엇을 했느냐고 물으면 숨기거나 변명한 적이 있다. 인터넷에 빠져 현실에서의 어려운 문제를 생각하지 못했던 적이 있다. 인터넷 사용 후 다시 접속할 때까지의 기간을 손꼽아 기다린 적이 있다. 인터넷 없는 생활은 따분하고 재미없을 것이라고 두려워 한 적이 있다. 온라인 접속 중 누군가가 방해하면 화를 내거나 귀찮은 듯이 행동한 적이 있다. 41 밤늦게까지 접속해 있느라 잠을 못 잔 적이 있다. 42 현실 생활에서도 인터넷에 접속해 있는 듯한 환상에 빠진 적이 있다. 43 몇 분만 더 라며 시간을 허비한 적이 있다. 44 사용시간을 줄이려고 노력했지만 실패한 적이 있다. 45 사용시간을 숨겨본 적이 있다. 46 47 밖으로 외출하려하기 보다 인터넷에 접속해 있는 것이 좋다. 오프라인 상태에서는 침울하며 신경질적이다가 온라인상에 오면 모두 사라진다.
314 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부록 3> 1. 2011~2013년 자살 이슈 정리 연 구분 월 구분 자살 이슈 2011년 2012년 2013년 1월 23일 2월 21일 3월 29일 5월 23일 5월 27일 8월 18일 11월 8일 12월 2일 12월 20일 1월 16일 4월 16, 17일 4월 17일 6월 12일 6월 28일 7월 8일 9월 15일 10월 5일 1월 6일 3월 6일 동두천 모텔 연탄가스 집단자살 청주 20대 3명 연탄 피워 동반 자살 우울증 앓던 카이스트생 투신 자살 아나운서 송지선 자살 가수 채동하 자살 탈옥수 신창원 감방서 자살 기도 쌍용자동차 근로자 또 자살 "18명째 죽음" 대전 여고생 투신 자살 대구 청소년 자살 사건 왕따 자살' 대전 여고생 친구도 투신 자살 무방비' 영주 안동 중학생 잇단 투신 카이스트 학생 기숙사 투신 자살 신인여배우 정아율 우울증으로 자살 배우 윤진서 자살기도 해프닝 배우 이채영 자살 암시 트윗 논란 크리에이티브디렉터 우종완 자살 가수 김장훈 SNS 자살 암시글 게시 후 자살 시도 故 최진실 전 남편 조성민 자살 대천해수욕장서 20대 남녀 4명 동반자살
부록 315 2. 3년간 자살 담론 주요 빈출 키워드 채널구분 SNS 뉴스 블로그 년도 순위 자살 청소년 자살 자살 청소년 자살 자살 청소년 자살 2011년 2012년 1 자살 자살 자살 자살 자살 자살 2 경찰 중학생 사람 학생 사람 학교 3 발견 대구 자살한 학교 사람들 학교폭력 4 목숨 청소년 학생 문제 문제 학생 5 조사 여고생 대구 청소년 세상 조사 6 뉴스 자살한 중학생 학생들 이유 경찰 7 사건 사건 자살률 사건 사건 학생들 8 서울 대전 사건 경찰 죽음 청소년 9 유서 학교 사람들 조사 발견 문제 10 자살한 학생 학교 중학생 학교 사건 11 기사 자살사건 친구 목숨 사실 중학교 12 사망 가해자 문제 결과 이야기 결과 13 문제 유서 죽음 필요 필요 유서 14 발생 1위 세상 사람 목숨 2011년 15 신고 나라 나라 내용 사회 목숨 16 사람 부모 등록금 대상 사랑 필요 17 내용 아이 이유 발생 내용 대상 18 충격 아이들 1위 뉴스 상황 뉴스 19 관계자 가해학생 사회 발견 선택 계획 20 결과 중학교 소식 대구 행복 경산 1 자살 자살 자살 자살 자살 자살 2 사람 청소년 경찰 학교 사람 사람 3 자살한 중학생 발견 학교폭력 사람들 학교 4 한국 대구 조사 학생 문제 문제 5 자살률 1위 목숨 경찰 세상 사람들 6 1위 한국 사건 조사 이유 이유 7 투신자살 학생 뉴스 학생들 사건 학생 8 청소년 학교폭력 서울 청소년 필요 아이들 9 학생 게임 신고 문제 발견 세상 10 이유 여고생 유서 사건 행복 친구 11 사람들 공부 내용 중학생 죽음 이야기 12 사건 고등학생 아파트 뉴스 학교 학생들 13 대구 투신 시도 대구 사랑 공부 14 문제 사회 문제 중학교 선택 청소년 15 사회 여학생 발생 서울 우울증 필요 16 유서 유서 결과 결과 이야기 학교폭력 17 대한민국 자살률 기사 목숨 상황 아이 18 학교 문제 사람 친구 사실 사회 19 노동자 학교 사망 교사 목숨 시간 20 자살율 왕따 자살한 발견 사회 사랑
316 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - 채널구분 SNS 뉴스 블로그 년도 순위 자살 청소년 자살 자살 청소년 자살 자살 청소년 자살 2013년 1 자살 자살 자살 자살 자살 자살 2 사람 청소년 경찰 학교 사람 사람 3 자살한 국가 발견 학교폭력 사람들 학교 4 자살률 학교 목숨 학생 문제 사람들 5 1위 자살한 조사 조사 이유 문제 6 한국 사람 서울 경찰 행복 이유 7 노동자 엄마 유서 학생들 목숨 이야기 8 유서 세상 뉴스 청소년 세상 필요 9 죽음 여학생 사건 문제 죽음 아이들 10 학교 아이돌 신고 사건 아이들 친구 11 사실 학원 아파트 중학교 발견 학생 12 우울증 콘서트 기사 결과 사건 세상 13 청소년 한심 사망 유서 상황 시간 14 국가 티켓 시도 2011년 가족 아이 15 자살율 경외 내용 목숨 선택 모습 16 문제 어린애 정확 필요 학교 사회 17 경찰 대자연 가족 대상 경찰 학생들 18 희망 죽기 병원 뉴스 필요 공부 19 사회 자살률 문제 계획 사실 사랑 20 이유 공부 발생 경산 명복 행복 2. 3년간 왕따 담론 주요 빈출 키워드 년도 순위 SNS 뉴스 블로그 2011년 1 왕따 왕따 왕따 2 빵셔틀 학교 사람 3 친구 문제 학교 4 학교 뉴스 친구 5 학생 기사 사람들 6 사람 따돌림 사진 7 트위터 사람 문제 8 아이들 집단 트위터 9 애들 이유 사랑 10 자살 조사 이야기 11 세상 사건 모습 12 아이 사실 페이스북 13 오빠 방송 아이들 14 피해자 학생 미투데이 15 문제 학생들 이유 16 남자 결과 아이 17 대구 서울 친구들
부록 317 년도 순위 SNS 뉴스 블로그 18 학생들 사이 필요 19 교육 상황 싸이월드 20 MB 사진 출처 1 왕따 왕따 왕따 2 티아라 학교 사람 3 빵셔틀 학교폭력 학교 4 친구 문제 문제 5 화영 학생 친구 6 사람 따돌림 사람들 7 학교 학생들 빵셔틀 8 아이들 집단 아이들 9 학교폭력 서울 학교폭력 2012년 10 문제 뉴스 이유 11 이유 기사 아이 12 왕따설 폭력 이야기 13 자살 결과 따돌림 14 책임 교육 필요 15 학생 대상 사진 16 문재인 이유 모습 17 아이 사람 친구들 18 사람들 사진 집단 19 승리 피해 사랑 20 깍두기 내용 보기 1 왕따 왕따 왕따 2 빵셔틀 학교 학교 3 친구 방송 사람 4 학교 친구들 친구 5 사람 출연 트위터 6 애들 따돌림 문제 7 아이들 고백 페이스북 8 책임 친구 미투데이 9 이유 사진 보기 2013년 10 승리 문제 아이들 11 깍두기 학창시절 빵셔틀 12 기쁨 배우 아이 13 패배 학교폭력 친구들 14 김제동 학생들 사람들 15 사람들 당시 이유 16 세상 학생 확인 17 눈물 프로그램 싸이월드 18 민주당 이야기 학교폭력 19 문제 대상 이야기 20 탐라 이유 필요
318 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부록 4> 1. 인터넷 정신건상 척도 분석결과 <부표 4-1> 하고 있는 일에 잘 집중할 수 있습니까? (단위: %) 계 매우 매우 그렇다 아니다 그렇다 아니다 P 계 100.0(1,214) 17.1 62.3 19.3 1.3 성별 0.570 남자 100.0( 684) 18.3 62.1 18.3 1.3 여자 100.0( 530) 15.7 62.5 20.6 1.3 연령 0.648 10대 100.0( 30) 23.3 60.0 16.7 0.0 20대 100.0( 342) 19.3 60.5 19.0 1.2 30대 100.0( 536) 15.3 64.7 18.5 1.5 40대 100.0( 221) 14.5 62.4 21.7 1.4 50대 이상 100.0( 85) 24.7 54.1 20.0 1.2 최종학력 0.028** 초졸 100.0( 88) 23.9 63.6 9.1 3.4 중졸 100.0( 810) 17.0 63.1 18.9 1.0 고졸 100.0( 277) 14.1 6.03 24.2 1.4 대학교 졸업 이상 100.0( 39) 25.6 56.4 15.4 2.6 직업 0.020** 전문사무직 100.0( 535) 15.7 67.3 16.1 0.9 서비스판매직 100.0( 181) 14.4 61.9 21.5 2.2 생산직 100.0( 66) 15.2 65.2 18.2 1.5 농수축산 100.0( 13) 0.0 53.8 38.5 7.7 공무원 100.0( 36) 22.2 61.1 16.7 0.0 교사 및 교수 100.0( 29) 24.1 62.1 10.3 3.4 학생 100.0( 132) 18.2 56.8 23.5 1.5 무직 100.0( 142) 19.0 59.9 19.7 1.4 기타 100.0( 80) 27.5 42.5 30.0 0.0 혼인상태 0.239 미혼 100.0( 705) 15.7 61.3 21.7 1.3 기혼 100.0( 500) 19.2 63.6 15.8 1.4 기타 100.0( 9) 11.1 66.7 22.2 0.0 건강상태 0.000*** 매우건강 100.0( 145) 39.3 50.3 8.3 2.1 건강한 편 100.0( 498) 19.9 67.3 12.0 0.8 보통 100.0( 391) 9.0 66.5 23.5 1.0 건강하지 못함 100.0( 167) 10.2 48.5 38.9 2.4 매우 건강하지 못함 100.0( 13) 0.0 53.8 38.5 7.7 만성질환 유무 0.000*** 있음 100.0 (271) 11.8 55.4 29.5 3.3 없음 100.0( 804) 19.4 65.2 14.8 0.6 모름 100.0( 139) 14.4 59.0 25.2 1.4 주: *p<0.1, ** P<0.05, *** P<0.001
부록 319 <부표 4-2> 걱정 때문에 잠을 잘 못 잔적이 많습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 15.8 39.0 36.0 9.1 성별 0.001** 남자 100.0 ( 684) 12.1 40.8 36.8 10.2 여자 100.0 ( 530) 20.6 36.8 34.9 7.7 연령 0.010** 10대 100.0 ( 30) 16.7 30.0 33.3 20.0 20대 100.0 ( 342) 18.1 39.5 32.2 10.2 30대 100.0 ( 536) 15.9 36.8 38.6 8.8 40대 100.0 ( 221) 16.3 45.2 33.5 5.0 50대 이상 100.0 ( 85) 4.7 38.8 42.4 14.1 최종학력 0.002** 초졸 100.0 ( 88) 9.1 30.7 39.8 20.5 중졸 100.0 ( 810) 16.0 39.3 35.6 9.1 고졸 100.0 ( 277) 17.7 41.9 35.7 4.7 대학교 졸업 이상 100.0 ( 39) 12.8 33.3 38.5 15.4 직업 0.248 전문사무직 100.0 ( 535) 15.3 36.8 37.0 10.8 서비스판매직 100.0 ( 181) 15.5 44.2 37.0 3.3 생산직 100.0 ( 66) 13.6 42.4 36.4 7.6 농수축산 100.0 ( 13) 30.8 15.4 53.8 0.0 공무원 100.0 ( 36) 13.9 36.1 38.9 11.1 교사 및 교수 100.0 ( 29) 17.2 31.0 41.4 10.3 학생 100.0 ( 132) 15.2 39.6 31.1 15.2 무직 100.0 ( 142) 16.9 43.0 34.5 5.6 기타 100.0 ( 80) 18.8 41.3 31.3 8.8 혼인상태 0.100 미혼 100.0 ( 705) 17.6 40.0 33.9 8.5 기혼 100.0 ( 500) 13.0 37.6 39.2 10.2 기타 100.0 ( 9) 33.3 44.4 22.2 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 15.2 38.6 29.7 16.6 건강한 편 100.0 ( 498) 8.2 97.1 43.8 10.8 보통 100.0 ( 391) 17.6 41.9 34.8 5.6 건강하지 못함 100.0 ( 167) 32.3 40.1 22.2 5.4 매우 건강하지 못함 100.0 ( 13) 46.2 15.4 23.1 15.4 만성질환 유무 0.000*** 있음 100.0 (271) 20.7 41.7 29.9 7.7 없음 100.0 ( 804) 12.4 37.8 39.9 9.8 모름 100.0 ( 139) 25.9 41.0 25.2 7.9 주: *p<0.1, ** P<0.05, *** P<0.001
320 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-3> 자신이 여러 면에서 쓸모 있는 역할을 잘 하고 있다고 느꼈습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 12.8 55.4 27.8 4.1 성별 0.006*** 남자 100.0 ( 684) 14.9 56.0 262. 2.9 여자 100.0 ( 530) 10.0 54.5 29.8 5.7 연령 0.148 10대 100.0 ( 30) 23.3 56.7 20.0 0.0 20대 100.0 ( 342) 14.3 56.4 25.7 3.5 30대 100.0 ( 536) 121. 56.7 27.4 3.7 40대 100.0 ( 221) 8.6 52.0 33.5 5.9 50대 이상 100.0 ( 85) 17.6 50.6 25.9 5.9 최종학력 0.000*** 초졸 100.0 ( 88) 22.7 63.6 12.5 1.1 중졸 100.0 ( 810) 12.3 56.8 27.0 3.8 고졸 100.0 ( 277) 9.7 49.8 35.0 5.4 대학교 졸업 이상 100.0 ( 39) 20.5 46.2 25.6 7.7 직업 0.001** 전문사무직 100.0 ( 535) 13.3 58.7 24.9 3.2 서비스판매직 100.0 ( 181) 12.2 50.3 32.6 5.0 생산직 100.0 ( 66) 9.1 59.1 25.8 6.1 농수축산 100.0 ( 13) 7.7 46.2 38.5 7.7 공무원 100.0 ( 36) 22.2 58.3 19.4 0.0 교사 및 교수 100.0 ( 29) 20.7 65.5 13.8 0.0 학생 100.0 ( 132) 16.7 54.5 27.3 1.5 무직 100.0 ( 142) 7.7 46.5 34.5 11.3 기타 100.0 ( 80) 10.0 55.0 33.8 1.3 혼인상태 0.078 미혼 100.0 ( 705) 11.9 52.8 30.6 4.7 기혼 100.0 ( 500) 14.2 58.8 23.6 3.4 기타 100.0 ( 9) 0.0 66.7 33.3 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 31.7 47.6 17.9 2.8 건강한 편 100.0 ( 498) 12.9 66.1 18.5 2.6 보통 100.0 ( 391) 8.2 53.5 35.0 3.3 건강하지 못함 100.0 ( 167) 7.2 38.9 45.5 8.4 매우 건강하지 못함 100.0 ( 13) 7.7 0.0 46.2 46.2 만성질환 유무 0.000*** 있음 100.0 (271) 12.2 45.8 35.4 6.6 없음 100.0 ( 804) 13.6 58.7 24.9 2.9 모름 100.0 ( 139) 9.4 54.7 29.5 6.5 주: *p<0.1, ** P<0.05, *** P<0.001
부록 321 <부표 4-4> 매사에 올바른 결정을 잘 내릴 수 있었습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 9.8 54.9 32.2 3.0 성별 0.084* 남자 100.0 ( 684) 11.4 55.6 30.0 3.1 여자 100.0 ( 530) 7.7 54.2 35.1 3.0 연령 0.029** 10대 100.0 ( 30) 13.3 46.7 40.0 0.0 20대 100.0 ( 342) 12.0 58.5 26.9 2.6 30대 100.0 ( 536) 8.2 54.1 34.3 3.4 40대 100.0 ( 221) 7.2 51.6 38.5 2.7 50대 이상 100.0 ( 85) 16.5 57.6 21.2 4.7 최종학력 0.001** 초졸 100.0 ( 88) 20.5 60.2 18.2 1.1 중졸 100.0 ( 810) 8.9 56.7 31.2 3.2 고졸 100.0 ( 277) 8.3 49.5 39.4 2.9 대학교 졸업 이상 100.0 ( 39) 15.4 46.2 33.3 5.1 직업 0.128 전문사무직 100.0 ( 535) 9.0 57.4 30.5 3.2 서비스판매직 100.0 ( 181) 6.1 52.5 38.1 3.3 생산직 100.0 ( 66) 7.6 53.0 34.8 4.5 농수축산 100.0 ( 13) 7.7 61.5 23.1 7.7 공무원 100.0 ( 36) 16.7 63.9 19.4 0.0 교사 및 교수 100.0 ( 29) 24.1 55.2 17.2 3.4 학생 100.0 ( 132) 13.6 53.0 31.1 2.3 무직 100.0 ( 142) 7.0 53.5 35.9 3.5 기타 100.0 ( 80) 16.3 46.3 36.3 1.3 혼인상태 0.043** 미혼 100.0 ( 705) 8.9 52.9 34.8 3.4 기혼 100.0 ( 500) 11.2 58.2 28.2 2.4 기타 100.0 ( 9) 0.0 33.3 55.6 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 29.0 53.1 14.5 3.4 건강한 편 100.0 ( 498) 10.4 62.0 24.9 2.6 보통 100.0 ( 391) 4.3 55.2 38.6 1.8 건강하지 못함 100.0 ( 167) 3.6 38.9 52.1 5.4 매우 건강하지 못함 100.0 ( 13) 15.4 0.0 61.5 23.1 만성질환 유무 0.001** 있음 100.0 (271) 6.6 51.3 37.6 4.4 없음 100.0 ( 804) 11.6 57.0 29.4 2.1 모름 100.0 ( 139) 5.8 50.4 38.1 5.8 주: *p<0.1, ** P<0.05, *** P<0.001
322 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-5> 계속해서 긴장감을 느낀 적이 자주 있었습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 12.9 434.4 38.0 5.7 성별 0.296 남자 100.0 ( 684) 11.4 43.4 39.2 6.0 여자 100.0 ( 530) 14.9 43.4 36.4 5.3 연령 0.658 10대 100.0 ( 30) 20.0 40.0 33.3 6.7 20대 100.0 ( 342) 13.2 46.5 34.8 5.6 30대 100.0 ( 536) 13.6 41.6 39.2 5.6 40대 100.0 ( 221) 11.8 42.1 41.6 4.5 50대 이상 100.0 ( 85) 8.2 47.1 35.3 9.4 최종학력 0.205 초졸 100.0 ( 88) 8.0 38.6 42.0 11.4 중졸 100.0 ( 810) 13.5 42.6 39.1 4.8 고졸 100.0 ( 277) 13.0 47.3 33.2 6.5 대학교 졸업 이상 100.0 ( 39) 12.8 43.6 38.5 5.1 직업 0.995 전문사무직 100.0 ( 535) 13.5 42.1 38.9 5.6 서비스판매직 100.0 ( 181) 13.3 47.5 34.8 4.4 생산직 100.0 ( 66) 7.6 43.9 42.4 6.1 농수축산 100.0 ( 13) 7.7 46.2 38.5 7.7 공무원 100.0 ( 36) 16.7 44.4 30.6 8.3 교사 및 교수 100.0 ( 29) 20.7 37.9 34.5 6.9 학생 100.0 ( 132) 14.4 42.4 37.1 6.1 무직 100.0 ( 142) 12.7 43.0 38.7 5.6 기타 100.0 ( 80) 7.5 46.3 40.0 6.3 혼인상태 0.049** 미혼 100.0 ( 705) 15.0 44.4 35.3 5.2 기혼 100.0 ( 500) 10.0 41.6 42.0 6.4 기타 100.0 ( 9) 11.1 66.7 22.2 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 13.8 33.8 39.3 13.1 건강한 편 100.0 ( 498) 10.2 39.8 44.6 5.4 보통 100.0 ( 391) 10.7 50.4 34.5 4.3 건강하지 못함 100.0 ( 167) 23.4 46.7 26.9 3.0 매우 건강하지 못함 100.0 ( 13) 38.5 38.5 15.4 7.7 만성질환 유무 0.000*** 있음 100.0 (271) 18.5 46.9 30.3 4.4 없음 100.0 ( 804) 10.3 40.7 42.9 6.1 모름 100.0 ( 139) 17.3 52.5 24.5 5.8 주: *p<0.1, ** P<0.05, *** P<0.001
부록 323 <부표 4-6> 어려움을 극복 할 수 없다고 느낀 적이 있습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 11.4 46.8 34.1 7.7 성별 0.060* 남자 100.0 ( 684) 9.4 46.8 35.4 8.5 여자 100.0 ( 530) 14.0 46.8 32.5 6.8 연령 0.289 10대 100.0 ( 30) 16.7 50.0 26.7 6.7 20대 100.0 ( 342) 11.7 43.3 34.2 10.8 30대 100.0 ( 536) 10.3 47.0 35.3 7.5 40대 100.0 ( 221) 12.7 52.5 30.3 4.5 50대 이상 100.0 ( 85) 11.8 43.5 38.8 5.9 최종학력 0.006** 초졸 100.0 ( 88) 3.4 33.0 52.3 11.4 중졸 100.0 ( 810) 11.6 47.4 33.6 7.4 고졸 100.0 ( 277) 12.6 48.0 31.8 7.6 대학교 졸업 이상 100.0 ( 39) 15.4 56.4 20.5 7.7 직업 0.473 전문사무직 100.0 ( 535) 10.8 47.5 33.6 8.0 서비스판매직 100.0 ( 181) 13.3 52.5 30.9 3.3 생산직 100.0 ( 66) 10.6 43.9 37.9 7.6 농수축산 100.0 ( 13) 7.7 53.8 38.5 0.0 공무원 100.0 ( 36) 8.3 36.1 44.4 11.1 교사 및 교수 100.0 ( 29) 10.3 31.0 41.4 17.2 학생 100.0 ( 132) 11.4 40.9 34.8 12.9 무직 100.0 ( 142) 12.0 49.3 32.4 6.3 기타 100.0 ( 80) 12.5 46.3 35.0 6.3 혼인상태 0.002** 미혼 100.0 ( 705) 12.3 49.6 30.1 7.9 기혼 100.0 ( 500) 10.2 42.0 40.2 7.6 기타 100.0 ( 9) 0.0 88.9 11.1 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 16.6 35.9 34.5 13.1 건강한 편 100.0 ( 498) 6.4 44.4 39.0 10.2 보통 100.0 ( 391) 10.2 54.5 30.9 4.3 건강하지 못함 100.0 ( 167) 21.0 47.3 28.1 3.6 매우 건강하지 못함 100.0 ( 13) 53.8 23.1 15.4 7.7 만성질환 유무 0.000*** 있음 100.0 (271) 16.2 55.7 24.4 3.7 없음 100.0 ( 804) 9.3 43.2 38.3 9.2 모름 100.0 ( 139) 13.7 50.4 28.8 7.2 주: *p<0.1, ** P<0.05, *** P<0.001
324 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-7> 일상적인 활동을 즐겁게 할 수 있었습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 15.2 58.8 22.5 3.5 성별 0.389 남자 100.0 ( 684) 14.8 59.5 23.0 2.8 여자 100.0 ( 530) 15.7 57.9 21.9 4.5 연령 0.000*** 10대 100.0 ( 30) 23.3 63.3 13.3 0.0 20대 100.0 ( 342) 20.8 62.0 14.3 2.9 30대 100.0 ( 536) 13.4 57.6 24.8 4.1 40대 100.0 ( 221) 10.4 56.6 30.8 2.3 50대 이상 100.0 ( 85) 12.9 57.6 22.4 7.1 최종학력 0.004** 초졸 100.0 ( 88) 27.3 54.5 15.9 2.3 중졸 100.0 ( 810) 15.8 60.0 20.7 3.5 고졸 100.0 ( 277) 10.5 56.3 28.9 4.3 대학교 졸업 이상 100.0 ( 39) 7.7 61.5 28.2 2.6 직업 0.154 전문사무직 100.0 ( 535) 14.2 62.8 19.3 3.7 서비스판매직 100.0 ( 181) 13.3 55.8 26.0 5.0 생산직 100.0 ( 66) 10.6 57.6 27.3 4.5 농수축산 100.0 ( 13) 7.7 69.2 23.1 0.0 공무원 100.0 ( 36) 27.8 50.0 19.4 2.8 교사 및 교수 100.0 ( 29) 31.0 55.2 13.8 0.0 학생 100.0 ( 132) 18.9 58.3 21.2 1.5 무직 100.0 ( 142) 16.9 50.7 28.9 3.5 기타 100.0 ( 80) 10.0 58.8 27.5 3.8 혼인상태 0.485 미혼 100.0 ( 705) 16.0 57.4 23.1 3.4 기혼 100.0 ( 500) 14.2 60.8 21.2 3.8 기타 100.0 ( 9) 0.0 55.6 44.4 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 30.3 54.5 12.4 2.8 건강한 편 100.0 ( 498) 17.1 66.7 12.9 3.4 보통 100.0 ( 391) 10.2 566.8 29.4 3.6 건강하지 못함 100.0 ( 167) 7.8 47.9 40.7 3.6 매우 건강하지 못함 100.0 ( 13) 15.4 7.7 61.5 15.4 만성질환 유무 0.000*** 있음 100.0 (271) 15.5 49.8 31.7 3.0 없음 100.0 ( 804) 16.0 63.1 17.8 3.1 모름 100.0 ( 139) 9.4 51.8 31.7 7.2 주: *p<0.1, ** P<0.05, *** P<0.001
부록 325 <부표 4-8> 문제가 생기면 그것을 피하지 않고 맞서서 해결하려고 하였습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 14.1 50.2 30.9 4.8 성별 0.001** 남자 100.0 ( 684) 15.5 53.7 27.0 3.8 여자 100.0 ( 530) 12.3 45.8 35.8 6.0 연령 0.185 10대 100.0 ( 30) 16.7 36.7 46.7 0.0 20대 100.0 ( 342) 17.0 49.7 27.5 5.8 30대 100.0 ( 536) 11.9 53.2 30.6 4.3 40대 100.0 ( 221) 13.6 45.2 36.2 5.0 50대 이상 100.0 ( 85) 16.5 51.8 27.1 4.7 최종학력 0.009** 초졸 100.0 ( 88) 20.5 56.8 20.5 2.3 중졸 100.0 ( 810) 14.0 52.2 29.4 4.4 고졸 100.0 ( 277) 11.9 44.4 36.8 6.9 대학교 졸업 이상 100.0 ( 39) 17.9 35.9 43.6 2.6 직업 0.154 전문사무직 100.0 ( 535) 13.5 53.1 28.0 5.4 서비스판매직 100.0 ( 181) 9.4 51.9 31.5 7.2 생산직 100.0 ( 66) 15.2 51.5 30.3 3.0 농수축산 100.0 ( 13) 7.7 61.5 30.8 0.0 공무원 100.0 ( 36) 19.4 61.1 19.4 0.0 교사 및 교수 100.0 ( 29) 20.7 55.2 24.1 0.0 학생 100.0 ( 132) 19.7 43.9 33.3 3.0 무직 100.0 ( 142) 12.7 43.7 39.4 4.2 기타 100.0 ( 80) 17.5 40.0 37.5 5.0 혼인상태 0.054* 미혼 100.0 ( 705) 12.8 48.9 33.3 5.0 기혼 100.0 ( 500) 16.0 52.2 27.6 4.2 기타 100.0 ( 9) 11.1 44.4 22.2 22.2 건강상태 0.000*** 매우건강 100.0 ( 145) 33.8 47.6 14.5 4.1 건강한 편 100.0 ( 498) 14.3 56.4 26.7 2.6 보통 100.0 ( 391) 8.7 49.9 36.1 5.4 건강하지 못함 100.0 ( 167) 9.6 37.1 44.3 9.0 매우 건강하지 못함 100.0 ( 13) 7.7 23.1 46.2 23.1 만성질환 유무 0.001** 있음 100.0 (271) 11.8 43.2 38.4 6.6 없음 100.0 ( 804) 15.7 52.7 27.9 3.7 모름 100.0 ( 139) 9.4 49.6 33.8 7.2 주: *p<0.1, ** P<0.05, *** P<0.001
326 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-9> 우울감과 불행감을 느낀 적이 많습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 14.5 39.5 35.6 10.5 성별 0.000*** 남자 100.0 ( 684) 12.1 35.8 40.4 11.7 여자 100.0 ( 530) 17.5 44.2 29.4 8.9 연령 0.078* 10대 100.0 ( 30) 16.7 40.0 20.0 23.3 20대 100.0 ( 342) 17.8 36.0 34.8 11.4 30대 100.0 ( 536) 13.2 40.1 37.9 8.8 40대 100.0 ( 221) 13.6 39.8 36.7 10.0 50대 이상 100.0 ( 85) 10.6 48.2 27.1 14.1 최종학력 0.006** 초졸 100.0 ( 88) 6.8 35.2 40.9 17.0 중졸 100.0 ( 810) 13.8 38.9 37.4 9.9 고졸 100.0 ( 277) 19.1 40.8 31.0 9.0 대학교 졸업 이상 100.0 ( 39) 12.8 51.3 17.9 17.9 직업 0.764 전문사무직 100.0 ( 535) 13.3 38.3 36.1 12.3 서비스판매직 100.0 ( 181) 13.3 44.8 35.4 6.6 생산직 100.0 ( 66) 16.7 39.4 34.8 9.1 농수축산 100.0 ( 13) 0.0 46.2 38.5 15.4 공무원 100.0 ( 36) 11.1 33.3 44.4 11.1 교사 및 교수 100.0 ( 29) 13.8 41.4 31.0 13.8 학생 100.0 ( 132) 17.4 34.8 34.8 12.9 무직 100.0 ( 142) 17.6 43.0 33.8 5.6 기타 100.0 ( 80) 17.5 37.5 35.0 10.0 혼인상태 0.046** 미혼 100.0 ( 705) 16.3 40.7 33.9 9.1 기혼 100.0 ( 500) 12.0 37.2 38.2 12.6 기타 100.0 ( 9) 11.1 66.7 22.2 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 10.3 31.0 37.9 20.7 건강한 편 100.0 ( 498) 8.2 33.7 45.6 12.4 보통 100.0 ( 391) 16.1 48.6 29.4 5.9 건강하지 못함 100.0 ( 167) 30.5 43.7 19.2 6.6 매우 건강하지 못함 100.0 ( 13) 46.2 23.1 23.1 7.7 만성질환 유무 0.000*** 있음 100.0 (271) 20.7 44.7 25.1 10.0 없음 100.0 ( 804) 11.3 37.1 40.5 11.1 모름 100.0 ( 139) 20.9 43.9 27.3 7.9 주: *p<0.1, ** P<0.05, *** P<0.001
부록 327 <부표 4-10> 자신감이 없어졌다고 느꼈습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 16.0 45.6 30.9 7.6 성별 0.001** 남자 100.0 ( 684) 12.7 45.0 33.9 8.3 여자 100.0 ( 530) 20.2 46.2 27.0 6.6 연령 0.004** 10대 100.0 ( 30) 20.0 46.7 20.0 13.3 20대 100.0 ( 342) 20.8 41.8 29.5 7.9 30대 100.0 ( 536) 13.6 45.7 34.0 6.7 40대 100.0 ( 221) 15.8 52.0 27.1 5.0 50대 이상 100.0 ( 85) 10.6 42.4 30.6 16.5 최종학력 0.011** 초졸 100.0 ( 88) 6.8 38.6 40.9 13.6 중졸 100.0 ( 810) 15.1 46.8 31.0 7.2 고졸 100.0 ( 277) 20.2 45.5 27.8 6.5 대학교 졸업 이상 100.0 ( 39) 25.6 35.9 28.2 10.3 직업 0.008** 전문사무직 100.0 ( 535) 12.7 44.9 34.2 8.2 서비스판매직 100.0 ( 181) 14.9 55.2 24.9 5.0 생산직 100.0 ( 66) 13.6 40.9 33.3 12.1 농수축산 100.0 ( 13) 15.4 53.8 30.8 0.0 공무원 100.0 ( 36) 22.2 22.2 44.4 11.1 교사 및 교수 100.0 ( 29) 6.9 51.7 24.1 17.2 학생 100.0 ( 132) 21.2 40.9 29.5 8.3 무직 100.0 ( 142) 21.8 47.2 25.4 5.6 기타 100.0 ( 80) 23.8 43.8 28.8 3.8 혼인상태 0.003** 미혼 100.0 ( 705) 17.7 48.1 28.1 6.1 기혼 100.0 ( 500) 13.8 41.4 35.0 9.8 기타 100.0 ( 9) 0.0 77.8 22.2 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 15.2 33.8 35.9 15.2 건강한 편 100.0 ( 498) 10.4 42.0 38.4 9.2 보통 100.0 ( 391) 15.3 54.5 26.1 4.1 건강하지 못함 100.0 ( 167) 31.1 47.3 14.7 4.2 매우 건강하지 못함 100.0 ( 13) 61.5 23.1 7.7 7.7 만성질환 유무 0.000*** 있음 100.0 (271) 19.2 52.8 22.1 5.9 없음 100.0 ( 804) 13.3 42.5 35.6 8.6 모름 100.0 ( 139) 25.2 48.9 20.9 5.0 주: *p<0.1, ** P<0.05, *** P<0.001
328 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-11> 그 전과 같은 정도로 외출을 하였습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 14.3 47.0 30.7 8.0 성별 0.004** 남자 100.0 ( 684) 14.3 49.3 30.8 5.6 여자 100.0 ( 530) 14.2 44.2 30.6 11.1 연령 0.155 10대 100.0 ( 30) 20.0 50.0 20.0 10.0 20대 100.0 ( 342) 16.7 47.1 28.1 8.2 30대 100.0 ( 536) 11.9 47.0 33.4 7.6 40대 100.0 ( 221) 11.8 50.2 29.0 9.0 50대 이상 100.0 ( 85) 23.5 37.6 32.9 5.9 최종학력 0.008** 초졸 100.0 ( 88) 23.9 47.7 22.7 5.7 중졸 100.0 ( 810) 13.1 49.4 30.5 7.0 고졸 100.0 ( 277) 14.4 40.4 35.0 10.1 대학교 졸업 이상 100.0 ( 39) 15.4 43.6 23.1 17.9 직업 0.055* 전문사무직 100.0 ( 535) 14.2 51.2 27.9 6.7 서비스판매직 100.0 ( 181) 14.9 39.8 39.2 6.1 생산직 100.0 ( 66) 12.1 43.9 36.4 7.6 농수축산 100.0 ( 13) 7.7 30.8 46.2 15.4 공무원 100.0 ( 36) 13.9 63.9 16.7 5.6 교사 및 교수 100.0 ( 29) 13.8 51.7 31.0 3.4 학생 100.0 ( 132) 19.7 38.6 32.6 9.1 무직 100.0 ( 142) 12.0 43.0 31.0 14.1 기타 100.0 ( 80) 11.3 52.5 26.3 10.0 혼인상태 0.037** 미혼 100.0 ( 705) 11.8 47.0 32.2 9.1 기혼 100.0 ( 500) 18.0 47.0 28.6 6.4 기타 100.0 ( 9) 0.0 55.6 33.3 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 24.1 51.7 17.2 6.9 건강한 편 100.0 ( 498) 15.9 52.6 26.5 5.0 보통 100.0 ( 391) 10.0 47.8 35.3 6.9 건강하지 못함 100.0 ( 167) 11.4 27.5 45.5 15.6 매우 건강하지 못함 100.0 ( 13) 7.7 7.7 15.4 69.2 만성질환 유무 0.063* 있음 100.0 (271) 12.5 42.4 33.9 11.1 없음 100.0 ( 804) 14.9 48.6 30.1 6.3 모름 100.0 ( 139) 13.7 46.8 28.1 11.5 주: *p<0.1, ** P<0.05, *** P<0.001
부록 329 <부표 4-12> 인생이 절망적이라고 느낀 적이 있습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 11.9 39.5 35.1 13.5 성별 0.004*** 남자 100.0 ( 684) 10.1 36.8 38.2 14.9 여자 100.0 ( 530) 14.2 43.0 31.1 11.7 연령 0.125 10대 100.0 ( 30) 6.7 43.3 26.7 23.3 20대 100.0 ( 342) 14.3 36.5 32.5 16.7 30대 100.0 ( 536) 11.2 41.6 35.6 11.6 40대 100.0 ( 221) 12.2 36.2 40.3 11.3 50대 이상 100.0 ( 85) 7.1 45.9 31.8 15.3 최종학력 0.022** 초졸 100.0 ( 88) 10.2 29.5 38.6 21.6 중졸 100.0 ( 810) 11.1 38.1 37.3 13.5 고졸 100.0 ( 277) 14.4 45.1 29.2 11.2 대학교 졸업 이상 100.0 ( 39) 12.8 51.3 23.1 12.8 직업 0.001** 전문사무직 100.0 ( 535) 10.3 35.9 39.3 14.6 서비스판매직 100.0 ( 181) 12.2 50.3 28.7 8.8 생산직 100.0 ( 66) 10.6 42.4 34.8 12.1 농수축산 100.0 ( 13) 15.4 53.8 30.8 0.0 공무원 100.0 ( 36) 19.4 22.2 41.7 16.7 교사 및 교수 100.0 ( 29) 3.4 48.3 27.6 20.7 학생 100.0 ( 132) 8.3 36.4 32.6 22.7 무직 100.0 ( 142) 19.0 42.3 31.0 7.7 기타 100.0 ( 80) 15.0 40.0 33.8 11.3 혼인상태 0.002** 미혼 100.0 ( 705) 12.9 42.7 32.8 11.6 기혼 100.0 ( 500) 10.4 34.4 38.8 16.4 기타 100.0 ( 9) 11.1 77.8 11.1 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 11.0 31.7 35.9 21.4 건강한 편 100.0 ( 498) 6.0 33.3. 42.6 18.1 보통 100.0 ( 391) 14.6 47.3 29.9 8.2 건강하지 못함 100.0 ( 167) 21.0 46.7 26.3 6.0 매우 건강하지 못함 100.0 ( 13) 46.2 38.5 7.7 7.7 만성질환 유무 0.000*** 있음 100.0 (271) 14.0 47.6 29.2 9.2 없음 100.0 ( 804) 9.8 36.2 38.2 15.8 모름 100.0 ( 139) 19.4 43.2 28.8 8.6 주: *p<0.1, ** P<0.05, *** P<0.001
330 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-13> 신경이 쓰여서 힘들게 느껴진 일이 많았습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 14.4 47.4 31.1 7.1 성별 0.062* 남자 100.0 ( 684) 13.2 45.5 33.6 7.7 여자 100.0 ( 530) 16.0 50.0 27.7 6.2 연령 0.639 10대 100.0 ( 30) 16.7 50.0 23.3 10.0 20대 100.0 ( 342) 13.7 48.8 29.8 7.6 30대 100.0 ( 536) 15.9 44.6 33.4 6.2 40대 100.0 ( 221) 13.6 49.3 30.3 6.8 50대 이상 100.0 ( 85) 9.4 54.1 25.9 10.6 최종학력 0.010** 초졸 100.0 ( 88) 5.7 39.8 40.9 13.6 중졸 100.0 ( 810) 14.1 47.7 31.5 6.8 고졸 100.0 ( 277) 17.7 47.7 28.9 5.8 대학교 졸업 이상 100.0 ( 39) 17.9 59.0 15.4 7.7 직업 0.187** 전문사무직 100.0 ( 535) 13.8 45.6 32.1 8.4 서비스판매직 100.0 ( 181) 11.6 51.9 30.9 5.5 생산직 100.0 ( 66) 19.7 45.5 31.8 3.0 농수축산 100.0 ( 13) 7.7 46.2 46.2 0.0 공무원 100.0 ( 36) 22.2 27.8 44.4 5.6 교사 및 교수 100.0 ( 29) 24.1 37.9 24.1 13.8 학생 100.0 ( 132) 13.6 46.2 30.3 9.8 무직 100.0 ( 142) 14.8 55.6 23.9 5.6 기타 100.0 ( 80) 15.0 51.3 31.3 2.5 혼인상태 0.016 미혼 100.0 ( 705) 16.7 47.9 29.5 5.8 기혼 100.0 ( 500) 11.4 46.2 33.6 8.8 기타 100.0 ( 9) 0.0 77.8 11.1 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 11.7 41.4 31.7 15.2 건강한 편 100.0 ( 498) 8.2 44.0 39.4 8.4 보통 100.0 ( 391) 16.1 54.2 25.1 4.6 건강하지 못함 100.0 ( 167) 29.3 47.9 20.4 2.4 매우 건강하지 못함 100.0 ( 13) 38.5 38.5 23.1 0.0 만성질환 유무 0.000*** 있음 100.0 (271) 17.7 52.4 24.0 5.9 없음 100.0 ( 804) 11.9 45.1 34.6 8.3 모름 100.0 ( 139) 22.3 51.1 24.5 2.2 주: *p<0.1, ** P<0.05, *** P<0.001
부록 331 <부표 4-14> 밤에 잠을 잘 못 이루거나 많이 설치곤 합니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 11.9 33.9 41.0 13.2 성별 0.076* 남자 100.0 ( 684) 9.8 34.8 42.0 13.5 여자 100.0 ( 530) 14.7 32.6 39.8 12.8 연령 0.041** 10대 100.0 ( 30) 16.7 23.3 40.0 20.0 20대 100.0 ( 342) 11.1 29.8 41.8 17.3 30대 100.0 ( 536) 10.8 33.4 43.5 12.3 40대 100.0 ( 221) 15.4 39.4 36.2 9.0 50대 이상 100.0 ( 85) 11.8 42.4 35.3 10.6 최종학력 0.020** 초졸 100.0 ( 88) 5.7 27.3 44.3 22.7 중졸 100.0 ( 810) 11.1 33.7 42.2 13.0 고졸 100.0 ( 277) 15.5 35.0 38.3 11.2 대학교 졸업 이상 100.0 ( 39) 17.9 43.6 28.2 10.3 직업 0.291 전문사무직 100.0 ( 535) 10.1 33.1 42.4 14.4 서비스판매직 100.0 ( 181) 14.9 32.6 38.7 13.8 생산직 100.0 ( 66) 10.6 40.9 37.9 10.6 농수축산 100.0 ( 13) 0.0 46.2 53.8 0.0 공무원 100.0 ( 36) 8.3 22.2 61.1 8.3 교사 및 교수 100.0 ( 29) 17.2 31.0 41.4 10.3 학생 100.0 ( 132) 12.1 31.1 39.4 17.4 무직 100.0 ( 142) 15.5 33.8 40.1 10.6 기타 100.0 ( 80) 13.8 45.0 32.5 8.8 혼인상태 0.779 미혼 100.0 ( 705) 12.6 33.0 41.6 12.8 기혼 100.0 ( 500) 11.0 34.6 40.6 13.8 기타 100.0 ( 9) 11.1 55.6 22.2 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 9.7 31.7 38.6 20.0 건강한 편 100.0 ( 498) 6.2 30.5 45.2 18.1 보통 100.0 ( 391) 13.6 36.3 42.2 7.9 건강하지 못함 100.0 ( 167) 25.1 40.1 29.3 5.4 매우 건강하지 못함 100.0 ( 13) 38.5 30.8 23.1 7.7 만성질환 유무 0.000*** 있음 100.0 (271) 17.7 40.2 33.2 8.9 없음 100.0 ( 804) 9.1 30.7 45.1 15.0 모름 100.0 ( 139) 17.3 39.6 32.4 10.8 주: *p<0.1, ** P<0.05, *** P<0.001
332 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-15> 어떤 일을 할 때 대부분의 다른 사람들이 하는 만큼 그 일을 잘 처리할 수 있었습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 14.9 61.2 21.2 2.7 성별 0.133 남자 100.0 ( 684) 17.0 59.4 21.2 2.5 여자 100.0 ( 530) 12.3 63.6 21.1 3.0 연령 0.038** 10대 100.0 ( 30) 20.0 70.0 10.0 0.0 20대 100.0 ( 342) 18.4 63.5 15.8 2.3 30대 100.0 ( 536) 14.0 59.7 22.9 3.4 40대 100.0 ( 221) 11.3 63.8 22.6 2.3 50대 이상 100.0 ( 85) 14.1 51.8 31.8 2.4 최종학력 0.001*** 초졸 100.0 ( 88) 31.8 50.0 15.9 2.3 중졸 100.0 ( 810) 13.7 63.8 20.1 2.3 고졸 100.0 ( 277) 13.7 57.0 25.3 4.0 대학교 졸업 이상 100.0 ( 39) 10.3 61.5 25.6 2.6 직업 0.000*** 전문사무직 100.0 ( 535) 16.1 66.0 16.3 1.7 서비스판매직 100.0 ( 181) 13.8 54.7 25.4 6.1 생산직 100.0 ( 66) 12.1 54.5 30.3 3.0 농수축산 100.0 ( 13) 7.7 46.2 38.5 7.7 공무원 100.0 ( 36) 16.7 66.7 13.9 2.8 교사 및 교수 100.0 ( 29) 17.2 55.2 27.6 0.0 학생 100.0 ( 132) 20.5 63.6 14.4 1.5 무직 100.0 ( 142) 7.0 57.0 31.7 4.2 기타 100.0 ( 80) 16.3 55.0 27.5 1.3 혼인상태 0.297 미혼 100.0 ( 705) 14.3 61.1 21.6 3.0 기혼 100.0 ( 500) 15.8 61.8 20.2 2.2 기타 100.0 ( 9) 11.1 33.3 44.4 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 29.7 49.7 18.6 2.1 건강한 편 100.0 ( 498) 15.9 65.9 15.7 2.6 보통 100.0 ( 391) 9.7 65.7 22.3 2.3 건강하지 못함 100.0 ( 167) 12.6 48.5 35.3 3.6 매우 건강하지 못함 100.0 ( 13) 0.0 38.5 46.2 15.4 만성질환 유무 0.010** 있음 100.0 (271) 12.9 56.1 26.6 4.4 없음 100.0 ( 804) 16.2 63.2 18.4 2.2 모름 100.0 ( 139) 11.5 59.7 26.6 2.2 주: *p<0.1, ** P<0.05, *** P<0.001
부록 333 <부표 4-16> 당신과 가까운 사람들에게 따뜻함과 애정을 느낄 수 있었습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 18.5 54.5 23.3 3.7 성별 0.803 남자 100.0 ( 684) 18.3 54.2 24.1 3.4 여자 100.0 ( 530) 18.7 54.9 22.3 4.2 연령 0.003** 10대 100.0 ( 30) 33.3 50.0 16.7 0.0 20대 100.0 ( 342) 22.8 55.0 17.8 4.4 30대 100.0 ( 536) 16.4 57.1 23.1 3.4 40대 100.0 ( 221) 12.7 51.1 32.1 4.1 50대 이상 100.0 ( 85) 23.5 47.1 25.9 3.5 최종학력 0.076* 초졸 100.0 ( 88) 23.9 61.4 12.5 2.3 중졸 100.0 ( 810) 17.3 56.2 22.8 3.7 고졸 100.0 ( 277) 19.5 47.7 28.9 4.0 대학교 졸업 이상 100.0 ( 39) 23.1 53.8 17.9 5.1 직업 0.054* 전문사무직 100.0 ( 535) 20.2 55.5 21.1 3.2 서비스판매직 100.0 ( 181) 16.0 51.4 29.3 3.3 생산직 100.0 ( 66) 18.2 42.4 36.4 3.0 농수축산 100.0 ( 13) 15.4 61.5 15.4 7.7 공무원 100.0 ( 36) 30.6 50.0 11.1 8.3 교사 및 교수 100.0 ( 29) 10.3 65.5 24.1 0.0 학생 100.0 ( 132) 24.2 52.3 18.2 5.3 무직 100.0 ( 142) 11.3 57.0 27.5 4.2 기타 100.0 ( 80) 13.8 61.3 21.3 3.8 혼인상태 0.346 미혼 100.0 ( 705) 17.7 53.8 24.3 4.3 기혼 100.0 ( 500) 19.8 55.6 21.6 3.0 기타 100.0 ( 9) 0.0 55.6 44.4 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 29.7 47.6 16.6 6.2 건강한 편 100.0 ( 498) 20.5 60.8 16.7 2.0 보통 100.0 ( 391) 13.0 55.8 28.1 3.1 건강하지 못함 100.0 ( 167) 15.6 42.5 35.9 6.0 매우 건강하지 못함 100.0 ( 13) 15.4 7.7 46.2 30.8 만성질환 유무 0.002** 있음 100.0 (271) 15.1 48.0 31.4 5.5 없음 100.0 ( 804) 19.3 57.5 20.0 3.2 모름 100.0 ( 139) 20.1 50.4 26.6 2.9 주: *p<0.1, ** P<0.05, *** P<0.001
334 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-17> 예정보다 오래 인터넷에 접속한 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 11.1 25.5 28.3 25.4 9.8 성별 0.05** 남자 100.0 ( 684) 10.8 28.2 26.8 26.6 7.6 여자 100.0 ( 530) 11.5 21.9 30.2 23.8 12.6 연령 0.115 10대 100.0 ( 30) 13.3 26.7 16.7 30.0 13.3 20대 100.0 ( 342) 10.2 22.2 26.3 30.4 10.8 30대 100.0 ( 536) 10.1 26.3 29.9 24.1 9.7 40대 100.0 ( 221) 10.9 27.1 29.4 24.4 8.1 50대 이상 100.0 ( 85) 21.2 28.2 27.1 14.1 9.4 최종학력 0.133 초졸 100.0 ( 88) 13.6 27.3 29.5 17.0 12.5 중졸 100.0 ( 810) 10.2 25.7 29.1 26.7 8.3 고졸 100.0 ( 277) 11.2 24.2 26.4 25.3 13.0 대학교 졸업 이상 100.0 ( 39) 23.1 25.6 20.5 17.9 12.8 직업 0.071* 전문사무직 100.0 ( 535) 8.0 26.9 30.7 26.7 7.7 서비스판매직 100.0 ( 181) 12.2 29.3 28.2 20.4 9.9 생산직 100.0 ( 66) 12.1 25.8 24.2 24.2 13.6 농수축산 100.0 ( 13) 7.7 38.5 38.5 15.4 공무원 100.0 ( 36) 8.3 22.2 36.1 19.4 13.9 교사 및 교수 100.0 ( 29) 24.1 17.2 20.7 27.6 10.3 학생 100.0 ( 132) 11.4 18.2 25.8 30.3 14.4 무직 100.0 ( 142) 12.7 23.9 24.6 26.8 12.0 기타 100.0 ( 80) 22.5 23.8 23.8 21.3 8.8 혼인상태 0.015** 미혼 100.0 ( 705) 8.8 24.4 27.7 27.8 11.3 기혼 100.0 ( 500) 14.2 27.0 29.2 21.8 7.8 기타 100.0 ( 9) 22.2 22.2 22.2 33.3 건강상태 0.000*** 매우건강 100.0 ( 145) 16.6 34.5 24.8 16.6 7.6 건강한 편 100.0 ( 498) 10.0 28.5 29.5 23.7 8.2 보통 100.0 ( 391) 10.0 22.3 29.4 27.9 10.5 건강하지 못함 100.0 ( 167) 12.6 16.8 26.3 31.7 12.6 매우 건강하지 못함 100.0 ( 13) 7.7 15.4 7.7 30.8 38.5 만성질환 유무 0.691 있음 100.0 (271) 10.7 24.7 27.7 25.8 11.1 없음 100.0 ( 804) 11.3 26.7 28.5 24.4 9.1 모름 100.0 ( 139) 10.8 19.4 28.1 30.2 11.5 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 335 <부표 4-18> 인터넷 때문에 자기 할 일을 소홀히 한 적 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 13.4 28.5 32.3 20.8 4.9 성별 0.143 남자 100.0 ( 684) 11.8 29.5 33.8 20.8 4.1 여자 100.0 ( 530) 15.5 27.2 30.4 20.9 6.0 연령 0.119 10대 100.0 ( 30) 20.0 20.0 20.0 33.3 6.7 20대 100.0 ( 342) 14.3 26.6 31.6 22.8 4.7 30대 100.0 ( 536) 11.8 27.6 34.0 21.3 5.4 40대 100.0 ( 221) 12.2 32.6 33.0 19.0 3.2 50대 이상 100.0 ( 85) 21.2 34.1 27.1 10.6 7.1 최종학력 0.024** 초졸 100.0 ( 88) 14.8 37.5 26.1 17.0 4.5 중졸 100.0 ( 810) 12.7 28.5 34.0 20.7 4.1 고졸 100.0 ( 277) 13.7 27.1 31.4 21.7 6.1 대학교 졸업 이상 100.0 ( 39) 23.1 17.9 17.9 25.6 15.4 직업 0.021** 전문사무직 100.0 ( 535) 11.2 29.9 33.6 20.6 4.7 서비스판매직 100.0 ( 181) 12.2 29.8 35.9 19.9 2.2 생산직 100.0 ( 66) 7.6 28.8 40.9 18.2 4.5 농수축산 100.0 ( 13) 15.4 23.1 30.8 15.4 15.4 공무원 100.0 ( 36) 5.6 33.3 30.6 22.2 8.3 교사 및 교수 100.0 ( 29) 13.8 24.1 37.9 20.7 3.4 학생 100.0 ( 132) 13.6 23.5 28.0 28.8 6.1 무직 100.0 ( 142) 17.6 27.5 26.8 21.1 7.0 기타 100.0 ( 80) 31.3 26.3 23.8 13.8 5.0 혼인상태 0.010** 미혼 100.0 ( 705) 12.6 25.0 33.6 24.1 4.7 기혼 100.0 ( 500) 14.4 33.6 30.2 16.4 5.4 기타 100.0 ( 9) 22.2 22.2 44.4 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 17.9 35.9 25.5 15.2 5.5 건강한 편 100.0 ( 498) 13.1 29.1 33.7 19.9 4.2 보통 100.0 ( 391) 11.5 28.4 35.8 20.7 3.6 건강하지 못함 100.0 ( 167) 15.6 22.8 26.3 27.5 7.8 매우 건강하지 못함 100.0 ( 13) 7.7 23.1 38.5 30.8 만성질환 유무 0.161 있음 100.0 (271) 12.2 27.3 29.5 24.4 6.6 없음 100.0 ( 804) 14.2 29.9 32.1 19.2 4.7 모름 100.0 ( 139) 11.5 23.0 38.8 23.7 2.9 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
336 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-19> 가족과 생활보다 인터넷에 더 흥미를 느낀 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 18.2 26.5 30.5 18.4 6.4 성별 0.017*** 남자 100.0 ( 684) 15.4 27.6 32.6 18.9 5.6 여자 100.0 ( 530) 21.9 25.1 27.7 17.7 7.5 연령 0.011** 10대 100.0 ( 30) 43.3 16.7 10.0 23.3 6.7 20대 100.0 ( 342) 20.2 23.4 29.8 20.8 5.8 30대 100.0 ( 536) 15.1 27.6 32.3 18.3 6.7 40대 100.0 ( 221) 16.3 28.5 33.0 16.3 5.9 50대 이상 100.0 ( 85) 25.9 30.6 22.4 12.9 8.2 최종학력 0.009** 초졸 100.0 ( 88) 26.1 29.5 27.3 11.4 5.7 중졸 100.0 ( 810) 15.6 28.0 32.1 18.5 5.8 고졸 100.0 ( 277) 22.4 22.0 28.9 19.5 7.2 대학교 졸업 이상 100.0 ( 39) 25.6 20.5 15.4 23.1 15.4 직업 0.003** 전문사무직 100.0 ( 535) 17.6 27.1 32.0 17.9 5.4 서비스판매직 100.0 ( 181) 16.6 27.6 34.8 14.9 6.1 생산직 100.0 ( 66) 9.1 16.7 34.8 28.8 10.6 농수축산 100.0 ( 13) 15.4 46.2 15.4 23.1 공무원 100.0 ( 36) 13.9 19.4 33.3 25.0 8.3 교사 및 교수 100.0 ( 29) 6.9 41.4 24.1 20.7 6.9 학생 100.0 ( 132) 25.8 20.5 24.2 25.0 4.5 무직 100.0 ( 142) 17.6 26.8 31.0 12.7 12.0 기타 100.0 ( 80) 28.8 32.5 20.0 15.0 3.8 혼인상태 0.032** 미혼 100.0 ( 705) 16.6 24.4 30.9 21.6 6.5 기혼 100.0 ( 500) 20.4 29.6 29.6 14.2 6.2 기타 100.0 ( 9) 22.2 22.2 44.4 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 21.4 29.0 33.1 7.6 9.0 건강한 편 100.0 ( 498) 19.7 24.5 30.7 19.7 5.4 보통 100.0 ( 391) 14.8 30.2 32.2 18.7 4.1 건강하지 못함 100.0 ( 167) 19.8 23.4 25.1 21.6 10.2 매우 건강하지 못함 100.0 ( 13) 7.7 7.7 7.7 38.5 38.5 만성질환 유무 0.838 있음 100.0 (271) 17.0 24.7 31.4 19.6 7.4 없음 100.0 ( 804) 18.4 27.9 30.1 17.4 6.2 모름 100.0 ( 139) 19.4 22.3 30.9 21.6 5.8 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 337 <부표 4-20> 온라인상의 친구를 만들어 본 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 26.5 28.9 25.9 14.0 4.7 성별 0.001** 남자 100.0 ( 684) 21.8 30.3 28.8 14.5 4.7 여자 100.0 ( 530) 32.6 27.2 22.1 13.4 4.7 연령 0.011** 10대 100.0 ( 30) 26.7 13.3 26.7 26.7 6.7 20대 100.0 ( 342) 25.4 32.2 22.5 14.0 5.8 30대 100.0 ( 536) 22.8 29.7 28.2 14.9 4.5 40대 100.0 ( 221) 33.5 28.1 24.0 12.2 2.3 50대 이상 100.0 ( 85) 36.5 18.8 29.4 8.2 7.1 최종학력 0.063* 초졸 100.0 ( 88) 37.5 25.0 21.6 9.1 6.8 중졸 100.0 ( 810) 23.7 31.2 26.2 14.7 4.2 고졸 100.0 ( 277) 30.0 25.6 26.0 13.4 5.1 대학교 졸업 이상 100.0 ( 39) 35.9 12.8 28.2 15.4 7.7 직업 0.071 전문사무직 100.0 ( 535) 8.0 26.9 30.7 26.7 7.7 서비스판매직 100.0 ( 181) 12.2 29.3 28.2 20.4 9.9 생산직 100.0 ( 66) 12.1 25.8 24.2 24.2 13.6 농수축산 100.0 ( 13) 7.7 38.5 38.5 15.4 공무원 100.0 ( 36) 8.3 22.2 36.1 19.4 13.9 교사 및 교수 100.0 ( 29) 24.1 17.2 20.7 27.6 10.3 학생 100.0 ( 132) 11.4 18.2 25.8 30.3 14.4 무직 100.0 ( 142) 12.7 23.9 24.6 26.8 12.0 기타 100.0 ( 80) 22.5 23.8 23.8 21.3 8.8 혼인상태 0.063* 미혼 100.0 ( 705) 8.8 24.4 27.7 27.8 11.3 기혼 100.0 ( 500) 14.2 27.0 29.2 21.8 7.8 기타 100.0 ( 9) 22.2 22.2 22.2 33.3 건강상태 0.000*** 매우건강 100.0 ( 145) 16.6 34.5 24.8 16.6 7.6 건강한 편 100.0 ( 498) 10.0 28.5 29.5 23.7 8.2 보통 100.0 ( 391) 10.0 22.3 29.4 27.9 10.5 건강하지 못함 100.0 ( 167) 12.6 16.8 26.3 31.7 12.6 매우 건강하지 못함 100.0 ( 13) 7.7 15.4 7.7 30.8 38.5 만성질환 유무 0.691 있음 100.0 (271) 10.7 24.7 27.7 25.8 11.1 없음 100.0 ( 804) 11.3 26.7 28.5 24.4 9.1 모름 100.0 ( 139) 10.8 19.4 28.1 30.2 11.5 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
338 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-21> 온라인 접속 때문에 다른 사람이 불평한 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 30.8 28.4 22.2 13.3 5.2 성별 0.000*** 남자 100.0 ( 684) 24.9 30.0 24.9 14.6 5.7 여자 100.0 ( 530) 38.5 26.4 18.9 11.7 4.5 연령 0.092* 10대 100.0 ( 30) 50.0 13.3 23.3 10.0 3.3 20대 100.0 ( 342) 35.4 28.7 20.2 10.5 5.3 30대 100.0 ( 536) 27.1 31.0 23.1 14.2 4.7 40대 100.0 ( 221) 29.0 27.6 22.2 16.3 5.0 50대 이상 100.0 ( 85) 34.1 18.8 24.7 12.9 9.4 최종학력 0.021** 초졸 100.0 ( 88) 37.5 31.8 15.9 9.1 5.7 중졸 100.0 ( 810) 28.9 31.4 21.6 13.8 4.3 고졸 100.0 ( 277) 33.9 20.6 25.3 13.4 6.9 대학교 졸업 이상 100.0 ( 39) 33.3 15.4 28.2 12.8 10.3 직업 0.000*** 전문사무직 100.0 ( 535) 28.8 31.8 22.6 13.8 3.0 서비스판매직 100.0 ( 181) 28.7 25.4 26.0 14.4 5.5 생산직 100.0 ( 66) 16.7 18.2 34.8 21.2 9.1 농수축산 100.0 ( 13) 23.1 38.5 7.7 15.4 15.4 공무원 100.0 ( 36) 16.7 47.2 13.9 8.3 13.9 교사 및 교수 100.0 ( 29) 20.7 27.6 34.5 6.9 10.3 학생 100.0 ( 132) 39.4 22.0 20.5 12.1 6.1 무직 100.0 ( 142) 34.5 26.8 19.0 13.4 6.3 기타 100.0 ( 80) 51.3 25.0 11.3 7.5 5.0 혼인상태 0.152 미혼 100.0 ( 705) 32.5 30.1 21.7 11.5 4.3 기혼 100.0 ( 500) 28.4 26.2 22.8 16.0 6.6 기타 100.0 ( 9) 33.3 22.2 33.3 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 29.0 31.0 18.6 10.3 11.0 건강한 편 100.0 ( 498) 30.1 30.1 22.3 13.1 4.4 보통 100.0 ( 391) 30.4 29.7 22.5 14.6 2.8 건강하지 못함 100.0 ( 167) 37.1 18.0 24.6 14.4 6.0 매우 건강하지 못함 100.0 ( 13) 7.7 30.8 23.1 7.7 30.8 만성질환 유무 0.133 있음 100.0 (271) 35.4 22.5 24.0 12.5 5.5 없음 100.0 ( 804) 29.7 29.7 21.5 13.3 5.7 모름 100.0 ( 139) 28.1 32.4 23.0 15.1 1.4 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 339 <부표 4-22> 인터넷 때문에 성적이나 학교생활에 문제가 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 37.0 23.2 22.0 12.9 4.9 성별 0.000*** 남자 100.0 ( 684) 30.0 26.3 24.0 14.0 5.7 여자 100.0 ( 530) 46.0 19.2 19.4 11.5 3.8 연령 0.844 10대 100.0 ( 30) 40.0 16.7 20.0 16.7 6.7 20대 100.0 ( 342) 38.9 24.0 18.7 13.7 4.7 30대 100.0 ( 536) 34.1 24.1 24.8 12.1 4.9 40대 100.0 ( 221) 38.5 21.3 23.1 12.7 4.5 50대 이상 100.0 ( 85) 42.4 22.4 15.3 14.1 5.9 최종학력 0.061* 초졸 100.0 ( 88) 51.1 23.9 9.1 9.1 6.8 중졸 100.0 ( 810) 34.9 23.5 24.1 13.2 4.3 고졸 100.0 ( 277) 39.4 22.7 19.9 13.0 5.1 대학교 졸업 이상 100.0 ( 39) 30.8 20.5 23.1 15.4 10.3 직업 0.011** 전문사무직 100.0 ( 535) 38.3 22.1 22.6 13.3 3.7 서비스판매직 100.0 ( 181) 33.7 22.1 24.9 14.4 5.0 생산직 100.0 ( 66) 24.2 18.2 37.9 13.6 6.1 농수축산 100.0 ( 13) 15.4 53.8 7.7 15.4 7.7 공무원 100.0 ( 36) 30.6 22.2 30.6 5.6 11.1 교사 및 교수 100.0 ( 29) 31.0 37.9 13.8 10.3 6.9 학생 100.0 ( 132) 35.6 25.8 17.4 15.2 6.1 무직 100.0 ( 142) 36.6 26.8 19.7 11.3 5.6 기타 100.0 ( 80) 57.5 17.5 11.3 10.0 3.8 혼인상태 0.633 미혼 100.0 ( 705) 36.7 23.7 23.4 12.2 4.0 기혼 100.0 ( 500) 37.2 22.6 20.2 14.0 6.0 기타 100.0 ( 9) 44.4 22.2 11.1 11.1 11.1 건강상태 0.007** 매우건강 100.0 ( 145) 29.0 24.8 25.5 10.3 10.3 건강한 편 100.0 ( 498) 39.0 22.1 21.7 12.4 4.8 보통 100.0 ( 391) 36.1 24.6 23.0 13.6 2.8 건강하지 못함 100.0 ( 167) 40.7 21.6 19.2 15.0 3.6 매우 건강하지 못함 100.0 ( 13) 30.8 30.8 15.4 23.1 만성질환 유무 0.142 있음 100.0 (271) 37.3 24.0 19.9 14.0 4.8 없음 100.0 ( 804) 37.7 23.0 21.0 12.8 5.5 모름 100.0 ( 139) 32.4 23.0 31.7 11.5 1.4 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
340 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-23> 다른 일을 하기 전에 먼저 메일을 점검한 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 17.3 24.8 25.8 22.2 10.0 성별 0.000*** 남자 100.0 ( 684) 14.8 28.2 25.4 23.5 8.0 여자 100.0 ( 530) 20.6 20.4 26.2 20.4 12.5 연령 0.250 10대 100.0 ( 30) 23.3 36.7 6.7 26.7 6.7 20대 100.0 ( 342) 20.5 22.2 24.6 23.7 9.1 30대 100.0 ( 536) 14.7 27.1 26.7 20.3 11.2 40대 100.0 ( 221) 18.1 20.4 28.5 24.0 9.0 50대 이상 100.0 ( 85) 16.5 28.2 24.7 21.2 9.4 최종학력 0.965 초졸 100.0 ( 88) 15.9 29.5 20.5 22.7 11.4 중졸 100.0 ( 810) 17.5 24.1 26.3 22.6 9.5 고졸 100.0 ( 277) 17.0 24.9 27.1 20.2 10.8 대학교 졸업 이상 100.0 ( 39) 17.9 28.2 17.9 25.6 10.3 직업 0.011** 전문사무직 100.0 ( 535) 15.5 22.8 26.2 24.5 11.0 서비스판매직 100.0 ( 181) 18.2 26.0 28.7 22.1 5.0 생산직 100.0 ( 66) 18.2 24.2 30.3 13.6 13.6 농수축산 100.0 ( 13) 23.1 30.8 30.8 7.7 7.7 공무원 100.0 ( 36) 8.3 38.9 19.4 22.2 11.1 교사 및 교수 100.0 ( 29) 20.7 24.1 31.0 6.9 17.2 학생 100.0 ( 132) 14.4 28.0 21.2 31.1 5.3 무직 100.0 ( 142) 17.6 24.6 24.6 18.3 14.8 기타 100.0 ( 80) 32.5 23.8 22.5 13.8 7.5 혼인상태 0.540 미혼 100.0 ( 705) 17.0 24.7 24.7 24.3 9.4 기혼 100.0 ( 500) 17.4 25.2 27.4 19.2 10.8 기타 100.0 ( 9) 33.3 11.1 22.2 22.2 11.1 건강상태 0.002** 매우건강 100.0 ( 145) 22.1 29.0 26.9 13.1 9.0 건강한 편 100.0 ( 498) 17.5 26.5 22.5 23.3 10.2 보통 100.0 ( 391) 15.9 24.0 30.2 22.3 7.7 건강하지 못함 100.0 ( 167) 17.4 18.0 25.7 25.7 13.2 매우 건강하지 못함 100.0 ( 13) 23.1 7.7 30.8 38.5 만성질환 유무 0.631 있음 100.0 (271) 15.1 24.0 25.1 23.6 12.2 없음 100.0 ( 804) 17.8 24.5 26.0 22.6 9.1 모름 100.0 ( 139) 18.7 28.1 25.9 16.5 10.8 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 341 <부표 4-24> 인터넷 때문에 능률이나 생산성에 문제가 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 23.5 29.8 26.8 15.0 4.9 성별 0.044** 남자 100.0 ( 684) 20.2 31.3 27.8 15.4 5.4 여자 100.0 ( 530) 27.7 27.9 25.5 14.5 4.3 연령 0.054* 10대 100.0 ( 30) 33.3 23.3 20.0 20.0 3.3 20대 100.0 ( 342) 25.1 29.2 22.5 18.4 4.7 30대 100.0 ( 536) 20.0 31.5 28.0 15.5 5.0 40대 100.0 ( 221) 24.0 30.3 30.3 10.9 4.5 50대 이상 100.0 ( 85) 34.1 22.4 29.4 7.1 7.1 최종학력 0.904 초졸 100.0 ( 88) 25.0 36.4 22.7 11.4 4.5 중졸 100.0 ( 810) 23.1 29.4 28.0 15.1 4.4 고졸 100.0 ( 277) 23.8 29.6 24.9 15.5 6.1 대학교 졸업 이상 100.0 ( 39) 25.6 25.6 23.1 17.9 7.7 직업 0.233 전문사무직 100.0 ( 535) 23.0 31.6 26.5 15.0 3.9 서비스판매직 100.0 ( 181) 24.3 29.3 28.7 12.2 5.5 생산직 100.0 ( 66) 18.2 27.3 24.2 21.2 9.1 농수축산 100.0 ( 13) 23.1 30.8 23.1 23.1 공무원 100.0 ( 36) 16.7 16.7 44.4 13.9 8.3 교사 및 교수 100.0 ( 29) 20.7 31.0 31.0 10.3 6.9 학생 100.0 ( 132) 22.0 27.3 24.2 19.7 6.8 무직 100.0 ( 142) 21.1 31.0 28.2 16.2 3.5 기타 100.0 ( 80) 40.0 28.8 18.8 7.5 5.0 혼인상태 0.260 미혼 100.0 ( 705) 22.7 29.5 27.0 16.7 4.1 기혼 100.0 ( 500) 24.4 30.0 27.0 12.6 6.0 기타 100.0 ( 9) 33.3 44.4 11.1 11.1 건강상태 0.006** 매우건강 100.0 ( 145) 30.3 22.8 29.0 9.0 9.0 건강한 편 100.0 ( 498) 24.3 30.5 24.3 15.5 5.4 보통 100.0 ( 391) 20.5 32.5 30.2 13.8 3.1 건강하지 못함 100.0 ( 167) 23.4 28.1 24.6 20.4 3.6 매우 건강하지 못함 100.0 ( 13) 7.7 23.1 23.1 30.8 15.4 만성질환 유무 0.718 있음 100.0 (271) 25.1 29.9 25.8 14.4 4.8 없음 100.0 ( 804) 22.6 30.0 26.7 15.0 5.6 모름 100.0 ( 139) 25.2 28.8 28.8 15.8 1.4 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
342 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-25> 누군가가 인터넷에서 무엇을 했느냐고 물어보면 숨기거나 변명한 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 29.9 28.3 23.9 12.8 5.1 성별 0.000*** 남자 100.0 ( 684) 24.0 31.7 27.3 12.1 4.8 여자 100.0 ( 530) 37.5 24.0 19.4 13.6 5.5 연령 0.154 10대 100.0 ( 30) 33.3 30.0 23.3 10.0 3.3 20대 100.0 ( 342) 34.2 26.3 20.8 13.5 5.3 30대 100.0 ( 536) 25.7 29.3 25.4 14.6 5.0 40대 100.0 ( 221) 28.5 31.2 26.2 10.0 4.1 50대 이상 100.0 ( 85) 41.2 22.4 21.2 7.1 8.2 최종학력 0.449 초졸 100.0 ( 88) 34.1 27.3 27.3 6.8 4.5 중졸 100.0 ( 810) 28.0 29.9 23.2 14.2 4.7 고졸 100.0 ( 277) 33.6 24.5 24.9 10.8 6.1 대학교 졸업 이상 100.0 ( 39) 33.3 25.6 23.1 10.3 7.7 직업 0.021** 전문사무직 100.0 ( 535) 27.1 30.3 24.3 14.0 4.3 서비스판매직 100.0 ( 181) 27.1 27.1 28.7 12.7 4.4 생산직 100.0 ( 66) 22.7 28.8 25.8 13.6 9.1 농수축산 100.0 ( 13) 7.7 69.2 15.4 7.7 공무원 100.0 ( 36) 25.0 36.1 22.2 11.1 5.6 교사 및 교수 100.0 ( 29) 34.5 20.7 13.8 20.7 10.3 학생 100.0 ( 132) 31.8 27.3 23.5 11.4 6.1 무직 100.0 ( 142) 37.3 23.9 23.9 11.3 3.5 기타 100.0 ( 80) 48.8 20.0 17.5 6.3 7.5 혼인상태 0.319 미혼 100.0 ( 705) 29.9 28.5 24.0 13.6 4.0 기혼 100.0 ( 500) 29.4 28.2 24.0 11.8 6.6 기타 100.0 ( 9) 55.6 22.2 11.1 11.1 건강상태 0.157 매우건강 100.0 ( 145) 35.2 20.7 23.4 11.0 9.7 건강한 편 100.0 ( 498) 29.1 30.1 23.7 11.4 5.6 보통 100.0 ( 391) 28.6 28.4 26.3 13.3 3.3 건강하지 못함 100.0 ( 167) 29.9 29.9 19.8 16.2 4.2 매우 건강하지 못함 100.0 ( 13) 38.5 23.1 15.4 23.1 만성질환 유무 0.635 있음 100.0 (271) 28.4 31.0 24.7 12.2 3.7 없음 100.0 ( 804) 29.9 27.7 23.9 12.6 6.0 모름 100.0 ( 139) 33.1 26.6 22.3 15.1 2.9 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 343 <부표 4-26> 인터넷에 빠져 현실에서의 어려운 문제를 생각하지 못했던 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 35.9 24.9 20.8 12.9 5.4 성별 0.000*** 남자 100.0 ( 684) 29.8 27.9 21.8 15.5 5.0 여자 100.0 ( 530) 43.8 20.9 19.6 9.6 6.0 연령 0.207 10대 100.0 ( 30) 50.0 23.3 13.3 10.0 3.3 20대 100.0 ( 342) 40.9 24.3 17.8 9.9 7.0 30대 100.0 ( 536) 31.7 24.6 22.9 15.9 4.9 40대 100.0 ( 221) 35.3 26.2 21.7 12.2 4.5 50대 이상 100.0 ( 85) 38.8 25.9 20.0 9.4 5.9 최종학력 0.580 초졸 100.0 ( 88) 45.5 21.6 18.2 10.2 4.5 중졸 100.0 ( 810) 35.4 25.3 20.1 14.1 5.1 고졸 100.0 ( 277) 35.4 24.9 23.5 10.1 6.1 대학교 졸업 이상 100.0 ( 39) 28.2 23.1 23.1 15.4 10.3 직업 0.346 전문사무직 100.0 ( 535) 37.4 24.5 20.6 12.5 5.0 서비스판매직 100.0 ( 181) 28.2 28.2 23.8 14.9 5.0 생산직 100.0 ( 66) 24.2 24.2 24.2 21.2 6.1 농수축산 100.0 ( 13) 23.1 38.5 30.8 7.7 공무원 100.0 ( 36) 30.6 33.3 13.9 11.1 11.1 교사 및 교수 100.0 ( 29) 31.0 17.2 27.6 17.2 6.9 학생 100.0 ( 132) 40.2 25.0 15.9 12.1 6.8 무직 100.0 ( 142) 37.3 21.1 24.6 11.3 5.6 기타 100.0 ( 80) 50.0 23.8 13.8 8.8 3.8 혼인상태 0.100 미혼 100.0 ( 705) 33.8 26.1 22.0 12.1 6.1 기혼 100.0 ( 500) 38.4 23.6 19.6 14.0 4.4 기타 100.0 ( 9) 66.7 22.2 11.1 건강상태 0.097* 매우건강 100.0 ( 145) 32.4 24.1 24.1 11.7 7.6 건강한 편 100.0 ( 498) 38.4 23.1 20.9 12.0 5.6 보통 100.0 ( 391) 34.5 28.1 21.5 11.8 4.1 건강하지 못함 100.0 ( 167) 35.9 23.4 17.4 18.6 4.8 매우 건강하지 못함 100.0 ( 13) 23.1 23.1 7.7 23.1 23.1 만성질환 유무 0.47 있음 100.0 (271) 36.5 24.7 19.2 14.8 4.8 없음 100.0 ( 804) 36.7 24.5 20.9 11.8 6.1 모름 100.0 ( 139) 30.2 27.3 23.7 15.8 2.9 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
344 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-27> 인터넷 사용 후 다시 접속할 때까지의 기간을 손꼽아 기다린 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 34.3 24.7 21.8 14.1 5.1 성별 0.001** 남자 100.0 ( 684) 30.0 26.3 24.7 13.0 6.0 여자 100.0 ( 530) 39.8 22.6 18.1 15.5 4.0 연령 0.014 10대 100.0 ( 30) 36.7 40.0 6.7 13.3 3.3 20대 100.0 ( 342) 42.1 22.2 17.5 13.7 4.4 30대 100.0 ( 536) 31.3 24.8 24.6 14.4 4.9 40대 100.0 ( 221) 29.4 24.9 27.1 12.2 6.3 50대 이상 100.0 ( 85) 32.9 28.2 12.9 18.8 7.1 최종학력 0.211 초졸 100.0 ( 88) 44.3 19.3 17.0 13.6 5.7 중졸 100.0 ( 810) 33.3 25.1 22.6 14.1 4.9 고졸 100.0 ( 277) 35.0 23.1 23.1 13.4 5.4 대학교 졸업 이상 100.0 ( 39) 25.6 41.0 7.7 20.5 5.1 직업 0.002** 전문사무직 100.0 ( 535) 36.4 22.4 21.9 14.8 4.5 서비스판매직 100.0 ( 181) 26.5 21.0 30.9 16.6 5.0 생산직 100.0 ( 66) 18.2 30.3 28.8 12.1 10.6 농수축산 100.0 ( 13) 23.1 30.8 23.1 23.1 공무원 100.0 ( 36) 25.0 33.3 27.8 8.3 5.6 교사 및 교수 100.0 ( 29) 24.1 20.7 31.0 20.7 3.4 학생 100.0 ( 132) 41.7 25.0 14.4 14.4 4.5 무직 100.0 ( 142) 33.1 32.4 14.8 12.7 7.0 기타 100.0 ( 80) 50.0 26.3 13.8 6.3 3.8 혼인상태 0.238 미혼 100.0 ( 705) 34.5 24.5 22.7 13.6 4.7 기혼 100.0 ( 500) 33.6 25.4 20.8 14.8 5.4 기타 100.0 ( 9) 55.6 11.1 11.1 22.2 건강상태 0.000*** 매우건강 100.0 ( 145) 29.7 27.6 24.8 9.7 8.3 건강한 편 100.0 ( 498) 37.6 21.7 22.9 12.9 5.0 보통 100.0 ( 391) 33.0 27.9 22.3 14.1 2.8 건강하지 못함 100.0 ( 167) 32.9 24.0 16.8 19.8 6.6 매우 건강하지 못함 100.0 ( 13) 15.4 23.1 38.5 23.1 만성질환 유무 0.696 있음 100.0 (271) 30.6 26.6 22.5 14.0 6.3 없음 100.0 ( 804) 35.9 23.3 21.6 14.3 4.9 모름 100.0 ( 139) 31.7 29.5 21.6 12.9 4.3 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 345 <부표 4-28> 인터넷 없는 생활은 따분하고 재미없을 것이라고 두려워 한 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 24.0 29.0 25.9 14.0 7.2 성별 0.693 남자 100.0 ( 684).22.5 29.7 26.6 13.7 7.5 여자 100.0 ( 530) 25.8 28.1 24.9 14.3 6.8 연령 0.330 10대 100.0 ( 30) 33.3 20.0 23.3 16.7 6.7 20대 100.0 ( 342) 26.6 27.5 22.5 15.5 7.9 30대 100.0 ( 536) 22.6 29.1 27.4 14.0 6.9 40대 100.0 ( 221) 19.5 35.3 26.2 13.1 5.9 50대 이상 100.0 ( 85) 30.6 21.2 29.4 9.4 9.4 최종학력 0.715 초졸 100.0 ( 88) 31.8 22.7 25.0 14.8 5.7 중졸 100.0 ( 810) 22.2 30.4 26.2 14.0 7.3 고졸 100.0 ( 277) 26.4 27.4 25.3 14.4 6.5 대학교 졸업 이상 100.0 ( 39) 25.6 25.6 25.6 10.3 12.8 직업 0.148 전문사무직 100.0 ( 535) 22.6 29.5 27.1 14.6 6.2 서비스판매직 100.0 ( 181) 17.7 33.1 26.5 16.0 6.6 생산직 100.0 ( 66) 21.2 25.8 28.8 16.7 7.6 농수축산 100.0 ( 13) 23.1 38.5 30.8 7.7 공무원 100.0 ( 36) 19.4 38.9 13.9 13.9 13.9 교사 및 교수 100.0 ( 29) 20.7 27.6 34.5 10.3 6.9 학생 100.0 ( 132) 32.6 23.5 21.2 12.9 9.8 무직 100.0 ( 142) 23.2 24.6 29.6 13.4 9.2 기타 100.0 ( 80) 40.0 30.0 16.3 8.8 5.0 혼인상태 0.246 미혼 100.0 ( 705) 23.3 27.9 25.4 15.5 7.9 기혼 100.0 ( 500) 24.6 30.6 27.0 11.8 6.0 기타 100.0 ( 9) 44.4 22.2 22.2 11.1 건강상태 0.016** 매우건강 100.0 ( 145) 22.1 25.5 32.4 10.3 9.7 건강한 편 100.0 ( 498) 26.3 30.9 23.7 13.1 6.0 보통 100.0 ( 391) 21.2 29.2 28.6 15.1 5.9 건강하지 못함 100.0 ( 167) 25.7 26.9 21.0 16.8 9.6 매우 건강하지 못함 100.0 ( 13) 15.4 15.4 15.4 23.1 30.8 만성질환 유무 0.963 있음 100.0 (271) 24.7 27.3 26.6 13.3 8.1 없음 100.0 ( 804) 23.6 29.5 26.2 13.8 6.8 모름 100.0 ( 139) 24.5 29.5 22.3 16.5 7.2 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
346 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-29> 온라인 접속 중 누군가가 방해하면 화를 내거나 귀찮은 듯한 행동을 한 적 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 25.9 29.5 24.1 15.7 4.7 성별 0.644 남자 100.0 ( 684) 24.3 29.7 25.0 16.2 4.8 여자 100.0 ( 530) 28.1 29.2 23.0 15.1 4.5 연령 0.115 10대 100.0 ( 30) 16.7 40.0 26.7 10.0 6.7 20대 100.0 ( 342) 29.5 27.8 22.8 14.6 5.3 30대 100.0 ( 536) 21.8 30.0 27.1 16.0 5.0 40대 100.0 ( 221) 29.4 29.0 20.8 19.0 1.8 50대 이상 100.0 ( 85) 31.8 30.6 18.8 11.8 7.1 최종학력 0.154 초졸 100.0 ( 88) 37.5 28.4 13.6 17.0 3.4 중졸 100.0 ( 810) 25.1 29.8 25.1 16.2 4.0 고졸 100.0 ( 277) 26.0 28.5 24.5 14.4 6.5 대학교 졸업 이상 100.0 ( 39) 17.9 33.3 25.6 12.8 10.3 직업 0.003** 전문사무직 100.0 ( 535) 27.7 28.2 25.0 16.1 3.0 서비스판매직 100.0 ( 181) 23.8 28.7 26.0 18.8 2.8 생산직 100.0 ( 66) 13.6 33.3 25.8 22.7 4.5 농수축산 100.0 ( 13) 23.1 46.2 15.4 7.7 7.7 공무원 100.0 ( 36) 13.9 44.4 16.7 11.1 13.9 교사 및 교수 100.0 ( 29) 20.7 24.1 31.0 10.3 13.8 학생 100.0 ( 132) 22.7 29.5 25.0 14.4 8.3 무직 100.0 ( 142) 27.5 26.8 25.4 12.7 7.7 기타 100.0 ( 80) 40.0 33.8 11.3 13.8 1.3 혼인상태 0.419 미혼 100.0 ( 705) 25.5 28.8 24.7 15.9 5.1 기혼 100.0 ( 500) 26.0 31.0 23.4 15.6 4.0 기타 100.0 ( 9) 55.6 22.2 11.1 11.1 건강상태 0.000*** 매우건강 100.0 ( 145) 31.7 24.1 23.4 13.1 7.6 건강한 편 100.0 ( 498) 27.7 28.7 25.3 13.3 5.0 보통 100.0 ( 391) 21.5 34.0 24.3 17.6 2.6 건강하지 못함 100.0 ( 167) 26.9 26.9 22.2 19.8 4.2 매우 건강하지 못함 100.0 ( 13) 15.4 15.4 7.7 30.8 30.8 만성질환 유무 0.768 있음 100.0 (271) 24.7 29.9 23.2 15.5 6.6 없음 100.0 ( 804) 26.4 29.0 24.5 15.7 4.5 모름 100.0 ( 139) 25.9 31.7 23.7 16.5 2.2 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 347 <부표 4-30> 밤늦게까지 접속해 있느라 잠을 못 잔 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 23.0 29.6 24.9 15.9 6.7 성별 0.814 남자 100.0 ( 684) 21.9 30.3 25.3 16.2 6.3 여자 100.0 ( 530) 24.3 28.7 24.3 15.5 7.2 연령 0.430 10대 100.0 ( 30) 33.3 23.3 16.7 20.0 6.7 20대 100.0 ( 342) 22.8 31.3 24.9 13.7 7.3 30대 100.0 ( 536) 20.3 28.0 27.6 17.0 7.1 40대 100.0 ( 221) 25.8 32.1 21.3 16.7 4.1 50대 이상 100.0 ( 85) 29.4 28.2 20.0 14.1 8.2 최종학력 0.264 초졸 100.0 ( 88) 27.3 35.2 14.8 15.9 6.8 중졸 100.0 ( 810) 21.7 28.9 26.7 16.7 6.0 고졸 100.0 ( 277) 24.9 30.3 24.2 12.6 7.9 대학교 졸업 이상 100.0 ( 39) 25.6 25.6 15.4 23.1 10.3 직업 0.032** 전문사무직 100.0 ( 535) 21.3 29.5 27.1 15.9 6.2 서비스판매직 100.0 ( 181) 23.2 30.4 30.9 12.7 2.8 생산직 100.0 ( 66) 21.2 25.8 21.2 24.2 7.6 농수축산 100.0 ( 13) 7.7 38.5 30.8 15.4 7.7 공무원 100.0 ( 36) 11.1 33.3 22.2 22.2 11.1 교사 및 교수 100.0 ( 29) 10.3 34.5 17.2 27.6 10.3 학생 100.0 ( 132) 28.0 26.5 21.2 16.7 7.6 무직 100.0 ( 142) 22.5 34.5 20.4 12.7 9.9 기타 100.0 ( 80) 40.0 22.5 16.3 13.8 7.5 혼인상태 0.023** 미혼 100.0 ( 705) 21.1 29.1 25.1 17.2 7.5 기혼 100.0 ( 500) 25.8 29.4 25.0 14.4 5.4 기타 100.0 ( 9) 11.1 77.8 11.1 건강상태 0.004** 매우건강 100.0 ( 145) 26.2 29.7 24.8 11.0 8.3 건강한 편 100.0 ( 498) 23.5 28.5 26.1 16.9 5.0 보통 100.0 ( 391) 20.7 33.0 25.1 15.9 5.4 건강하지 못함 100.0 ( 167) 24.6 26.3 22.2 15.0 12.0 매우 건강하지 못함 100.0 ( 13) 15.4 7.7 7.7 46.2 23.1 만성질환 유무 0.132 있음 100.0 (271) 21.8 28.0 22.9 20.3 7.0 없음 100.0 ( 804) 23.6 31.2 24.3 14.7 6.2 모름 100.0 ( 139) 21.6 23.0 32.4 14.4 8.6 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
348 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-31> 현실 생활에서도 인터넷에 접속해 있는 듯한 환상에 빠진 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 47.0 18.9 18.0 10.3 5.8 성별 0.000*** 남자 100.0 ( 684) 42.1 21.5 17.0 12.3 7.2 여자 100.0 ( 530) 53.2 15.7 19.4 7.7 4.0 연령 0.345 10대 100.0 ( 30) 56.7 16.7 10.0 13.3 3.3 20대 100.0 ( 342) 53.2 16.7 15.8 7.9 6.4 30대 100.0 ( 536) 44.8 18.1 19.6 11.8 5.8 40대 100.0 ( 221) 43.4 21.7 19.0 10.9 5.0 50대 이상 100.0 ( 85) 41.2 27.1 17.6 8.2 5.9 최종학력 0.446 초졸 100.0 ( 88) 55.7 14.8 11.4 11.4 6.8 중졸 100.0 ( 810) 45.2 19.6 18.5 11.0 5.7 고졸 100.0 ( 277) 50.9 18.1 18.4 7.2 5.4 대학교 졸업 이상 100.0 ( 39) 35.9 20.5 20.5 15.4 7.7 직업 0.000*** 전문사무직 100.0 ( 535) 47.5 19.1 16.8 10.3 6.4 서비스판매직 100.0 ( 181) 36.5 27.1 22.1 9.9 4.4 생산직 100.0 ( 66) 30.3 19.7 22.7 22.7 4.5 농수축산 100.0 ( 13) 30.8 46.2 7.7 15.4 공무원 100.0 ( 36) 38.9 25.0 13.9 13.9 8.3 교사 및 교수 100.0 ( 29) 31.0 24.1 20.7 13.8 10.3 학생 100.0 ( 132) 55.3 13.6 16.7 7.6 6.8 무직 100.0 ( 142) 55.6 13.4 21.1 5.6 4.2 기타 100.0 ( 80) 63.8 8.8 12.5 10.0 5.0 혼인상태 0.485 미혼 100.0 ( 705) 48.8 17.3 17.7 10.4 5.8 기혼 100.0 ( 500) 44.2 21.2 18.8 10.0 5.8 기타 100.0 ( 9) 55.6 22.2 22.2 건강상태 0.088 매우건강 100.0 ( 145) 38.6 21.4 20.0 9.7 10.3 건강한 편 100.0 ( 498) 48.0 17.5 18.5 9.2 6.8 보통 100.0 ( 391) 48.1 20.7 17.9 9.7 3.6 건강하지 못함 100.0 ( 167) 49.1 17.4 15.6 15.0 3.0 매우 건강하지 못함 100.0 ( 13) 38.5 15.4 15.4 15.4 15.4 만성질환 유무 0.308 있음 100.0 (271) 47.6 18.1 16.6 12.2 5.5 없음 100.0 ( 804) 46.8 19.0 17.7 10.0 6.6 모름 100.0 ( 139) 46.8 20.1 23.0 8.6 1.4 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 349 <부표 4-32> 몇 분만 더 라며 시간을 허비한 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 19.4 31.3 24.1 18.6 6.7 성별 0.006** 남자 100.0 ( 684) 16.8 31.3 27.5 18.6 5.8 여자 100.0 ( 530) 22.6 31.3 19.6 18.7 7.7 연령 0.583 10대 100.0 ( 30) 13.3 30.0 23.3 23.3 10.0 20대 100.0 ( 342) 19.6 30.4 22.5 19.6 7.9 30대 100.0 ( 536) 17.4 31.9 24.1 20.3 6.3 40대 100.0 ( 221) 22.2 31.7 26.2 15.4 4.5 50대 이상 100.0 ( 85) 25.9 30.6 24.7 10.6 8.2 최종학력 0.784 초졸 100.0 ( 88) 22.7 33.0 25.0 13.6 5.7 중졸 100.0 ( 810) 18.8 32.5 24.0 18.8 6.0 고졸 100.0 ( 277) 20.2 28.5 23.5 19.9 7.9 대학교 졸업 이상 100.0 ( 39) 17.9 23.1 28.2 17.9 12.8 직업 0.003** 전문사무직 100.0 ( 535) 20.4 31.8 23.7 18.7 5.4 서비스판매직 100.0 ( 181) 18.2 34.3 23.8 16.6 7.2 생산직 100.0 ( 66) 10.6 19.7 27.3 37.9 4.5 농수축산 100.0 ( 13) 7.7 46.2 38.5 7.7 공무원 100.0 ( 36) 11.1 38.9 25.0 13.9 11.1 교사 및 교수 100.0 ( 29) 10.3 24.1 34.5 17.2 13.8 학생 100.0 ( 132) 14.4 30.3 22.0 23.5 9.8 무직 100.0 ( 142) 21.1 32.4 24.6 14.1 7.7 기타 100.0 ( 80) 36.3 27.5 20.0 11.3 5.0 혼인상태 0.200 미혼 100.0 ( 705) 16.9 30.9 24.5 20.6 7.1 기혼 100.0 ( 500) 22.6 31.8 23.6 16.0 6.0 기타 100.0 ( 9) 33.3 33.3 11.1 11.1 11.1 건강상태 0.122 매우건강 100.0 ( 145) 23.4 25.5 26.2 17.2 7.6 건강한 편 100.0 ( 498) 20.7 32.1 23.3 17.5 6.4 보통 100.0 ( 391) 15.1 35.5 25.3 18.4 5.6 건강하지 못함 100.0 ( 167) 21.6 25.7 20.4 24.0 8.4 매우 건강하지 못함 100.0 ( 13) 23.1 7.7 38.5 15.4 15.4 만성질환 유무 0.660 있음 100.0 (271) 17.3 32.8 23.2 20.3 6.3 없음 100.0 ( 804) 20.1 32.0 23.6 17.7 6.6 모름 100.0 ( 139) 18.7 24.5 28.1 20.9 7.9 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
350 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-33> 사용시간을 줄이려고 노력했지만 실패한 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 24.9 29.5 25.2 15.3 5.1 성별 0.285 남자 100.0 ( 684) 22.8 31.1 25.9 15.5 4.7 여자 100.0 ( 530) 27.5 27.4 24.3 15.1 5.7 연령 0.731 10대 100.0 ( 30) 23.3 33.3 20.0 20.0 3.3 20대 100.0 ( 342) 26.0 28.1 25.1 14.6 6.1 30대 100.0 ( 536) 22.4 31.3 25.6 15.9 4.9 40대 100.0 ( 221) 28.5 28.5 22.2 16.7 4.1 50대 이상 100.0 ( 85) 27.1 24.7 32.9 9.4 5.9 최종학력 0.408 초졸 100.0 ( 88) 28.4 30.7 20.5 15.9 4.5 중졸 100.0 ( 810) 24.3 30.4 24.9 15.1 5.3 고졸 100.0 ( 277) 25.6 27.8 28.5 14.1 4.0 대학교 졸업 이상 100.0 ( 39) 23.1 20.5 17.9 28.2 10.3 직업 0.042** 전문사무직 100.0 ( 535) 23.9 31.4 25.8 13.8 5.0 서비스판매직 100.0 ( 181) 21.5 30.4 27.1 17.7 3.3 생산직 100.0 ( 66) 13.6 30.3 31.8 16.7 7.6 농수축산 100.0 ( 13) 23.1 53.8 7.7 7.7 7.7 공무원 100.0 ( 36) 11.1 47.2 19.4 13.9 8.3 교사 및 교수 100.0 ( 29) 24.1 17.2 31.0 17.2 10.3 학생 100.0 ( 132) 28.8 20.5 28.0 17.4 5.3 무직 100.0 ( 142) 28.9 28.9 19.0 17.6 5.6 기타 100.0 ( 80) 41.3 22.5 21.3 12.5 2.5 혼인상태 0.562 미혼 100.0 ( 705) 22.8 29.4 26.7 15.9 5.2 기혼 100.0 ( 500) 27.8 29.4 23.4 14.4 5.0 기타 100.0 ( 9) 22.2 44.4 11.1 22.2 건강상태 0.001** 매우건강 100.0 ( 145) 24.1 32.4 23.4 10.3 9.7 건강한 편 100.0 ( 498) 26.7 28.9 24.5 14.9 5.0 보통 100.0 ( 391) 23.8 31.7 28.1 13.8 2.6 건강하지 못함 100.0 ( 167) 24.0 24.6 21.6 24.0 6.0 매우 건강하지 못함 100.0 ( 13) 7.7 15.4 30.8 23.1 23.1 만성질환 유무 0.553 있음 100.0 (271) 24.0 27.3 26.6 17.3 4.8 없음 100.0 ( 804) 25.4 31.2 24.0 14.2 5.2 모름 100.0 ( 139) 23.7 23.7 29.5 18.0 5.0 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 351 <부표 4-34> 사용시간을 숨겨본 적이 있다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 37.6 23.3 20.7 13.0 5.4 성별 0.019** 남자 100.0 ( 684) 33.6 25.0 21.1 14.0 6.3 여자 100.0 ( 530) 42.6 21.1 20.2 11.7 4.3 연령 0.702 10대 100.0 ( 30) 33.3 26.7 20.0 16.7 3.3 20대 100.0 ( 342) 36.8 25.4 19.9 10.5 7.3 30대 100.0 ( 536) 36.6 22.9 20.3 14.7 5.4 40대 100.0 ( 221) 38.9 23.1 22.6 12.2 3.2 50대 이상 100.0 ( 85) 44.7 16.5 21.2 12.9 4.7 최종학력 0.808 초졸 100.0 ( 88) 47.7 20.5 13.6 13.6 4.5 중졸 100.0 ( 810) 37.0 24.0 21.4 12.5 5.2 고졸 100.0 ( 277) 35.7 22.4 21.7 14.1 6.1 대학교 졸업 이상 100.0 ( 39) 38.5 23.1 15.4 15.4 7.7 직업 0.007** 전문사무직 100.0 ( 535) 39.3 24.5 19.6 11.8 4.9 서비스판매직 100.0 ( 181) 32.0 21.5 22.7 19.9 3.9 생산직 100.0 ( 66) 22.7 27.3 27.3 13.6 9.1 농수축산 100.0 ( 13) 23.1 53.8 15.4 7.7 공무원 100.0 ( 36) 30.6 33.3 19.4 2.8 13.9 교사 및 교수 100.0 ( 29) 37.9 10.3 34.5 6.9 10.3 학생 100.0 ( 132) 35.6 22.0 21.2 15.2 6.1 무직 100.0 ( 142) 40.1 21.1 19.7 14.1 4.9 기타 100.0 ( 80) 55.0 17.5 15.0 7.5 5.0 혼인상태 0.714 미혼 100.0 ( 705) 36.2 24.7 20.4 12.8 6.0 기혼 100.0 ( 500) 39.2 21.6 21.2 13.4 4.6 기타 100.0 ( 9) 55.6 11.1 11.1 11.1 11.1 건강상태 0.110 매우건강 100.0 ( 145) 32.4 23.4 23.4 9.7 11.0 건강한 편 100.0 ( 498) 38.0 24.7 19.1 12.9 5.4 보통 100.0 ( 391) 38.9 22.3 23.0 12.8 3.1 건강하지 못함 100.0 ( 167) 37.7 22.2 18.0 16.8 5.4 매우 건강하지 못함 100.0 ( 13) 38.5 15.4 15.4 15.4 15.4 만성질환 유무 0.508 있음 100.0 (271) 37.3 23.6 20.3 12.9 5.9 없음 100.0 ( 804) 37.7 23.5 20.5 12.3 6.0 모름 100.0 ( 139) 37.4 21.6 22.3 17.3 1.4 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
352 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-35> 밖으로 외출하려하기 보다 인터넷에 접속해 있는 것이 좋다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 27.4 25.7 23.7 16.1 7.0 성별 0.235 남자 100.0 ( 684) 25.6 26.9 25.4 15.4 6.7 여자 100.0 ( 530) 29.8 24.2 21.5 17.2 7.4 연령 0.127 10대 100.0 ( 30) 46.7 13.3 13.3 16.7 10.0 20대 100.0 ( 342) 30.1 27.8 21.6 14.0 6.4 30대 100.0 ( 536) 25.2 26.7 23.9 16.6 7.6 40대 100.0 ( 221) 26.2 20.4 28.5 19.9 5.0 50대 이상 100.0 ( 85) 27.1 29.4 22.4 11.8 9.4 최종학력 0.009** 초졸 100.0 ( 88) 43.2 27.3 14.8 11.4 3.4 중졸 100.0 ( 810) 27.3 25.4 23.5 16.7 7.2 고졸 100.0 ( 277) 22.4 27.8 27.8 15.5 6.5 대학교 졸업 이상 100.0 ( 39) 30.8 12.8 20.5 20.5 15.4 직업 0.000*** 전문사무직 100.0 ( 535) 28.2 26.2 23.6 15.5 6.5 서비스판매직 100.0 ( 181) 21.5 25.4 33.1 16.0 3.9 생산직 100.0 ( 66) 15.2 13.6 37.9 25.8 7.6 농수축산 100.0 ( 13) 7.7 46.2 7.7 38.5 공무원 100.0 ( 36) 33.3 27.8 16.7 8.3 13.9 교사 및 교수 100.0 ( 29) 13.8 34.5 17.2 24.1 10.3 학생 100.0 ( 132) 35.6 24.2 18.2 12.9 9.1 무직 100.0 ( 142) 25.4 28.9 17.6 19.7 8.5 기타 100.0 ( 80) 41.3 22.5 20.0 8.8 7.5 혼인상태 0.212 미혼 100.0 ( 705) 24.7 27.4 23.5 17.2 7.2 기혼 100.0 ( 500) 31.0 23.8 24.0 14.6 6.6 기타 100.0 ( 9) 44.4 22.2 22.2 11.1 건강상태 0.006** 매우건강 100.0 ( 145) 31.0 23.4 22.8 13.8 9.0 건강한 편 100.0 ( 498) 28.5 28.1 22.9 14.1 6.4 보통 100.0 ( 391) 26.6 24.8 26.1 18.2 4.3 건강하지 못함 100.0 ( 167) 24.6 21.6 22.8 19.8 11.4 매우 건강하지 못함 100.0 ( 13) 7.7 38.5 7.7 15.4 30.8 만성질환 유무 0.711 있음 100.0 (271) 27.3 21.8 25.8 17.7 7.4 없음 100.0 ( 804) 27.5 27.5 23.1 15.2 6.7 모름 100.0 ( 139) 27.3 23.0 23.0 18.7 7.9 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
부록 353 <부표 4-36> 오프라인상태에서는 침울하며 신경질적이다가 온라인상에 오면 모두 사라진다. 계 0 1 2 3 4 P (단위: %) 계 100.0 (1,214) 40.9 22.2 20.6 10.1 6.1 성별 0.012** 남자 100.0 ( 684) 37.3 25.3 20.8 9.9 6.7 여자 100.0 ( 530) 45.7 18.3 20.4 10.4 5.3 연령 0.073* 10대 100.0 ( 30) 66.7 10.0 10.0 6.7 6.7 20대 100.0 ( 342) 46.5 20.8 17.8 9.9 5.0 30대 100.0 ( 536) 38.6 24.1 21.3 9.7 6.3 40대 100.0 ( 221) 34.8 21.7 25.3 12.7 5.4 50대 이상 100.0 ( 85) 40.0 22.4 18.8 8.2 10.6 최종학력 0.369 초졸 100.0 ( 88) 56.8 14.8 15.9 9.1 3.4 중졸 100.0 ( 810) 40.5 22.7 20.6 10.2 5.9 고졸 100.0 ( 277) 37.2 23.5 22.4 10.1 6.9 대학교 졸업 이상 100.0 ( 39) 41.0 20.5 17.9 10.3 10.3 직업 0.001** 전문사무직 100.0 ( 535) 42.4 22.1 20.9 9.3 5.2 서비스판매직 100.0 ( 181) 29.8 23.8 29.8 11.6 5.0 생산직 100.0 ( 66) 22.7 19.7 28.8 21.2 7.6 농수축산 100.0 ( 13) 38.5 23.1 30.8 7.7 공무원 100.0 ( 36) 44.4 30.6 8.3 8.3 8.3 교사 및 교수 100.0 ( 29) 34.5 20.7 24.1 10.3 10.3 학생 100.0 ( 132) 49.2 21.2 13.6 9.8 6.1 무직 100.0 ( 142) 45.8 16.9 19.0 7.7 10.6 기타 100.0 ( 80) 50.0 30.0 7.5 8.8 3.8 혼인상태 0.536 미혼 100.0 ( 705) 42.7 21.7 20.1 10.1 5.4 기혼 100.0 ( 500) 38.6 23.0 21.4 10.2 6.8 기타 100.0 ( 9) 33.3 22.2 11.1 11.1 22.2 건강상태 0.175 매우건강 100.0 ( 145) 40.0 17.2 21.4 11.0 10.3 건강한 편 100.0 ( 498) 43.2 22.7 19.5 8.6 6.0 보통 100.0 ( 391) 39.1 24.0 21.5 11.3 4.1 건강하지 못함 100.0 ( 167) 41.3 21.0 21.0 10.8 6.0 매우 건강하지 못함 100.0 ( 13) 15.4 23.1 23.1 15.4 23.1 만성질환 유무 0.942 있음 100.0 (271) 41.0 21.8 21.4 10.7 5.2 없음 100.0 ( 804) 41.5 22.5 19.7 10.1 6.2 모름 100.0 ( 139) 37.4 21.6 24.5 9.4 7.2 주: *p<0.1, ** P<0.05, *** P<0.001, 전혀 아니다 0 - 항상 있다 4
354 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-37> 자신의 미래를 희망적으로 느꼈습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 15.3 46.4 31.2 7.1 성별 0.119 남자 100.0 ( 684) 16.8 45.8 31.6 5.8 여자 100.0 ( 530) 13.4 47.2 30.8 8.7 연령 0.000*** 10대 100.0 ( 30) 20.0 60.0 16.7 3.3 20대 100.0 ( 342) 21.1 47.1 24.9 7.0 30대 100.0 ( 536) 14.6 47.2 30.8 7.5 40대 100.0 ( 221) 7.2 41.2 43.9 7.7 50대 이상 100.0 ( 85) 16.5 47.1 31.8 4.7 최종학력 0.017** 초졸 100.0 ( 88) 22.7 58.0 18.2 1.1 중졸 100.0 ( 810) 15.1 46.7 31.5 6.8 고졸 100.0 ( 277) 14.1 42.2 34.3 9.4 대학교 졸업 이상 100.0 ( 39) 12.8 43.6 33.3 10.3 직업 0.000*** 전문사무직 100.0 ( 535) 15.7 50.7 27.3 6.4 서비스판매직 100.0 ( 181) 12.7 38.1 40.9 8.3 생산직 100.0 ( 66) 13.6 37.9 42.4 6.1 농수축산 100.0 ( 13) 0.0 61.5 30.8 7.7 공무원 100.0 ( 36) 27.8 55.6 13.9 2.8 교사 및 교수 100.0 ( 29) 17.2 51.7 31.0 0.0 학생 100.0 ( 132) 22.0 48.5 24.2 5.3 무직 100.0 ( 142) 7.7 44.4 34.5 13.4 기타 100.0 ( 80) 18.8 35.0 40.0 6.3 혼인상태 0.086* 미혼 100.0 ( 705) 14.6 44.1 32.8 8.5 기혼 100.0 ( 500) 16.6 49.2 29.0 5.2 기타 100.0 ( 9) 0.0 66.7 33.3 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 33.8 45.5 15.2 5.5 건강한 편 100.0 ( 498) 17.9 55.8 22.9 3.4 보통 100.0 ( 391) 9.0 41.2 43.2 6.6 건강하지 못함 100.0 ( 167) 7.8 34.1 41.9 16.2 매우 건강하지 못함 100.0 ( 13) 0.0 7.7 30.8 61.5 만성질환 유무 0.000*** 있음 100.0 (271) 9.2 40.2 40.6 10.0 없음 100.0 ( 804) 18.2 49.0 27.7 5.1 모름 100.0 ( 139) 10.8 43.2 33.1 12.9 주: *p<0.1, ** P<0.05, *** P<0.001
부록 355 <부표 4-38> 부지런히 생활하며 일에 전념할 수 있었습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 14.4 52.5 29.2 3.9 성별 0.013** 남자 100.0 ( 684) 16.4 53.9 26.5 3.2 여자 100.0 ( 530) 11.9 50.6 32.8 4.7 연령 0.012** 10대 100.0 ( 30) 23.3 43.3 33.3 0.0 20대 100.0 ( 342) 19.3 50.6 25.7 4.4 30대 100.0 ( 536) 12.7 54.3 29.7 3.4 40대 100.0 ( 221) 7.7 52.5 35.3 4.5 50대 이상 100.0 ( 85) 20.0 51.8 23.5 4.7 최종학력 0.002** 초졸 100.0 ( 88) 25.0 55.7 18.2 1.1 중졸 100.0 ( 810) 13.7 54.6 28.4 3.3 고졸 100.0 ( 277) 13.0 47.3 34.3 5.4 대학교 졸업 이상 100.0 ( 39) 15.4 38.5 35.9 10.3 직업 0.006** 전문사무직 100.0 ( 535) 15.3 56.4 25.2 3.0 서비스판매직 100.0 ( 181) 10.5 49.7 34.8 5.0 생산직 100.0 ( 66) 10.6 54.5 33.3 1.5 농수축산 100.0 ( 13) 7.7 38.5 53.8 0.0 공무원 100.0 ( 36) 30.6 52.8 16.7 0.0 교사 및 교수 100.0 ( 29) 20.7 55.2 24.1 0.0 학생 100.0 ( 132) 16.7 47.7 30.3 5.3 무직 100.0 ( 142) 7.7 49.3 35.2 7.7 기타 100.0 ( 80) 20.0 45.0 31.3 3.8 혼인상태 0.267 미혼 100.0 ( 705) 13.5 50.6 31.2 4.7 기혼 100.0 ( 500) 15.8 55.0 26.4 2.8 기타 100.0 ( 9) 11.1 55.6 33.3 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 31.7 47.6 20.0 0.7 건강한 편 100.0 ( 498) 17.7 61.6 19.9 0.8 보통 100.0 ( 391) 7.4 51.7 35.0 5.9 건강하지 못함 100.0 ( 167) 7.2 32.9 52.1 7.8 매우 건강하지 못함 100.0 ( 13) 0.0 30.8 23.1 46.2 만성질환 유무 0.000*** 있음 100.0 (271) 9.6 46.9 38.4 5.2 없음 100.0 ( 804) 16.8 55.0 26.02 2.2 모름 100.0 ( 139) 10.1 48.9 30.2 10.8 주: *p<0.1, ** P<0.05, *** P<0.001
356 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 - 빅 데이터 활용방안을 중심으로 - <부표 4-39> 다른 사람들과 잘 지내는 것이 어렵지 않게 느껴졌습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 13.0 48.7 32.9 5.4 성별 0.169 남자 100.0 ( 684) 13.6 50.4 31.6 4.4 여자 100.0 ( 530) 12.3 46.4 34.7 6.6 연령 0.003** 10대 100.0 ( 30) 26.7 43.3 30.0 0.0 20대 100.0 ( 342) 17.8 43.9 31.0 7.3 30대 100.0 ( 536) 11.4 50.7 34.0 3.9 40대 100.0 ( 221) 8.6 48.0 36.2 7.2 50대 이상 100.0 ( 85) 10.6 58.8 27.1 3.5 최종학력 0.010** 초졸 100.0 ( 88) 19.3 56.8 21.6 2.3 중졸 100.0 ( 810) 12.8 49.6 33.1 4.4 고졸 100.0 ( 277) 11.2 43.0 36.8 9.0 대학교 졸업 이상 100.0 ( 39) 15.4 51.3 28.2 5.1 직업 0.016** 전문사무직 100.0 ( 535) 12.3 51.8 31.0 4.9 서비스판매직 100.0 ( 181) 9.4 51.4 35.4 3.9 생산직 100.0 ( 66) 10.6 37.9 43.9 7.6 농수축산 100.0 ( 13) 0.0 61.5 38.5 0.0 공무원 100.0 ( 36) 27.8 47.2 19.4 5.6 교사 및 교수 100.0 ( 29) 13.8 55.2 27.6 3.4 학생 100.0 ( 132) 22.0 42.4 28.0 7.6 무직 100.0 ( 142) 8.5 43.0 41.5 7.0 기타 100.0 ( 80) 16.3 47.5 31.3 5.0 혼인상태 0.413 미혼 100.0 ( 705) 14.0 46.1 33.8 6.1 기혼 100.0 ( 500) 11.6 52.2 31.8 4.4 기타 100.0 ( 9) 11.1 55.6 33.3 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 25.5 51.7 19.3 3.4 건강한 편 100.0 ( 498) 14.3 55.0 26.9 3.8 보통 100.0 ( 391) 9.5 45.8 39.6 5.1 건강하지 못함 100.0 ( 167) 7.2 37.1 46.7 9.0 매우 건강하지 못함 100.0 ( 13) 7.7 7.7 38.5 46.2 만성질환 유무 0.001** 있음 100.0 (271) 9.6 42.8 39.5 8.1 없음 100.0 ( 804) 14.2 51.4 30.6 3.9 모름 100.0 ( 139) 12.9 44.6 33.8 8.6 주: *p<0.1, ** P<0.05, *** P<0.001
부록 357 <부표 4-40> 전반적으로 자신이 일을 잘 하고 있다고 느꼈습니까? (단위: %) 계 매우 그렇다 그렇다 아니다 매우 아니다 P 계 100.0 (1,214) 14.4 56.3 25.3 4.0 성별 0.095* 남자 100.0 ( 684) 16.2 56.3 24.3 3.2 여자 100.0 ( 530) 12.1 56.4 26.6 4.9 연령 0.385 10대 100.0 ( 30) 20.0 53.3 26.7 0.0 20대 100.0 ( 342) 16.7 57.0 21.6 4.7 30대 100.0 ( 536) 14.2 55.4 26.5 3.9 40대 100.0 ( 221) 10.0 56.1 29.9 4.1 50대 이상 100.0 ( 85) 16.5 61.2 20.0 2.4 최종학력 0.022** 초졸 100.0 ( 88) 23.9 61.4 12.5 2.3 중졸 100.0 ( 810) 13.6 57.7 25.2 3.6 고졸 100.0 ( 277) 13.0 52.3 29.2 5.4 대학교 졸업 이상 100.0 ( 39) 20.5 46.2 28.2 5.1 직업 0.000*** 전문사무직 100.0 ( 535) 14.2 61.1 20.4 4.3 서비스판매직 100.0 ( 181) 11.6 48.6 35.9 3.9 생산직 100.0 ( 66) 7.6 63.6 25.8 3.0 농수축산 100.0 ( 13) 30.8 30.8 38.5 0.0 공무원 100.0 ( 36) 25.0 66.7 8.3 0.0 교사 및 교수 100.0 ( 29) 31.0 55.2 13.8 0.0 학생 100.0 ( 132) 18.9 52.3 25.0 3.8 무직 100.0 ( 142) 9.9 52.8 31.0 6.3 기타 100.0 ( 80) 15.0 48.8 33.8 2.5 혼인상태 0.224 미혼 100.0 ( 705) 13.3 54.6 27.4 4.7 기혼 100.0 ( 500) 16.0 58.8 22.2 3.0 기타 100.0 ( 9) 11.1 55.6 33.3 0.0 건강상태 0.000*** 매우건강 100.0 ( 145) 29.0 55.9 11.7 3.4 건강한 편 100.0 ( 498) 16.1 62.4 19.3 2.2 보통 100.0 ( 391) 9.4 56.8 29.4 4.1 건강하지 못함 100.0 ( 167) 7.8 41.3 44.9 6.0 매우 건강하지 못함 100.0 ( 13) 15.4 7.7 30.8 46.2 만성질환 유무 0.001** 있음 100.0 (271) 11.4 51.7 32.1 4.8 없음 100.0 ( 804) 15.9 59.0 22.1 3.0 모름 100.0 ( 139) 11.5 50.4 30.2 7.9 주: *p<0.1, ** P<0.05, *** P<0.001
간행물회원제 안내 회원에 대한 특전 본 연구원이 발행하는 판매용 보고서는 물론 보건복지포럼, 보건사회연구 도 무료로 받아보실 수 있으며 일반 서점에서 구입할 수 없는 비매용 간행물은 실비로 제공합니다. 가입기간 중 회비가 인상되는 경우라도 추가 부담이 없습니다. 회원종류 전체간행물회원 : 120,000원 보건분야 간행물회원 : 75,000원 사회분야 간행물회원 : 75,000원 정기간행물회원 : 35,000원 가입방법 홈페이지(www.kihasa.re.kr) - 발간자료 - 간행물구독안내 회비납부 홈페이지를 통해 신용카드 결제 온라인 입금 : 우리은행 019-219956-01-014 (예금주: 한국보건사회연구원) 문의처 (122-705) 서울특별시 은평구 진흥로 235 한국보건사회연구원 간행물 담당자 (Tel: 02-380-8157) KIHASA 도서 판매처 한국경제서적(총판) 737-7498 영풍문고(종로점) 399-5600 Yes24 http://www.yes24.com 교보문고(광화문점) 1544-1900 서울문고(종로점) 2198-2307 알라딘 http://www.aladdin.co.kr
연구보고서 발간목록 발간번호 보고서명 연구책임자 연구 2013-01 근거중심보건정책에 필요한 연구근거 현황 및 활용 김남순 연구 2013-02 국민건강증진기금사업의 운영현황과 개선방안 연구 김혜련 연구 2013-03 의료서비스산업의 경쟁구조 및 경영효율성에 관한 연구 김대중 연구 2013-04 보건의료서비스 분야의 소비자 위상과 권리 윤강재 연구 2013-05 식품분야 규제정책의 변화와 향후 식품안전 관리강화를 위한 규제합리화 정기혜 연구 2013-06 화장품 및 의약외품에 대한 소비자 중심적 연구 김정선 연구 2013-07 보건의료분야 국가연구개발사업 운영현황 및 개선방안 박은자 연구 2013-08 진료비지출 요인분석 및 거시적 관리방안 신현웅 연구 2013-09 의약품 정책이 의사의 처방에 미친 영향 연구 박실비아 연구 2013-10 한국의 건강불평등 지표와 정책과제 김동진 연구 2013-11 한국 의료의 질 보고서 설계 강희정 연구 2013-12 국민연금기금운용 중장기 정책수립 기금운영의 정책방향을 제시하는 실증적 연구 원종욱 연구 2013-13 소득분배 악화의 산업구조적 원인과 대응 방안 강신욱 연구 2013-14 소득계층별 순조세 부담의 분포에 관한 연구 남상호 연구 2013-15 저소득층 현금 및 현물서비스 복지지출의 사회경제적 영향분석 김태완 연구 2013-16 기회의 불평등 측정에 관한 연구: 성장배경을 중심으로 김문길 연구 2013-17 2013년 빈곤통계연보 임완섭/노대명 연구 2013-18 고용-복지 연계정책의 국제비교 연구: 한중일의 최근 정책변화를 중심으로 노대명 연구 2013-19 근로 및 사회정책에 대한 국민의식 분석 이현주 연구 2013-20 한국복지패널 연계 질적 연구(3차): 취약계층의 삶을 중심으로 김미곤 연구 2013-21 사회서비스 수요 공급의 지역단위 분석 연구 박세경 연구 2013-22 사회복지영역의 평가제도 분석 및 개선방안 정홍원 연구 2013-23 장애인의 자립생활 지원 방안: 발달장애인을 중심으로 김성희 연구 2013-24 장애인지원서비스의 질과 공급특성 분석 연구 박수지 연구 2013-25 복지재정 DB구축과 지표 분석 박인화 연구 2013-26 중앙과 지방의 복지재정형평화 연구 고제이 연구 2013-27 사회보장 중장기 재정추계 모형개발을 위한 연구 신화연 연구 2013-28 사회보장 재원조달에서의 세대 간 형평성 제고방안 연구 유근춘 연구 2013-29 의료기관의 개인정보 보호현황과 대책 정영철 연구 2013-30 우리나라 아동빈곤의 특성 정은희 연구 2013-31-01 한 중 일 인구동향과 국가 인구전략 이삼식 연구 2013-31-02 인구예측모형 국제비교 연구 이삼식 연구 2013-31-03 자녀 양육 지원 정책 평가와 개선 방안 신윤정 연구 2013-31-04 보육서비스 공급 적정성 분석 및 개선방안 연구 김은정 연구 2013-31-05 아동보호체계 연계성 제고방안 김미숙 연구 2013-31-06 여성고용 활성화 방안 연구 여유진 연구 2013-31-07 출산 보육 통계생산 및 관리효율화 연구 도세록