구글 검색을 통한 불법정보 유통 차단 기법 Ⅰ. 서 론 개인 정보는 개인에 관한 정보 가운데 직ㆍ간접적으로 각 개인을 식별할 수 있는 정보를 가리킨다. 2000년대 이후 지속적인 발전을 보인 인터넷 응용 분야로 인해 특정 개인을 식별하기 위한 개인정보의 이용도 증가하고



Similar documents
게시판 스팸 실시간 차단 시스템

1. 불건전정보 (1) 불건전정보의의미 불건전정보란사회의발전을저해하고사회에피해를가져오는정보를 의미하며, 불건전한정보중에는법으로금지되어있는정보를유포하는 불법정보와다른사람이나사회에피해를주는유해정보가포함됩니다. 유해정보 : 허가는되어있지만유통은제한되며, 콘텐츠의출판은허용되나

98 자료 개발 집필 지침

1. 상고이유 제1, 2점에 관하여 가. 먼저, 구 정보통신망 이용촉진 및 정보보호 등에 관한 법률( 법률 제11690호로 개정되기 전의 것, 이하 구 정보통신망법 이라 한다) 제44조의7 제3항이 정한 정보의 취급 거부 등 에 웹사이트의 웹호스팅

諛⑺넻?꾩뿰媛?遺€1?μ옱?몄쭛


rmi_박준용_final.PDF

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D D382E687770>

<C0FAC0DBB1C7B4DCC3BCBFACC7D5C8B85F BFACC2F7BAB8B0EDBCAD5FB8E9C1F62CB3BBC1F62E687770>

< FC8A8C6E4C0CCC1F620B0B3B9DF20BAB8BEC8B0A1C0CCB5E5C3D6C1BE28C0FAC0DBB1C7BBE8C1A6292E687770>

디지털포렌식학회 논문양식

인문사회과학기술융합학회

160322_ADOP 상품 소개서_1.0

PowerPoint 프레젠테이션

암호내지

표현의 자유

Web Scraper in 30 Minutes 강철

6강.hwp

SNS 명예훼손의 형사책임

01-02Àå_»ç·ÊÁýb74öÁ¤š

XXXXXXXXXXXXX XXXXXXX

XSS Attack - Real-World XSS Attacks, Chaining XSS and Other Attacks, Payloads for XSS Attacks

<30362E20C6EDC1FD2DB0EDBFB5B4EBB4D420BCF6C1A42E687770>

¾Æµ¿ÇÐ´ë º»¹®.hwp

제20회_해킹방지워크샵_(이재석)

<4D F736F F F696E74202D E20C0CEC5CDB3DD20C0C0BFEB20B9D720BCADBAF1BDBA20B1E2BCFA E >

PowerPoint 프레젠테이션

425.pdf

*2008년1월호진짜

TTA Journal No.157_서체변경.indd

Microsoft PowerPoint - chap01-C언어개요.pptx

정진명 남재원 떠오르고 있다. 배달앱서비스는 소비자가 배달 앱서비스를 이용하여 배달음식점을 찾고 음식 을 주문하며, 대금을 결제까지 할 수 있는 서비 스를 말한다. 배달앱서비스는 간편한 음식 주문 과 바로결제 서비스를 바탕으로 전 연령층에서 빠르게 보급되고 있는 반면,

개인정보보호의 이해 및 안전한 관리 - 개인PC 및 스마트폰 개인정보보호-

PowerPoint Template

e- 11 (Source: IMT strategy 1999 'PERMISSION ' ) The World Best Knowledge Providers Network

지난 2월 현직 부장판사가 네이버, 다음 등에서 기사에 악성 댓글 1만여 건을 단 사실이 드러났다. (출처 : JTBC, 상습적 악성 댓글 알고 보니 현직 부장 판사가, 2015년 2월 11일자) 헌법재판소는 인터넷을 가장 참여적인 시장 이자 표현촉진적인 매체 라고 했

(012~031)223교과(교)2-1

04.박락인(최종)치안정책연구 29-3.hwp

1217 WebTrafMon II

슬라이드 1

CMS-내지(서진이)

< FC1A4BAB8B9FDC7D D325FC3D6C1BEBABB2E687770>

2

Windows 8에서 BioStar 1 설치하기

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

2016년 신호등 10월호 내지.indd


Microsoft PowerPoint - ch02_인터넷 이해와 활용.ppt

<C8B8BDC5BFEB2DBBE7C0CCB9F6B8F0BFE5C1CB20B0FCB7C320C1B6BBE728C3CABEC8292E687770>

최종_백서 표지

API STORE 키발급및 API 사용가이드 Document Information 문서명 : API STORE 언어별 Client 사용가이드작성자 : 작성일 : 업무영역 : 버전 : 1 st Draft. 서브시스템 : 문서번호 : 단계 : Docum

(주)나우프로필의 이동형 대표 개편의 방향이 시민참여를 많이 하는 방향이라, 홈페이지 시안 이 매우 간편해져서 소통이 쉬워질 것 같다. 다만 웹보다 모바일 이용자가 지속적으로 급증하는 추세이므로 이에 적합한 구조가 되도록 보장해야 한다. 소셜미디어전략연구소 배운철 대표

<37322DC0CEB1C7BAB8C8A3BCF6BBE7C1D8C4A2C0C7B0DFC7A5B8ED5B315D2E687770>

국가정보보호백서 제1장 정보환경 변화와 정보보호 정보통신기술은 우리에게 보다 나은 미래를 제공해주는 원동력이자 현대사회에서 없어서는 안 될 필수불가결한 사회기반으로 여겨지고 있다. 또한 정보통신기술은 경제 성장의 원천이 되고 있으 며 사회 시스템의 효율성을

#WI DNS DDoS 공격악성코드분석

아동

13.11 ②분석


ActFax 4.31 Local Privilege Escalation Exploit

<C6F7C5D0BAB8B0EDBCAD5FC3D6C1BE2E687770>

DBPIA-NURIMEDIA

Çʸ§-¾÷¹«Æí¶÷.hwp.hwp

諛⑺넻?꾩뿰媛?遺€1?μ옱?몄쭛

<C1A4BAB8B9FDC7D031362D335F E687770>

1701_ADOP-소개서_3.3.key

정보통신망법상 임시조치 관련 1. 머리말 임시조치제도 ( 이하 임시조치 ) 란 정보통신망 이용촉진 및 정보보 호 등에 관한 법률 ( 이하 정보통신망법 ) 에서 규정하고 있는 권리 침해정보에 대한 규제제도로, 인터넷에 명예훼손이나 사생활침해 등 타인의 권리를 침해하는 정

SIGIL 완벽입문

Interstage5 SOAP서비스 설정 가이드

무제-1

PowerPoint Presentation

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

0125_ 워크샵 발표자료_완성.key

PWR PWR HDD HDD USB USB Quick Network Setup Guide xdsl/cable Modem PC DVR 1~3 1.. DVR DVR IP xdsl Cable xdsl Cable PC PC DDNS (

요 약 문 1. 제목 : 개인정보 오남용 유출 2차 피해 최소화 방안 2. 연구의 배경 개인정보란 살아 있는 개인에 관한 정보로서 개인을 알아볼 수 있는 정보로 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함한다.

< FBEC8B3BBB9AE2E6169>

4? [The Fourth Industrial Revolution] IT :,,,. : (AI), ,, 2, 4 3, : 4 3.


1. 자바프로그램기초 및개발환경 2 장 & 3 장. 자바개발도구 충남대학교 컴퓨터공학과

PowerPoint 프레젠테이션

Microsoft PowerPoint - web-part03-ch19-node.js기본.pptx

Microsoft PowerPoint - GUI _DB연동.ppt [호환 모드]

슬라이드 제목 없음

KISO저널 원고 작성 양식

PowerPoint Presentation

PowerPoint 프레젠테이션

< 목차 > 1. 악성코드은닉동향요약 1 2. 홈페이지은닉형악성코드통계 2 - 유포지탐지 국가별현황 2 - 대량경유지가탐지된유포지 TOP 악성코드유형별비율 4 - 악성코드취약점유형별비율 4 - 악성코드수집및분석결과 5 - 경유지탐지 업종별비율 9 3. 악성코

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: NCS : * A Study on

Data Industry White Paper

38이성식,안상락.hwp

PowerPoint 프레젠테이션

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

< FBBE7B0EDB3EBC6AE5FB5F0C6FAC6AEC6D0BDBABFF6B5E5C3EBBEE0C1A128BCF6C1A4292E687770>

Ⅰ. 서론 인터넷 이용의 보편화에 따라 인터넷이 우리 일상생활에서 차지하는 비중이 점차 늘고 있으나, 그에 반해 온라인상에서의 불법, 유해한 정보의 생산, 유통 등 역기능이 발생하여 심각한 사회문제가 되고 있다. 한국인터넷진흥원 조사결과에 따르면 온라인상에서 음란 선전

놀이동산미아찾기시스템

¾ç¼ºÄÀ-2

<B1B9C8B8C0D4B9FDC1B6BBE7C3B3BAB85F BB0DCBFEFC8A35B315D2E706466>

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

. PC PC 3 [ ] [ ], [ ] [ ] [ ] 3 [ ] [ ], 4 [ ] [ ], 4 [Internet Protocol Version 4 (TCP/IPv4)] 5 [ ] 6 [ IP (O)], [ DNS (B)] 7 [ ] 한국어 -

ICT EXPERT INTERVIEW ITS/ ICT? 차량과 인프라 간 통신(V2I) Nomadic 단말 통신(V2P) 차량 간 통신(V2V) IVN IVN [ 1] ITS/ ICT TTA Journal Vol.160 l 9

User Guide

Transcription:

The Techniques to Block Distribution for The Illegal Information Through Google Searching 구글 검색을 통한 불법정보 유통 차단 기법 - 개인정보 판매 게시글 차단을 중심으로 - 배 영 효, 이 금 녀 인천삼산경찰서 사이버수사팀, 인천지방경찰청 국제범죄수사대 The Techniques to Block Distribution for The Illegal Information Through Google Searching - Based on posting the sale of personal information - Young-Hyo Bae, Keum-Nea Lee Incheon Samsan Police Station, Incheon Metro Police Agency 요 최근 국내에서 개인정보 침해사고가 끊이지 않고 발생하고 있으며, 인터넷 게시판 등에 유출된 개인정보를 판매하는 광고가 다량으로 게시되고 있다. 이러한 광고를 통해 판매된 개인정보는 제2의 범죄로 이어질 가능성이 크기 때문에 이를 찾아내어 차단하는 시스템이 필요하다. 본 논문에서는 구글에서 검색되는 개인정보판매 게시글에서 자주 사용되는 단어의 형태를 분석하고, 해당 단어로 웹 크롤링 기법을 사용한 프로그램을 제작하여 구글에서 실시간으로 개인정보 판매 게시글을 찾아내어 해당 URL을 방송통신심의위원회 등에서 차단하는 방법을 제시하고자 한다. 주제어 : 불법정보, 개인정보, 차단시스템, 구글 약 ABSTRACT Privacy in domestic incident occurred, and the never ending, Internet message boards, and spilled a large amount of personal information to sell advertisements are published. These ads are sold through the privacy of a second, so they are likely to lead to crime, detect and block system is required. In this paper, a search on Google is selling your personal information in the form of a word that is often used in posts to analyze and, as the word with web crawling techniques to produce a program in real time on Google to find out personal information that URL sale posts Korea Communications Standards Commission to block the post is to propose. Keywords : illegal information, personal information, protection system, google Received 5 Aug. 2013, Revised 15 Dec. 2013. Accepted 23 Dec. 2013 제1저자(First Author) : Young-Hyo Bae (Email : cybersusa@police.go.kr) 교신저자(Corresponding Author) : Keum-Nea Lee (Email : twogold@police.go.kr) Journal of Korean Digital Forensics Society 2013 Dec.: 7(1) 77

구글 검색을 통한 불법정보 유통 차단 기법 Ⅰ. 서 론 개인 정보는 개인에 관한 정보 가운데 직ㆍ간접적으로 각 개인을 식별할 수 있는 정보를 가리킨다. 2000년대 이후 지속적인 발전을 보인 인터넷 응용 분야로 인해 특정 개인을 식별하기 위한 개인정보의 이용도 증가하고 있다. 행정안전부에서 실시한 2011년 정보화 통계조사에 따르 면 홈페이지 보유 사업체 26만 8천여개 중 홈페이지 방문자의 개인정보를 수집하고 있는 사업 체의 비율이 2010년 47.0% 12만6천여 개로 추정되어 2008년의 35.7%에 비해 11.3% 증가한 것으로 조사되었다. 그러나 온라인 과금이나 기타 정보서비스 제공 목적을 위한 개인정보 이용 의 꾸준한 증가는 필연적으로 제3자에 의한 정보의 수집과 저장을 유도한다.[1] 인터넷의 발달은 전자상거래의 활성화는 물론 전자정부 출현으로까지 이어져 국민생활의 편리함과 동시에 업무처리의 신속함까지 더해져 한층 풍요로운 삶을 영위할 수 있는 계기를 마련했다. 우리의 일상이 되어버린 인터넷뱅킹, 인터넷 쇼핑, 정보검색, SNS 등 인터넷이 없는 생활은 상상할 수 없을 정도의 현실이 되어 버렸다. 이러한 인터넷의 편리함은 포털사, 쇼핑몰 등에 회원가입을 해야 서비스를 받을 수 있고, 우리가 무심하게 입력하여 회원가입한 정보들은 기업의 서버에 저장되나, 기업은 개인정보들을 내부인의 유출이나, 외부 해커의 공격으로부터 온전하게 보관하지 못하는 경우가 있어, 한번 유출된 개인정보는 회수, 변경이 어렵고, 스미싱, 보이스피싱, 파밍 등의 범죄에 노출되고 있다. 반면, 인터넷상에서 사이버공격은 날로 지능화, 조직화, 첨단화 되어 가고 있는 상황이다. 또한 국내외 해커들은 금전적 이득을 얻기 위해 개인정보를 선호하고 있으며, 인터넷을 통한 개인 정보 유출사고는 끊임없이 발생하고 있는 실정이다. 표 1. 주요 개인정보 유출사례 사례 시기 내용 유출규모(명) 넥슨 2011.11 해킹으로 고객정보 1,320만 명분 유출 1,320만 SK컴즈(해킹) 2011.07 해킹(중국소재 IP)으로 네이트와 싸이월드 회원 3,500만명 정보 유출 3,500만 대부업체, 저축은행, 채팅사이트 등 (해킹) 2011.06 개인정보 DB 판매상들이 중국 해커에게 의뢰해 대부업체 사이트 등에서 1,900만명의 고객정보 유출 1,900만 신세계몰등 (해킹) 2010.03 개인정보 DB 판매상이 중국 해커에게 의뢰해 신세계몰 등에서 2,000만명의 개인정보 구입 2,000만 GS 칼텍스 (고의) 2008.09 GS칼텍스 자회사 직원이 GS칼텍스 상담 홈페이지에서 고객정보 1,151만명분을 DVD에 저장 1,151만 옥션 (해킹) 2008.02 해커가 옥션 웹서를 해킹하여 회원 1,863만명 개인정보 유출 1,863만 78 디지털포렌식연구 제7권 제1호 2013년 12월

The Techniques to Block Distribution for The Illegal Information Through Google Searching 위 [표 1]의 사례와 같이 2005년부터 현재까지 주요 기업 등에서 대량의 개인정보가 내부인 또 는 외부의 해킹으로부터 개인정보가 유출되었다. 해커들은 유출된 개인정보를 스미싱, 보이스 피싱 등 제3의 범죄를 노리는 범죄 집단 또는 인터넷에 광고하여 개인정보를 필요로 하는자 들에게 판매를 하고 있다. 최근 2년간 개인정보 유출사례건수가 6,400만명에 이르고 있으니, 국민 전부가 1번 이상의 개인정보가 유출되었다고 할 수 있다. 위 사례의 인천지방경찰청에서 검거한 2010. 3.월경 신세계몰 등(해킹) 사례에서도 피의자들은 해킹한 개인정보를 구글에서 광고하여 이를 보고 연락하는 개인정보 구매자들에게 메신져로 연락하여 대량으로 판매하였다. 위 개인정보들은 암호화하지 않은 plain text 그대로 유출되어 그 피해 규모가 더 컸다고 할 수 있다. 이미 유출된 개인정보들은 무분별하게 인터넷상에서 유포 되고 있으며, 현재에도 구글에서 디비팝니다, 디비판매 등의 검색어로 검색을 하면, 하루에도 수십개의 개인정보 판매 게시글이 검색되어, 이를 필요로 하는 수요자들은 이러한 광고를 보고 개인정보 판매자들에게 접근을 하여 개인정보를 구매하고 있다. 국내에서는 이러한 개인정보 판매 게시글을 감시하거나 게시글을 차단하지 못함으로 인하여 현재에도 국내에서 유출된 개인정보들이 암묵적으로 거래되고 있다. 한번 유출된 국민의 개인정보는 전파성이 굉장히 강한 특성을 가지고 있다. 한번 유출된 개인 정보 파일은 누군가에 의해 인터넷 메일, 메신져 등으로 급속히 퍼질 수 있기 때문이다. 본 논문에서는 구글에서 검색되는 개인정보판매 게시글에서 자주 사용되는 단어의 형태를 분석하고, 해당 단어로 웹 크롤링 기법을 사용한 프로그램을 제작하여 구글에서 실시간으로 개인정보 판매 게시글을 찾아내어 해당 URL을 방송통신심의위원회등에서 게시글을 차단하는 방법을 제시하고자 한다. Ⅱ. 인터넷 불법 유해 정보 불법 유해 정보는 인간이 문자를 발명한 이래로 항상 존재해왔다. 과거에도 지금도 미래에도 불법 유해 정보의 폐해는 계속되어 왔고, 인류는 사회공학적 차원에서 불법 유해 정보를 통제하는데 힘을 기울여왔다. 이러한 시도는 성공하는 듯이 보였지만, 새로운 매체환경의 도래와 함께 새롭게 등장한 불법 유해정보와 싸우는 상황은 지속되었다. 이는 마치 바이러스를 퇴치하기 위하여 개발되는 항생제와 이에 적응한 새로운 바이러스의 출현이 서로 창과 방패가 되어 끝없이 이어져나가는 상황과 유사하다고 할 수 있다. 국내 실정법상 온라인 불법 정보에 대한 분류체계 및 세부내용은 정보통신망 이용촉진 및 정보보호 등에 관한 법률이 가장 포괄적이고 직접적인 내용을 포함하고 있으며, 정보통신망법은 정보통신망의 이용을 촉진하고 정보통신서비스를 이용 하는 자의 개인정보를 보호함과 아울러 정보통신망을 건전하고 안전하게 이용할 수 있는 환경을 조성하여 국민생활의 향상과 공공복리의 증진에 이바지함을 목적으로 제정되었다.[2] Journal of Korean Digital Forensics Society 2013 Dec.: 7(1) 79

구글 검색을 통한 불법정보 유통 차단 기법 2.1 인터넷 불법 유해 정보의 개념 인터넷 정보는 정치, 경제, 사회, 문화의 모든 분야에 걸쳐 있으며, 그 형식이나 양태 역시 매우 다양하다. 사실상 인간이 만들고, 쌓아온 모든 정보가 인터넷상에서 유통되고 있다고 해도 과언이 아니며, 디지털화된 정보의 특성상 이종기기간 이식성, 정보간 융합성 역시 매우 뛰어나다. 실제로 인터넷 상의 정보는 인간이 상상할 수 있는 모든 형태의 정보가 만들어질 수 있고, 실제 로도 그러하다. 또한, 접근성이 아주 뛰어나 정보의 생성 자체가 쉽게, 저렴한 비용으로 만들어 질 수 있다. 인류가 지금까지 겪어보지 못한 정보의 홍수가 일어나고 있다고 볼 수 있다. 실제로 인터넷 불법 유해 정보에 대한 정의는 매우 다양하다. 간단하게 불법정보는 법적 규제를 받는 관련 정보이고, 범죄의 차원은 아니지만 윤리적, 도덕적으로 사회적 해악을 주는 정보를 유해정보라고 할 수 있다. 그러나 유해정보의 개념을 정의하는 것은 쉬운 일이 아니다. 기본적으로 불법유해정보의 정의에는 사회적, 역사적 맥락이 포함되어야 한다. 같은 정보라도 시기와 장소에 따라 달라질 수 있고, 같은 시기 같은 장소라고 하더라도 모든 사람들이 동의할 수 있는 기준을 세우는 것은 어려운 일이다. [2] 우리나라 법률상으로는 표 2.와 같이 정보통신망 이용촉진 및 정보보호 등에 관한 법률 제44조 7 불법정보의 대상 에 구체적으로 적시되어 있다. 이에 따르면, 음란한 전기통신, 명예훼손, 사이버스토킹, 해킹 바이러스 유포 등 9가지를 불법정보로 정의하고 있다. 표 2. 정보통신망이용촉진및정보보호등에관한 법률 제44조의7 불법정보의 대상 제1호 (음란한 전기통신) 제2호 (명예훼손) 제3호 (사이버스토킹) 제4호 (해킹, 바이러스 유포) 제5호 (청소년유해매체물 표시의무 위반) 제6호 (도박 등 사행행위) 음란한 부호 문언 음향 화상 또는 영상을 배포 판매 임대하거나 공연히 전시하는 내용의 정보 사람을 비방할 목적으로 공연히 사실 또는 허위의 사실을 적시하여 타인의 명예를 훼손하는 내용의 정보 공포심이나 불안감을 유발하는 부호 문언 음향 화상 또는 영상을 반복적으로 상대방에게 도달하게 하는 내용의 정보 정당한 사유없이 정보통신시스템, 데이터 또는 프로그램 등을 훼손 멸실 변경 위조하거나 그 운용을 방해하는 내용의 정보 청소년보호법에 의한 청소년유해매체물로서 상대방의 연령확인, 표시의무 등 법령에 의한 의무를 이행하지 아니하고 영리를 목적으로 제공하는 내용의 정보 법령에 의하여 금지되는 사행행위에 해당하는 내용의 정보 제7호 (국가기밀 누설) 법령에 의하여 분류된 비밀 등 국가기밀을 누설하는 내용의 정보 제8호 (국가보안법 위반) 국가보안법에서 금지하는 행위를 수행하는 내용의 정보 제9호 (범죄관련 정보) 범죄를 목적으로 하거나 교사 또는 방조하는 내용의 정보 80 디지털포렌식연구 제7권 제1호 2013년 12월

The Techniques to Block Distribution for The Illegal Information Through Google Searching 2.2 인터넷 불법 유해 정보 차단 정책 방송통신심의위원회는 정보통신에서의 건전한 문화를 창달하고 정보통신의 올바른 이용환경을 조성하기 위해 불법정보 및 청소년유해정보 등을 심의하고 있다. 이와 관련하여 방송통신위원 회의 설치 및 운영에 관한 법률 제21조제3호 및 제4호는 위원회의 직무 사항으로 정보통신망 이용촉진 및 정보보호 등에 관한 법률 제44조의7에 규정된 사항의 심의, 전기통신회선을 통하여 일반에게 공개되어 유통되는 정보 중 건전한 정보통신윤리의 함양을 위하여 필요한 사항 으로서 대통령령이 정하는 정보의 시의 및 시정요구 를 각각 규정하고 있다. 한편, 청소년 보호법 제8조제1항에 따른 심의기관으로서 방송통신심의위원회는 청소년 유해매체물의 결정 권한을 가지고 있다. 방송통신심의위원회의 심의는 방송통신위원회의 설치 및 운영에 관한 법률 제21조제4호 및 같은 법 시행령 제8조제1항에 따라 정보통신망 이용촉진 및 정보보호등에 관한 법률 제44조의7에 따른 불법정보 및 청소년에게 유해한 정보 등 심의가 필요하다고 인정되는 정보 를 대상으로 한다. 법령에 따른 심의대상 정보로서, 정보통신서비스제공자 등이 심의를 신청하거나 이용자 등이 위원회에 신고한 경우, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 제44조의7제2항 및 제3항에 따른 방송통신위원회의 심의요청이 있는 경우, 그 밖에 위원회가 모니터링, 중점조사 등을 통하여 심의가 필요하다고 인정한 경우에 위원회는 해당 정보의 불법 유해성 여부 등을 심의한다. 불법 유해정보에 대한 심의는 해당 직무의 수행을 위하여, 방송통신심의위원회가 방송통신위원회의 설치 및 운영에 관한 법률 제24조에 근거하여 제정 공표한 정보통신에 관한 심의규정 에 따라 이루어지며, 심의규정 위반 시 방송통신심의위원회는 해당 정보의 삭제 또는 접속차단, 이용자에 대한 이용정지 또는 이용해지 등의 시정요구를 하고 있다. 인터넷서비스제공자(ISP, Internet Service Provider) 또는 게시판 관리 운영자가 시정요구에 불응하는 경우 또는 정보통신에 관한 심의규정 위반 시 방송통신위원회는 불법정보에 대한 취급 거부 정지 또는 제한의 제재조치를 정하여 방송통신위원회에 제재조치 처분을 요청할 수 있다.[4] - 신고 - 자체인지 (네티즌, 윤리위 게임위 등) 심의 시정요구 주요 망사업자 불법성여부 결정 신규, 변경된 사이트 반영 국제관문국에서 해당사이트차단 (심의위) (심의위) (ISP망사업자) 그림 1. 우리나라의 불법 유해 정보 차단 체계 Journal of Korean Digital Forensics Society 2013 Dec.: 7(1) 81

구글 검색을 통한 불법정보 유통 차단 기법 2.3 인터넷 불법 유해 정보 차단 기술 2.3.1 IP 차단 방식 현재 친북 사이트는 IP방식으로 차단한다. IP방식은 중계(Proxy)서버를 이용하여 우회 접속이 가능하고 라우터에 별도의 부하를 주어 전체 인터넷 처리 속도 저하를 초래하기도 한다. IP 방식 : 해외관문국의 인터넷 연결 장비인 라우터에서 해당 IP주소를 직접 차단하는 방식으로 프락시 등 중계 서버를 이용하여 우회 시 차단불가 그림 2. IP 차단방법 2.3.2 DNS 변조 방식 도박, 음란 사이트는 대부분 DNS 변조 방식을 적용하여 차단한다. DNS 변조 방식은 이용자가 별도의 DNS 서버를 설정하거나 별도 소프트웨어(DNS Free 등) 이용하는 경우 쉽게 우회 가능 하여, 차단을 효율적으로 수행하지 못한다. DNS Free(DNS 자동변경 프로그램)는 포털 등에서 손쉽게 입수가능 DNS(Domain Name Sever)방식 : 인터넷주소를 IP주소로 변환하는 DNS서버에서 차단하는 기술로 Domain Name을 변경하거나 별도 DNS 사용시 차단불가 82 디지털포렌식연구 제7권 제1호 2013년 12월

The Techniques to Block Distribution for The Illegal Information Through Google Searching 그림 3. 정상적인 웹 접근 및 DNS 변조 방법 2.3.3 URL 차단 방식 IP 차단 방식과 DNS변조 차단 방식의 취약점을 보완하기 위해, 2008년 이후 ISP(기간통신 사업자)들은 URL 차단 방식 필터링 장비를 도입하였다. 해외 관문국에 URL 차단 전용장비를 설치하여 불법 유해사이트를 필터링 하는 방법으로 다음과 같은 장점이 있다. 1 Domain과 IP 단위의 차단뿐만 아니라 하위 디텍토리 및 페이지단위로 차단이 가능하다. (예 : www.big.or.jp/~jrldr/index.html)까지 차단 가능 URL 차단은 국제 게이트웨이에서 특정 IP 패킷에 목적지 IP 주소, 프락시서버 주소 등 관련 내용을 함께 보고 차단여부를 결정할 수 있어 DNS우회, 프락시 서버 등의 우회 접속도 차단가능하다. 프락시서버를 이용할 경우 IP 패킷에 프락시서버와 목적지 주소가 함께 포함되어 있어 URL 차단 장비에서 차단가능 2 도메인 네임서버나 라우터에 별도의 부하를 주지 않기 때문에 인터넷 속도에 영향이 없어 ISP 입장에서도 IP 차단시 우려되는 속도 저하 문제와 전국에 산재된 DNS 서버에 대하여 수작업 입력에 따른 관리상의 부담을 줄일 수 있다.[5] DNS Local Network Domain 차단 국제망 www.xxx.com 접속 요청 L7 Layer Internet PC 사용자 URL 차단 (Packet 분석) ISP Router IP 차단 (206.207.85.33) www.xxx.com 그림 4. 차단 방법별 개요도 Journal of Korean Digital Forensics Society 2013 Dec.: 7(1) 83

구글 검색을 통한 불법정보 유통 차단 기법 2.4 개인정보 판매 게시글 차단 법적 근거 본 논문에서 제시한 개인정보 판매 게시글 차단 시스템은 개인정보 판매 게시글 차단에 대해서 논의하였고, 이러한 글을 게시하는 자는 개인정보를 판매하려는 자들이다. 개인정보를 판매하려는 자는 정보통신망 이용촉진 및 정보보호등에 관한 법률 제49조 누구든지 정보통신망에 의하여 처리 보관 또는 전송되는 타인의 정보를 훼손하거나 타인의 비밀을 침해 도용 또는 누설하여 서는 아니 된다. 에 의하여 5년이하의 징역이나 5천만원 이하의 벌금에 처하도록 법률에 명시되어 있다. 여기에서 타인의 비밀이란 일반적으로 알려져 있지 않은 사실로서 이를 다른 사람에게 알리지 않는 것이 본인에게 이익이 있는 것을 의미한다.(대법원 2006. 3. 24. 선고 2005도 7309 판결) 위와 같이 개인정보 판매자들은 데이터베이스 서버에 보관 중 유출되었거나 보관중인 개인정보를 판매하는 것이며, 이는 개인정보의 각 주체자가 자신의 비밀 등이 담긴 정보가 다른 사람에게 알려지지 않는 것이 본인에게 이익이 됨은 당연하다. 또한, 이러한 개인정보를 선호하는 다른 사람이란 주로 범죄집단이므로, 개인정보의 주체자가 범죄의 피해 대상이 될 수 있는 것이다. 이러한 개인정보 판매 게시글은 정보통신망 이용촉진 및 정보보호등에 관한 법률 제44조의7 불법정보의대상 제9호(범죄관련정보) 범죄를 목적으로 하는 범죄에 해당하며, 방송통신위원회의 설치 및 운영에 관한 법률 시행령 제8조 제2항 제1호 해당 정보의 삭제 또는 접속차단 에 근거 하여 해당 게시글을 차단 할 수 있다. 개인정보 판매 게시글에 대한 법적 근거 개요도는 아래 [그림 5]와 같이 표현하였다. 그림 5. 개인정보 판매 게시글 차단 법적 근거 개요도 84 디지털포렌식연구 제7권 제1호 2013년 12월

The Techniques to Block Distribution for The Illegal Information Through Google Searching Ⅲ. 구글 검색을 통한 개인정보 판매 게시글 차단 기법 개인정보 판매자들은 국내외 게시판을 이용하여 개인정보 판매 게시글을 게시하여 광고하고 있고, 이를 보고 연락하는 개인정보 구매자들에게 개인정보를 판매하고 있다. 개인정보 구매자 들은 인터넷 검색사이트 구글 등에서 개인정보 판매자들을 찾고 있으며, 실제 구글사이트에서 개인정보 판매 게시글들은 손쉽게 검색이 가능한 실정이다. 본 논문에서는 구글에서 검색되는 개인정보 판매관련 게시글들을 찾아내는 시스템을 개발하여 해당 URL에 대해서 방송통신심의 위원회 등에서 게시글을 차단하는 방법을 제시하고자 한다. 3.1 구글 개인정보 판매 게시글에 대한 단어 형태 분석 인터넷 검색사이트 구글(www.google.co.kr)에서 개인정보 판매자들이 주로 사용하는 단어인 디비 팝니다 라는 검색어로 웹 페이지 게시글을 검색하였다. 구글에서 국내외 사이트의 웹문서 게시글 168,000개가 검색되었으며, 정확도 순으로 검색된 100개의 개인정보판매 게시글 중 97개의 게시글이 실제 개인정보 판매 게시글인 것을 확인하였다. 개인정보 판매게시글 중 30개를 표본 분석하여 해당 제목, URL 및 광고 게시글에 사용된 단어의 형태를 분석하였다. 개인정보 판매 게시글에서는 개인정보 판매 관련 검색어인 디비 팝니다, 대출디비 등의 단어가 주로 추출되었고, 게시글에서 개인정보 판매 관련 검색어 총 199개를 추출하였다. 개인정보 판매 게시글에서 추출한 단어에서 많이 사용되는 단어의 빈도수는 디비팝니다, 실시간디비, 부결디비, 대출디비, 완편디비 등의 순으로 많이 사용된 것으로 확인되며, 개인정보 판매 게시글에서 자주 사용되는 단어의 빈도 순위, 비율은 [표 3]과 같다. 표 3. 개인정보 판매 게시글내 관련 단어의 빈도 순위, 비율 연번 단어 횟수 비율 연번 단어 횟수 비율 1 디비팝니다 20 10% 6 각종디비 9 4.5% 2 실시간디비 13 6.5% 7 막디비 8 4% 3 부결디비 12 6% 8 최신디비 8 4% 4 대출디비 10 5% 9 저축은행디비 6 3% 5 완편디비 9 4.5% 10 토토디비 6 3% 3.2 개인정보 판매 게시글 차단시스템 설계 개인정보 판매 게시글 차단시스템은 Google Custom Search Api를 이용하여, 자바 네트워크 프로그램으로 3.1의 분석 결과와 같이 개인정보 판매자들이 게시글에서 자주 사용하는 단어인 Journal of Korean Digital Forensics Society 2013 Dec.: 7(1) 85

구글 검색을 통한 불법정보 유통 차단 기법 1 5 디비팝니다 에서 완편디비 까지 5개의 단어를 이용하여 구글에서 검색되는 개인정보 판매 의심 게시글의 제목, URL, Content 및 해당 URL로 연결되는 개인정보 판매 게시글 웹사이트의 html Source가 Database에 저장되도록 설계하였다. 위 Google Custom Search Api는 웹 페이지 및 다른 웹 응용프로그램에 Google 검색을 포함 할 수 있게 해주는 오픈 라이브러리이다. Flash 및 다른 비 자바스크립트 환경에서 API는 원시 인터페이스를 반환하고, 이 인터페이스는 대부분의 언어 및 런타임에서 쉽게 처리할 수 있는 JSON 인코딩 검색결과를 반환한다. Google Custom Search Api는 많은 Google 서비스(웹 검색, 지역 검색, 동영상 검색, 블로그 검색, 뉴스 검색, 도서 검색 및 이미지 검색)를 통해 인라인 검색을 수행하는 간단한 웹 개체를 제공한다. 차단시스템은 Java Thread를 이용하여 한시간에 한번씩 자동으로 실행되도록 하였으며, 해당 개인정보 판매 게시글 정보가 Database에 저장되도록 데몬으로 운용된다. 개인정보 판매자들은 게시글을 홍보하고, 구글 등에 노출되어 영업을 하기 위하여 같은 개인정보 판매 게시글을 여러 곳에 작성하고 있으므로, 해당 데몬을 이용하여 실시간으로 정보들을 DB목록화 할 수 있을 것으로 기대한다. 이후 방송통신심의위원회 등의 관리자가 위 Database에 저장한 정보를 Jsp(Java Server Page)로 구성한 관리자 웹사이트에서 볼 수 있도록 하였으며, 해당 관리자는 웹사이트에서 실제 개인정보 판매 게시글을 일괄 선택하여 실시간 차단할 수 있도록 설계하였다. [그림 6]. 이는 자바 네트워크 프로그램 데몬으로 저장한 개인정보 판매 의심 게시글 정보 및 웹페이지가 실제 개인정보 판매 게시글인지 확인하기 위해서는 해당 웹페이지를 직접 육안으로 보고 확인해야 하기 때문이다. 그림 6. 개인정보 판매 게시글 차단 시스템 설계도 86 디지털포렌식연구 제7권 제1호 2013년 12월

The Techniques to Block Distribution for The Illegal Information Through Google Searching 3.3 개인정보 판매게시글 차단 시스템 구현 개인정보 판매 게시글 차단을 위한 시스템은 구글에서 제공하는 Google Custom Search Api 및 무료로 배포되는 Java JDK 1.7.0_21, Tomcat 7.0, MySql 6.0 Workbench 에서 구동된다. 본 연구에서는 프로그램 개발의 효율성과 호환성을 높이기 위해 컴퓨터 시스템은 인텔 듀얼코어 프로세서와 주기억 메모리 2Gb로 구성하였다. 또한 컴퓨터 운영체제는 윈도우 XP 서비스팩 3와 프로그램 제작 에디터인 에디트플러스(EditPlus)를 사용하였다. 3.3.1 개인정보 판매게시글 차단 시스템 위 개인정보 판매게시글 차단 시스템 Daemon은 Java Thread를 이용하여 구현하였으며 개인 정보 판매상들이 많이 사용하는 단어 5개에 대해서 Google Custom Search에 쿼리하여 단어 한 개당 100개의 검색결과를 리턴받도록 설계하였으며, 데몬이 실행되면 한시간에 한번씩 Google Custom Search를 자동 호출하도록 하였다. 위 개인정보 판매 연관어인 5개의 단어가 Google Custom Search를 호출하는 형태는 https://www.googleapis.com/customsearch/v1?key= AIzaSyBHyybPykELC-2Scr_t0T8jaiBMCfBW5jA&cx=013036536707430787589:_pqjad5hr1a& q=디비팝니다&start=start&alt=json 와 같으며 구글에서는 해당 쿼리에 대한 결과값을 Json 형태로 리턴한다. JSONObject를 이용하여 해당 결과를 파싱하여 MySql Database에 저장되며, java 소스 코드의 일부는 [표 4]와 같다. 표 4. 개인정보 판매 게시글 차단 시스템 자바 코드(일부) public void googlequery() { try { String [] ar = {"디비팝니다", "부결디비", "대출디비", "토토디비", "완편디비"}; for (int v = 0; v < ar.length; v++) { int start=1; Google custom search api String qq= URLEncoder.encode(ar[v], "UTF-8"); for (int a = 0; a < 10; a++) { try { StringBuilder builder = new StringBuilder(); if (a!=0) start = start + 10; String query = "https://www.googleapis.com/customsearch/"; query = query +"v1?key=aizasycmgfddasfjqv5zyos0mtjnot3e9murwku"; query = query +"&cx=018021731902419050792:xgyk4jh3mua"; query = query +"&q="+qq+"&start="+start+"&alt=json"; URL url = new URL(query); HttpURLConnection conn = (HttpURLConnection) url.openconnection(); conn.setrequestmethod("get"); conn.setrequestproperty("accept", "application/json"); BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream(),"UTF-8")); String output; while ((output = br.readline())!= null) { builder.append(output); } Journal of Korean Digital Forensics Society 2013 Dec.: 7(1) 87

구글 검색을 통한 불법정보 유통 차단 기법 3.3.2. 개인정보 판매게시글 차단 시스템 데몬 실행 2013. 11. 25. 14:00 ~ 11. 28. 24:00.까지 위 자바로 구현한 개인정보 판매 게시글 차단 시스템의 데몬을 실행하여 개인정보판매 의심 게시글 788개를 MySql Database에 저장할 수 있었으며, 프로그램의 1회 평균 실행 시간은 5분24초가 걸렸다. 데몬을 실행하여 해당 단어별로 Database에 저장한 개인정보 판매 의심 게시글의 개수는 [표 5]와 같다. 표 5. 개인정보 판매게시글 차단 시스템 실행 결과 연번 단어 검색일시 검색 게시글(개) 실제 개인정보 게시글(개) 비율 1 디비팝니다 2013.11.25. 2013.11.28 168 145 86% 2 실시간디비 상동 222 211 95% 3 부결디비 상동 169 158 93% 4 대출디비 상동 110 101 91% 5 완편디비 상동 119 105 88% 합계 788 720 91% 시스템 데몬을 최초 실행시 427개의 개인정보 판매 의심 게시글의 정보를 저장할 수 있었으며, 그 후 82시간동안 한시간에 한번씩 데몬을 실행하여 실시간으로 올라오는 개인정보 판매 의심 게시글 361개의 정보를 추가로 저장할 수 있었다. 이는 본 논문에서 제작한 차단시스템이 실시 간으로 개인정보 판매 의심 게시글을 수집할 수 있음을 보여준다. 수집한 개인정보 판매 의심 게시글 총 788개 중 722개의 게시글이 실제 개인정보 판매 게시 글로 확인되었으며, 이러한 방법으로 계속하여 개인정보 판매 게시글 URL을 실시간으로 차단할 경우 본 논문에서 제안한 시스템이 개인정보 유출방지에 상당한 기여를 할 것으로 기대한다. 3.3.3 관리자 페이지 위와 같이 저장한 개인정보 판매 의심 게시글 정보를 방송통신위원회 관리자 페이지에서 볼 수 있는 jsp(java Server Page) 구현 페이지는 [그림 7]과 같이 설계하였다. 관리자는 jsp 페이지 에서 실제 개인정보 판매글을 판별하여, 일괄 선택한 후 차단할 수 있을 것이다. 88 디지털포렌식연구 제7권 제1호 2013년 12월

The Techniques to Block Distribution for The Illegal Information Through Google Searching 수집된 개인정보 판매 의심 게시글 그림 7. 관리자 페이지 실행화면 (검색봇으로 수집한 개인정보 판매 게시글 정보) 3.4 구글 검색 게시글 차단 시스템 활용방안 현재 범죄를 목적으로 하는 불법 유해정보 인터넷 게시글에 대해서 방송통신심의위원회등 에서는 인력을 이용한 모니터링 및 신고 접수를 통하여 심의의결 및 접속 차단을 하고 있으나, 불법 유해 정보 검색 시스템 등을 이용한 차단 시스템은 없는 실정이다. 또한 기존의 불법정보 차단 등의 연구 방법에서는 본 논문에서와 같이 프로그램을 이용한 불법정보 탐지 등에 대한 연구 사례는 없었다. 본 논문에서는 개인정보 판매 게시글에 한해서 해당 키워드를 이용하여 google custom search api를 이용한 개인정보 판매 의심 게시글을 추출하였다. 해당 키워드로 검색봇을 제작하여 개인정보 판매 의심 게시글을 수집하였으며, 개인정보 판매 게시글에 대한 정확도는 상당한 수준으로 확인하였다. 다른 불법 유해 정보들에 대해서도 해당 범죄 관련 키워드, 특히 범죄를 목적으로 하는 게시글 에서 사용하는 은어 등을 이용하여 본 차단 시스템에서 활용하면 불법 유해 정보 광고 게시글 검색 및 차단이 가능할 것이다. Journal of Korean Digital Forensics Society 2013 Dec.: 7(1) 89

구글 검색을 통한 불법정보 유통 차단 기법 Ⅳ. 결 론 인터넷에서 통용되는 광범위한 콘텐츠와 온라인에서 일어나는 수많은 활동들은 대개는 긍정적 이고 건설적인 변화들로 간주 되지만, 동시에 상당수의 불법 유해 행위들 역시 인터넷상에서 만연하고 있는 것이 사실이다. 인터넷의 편리함 뒤편에는 중요 개인 정보가 노출 및 유출될 수 있는 점을 간과할 수가 없다. 이미 개인정보 유출과 같은 보안문제는 빈번하게 뉴스를 장식하고 있고 개인정보 유출 및 금전적 피해가 더욱 확산될 것이라는 것은 인터넷화 되어 가는 우리 실생활을 보아도 어렵지 않게 예측이 가능하다. 포털사, 쇼핑몰, 기업 등의 서버 등에 저장되어 있는 소중한 개인정보가 유출되어 범죄에 이용되고 있으며, 개인정보가 필요한 범죄자들은 인터넷을 통하여 개인정보 광고 게시글을 보고, 개인정보 판매자들에게 메신져 등으로 연락하여 손쉽게 개인정보를 취득하고 범죄에 이용 하고 있다. 이에 본 논문에서는 범죄자들이 개인정보 취득시 이용하는 검색사이트인 구글 검색 결과에 나오는 개인정보 판매 게시글을 실시간으로 차단하는 방안에 대해서 제안하였다. 제안된 방법을 통해 개인정보 판매 게시글을 차단하여 개인정보 유출 방지에 도움이 되었으면 한다. 또한 다른 범죄를 목적으로 하는 게시글에 대한 불법정보의 키워드를 설정하여, 차단시스템을 활용하면 범죄를 목적으로 하는 불법정보를 차단할 수 있을 것이다. 90 디지털포렌식연구 제7권 제1호 2013년 12월

The Techniques to Block Distribution for The Illegal Information Through Google Searching 참 고 문 헌 [1] Personal Informaion Protection Commission, Personal Information Protection Annual Report, pp. 9, 2012 [2] Korea Communications Standards Commission, The Study for plan for reaction the internet illegal and noxious information. pp. 5-6, 2012.12 [3] Yeo Seong Yun, Jin ho Yu, Analysis for law and system of illegal and noxious information pp. 54, 2013.8 [4] Korea Communications Standards Commission, Year Book of Korea Communications Standards, pp. 96-97, 2009 [5] Korea Communications Commission, A Technical Investigation and Supply on the Circuital Connection of Illegal Information, pp. 47-49, 2010.11 Journal of Korean Digital Forensics Society 2013 Dec.: 7(1) 91

구글 검색을 통한 불법정보 유통 차단 기법 著 者 紹 介 배 영 효 (Young-Hyo Bae) 2002년 8월 : 인천대학교 산업공학과 졸업 2006년 7월~현재 : 인천지방경찰청(사이버수사) 재직중 2012년 9월~현재 : 고려대학교 정보보호대학원 석사과정 관심분야 : 디지털 포렌식, 개인정보, 악성코드, 정보보호 등 이 금 녀 (Keum-Nea Lee) 정회원 2001년 2월 : 인천대학교 수학교육학과 석사 2001년 10월~현재 : 인천지방경찰청 국제범죄수사대 산업기술유출수사팀 근무 2012년 8월~현재 : 고려대학교 디지털포렌식학과 석사과정 관심분야 : 디지털 포렌식, 산업기술유출수사 등 92 디지털포렌식연구 제7권 제1호 2013년 12월