<4D F736F F D BDC5B1E2BCFA2DC0B1BFB5BCAE>

Similar documents
8월-이윤희-1.indd

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

Microsoft Word - 목차

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

160322_ADOP 상품 소개서_1.0

SIGIL 완벽입문

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

슬라이드 1

기사스크랩 (160317).hwp

IT현황리포트 내지 완

<B3EDB4DC28B1E8BCAEC7F6292E687770>

Political Science& International Relations EWHA WOMANS UNIVERSITY

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

TTA Journal No.157_서체변경.indd

해외과학기술동향


(5차 편집).hwp

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

<4D F736F F D20C3D6BDC B5BFC7E2202D20BAB9BBE7BABB>

XSS Attack - Real-World XSS Attacks, Chaining XSS and Other Attacks, Payloads for XSS Attacks

09오충원(613~623)

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

정보기술응용학회 발표

위해 사용된 기법에 대해 소개하고자 한다. 시각화와 자료구조를 동시에 활용하는 프로그램이 가지는 한계와 이를 극복하기 위한 시도들을 살펴봄으로서 소셜네트워크의 분석을 위한 접근 방안을 고찰해 보고자 한다. 2장에서는 실험에 사용된 인터넷 커뮤니티인 MLBPark 게시판

CONTENTS June 2007, VOL. 371 IP News IP Column IP Report IP Information Invention & Patent

<B3EDB9AEC0DBBCBAB9FD2E687770>

Data Industry White Paper

2017 년 1 학기 공학논문작성법 (3 강 ) 공학논문작성방법개요 좋은공학논문작성을위해서는무엇이필요한가? (1) 논리적이고정확하게글쓰기 (2강내용에연결 ) (2) Abstract 작성법의예

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

Microsoft Word - Westpac Korean Handouts.doc

´º½º·¹ÅÍ2¿ùÈ£

< FBEC8B3BBB9AE2E6169>

424

420

392

PowerPoint 프레젠테이션

CONTENTS September 2007, VOL. 374 IP News IP Column IP Report IP Information Invention & Patent

4 차산업혁명과지식서비스 l 저자 l 한형상 / 한국산업기술평가관리원지식서비스 PD 김 현 / 한국전자통신연구원 IoT 연구본부장 SUMMARY 4차산업혁명의성격은초연결 초융합 초지능의세키워드로요약된다. 초연결은사람, 사물등객체간의상호연결성이확장됨을말하며이는곧실시간데이

Research subject change trend analysis of Journal of Educational Information and Media Studies : Network text analysis of the last 20 years * The obje

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

006_026_특집_정일권.indd

Bitcoin_3.indd

52 l /08

PowerPoint 프레젠테이션

Microsoft Word - ICT Reprot

[한반도]한국의 ICT 현주소(송부)

도비라

( )전국네트워크


( )업계소식

( )업계소식(14.01월)

( )업계소식

소규모 비즈니스를 위한 플레이북 여기서 다룰 내용은 다음과 같습니다. 1. YouTube 소개 2. YouTube에서 비즈니스를 위한 채널 만들기 3. 눈길을 끄는 동영상 만들기 4. 고객의 액션 유도하기 5. 비즈니스에 중요한 잠재고객에게 더 많이 도달하기

Windows Live Hotmail Custom Domains Korea

BibLaTeX을 이용한 한국어 참고 문헌 처리의 가능성

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

3. 클라우드 컴퓨팅 상호 운용성 기반의 서비스 평가 방법론 개발.hwp

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

**09콘텐츠산업백서_1 2

이제는 쓸모없는 질문들 1. 스마트폰 열기가 과연 계속될까? 2. 언제 스마트폰이 일반 휴대폰을 앞지를까? (2010년 10%, 2012년 33% 예상) 3. 삼성의 스마트폰 OS 바다는 과연 성공할 수 있을까? 지금부터 기업들이 관심 가져야 할 질문들 1. 스마트폰은

Ch 1 머신러닝 개요.pptx

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C8F1BCF8>

04 특집

공공기관 지식경영

?

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

Amazon Stores

. 1, 3,,., ICT(),,.. 2 3,.. Player (, ) IT,. 3,...,.


성인용-칼라-단면-수정1030

슬라이드 1

조사보고서 구조화금융관점에서본금융위기 분석및시사점

용어사전 PDF

<4D F736F F D20C3D6BDC B5BFC7E2202D20BAB9BBE7BABB>

OP_Journalism

초보자를 위한 분산 캐시 활용 전략

<43494FB8AEC6F7C6AE5FB0F8B0A3C1A4BAB85FBCF6C1A42E687770>

프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음

<B9CCC3DFC8A6B5B5BCADB0FC C0DAB7E120B8F1B7CF B3E22036BFF9292E786C7378>


Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: A Study on the Opti

<C3D6BDC C0CCBDB4202D20BAB9BBE7BABB2E687770>

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Track2

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr

암호내지

XXXXXXXXXXXXX XXXXXXX

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

02 BRAND REPORT 여기서 내 친구들도 따로 나와는 별도의 가까운 친구들이 있다는 것이 핵심이다. 즉 A와 B가 알 고 B와 C가 서로 알지만 A와 C가 서로 모를 때 B 가 A와 C를 서로 소개시켜줄 수 있고 A가 B를 거 쳐 우연하게 C까지 도달해 친구를

Microsoft PowerPoint - e pptx

Microsoft PowerPoint - G3-2-박재우.pptx

ø©º∫∞˙ ∞Êøµ0


Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

2010 년 10 월넷째주 ( ) 1. IT와타산업융합위한민관노력강화 2. 한국, IT산업분야국제표준제안건수세계 1위달성 3. 한국, 3년연속세계브로드밴드경쟁력 1위기록 4. 삼성SDS, 2011년 IT메가트렌드선정 'Smart' 와 'Social' 이핵심

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

Transcription:

주간기술동향 2017. 10. 4. 페이크뉴스탐지기술동향과시사점 윤영석엄태원 * 안재영 * 이현우 ** 허재두 ** 한국전자통신연구원연구원한국전자통신연구원책임연구원 * 한국전자통신연구원본부장 ** I. 서론 미국 45 대대선과정에서페이크뉴스가광범위하게파급되면서페이크뉴스는뜨거운화두로떠올랐다. 미대선관련상위 20 개페이크뉴스에대한좋아요 공유 댓글등에대한페이스북반응 (870 만회 ) 이주류언론기관의상위 20 개진짜뉴스에대한페이스북반응 (730 만회 ) 을상회하였다 [3]. 미대선에서페이스북을통해확산된페이크뉴스중상위 5 개페이크뉴스는 [ 표 1] 과같이특정후보를겨냥하고조작된뉴스들이다. [ 표 1] 미 45 대대선중페이스북에서좋아요 공유 댓글반응을얻은상위 5 개페이크뉴스 번호 언론매체 개요및내용 반응수 비율 1 Ending the Fed 교황이트럼프지지선언 960,000 25.46% 2 The Political Insider 위키리크스가힐러리후보의 IS 무기판매확인 789,000 20.92% 3 Ending the Fed 유출된힐러리의 IS 이메일은상상초월 754,000 19.99% 4 Ending the Fed 법적관점에서힐러리는공무직자격결여 701,000 18.59% 5 Denver Guardian 힐러리의이메일유출의심 FBI 요원이시체로발견 567,000 15.04% 누계 3,771,000 100% < 자료 > BuzzFeed, This Analysis Shows How Viral Fake Election News Stories Outperformed Real News On Facebook, 2016. 11. 17. 가짜뉴스의진원지중하나인 Ending the Fed 은트럼프지지세력이었으며, 다른가짜뉴스제작자들은클릭광고수익창출이목적인것으로밝혀졌다 [3]. 결과적으로, 페이크뉴스이슈로인해소셜네트워크서비스의언론기능재정립, 페이크뉴스조기검진및확산방지기술개발에대한사회적요구가발생하게되었다. 페이스북은페이크뉴스방지와탐지를위한 * 본내용은윤영석연구원 ( 042-860-1594, isay@etri.re.kr) 에게문의하시기바랍니다. ** 본내용은필자의주관적인의견이며 IITP 의공식적인입장이아님을밝힙니다. 12 www.iitp.kr

ICT 신기술 기술개발을진행하고, 페이크뉴스로확인되는경우광고수익을막겠다는정책을밝혔다 [18]. 현재까지페이크뉴스에대한정의는학술적으로합의되지않았으나, 몇몇정의는찾아볼수있다. Allcott and Gentzkow[8] 는 독자들이오해할고의적이고검증가능한뉴스기사 로정의한바있다. 가디언지는 트래픽과이윤을극대화하기위해독자들을속이기위해설계되고만들어진기사 로정의하였다 [7]. 한편, 국내언론에서는페이크뉴스를 전체또는일정부분이사실이아닌정보에근거해만들어진기사나뉴스형태 라고정의한바있다 [20]. 정리하면페이크뉴스는의도를가지고전체또는일부가조작된뉴스기사를의미한다. 현재페이크뉴스탐지는사업자및연구자가개별적으로진행하고있어전체적인관점에서이를조망해보고기술및정책의방향을가늠할필요가있다. 본고에서는페이크뉴스탐지를위한다양한접근을살펴보고시사점을논하였다. II. 페이크뉴스탐지기법의개요와사례 1. 페이크뉴스탐지기법의유형페이크뉴스 (Fake news) 가사회적, 정치적문제로대두되면서다양한주체들이해법을제시하고있으며, 학술적연구도급속히진행되고있다. 이를토대로정리하면, [ 그림 1] 과같이페이크뉴스를탐지하는방법은크게비기술적방법과기술적방법으로분류할수있다. [ 그림 1] 페이크뉴스탐지기법유형 정보통신기술진흥센터 13

주간기술동향 2017. 10. 4. 2. 전문가기반페이크뉴스탐지기법전문가기반페이크뉴스탐지기법은뉴스의진위여부를전문성을가진기자가판단하는방법으로 CNN, 페이스북, 구글등이적용하고있다. 미국의주요방송매체인 CNN 은페이크뉴스를판별할팩트체크전담기자를채용하겠다고밝혔다 [15]. 페이스북독일지사는가짜뉴스판별을위한확인절차인 제 3 자사실확인 (third-party fact checker) 을도입하였다 [5],[11]. 사실확인에대한판단은페이스북이아니라비영리재단인 International Fact-Checking Network (IFCN) 이담당하며, 이는페이스북이외부단체에사실확인기능을위임함으로써미디어검열이라는비판에서자유로운전략적이점을가지기위한것이다. 현재 IFCN 에는 AP fact check, The Washington Post Fact Checker, Snopes 등전세계 28 개언론기관산하팩트체크조직이참여하고있다 [12]. IFCN 은페이크뉴스탐지에서발생할수있는공정성, 투명성문제를해결하기위해 5 개 원칙 (1 논파트너쉽및공정성, 2 정보 [ 그림 2] 페이스북전문가기반페이크뉴스탐지절차 원천의투명성, 3 자금과조직의투명성, 4 방법론의투명성, 5 개방적이고정직한오류수정 ) 을제정하고준수한다고밝혔다 [12]. 페이크뉴스탐지절차를살펴보면, 먼저사용자신고및리포트가페이스북에접수되면, 페이스북은이를팩트체크부서에전달한다. 다음으로언론매체인 IFCN 이협의를통해이를조사하고판단하여최종적으로페이크뉴스에 disputed 태그를부착하여일반인들이조작된정보임을쉽게인지하도록한다. 사용자신고및페이스북의조치는 [ 그림 3] 과같은인터페이스를통해확인할수있다 [5]. 다만, 페이스북은정보자체의통제는실시하지않기때문에, 사용자들은 disputed 태그가있는페이크뉴스도확인하고공유 [ 그림 3] 구글의 CrossCheck 프로젝트에서탐지한페이크뉴스 14 www.iitp.kr

ICT 신기술 할수있다. 한편, 구글은프랑스대선에서의페이크뉴스문제해소를위해협업기반뉴스확인플랫폼 CrossCheck 프로젝트를 2017 년 2 월개시하였다. CrossCheck 프로젝트는비영리단체 FDN (First Draft News) 이수행한다. CrossCheck 프로젝트에는 37 개전세계미디어회사들이참여하여, 온라인에서보고되고공유되는뉴스의원천과진위를검증하고 [4], 사실확인을통해해당기사의조작, 오도, 오보, 풍자여부에대한분석결과를제공한다. CrossCheck 를통해대선기간중탐지한페이크뉴스의예는 [ 그림 3] 과같다. 이기법은전문가가사실관계를확인한다는측면에서사실관계검증과정과결과가명료하고공신력이있는장점이있다. 그러나, 전문가의지식에전적으로의존한다는점, 소수의전문가들이정보를전수조사하기어렵다는점, 분석시간이요구된다는점등의한계가있다. 3. 집단지성기반페이크뉴스탐지기법페이크뉴스체커 (http://www.fakenewschecker.com) 는집단지성기반페이크뉴스탐지서비스를제공한바있다. 페이크뉴스체커는가짜뉴스판독을위한전문웹사이트로해당뉴스에대해참여자들이집단지성을바탕으로 신뢰할수있음 (trustworthy) 지표를평가하고공유하는방법을적용하였다. [ 그림 4] 와같이뉴스의신뢰성에의구심을가진사용자들은해당사이트를방문하여집단지성에의해판단된기사의신뢰성을확인할수있다. 그러나, 페이크뉴스체커의경우해당뉴스에대한사실확인이이서비스도메인내에서만가능하다는한계를가진다. 즉, 이용자들이해당뉴스의사실성에대한의구심을가지고적극적으로서비스에참여해야만집단지성을통한사실확인과정을거칠수있어, 사실확인의결과가전파되기어려울뿐더러사실확인의결과를완전히신뢰하기어렵다. 또한, 집단지성을통해생성된지식은검증과정을충분히거치지않아오류가있을수있고, 전문가들이집단지성에참여할동기가부족 하다. [ 그림 4] 집단지성기반페이크뉴스탐지서비스페이크뉴스체커 정보통신기술진흥센터 15

주간기술동향 2017. 10. 4. 유사한문제가페이크뉴스체커에서발생하였다. 미국의미디어업체 WND(WorldNetDaily) 는최근페이크뉴스체커가오히려페이크뉴스를생산한사례를뉴스로보도하였다 [19]. 페이크뉴스체커는 WND 가도널드트럼프에게자금을지원받았다는뉴스를보도하였으나, WND 는이를페이크뉴스라고반박보도하였다. 즉, 검증받지않은기관이사실여부를판단하고있다는것이다. 2017 년 8 월기준페이크뉴스체커웹사이트도메인매각이진행되고있으며, 페이크뉴스확인서비스를더이상제공하고있지않다. 집단지성기반페이크뉴스탐지기법은집단지성의오판가능성, 참여유인제공의어려움, 특별한검증과정이존재하지않는다는점등의한계점을가진다. 4. 인공지능기반페이크뉴스탐지기법인공지능기반페이크뉴스탐지는언어와구문을분석하여과거문제가된페이크뉴스에자주등장한단어와표현을기계에학습시켜페이크뉴스일확률을추정하는기법이다 [17]. 일례로구글은가짜리뷰탐지를위해 SVM(Super Vector Machine) 학습에리뷰어의행동데이터를결합하여분석하는기법을소개한바있다 [1]. 페이스북은최초폭력적인콘텐츠및동영상의확산을방지하기위해인공지능기술을도입하였고, 이후페이크뉴스이슈가대두되면서페이크뉴스탐지를위해관련기술을접목하였다 [9]. 한편, FiB 는페이스북이자체적으로제시한해법이아니라외부개발자들이페이스북에서의페이크뉴스문제를해결하기위해개발한페이크뉴스감지툴이다 [6]. FiB 는페이스북뉴스피드를스캔하고 AI 기술을적용하여실시간으로뉴스의출처, 이미지및기타링크의출처를 [ 그림 5] FiB 익스텐션설치후확인할수있는페이스북의확인됨 (verified) 태그 16 www.iitp.kr

ICT 신기술 [ 그림 6] 인공지능기반페이크뉴스탐지를위한 FiB 분석절차확인하고 확인된 (verified) 태그를 [ 그림 5] 와같이뉴스포스트에부착한다. 최근 FiB 는한글지원을개시하여국문작성뉴스기사에서도 FiB 를이용할수있다. FiB 의페이크뉴스분석절차는 [ 그림 6] 과같이정리될수있다. FiB 는자바스크립트기반의웹스크랩기술로링크, 포스트, 이미지정보를추출하고이를인공지능을통해기사의원출처를확인하는기능을제공한다 [6]. FiB 는이용가능한다양한외부 API 로구성된인공지능기술을페이크뉴스탐지에이용하였다 [6]. 이용된 API 는마이크로소프트의 cognitive services( 이미지 / 텍스트분석 /Bing web search), 트위터의 search API, 그리고구글의 Safe Browsing API 이며, 챗봇은페이스북의 wit.ai 를이용하였다. 백엔드 AI 는페이스북에포스팅된이미지와링크를이미지인식, 키워드추출, 소스확인등을통해확인한다. 사용자들은 FiB 를통해부착된페이스북포스트의 확인된 태그를통해기사의원출처가확인되었음을인지할수있다. 그러나, 2017 년 7 월 25 일현재전세계이용자수는 472 명에불과하여기술적완성도는높지않은것으로유추할수있다. 인공지능기반페이크뉴스탐지기법은데이터를기반으로학습된인공지능을이용하여신속한분석결과를얻을수있는장점이있다. 그럼에도불구하고, 충분한학습의필요성, 인공지능성능지표에대한사전정보의부재, 판단의정확도문제, 정밀하게조작된페이크뉴스의진단난해성문제등이향후해소되어야할과제들이다. 5. 시맨틱기반페이크뉴스탐지기법시맨틱기반페이크뉴스탐지는제목또는콘텐츠에내포된단어, 어절, 문장, 맥락을바탕으로분석하여내용의사실성을검증하는기법이다. 이기법은언어학을토대로 예측가능한기만언어 탐지가주목적이다. 과거에는분석대상을단어, 구문으로하여사전에정의된사 정보통신기술진흥센터 17

주간기술동향 2017. 10. 4. 전 (Dictionary) 과의비교를토대로사실성여부를판단하였으나, 최근에는이에더해문장에내포된의미와정보를추론하는시맨틱분석이각광받고있다. 시맨틱분석의기본적인분석메커니즘을제품리뷰를통해설명하면, 신뢰할수있는리뷰는다른신뢰할수있는리뷰의댓글과유사한댓글을받을가능성이높기때문에공통적인반응이발생할것이다. 반면, 해당제품에대해정확한경험이없는페이크리뷰의경우사실과상충되는표현이존재하거나사실을생략하는경우가보다빈번할것이다. 시맨틱분석은이러한차이를바탕으로사실과거짓을구분하는방법론이다. 구체적으로는, 속성-서술자 (attributedescriptor) 쌍으로구성된키워드를콘텐츠에서추출하고, 콘텐츠의프로파일 ( 유사데이터에서추출된데이터집합 ) 과비교하여적합성점수 (compatibility score) 를추정하여콘텐츠의사실여부를판단한다 [10]. 시맨틱기술은페이크리뷰탐지를위해구글과아마존이사용중인것으로알려져있다. 먼저텍스트문장을분석하여형태소분석, 개체명추출, 구문분석, 의미추출의과정을통해지식베이스를구축한다. 구축된지식베이스에시맨틱쿼리를통해사실여부를확인할수있다. 시맨틱기반페이크뉴스탐지는과학적, 역사적사실과같은지식의사실여부는축적된지식베이스를통해쉽게확인할수있으나, 근거없는실시간페이크뉴스확인은난해하다. 시맨틱기반페이크뉴스탐지기법은약 91% 의예측력을가진다고보고되고있지만 [10], 크게두가지한계점을가진다. 첫째, 충분한데이터가축적되어야분석이가능하며, 둘째, 속성과설명자를연결하는정확도가문제가된다. 따라서시맨틱기술기반페이크뉴스탐지는시맨틱단독으로사용되는것이아니라타기법과의결합을통해발전해나갈것으로전망된다. 6. 이상확산패턴감지기반페이크뉴스탐지기법이상확산패턴감지기반페이크뉴스탐지기법은확산경로를통해페이크뉴스를감지한다는측면에서차별성을가진다. 트위터데이터를이용하여분석한결과소셜네트워크상에서전파되는페이크뉴스는정상적인정보와언급패턴과확산경로측면에서상이하다 [14]. [ 그림 7] 은페이크뉴스와정상적인정보의언급횟수를시간축에따라기록한것이다. 페이크뉴스의경우약하고지속적인언급이발생하였으나, 정상적뉴스는페이크뉴스와달리단발성의강한언급이발생하였다. 이는페이크뉴스생산자들이목적달성을위해인위적으로페이크뉴스를지속하여전파하고자시도하기때문에발생한차이이다. 18 www.iitp.kr

ICT 신기술 < 자료 > S. Kwon, M. Cha, K. Jung, W. Chen, and Y. Wang, "Prominent features of rumor propagation in online social media," in Data Mining(ICDM), 2013 IEEE 13th International Conference on, 2013, pp. 1103-1108. [ 그림 7] 시간에따른페이크뉴스와정상뉴스의트위터상언급횟수 또한, 페이크뉴스의확산경로는다수의분산되고균일한노드를중심으로짧은정보확산 이관찰되어, 상관관계가없는사용자간에정보가산발적으로전파된다. 반면, 정상적인뉴스 는다양한전파경로를가지며특정노드에집중되어정보의전파가이루어진다 ([ 그림 8] 참조 ). A: 페이크뉴스 B: 정상뉴스 < 자료 > S. Kwon, M. Cha, K. Jung, W. Chen, and Y. Wang, "Prominent features of rumor propagation in online social media," in Data Mining(ICDM), 2013 IEEE 13th International Conference on, 2013, pp. 1103-1108. [ 그림 8] 페이크뉴스와정상뉴스의확산경로차이페이크뉴스와정상적인정보의확산패턴이다른이유는자극적인페이크뉴스는호기심을불러일으키기때문에상대적으로링크의개수가적은 ( 친구수가적은 ) 노드가전파하는반면, 링크의개수가큰노드는본인의평판훼손가능성으로인해페이크뉴스를전파하지않기때문이다 [14]. 이상확산패턴감지기반페이크뉴스탐지기술은 87~92% 에달하는페이크뉴스탐지예측력을보인다 [14]. 그러나, 이방법론의경우정보가확산된이후전파경로를파악할수있다 정보통신기술진흥센터 19

주간기술동향 2017. 10. 4. 는측면에서실시간분석능력부족이라는태생적한계를가질수밖에없다. 따라서, 이상확산 패턴감지기법은다른방법론을보완하는기술로활용될것으로전망된다. 7. 하이브리드방식페이크뉴스탐지기법하이브리드방식의페이크뉴스탐지기법은복수의분석메커니즘을결합해서페이크뉴스를탐지하는기법이다. 예를들어, 페이스북의경우전문가기반탐지기법과인공지능기반의탐지기법을결합하여페이크뉴스를탐지하고있다 [16]. 또한, KAIST 는이상확산패턴감지기법과언어적신호특징분석인시맨틱분석을동시에사용한새로운연구를발표하였다 [13]. 이연구에는정보확산네트워크에서발생하는이상패턴뿐아니라페이크뉴스의언어학적특징으로부정 (negation) 과회의 (skepticism) 관련단어가빈번히출현함을밝혔다 [13]. 하이브리드방식은각각의기법이가진장점을결합하여보다높은정확성과공신력을가질수있기때문에점차확산될것으로전망된다. 특히, 인공지능기반페이크뉴스탐지기법의경우인공지능의판단을완전히신뢰할수없으나신속한분석및진단이라는장점을가지고있기때문에다른기법과결합될가능성이높다. 따라서, 인공지능기반페이크뉴스탐지기법뿐아니라다양한기법들이결합되어페이크뉴스탐지에이용될것으로전망된다. 8. 페이크뉴스탐지기법요약본고에서살펴본페이크뉴스탐지기법들은 [ 표 2] 와같이정리될수있다. 현재에는비기술적접근이주류를이루고있으나향후기술적접근인인공지능기반탐지, 시맨틱기반탐지, 이상확산패턴감지기법이신속성과정확성을강점으로비기술적접근을보완하는하이브리드방식으로발전해나갈것이다. 페이스북은이미전문가기반탐지기법과인공지능기반탐지기법을함께사용하고있다. 충분한학습데이터만존재한다면인공지능기반탐지기법은우월한성능과신속한탐지능력을보여줄것이나, 학습데이터의부재와치밀하게조작된페이크뉴스탐지의어려움이있다. 한편, 시맨틱기반탐지기법은분석과정이잘설명되므로분석결과에대한명료한이해가가능하지만데이터축적비용과노력이상대적으로많이요구된다. 이상패턴확산감지기술은콘텐츠자체가아닌전파경로를분석의대상으로하여페이크뉴스여부를구분해내지만, 페이크뉴스확산이후에파악할수밖에없다는단점이있다. 각각의방식들은장점뿐아 20 www.iitp.kr

ICT 신기술 [ 표 2] 페이크뉴스탐지기법의유형및개요 구분방법론적용사례분석대상장점한계점 비기술적접근 기술적접근 전문가기반탐지 집단지성기반탐지 인공지능기반탐지 시맨틱기반탐지 이상확산패턴감지 하이브리드방식 Facebook Google Fakenewschecker Naver FiB Deeplearning.org Google Amazon.com - (KAIST 연구결과 ) Facebook 콘텐츠 / 생산자 콘텐츠 콘텐츠 콘텐츠 / 생산자 콘텐츠확산경로 콘텐츠 / 생산자 / 확산경로 공인언론매체의사실확인 군중의지혜활용및실시간성 신속한진단능력 결론도출의명료성 높은정확도 기술간장점결합 - 소수전문가에의존 - 뉴스전수조사불가 - 집단지성의오판가능성 - 적극적참여가전제 - 불충분한탐지능력 - 데이터축적필요 - 판단의정확성문제 - 정밀조작페이크뉴스진단난해 - 높은지식축적비용 - 자연어처리및형태소분석의정확성문제 - 사후분석 니라명료한한계점도존재하기때문에탐지기법간의보완과결합이진행될것임은쉽게예측 가능하다. III. 결론및시사점 본고에서는최근뜨거운관심을받고있는페이크뉴스탐지기법을유형화하고각각의탐지기법의개요와적용사례를살펴보았다. 지금까지의논의를바탕으로우리는다음과같은시사점을도출할수있다. 첫째, 페이크뉴스탐지방법론은비기술적, 기술적기법이혼재하여발전해가고있으나, 향후인공지능기술의발전과더불어하이브리드방식이주류를이룰것으로예상된다. 특히, 인공지능기반기법은신속한진단능력으로인해향후급속한확산이예상된다. 그러나, 인공지능의오류확인및전문가의최종검토를위해인공지능에전적으로의존하는것이아니라, 전문가와역할을분담하고협업하는하이브리드방식이점차확산될것으로전망된다. 둘째, 페이크뉴스판단및진단을위한기본요건은정확성, 신속성, 공정성, 투명성에있다. 디지털환경에서는뉴스의전파속도가빠르고그파급력이크기때문에신속한진단이반드시필요하다. 또한, 공정성과투명성의원칙은페이크뉴스탐지라는이름으로자행될수있 정보통신기술진흥센터 21

주간기술동향 2017. 10. 4. 는콘텐츠의자율성훼손방지를담보하기위한기본요건이된다. 일례로, 페이스북의사실확인외부조직 IFCN 은공정성과투명성을골자로한 5 개원칙을제정하였다. 셋째, 페이크뉴스여부의검증결과뿐아니라과정이함께제공되어야한다. 일례로구글의 CrossCheck 은페이크뉴스여부뿐아니라이기사의조작, 오도, 오보여부의정보를함께제공하여독자들로하여금판단의이유를납득시키고있다. 정보수용자들은맥락및상황과의연결을통해사실관계를합리적으로이해하고자시도하기때문에페이크뉴스에대한사실관계확인결과만을원하는것이아니라그과정을이해하길원하기때문이다. 넷째, 페이크뉴스탐지를위한분석대상은콘텐츠자체를넘어콘텐츠작성자를포함하게될것이다. 콘텐츠작성자의신뢰정보가입체적인데이터를통해분석되고뉴스와함께제공될수있다. 콘텐츠분석의경우신조어가사용되거나, 치밀하게조작된콘텐츠는분석이난해하다. 따라서, 향후에는이를넘어뉴스기사작성자의과거뉴스작성이력을토대로한신뢰정보가분석되어함께제공될수있다. 마지막으로, 페이크뉴스탐지를보다넓은관점에서디지털세상에서생성된다양한정보와지식의검증과확인이라는프레임으로이해할필요가있다. 왜냐하면뉴스뿐만아니라페이크리뷰, 페이크웹페이지등다양한페이크정보가존재하며, 이를 IoT 환경에서의자율판단과연결하여생각해본다면, 페이크정보가예상치못한문제를발생시킬위험이상존하기때문이다. 초연결지식정보사회로의진입을목전에둔현시점에서지식과정보의신뢰분석에대한심도깊은연구가절실히요구되는시점이다. [ 참고문헌 ] * [1] A. Mukherjee, V. Venkataraman, B. Liu, and N. Glance, Fake review detection: Classification and analysis of real and pseudo reviews, Technical Report UIC-CS-2013 03, University of Illinois at Chicago, Tech. Rep., 2013. [2] BuzzFeed, BuzzFeed News: Election content engagemenr, 2016. 11. 17. [3] BuzzFeed, This Analysis Shows How Viral Fake Election News Stories Outperformed Real News On Facebook, 2016. 11. 17. [4] CrossCheck, CrossCheck: A collaborative Journalism project, 2017. 2. 28. * 이논문은 2017 년도정부 ( 과학기술정보통신부 ) 의재원으로정보통신기술진흥센터의지원을받아수행된연구임. [2015-0-00533, 고신뢰사물지능생태계창출을위한 TII(Trusted Information Infrastructure) S/W 프레임워크개발 ] 22 www.iitp.kr

ICT 신기술 [5] Facebook, News Feed FYI: Addressing Hoaxes and Fake News, 2016. 12. 15. [6] FiB, FiB: Lets stop living a lie, 2016. [7] Guardian, What is fake news? How to spot it and what you can do to stop it., 2016. 12. 17. [8] H. Allcott and M. Gentzkow, Social media and fake news in the 2016 election, Journal of Economic Perspectives, vol.31, 2017, pp.211 236. [9] Investopedia, Facebook Is Using AI To Tackle Fake News(FB, GOOG), 2016. 12. 5. [10] N.J. Conroy, V.L. Rubin, and Y. Chen, Automatic deception detection: Methods for finding fake news, Proceedings of the Association for Information Science and Technology, vol.52, 2015, pp.-4. [11] Poynter, Facebook has a plan to fight fake news. Here s where we come in, 2016. 12. 15. [12] Poynter, International Fact-Checking Network fact-checkers code of principles, 2017. 1. 17. [13] S. Kwon, M. Cha, and K. Jung, Rumor detection over varying time windows, PloS one, vol.12, p.e0168344, 2017. [14] S. Kwon, M. Cha, K. Jung, W. Chen, and Y. Wang, Prominent features of rumor propagation in online social media, in Data Mining(ICDM), 2013 IEEE 13th International Conference on, 2013, pp.1103-1108. [15] SBS, 美 CNN, 가짜뉴스판별한다.. 팩트체커 뽑기로, 2017. 1. 21. [16] Techcrunch, Facebook chose to fight fake news with AI, not just user reports, 2016. 11. 14. [17] Techcrunch, Machine learning can fix Twitter, Facebook, and maybe even America, 2016. 11. 26. [18] TIME, Facebook Is Banning Fake News Websites From Generating Advertising Revenue, 2016. 11. 15. [19] WND, FAKE -NEWS CHECKER PUBLISHES FAKE NEWS, 2017. 2. 10. [20] 뉴스퀘어, 가짜뉴스 가판치는세상, 2017. 2. 5. 정보통신기술진흥센터 23