최근 IT(ICT) 와관련하여많은관심을갖는분야중에하나가아마빅데이터 (Big-Data) 일것이다. 빅데이터란 IBM 이정의하기를크기 (Volume: Big data) 와다양성 (Variety: Image, text, censor), 그리고생성속도 (Velocity: fast data) 로표현한다. 빅데이터는기존 SW(Software) 의수집, 관리, 분석역량을넘어서는대규모의데이터를말한다. 최근에데이터를수집, 저장, 처리, 분석하는기술뿐만아니라관련된인재와조직을포괄하는개념으로정의되고있는것이빅데이터이다.( 김화종외 1, 2012) 사실초창기컴퓨터로업무를처리하던시기에는컴퓨터의처리능력이떨어지고, 저장장치의크기가작아서중요한부분들만컴퓨터에저장하려고하였다. 이후시대가바뀌어서컴퓨터처리능력이급속히좋아지고, 대규모데이터를저장할수있는장치가만들어지면서많은자료들을컴퓨터에본격적으로저장할수있는시대가된것이다. 여기에인터넷이활성화되고, 이를통한이메일및스마트폰등의사용이본격화되면서저장하는데이터형태들도글자나문자중심에서그림, 동영상등매우다양한형태로변화되고있다. 특히스마트폰을중심으로다양한양방향성미디어매체들에대한사용이급속히늘어가면서이러한매체들을통한데이터증가량이가히폭발적으로나타나고있다. 새로운모바일장치 (Device) 와 SNS(Social Network Service) 가대중화되면서트위터 (Twitter) 에는하루에 2 억개이상의글이올라오고있으며, 페이스북 (Facebook) 은하루 5 억건이상의정보가갱신 (Update) 되고있다고한다.( 김정일, 2012) 내이버 (Naver) 검색창에서 쇼핑 을치면 340 만개의블로그 (Blog) 와 225 만개의이미지 (Image), 68 만건의뉴스, 3 만 2 천개의온라인카페 (Cafe), 1000 개의사이트가뜬다고한다. ( 김정일, 2012)
이렇게폭발적으로증가하고있는데이터들을유용하게사용하고자노력하는모습들이서서히나타났다. 많은데이터들에서의미있는데이터를추출하여가치창출을선순환 (Forward loop) 시키는대표적인사례가 구글번역 (Google Translate) 서비스이다. 구글번역서비스의전세계월이용자수는 2012 년초 2 억명을육박했다고한다. 구글의이러한서비스는약백만권의도서에해당하는텍스트를번역하고있고, 언어서비스도 62 개로확대하였다. 구글은이를통해확보한사용흔적데이터를재활용해서모바일단말에서촬영한사진속의텍스트 (Text) 번역, 유튜브의비디어자막, 스마트폰을통한통역서비스등에활용하고있다. 이러한것이빅데이터를활용하여의미있는가치를추출하는것이며, 가치의재창출하는것이다. ( 송민정, 2012) 본고에서는이러한현실에서관광분야에이러한빅데이터를도입하기위해먼저빅데이터가무엇인지? 이들의개념과정의를다양한사용예들을통해서설명하고자한다. 아울러현재어느부문의산업에서빅데이터가사용되고있으며, 향후미래엔어떻게활용될수있는지등을다양한사례및전문기관의제시등을통해설명하고자한다. 아울러향후관광부문에서는어떻게빅데이터가적용될수있을것인가? 하는실제적인문제들에대해서도그사용의가능성을살펴보고자한다. SNS 와스마트폰은개인정보와위치정보를기반으로한다양한거래데이터가만들어지게됨으로여기서획득한데이터들은과거자료와는비교할수없을정도로정보로서그가치가높다. 그이유는이러한자료는살아있는자료로서개인의정확한상황을파악할수있기때문에이를다양하게활용할여지가많다. 페이스북의경우매출이 5 조원정도수준인데 IPO(Initial Public Offering: 기업공개 ) 시그가치는 100 조원에달한다고한다. 이것은페이스북이갖고있는데이터기반으로전개할수있는다양한비즈니스의가능성이매우높기때문에이를긍정적으로평가한것으로볼수있다. ( 김정일, 2012) 결국유용하고, 가치가있는데이터들을얼마나많이시스템에갖고있느냐하는것이중요한시대가된것이다. 이러한것들을고려해볼때, 결국빅데이터란 ' 기존 IT 시스템이데이터를수집, 관리, 분석하는역량을넘어서는대규모의방대한데이터 ' 라고말할수있다. 아니종래에는볼수없었던 다양한형태의데이터가빠른속도로생성되는대량의데이터 라고말할수있다. 빅데이터는일반적으로너무거대 (Huge: Big data) 하고, 빠르며 (Fast), 이질성 (Heterogeneous) 이라는 3 가지특징을갖고있다고한다. 여기에 Gartner 는복잡성 (Complicated) 을추가하여 4 가지특징을갖고있다고말한다.
< 표 -1> 에서와같이빅데이터의이러한특징을잘이해하여, 많은데이터들에서예전에는몰랐거나, 사용하지않았던다양한패턴들을발견하고, 변화하는비즈니스환경에대해보다예리한빅 (Big) 인사이트를갖는것이매우필요하게되었다. 여기서빅인사이트는빅데이터그자체로가능한것이아니라이를잘활용하여서의미있는데이터추출 (Data Selection) 이가능할때빅인사이트 (insight) 가실현될수있는것이다. *insight: 시행착오행동없이일어나는즉각적이고불명한지각이나이해 향후빅데이터변화에대해 ' 데이터를얻는능력, 즉데이터를이해하는능력, 처리하는능력, 가치를뽑아내는능력, 시각화하는능력, 전달하는능력이야말로앞으로 10 년간엄청나게중요한능력이될것이다. ( 할배리언, 구글의수석경제학자.) 빅데이터의향후변화에대해다양한분야의전문가들이많은관심을갖고있다. 또한이러한변화에서중요한역할을한것이웹 (Web) 의진화라고할수있다.
웹 1.0 시대에서소셜네트워크로대변되는웹 2.0 시대로이동하면서이제모바일웹과데이터웹으로대변되는시대에많은데이터를어떻게분석하고이를다양한산업부문에어떻게활용할수있는가가중요한이슈로떠오르기시작한것이다. 버지니아로메티, IBM CEO 는 앞으로모든산업에서데이터가승자와패자를가를것이다. 또한빠르게클라우드시장에진출한아마존닷컴의 CEO 인제프베조스는 우리는절대로데이터를내다버리지않는다. 그동안내쳐놓았던, 복잡하고쓸모없어보였던대용량데이터, 서버 (Server) 용량만차지해온그애물단지같은데이터가미래경쟁력을좌우하는 21 세기원유다.(Gartner, 2011) 라는말로향후미래사회에서빅데이터의중요성을강조하고있다. 특히스마트폰을중심으로다양한양방향성미디어매체들에대한사용이급속히늘어가면서이러한매체들을통한데이터량이폭발적으로증가하고있다. 웹의진화는다양한형태의데이터를폭발적으로만들어냈고, 세상을이해하고, 어떠한문제들을해결하기위해선이러한많은데이터를분석하고최적화를통해서중요한의사결정등에사용할수밖에없는현실에살게된것이다. 2010 년한컨퍼런스에서구글의 CEO 인에릭슈미트는 인류문명이시작된이래 2003 년까지만들어진데이터량이 5 엑사바이트 (Hexa-Byte: 5 10**18) 에불과했으나, 지금은이틀마다그만큼의데이터가새로추가되고있으며, 추가되는속도가점점빨라지고있다. 2011 년전세계에서새롭게생성되거나복제된정보량이 1.8 조기가바이트를넘어섰으며, 전세계디지털정보량은약 2 년마다 2 배로증가하는추세라고한다.(IDC, 2011) 이러한추세로증가한다면 2020 년이면전세계디지털정보량이현재의 44 배가된다 ( 존하겔등, 2012) 여기저기서데이터의폭발적증가를예견하고있다.( 김정일, 2012) 참고로미의회도서관이소장한장서가약 1 억 5 천만종인데이는 1Hexa Byte 의 10 만분의 1 분량에불과하다고한다. 문제는우리인류가만들어내는데이터가기하급수적으로증가하고있다는데있다. 수년내에데이터의폭발적증가가이의잠재력과혼돈양상을공존하게할것이다. 이러한상황을만든주요원인들은모든업종의영역이대부분전산화되고자동화가되어있어서데이터가증가할수밖에없는환경이된것이다. 특히과거엔관심없었던 CCTV, 교통트래픽정보관리등다양한교통정보가증가하고있다는것도큰요인중에하나이다. 스마트폰등양방향성을가진미디어기기들이급속히증가하면서이를통한자료의급증또한주요한요인중에하나다. 구글 (Google) 의유튜브 (U-tube) 등을통한멀티미디어콘텐츠의지속적인증가, DNA 분석을통한질병진단과치료가더욱더활발해지면서이와관련된데이터의급속한증가가데이터소스 (Source) 의증가를만든주요한요인중에하나라는것이사실이다. 존하겔등은인터넷패러다임이 Push 에서 Pull 중심으로급격하게이동중이며 3 가지커다란이동 (Big-Shift) 을이야기를하였다. 그중하나는정치적힘 (Political Power) 은이제정치단체중심에서일반시민중심으로이동하였으며, 경제적가치 (Economic Power) 는기업경영진에얼마나재능있는직원들이포진하고있는가로, 그리고시장지배력은벤더 (Vender) 중심에서소비자중심으로이동한다는것이다.( 송민정, 2012) 그렇다면정말로 의미있는가치를어떻게만들어낼까? 컴퓨터에저장되어있는많은디지털데이터에서원하는정보를추출하는것이필요해진시점이된것이다. 시장의파워가이미소비자에게이동했음으로의미있는가치를찾으려면이들소비자들의정확한목소리를읽어야만할것이다. 이렇게앱 (App) 의경제가빅데이터경제로옮겨질수밖에없는것이현실이된것이다.
전문가들은미래사회는크게불확실성과위험도 (Risk), 스마트 (Smart), 융합이라는 4 가지특성을가질것이라고예상하고있다. 이러한상황에서빅데이트의역할은사람들로하여금미래에대한통찰력을갖게하는데도움이될것이며, 위험징후들을예측하는것외에도상황인식등을통한개개인별맞춤화서비스, 서로유형이다른데이터간의융합등을통한새로운융합시장을창출할수도있을것이다. < 표 -3> 은빅데이터의주요한역할에대해기술하였다. 산업패러다임의변화흐름에서나타나는큰이슈는 3 가지가있다. 그첫째는전통기술의성숙속도가과거보다더빨라지는데그가운데 IT 를접목한기술혁신이기업, 국가경쟁력의변함없는핵심원천이라는점이다. 둘째, 한정된시장에서경쟁의격화로인해투자경쟁, 수요의정체, 공급과잉현상이더욱심화되는가운데예산감축이나, 설비투자비용의절감, 서비스통합등의구조조정행위가지속적으로필요하다는것이다. 세번째, 기후변화위기론이급부상하는가운데범국가적인환경위기관리와그린 (Green) 에너지투자가적극적으로진행되어야할필요성있다는점이다.
09 년블룸버그와맥킨지도 1999 년 - 2009 년간빅데이터리더기업들이그렇지못한기업들보다매출, 이익면에서높은성과를보였음을그림과표에서수치로입증하였다. 이러한결과를볼때빅데이터의분석결과를다양한산업부문에활용한다는것이매우중요해지기시작하였다. 이외에도주요의사결정을빠르고정확하게활용하는데에도빅데이터가사용되고있다. 특히다품종소량생산방식은실제로상당비용을요구하게되는데자라 (Zara) 는이러한시장창출전략으로저가상품을출시하고있다. 그비결은빅데이터의활용에있었다. 즉자라는상품수요예측, 각매장별적정재고산출, 상품별가격결정등을최대매출을창출할수있는알고리즘을이용한분석기법기술개발로현장운영에활용하고있다.
소셜미디어를활용한개인맞춤서비스제공에도빅데이터가활용되고있다. 넥플릭스 (Netflix) 기업은수학자, 컴퓨터공학자, 인공지능엔지니어등을영입해고객이과거에대여한영화목록과시청한영화에부여한평점등을데이터분석할수있는 시네매치 (Cinematch)' 라는 CRM 기반의영화추천시스템을일찍개발하였다. 넥플릭스는이를통해매출의 80% 가추천에의해발생하는성과를거두었다. 빅데이터산업생태계의서비스제공자 (Service Provider) 를중심으로데이터제공자와사용자간교류가형성되어서디지털데이터를서비스제공자가원하는기업들을위해수집, 분석을하고있다. 서비스제공자들도빅데이터를처리, 분석하기위해선다양한솔루션이필요하게되었으며, 이를위해다양한솔루션들을개발하거나, 확보하고있는실정이다. 이러한빅데이터분석을통해만들어진지식상품의사용자는일반인, 정부및기업그리고다양한산업분야의전문가등이된다. 또다른비즈니스는소셜데이터기반의응용비즈니스로소셜분석은소셜필터링 (filtering), 소셜네트워크분석, 감성분석 (Sentiment analysis), 소셜미디어분석기술등다양한분석도구들을포함하는상위의개념으로사용되고있다. 가장대표적인사례중하나는트위터에나타나는다양한자료들을분석하는트위터데이터분석이다.
또한미국정부는 2011 년 12 월 Data.gov' 에수십만개데이터세트를다양한형태로제공하고핵심메커니즘과코드등을공개하고 2012 년 5 월엔디지털정부전략을발표하는등새로운빅데이터시장에적극적으로개입하고있다. IT 에관한주요조사기관들이빅데이터에대한예측과향후어떠한방향으로발전할것인가를보여주는예이다. 건강과관련된빅데이터비즈니스는미국국립보건원과수십개기업, 기관들이 08 년부터 1000 유전체프로젝트 (1000 Genomes Project)' 는 DNA 분석, 인간의유전적다양성과질병과의상관관계연구를진행하고있다.(Univ. of Harvard, MIT, Harvard Medical School, Dana-farber Cancer Institute, Massachusetts General Hospital 등, 2009 년 ) 국내에서도이와유사한사업들이진행되고있다. KT 와세브란스병원은헬스 IT, 합작사인 후헬스케어 를설립하고클라우드기반의 DNA 분석사업을시작하였다. 국내에서는보험사기를예방하는차원에서빅데이터활용이시작되어서 2007 년국내벤처기업인지식시스템 (KSTEC) 을통해보험사기방지시스템을구축하였다. 기타빅데이터분석을활용한응용사례는매우많다. < 그림 -6> 과 < 그림 -7> 은다양한응용사례를보여주는예이다.
금융서비스분야에서도빅데이터분석이매우활발하게사용되고있다. 금융서비스기관들의운용비용중 92% 가데이터처리를위해사용하고있는것이현실이다. < 표 - 7> 금융분야의활용한예들이다.
특히공공분야에서의빅데이터활용이가장활발하다. 다음은해외에서빅데이터를활용하는주요한사례들을열거하였다. 데이터를가공한정보의필요성을논의한지가얼마되지않은것같은데, 사회는지식이라는새로운형태의정보를요구하여서만들어졌고, 활발하게사용하고있다. 또한필요에따라새로운형태에데이터들이만들어지고인터넷을통해주고받는상황이되었다. 과거엔많은데이터를질좋은데이터와질나쁜데이터를구분하여서사용하고자노력하였는데이제이를구분하는것조차의미가없는것같다. 관광은현재, 미래의주요한산업부문이되었다. 사람들이일로서만생활을영위하지않으며, 휴식과여유있는삶을즐기고자하는욕구들이계속증가하기때문에이러한현실에관광소비자들이원하는목적비즈니스를만들기위해부단히노력해야하는것이현실이되었다. 아직우리나라관광부문의산업들이관광선진국들과비교해볼때사업규모나산업이차지하는비중등이영세하기에이러한빅데이터의도입들이많이논의되지않고있다. 그렇지만상기에서논의한바와같이관광부문은빅데이터의영향을많이받을수밖에없는것이현실이다. 질좋은서비스, 고객이원하는서비스상품과함께이를판매해야하는관광부문에서는고객의트렌드를정확히안다는것은무엇보다도중요한일이기때문이다. 이러한정보들의대부분은고객들에게서나오는것들이다. 특히모바일을통한데이터에서비롯된다고보아도과언이아니다. 그러나이러한모바일데이터들의중요성을인식하기시작한것은최근의일이다. 이러한모바일데이터를분석하는데빅데이터의활용은최적의방법론일것이다. 타산업에서유용하게사용하고있는빅데이터의처리, 분석등이이제관광부문에도입되는것은시간문제일것이다. 아울러타산업부문의좋은사례들은관광부문에접목해서사용하는데있어서아무런문제가없다고보여진다.
그러나아직우리나라관광부문의기업들이대부분영세하기에빅데이터를직접운영할만한하드웨어, 소프트웨어를갖춘기업들이많지않은것도현실이다. 또한이를직접운영할만한역량을갖춘인재들이많지도않다. 그러기때문에대부분의관광기업들은빅데이터를전문적비즈니스로하는기업들에도움을받을수밖에없을것으로보여진다. 이것보다더걱정스러운부문은빅데이터를분석하고이를활용할수있는인력들이관광부문에는많지않다는사실이다. 이것이가장우려가되는부분이다. 관광이기존의산업범위를벗어나타산업과융합과복합을통해새로운비즈니스모델이지속적으로창출되어야하는시점에서실패를최소화하고관광소비자들의패턴, 기호등을정확히이해하기위해서는이러한빅데이터를활용하는것이무엇보다도필요한시점이다. 여기에서가장중요한것은빅데이터를이해하고이를활용할수있는인력들이많아야관광부문에서도빅데이터활용할수있는생태계가자연스럽게조성될수있을것이다. 빅데이터부문은지속적으로발전하고, 성공적인사례모델들이앞으로계속나타날것이다. 이러한모델들을잘활용하여서관광부문에기업경영, 고객만족등에잘활용할수있는환경조성이무엇보다도필요한시점이라고생각된다. 이를통해관광부문의지속적인발전에빅데이터가하나의중요한동인이되었으면하는바램이다.
참고문헌 1) 김정일 (DB Discover), Big Data Business Model, 2012. 12. 17, 서비스사이언스학회 2012 추계학술대회발표자료 2) 이경일 ( 솔트룩스대표 ), Big-Data 기반의 Social Network 분석, 2011. 3. 26, 서비스사이언스전국포럼국방정보화세미나 3) 이경일 ( 솔트룩스대표 ), 빅데이터의가치와활용사례, 2012. 12. 17, 서비스사이언스학회 2012 추계학술대회 4) 송민정 (KT 경제경영연구소수석연구원 ), 빅데이터가만드는비즈니스미래지도, 2012. 12. 7, 서비스사이언스학회 2012 추계학술대회 5) 안두헌, 김화종 ( 강원대 ), Open Data Interface 를통한공유데이터제공서비스, 2012. 12. 7, 서비스사이언스학회 2012 추계학술대회 6) 가트너, 2011; NIA, ' 신가치창출엔진, 빅데이터의새로운가능성과대응전략 7) Bloomberg and Datastream; annual report; McKinsey analysis, 2009 8) Daum 지식검색서비스 9) Naver 지식검색서비스