관광학연구제 39 권제 10 호 ( 통권 136 호 ) pp. 107~126 DOI http://dx.doi.org/10.17086/jts.2015.39.10.107.126 한국관광학회 2015. 12. 빅데이터분석을통한한국관광인식에관한연구 * A Study on Awareness of Korea Tourism through Big Data Analysis 2) 오익근 ** 이태숙 *** 전채남 **** Oh, Ick-Keun Lee, Tae-Sook Chon, Chae-Nam 요약 : 본연구에서는관광객들의관광인식을 SNS 빅데이터를통해분석하고자 2014 년부터 1 월 1 일 - 12 월 31 일까지 1 년간의네이버, 다음, 구글의 관광 / 여행 키워드를포함하고있는웹페이지, 개인들이운영하는블로그, 공신력있는정보를제공하는뉴스등을수집하여분석하였다. 자료수집은데이터수집및처리프로그램인 TEXTOM 을활용하였고, 데이터는 UCINET 와함께패키지화된 NetDraw 를활용하여연결정도중심성, 근접중심성, 매개중심성, 그리고아이겐벡터중심성등을분석하였다. 분석결과해외주요관광국가및도시, 국내주요관광도시등의웹가시성이높은것으로파악되었으며, 가족여행, 자유여행, 해외여행, 신혼여행등의관광행태와숙박관광과 2 박 3 일, 3 박 4 일등의여행일정도높게나타났다. 이외에도안전, 관광주간, 관광두레, 해미읍성이비중있게포함되어 2014 년의사회환경적특성을확인할수있었다. 이러한소셜미디어를활용한국내관광환경변화에대한관광인식진단은실현가능한관광마케팅전략수립에유용한기초자료가될수있을것으로기대한다. 핵심용어 : 관광인식, 사회네트워크분석, 빅데이터, 시멘틱네트워크분석 ABSTRACT : The objective of this study is to examine tourists awareness of tourism through SNS big data. For this, this study collected data containing tourism/travel keywords from web pages, blogs and news on Naver, Daum and Google during one year from January 1 through December 31, 2014. Data were collected by using TEXTOM, a data collecting and processing program and from those data, degree centrality, closeness centrality, betweenness centrality and eigenvector centrality were analyzed by utilizing packaged NetDraw along with UCINET. As a result of the analysis, it was found that the web visibility of foreign and domestic tourist destinations was high. In addition, the result showed that the web visibility was also high for tourism types such as family trip, free-style trip, overseas trip and honeymoon; overnight tourism; and tour itinerary such as two nights and three days, three nights and four days. Except this, tourism safety, tourism week, Tour Doorae(tourism cooperative group) and Haemi-eup Fortress were included and social and environmental tourism characteristics in 2014 were identified. It is expected that this diagnosis on awareness of tourism according to changes in domestic tourism environment by using these social media will be a foundation of baseline data useful for establishing tourism marketing strategies. Key words:tourism perceptions, Social network analysis, Big data, Semantic network analysis * 이논문은 2014 년정부 ( 교육부 ) 재원으로한국연구재단의지원을받아수행된연구임 (NRF-2014S1A5A2A03065863) ** 계명대학교호텥관광학과관광경영전공교수. e-mail: ickoh@kmu.ac.kr *** 순천제일대학교호텔관광과교수. e-mail: tsyi1010@hanmail.net **** ( 주 ) 더아이엠씨 (THE IMC) 대표. 경영학박사. e-mail: cnjun@theimc.co.kr
108 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) I. 서론 국내관광트렌드는공급측면이든수요측면이든모두양 (quantity) 중심에서질 (quality) 중심으로변화가일고있으며, 이에따른가치중심관광을위한종합적인지원체계가필요하다 ( 한국문화관광연구원, 2012). 뿐만아니라끊임없는미래관광트렌드변화를파악하고이를위한방안마련의노력도필요하다. 하지만, 지금까지는현안대응에급급한나머지미래트렌드변화에기반한장기적이고미래지향적인전략방향제시가미흡한것으로파악된다. 이를위해서는환경변화를고려한관광발전패러다임모색이필요하며그일환으로과학적인증거기반의관광서비스 R&D 토대가뒷받침되어야한다. 그동안의관광시장조사프레임이나분석접근체계로는관광객의다양한성향이나행태들을파악하는데한계가따랐다. 이에본연구에서는한국이세계최고의정보통신기술력 (ICT) 과인프라를보유하고많은데이터를생산, 소비하고있음에착안하여관광관련대용량데이터에주목하였다. 관광산업에서도빅데이터에대한연구와활용, 그리고관련기업과정부까지큰관심을보이고있다 ( 이양환, 2013). 우리가가진가장큰장점이초고속인터넷환경과높은스마트폰보급률에기인한데이터생성과보유에있음을고려할때관광빅데이터에대한접근은시의적절하다고보여진다. 현재쌓아놓은정보를어떻게활용하는가에따라미래관광산업의흐름이달라진다는인식이비즈니스계뿐만아니라공적영역에까지퍼짐으로서빅데이터는관광기업의경쟁원리나정부거버넌스 (governance) 차원에서경쟁력확보의필수적과제로보여진다 ( 이양환, 2013). 이처럼수없이널려있는정보를분석해새로운정보를만들고현재상황을분석하며, 앞으로의트렌드를예측하는데유용한빅데이터에체 계적으로접근한다면, 관광객들의감성에다가갈수있는새로운길을찾아낼수있지않을까? 빅데이터는이러한가능성에대한해답을줄수있을것으로보여진다. 이러한맥락에서본연구에서는국내관광환경에대한관광객들의관광인식을빅데이터를통해분석하고자한다. 구체적으로는인터넷포털사이트와 SNS 를중심으로한한국관광에대한인식을살펴보고자한다. 현대사회는 1년을예측할수없을정도로빠르게진화하고변화하고있다. 관광산업을둘러싼국내외환경또한급격히변화하고있다. 이러한측면에서소셜미디어를통한관광환경변화에대한관광인식진단은현실성이제고된관광마케팅전략수립에기초자료의근간이될수있을것으로본다. 뿐만아니라온라인의다양한자료원에서생산된빅데이터를관광연구에서어떻게활용할것인지에대한방향성제시와한국어최적화빅데이터분석솔루션적용을통해기술적인한계로빅데이터를수집 분석하지못하던문제를해결할수있는지침이될수있을것으로기대한다. 더불어국내관광에대한인식조사를빅데이터를통해규명하는것은관광데이터분석패러다임의변화를도모하고, 데이터활용의혁신적단초를제공하며, 나아가관광학연구의학문적지평또한넓힐수있을것으로기대한다. II. 이론적고찰 1. 관광정책에따른관광인식패러다임 1960년대이후부터현재까지의국내관광정책에대해한국문화관광연구원 (2012) 에서는발전단계별발아기 (1960-1979), 형성기 (1980-1996), 확충기 (1997-2004), 성장기 (2005-2012) 로분류하였다. 시기별내용을살펴보면, 먼저, 발아기에는수출위주의경제성장중심의
빅데이터분석을통한한국관광인식에관한연구 109 국정가치에영향을받아외화획득을위한정책이수립되었고, 관광을국제관계개선을위한정책수단으로파악하여국제회의를적극적으로개최하였다. 다음으로형성기의경우정치 경제 사회적인급변속에서국제관광진흥정책에서국민관광진흥정책으로정책기조가변경되었으며, 확충기에는관광의경제적효과뿐만아니라사회 문화적인효과가부각되었고국민관광활성화, 남북관광, 지역관광활성화등의관광정책대상범위가확대되었으며, 관광을신성장동력산업으로육성하여관광산업의경쟁력강화를위한제도개선을시작하는등의관광산업환경개선이이루어졌다. 끝으로성장기에는관광산업의외연적성장뿐만아니라관광산업환경의질적개선이이루어졌으며, 국제관광정책과국민관광정책이균형 적으로추진되었다 ( 한국문화관광연구원, 2012). 결과적으로한국관광정책은발아기에서성장기를거치면서크게경제적가치중심에서경제 사회 문화적가치로, 소극적국제관광진흥정책에서적극적국제관광발전정책으로, 중앙중심의관광정책에서지방 분권정책으로, 규제중심정책에서탈규제 지원정책으로변화한것으로나타났다 ( 한국문화관광연구원, 2012). 이외에도, 1960년대부터 2000년대까지의한국관광이슈및인식에대해분석한연구결과가눈길을끈다. 민경익 이태숙 (2012) 은신문기사를소재로 1960년대부터 2000년대까지의한국관광인식에대해내용분석을하였으며, 그결과에대한흐름을다음과같이제시하였다. 이연구의결과를연대별살펴보면, 먼저, < 표 1> 한국관광인식변화 (1960~2000 년대 ) 1960 년대 1970 년대 1980 년대 1990 년대 2000 년대 국제관광방문단활동 방문단활동, 기생파티 관광형태다양화 테마관광, 관광교류 / 협정, 해외여행자유화 인센티브관광, 의료관광 국민국내관광 단체여행 휴가철 / 연휴관광 명소관광 선심관광, 관광인파 테마관광 관광개발 관광기반기초인프라 관광단지 / 관광시설 관광단지 ( 테마관광지 ) 관광단지, 관광시설, 관광상품 테마관광지, 테마관광상품 관광조사 출입국 / 관광수지 출입국 / 관광수지 출입국 / 관광수지 출입국 / 휴가계획 / 관광산업매출 지자체관광통계 관광정보 관광행사유치 / 개최 관광관련행사, 패키지상품 관광지 / 관광상품소개 관광지 / 관광 상품다양화 테마관광상품 ( 체험관광 ) 관광행정 외화획득위한관광정책 외화획득위한관광정책 외화획득 / 국민관광활성화정책 외래관광객유치, 국가이미지 관광상품브랜드화 관광산업 관광산업발전과제 ( 인프라측면 ) 관광마케팅, 관광산업발전과제 ( 인프라측면 ) 관광산업발전과제 ( 서비스품질 ) 관광마케팅관광기업, 관광산업실태 ( 지자체전략산업 ) 북한관광대표단교류 북한관광개방 / 정책 금강산관광, 북한관광정책 금강산 / 개성관광
110 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) 세계관광산업 세계관광산업동향 해외관광해외관광정책해외관광정책 산업동향 해외관광정책 관광인식외화획득 외화획득, 국가위상 국가이미지, 소득재분배, 여가 / 재충전 외화획득, 지역경제활성화, 민족교류 / 화합 외화획득, 국가이미지, 국민여가, 지역경제활성화, 지역국제화 자료 : 민경익 이태숙 (2012). 미디어분석을통한한국관광인식변화에관한연구 : 신문기사를중심으로. 관광학연구, 36(10), 81-104. 1960년대는관광산업을외국인유치를통한외화획득산업으로간주하였고, 따라서대부분의관광정책이나개발목적이외국인유치에초점이맞추어졌다. 해외주요인사의방한및내국인의해외여행활동이특별한 사건 으로보도되기도하였다. 1970년대도마찬가지로관광산업의목적및관광산업에대한인식은외국인관광객유치를통한외화획득이라는관점이지배적이었다. 특히관광요금등을정부의규제하에일원화하기도하였다. 1980년대에는관광관점이보다다양화된시기로, 국가이미지및국가위상이라는측면에서관광을바라보며국민의식을촉구하였으며, 특히관광개발에있어외래관광객을위한관광지, 수용시설등에서국민국내관광수용인프라구축에관심이높아져, 테마관광지등의개발계획이시작되었다. 한편국민국내관광활성화가시작되면서사치및향락이라는관광산업에대한부정적인식도발생하였다. 1990년대는지방자치제도가시행됨에따라지역별로테마관광지조성, 문화관광상품개발등의지역경제활성화를위한관광역할이급부상하였으며, 특히, 금강산관광사업이시작됨에따라관광을통한 민족교류 및 민족화합 이라는남북관계의특수적상황에배경을둔인식이나타났다. 2000년대는지역경제활성화및지역의국제화라는관점에서의지역전략산업으로서의관광산업에대한접근이나타나기시작하였다. 특히 2000년대에는한류관광, 문화관광등과더불어 MICE, 의료관광등을집중육성하려는노력이전개되었 다. 이렇듯관광산업이지역의전략산업으로부상함에따라각지자체의관광마케팅활동및관광객유치를위한경쟁이심화되고있음이나타났다. 결과적으로이연구에서분석된한국관광이슈및인식도결국국내관광정책의흐름과그맥을같이함을알수있다. 다양한관광정책들은많은관광환경변화를도모하며, 관광환경변화는결국국내관광에대한인식과개념변화에영향을주고있음이확인된다. 뿐만아니라이제는보는관광을뛰어넘고체험형관광을지나여러장르와융복합으로가는관광으로변모하고있다. 이처럼시대별변화를거듭하고있는관광인식에대한파악은중요하며, 필요하다고보여진다. 이에본연구에서는최근의관광환경에대한관광인식에대해서도조사해보고자하며, 이를위해빅데이터를활용하고자한다. 2. 빅데이터개요최근빅데이터가 IT 트렌드의메인이슈로부상하고있다. Gartner 는빅데이터를 미래경쟁력을좌우하는 21세기의원유 라고까지표현할정도로, 전세계는빅데이터의성장잠재력과가치에주목하고있다 ( 배동민 박현수 오기환, 2012). 빅데이터는규모가방대한자료 (data) 를의미하는용어로 대용량데이터를활용, 분석하여가치있는정보를추출하고, 생성된지식을바탕으로능동적으로대응하거나변화를예측하기위한정보화기술 로정의되고있으
빅데이터분석을통한한국관광인식에관한연구 111 나아직합의된내용은없는실정이다 ( 강만모 김상락 박상무, 2012; 이양환, 2013). 하지만, 빅데이터라는개념이최근에갑자기나타난것은아니다. 대용량데이터는예전부터있었으나약 10년사이에검색엔진의급격한진화와소셜네트워킹사이트 (social networking site) 의확산, 클라우드 (cloud) 서비스의본격화등이빅데이터의분석과활용을서두르게하였다 ( 이양환, 2013). 이러한빅데이터개념에대한논의를살펴보면, Gartner(2012) 는 향상된시사점 (insight) 과더나은의사결정을위해사용되는비용효율이높고, 혁신적이며, 대용량, 고속및다양성의특성을가진정보자산 이라고하였고, 맥킨지 (2011) 는데이터베이스의규모에초점을맞추어 일반적인데이터베이스 SW가저장, 관리, 분석할수있는범위를초과하는규모의데이터 라고하였으며, IDC(Internet Data Center, 2011) 는데이터베이스가아닌업무수행에초점을맞추어 다양한종류의대규모데이터로부터저렴한비용으로가치를추출하고데이터의초고속수집, 발굴, 분석을지원하도록고안된차세대기술및아키텍처 로개념화하였다. 이외에도 Douglas(2012) 는 Gartner Report 를인용해다양한형태의대량데이터가실시간으로형성되어초대용량 (highvolume), 빠른생성속도 (high-velocity), 높은다양성 (high-variety) 을갖는정보자산이라정의하였고, O eilly(2012) 는자료가너무크고, 빠르게변화하여전통 DB에서처리하기힘든데이터라고정의하였다. 최근에는빅데이터가소셜미디어와정보기술의발달로더욱빠르게전 파되고변화되며, 비정형적이고, 일정한패턴의발견이어렵게되면서가치창출의중요성이더욱강조되었다. 이에 Douglas(2012) 가제시한정의에최고의가치 (high-value) 특성이추가된정의도사용되고있다 ( 이영진 윤지환, 2014). 국내에서는삼성경제연구소 (2012) 에서과거의관리및분석시스템으로는처리할수없는방대한데이터의집합이라하였으며, 함유근 채승병 (2012) 은구체적인수치를활용해수천테라바이트 (TB) 의크기를가지고있는비정형데이터로, 생성과이용이짧게는몇초, 길게는몇시간단위로발생하여기존의방식으로처리하기어려운데이터집합이라정의하였다. IBM(2011) 은최근빅데이터의특징으로모호함을의미하는 Veracity( 진실성 ) 의 V 를추가하여 [ 그림 1] 에서보는바와같이 4가지 V4 로규정하였다. 여기서진실성 (Veracity) 은데이터의모호성, 불완전성및데이터간의불일치등으로인한데이터의불확실성 (uncertainty) 을의미한다고한다. 이렇게다양하게정의되고있는빅데이터의활용가치가주목받게된것은 World Economic Forum (2012) 에서빅데이터를국제개발의새로운가능성을여는중요기술의하나로지목하면서부터라회자된다 ( 이영진 윤지환, 2014). 빅데이터의활용가치가주목받게되면서세계각국의정부와기업들은국가와기업의성패를가름할새로운경제적가치의원천이될것으로기대하며다양한부문에서빅데이터의활용을시도하고있다 ( 한국정보화진흥원, 2012). 해외 < 표 2> 빅데이터의정량적요건 구분 내용 양 (Volume) 수십테라바이트이상 종류 (Variety) 형식을갖추고정리된구조적데이터보다구조화되어있지않은비정형데이터가 90% 이상 속도 (Velocity) 데이터의생성, 처리, 유통, 소비되는속도가수초에서수시간단위 자료 : 한형상 이창호 (2014). 빅데이터분석의현황과발전전략. PD 이슈리포트, 6. KEIT
112 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) 자료 : 한형상 이창호 (2014). 빅데이터분석의현황과발전전략. PD 이슈리포트, 6. KEIT < 그림 1> IBM 의 Big Data 정의 주요국보다는늦지만우리나라도 2011년말부터정부차원에서빅데이터에관한논의가시작되었다. 관련정부부처에서정책과제로빅데이터를채택하였으며, 연구소및포럼등이활발히설립되었다. 2012년 11월에는 빅데이터마스터플랜 안이발표되면서빅데이터진흥의청사진을마련하였다. 이러한국내빅데이터의시장은국민들의신기술수용력이높고, IT 인프라가잘구축되어데이터생산과 1차활용이활발하며, 사회정보화를추진하면서데이터축적기반이잘조성되어있는실정이다. 하지만, 방대한공공데이터공개가선진국대비상대적으로늦은편이고실제활용을위한인력과인프라 (SW, HW), 전문성축적이부족하며, 데이터활용에대한인식도부족하고, 빅데이터활용을저해할수있는법 / 제도의정비도미진한실정이다. 3. 관광분야에서의빅데이터논의맥킨지 (McKinsey) 는공공행정, 소매, 제조, 개인정보등다양한분야에서빅데이터가적용될것이라추정하였다 ( 송태민, 2012). 이러한추세속에서하버드경영대학원의 Davenport Thomas 교수는여행업계가빅데이터에서혜택을얻을가능성이아주크다고밝혔다. 빅데이터는특성상로그기록, 소셜, 위치, 소비, 현실데이터등비정형화된데이터유형의 다양화로맞춤형관광서비스를제공할수있는여건을마련해준다. 자신의관광경험에대해표출된감정, 인식, 체험결과등의수집과분석이가능해져이용자별특성과선호를고려한맞춤형서비스제공이가능하다. 고객의트렌드를정확히안다는것은무엇보다도중요하며, 정보들의대부분은모바일을통한데이터에서비롯된다고보아도과언이아니다. 이미유용하게사용하고있는빅데이터의처리, 분석등이관광부문에도도입되고있다 ( 변정우, 2013). 적용사례가많지는않지만, 빅데이터의미래추세예측과마케팅활용도가높기때문에그사례들이속속제시되고있다. 그사례를살펴보면, 먼저인터넷의존비중의높은분야가여행정보임에착안한여행정보사이트인 트립어드바이저 (tripadvisor) 는개개인의텍스트와이미지리뷰등방대한비정형데이터를분석하였다. 그결과여행목적별 ( 유적지여행, 휴양지여행, 도심형휴양여행, 쇼핑여행등 ), 지역별 ( 근거리여행, 원거리여행 ), 취향별 ( 시간이걸리더라도저렴한여행, 비싸더라도편한여행, 버스나기차선호여행, 짧은시간에많은곳방문하는여행, 한곳에서오래머무르는여행 ) 개인선호스타일의결과를도출하였다. 이를통해비슷한지역의비슷한연령대가선호하는여행형태를파악할수있었으며, 또한각여행자의구미에맞는여행상품
빅데이터분석을통한한국관광인식에관한연구 113 을제안하고자세한여행정보함께제공하였다. 이는여행사들이현지에인력을파견하여얻는한정적인여행정보와전세계인들이매일쏟아붓는정보의양과질에분명한차이가있음을시사해주는결과이다 ( 삼정 KPMG 경제연구원, 2012). 국내의경우한국관광공사에서는 빅데이터 를활용하여전국문화관광축제의개최효과를심층분석하였다 ( 한국관광공사, 2014). 기존관광분야조사 연구의한계를보완하고지방축제와관련한국민들의관광행태및특성을구체적으로파악하기위해추진된 빅데이터 분석은 2013 년개최된전국 16개우수지방축제를시범대상으로 2013년 11월부터진행되었다. 특히, 이분석에서이동통신사의 빅데이터 를관광산업에접목한것은세계적으로도전례를찾기힘든시도일뿐만아니라유동인구분석부터매출분석, 소셜미디어분석등국내에서시도되고있는다양한 빅데이터 분석기법을일시에적용했다는점에서높이평가받았다. 이분석은이동통신사가보유한이동통신망데이터및빅데이터분석인프라를기반으로진행되었으며, 분석에활용된전체 빅 데이터는 DVD 51만장 (2,200 테라바이트 ) 분량에달하는것으로나타났다. 이를통해시간대별, 성 연령별, 지역별등다각적인외부유입인구분석과매출변동현황, 소셜데이터등의분석도병행되어상세한정보까지보여줌으로서세부적인축제개최효과를제시하였다. 또한부산해운대구에서는 빅데이터 를접목한관광정책을실시하였다. 레디안 6 라는자료수집기를통해 5개월간트위터와페이스북, 블로그등소셜미디어에 해운대 라는키워드가언급된소셜정보를수집 분석하였다. 약 3만 8,500여개의글가운데관련성이높은 1만여건을분석한결과, 해운대해수욕장 과 달맞이길 등자연경관에만족수준이높음이발견되었으 며, 반면, 비싼숙박요금, 교통체증, 복잡한버스노선 등이부정적인요소임이확인되었다 (NSP 통신, 2013. 8. 22; 문정욱, 2013). 이를통해해운대구는관광객의정확한수요와장애요인등을파악하여보다과학적인관광정책과서비스개선을추진하는계기를마련하였다. 이외에도제주도는 빅데이터를활용한스마트관광정보서비스 추진을통해빅데이터서비스플랫폼을구축하였다 ( 연합뉴스, 2013. 9. 12; 문정욱, 2013). 제주도의빅데이터기반관광서비스는관광객과관광지, 기상등관련빅데이터를수집, 분석하여실시간으로이용자에게제공하는시스템으로, 관광객이모바일에스마트여행길잡이애플리케이션을설치하면해당관광객의동선과정보가자동으로빅데이터분석시스템에전송되도록하여보다풍부한분석결과를얻게된다. 현실적인관점에서는관광산업체보다카드사에서관광객정보를활용하여컨설팅에활용하는경우가있다. 신용카드사는한국문화정보센터와제휴를맺고국내외관광객의이용행태등에대한광범위한자료를분석해관광정책수립의기초자료를제공하기도하였다 ( 이영진 윤지환, 2014). 한편, 빅데이터를활용한학술적논의도이어지고있다. 하지만, 관련연구들이외식이나호텔 ( 공효순 송은지, 2013; 도해용 류기상, 2013; 도해용 이애주 이창원, 2013), 온라인관광정보의공공성분석 ( 이영진 정호권 부석현, 2010), 관광분야에서의 SNS 빅데이터활용방법모색 ( 이영진 윤지환, 2014) 등에그치고있어여전히빅데이터의활용도는낮은것으로파악된다. 국내관광부문에서의빅데이터활용도가낮은이유는그동안대량의자료를수집해온정부등공공기관에서축척한 2차자료사용이부족하였을뿐만아니라 ( 국내공기관의원천데이터공개는최근시행 ), 빅데이터분석을위한솔루션이나소프트웨어활용기술이부
114 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) 족했기때문으로판단된다 ( 이영진 윤지환, 2014). 하지만최근정부뿐만아니라포털사이트등에서도한정적이지만 SNS 등에서수집한자료를부분적으로나마공개하고있다. 따라서이제는데이터수집의문제가아니라수많은데이터를어떻게의미있는정보로전환할지에대한고민이필요하다 ( 이영진 윤지환, 2014). 이러한맥락에서본연구에서는기술적측면에서의빅데이터활용가능성에대한탐색과분석가능한소프트개발을통해관광분야데이터활용의가치에토대를둔데이터분석기반의학술적논의에비중을두고자한다. III. 연구방법 1. 조사설계및자료수집방법 한국관광에대한인식조사를위해국내관광 관련정보를제공하는각포털을활용하여관련된텍스트를수집하였다. 구체적으로는인터넷에분산저장되어있는관광정보즉, 웹페이지, 개인들이운영하는블로그, 공신력있는정보를제공하는뉴스등에서자료를수집하였다. 자료수집은데이터수집및처리프로그램인텍스톰 (TEXTOM: Text to Metrix) 1) 을활용하였다. TEXTOM 은 web 상의다양한데이터를채널별로자동수집하여정제, 매트릭스생산까지일괄처리해주는데이터처리솔루션으로크롤링 (crawling) 방식을이용한다. 또한연관성과정확도에따라추출된데이터를수집하고다양한주제에대한감성분석 (sentiment analysis) 과오피니언분석 (opinion analysis) 이가능하여텍스트마이닝을가능하게해주는한국어최적화빅데이터분석솔루션이다. 그동안의전통적인조사의한계를극복하고인터넷의데이터를자동으로수집하고수집된데이터를정제한후결과 < 그림 2> 텍스톰 (Textom) 처리과정예시 ( 텍스톰홈페이지참조 ) 1) TEXTOM 은 ( 주 ) 더아이엠씨 (THE IMC) 가자체개발한빅데이터처리솔루션임. 웹과소셜미디어상의데이터를수집에서텍스트마이닝과매트릭스데이터생성까지일괄처리되는방식으로빅데이터활용의핵심기술인빅데이터큐레이션및분석데이터를생성하는솔루션임. TEXTOM 은국내외포털사이트와소셜미디어등다양한채널에서데이터를대량으로수집한뒤자동정제과정을통하여네트워크분석이가능한데이터마이닝이가능하며, 정제된데이터는유클리디언계수, 코사인계수, 자카드계수등다양한값으로변환하여다운로드할수있어타분석프로그램과의확장에도효율적임.
빅데이터분석을통한한국관광인식에관한연구 115 를정리분석할수있는조사도구의필요성에의해 ( 박한우, 2012) TEXTOM은개발되었으며, 이후전채남 (2014), 김해원 전채남 (2014) 등에의해학술적논의로서과학적인방법으로검증되어지고있다. 본연구에서는 2014년부터 1월 1일-12월 31일까지 1년간의네이버, 다음, 구글에서 관광, 여행 키워드를포함하고있는자료를수집하였다. 수집된데이터를통해핵심어를도출하고, 이후분석데이터의탐색을진행하여데이터수정및변환과정을거친후텍스트마이닝 (textmining) 과시맨틱네트워크 (semantic network) 분석을진행하였다. 텍스트마이닝은구조화되지않은대규모의텍스트집합으로부터새로운지식을발견하는과정이며문서내에서유용한정보를찾는기술로대량정보의문서데이터에서의미를도출해내는일련의과정을설명한다. 또한텍스트마이닝은비정형의텍스트데이터를자연어처리와형태소 분석기술에기반하여정제하고유용한단어를추출해빈도수를추출하여맥락 (context) 수준의의미를찾아내는프로세스를의미한다 ( 정근하, 2010). 시맨틱네트워크분석은문장속의개념들과상징들에대한구조를밝히기위해사용되었다는점에서소셜네트워크분석의한형태이며 (Chung & Park, 2010), 텍스트에서자주사용하는단어들은그사람의정체성을나타내므로담론의성격을드러내는하나의지표로도작용한다. 2. 사회네트워크분석 (Social Network Analysis) 네트워크적인성격을가지기시작한사회변동속에서네트워크분석에대한중요도가커지게되면서이에대한학문적인주목도도높아지고있다. 이분석법은많은학문분야에서빠른속도로보급되었으며, 이제는대부분의사회과학분 구분 내용 본연구에서의적용 연결정도중심성 네트워크의노드들이얼마나많은연결을가지고있는지를중심으로측정하는개념. 한노드에연결된다른노드의수로측정. 연결된노드의수가많을수록연결정도중심성은높아지게되며, 가장연결이많은단어는그네트워크의중요한역할을하는허브가됨 단어간연결정도를측정하여연결정도중심성이높은단어는다른단어와많이연결되어있는것으로해석 근접중심성 매개중심성 아이겐벡터중심성 CONCOR 에고네트워크분석 < 표 3> 중심성 (centrality) 개요 하나의노드가다른노드에얼마나가깝게있는가를나타내는개념. 두노드사이의거리가가깝게있다면그노드와쉽게연결된다고보고그만큼중심적인역할을한다고간주하나의노드가다른노드들과의네트워크를구축할때중개자혹은다리역할을얼마나수행하는가를측정하는개념. 중개역할에초점을맞추어 중심성 을측정. 직접적으로관계를맺고있는노드들뿐만아니라연결된이웃노드들의간접적인관계까지포함하여영향력을계산하는개념. 위세중심성 (prestige centrality) 중하나로서중요한노드와연결될수록해당노드의중심성은높게측정구조적등위성분석중에가장보편적으로사용되는분석방법임. CONCOR 는단어간의동시발생적매트릭스를통하여의미구조내텍스트를분석하기위해사용됨. 복잡한네트워크집단사이에숨겨진하위집단들의관계의구조적분석에활용. 전체네트워크에서단하나의주체 ( 노드, 단어 ) 를중심으로네트워크를보고자할때분석하는방법. 근접중심성이높은단어는다른단어와쉽게연결되어나타난다고해석매개중심성이높은단어는다른단어들이나타날때중개역할이상대적으로많다고해석아이겐벡터중심성이높은단어는중요하게등장하거나언급된단어와같이연결된정도가많다고해석 네트워크분석을위해흔히사용되는소프트웨어프로그램인 UCINET 를사용하여실행 관광에대한전체네트워크에서 한국관광공사 와관련된단어를중심으로어떠한단어들이연결되어있는지를살펴볼때활용
116 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) 야, 물리학, 생물학등의자연과학분야등에서연구가이루어지고있다 ( 김용학, 2011). 특히, 인터넷사회의등장과정보의폭발과초연결사회의도래로복잡한네트워크에숨겨져있는정보의비밀을탐색하는목적으로정치, 경제, 조직등의분야에서도활용되고있다. 이러한맥락에서본연구는사회네트워크분석에서나온기법을이용하고자한다. 네트워크분석방법은시스템을구성하는개체들간의관계구조를연구대상으로하는실증적연구방법론으로분석단위가개별요소들이아니라개별요소들간의관계성을가진연결망, 즉구조 (structure) 를살피는것이주요한분석틀이라고할수있다. 이러한관계적인속성분석을위해여러가지지표들이발달되어있다. 그중중앙성 (centrality) 은네트워크내에서중앙에얼마나가까이에위치하고있는지를측정하는지표로서, 사회네트워크분석법에서가장많이쓰이고있다 ( 김정하, 2012). 대표적인개념으로서는연결정도중앙성 (degree centrality), 매개중앙성 (betweenness centrality), 인접중앙성 (closeness centrality) 등이있으며 ( 김용학, 2011). 본연구에서는연결정도중심성 (degree centrality), 근접중심성 (closeness centrality), 매개중심성 (betweenness centrality), 그리고아이겐벡터중심성 (eigenvector centrality) 등을분석하고자한다. 3. 분석설계관광객이웹이나소셜미디어에남긴텍스트자료로부터구조화된형태의정보를추출하여패턴과의미를시각적으로나타내고의미체계를파악하고자함이본연구의목적이다. 이를위해웹과소셜미디어에작성된텍스트를수집-정제- 분석-시각화의과정을통해유용한정보를도출하고자한다. 즉, 수집데이터인비정형데이터를분석용데이터로활용하기위하여텍스트의정제과정을수행하고, 정제된데이터를텍스트마이닝을통해빈도를계산하여주요단어들을선정한다. 선정된단어들의범주화를통해매트릭스데이터로만들어시멘틱네트워크분석에이용한다. 분석에는 Ucinet6 2) 을활용하여텍스트의네트워크중심성과구조적등위성 (CONCOR: CONvergence of iterated CORrelations) 3), 에고네트워크 (ego-network) 분석을진행한다. 구분수집범위수집기간수집도구검색어분석도구수집데이터 < 표 4> 분석데이터정보내용 Naver( 블로그, 뉴스, 카페, 웹, 지식인 ), Daum( 블로그, 뉴스, 카페, 웹, 지식인 ), google( 블로그, 뉴스, 웹 ) 2014년 1월 - 2014년 12월 TEXTOM 관광 / 여행 UcINet 6.0, NetDraw TEXTOM 을이용해분석단어인 관광 / 여행 데이터를수집 2) Freeman이개발한다양한연결망분석기법을활용할수있는종합적인프로그램으로네트워크분석에서주로사용하고있으며, 무료로이용가능하여많은연구자들이사용하고있다. 또한 Netdraw 기능이포함되어있어결과분석뿐만아니라시각화도구까지포함하고유용한도구이다. 관련프로그램은다음의홈페이지에서다운로드가가능 (https://sites.google.com/site/ucinetsoftware/home) 3) CONCOR 분석은단어간의동시출현매트릭스의피어슨상관관계를분석하고이를토대로노드들의블록을식별해내고블록들간의관계를파악하는방법으로, 주로복잡한네트워크집단의숨겨진하위집단들관계의구조적분석에활용 (Wasserman & Faust, 1994)
빅데이터분석을통한한국관광인식에관한연구 117 UCINET 와함께패키지화된 NetDraw 를활용하여분석결과를시각화함으로써텍스트의관계를구체적으로제시하고자한다. IV. 분석결과 1. 데이터빈도 ( 상위주요빈도 ) 관광및여행관련내용을텍스트마이닝한결과총 31,735개의단어가출현되었으며, 그중상위 100개의결과를정리하면다음과같다 (100개중부사 ( 예 : 이제 now 등 ) 와유사어 ( 한국관광공사 / 관광공사, 정보 / 관광정보등 ) 등과같은단어는삭제되어 81개로정리됨 ). 조사결과, 해외주요국가및도시, 국내주요도시등의웹가시성 (Web visibility) 이높은것으로파악되며, 가족여행, 자유여행, 해외여행, 신혼여행등의관광행태가크게부각되어나타났고, 숙박관광과 2박 3일, 3박 4일등의여행일정도높은가시성을나타내었다. 뿐만아니라각교통수단들에대한내용들도비중있게제시되었다. 한편, 제주도의경우상기표외에도제주여행, 제주도여행, 제주관광, 제주도관광, 제주홀로여행, 제주가족여행, 제주관광공사, 제주공항, 제주항공, 제주맛집, 제주둘레길, 제주관광지도등으로제시되어이들을통합한다면전체결과물중제주도의웹가시성이가장높은것으로파악된다. 이외에도 1일, 1인등의빈도가 < 표 5> 관광 / 여행데이터상위주요단어빈도 순위 단어 빈도 % 순위 단어 빈도 % 순위 단어 빈도 % 1 여행 4981 3.59% 28 가족여행 183 0.13% 55 호치민 109 0.08% 2 관광 3385 2.44% 29 베트남 180 0.13% 56 홍콩 106 0.08% 3 여행사 660 0.48% 30 문화관광 179 0.13% 57 시내 105 0.08% 4 제주도 610 0.44% 31 신혼여행 178 0.13% 58 캐나다 104 0.07% 5 추천 543 0.39% 32 서비스 167 0.12% 59 강원도 104 0.07% 6 중국 416 0.30% 33 관광버스 165 0.12% 60 하나투어여행사 104 0.07% 7 한국관광공사 356 0.26% 34 신청 158 0.11% 61 관광산업 103 0.07% 8 일본 326 0.24% 35 체험 157 0.11% 62 호주 102 0.07% 9 여행코스 316 0.23% 36 수학여행 156 0.11% 63 대구 101 0.07% 10 자유여행 309 0.22% 37 사진 155 0.11% 64 쇼핑 100 0.07% 11 호텔 300 0.22% 38 가을 155 0.11% 65 겨울 99 0.07% 12 미국 282 0.20% 39 무료 149 0.11% 66 홈페이지 98 0.07% 13 여행상품 267 0.19% 40 필리핀 148 0.11% 67 10월 97 0.07% 14 관광명소 263 0.19% 41 포함 145 0.10% 68 하와이 97 0.07% 15 관광비 262 0.19% 42 맛집 141 0.10% 69 교통정보 97 0.07% 16 정보 258 0.19% 43 지도 140 0.10% 70 관광열차 96 0.07% 17 서울 248 0.18% 44 비자 139 0.10% 71 공항 95 0.07% 18 롯데관광 248 0.18% 45 3박4일 136 0.10% 72 안전 95 0.07% 19 해외여행 240 0.17% 46 할인 131 0.09% 73 울릉도 95 0.07% 20 오사카 235 0.17% 47 숙박 128 0.09% 74 경주 95 0.07% 21 시간 229 0.17% 48 예약 127 0.09% 75 비 94 0.07% 22 계획 221 0.16% 49 기차여행 126 0.09% 76 크루즈 93 0.07% 23 부산 216 0.16% 50 2014 126 0.09% 77 홍보 92 0.07% 24 2박3일 209 0.15% 51 이벤트 124 0.09% 78 친구 92 0.07% 25 가이드 202 0.15% 52 휴양 115 0.08% 79 대한민국 91 0.07% 26 패키지 191 0.14% 53 모집 114 0.08% 80 문의 91 0.07% 27 항공 183 0.13% 54 5월 109 0.08% 81 대만 89 0.06%
118 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) < 그림 3> 관광 / 여행데이터상위주요단어네트워크분석의시각화 부각됨이확인되고, 안전, 관광주간, 관광두레, 해미읍성도포함되어있어 2014년의사회환경적특성이반영된결과로풀이된다. 그러나 2014년도에는정부의관광정책이나관광개발과관련된단어의빈도수는미미한것으로파악된다. 상위주요단어빈도를이용해네트워크를그린결과는 < 그림 3> 과같다. 2. 주요단어중심성분석결과연관단어의연결정도중심성 (degree centrality), 근접중심성 (closeness centrality), 매개중심성 (betweenness centrality), 위세중 심성 (eigenvector centrality) 을분석한결과는다음과같다. 연결정도중심성은네트워크상에서한노드가다른노드들과얼마나많은연결을가지고있는지를측정하는지표로서, 연결된노드가많을수록연결정도중심성은높아지게된다. 관광또는여행에대한주요단어연결정도중심성을확인한결과, 추천, 여행사, 제주도, 호텔, 일본, 중국, 여행코스, 관광비, 미국, 자유여행, 정보등이높음이확인되며, 이는주요단어빈도결과와비슷한양상을나타낸다. 한편, 위세중심성은고유벡터중심성또는연쇄중심성이라하며, 네트워크내에서가장영향력이있는중심노드를찾는데유용한지표이다. < 표 6> 관광 / 여행연관단어의중심성분석결과 연결정도중심성 근접중심성 매개중심성 위세중심성 1 여행 0.196 1 여행 50 1 여행 1.717 1 여행 93.279 2 관광 0.147 2 관광 50 2 관광 1.717 2 관광 90.506 5 추천 0.026 3 여행사 48.824 3 여행사 1.330 4 제주도 17.831 3 여행사 0.025 5 추천 48.538 5 추천 1.275 5 추천 17.994 4 제주도 0.025 16 정보 47.977 16 정보 1.269 3 여행사 13.772 11 호텔 0.017 22 계획 47.159 6 중국 1.015 11 호텔 12.413 8 일본 0.016 11 호텔 46.893 13 여행상품 1.010 8 일본 11.798 6 중국 0.015 6 중국 46.369 22 계획 0.963 27 항공 10.362 9 여행코스 0.015 10 자유여행 46.111 11 호텔 0.897 16 정보 9.753 15 관광비 0.015 28 가족여행 46.111 42 포함 0.813 6 중국 9.728 12 미국 0.015 42 포함 46.111 34 안내 0.803 12 미국 9.519
빅데이터분석을통한한국관광인식에관한연구 119 10 자유여행 0.014 13 여행상품 45.856 28 가족여행 0.789 20 오사카 8.792 16 정보 0.014 19 해외여행 45.355 57 5월 0.782 9 여행코스 8.756 20 오사카 0.013 8 일본 45.109 10 자유여행 0.768 21 시간 8.491 27 항공 0.012 57 5월 45.109 7 한국관광공사 0.751 10 자유여행 8.435 13 여행상품 0.012 34 안내 44.865 70 10월 0.705 23 부산 8.097 29 베트남 0.011 4 제주도 44.865 21 시간 0.674 25 가이드 7.449 7 한국관광한국관광 0.011 7 공사공사 44.865 19 해외여행 0.659 15 관광비 7.407 24 2박3 0.011 21 시간 44.865 52 2014 0.628 26 패키지 7.240 22 계획 0.010 70 10월 44.865 17 서울 0.618 24 2박3 6.733 14 관광명소 0.010 48 숙박 44.385 8 일본 0.617 32 서비스 6.607 21 시간 0.010 14 관광명소 44.385 4 제주도 0.616 22 계획 6.578 25 가이드 0.010 23 부산 44.385 27 항공 0.609 17 서울 6.446 26 패키지 0.010 9 여행코스 44.385 43 맛집 0.594 36 체험 6.424 23 부산 0.010 49 예약 44.149 38 사진 0.582 14 관광명소 5.912 18 롯데관광 0.010 26 패키지 44.149 23 부산 0.571 45 비자 5.752 17 서울 0.009 38 사진 44.149 81 친구 0.561 29 베트남 5.605 45 비자 0.009 81 친구 44.149 9 여행코스 0.560 19 해외여행 5.500 35 신청 0.009 52 2014 44.149 25 가이드 0.554 44 지도 5.418 19 해외여행 0.009 67 쇼핑 43.915 14 관광명소 0.537 55 휴양 5.388 32 서비스 0.009 25 가이드 43.915 48 숙박 0.533 65 호주 5.377 34 안내 0.008 40 무료 43.455 49 예약 0.514 48 숙박 5.220 36 체험 0.008 43 맛집 43.455 36 체험 0.505 7 한국관광공사 4.997 58 호치민 0.008 36 체험 43.455 26 패키지 0.489 34 안내 4.781 28 가족여행 0.008 17 서울 43.229 74 공항 0.487 46 3박4 4.738 31 신혼여행 0.008 74 공항 43.005 35 신청 0.486 41 필리핀 4.665 48 숙박 0.007 78 비 43.005 78 비 0.462 31 신혼여행 4.643 46 3박4 0.007 27 항공 43.005 67 쇼핑 0.459 38 사진 4.551 44 지도 0.007 32 서비스 42.784 40 무료 40 66 대구 4.551 40 무료 0.007 83 문의 42.784 32 서비스 32 60 시내 4.527 43 맛집 0.007 24 2박3 42.564 18 롯데관광 18 43 맛집 4.465 47 할인 0.007 18 롯데관광 42.564 68 겨울 68 35 신청 4.423 49 예약 0.007 46 3박4 42.347 83 문의 83 42 포함 4.267 55 휴양 0.007 35 신청 42.132 69 홈페이지 69 54 버스 4.160 39 가을 0.007 31 신혼여행 42.132 39 가을 0.344 49 예약 4.151 60 시내 0.006 44 지도 42.132 44 지도 0.341 28 가족여행 4.150 42 포함 0.006 69 홈페이지 42.132 24 2박3 0.337 39 가을 4.088 61 캐나다 0.006 12 미국 41.709 54 버스 0.333 64 관광산업 4.070 38 사진 0.006 68 겨울 41.709 31 신혼여행 0.318 61 캐나다 3.945 52 2014 0.006 39 가을 41.5 46 3박4 0.301 13 여행상품 3.800 67 쇼핑 0.006 54 버스 41.5 12 미국 0.287 77 울릉도 3.776 65 호주 0.005 75 안전 41.294 33 관광버스 0.235 52 2014 3.659 78 비 0.005 60 시내 41.089 75 안전 0.226 68 겨울 3.485 59 홍콩 0.005 15 관광비 40.686 82 대한민국 0.224 67 쇼핑 3.481 74 공항 0.005 53 이벤트 40.686 53 이벤트 0.219 33 관광버스 3.446 77 경주 0.005 33 관광버스 40.488 15 관광비 0.219 40 무료 3.400 54 버스 0.005 37 수학여행 40.488 37 수학여행 0.215 78 비 3.397 41 필리핀 0.005 59 홍콩 40.291 62 강원도 0.211 79 크루즈 3.356 33 관광버스 0.005 20 오사카 40.097 60 시내 0.184 59 홍콩 3.345 53 이벤트 0.005 47 할인 40.097 59 홍콩 0.179 81 친구 3.271
120 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) 82 대한민국 0.005 29 베트남 40.097 20 오사카 0.167 82 대한민국 3.259 71 하와이 0.005 80 홍보 39.713 80 홍보 0.165 76 울릉도 3.208 68 겨울 0.005 82 대한민국 39.524 29 베트남 0.154 74 공항 3.035 81 친구 0.005 41 필리핀 39.524 30 문화관광 0.148 58 호치민 2.985 75 안전 0.005 56 모집 39.336 56 모집 0.144 83 대만 2.927 66 대구 0.005 84 대만 39.151 47 할인 0.140 62 강원도 2.853 83 문의 0.004 79 크루즈 39.151 77 경주 0.120 47 할인 2.849 57 5월 0.004 62 강원도 39.151 45 비자 0.117 70 10월 2.755 79 크루즈 0.004 50 기차여행 38.967 79 크루즈 0.112 56 모집 2.712 37 수학여행 0.004 77 경주 38.967 41 필리핀 0.111 57 5월 2.548 56 모집 0.004 30 문화관광 38.785 84 대만 0.109 69 홈페이지 2.492 70 10월 0.004 71 하와이 38.605 61 캐나다 0.094 71 하와이 2.426 30 문화관광 0.004 61 캐나다 38.605 65 호주 0.092 53 이벤트 2.405 69 홈페이지 0.004 65 호주 38.605 71 하와이 0.089 51 관광가이드 2.400 84 대만 0.004 55 휴양 38.426 50 기차여행 0.081 75 안전 2.376 50 기차여행 0.004 45 비자 38.249 64 관광산업 0.081 18 롯데관광 2.348 64 관광산업 0.004 51 관광가이 38.249 51 관광가이드드 0.075 83 문의 2.320 62 강원도 0.004 64 관광산업 37.9 66 대구 0.066 37 수학여행 2.066 51 관광가이드 0.003 66 대구 37.727 55 휴양 0.060 80 홍보 2.039 76 울릉도 0.003 73 관광열차 37.387 73 관광열차 0.060 50 기차여행 1.970 80 홍보 0.003 58 호치민 37.22 58 호치민 0.045 73 관광열차 1.618 73 관광열차 0.003 76 울릉도 37.054 76 울릉도 0.037 30 문화관광 1.297 72 교통정보 0.003 72 교통정보 35.47 72 교통정보 0.016 72 교통정보 0.323 63 하나투어여행사 0.000 63 하나투어여행사 0.000 63 하나투어여행사 0.000 63 하나투어여행사 0.000 < 표 7> 주요단어빈도와각중심성비교 구분 빈도연결정도중심성근접중심성매개중심성위세중심성빈도순위빈도순위빈도순위빈도순위빈도순위 여행 4981 1 0.196 1 50 1 1.717 1 93.279 1 관광 3385 2 0.147 2 50 2 1.717 2 90.506 2 여행사 660 3 0.025 4 48.824 3 1.330 3 13.772 5 제주도 610 4 0.025 5 44.865 17 0.616 22 17.831 3 추천 543 5 0.026 3 48.538 4 1.275 4 17.994 4 중국 416 6 0.015 8 46.369 8 1.015 6 9.728 10 한국관광공사 356 7 0.011 18 44.865 18 0.751 15 4.997 33 일본 326 8 0.016 7 45.109 14 0.617 21 11.798 7 여행코스 316 9 0.015 9 44.385 24 0.560 28 8.756 13 자유여행 309 10 0.014 12 46.111 9 0.768 14 8.435 15 호텔 300 11 0.017 6 46.893 7 0.897 9 12.413 6 미국 282 12 0.015 11 41.709 48 0.287 51 9.519 11 여행상품 267 13 0.012 16 45.856 12 1.010 7 3.800 50 관광명소 263 14 0.010 21 44.385 22 0.537 30 5.912 25 관광비 262 15 0.015 10 40.686 54 0.219 56 7.407 18 정보 258 16 0.014 13 47.977 5 1.269 5 9.753 9 서울 248 17 0.009 27 43.229 35 0.618 20 6.446 23 롯데관광 248 18 0.010 26 42.564 42 18 41 2.348 76 해외여행 240 19 0.009 30 45.355 13 0.659 18 5.500 28 오사카 235 20 0.013 14 40.097 59 0.167 61 8.792 12
빅데이터 분석을 통한 한국관광 인식에 관한 연구 121 가장 영향력 있는 중심 노드를 찾기 위해 주요 대상지 중심 클러스터 로 명명하였고, 그 다음의 단어의 위세중심성을 계산한 결과, 제주도, 추 2개 클러스터는 비슷한 크기로 생성되었으며, 천, 여행사, 호텔, 일본, 항공, 정보, 중국, 미국 그 중 하나는 제주도, 2박 3일, 3박 4일, 가족여 등이 높게 나타났다. 여기에서 제주도와 해외 국 행, 여행코스, 맛집 등이 포함되어 있어 제주 중 가들의 비중도가 큼을 알 수 있다. 심 여행 클러스터 로 명명하였고, 다른 하나는 관 단어의 빈도보다 연결정도 중심성이 높거나 광열차, 관광버스, 관광가이드, 관광명소, 안전, 위세중심성이 높은 단어를 찾아 상대적으로 다른 무료, 한국관광공사 등이 포함되어 있어 관광활 단어나 이슈와 보다 밀접하게 연결되어 있는 것 동 중심 클러스터 로 명명하였다. 을 확인하고자 이들 값을 비교하였다. 빈도 순위 상위 20개의 단어를 비교한 결과 다른 단어나 이슈와 보다 밀접하게 연결된 단어는 추천, 호 4. 주요 단어 에고네트워크 분석(Ego Network Analysis) 텔, 정보로 나타났다. 에고네트워크 분석은 특정한 노드를 중심으로 3. CONCOR(CONvergence of iterated CORrelations) 분석 관련된 다른 노드간의 연결을 표현한 네트워크로 써 이를 통해 내재된 구성노드들 간의 특성을 기 술하고 파악하는데 사용한다. 본 연구에서는 일 CONCOR는 상관관계 분석을 반복적으로 수 행하여 적정한 수준의 유사성 집단을 찾아내는 정별 2박 3일 과 3박 4일 의 에고네트워크 분석 을 실시하였다. 방법으로 본 연구에서는 의미망 분석결과를 바탕 분석결과 2박 3일은 맛 집, 추천, 체험, 5월, 으로 CONCOR 분석을 실시하였다. 그 결과, 3 홈페이지, 가족여행, 정보, 숙박, 안전, 포함, 관 개의 클러스터(cluster)가 생성되었고 그 중 서 광명소, 무료, 쇼핑, 일본 등과의 연결이 강한 것 울, 경주, 부산, 강원도, 호주, 하와이, 홍콩, 오 으로 나타났으며, 3박 4일은 호텔, 친구, 5월, 사카, 홈페이지, 여행상품 등의 노드가 포함된 예약, 중국, 제주도, 여행사, 여행상품, 자유여행 클러스터가 가장 크게 이루어졌으며, 이를 관광 등이 강한 것으로 도출되었다. 이러한 결과는 2 <그림 4> CONCOR 분석 결과 도식화
122 관광학연구 제39권 제10호(통권 제136호) <그림 5> 2박 3일 에고네트워크 <그림 6> 3박 4일의 에고네트워크 <그림 7> 일정별(2박 3일/ 3박4일) 에고네트워크 분석 비교
빅데이터분석을통한한국관광인식에관한연구 123 박 3일의경우가족여행의유형이강하며, 주로홈페이지등을통해정보를얻고, 관광명소나맛집등을추천을통해즐기며, 무료, 체험을선호하면서안전도고려하는것으로풀이된다. 3박 4일의경우가까운중국이나홍콩과같은해외여행을위한내용들이강하며, 여행사의여행상품을많이고려하는것으로확인된다. 하지만, 여행상품패키지못지않게예약및자유여행도강하게나타나고있음이확인된다. V. 결론 본연구에서는국내관광에대한관광인식을빅데이터를통해분석하고자 2014년부터 1월 1 일- 12월 31일까지 1년간의네이버, 다음, 구글을활용하여 관광 / 여행 키워드를포함하고있는웹페이지, 개인들이운영하는블로그, 공신력있는정보를제공하는뉴스등을수집하여분석하였다. 데이터는 UCINET 와함께패키지화된 NetDraw 를활용하여연결정도중심성, 근접중심성, 매개중심성, 그리고아이겐벡터중심성등을분석하였다. 분석결과전반적으로해외주요국가및도시, 국내주요도시등의웹가시성 (Web visibility) 이높은것으로파악되었으며, 가족여행, 자유여행, 해외여행, 신혼여행등의관광행태와숙박관광과 2박 3일, 3박 4일등의여행일정도높게나타났다. 특히, 제주도의경우주요단어에서도높게나타났지만, 유사한데이터 ( 제주여행, 제주도여행, 제주도관광, 제주홀로여행, 제주가족여행, 제주관광공사, 제주공항, 제주맛집, 제주둘레길, 제주관광지도등 ) 로도많이제시되어이들을통합한다면전체결과물중제주도의웹가시성은가장독보적인수준이다. 이외에도 1 일, 1인등의빈도가부각되었고, 안전, 관광주간, 관광두레, 해미읍성도포함되어있어 2014 년의사회환경적특성을반영하고있음이확인된다. 그러나 2014년도에는정부의관광정책이나관광개발과관련된내용은미미한것으로파악된다. 단, 수학여행이높게출현되어세월로사고로인한수학여행폐지논란이이어지면서기사화된것이출연된경우가있긴하다. 생성된데이터들은적정한수준의유사성으로 3개의클러스터 (cluster) 가생성되었고그중서울, 경주, 부산, 강원도, 호주, 하와이, 홍콩, 오사카, 홈페이지, 여행상품등의노드가포함된 관광대상지중심클러스터 와제주도, 2박 3일, 3박 4일, 가족여행, 여행코스, 맛집등이포함되어있는 제주중심여행클러스터, 관광열차, 관광버스, 관광가이드, 관광명소, 안전, 무료, 한국관광공사등이포함되어있는 관광활동중심클러스터 로구분되었다. 이외에도 2박 3일 과 3박 4일 에대한에고네트워크분석에서 2박 3일은맛집, 추천, 체험, 홈페이지, 가족여행, 정보, 숙박, 안전, 포함, 관광명소, 무료, 쇼핑, 일본등과의연결이강하게나타났으며, 3박 4일은호텔, 친구, 5월, 예약, 중국, 제주도, 여행사, 여행상품, 자유여행등이강하게도출되었다. 이러한분석결과를통해본연구에서는다음과같은시사점을제시한다. 첫째, 관광인식범주가다양함을확인할수있다. 특히여행행태에있어서자유여행, 가족여행, 문화관광, 기차여행, 수학여행, 해외여행, 여행상품등이주요인식단어로도출되었다. 이중자유여행은 2014년도의미디어의영향이큰것으로풀이된다. TV 방송에 꽃보다할배 와같은여행관련프로그램의방영으로해외여행의경우패키지상품못지않게자유여행의선호도가높아지고있으며, 이러한영향이사회트렌드로반영된결과로볼수있다. 둘째, 관광목적지로서의제주도의위상이확인되는결과이다. 앞에서도제시하였지만, 제주도의경우제주여행또는관광외에도제주도모
124 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) 바일할인쿠폰, 제주도여행코스, 제주도관광지, 제주관광공사, 제주관광협회, 제주도겨울여행코스, 제주관광센터, 드라이브제주, 제주도효도관광, 제주특급호텔무료이용, 제주도청, 제주도택시관광, 제주관광정보, 제주중문관광단지, 제주도버스관광패키지, 제주관광홍보, 제주여행할인쇼핑몰, 제주여행계획, 제주도가족여행, 제주항, 제주숙박, 제주관광안내등의단어들로제시되어데이터양이가장크며, 또한다양한형태로접근되었음이확인된다. 이처럼제주도가국내에서최고의관광목적지로서위상이높은것은긍정적현상이나전체적인국내관광시장을고려해볼때, 제주도뿐만아니라다양한지역으로의관심을분산시킬수있는대안이필요하다. 이는각기지자체들의자발적인노력도중요하겠지만정부에서도방안을강구하여특정관광목적지로의집중현상보다는분산을통해지역의균형발전프레임을구축할필요가있다. 셋째, 1인관광, 홀로관광의데이터도부각되어관광행태의다양성을더해주고있다. 직접정보를검색하고, 여행코스를찾으며, 예약, 할인, 무료, 지도, 체험거리등을추구하는행태들이높아져부각된현상이라해석된다. 이는타인이바라보는시선에서벗어나고싶어하는요즘의싱글라이프와그맥을같이한다고보여진다. 점차혼자에익숙해지는사회현상을고려하여관광시장에서도싱글시장의잠재성을고려해야할것이다. 넷째, 정부정책이나관광개발과관련된데이터는상대적으로미미한것으로확인된다. 대체로특수형태의고급관광보다일반보편적관광활동을추구하는욕구들이높아일상에서즐길수있는소소한것들이많이도출된만큼, 관광정책방향수립시좀더생활밀착형관광정책수립에관심을가지는것도성과제고에도움이될것으로풀이된다. 소셜미디어빅데이터는양 ( 量 ) 에제한이없다. 무제한으로수집한정보라하더라도텍스트마이닝툴 (text-mining tool) 을이용하면다양한반응들을정량화해서분석할수있다 ( 신승중, 2012). SNS에서는개인의취향이보다직접적으로반영되고, 진실성과진정성, 관련성이증가되므로데이터로서의가치가높다. 또한실시간성과가속성이라는특징을지녔기때문에어떠한매체보다도이슈의확산속도가빠르다. 즉 SNS 상의빅데이터를관광인식의측정기준으로삼는다는것은해당시점에어떤방법론보다도시의적절하고유용하며정확한평가를얻는데도움이될것으로기대한다. 이러한맥락에서본연구는디지털경제의확산으로관광산업에서도빅데이터에기반한과학적인마케팅을도입할수있는단초를제공하고, 나아가통계분석에서융복합적측면에서의학문적성과를제고하는논의로서그의의를가진다. 하지만, 본연구는국내관광인식조사에있어서한국어영역에대해서만분석이이루어져영어권역에대한의견은포함하지못한아쉬움이있다. 즉, 외국어분석솔루션에대한기술적한계로외국인들의인식은분석되지못하였다. 향후에는이를극복하여국내관광에대한세계각국관광객들의반응을살펴보고, 나아가숙박시설, 관광인프라등세부영역별인식변화등을살펴봄으로서관광마케팅전략수립에유용한토대를마련해야할것이다. 참고문헌강만모 김상락 박상무 (2012). 빅데이터의분석과활용. 정보과학회지, 30(6), 25-32. 공효순 송은지 (2013). 빅데이터를이용한호텔기업 CRM 및보안에관한연구. 융합보안논문지, 13(4), 69-75. 김용학 (2011). 사회연결망분석. 서울 : 박영사.
빅데이터분석을통한한국관광인식에관한연구 125 김해원 전채남 (2014). 빅데이터를활용한콘텐츠제작방안에관한탐색적연구 : TV홈쇼핑을중심으로. 사이버커뮤니케이션학보, 31 (3), 5-51. 김정하 (2012). 사회연결망분석을이용한지역의료관광산업의이해관계자네트워크분석 : 서울시강남구지역을대상으로. 한양대학교대학원석사학위논문. 네이버지식백과 (2014). http://terms.naver.com. 도해용 류기상 (2013). 빅데이터분석기법을이용한레스토랑품질과고객만족이추천행동에미치는영향에관한연구. 외식경영연구, 16(2), 233-255. 도해용 이애주 이창원 (2013). 빅데이터를이용한레스토랑품질이고객만족에미치는영향에관한연구 : 국가의조절효과중심으로. 외식경영연구, 16(6), 49-70. 문정욱 (2013). 관광서비스발전을위한 ICT 활용현황과시사점 : 국내외사례분석을중심으로. 방송통신정책, 25(20), 1-35. 민경익 이태숙 (2012). 미디어분석을통한한국관광인식변화에관한연구 : 신문기사를중심으로. 관광학연구, 36(10), 81-104. 변정우 (2013). 빅데이터관광에서얼마나활용될수있을까?. 웹진문화관광, 3월호. 배동민 박현수 오기환 (2012). 빅데이터동향및정책시사점. 방송통신정책, 25(10), 37-74. 삼성경제연구소 (2012). 빅데이터 : 산업지각변동의진원. CEO Information, 851. 삼정 KPMG 경제연구원 (2012). 빅데이터분석을통한기업미래가치창출. 신승중 (2012). 빅데이타를이용한 SNS 활용방안연구. 한국인터넷방송통신학회논문지, 12 (6), 267-272. 송태민 (2012). 빅데이터를활용한자살요인다변량분석 : Google 검색트렌드적용. 보건 복지 Issue & Focus, 168호. 연합뉴스 (2013. 9. 12). 제주관광정보빅데이터플랫폼구축... 실시간서비스. 이영진 정호권 부석현 (2010). 온라인관광 (etourism) 정보의공공성평가 : 포털사이트를대상으로. 관광 레저연구, 22(3), 389-408. 이영진 윤지환 (2014). 관광분야에서 SNS 빅데이터활용방법모색 : 관광정보검색키워드분석을중심으로. 관광연구저널, 28(3), 5-14. 이양환 (2013). 문화산업에서빅데이터의필요성. 웹진문화관광, 3월호. 전채남 (2014). 텍스톰을이용한 SNA 분석. 한국데이터사이언스학회 2014 학술대회발표자료. 정근하 (2011). 텍스트마이닝과네트워크분석을활용한미래예측방법연구. 한국과학기술기획평가원. 한국관광공사 (2014). 빅데이터활용관광사업성과시범분석 : 2013 문화관광축제를중심으로. 한국관광공사. 한국문화관광연구원 (2012). 미래관광환경변화전망과新관광정책방향. 한국문화관광연구원. 한국정보화진흥원 (2012). 대한민국사회현안과빅데이터전략세미나. 한국정보화진흥원. 한형상 이창호 (2014). 빅데이터분석의현황과발전전략. PD 이슈리포트, 6. 함유근 채승병 (2012). 빅데이터, 경영을바꾸다. 삼성경제연구소. NSP 통신 (2013.08.22). 부산해운대구, 전국최초 빅데이터 접목관광정책선보여. Chung, C., & Park, H. W. (2010). Textual analysis of a political message: The inaugural addresses of two Korean presidents. Social Science Information, 49(2), 215-239. Douglas, L. (2012). The importance of Big Data: A definition. Gartner, Retrieved, 21, June. IBM. (2011). Understanding big data. Gartner. (2012). The importance of Big Data : A definition. IDC. (2011. 6). Extracting value from chaos.
126 관광학연구제 39 권제 10 호 ( 통권제 136 호 ) IPK International. (2011). ITB World Travel Report 2010/2011. McKinsey Global Institute. (2011. 6). Big data: The next frontier for innovation, competition, and productivity. O eilly. (2012). Big data now: Current perspectives from O eilly Readar. O eilly Media. UCINET Softwqre. (2015). https://sites. google.com/site/ucinetsoftware/home Wasserman, S., & Faust, K. (1994). Social network analysis: Methods and applications. New York, Cambridge University Press. World Economic Forum. (2012). Big data, big impact: New possibilities for international development. 2015 년 7월 10일최초투고논문접수 2015년 11월 17일최종심사완료및게재확정통보 2015년 11월 19일최종논문도착 3인익명심사畢