외래객국적별맞춤형관광지추천전략 Report74
Contents 1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 2. 데이터탐색및매시업의활용 1) 탐색적기초분석 2) 외부데이터매시업의활용 3) 다양한파생변수생성 3. 기본분석 1) 국적별장 / 단기체류집단에따른관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지이동패턴분석 4. 추가분석 1) 국적별 SNS 를활용한텍스트마이닝분석 2) 국적별서울지역관광지분석 5. 최종관광마케팅방안 6. 참고문헌
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 외래관광시장의속사정 방한외래객수및관광수입 방한외래객구성비 ( 단위 : 천명 ) 14000 12000 10000 8000 6000 4000 2000 0 ( 단위 : 백만 US$) 16000 14000 12000 10000 8000 6000 4000 2000 0 2005 2006 2007 2008 2009 2010 2011 2012 2013 아시아주 80.9% 방한외래관광객수관광수입 ( 출처 : TOUR.GO 관광지식정보시스템 ) 방한외래객수는 2005 년기준, 600 만명에서 2013 년에는 1200 만명으로 2 배증가 2005 년기준, 관광수입이 68 억달러에서 2013 년에는 141 억달러로 2.1 배증가 관광산업경쟁력순위가 2012 년대비무려 7 단계상승하여 25 위에위치함 ( 출처 : TOUR.GO 관광지식정보시스템 ) 방한외래객중 80.9% 는아시아국적관광객, 그중에서도중국 (35.5%) 과일본 (22.6%) 관광객이가장많이방문 2000 년도부터계속되는관광수지적자, 올해 1 분기해외관광지출액이사상최대를기록함과동시에, 그로인해 1 분기관광수지는 7 억 2010 만달러적자 외래관광시장이외형적인면에서성장세를거듭하고있지만, 속사정을들여다보면중국의 나홀로독주 로중국이외의외국관광객유치에힘써야하며, 뿐만아니라외국인관광객 1 인당평균지출액도 1990 년도에비해 100 달러줄어든 1,108 달러 (2010 년기준 ). 이렇듯외래관광시장이양극화로치닫는문제해결방안이절실하며, 이제는다양한아이디어로다양성이중심이되는시대에적극대비해야함
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 외래관광시장벤다이어그램 Idea 벤다이어그램 관광산업 이라는 keyword 를가지고관광산업을발전시킬수있는요소를살펴보았다. 그결과, 관광산업으로서얻고자하는목적을달성하기위해서는다양한 관광상품개발 이중요함을알수있었다.
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 F R A M E W O R K Key note
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 raw 데이터파악 * Call 이발생한건별데이터로빈도분석을실시한결과이다. ( 단위 : 천건 ) 700 600 월별 Call 발생빈도 ( 단위 : 천건 ) 350 요일별 Call 발생빈도 500 400 300 200 100 year 300 250 200 150 100 50 week 0 2013 년 12 월 2014 년 01 월 2014 년 02 월 0 월화수목금토일 2013 년 12 월과 2014 년 1 월 2 일모두비슷한빈도로 Call 발생이이루어짐 요일별, Call 발생빈도를살펴본결과주중에는 Call 빈도가비슷하게이루어지지만, 주말에는빈도가낮음
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 raw 데이터파악 국적별 Call 발생빈도 서울과지방권에서의 Call 발생빈도 지역별첫 Call 발생빈도 N02 (31.3%) N01 (45.1%) 지방 (51%) 서울 (49%) ( 단위 : 천건 ) 40 35 30 25 20 15 10 5 0 인천광역시중구운서동 서울특별시중구명동 2 가 서울특과별해시동강서구 서충울무특로별 2 시가중구 서태울평특로별 2 시가중구 서울특별시중구신당동 서을울지특로별 2 시가중구 Call 발생빈도가높은국적은 N01 이 45.1% 를차지하고다음으로 N02 가 31.3% 를차지 외래객이전화기를사용한지역을크게서울과지방으로두분류로나누어빈도분석한결과, 서울과지방에서비슷한 Call 발생빈도가보임을알수있음 외래객이가장처음 Call 이일어난지역을빈도로알아본결과, 인천광역시중구운서동 으로나타남. 인천국제공항이있는지역이라첫번째방문지에서많은빈도를차지하는것으로생각됨
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 raw 데이터파악 Call 데이터전체 (1,774,618 건 ) World Touristiness Map 노란색 : 관광객이많음, 빨간색 : 관광객이어느정도있음, 파란색 : 관광객이적음 왼쪽사진은주어진 raw 데이터를이용하여 Call 이발생된위도, 경도를가지고지도상에표시한지도이며,. 오른쪽사진은 World Touristiness Map 으로사진촬영횟수가가장많은여행지를보여주는열지도이다. 두사진을비교해보았을때, 두사진모두대도시지역에만많은관광객들이몰려있다는것을알수있다.
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 raw 데이터파악 국적별 Call 빈도시각화지도 - 각국적별 Call 빈도를찍어본결과. - 외견상각국적마다서울, 인천, 대구, 광주, 부산, 제주도등대도시지역에서 Call 발생빈도가많음을볼수있으며즉, 외래객수가많음을알수있음 - 하지만, 국적마다차이는없어보임 - 그러나표면적으로보이는것과는달리국적별관광이동경로는다를것으로예상 N01 N02 N03 N04 N05 N06 N07 N08 N09 N10
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 관광시장관련기사 이들은 20~30 대젊은층을중심으로항공및숙박권예약, 관광명소정보등여행에필요한것들을개별적으로준비한다. 그런만큼유명관광지와쇼핑센터위주의관광에편중됐던종래단체여행객들과는취향과여행목적이판이하다. 2014.03.18 부산일보中 용평리조트에서개최되는이번행사는태국의송크란연휴에맞춰 12 일부터 14 일까지 3 일간진행되며썰매는겨울에만가능하다는고정관념에서탈피해한국의눈과꽃을좋아하는태국관광객수요를겨냥한맞춤형상품으로개발됐다. 2014.04.09 경제투데이中 한국관광공사가오는 21 일부터다음달 6 일까지이어지는중국최대명절인춘절을맞아요우커 ( 중국인관광객 ) 맞춤형마케팅을추진한다. 2014.01.10 매트로신문中 중국관광객들은상품이진부하다고불평한다. 맞는말이다. 서울 ~ 부산 ~ 제주도코스는 10 년동안바뀌지않았다. 중국인에대한우리인식이현실을따라잡지못하고있다. 외래관광객마다다양한관광상품에대한 Needs 가발생되고있는현실, 국적별또는개인별로다양한맞춤형관광상품제공이필요!
1. 과제파악및방향설정 1) 과제파악 2) 사전조사 3) 분석방향설정 분석주제 외래객국적별맞춤형관광지추천전략 세부목표 I. 국적별평균체류기간을기준으로체류기간집단별관광지이동경로분석 II. 국적별주중과주말로나누어관광지이동경로분석 추가분석 I. 국적별 SNS를활용한텍스트마이닝분석 II. 국적별서울지역관광지분석 달성하고자하는목표 : 다양한방법으로외래객의각국적별맞춤형관광상품을개발하기위함
2. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 외부데이터매시업 우편번호 DATA 우리나라관광지정보 DATA - 대한민국의우편번호는현재지역별발송번호 3 자리와세부주소발송번호 3 자리를합쳐 6 자리의우편번호를이용하고있음 - 우편번호를잘이용하면, 우편번호가해당하는시 / 군 / 구의위치를파악해낼수있음 - 예를들어, 우편번호 446-920 는경기도용인시기흥구농서동을의미하며, 여기서앞자리 446 은경기도용인시를나타냄 - 이렇듯, 현재주어진데이터의우편번호앞 3 자리를이용하여, 우편번호 DATA 와매시업을시도하면, 현재 Call 발생위치에해당하는시 / 군 / 구를파악해낼수있음 - 주어진위도, 경도데이터와우편번호외부 DATA 만으로는관광지에대한정보를얻기에어려움이있으므로한국관광공사 TOUR API 에서제공하는관광지위도, 경도데이터를매시업데이터로선택하였음 - 각위도, 경도옆에해당하는관광지명, 주소, 관광지와관련깊은테마 ( 대분류, 중분류, 소분류 ) 변수도삽입되어있음 - 예를들어, 관광지명이 문경새재도립공원 이라면대분류 : 자연, 중분류 : 자연관광지, 소분류 : 도립공원형식으로코딩되어있음 - 매시업할때에는주어진데이터와매시업용데이터모두위도, 경도를소수점 2 째자리까지설정하여매시업함 데이터출처 : http://www.epost.go.kr/search/zipcode/jibunaddressdown.jsp 데이터출처 : 한국관광공사 TOUR API 참조
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 외부데이터매시업과정 1 Key 변수 : 우편번호앞 3 자리 기존 DATA Key : 우편번호 우편번호 DATA - 기존 DATA 의 zip 변수앞 3 자리와매시업할데이터인 우편번호 DATA 의우편번호앞 3 자리를 key 변수로설정하고매시업실시!(left join 사용 ) - 평택시와여수시는각각도시통합으로인해중복되는우편번호가발생됨. 그에따라각도시마다하나의우편번호로중복을피함 Ex) 2 기존 DATA Key : 위도, 경도 관광지정보 DATA Key 변수 : 위도, 경도소수점 2 째자리 - 기존 DATA 의위도, 경도변수인 latitude, longitude 를소수점 2 째자리까리설정하고, 매시업할데이터인 관광지정보 DATA 도또한위도, 경도변수를소수점 2 째자리까지설정 - 그후, 두데이터의 key 변수를위도, 경도변수로설정하고매시업실시!(left join 사용 ) - 소수점 2 째자리로맞춘이유 : 소수점자릿수가많으면많을수록한걸음폭정도의반경이됨기본적으로관광지는넓다는기준을두었으며, 소수점자릿수를하나하나씩좁혀본결과, 소수점 2 째자리가가장적당하게관광지를대표할것이라고생각함
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 파생변수생성리스트 분석의다양성을높이기위하여여러가지파생변수를생성하였음. 생성된파생변수는분석의다양성을높이기위해서도사용되었지만외국인의특성을파악하기위해서도사용되었음. 파생변수명변수설명세부설명 date_1 weekday 1960 년 1 월 1 일을기준으로해당 ID 별날짜데이터까지의일수 일주일단위의요일을의미하는숫자변수 ex)1: 일요일, 2: 월요일, 3: 화요일, Week_day 일주일단위의요일텍스트변수 weekdayn 주중과주말의구분변수 ex)1: 주중, 2: 주말 hour 시간 ( 시 ) 변수 (00시 ~23시 ) 날짜요일및시간과관련된변수. 시간대 ( 새벽 / 오전 / 오후 / 저녁 ) 별각국적별여행 패턴을확인해보고자하였음. minute 시간 ( 분 ) 변수 (00 분 ~59 분 ) apm si_do si_gun_gu address count bang bang1 period period_bi period_bi1 id_n * 00시 ~06시 : 새벽 * 06시 ~11시 : 오전 * 11시 ~17시 : 오후 * 17시 ~00시 : 저녁광역시 / 도변수시 / 군 / 구변수구분자를사용하여 si_do 변수와 si_gun_gu 변수결합 Call발생빈도에따른구분변수 * 1: Call발생빈도가 1번인사람 * 2: Call발생빈도가 2번이상인사람한 ID당지역이동순서한 ID당지역이동횟수한 ID당체류기간각국적별평균체류일수를기준으로나눈장 / 단기체류자구분변수 * 1: 단기체류자 * 2: 장기체류자전체국적평균체류일수 (7.3일) 를기준으로나눈장 / 단기체류자구분변수 * 1: 단기체류자 * 2: 장기체류자문자형식으로암호화되어있는 id변수를숫자로재코딩한변수 우편번호 DB를이용하여각우편번호에시 / 군 / 구정보를삽입하는데에사용하고자하였음. Call발생빈도가 2번이상인사람들은이동경로를파악할수있지만, 빈도가 1번뿐인사람들은경로파악이어려우므로구분변수를생성. 한 ID당처음콜이발생한날짜와마지막콜이발생한날짜를이용하여체류기간변수생성. 각국적별평균체류일수를기준으로장 / 단기체류자를파악하고자하였음.
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 파생변수생성과정 2013 년외국인관광객평균체류기간 국가 평균체류일 14 12 10 8 6 4 2 0 11.5 11 캐나다 미국 8.6 오스트레일리아 7.3 7.2 7.1 싱가포르 말레이시아 중국 5.5 5.5 5.4 대만 홍콩 태국 4.1 일본 ( 출처 : 2013 외래관광객실태조사참고 ) 캐나다 11.5 미국 11 오스트레일리아 8.6 싱가포르 7.3 말레이시아 7.2 중국 7.1 대만 5.5 홍콩 5.5 태국 5.4 일본 4.1 전체평균 7.3일 파생변수중, period_bi 변수는위의 2013 년각국적별외국인관광객평균체류기간 을기반으로각국적마다평균체류일수를중심으로평균체류일보다체류일수가적으면단기체류자 (period_bi=1), 크면장기체류자 (period_bi=2) 로구분하였음 period_bi1 변수는 10 개국가마다평균체류일수를전체평균 (7.3 일 ) 내어해당일수를가지고전체외래객의장단기체류여부를구분하였음 이렇게, 각국가별로 2013 년평균체류기간을이용한 체류기간재범주화 를실시하였음
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 이상치제거기준 대포폰 이란? - 도용한다른사람의명의로개통한휴대전화. - 자신의신분을감추기위해다른사람명의로등록해사용하는휴대전화이다. 첫번째제거기준 같은 id 가같은날짜, 같은시간 ( 시 ), 다른장소는 짧은시간에도시간의거리만큼이동할수없다 는가정하에대포폰으로의심하여제거 사례 제거된개체수 -1,136,370 건 (-166,652 명 ) 두번째제거기준 제거된개체수 같은날짜, 같은시간 ( 시 ), 같은지역안에서여러번 Call 이발생할경우, 한날짜에한지역 (zip 변수기준 ) 으로중복제거시켜서이동경로를알아보고자함 -344,293 건 (-0 명 ) 사례
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 데이터생성과정 Call 건 DATA ( 행수 : 293,955 개 ) raw DATA (1,774,618 건 ) (273,553 명 ) 대포폰의심데이터제거 정제된 DATA (638,248 건 ) (106,901 명 ) 이상치제거 최종 DATA (293,955 건 ) (106,901 명 ) : 분석에사용된데이터 사람 DATA ( 행수 : 106,901 개 )
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 주어진데이터속, 국가파악 2012 년연간방한외래관광객입국자수 2013 년 12 월, 2014 년 1~2 월외래관광객입국자수합계 주어진데이터속, 외래관광객국적빈도 ( 단위 : 천명 ) 4,000 3,500 3,000 2,500 2,000 1,500 1,000 500 0 일본 중국 미국 대만 홍콩 태국 말레이시아 싱가포르 호주 캐나다 ( 단위 : 천명 ) 1,000 900 800 700 600 500 400 300 200 100 0 중국 일본 미국 대만 홍콩 태국 말레이시아 싱가포르 캐나다 호주 ( 단위 : 천명 ) 120 100 80 60 40 20 0 N02 N01 N10 N03 N06 N04 N09 N07 N08 N05 - 주어진데이터속, Country_code 변수는한국방문상위 10 개국을나타낸변수 - 위의그래프는 2012 년도한국문화관광연구원이제공한 2012 년연간외래관광객입국자수의상위 10 개국그래프 - 주어진데이터속국적파악을위해위의국가명 10 개를이용 - 주어진데이터는 2013 년 12 월부터 2014 년 2 월까지의 3 개월간데이터 - 기간에맞게한국관광공사에서제공하는실제 2013 년 12 월부터 2014 년 2 월까지의월별외래관광객입국자수를파악 ( 단, 국가는왼쪽의 2012 년연간방한외래관광객입국자수 TOP10 국가 만으로파악 ) ( 데이터출처 : TOUR.GO 관광지식정보시스템 ) ( 데이터출처 : TOUR.GO 관광지식정보시스템 ) - 대포폰이라고의심되는 id 만제거후, 외래관광객국적빈도를뽑아보고가운데그래프에서나타내듯이한국관광공사에서제공한실제 3 개월간입국자수그래프와비교하여, 두그래프의첫번째빈도끼리, 두번째빈도끼리매칭. Ex) N01= 일본, N02= 중국, N03= 대만, - 단, 분석의목적은각국가별관광지이동경로분석일뿐, 국가매칭은편의상실시한것이므로실제와다를수있음
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 데이터기초분석 국적별 call 발생빈도 광역시 도별 call 발생빈도 그외 48% 서울 특별시 52% 일본 (N01) 에서다른국적들에비해상대적으로높은 call 이발생하였다그리고일본을제외한다른국적들에서는단기체류자의 call 발생빈도가 60% 이상을차지했다. 요일별 call 발생빈도 주말에비해주중에 call 발생빈도가높았으며, call 발생빈도가가장낮았던요일과가장높았던요일의빈도차이는약 1.7 배정도났다. 우리나라의수도권인서울특별시, 인천광역시, 경기도가 call 발생빈도 Top3 지역으로나타났으며그뒤를이어서제주특별자치도, 부산광역시가 4,5 위로나타났다.
1. 데이터탐색및매시업의활용 1) 외부데이터매시업의활용 2) 다양한파생변수생성 3) 탐색적기초분석 데이터기초분석 ( 명수 ) 서울특별시시 군 구별 call 발생빈도 -N01( 일본 ) : 48164 명 서울특별시시 군 구별 call 발생빈도 중구 강남구 일본의경우는중국에비해송파구에서 call 발생빈도순위가높게나왔다. 송파구에는롯데월드, 롯데백화점, 롯데마트등이있었다. 서울특별시시 군 구별 call 발생빈도 -N02( 중국 ) : 30135 명 관광지 외래객 외래객들을많이만날수있는명동, 동대문, 남대문, 인사동등이위치하는서울특별시중구에서가장많은 call 발생빈도가나왔으며, 2 위를차지하는지역과약 2 배정도차이가났다. 중국의경우는일본에비해강서구에서 call 발생빈도순위가높게나왔다. 중국외래객들이많은관심을갖는것들중하나가제주도투자인데확인해본결과강서구에는제주도를갈수있는김포국제공항이있었다.
3. 기본분석 1) 국적별장 / 단기체류집단에따른관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지이동패턴분석
3. 기본분석 1) 국적별장 / 단기체류집단에따른 관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지이동패턴분석 시차연관성분석 _1 국적별장 / 단기체류집단에따라 ID Target Sequence id_n 변수 address 변수 bang 변수 - 각국적별여행이동경로를파악하기위하여시차연관성분석을실시함 - 각국적별장 / 단기체류여부를구분지어분석하였으며, 단기외래객들은여행목적이며, 장기외래객들은비즈니스혹은사업과관련되어방문하였다고가정하여, 단기외래객들만분석하였음 - 여기서는방한외래객랜덤으로 4 개국가만을대상으로하여분석 - 관광객들의이동경로가다양할것으로예상하여항목수를최대 10 으로지정하고분석실시
3. 기본분석 1) 국적별장 / 단기체류집단에따른 관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지이동패턴분석 시차연관성분석 _1 일본 ( 단기 ) 중국 ( 단기 ) 결과해석 : 일본단기관광객들은서울중구를간사람중에서또서울중구를방문하는비율은 48.28% 이고, 제주도제주시를방문한사람중에서또제주도제주시를방문하는비율은 64.49% 로높음을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다. 결과해석 : 중국단기관광객들은서울중구를간사람중에서또서울중구를방문하는비율은 47.18% 이고, 서울종로구를방문한사람중에서서울중구를방문하는비율은 44.33% 로높음을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다.
3. 기본분석 1) 국적별장 / 단기체류집단에따른 관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지이동패턴분석 시차연관성분석 _1 미국 ( 단기 ) 홍콩 ( 단기 ) 결과해석 : 미국단기관광객들은서울중구를간사람중에서또서울중구를방문하는비율은 45.73% 이고, 서울강남구를방문한사람중에서또서울강남구를방문하는비율은 47.56% 임을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다. 수도권외지역으로는경남거제시, 강원도평창군도많은빈도를보인다. 결과해석 : 홍콩단기관광객들은서울중구를간사람중에서또서울중구를방문하는비율은 43.97% 이고, 서울강남구를방문한사람중에서서울강남구를방문하는비율은 41.84% 임을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다. 수도권외지역으로는강원도평창군도많은빈도를보인다.
3. 기본분석 1) 국적별장 / 단기체류집단에따른관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지 이동패턴분석 시차연관성분석 _2 국적별주중 / 주말에따라 ID Target Sequence id_n 변수 address 변수 bang 변수 - 각국적별여행이동경로를파악하기위하여시차연관성분석을실시함 - 각국적별주중 / 주말 Call 발생여부를구분지어분석 - 여기서는방한외래객랜덤으로 4 개국가만을대상으로하여분석 - 관광객들의이동경로가다양할것으로예상하여항목수를최대 10 으로지정하고분석실시
3. 기본분석 1) 국적별장 / 단기체류집단에따른관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지 이동패턴분석 시차연관성분석 _2 일본 ( 주중 ) 일본 ( 주말 ) 결과해석 : 일본관광객들은주중에서울중구를간사람중에서또서울중구를방문하는비율은 46.18% 이고, 인천중구를방문한사람중에서또인천중구를방문하는비율은 28.47% 로매우높음을볼수있다. 이렇듯, 주중에는지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다. 결과해석 : 일본관광객들은주말에서울중구를간사람중에서또서울중구를방문하는비율은 32.72% 이고, 제주도제주시를방문한사람중에서제주도제주시를방문하는비율은 49.17% 임을볼수있다. 이렇듯, 주중뿐만아니라주말에도지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다.
3. 기본분석 1) 국적별장 / 단기체류집단에따른관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지 이동패턴분석 시차연관성분석 _2 중국 ( 주중 ) 중국 ( 주말 ) 결과해석 : 중국관광객들은주중에서울중구를간사람중에서또서울중구를방문하는비율은 43.32% 이고, 서울강남구를방문한사람중에서또서울강남구를방문하는비율은 46.44% 임을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다. 결과해석 : 중국관광객들은주말에서울중구를간사람중에서또서울중구를방문하는비율은 31.44% 이고, 서울강남구를방문한사람중에서서울강남구를방문하는비율은 29.18% 임을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다.
3. 기본분석 1) 국적별장 / 단기체류집단에따른관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지 이동패턴분석 시차연관성분석 _2 미국 ( 주중 ) 미국 ( 주말 ) 결과해석 : 미국관광객들은주중에서울중구를간사람중에서또서울중구를방문하는비율은 47.65% 이고, 서울강남구를방문한사람중에서또서울강남구를방문하는비율은 49.79% 임을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다. 결과해석 : 미국관광객들은주말에서울중구를간사람중에서또서울중구를방문하는비율은 47.18% 로매우높고, 서울종로구를방문한사람중에서서울중구를방문하는비율은 44.33% 로매우높음을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다.
3. 기본분석 1) 국적별장 / 단기체류집단에따른관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지 이동패턴분석 시차연관성분석 _2 홍콩 ( 주중 ) 홍콩 ( 주말 ) 결과해석 : 홍콩관광객들은주중에서울중구를간사람중에서또서울중구를방문하는비율은 45.71% 이고, 서울강남구를방문한사람중에서또서울강남구를방문하는비율은 49.12% 임을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다. 결과해석 : 홍콩관광객들은주말에서울중구를간사람중에서또서울중구를방문하는비율은 22.22% 이고, 서울강남구를방문한사람중에서서울깅님구를방문하는비율은 34.51% 임을볼수있다. 이렇듯, 지역간의이동보다는대도시에서만관광을하는경향이있음을알수있다.
3. 기본분석 1) 국적별장 / 단기체류집단에따른관광지이동패턴분석 2) 국적별주중 / 주말에따른관광지 이동패턴분석 분석결과및한계점 전체로밍데이터에서분석용로밍데이터는대략 1/10 정도뿐이므로분석결과를일반화하기에는위험함과어려움이따름 빅데이터라고하여도같은시간에다른장소에서 Call 이발생한대포폰의심데이터와같은 garbage 데이터는미리사전에정확한정의하에이상치처리를해줘야함 분석용로밍데이터의절반은서울에서발생된 Call 데이터이므로그외지방지역의시차연관성을분석하기에는한계가있음 시차연관성분석결과, 국적별로수도권이외지역의빈도가어느정도보이긴하였지만, 대부분의국적모두서울특별시안에서의연관성결과를보임그리하여추가분석에서서울지역만을대상으로하여서울지역내에서자주방문하는관광지분석을하였음
4. 추가분석 1) 국적별 SNS 를활용한텍스트마이닝분석 2) 국적별관광테마분석
4. 추가분석 1) 국적별 SNS 를활용한텍스트마이닝분석 2) 국적별서울지역관광지분석 TEXT MINING - 텍스트마이닝 : 텍스트정보에숨어있는가치를재발견하는아주특별한솔루션 - 빅데이터란, 말그대로온오프라인에서매초마다빠르게생산되고있는방대한규모의데이터를말한다. 이렇게홍수처럼쏟아지는데이터를이용하여, 보석을캐내듯이정보를찾아내는일또한매우중요하다. 하지만, 더중요한것이있다. 빅데이터는정형화된데이터뿐만아니라비정형화된텍스트데이터들도포함되어있기때문에텍스트마이닝도중요한분석기법으로대두되고있는시점이다. 단어별가중치를통해단어를시각적으로보여주는 워드클라우드 (word cloud) - 텍스트마이닝중에서도, 요즘뜨고있는워드클라우드 (word cloud) 를사용하면각국가별관광산업이슈키워드를알수있으며 - 해당분석결과를기반으로국가별맞춤형으로다양한관광상품을개발할수있을것이다. - 또한, 기존의데이터분석으로알지못했던정보를사람들의감정, 의견이담긴 SNS( 트위터, 페이스북, 등 ) 데이터를통하여분석을하게된다면좀더질적으로향상된분석결과및마케팅방안도출이예상된다. - 다음은주어진데이터에서방한외래객이가장많은순서로 Top6 국가의관광관련기사를스크랩하여워드클라우드를생성한결과이다.
4. 추가분석 1) 국적별 SNS 를활용한텍스트마이닝분석 2) 국적별서울지역관광지분석 Word Cloud 일본중국미국 일본인관광객은명동과, 쇼핑이라는 keyword 빈도가가장높은것으로나왔다. 즉, 일본관광객들은우리나라에방한하면대부분명동을많이들려쇼핑을하는것으로해석할수있겠으며, 쇼핑품목으로는화장품과의류, 김및건어물을주로구입함을알수있다. 중국인관광객은일본인관광객과비슷하게명동, 쇼핑, 화장품이라는 keyword 빈도가가장높은것으로나왔다. 기존의기사를통해서도알수있듯이, 중국인은한약재를사기위해한국을방문한다는기사도있다. 그러한내용을바탕으로해당결과를보았을때도, 중국인의쇼핑품목은의류, 화장품도있겠지만한약재품목도구입빈도가높음을알수있다. 미국인관광객은중국, 일본인관광객과는다르게쇼핑보다는의료관광 keyword 빈도가가장높은것으로나왔다. 기사에서도보면, 지난해의료관광을목적으로한국을방문한외국인가운데미국인비율이두번째로높게조사됐다고한다. 기사와위의결과를비교했을때도, 대다수미국인들은의료관광을목적으로도방한함을알수있다.
4. 추가분석 1) 국적별 SNS 를활용한텍스트마이닝분석 2) 국적별서울지역관광지분석 Word Cloud 대만홍콩태국 대만은위치상, 홍콩과가깝게위치하기에홍콩이라는 keyword 빈도가높은것으로생각되며, 이외에대만인들은우리나라의한류드라마에관심이많으며, 특히작년겨울에큰인기를끌었던 별에서온그대 의드라마와관련된키워드들이많음을알수있다. 대표적으로드라마상영과관련된한류상품소비가많음을알수있다. 홍콩인도역시대만과비슷하게우리나라의한류드라마에대한관심이높음을볼수있으며, 특히작년겨울에큰인기를끌었던 별에서온그대 의드라마와관련된키워드들이많음을알수있다. 또한, 홍콩인의방한률을높이기위해한국관광공사에서는저비용항공사와함께파격적인금액의항공권판매 Free&Easy Go, Korea 캠페인도진행함으로써, 홍콩의개별관광객을확대한다는 trend 도볼수있다. 태국인관광객은페스티벌, 4 월, 비수기, 스키장이라는 keyword 빈도가높게나왔다. 우선, 태국인방한관광관련기사를보면 스키장비수기인 4 월에스키슬로프에남아있는잔설을활용해한국의눈과꽃을좋아하는태국등동남아관광객의수요를겨냥한맞춤형상품으로개발 라는기사를찾아볼수있다. 이렇게동남아지역의외국인들은겨울레저를경험해볼수없기때문에스키장과관련하여맞춤형관광마케팅 (ex. 계절테마상품 ) 을실시하고있는상황을잘설명해준다.
4. 추가분석 1) 국적별 SNS 를활용한텍스트마이닝분석 2) 국적별서울지역관광지분석 국적별외래객밀집지역 Top10 8000 5000 1000 6000 4000 800 4000 3000 2000 600 400 2000 1000 200 0 명동 동대문 인사동 롯데월드 한옥마을 가로수길 창덕궁 한강 경복궁 숭례문 0 명동 인사동 동대문 한옥마을 창덕궁 가로수길 숭례문 청계천 이태원 코엑스 0 명인동사동 롯데월드 창덕궁 한강공원 한옥마을 청선계릉천 정릉 동대문 가로수길 - 일본인관광객은명동 (34.7%) 의방문빈도가가장높았으며그다음으로동대문 (21.3%), 인사동 (13.8%) 순으로방문빈도가높음을보임 - 명동, 동대문의빈도가높기때문에쇼핑을목적으로방문하였을것이라고예측되어짐 - 중국인관광객은명동 (35.3%) 의방문빈도가가장높았으며그다음으로인사동 (14.8%), 동대문 (13.7%) 순으로방문빈도가높음을보임 - 명동, 동대문의빈도가높기때문에쇼핑을목적으로방문하였을것이라고예측되어짐 - 미국인관광객은명동 (34.4%) 의방문빈도가가장높았으며그다음으로인사동 (17.8%), 롯데월드 (8.6%) 순으로방문빈도가높음을보임 - 창덕궁, 한옥마을, 선릉 정릉의빈도가높은것을보아전통문화체험을목적으로방문하였을것이라고예측되어짐
5. 최종관광마케팅방안
5. 최종관광마케팅방안 2014 관광마케팅전략 4 대방안 1안. 패턴분석을활용한국적별관광코스 target 마케팅 2안. 로밍위치에가까운관광지역정보를핸드폰 push알림메시지로발송 3안. 지역별로많이방문하는국가에대한통역자인력늘리고, 통역서비스제공 4안. 비정형화된 SNS데이터를이용, 감정분석 ( 오피니언마이닝 ) 을하여마케팅에적용
5. 최종관광마케팅방안 2014 관광마케팅전략 4 대방안 1 안. 패턴분석을활용한국적별관광코스 target 마케팅 - 국적별관광이동경로분석을통해관광패턴을파악하고이에맞게관광코스를수정 / 개발하여관광객의 needs 를충족 - 일본과중국은쇼핑위주의관광, 미국은의료관광또는체험위주의관광이대부분. 이를바탕으로, 각국적별선호관광아이템을찾아관광코스로선정 ( 중요!: 서울과같은특정지역에만국한되지않은코스개발이중요 ) - 기존의고정된관광코스보다더욱다양하고창의적관광상품이나올것으로기대함
5. 최종관광마케팅방안 2014 관광마케팅전략 4 대방안 2 안. 로밍위치에가까운관광지역정보또는같은국적인외래객의관광코스정보를핸드폰 push 알림메시지로발송 - 외래객이로밍한위치 ( 위도, 경도 ) 를활용하여해당지역주변의외래객이선호한맛집정보또는관광정보를제공 - 외래객이로밍시, 기존에같은국적을가진방한외래객의 best 관광코스정보를핸드폰 push 알림을통하여발송 - 이미기존에방한하였던외래객으로부터검증된관광코스이므로믿을만하며, 만들어진코스에대해리뷰분석을하여보완하면좋은관광코스가만들어질것이라기대
5. 최종관광마케팅방안 2014 관광마케팅전략 4 대방안 3 안. 지역별로많이방문하는국가에대한통역자인력늘리고, 통역서비스제공 - 매년방한외래객의불만사항중언어소통의불편이순위권에속하므로이에따른대책이필요함 - 표면적으로는방한외래객의대부분이중국인. 하지만, 지역별로살펴보면방한외래객의국적분포는다름 - 그러므로, 각지역별방한외래객의분포를고려한통역자인력을늘리고, 통역서비스를제공하여마치내나라처럼편하게여행할수있는서비스가필요
5. 최종관광마케팅방안 2014 관광마케팅전략 4 대방안 4 안. 비정형화된 SNS 데이터를이용, 감정분석 ( 오피니언마이닝 ) 을하여마케팅에적용 - 다양한형식의 SNS 에는방한외래객들이작성한수많은리뷰들이존재하고이와같은데이터들이매초마다쌓이고있으나, 아직국내관광분야텍스트분석은활발히진행되고있지않음 - tripadvisor 라는사이트에서는실시간으로방한외래객또는국내객의관광지리뷰가올라옴 - 이것으로, 다양한비정형데이터분석기법인텍스트마이닝또는오피니언마이닝을이용하여분석결과를도출해낸다면, 한층더외래객의마음을헤아려주는창의적인관광마케팅이될것이라기대
참고문헌 * 통계자료 - 2013 외래관광객실태조사보고서 한국방문시, 연도별언어소통에대한만족도 한국방문시, 평균체재기간 -TOUR.GO 관광지식정보시스템 한국방문시, 연도별언어소통에대한만족도 한국방문시, 평균체재기간 * 참고기사및활용사이트 - 서울시, 외국인맞춤형관광코스 2018 년까지 125 개개발 http://news.heraldcorp.com/common_prog/newsprint.php?ud=20140311000031 - 외국인관광객 맞춤형마케팅 전략필요하다 http://www.iusm.co.kr/news/articleview.html?idxno=447300 - [ 사설 ] 개별여행외국인맞춤형관광안내되도록 http://news20.busan.com/controller/newscontroller.jsp?newsid=20140318000158 - 카페두다트, 제주서돌풍 관광객맞춤서비스로외국인고객 3 배증가 http://news.kukinews.com/article/view.asp?page=1&gcode=cul&arcid=0008152248&cp=nv - 10 년째 서울 ~ 부산 ~ 제주도 코스 중국인눈높이못따라가 http://article.joins.com/news/article/article.asp?total_id=3988257 - 中관광객 65% 日관광객 24% 뚜렷한양극화, 대안은? http://mbn.mk.co.kr/pages/news/newsview.php?category=mbn00003&news_seq_no=1785667 - 꽃 단풍 눈 한국의사계절아름다워요 http://www.hankyung.com/news/app/newsview.php?aid=2013042835511 - 관광공사, 스키장 잔설 활용동남아관광객유치 http://www.nocutnews.co.kr/news/4004147 - 국내객및외래객의실시간관광리뷰가있는사이트 : www.tripadvisor.co.kr - 워드클라우드작성사이트 : http://worditout.com/ - SAS 유저커뮤니티 : http://www.mysas.co.kr
참고문헌 * 참고문헌 - 강현철 한상태 최종후외 4 명. (2014). 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로. 자유아카데미 - 전치혁. (2012). 데이터마이닝기법과응용. 한나래 - 김기영 강현철 최병정공저. (2012). 예제로배우는 SAS 프로그래밍입문. 자유아카데미 - 제 2 회관광데이터마이닝교육지원교재 (SAS Programming, SAS School SAS Enterprise Miner) - 문화체육관광부. (2014.2). 2013 외래관광객실태조사. - 유지윤. 올해의관광도시지정방안연구. 한국문화관광연구원. 2013 - 박경열. 레저스포츠관광활성화방안. 한국문화관광연구원. 2013 - 최자은. 지역관광발전추진체계개선방안연구. 한국문화관광연구원. 2013 - 오훈성, 김향자. 한국관광의질적발전을위한관광품질관리정책추진방안. 한국문화관광연구원. 2013
Thank You! 감사합니다