목차 01. 분석주제 한국관광산업의발전을유도할수있는분석결과및창의력관광마케팅전략을제공하여보자. 03. 분석개요 Ⅱ - 목적에맞는모형개발 - Data partition 을통한모형의성능및안정성평가 - Score 결과도출 - 모형을통한반응변수의최적치를통계적으로만족하는설명변수들의조합찾아내기 02. 분석개요 Ⅰ - 주제에적합한목표변수설정 - 목표변수에대한예측모형개발하기위해분석단계정의 - 분석데이터구성 - 데이터정제및가공수행 04. 결론 데이터분석결과를통한대한민국의관광산업의미래를위한마케팅전략및세계인들의관광의증폭적인유치를위한대책제안.
목표변수 RFM 을통한분할된개념을하나의목표로통합시킨다. 1. F : Frequency( 방문빈도 ) 방문정보를바탕으로새로운범주인방문한관광객과재방문을한관광객으로나누어준다 2. M : Monetary( 지출금액 ) 돈을많이쓴관광객 ( 지출금액을단순히적용하는것이아니라. 한국에머문날짜로 control 하기위해나누고그값에 log 변환을시켜정규화한다음분석을한다.) 3.M2 : Monetary( 지출금액 ) 을 log 변환시킨값 F M
비교모델종류및설명 비교모델 Linear regression model ( using variable selection like BE FS STEP) Decision tree model Neural network Variable Selection 회귀분석에서변수선택에대한 Criteria : CV(cross validation)
DATA 정제및파생변수생성 변수변환에대한설명 : 파생변수와더미변수로변환한변수 만약 A variable 다중선택가능범주 4 개인경우다음과같이변수를정제하였다. a a_1 a_2 a_3 1 2 3. 1 4.. 1 2 3 4 3 4.. a1 a2 a3 a4 1 1 1 0 1 0 0 1 1 1 1 1 0 0 1 1 결측치처리방법 - Tree surrogate 범주 4 개의 dummy Variables 생성
분석과정 Diagram EM diagram 및설명 데이터를읽고변수의 type 및 role 을할당결측값을 tree surrogate 방법을이용해처리 데이터분할 train : validation : test =4:3:3 Train 과 validation 로모델을 fitting 과점검을해서모델을만들어내고 test 로모델을점검 모델적용각모델을옵션설정에따라총 6 가지모델을 fitting 해본다. 모델비교를통해 6 가지모델중가장적절한모델을 test set 에서 evaluation 을기준으로최적모델산출및 scroe 계산
목표변수상세설명 1 st 목표변수 : MQ1A 을지난 3 년간한번온사람은 1, 한번에서네번온사람은 2, 어떤항목에도해당되지않는사람은결측값으로처리. type : nominal => 회귀분석 : Logistic regression 2 nd 목표변수 : log(mtz16/mq6)=log( 총지출금액 / 체류기간 ) type : interval 3 rd 목표변수 : log(mtz16)=log( 총지출금액 ) type : interval 설명변수 : 목표변수를제외한주어진모든설명변수 Log 변환
최종모형결정 목표변수최종모형선택기준 재방문여부 log( 총지출금액 / 체류기간 ) log( 총지출금액 ) Regression with backward elimination Regression with forward selection Regression with forward selection 오분류비율 =0.314 MSE 수정된결정계수 :0.2821 MSE 수정된결정계수 :0.1904
Data 2009 년변수설명 - 재방문여부 Variable 여행형태 Log_ 지출금액쇼핑주요품목쇼핑중불편사항한국여행만족도인상깊은점여행정보입수 Interpretation 개별여행 <air-tel< 단체여행순으로재방문가능성높음 총지출액이클수록재방문가능성낮다 자기, 도자기, 담배산경우에재방문가능성이줄어든다. 피혁제품, 신발류, 전통민예품, 칠기, 목각제품전자전기제품을산경우에재방문가능성높음. 쇼핑불만사항이없을때호객행위가있을때재방문가능성높음 관광지로서한국을추천을크게할수록재방문가능성이크다. 한국을재방문할생각이클수록오히려재방문할가능성낮다 사람이친절하다활기에차있다고느낄때재방문가능성크다 정보를얻지않았을때보다인터넷을통하거나보도를통해서여행정보를입수했을때재방문가능성이커진다. 하지만한국기관을통해서 ( 관광공사, 대사관, 무역관 ) 정보를얻었을때에는기타에비해재방문가능성이떨어진다. Variable 방한목적별 나이 Interpretation 여행형태가기타에비해서여가위락개별휴가의경우에는재방문가능성이증가하지만사업또는전문활동의경우에는재방문가능성이감소한다. 그외에종교의경우재방문확률이증가함 61 세이상은 0-20 대는재방문가능성이크지만 41~50 세는재방문가능성이매우낮음 방한비자취득방한비자취득이어려울때재방문률이감소한다. 거주국별 방문지 (16 개시도 ) 조사기간별 기타나라에비해서일본의경우재방문할가능성이작다홍콩의경우에도비슷하다. 태국이나미국유럽의나라들은재방문할가능성이기타에비해크다특히프랑의경우에는재방문할가능성이크다 광주나대전을간경우에는재방문할가능성이크다강원도를갔을때에는재방문할가능성이낮다 4 월 5 월 10 월이유의하며 4 월과 5 월은재방문할가능성이 12 월에비해낮지만 10 월은재방문가능성이크다
Data 2009 년변수설명 -log( 지출금액 / 체류기간 ) : M Variable 여행형태한국주요활동쇼핑주요품목 Interpretation 개별여행 <air-tel< 단체여행순으로 M값높음여가위락개별휴가일때 M값이크고친구친지방문종교및순례의경우 M값이작다전자전기제품사용한구매한사람이 M값이크다 주요쇼핑장소 시내면세점이나남대문시장에서쇼핑한사람의 M값이작다 재방문여부 재방문을한경우에는 M이작다. 주요숙박시설 호텔과유스호스텔여관이용객 M값높음친척집이나사찰을이용한관광객은 M값낮음 거주국별한국방문목적나이동반자현황 Variable 일본, 중국, 태국 M값크고프랑스사람들이 M값낮음친구친지방문한경우 M값낮음 61세이상에비해 0-30세는 M이작다또한 40-60세사람들이 M이크다배우자나연인과방문한사람이 M값높음 Interpretation 조사기간별 12 월기준 2 월과 8 월은 M 이작고 11 월달은 M 이크다 쇼핑중불만사항 상점문닫는시간이이르다고느낀사람은 M 이크다 한국여행에서인상깊은점 여행정보입수경로 1 순위 강원도에방문한사람 음식이맛있다고느낀사람은 M 이크다 여행정보를얻지않은경우보다여행사를통한경우 M 이크다항공사호텔을이용한경우에도 M 이매우크다 강원도에방문한경우 M 이작다
Data 2009 년변수설명 -log( 지출금액 ) : M2 Variable Interpretation 조사기간별 12 월을기준으로 1,2,8 월 M2 작다 11 월은 M2 크다. 여행형태별방한목적별나이재방문여부주요쇼핑품목한국에인상깊은점. 개별여행 <air-tel< 단체여행순으로 M2 값높음 방한목적을기타를기준으로여락위락개별휴가일 M2 크고친구친지방문사업또는전문활동경우 M2 작다 61 세이상사람에비해 0-30 세에 M2 작다 30-60 세사람들이 M2 크다 51-60 세가가장 M2 가크다 재방문을한경우 M2 감소 기타제품을산것보다전자전기제품을산경우에 M2 증가 기타제품을구매한것보다인삼한약재를산경우에는 M2 감소. 밤에놀거리가많다고느꼈을때 M2 증가 Variable 쇼핑불편사항 한국에서불편한점 동반자현황 - 배우자 나라 향후 3 년이내관광목적한국재방문의사 여행정보입수경로 Interpretation 점원이불친절하다고느꼈을때 M2 작다물가가비싸다고느꼈을때 M2 작다배우자와왔을때 M2 증가러시아와중동일본 M2 크다대만과호주가 M2 작다재방문의사가강할수록 M2 크다정보를얻지않은경우보다여행사나친구친지동료를통해여행정보를입수하였을때 M2 크다
최종모형결정 목표변수최종모형선택기준 재방문여부 log( 총지출금액 / 체류기간 ) log( 총지출금액 ) Regression with stepwise Regression with forward selection Regression with forward selection 오분류비율 =0.293 MSE 수정된결정계수 :0.3375 MSE 수정된결정계수 :0.1977
Data 2010 년변수설명 - 재방문여부 Variable 여행형태한국체류기간 Log_ 지출금액 Interpretation 개별여행 <air-tel< 단체여행순으로재방문가능성높음기간이길수록재방문가능성낮음지출금액이큰사람들이재방문가능성낮음 쇼핑주요품목음반 dvd 재방문가능성낮다실크섬유전통민예품식료품재방문가능성크다. 한국방문주요목적 주요쇼핑장소 한국여행만족도 미용관광치료인경우재방문가능성크다. 카지노레포츠의경우재방문가능성이낮다. 공항면세점에서쇼핑한사람이재방문가능성낮음 한국음식에매료된사람일경우재방문가능성낮음 인상깊은점밤문화에인상깊었던사람들이재방문가능성크다. 여행정보입수 직업별 방문지 (16 개시도 ) 관광안내서적을기사통해정보를입수한경우재방문가능성높음한국관광기관이나항공사를통해정보를얻은경우재방문가능성이낮다. 공무원, 군인, 학생들이재방문가능성높음 부산과전북을방문한사람들이재방문가능성높음 여행목적여가휴가계획재방문가능성크다. 종교및순례의경우재방문가능성이낮다.
Data 2010 년변수설명 -log( 지출금액 / 체류기간 ) : M Variable 여행형태 한국주요활동 쇼핑주요품목 주요쇼핑장소 한국여행만족도 주요숙박시설 거주국별 한국방문목적 학력별 직업별 동반자현황 Interpretation 개별여행 <air-tel< 단체여행순으로 M 값높음 쇼핑, 카지노, 휴양을즐긴사람들이 M 값높음 대체로쇼핑을한사람이 M 값높음 공항면세점에서쇼핑한사람이 M 값높음 숙박시설에만족하는사람들이 M 값높음 호텔과유스호스텔여관이용객 M 값높음친척집이나사찰을이용한관광객은 M 값낮음 일본, 중국 M 값크고프랑스사람들이 M 값낮음 친구친지방문한경우 M 값낮음 대학원이상의경우 M 값높음 공무원, 군인이 M 값높고기업인이 M 값낮음 배우자나연인과방문한사람이 M 값높음 방문지 (16 개시도 ) 부산과전북을방문한사람들이재방문가능성높음
Data 2010 년변수설명 -log( 지출금액 ) : M2 Variable 여행형태 한국체류기간 한국주요활동 쇼핑주요품목 주요쇼핑장소 인상깊은점 여행정보입수 거주국별 직업별 Interpretation 개별여행 <air-tel< 단체여행순으로 M2 값높음 체류기간이길수록 M2 값높음 카지노, 휴양을즐긴사람들이 M2 값높음 시계를구매한사람들이 M2 값높음 어느곳에서도쇼핑하지않은사람들이 M2 값낮음 자연경관에인상깊은사람이 M2 값낮음 친지, 친구, 동료를통해입수한사람이 M2 값높음 싱가포르, 미국러시아 M2 값높음, 대만, 프랑스낮음 주부, 자영업자 M2 값높음학생낮음 방문지 (16 개시도 ) 서울, 울산, 경기방문자 M2 값높음충청도방문자낮음
Data 2010 년분석 마케팅전략의예 1. 한국방문주요활동더미변수들중에가장회귀계수가큰항목이휴양및휴식 ( 리조트 ) 항목이다. 이곳에서주요활동을한사람이하루에평균소비비용이더크다. 그렇기때문에휴양및휴식 ( 리조트 ) 산업에투자를해서편의시설을더확보하고이벤트등여러행사및다른쇼핑시설을마련하여많은외래사람들의관심을끌고소비를촉진하기위해힘써야할것이다. 2. 국적에따른변수를보면대만국적의관광객이하루평균소비비용이크다대만사람의지갑을열리게하기위해대만에서 K-pop 콘서트를개최하면한국의문화홍보를위해우리유산이나발전가능성에관련된영상이나기념품을만들어많은대만사람들에게알리는등적극적인투자를통해대만사람들이한국에서돈을많이쓸수있도록해야한다.
최종모형결정 목표변수최종모형선택기준 재방문여부 log( 총지출금액 / 체류기간 ) log( 총지출금액 ) Regression with backward elimination Regression with forward selection Regression with forward selection 오분류비율 =0.29 MSE 수정된결정계수 :0.2248 MSE 수정된결정계수 :0.2262
Data 2011 년변수설명 - 재방문여부 Variable Interpretation 연령별한국여행방문지직업별지출금액방문시활동내역 10 대 20 대가 40 대, 50 대에비해재방문가능성높음 경상도방문한관광객들이재방문가능성낮음 학생들이재방문가능성높고주부나은퇴자는낮음 지출금액이높을수록재방문가능성낮음 자연경관과박물관식도락쇼핑을하는방문객의재방문의재방문일가능성높음오히려카지노나미용의료의경우의재방문가능성낮음 쇼핑장소 여행시좋은점 백화점에서쇼핑한사람들이재방문가능성낮다소규모상점에서쇼핑한경우가재방문가능성높다. 안전함에장점을느낌사람들의재방문가능성높음 불편했던점언어소통에불편함을느낌사람들의재방문가능성높다. 교통혼잡을느낀사람들의재방문가능성나다. 3 년내재방문의사호의적으로답할수록재방문가능성낮음 한국 Variable 이미지변화여행정보입수조사기간별거주국별여행형태숙박시설한국체류기간 Interpretation 이미지가호전될수록재방문가능성높음 한국기관, 공항, 항공사에서정보입수한경우재방문가능성낮음 1 월에조사한경우재방문가능성낮음 7 월은높음 일본, 홍콩, 러시아사람들재방문가능성낮음호주, 미국사람들은재방문가능성높음 개별여행 <air-tel< 단체여행순으로재방문가능성높음 학교 / 회사기숙사에서묵은경우재방문가능성낮음 길면길수록재방문가능성낮음
Data 2011 년변수설명 -log( 지출금액 / 체류기간 ) : M Variable 여행방문지 직업별 활동내역 쇼핑품목 재방문의사 조사기간 거주국 여행형태 숙박시설 최근방문횟수 Interpretation 서울, 인천, 경기방문자들은 M 값높음 기업인, 자영업자 M 값높음학생들 M 값낮음 레저활동이나카지노이용객은 M 값높음 대체로쇼핑한사람들 M 값높음 재방문의지가높을수록 M 값높음 3 월보다 7 월 8 월에조사한경우 M 값높음 일본, 중동, 중국, 러시아사람들 M 값높음 개별여행일수록 M 값낮음 호텔에묵은경우 M 값높음 최근방문횟수가클수록 M 값낮음 다른국가검토여부다른국가비교한사람에비해비교안한사람 M 값높음 동반자 _ 직장동료 직장동료와온경우 M 값낮음
Data 2011 년변수설명 -log( 지출금액 ) : M2 Variable 연령별 여행방문지 직업별 좋았던활동내역 쇼핑품목 좋았던점 Interpretation 10 대에비해 50 대 M2 값높음 서울, 인천, 경기방문자들 M2 값높음 기업인, 자영업인 M2 값높음학생, 은퇴자 M2 값낮음 유흥, 오락, 카지노, 테마파크 M2 값높음박물관방문 M2 값낮음 대부분품목에소비한경우 M2 값높음 쇼핑에좋은인상을남긴사람이 M2 값높음 3 년내방문의사방문의지가높을수록 M2 값높음 조사년도 거주국별 여행형태 숙박시설 한국체류기간 여행동기 동반자현황 7 월 8 월에조사한경우 M2 값높음 중국, 일본, 러시아, 중동 M2 값높음영국, 독일, 인도 M2 값낮음 개별여행 <air-tel< 단체여행순으로 M2 값높음 호텔이용객 M2 값높음친척집이용객 M2 값낮음 체류기간이길수록 M2 값높음 음식 / 미식탐방하기위해온사람들 M2 값높음 직장동료와방문한경우 M2 값낮음
Data 2011 년분석 유의한변수로부터도출해낼수있는마케팅전략의예 1. 의료시설카지노테마파크에간사람들이평균적으로돈을많이지출하였다. 백화점에서의평균지출이크고항목에는피혁제품이나의류전기제품이있다. 그러므로외국인들이자주가는명동에백화점부터의료관광까지한번에할수있는코스를개발해야한다. 특히위의소비가잘되는품목들의경우외국인들을도와줄수있는안내서를준비하는것도좋을것이다. 2. 외국인들은한국의저녁이후의분위기를신기해한다. 밤에도여전히외국인들이즐길수있는이벤트를계획해보아도좋을것이다. 3. 최근에는중국과중동의평균지출액이가장크다. 그러므로일본을위주로한관광안내서나관광패키지들이중국인이나중동을대상으로변화해야한다. 4. 여가건강쇼핑기타인경우에평균지출이크다. 그중건강의경우평균지출액이가장크다. 의료산업과관련되어있을가능성이높다. 한국인의이미지와건강을접목시킨미용산업을병원과연결하여서동시소비가일어날수있도록장려한다.
Data 분석 ( 재방문여부 ) 2009 년 2010 년 2011 년 일본인이나홍콩인은한국에처음올가능성이크다하지만프랑스인은재방문할가능성이크다. 주로도자기를산사람은처음방문할가능성이크다. 정통민예품을산사람이재방문할가능성이크다활동내역변수는변수선택되지않음 일본이나중국홍콩사람들이처음방문할가능성이크다. 음반 DVD 산사람들이처음방문할가능성이크다. 미용관광의경우재방문가능성이크다카지노나레포츠의경우처음방문할가능성이크다. 한국음식에매료된경우는처음방문할가능성이크다. 한국의밤문화에큰매력을느낀사람들이재방문가능성이크다. 일본러시아홍콩사람은처음방문할가능성이크다호주미국프랑스등이재방문할가능성이높다자연경관감상및식도락쇼핑공연민속행사를즐기는관광객이재방문의할가능성이크다.( 특히사찰 ) 카지노나미용의료의경우처음올가능성이크다. 언어소통이나표지판문제를가진사람은재방문할가능성이크다. - 한국관광공사를통해서정보를얻은경우처음방문할가능성이크고인터넷이나보도를통해서여행정보를입수했을경우에재방문일가능성이커진다. - 단체여행일수록재방문가능성크고혼자오는경우는처음올가능성이크다.
Data 분석 (Money) 2009 년 2010 년 2011 년 일본이나중국태국국적을경우하루에돈을많이쓰며프랑스의경우하루에돈을적게쓴다. 나이가많을수록많이소비전자전기제품을살수록많이소비러시아나중동일본총지출액이크다. 점원이불친절하다고느낄때총지출액적다. 배우자나연인과방문한경우총지출액증가 일본이나중국은하루지출액이크다. 총지출액은일본은작다하지만중국은총지출액이크게나왔다 총지출액은싱가포르나러시아가많이쓴다. 평균지출액의료관광이카지노에비해적게나옴식도락이가장큼 카지노휴양을즐긴사람의총지출액이크다. 관광지식도락 유흥테마파크를간경우총지출액이매우크다. 일본과중국은여전히하루평균지출액과총지출액이크다. 하루평균지출액은카지노 > 의료관광총지출액은의료관광 > 카지노직장동료와방문한경우가장지출액이적다.
결론및추천 한국에오는관광객중에중국인의비율이점점증가하고있다. 또한중국인들이일본인들에비해서더돈을많이쓴다하지만중국인들이나일본인들의경우처음으로한국을방문하는경우가많다. 반면에프랑스의경우에는한국에재방문할경우가많지만돈을적게쓰는경향이있다. 일괄된관광정책이아니라처음오는관광객들이다시올수있도록컨텐츠보강을해야한다. 또한자주오는관광객들에게는돈을많이쓸수있는컨텐츠역시개발해야한다. 미용치료관광이나의료관광중점으로하여서관광객유치
추가분석 설문지문항 인구학 적정보 구매정 보 여행만 족도 여행사나항공회사가입정보여권정보 쉽게얻을수있는정보 조사날짜여행형태국가교육정도직업나이 sex 동반자정보
추가분석 Train data set Test data set 2009 년 2011 년 2010 년 모형적합 MSE 계산 분석변수 총지출액하루평균지출액회귀분석 TREE Random forest 방법으로모형적합
추가분석 test set 평균소비금액 Reg Tree random Mse(Test) 0.974012 0.9730261 1.037231 Mse(train) 1.07138 1.09954 0.4889624
추가분석 test set 총소비금액 Reg Tree random Mse(Test) 0.9438662 0.968493 0.9628717 Mse(train) 0.869932 0.9147347 0.2925557
한국의외래관광전망 데이터분석을통한합리적투자에따른미래 다양하고정확한 DATA BASE 구축 세분화된관광객예측오분율 관광통계에관련된모형개발 정확한예측을동반한마케팅 논리적인변수변환및정제 통계학적다양한모델적용 관광객소비패턴예측으로외화벌이 관광산업의긍정적에너지순환및순기능