PowerPoint 프레젠테이션

Similar documents
PowerPoint 프레젠테이션

신규투자사업에 대한 타당성조사(최종보고서)_v10_클린아이공시.hwp

외국인투자유치성과평가기준개발

슬라이드 1

PowerPoint 프레젠테이션

Microsoft Word - src.doc

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경

Web Scraper in 30 Minutes 강철


2013 년도연구용역보고서 중소기업정책자금지원의경기대응효과분석 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한남대학교경제학과교수황진영

Forecast2014_add.indd

한국정책학회학회보

슬라이드 1

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

First Quarter 2013 Office Market Report COMPANY OVERVIEW

OCW_C언어 기초

2013 년 10 월관광객입출국 / 관광수입 지출분석


Microsoft PowerPoint - chap06-2pointer.ppt

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

CHU 통계교육 Workshop (DAY 7. MDA 군집분석 ) 1. 개념 Individual Directed Technique + 범주 ( 그룹 ) 에대한사전정보가없음 + 다변량측정치를동시에고려하여데이터개체분류 + 개체의유사성 (simila

C# Programming Guide - Types

01정책백서목차(1~18)

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

第 1 節 組 織 11 第 1 章 檢 察 의 組 織 人 事 制 度 등 第 1 項 大 檢 察 廳 第 1 節 組 대검찰청은 대법원에 대응하여 수도인 서울에 위치 한다(검찰청법 제2조,제3조,대검찰청의 위치와 각급 검찰청의명칭및위치에관한규정 제2조). 대검찰청에 검찰총장,대

-2- 여성을 대상으로 한 단기적,추상적 과제까지 포함되어 있어 기본법으 로서의 방향제시와 실효성 측면에서 한계가 있다는 지적을 받아왔음. 더욱이 제정된 지 20년이 되어가는 현재의 시점에서 볼 때,여성정 책을 둘러싼 사회 환경과 관련 법제도가 크게 변화되고 있어 현

2013 년 Maker's Mark Academy 추석 Program 2013 ~ 2014 년 ACT Test 일정 2013/09/ /10/ /12/ /04/ /6/14 9 월 21 일 ACT 대비추석특강반 ( 이이화 / Jo

Special Theme TV SNS 2015 Spring vol


( 제 20-1 호 ) '15 ( 제 20-2 호 ) ''16 '15 년국제개발협력자체평가결과 ( 안 ) 16 년국제개발협력통합평가계획 ( 안 ) 자체평가결과반영계획이행점검결과 ( 제 20-3 호 ) 자체평가결과 국제개발협력평가소위원회

e-spider_제품표준제안서_160516

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

2013 년 11 월관광객입출국 / 관광수입 지출분석

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

방한외래관광객관광객

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

MRIO (25..,..).hwp

변수설명

도약종합 강의목표 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 점향상시킵니다. 강의대상다음과같은분들에게가장적합합니다. -현재토익점수 500점에서 600점대이신분들에게가장좋습니다. -정기토익을 2-3번본적이있으신분

PowerPoint 프레젠테이션

Semantic Search and Data Interoperability for GeoWeb

REP - CP - 016, N OVEMBER 사진 요약 25 가지 색상 Surf 를 이용한 사진 요약과 사진 배치 알고리즘 Photo Summarization - Representative Photo Selection based on 25 Color Hi

< C0DAC0B2C5BDB1B820BFEEBFB520B8DEB4BABEF32D33C2F720C6EDC1FD2E687770>

ePapyrus PDF Document

[서비스] 1. 오프닝 네트워킹 파티 (전체 공통) (1/13(월) 밤 9시) FAST TRACK ASIA와 CAMP에 대해 소개하고, 3개 코스의 전체 참가자들의 소개 및 네트워킹을 진행합니다. 2. 패스트트랙아시아 파트너 CEO들과의 네트워킹 파티 (전체 공통) (

Microsoft PowerPoint - chap01-C언어개요.pptx

C O N T E N T S 목 차 요약 / 1 Ⅰ. 태국자동차산업현황 2 1. 개관 5 2. 태국자동차생산 판매 수출입현황 우리나라의대태국자동차 부품수출현황 Ⅱ. 태국자동차산업밸류체인현황 개관 완성차브랜드현황 협력업체 ( 부

빅데이터_DAY key

목차 < 요약 > Ⅰ. 국내은행 1 1. 대출태도 1 2. 신용위험 3 3. 대출수요 5 Ⅱ. 비은행금융기관 7 1. 대출태도 7 2. 신용위험 8 3. 대출수요 8 < 붙임 > 2015 년 1/4 분기금융기관대출행태서베이실시개요

지도임자_1204_출판(최종).hwp

<BBE7C8B8C0FBC0C7BBE7BCD2C5EBBFACB1B820C3D6C1BEBAB8B0EDBCAD2E687770>

<4D F736F F F696E74202D EBCADBAF1BDBABDC3BCB3C0C720C0D4C1F6BCB1C1A4205BC8A3C8AF20B8F0B5E55D>

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

소준섭

서울도시연구_13권4호.hwp

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

Microsoft PowerPoint - chap02-C프로그램시작하기.pptx

DBMS & SQL Server Installation Database Laboratory


지역온천수의농업활용타당성연구


슬라이드 1


<B8D3B8AEB8BB5F20B8F1C2F72E687770>

전기차보급활성화포럼 전기차보급정책방향ㅣ 211

2011년_1분기_지역경제동향_보도자료.hwp

exp

Microsoft PowerPoint - Java7.pptx

다른 JSP 페이지호출 forward() 메서드 - 하나의 JSP 페이지실행이끝나고다른 JSP 페이지를호출할때사용한다. 예 ) <% RequestDispatcher dispatcher = request.getrequestdispatcher(" 실행할페이지.jsp");

hwp

제주발전연구원 제주발전연구원 정책이슈브리프 2015년 7월 14일 Vol. 222 발행처 : 제주발전연구원 발행인 : 공영민 주 소 : 제주특별자치도 제주시 아연로 253 TEL FAX 제주발전연구원은 지

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

조사연구 using odds ratio. The result of analysis for 58 election polls registered in National Election Survey Deliberation Commission revealed that progr

PowerPoint 프레젠테이션

< > 수출기업업황평가지수추이

G Power

Microsoft PowerPoint - chap04-연산자.pptx

[INPUT] 뒤에는변수와관련된정보를표기한다. [CARDS;] 뒤에는각각의변수가가지는관측값들을표기한다. >> 위의프로그램에서데이터셋명은 wghtclub 이고, 변수는 idno, name, team, strtwght, endwght 이다. 이중 name 과 team 은

쉽게 풀어쓴 C 프로그래밊

<B8B6B1D4C7CF2DBAD0BEDFB0CBC5E4BFCF2DB1B3C1A4BFCFB7E128C0CCC8ADBFB5292DC0DBBCBAC0DAB0CBC1F5BFCF2DB8D3B8AEB8BB2DB3BBBACEB0CBC1F52E687770>

**09콘텐츠산업백서_1 2

단순 베이즈 분류기

5장. JSP와 Servlet 프로그래밍을 위한 기본 문법(완성-0421).hwp

2002년 2학기 자료구조

이화여자대학교, 판다코리아닷컴 이종식 대표 초청 특강 개최 지난 17일, 경제학과 대상 유통 산업의 패러다임 전환 주제로 강연 <이화여대 경제학과에서 강연 중인 이종식 대표> 판다코리아닷컴 이종식 대표가 지난 17일 이화여자대학교 포스코관에서 진행된 경제학과 재학생 대

고3-02_비문학_2_사회-해설.hwp

일시 : 2013 년 6 월 12 일 ( 수 ) 10:00 ~ 18:00 장소 : 중소기업중앙회중회의실 (2 층 ) 주최 : 한국경제연구원 ( 사 ) 한국규제학회 ( 사 ) 한국규제학회 Korea Society For Regulatory Studies

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

13È£³»Áö-1

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

( ) 0 Ⅰ 02 Ⅰ 03 Ⅰ 04 Ⅰ LBR00 05 Ⅰ 06 Ⅰ.0 4 G G G G G G Ⅰ.0 0 G Ⅰ.0 9 J30 LBR ,9 D45 * 과목은 학

Transcription:

TOUR 395

목차 2

1. 과제이해및주제선정 3

1. 과제이해및주제선정 1) 과제이해 관광산업의발전을위해서데이터를활용한과학적인평가체계의구축이필요함 정밀하고종합적인관광진흥정책의효과분석모형개발을최종목표로정함 비전 지역특성기반의관광정책효과분석 목표 1. 정책효과분석 2. 원인파악분석 3. 정책방향제시 관광정책성과목표는관광객수, 매출액, 일자리창출등을바탕으로설정되고있음 관광정책성과와관계있는변수, 요인에대한분석이다소미흡함 관광정책수립시데이터분석을통한커스터마이제이션이이루어지지않고있음 현황 정책성과를정확하게측정할수있는세부적인정책효과분석전략이필요함 정책의성과를이해하기위해서원인 - 결과관계분석이필요함 정책수립시지역특성을반영하는분석모델개발이필요함 세부전략세그먼트분석토픽모델링 & AKE 어플리케이션 4

과제이해및주제선정 2) 주제탐색 WEF 관광경쟁력지수를분석한결과관광정책및기반조성분야에서낮은경쟁력을보임 지역특성과관광객의국적데이터를종합한관광진흥정책효과분석모형개발을주제로선정함 한 중 일 WEF 관광경쟁력지수 관광산업의국가경쟁력을높이기위해서는무엇이필요한가? 관광경쟁력문화자원관광정책및 17위 8위 12위 4위 6위 29 위 82 위 관광정책및기반조성분야의경쟁력을높여야함 주제선정 국가 - 지역 - 연도를기준으로하는세그먼트분석과토픽모델링통한관광진흥정책효과분석모형개발 기반조성 26 위 0 20 40 60 80 100 한국중국일본 SOURCE : WEF, The Travel & Tourism Competitiveness Report 2015 5

1. 과제이해및주제선정 3) 이슈현황 정책효과를분석할때데이터를실질적으로활용하지못하고있음 정책효과분석, 원인분석, 방향제시과정에서데이터분석을통한체계적인모형의개발이필요함 정책효과분석 관광정책성과목표는관광객수, 매출액, 일자리창출등을바탕으로설정되고있음 원인분석 관광정책성과와관계있는변수와요인에대한분석이다소미흡함 정책방향제시 관광정책수립시데이터분석을통한커스터마이제이션이이루어지지않고있음 정책성과를정확하게측정할수있는세부적인정책효과분석전략이필요함 정책의성과를이해하기위해서원인 - 결과관계분석이필요함 정책수립시지역특성을반영하는분석모델개발이필요함 SOURCE : 문화체육관광부 코리아그랜드세일추진현황및계획, 머니투데이, 국회예산정책처 6 2015회계연도결산분석종합

1. 과제이해및주제선정 4) 분석전략 지역특성기반의관광정책효과분석을위한전체적인분석전략의흐름은 데이터분석을통한정책효과분석, 원인파악분석, 정책방향제시로구성됨 정책효과분석 원인파악분석 정책방향제시 데이터정제 세그멘테이션시계열분해법계층적군집분석 데이터수집및형태소분석 토픽모델링 AKE 정책분석을위한어플리케이션개발 분석툴 분석내용 데이터 국가, 지역, 수집및시행회차별분류관광객분할 시계열데이터변환및분해 계층적군집분석을통하여전체세그먼트결과를군집및프로파일링 정책효과 토픽모델링 분석결과진행후각중관심세토픽별상그먼트에위단어와대해 SNS크출현확률을롤링및자기준으로연어처리토픽들을군집 군집토픽들의주제를파악하기위해 AKE 분석 앞에서의분석모델을바탕으로지역별관광정책의효과를평가하고앞으로의방향을제시하는데도움을주는어플리케이션개발 7

2. 정책효과분석 1) 데이터정제 2) 세그멘트분석 3) 시계열분해 4) 계층적군집분석 5) 분석결과 데이터정제 1. 분석에미사용되는변수들은이용액을합산하여제거 2. 파생변수 Region - DONG 변수를기반으로지역구분 Order - DAY 변수를기반으로시행연도구분 3. 코리아그랜드세일이매회마다기간이상이하여각회별 42 일간 (1~2 월, 금 ~ 목각 6 주씩 ) 의데이터를사용 (20130111~2013022, 20140103~20140213, 20150109~20150219) 4. RAW 데이터상의국가코드는실제국가정보를알수없기때문에전체이용액의 87.0% 에해당하는상위 4 개국가 ( 중국, 일본, 미국, 홍콩 ) 의데이터만을사용 ( 관광정보시스템의입국관광정보통계와카드이용패턴을통해상위 4 개국가를특정중국 C, 일본 J, 미국 U, 홍콩 H) 5. 정제된데이터 -> 568822 개의레코드 시계열분해 : 시계열자료로부터추세, 순환변동, 계절적변동을확인하여정확한예측을시도하는예측기법계절적변동 (Seasonality) 이있고, 추세 (Trend) 에따라승법적으로변동하며, 변동이비선형양상을보여비선형추세의승법계절모형 (f) 으로결정 R 프로그램의 forecast 를이용해데이터를분해하여추세값을추출 ( 계절주기를일주일단위인 7 일로설정, 각예측값들은계절주기로 7 일단위로설정하였기때문에앞뒤 3 일을이용해예측. 따라서각회의처음과끝 3 일은결측 ) 연간비교를위해추세평균을구하고 Ratio 를비교해각세그먼트에대한정책의효과성을측정 (ex : 제 3 회코리아그랜드세일중국인 - 명동세그먼트의효과성 : 해당세그먼트에대한 Ratio 를통해분석 ) 세그먼트분석 : 전체데이터를국가 (4)- 지역별 (14)- 연도 (3) 조합으로 168 개의세그먼트로분할하고세그먼트별이용액데이터를시계열데이터로변환하여파악 계층적군집분석 : 세그먼트별로분석된데이터를통합해정규화하고데이터를군집화하였으며각군집들의데이터를수집해계층적군집분석을진행하고군집프로파일링실행 8

2. 정책효과분석 1) 데이터정제 외국인카드결제데이터의변수들중 DONG, COUNTRY, DAY 를독립변수로서사용 TOTAL_AMOUNT 를종속변수로서사용 제 4 회빅데이터경진대회외국인카드결제데이터 (1332631 건 ) 독립변수 DONG 변수구분변수설명예시비고변수역할변수타입 DONG 가맹점 ' 동 ' 소공동 명동 1 가, 명동 2 가,, 이태원 Input Nominal COUNTRY 이용국가코드 C A/B/C/ /W/X Input Nominal COUNTRY 종속변수 TOTAL_AMOUNT DAY 이용일 20130117 TAMT 이용액 5355 20130111/2013 0112/ /20150218/201 50219 별도의절대적단위없음 Input Target Ordinal Interval YEAR 이용연도 2013 DAY 변수를이용 DAY MCT_CODE 업종코드 01 미사용 MCT_CODE_NAM E 업종명특급호텔미사용 MCT_ID 가맹점 ID A002956 미사용 MCT_GROUP 업종그룹숙박미사용 TIME 시간대구분 20130117 미사용 GU 가맹점소재 ' 구 ' 중구미사용 9

2. 정책효과분석 1) 데이터정제 메인데이터를분석하고시각화하여파악하였고데이터가불균등한양상을보여 국가 - 지역 - 연도를기준으로데이터를분류하는세그먼트분석을분석방법으로정함 연도별정책기간상이 상위 4 개국비중 87% U J 5% 17% 1 회 2 회 3 회 쇼핑, 숙박, 요식이대부분 DATA 기초통계 C H 60% 5% 지역별매출액불균형 요식 6% 숙박 21% 충무로 1 가 4% 삼성동 6% 쇼핑 73% 교통 0% 관광 0% 소공동 48% 잠실동 16% 10

2. 정책효과분석 1) 데이터정제 프로젝트목적에맞는모형구축을위해변수들을통합하고정제함 효과성분석에서연간비교의타당성을위해연도별 6 주만을선정 MCT_ CODE MCT_ CODE_NM MCT_ GROUP 데이터정제 MCT_ID GU DONG COUNTRY DAY YEAR TIME TAMT 1 특급호텔숙박 A002956 중구명동 1 가 J 20130111 2013 오전 5734 1 특급호텔숙박 A002956 중구명동 1 가 J 20130111 2013 오후 4496 1 특급호텔숙박 A002956 중구명동 1 가 J 20130111 2013 저녁 2637 미사용변수처리 DONG COUNTRY DAY TAMT 명동 1 가 J 20130111 12867 Region 변수변환 Region COUNTRY DAY TAMT 명동 J 20130111 12867 Order 변수추가 Order Region COUNTRY DAY TAMT 1 명동 J 20130111 12867 코리아그랜드세일이매회마다기간이상이하여각회별 42 일간 (1~2 월, 금 ~ 목각 6 주씩 ) 의데이터를사용 20130111~2013022 20140103~20140213 20150109~20150219 분석에미사용되는변수들은이용액을합산하여제거 Region 변수 - DONG 변수를범주화 Region Dong Region Dong 명동 명동 1 가, 명동 2 가, 소공동, 을지로 1 가, 을지로 2 가, 충무로 1 가, 충무로 2 가 잠실 잠실동 동대문시장 종로6가, 을지로6가 강남역 역삼동 인사동 인사동 가로수길 신사동 신촌 신촌동 청담동 / 압구정동 압구정동, 청담동 홍대역부근 동교동, 서교동 복촌 / 삼청동 가회동, 삼청동 이화여대앞 대현동 코엑스 삼성동 남대문시장 상수동, 남창동 이태원 이태원동 Order 변수 DAY 변수를기반으로시행회차를구분 11

2. 정책효과분석 1) 데이터정제 프로젝트목적에맞는모형구축을위해변수들을통합하고정제함 입국관광통계와카드이용패턴을통해상위 4 개국가를특정 ( 중국 C, 일본 J, 미국 U, 홍콩 H) 4 개국가특정 최종정제된데이터 분석 분석을위한상위 4 개국가특정 분석 분석에사용될최종데이터정제 RAW 데이터상의국가코드는실제국가정보를알수없기때문에전체이용액의 87.0% 에해당하는상위 4 개국가 (C,J,H,U) 의데이터만사용 ( 관광정보시스템의입국관광정보통계와카드이용패턴을통해상위 4 개국가를특정중국 C, 일본 J, 홍콩 H, 미국 U) 최종정제된데이터 -> 568822 개 변수이름 설명 변수수준 타입 Order 코리아그랜드세일시행회차 3 Ordinal 분석내용 100.00% 59.80% 국가별이용액 76.30% 81.70% 87.00% 90.70% 92.70% 94.50% 분석내용 Country 고객의국가코드 4 Nominal Region 가맹점의지역 14 Nominal DAY 기간 126 Nominal TAMT 이용액 Interval 50.00% 0.00% 59.80% 16.50% 5.50% 5.20% 3.70% 2.10% 1.70% C J H U X P W 비율 누적 12

2. 정책효과분석 2) 세그먼트분석 전체데이터를국가 (4)- 지역별 (14)- 연도 (3) 조합으로 168 개의세그먼트분할하고 각각의관광객세그먼트별이용액데이터를시계열데이터로변환하여파악함 8000000 C 명동 국가 (4)- 지역별 (14)- 시행회차 (3) 조합으로전체 168 개의세그먼트분할 1 회중국관광객명동시계열데이터 6000000 4000000 2000000 0 20130111 20130123 20130204 20130216 20130111 2636039 20130112 3368733 20130220 2455552 20130221 2097567 2 회중국관광객명동시계열데이터 8000000 6000000 4000000 2000000 0 20140103 20140115 20140127 20140208 C 명동 20140103 3441245 20140104 5023436 20140212 4215742 20140213 3543941 3 회중국관광객명동시계열데이터 8000000 6000000 4000000 2000000 C 명동 20150109 3668040 20150110 4909225 20150218 5275526 0 20150109 20150121 20150202 20150214 20150219 5618610 13

2. 정책효과분석 3) 시계열분해 시계열데이터의패턴을바탕으로계절적요인과무작위적요인들을제거한추세를구현 연간비교를위해추세평균을구하고 RATIO 를비교해각세그먼트에대한정책의효과성을측정 시계열분해법 중국인 - 명동세그먼트의시계열분해결과 분석툴 비선형적추세의승법계절모형 분석툴 R 프로그램의 forecast 라이브러리 1 시계열분해법 시계열자료로부터추세, 순환변동, 계절적변동을확인하여정확한예측을시도하는예측기법 2 비선형적추세의승법계절모형 분석내용 계절적변동 (Seasonality) 이있고, 추세 (Trend) 에따라승법적으로변동하며, 변동이비선형양상을보여비선형추세의승법계절모형 (f) 으로결정 분석내용 2013 년 2014 년 2015 년 R 프로그램의 forecast 를이용해데이터를분해하여추세값을추출연간비교를위해추세평균을구하고 Ratio 를비교해각세그먼트에대한정책의효과성을측정 중국 - 명동세그먼트 20130111~20130221 10535914.87 20140103~20140213 15035308.35 20150109~20150219 15122026.86 중국 - 명동세그먼트 RATIO2 1.427052945 RATIO3 1.005767658 14

2. 정책효과분석 4) 계층적군집분석 세그먼트별로분석된데이터를통합해정규화하고데이터를군집화하였으며 각군집들의데이터를수집해계층적군집분석을진행하고군집프로파일링실행 1. 각세그먼트별 2,3 회의효과성결과데이터 Merge 중국 - 명동세그먼트 2 회차의효과성 1.427052945 3 회차의효과성 1.005767658 168 개세그먼트결과 중국 - 동대문세그먼트 2 회차의효과성 3.041244 3 회차의효과성 1.932194 미국 - 이태원세그먼트 2 회차의효과성 1.021545 3 회차의효과성 1.012041 2. 통합된데이터수치에자연로그를취해정규화한후계층적군집분석을진행 ( 군집방법 : ward, 최종군집개수 : 7 개 ) 군집프로파일링결과 군집 1 : 2 회감소 3 회감소군집 2 : 2 회성장 3 회고정군집 3 : 2 회고정 3 회성장군집 4 : 2 회크게성장 3 회다소성장군집 5 : 2 회다소성장 3 회크게성장군집 6 : 2 회다소성장 3 회다소성장군집 7 : 2 회고정 3 회고정 Country Region KGS2 KGS3 Country Region LN(KGS2) LN(KGS3) Cluster KGS2 KGS3 중국명동 1.427053 1.005768 중국명동 0.355611 0.005751 1 0.692714 0.751889 중국동대문 3.041244 1.932194 중국동대문 1.112267 0.658656 2 2.73631 0.959985 중국 인사동 0.953239 1.560117 중국 신촌 3.813943 1.76435 미국 북촌 / 삼청동 1.360469 1.065397 미국 코엑스 0.762077 1.297071 미국 이태원 1.021545 1.012041 자연로그변환 중국 인사동 -0.04789 0.444761 중국 신촌 1.338664 0.567782 미국 북촌 / 삼청동 0.30783 0.063347 미국 코엑스 -0.27171 0.260109 미국 이태원 0.021316 0.011969 군집화 3 1.002361 1.89555 4 3.40575 1.846366 5 2.40336 4.760104 6 2.479646 2.433695 7 1.284539 1.015377 15

2. 정책효과분석 5) 분석결과 전체세그먼트들의결과를확인하고군집프로파일링결과와비교하여검증 전체세그먼트들의프로파일링결과표를통해정책의효과성파악 전체세그먼트들의프로파일링결과표 군집 1 : 2 회감소 3 회감소 Country Region KGS2 KGS3 Cluster 일본 남대문 0.788109 0.93907 Cluster1 일본 명동 0.509624 0.702295 Cluster1 일본 잠실 0.550992 0.365451 Cluster1 일본 이태원 0.651825 0.689254 Cluster1 일본 인사동 0.515371 0.735561 Cluster1 일본 가로수 0.72437 0.536936 Cluster1 일본 강남 0.475401 1.420091 Cluster1 일본 동대문 0.936524 0.88721 Cluster1 일본 코엑스 0.807585 1.109762 Cluster1 일본 청담동 / 압구정 0.58627 0.738819 Cluster1 홍콩 명동 0.987747 0.752107 Cluster1 홍콩 잠실 1.005895 0.527675 Cluster1 홍콩 이태원 0.964104 0.712023 Cluster1 홍콩 인사동 0.65776 0.846608 Cluster1 홍콩 홍대 0.653618 0.459439 Cluster1 홍콩 코엑스 0.601307 1.400649 Cluster1 군집 2 : 2 회성장 3 회고정 Country Region KGS2 KGS3 Cluster 홍콩 남대문 2.288632 0.605349 Cluster2 홍콩 동대문 2.59953 0.972691 Cluster2 홍콩 북촌 / 삼청동 3.08328 1.164604 Cluster2 중국 남대문 2.945636 1.298432 Cluster2 중국 가로수 2.838986 0.91568 Cluster2 군집3 : 2회고정 3회성장 Country Region KGS2 KGS3 Cluster 미국 명동 0.841048 1.303491 Cluster3 미국 홍대 1.170111 1.562873 Cluster3 미국 강남 0.826832 2.637789 Cluster3 미국 코엑스 0.762077 1.297071 Cluster3 일본 신촌 1.282168 2.828305 Cluster3 일본 이화여대 1.032847 1.389269 Cluster3 홍콩 신촌 0.5301 5.647543 Cluster3 홍콩 강남 0.871376 1.706365 Cluster3 홍콩 청담동 / 압구정 1.353328 1.664521 Cluster3 중국 인사동 0.953239 1.560117 Cluster3 중국 강남 1.349821 1.965889 Cluster3 중국 코엑스 1.260787 1.821018 Cluster3 중국 청담동 / 압구정 1.238173 1.662492 Cluster3 군집 4 : 2 회크게성장 3 회다소성장 Country Region KGS2 KGS3 Cluster 중국 신촌 3.813943 1.76435 Cluster4 중국 동대문 3.041244 1.932194 Cluster4 군집 5 : 2 회다소성장 3 회크게성장 Country Region KGS2 KGS3 Cluster 중국 북촌 / 삼청동 2.40336 4.760104 Cluster5 16 군집 6 : 2 회다소성장 3 회다소성장 Country Region KGS2 KGS3 Cluster 중국 이화여대 2.496371 2.414161 Cluster6 중국 홍대 2.463033 2.453386 Cluster6 군집 7 : 2 회고정 3 회고정 Country Region KGS2 KGS3 Cluster 미국 신촌 1.185397 0.82061 Cluster7 미국 남대문 1.799768 0.997627 Cluster7 미국 잠실 1.116688 0.871828 Cluster7 미국 이태원 1.021545 1.012041 Cluster7 미국 인사동 1.383406 0.945133 Cluster7 미국 이화여대 1.631509 1.334751 Cluster7 미국 가로수 1.136301 0.837376 Cluster7 미국 동대문 1.510654 1.255115 Cluster7 미국 청담동 / 압구정 0.987625 1.161674 Cluster7 미국 북촌 / 삼청동 1.360469 1.065397 Cluster7 일본 홍대 1.028412 1.01483 Cluster7 일본 북촌 / 삼청동 0.994426 0.897658 Cluster7 홍콩 이화여대 1.10092 1.143354 Cluster7 홍콩 가로수 1.373981 0.673896 Cluster7 중국 명동 1.427053 1.005768 Cluster7 중국 잠실 1.445159 1.218608 Cluster7 중국 이태원 1.746314 1.271166 Cluster7

2. 정책효과분석 5) 분석결과 일본홍콩중국미국 군집 1 2회감소 3회감소 Country Region KGS2 KGS3 Cluster 일본 남대문 0.788109 0.93907 Cluster1 일본 명동 0.509624 0.702295 Cluster1 일본 잠실 0.550992 0.365451 Cluster1 일본 이태원 0.651825 0.689254 Cluster1 일본 인사동 0.515371 0.735561 Cluster1 일본 가로수 0.72437 0.536936 Cluster1 일본 강남 0.475401 1.420091 Cluster1 일본 동대문 0.936524 0.88721 Cluster1 일본 코엑스 0.807585 1.109762 Cluster1 일본청담동 / 압구정 0.58627 0.738819 Cluster1 홍콩 명동 0.987747 0.752107 Cluster1 홍콩 잠실 1.005895 0.527675 Cluster1 홍콩 이태원 0.964104 0.712023 Cluster1 홍콩 인사동 0.65776 0.846608 Cluster1 홍콩 홍대 0.653618 0.459439 Cluster1 홍콩 코엑스 0.601307 1.400649 Cluster1 17

2. 정책효과분석 5) 분석결과 군집 2 군집 3 군집 4 2 회성장 3 회고정 2 회고정 3 회성장 2 회크게성장 3 회다소성장 18

2. 정책효과분석 5) 분석결과 군집 5 군집 6 군집 7 2 회다소성장 3 회크게성장 2 회다소성장 3 회다소성장 2 회고정 3 회고정 19

3. 원인파악분석 정책효과분석 4) AKE 분석 5) 결과해석 크롤링 : 웹페이지상의문서데이터를가져와서데이터를추출해내는행위. 크롤링 (Crawling) 혹은스크래이핑 (Scraping) 이라고도함 자연어처리 : 인간이발화하는언어현상을기계적으로분석해서컴퓨터가이해할수있는형태로만드는자연언어이해혹은그러한형태를다시인간이이해할수있는언어로표현하는제반기술 토픽모델링 : 구조화되지않은방대한문헌집단에서주제를찾아내기위한알고리즘으로, 맥락과관련된단서들을이용하여유사한의미를가진단어들을클러스터링하는방식으로주제를추론하는모델 AKE (Automatic Keyword Extraction from Individual Documents) : 개개의문서에서출현한각단어별로 Word score 를계산해얻은후보키워드들의비율과토픽모델링결과로얻은토픽별문서의출현확률을이용해토픽별로또는클러스터별로후보키워드를통해제목을생성후 PMI 와 PageRank 를이용해최종제목선정 PMI : 하나의단어쌍 (x,y) 에대해계산되는확률로서, 단어 x 와단어 y 가각각등장하는확률과동시등장하는확률을사용하여계산함 PMI 값이클수록서로관련성이높음 PMI(x,y) = log P(x,y) =>PMI(Word1, Word2) P x P(y) = hits(word1,word2) *100000000 hits Word1 hits(word2) Hits(Word) : Word에대한웹페이지의검색결과수 PAGERANK : 값이클수록중심성이높은것으로판단해최종후보키워드선정에사용 PR(A) = [ 1 d N +d(pr T 1 ) C(T 1 ) + + d(pr T n ) ] : A 노드의 pagerank 값 C(T n ) N : 모든노드의수 d : 이탈할확률 (Damping factor) 0 과 1 사이의값이며, 일반적으로 0.85 로설정 C(T) : 노드 T 가가지고있는링크의총개수 20

3. 원인파악분석 1) 데이터수집 정책효과를파악한세그먼트들의정책효과와관련된변수들을분석하기위해 토픽모델링을분석방법으로정하고크롤링을통해데이터를수집하고관심세그먼트선정 데이터수집 관심세그먼트선정 분석툴 JAVA 의 Jsoup 라이브러리이용 분석툴 앞선정책효과분석에서의계층적군집분석이용 분석내용 1 선행분석의전체세그먼트를각각키워드화 2 네이버뉴스에서문서들을수집 수집대상문서 : 제 3 회코리아그랜드세일기간전후네이버뉴스기사 (2014.07.01~2015.06.30) 3 네이버뉴스수집결과 keyword 문서수 중국인북촌 105 중국인강남 1262 일본인명동 497 중국인동대문 1127 일본인이태원 98 일본인잠실 99 일본인가로수길 55 중국인인사동 295 중국인신촌 458 중국인홍대 391 중국인이화동 48 중국인코엑스 466 미국인강남 240 분석내용 1 군집프로파일링결과를바탕으로군집들중정책으로계속성장하거나감소하는세그먼트들에포커싱 군집 1 : 2 회감소 3 회감소 군집 3 : 2 회고정 3 회성장 군집 5 : 2 회다소성장 3 회크게성장 2 각각의집단에서추가분석을위한세그먼트를하나씩선정 군집 1 ( 지속적감소 ) 군집 3 (3 회때성장 ) 군집 5 ( 지속적성장 ) 일본인명동 중국인강남 중국인북촌 4 수집된기사들을 mysql 을이용하여 DB 화 21

3. 원인파악분석 2) 형태소분석세그먼트별로수집된문서들에서토픽모델링과 AKE 를진행하기위해전처리작업인형태소분석을통한자연어처리를실행형태소분석 분석툴 분석내용 JAVA 의형태소분석 KOMORAN 라이브러리이용 1 수집된뉴스기사의 content 를토픽모델링과 AKE 분석을위해각각목적에맞게형태소분석 토픽모델링띄워쓰기단위에서명사구추출 AKE 문장단위에서명사구추출 문서수집결과 일본인명동 중국인강남 중국인북촌 토픽모델링을위한형태소분석결과 AKE 를위한형태소분석결과 22

3. 원인파악분석 3) 토픽모델링 형태소분석결과를통합해토픽모델링을진행하여정책효과의원인과관련된변수수집 각토픽들의데이터를수집해계층별군집분석을실행하여군집결과도출 토픽모델링 토픽계층적군집분석 분석툴 R 의 LDA 라이브러리이용 분석툴 R 을이용 parameter 토픽개수 : 10 개 Alpha : 0.1 Eta : 0.1 Iterations : 3000 상위단어개수 : 300 1 토픽의단어별출현확률을기준으로토픽들을군집 분석내용 토픽모델링결과 Topic 1 출현확률 Topic 2 출현확률 Topic 10 출현확률 서울 0.021648 호텔 0.043434 중국인 0.062809 호텔 0.018512 제주 0.01896 관광객 0.019897 상권 0.011508 분양 0.018285 매출 0.019566 임대료 0.008005 제주도 0.014028 중국 0.014722 지역 0.007438 스타케이 0.013098 화장품 0.014391 비즈니스 0.007372 객실 0.012074 한국 0.012736 명동 0.007038 관광객 0.010864 브랜드 0.011969 강남 0.006905 세계 0.010678 쇼핑 0.010767 관광객 0.006538 투자자 0.009817 지난해 0.010401 외국인 0.006438 수익 0.008561 증가 0.00967 기자 0.006204 중국인 0.008398 명동 0.009339 상승 0.005737 브랜드 0.008328 매장 0.009182 중국인 0.005704 운영 0.005839 서울 0.008729 분석내용 2 토픽그룹군집결과 C1 C2 C3 C4 C5 Topic 3 Topic 10 Topic 2 Topic 6 Topic 7 Topic 1 Topic 4 Topic 5 Topic 8 Topic 9 중국인 중국인 호텔 면세점 환자 서울 중국 서울 중국 사람 고객 관광객 제주 서울 중국인 호텔 한국 메르스 시장 때 중국 매출 분양 사업 성형외과 상권 중국인대통령 투자 음식 관광객 중국 제주도 관광객 병원 임대료관광객 문제 국내 말 브랜드 화장품 스타케이 운영 수술 지역 말 기자 이데일리 손님 23

3. 원인파악분석 4) AKE 분석군집을대표할수있는키워드를파악하기위해 AKE 분석을통해후보키워드도출도출된후보키워드로 PMI와 PAGERANK값을구해최종키워드분석 AKE 분석 분석툴 분석내용 AKE (Automatic Keyword Extraction) 1 AKE 용으로형태소분석된테이블과토픽모델링결과를이용하여 ESS 기준정렬및 PROB/RDF 로토픽군집별상위 20 개후보키워드도출 word rdf edf ess exc gen sortstd 중견ㆍ기업 247 110 48.98785 0.445344 137 deg/freq 기업ㆍ들 250 106 44.944 0.424 144 deg/freq 면세점ㆍ사업 339 119 41.77286 0.351032 220 deg/freq 면세ㆍ사업 181 83 38.06077 0.458564 98 deg/freq 대기업ㆍ들 164 78 37.09756 0.47561 86 deg/freq 사업ㆍ권 110 56 28.50909 0.509091 54 deg/freq 중견ㆍ기업ㆍ몫 49 37 27.93878 0.755102 12 deg/freq 2 도출된후보키워드로 PMI 와 PAGERANK 값을구해최종 3 개키워드분석 24 word topic prob prob/rdf C 중견ㆍ기업 X1 0.167313 0.000677 c5 중견ㆍ기업 X2 0.18904 0.000765 c2 중견ㆍ기업 X3 0.317092 0.001284 c1 중견ㆍ기업 X4 0.559037 0.002263 c5 중견ㆍ기업 X5 0.290986 0.001178 c5 중견ㆍ기업 X6 40.85818 0.165418 c3 중견ㆍ기업 X7 0.498833 0.00202 c4 중견ㆍ기업 X8 1.348792 0.005461 c5 중견ㆍ기업 X9 0.060414 0.000245 c5 중견ㆍ기업 X10 0.710317 0.002876 c1 C1 pagerank C2 pagerank C3 pagerank C4 pagerank C5 pagerank 화장품증가율 0.421396 서비스업생산증가율 0.343147 국내유통업계 0.264302 일부지역호텔 0.254321 품목별매출증가율 0.134156 국내외투자자들 0.149453 시내면세점운영권획득경쟁 시내면세점운영권입찰경쟁 면세점운영노하우가결합 0.293785 맞춤형공간 0.343147 자유회화 0.415484 0.147118 국내관광업계 0.254321 파고다어학원강사 0.256639 0.145704 국내성형외과 0.149453 원어민회화수업 0.114848

3. 원인파악분석 5) 결과해석 세그먼트들의관광정책효과의원인파악을위해토픽모델링결과를분석 관광진흥정책의효과와관계있는주요변수와요인에대해파악 중국인강남 c1 c2 c3 c4 C5( 기타 ) 화장품증가율 서비스업생산증가율 국내유통업계일부지역호텔 품목별매출증가율 국내외투자자들 시내면세점운영권획득경쟁 시내면세점운영권입찰경쟁 면세점운영노하우가결합 맞춤형공간 국내관광업계 국내성형외과 자유회화 파고다어학원강사 원어민회화수업 C1 - 화장품구입증가 C2 호텔수요증가 C3 면세점운영권획득경쟁 C4 성형외과의료관광활성화 분석내용 중국인북촌 C1 C2 C3 C4 관광버스전용디자인업체방문창조형관광산업육성문화마케팅선정배경주차공간 합작프로그램학생들지역별장소성고가경품이벤트 증가폭주차공간확보가이드취업전선한류체험이벤트 일본인명동 C1 C2 C3 엔화가격국내유통업계방한관광시장상황점검 규모투자프로젝트기업들걱정국내여행취소상황 부가가치관광산업중소기업상황메르스상황 25 C1 디자인업체방문증가 C2 주차공간확보필요 C3 창조형관광산업육성필요 C1 엔화가격하락의영향 C2 관광객수감소 C3 메르스영향

4. 결과활용 26

4. 결과활용 1) 분석결과 지역데이터, 관광객데이터, 시계열데이터를종합하여정책의효과성을분석함 관광진흥정책의효과를분석하고, 원인을파악하였으며정책방향제시를위한어플리케이션을제작함 정책효과분석원인분석정책방향제시 관광진흥정책효과를국가 - 지역 - 연도세그먼트를통해파악 전체세그먼트들의프로파일링결과표 정책효과를정확하게측정할수있는세부적인정책효과분석이가능 중국인강남 중국인북촌 일본인명동 관광진흥정책효과와관련있는변수와요인에대해파악 C1 C2 C3 C4 C1 C2 C3 C1 C2 C3 화장품구입증가 호텔수요증가 면세점운영권획득경쟁 성형외과의료관광활성화 디자인업체방문증가 주차공간확보필요 창조형관광산업육성필요 엔화가격하락영향 관광객수감소 메르스영향 정책의성과를이해하기위한원인 - 결과관계분석이가능 어플리케이션개발을통해서정책효과와관련된변수와요인들의인과관계를파악 중국인강남 중국인북촌 일본인명동 C1 C2 C3 C4 C1 C2 C3 C1 C2 C3 화장품관련협력업체추가 호텔추가건립 면세점추가영향검토 성형외과관련협력업체추가 디자인관련협력업체추가 행사기간에주차공간확보 창조형관광산업육성 코리아그랜드세일할인율증가 일본인대상프로모션실시 코리아그랜드세일확대실시 정책수립시빅데이터를기반으로하는맞춤형정책개발이가능 27

4. 결과활용 2) 어플리케이션 지역특성기반의관광진흥정책효과분석결과를어플리케이션을통해서구현함 국가 지역 연도의조합으로세그먼트분석과토픽모델링데이터를확인할수있게하였음 DAFT2016 DAFT2016 은빅데이터를활용한관광진흥정책효과분석어플리케이션으로국가 - 지역 - 연도의조합으로분할된개별세그먼트의시계열데이터와토픽모델링데이터를제공하는서비스입니다. 빅데이터기반국가 - 지역 - 연도단위분석결과제공 국가 지역 BIG DATA 130 만건 연도 토픽 28

4. 결과활용 3) 이용안내 국가 - 지역 - 연도를기준으로하는세그먼트분석을통해서정밀한정책효과측정이가능함 어플리케이션을통해정책효과와관련된변수와요인들의인과관계를파악할수있음 이용안내 국가 - 지역 - 연도를기준으로하는세그먼트별정책효과데이터를통해정밀한정책성과측정이가능하며관련변수와요인들의인과관계를파악할수있습니다. 데이터를바탕으로하는맞춤형정책개발이가능합니다. 1. 지역 - 연도 - 국가선택 2. 데이터확인 29

4. 결과활용 3) 이용안내 국가 - 지역 - 연도를기준으로하는세그먼트분석을통해서정밀한정책효과측정이가능함 어플리케이션을통해정책효과와관련된변수와요인들의인과관계를파악할수있음 이용안내 국가 - 지역 - 연도를기준으로하는세그먼트별정책효과데이터를통해정밀한정책성과측정이가능하며관련변수와요인들의인과관계를파악할수있습니다. 데이터를바탕으로하는맞춤형정책개발이가능합니다. 1. 군집선택 2. 군집데이터확인 30

4. 결과활용 4) 활용방안 세그먼트분할프레임을기반으로데이터와변수추가를통해모형을확장할수있음 빅데이터를기반으로하는정밀한정책성과측정과맞춤형정책개발이가능함 모델의확장 맞춤형정책개발 중국인강남 C1 C2 C3 C4 화장품관련협력업체추가호텔추가건립면세점추가영향검토성형외과관련협력업체추가 세그먼트분할프레임을기반으로데이터와변수를추가하여모형의확장이가능 정책수립시빅데이터를기반으로하는맞춤형정책개발이가능 31

참고문헌 WEF, The Travel & Tourism Competitiveness Report 2015 문화체육관광부 코리아그랜드세일추진현황및계획 문화체육관광부 2015년도관광부문재정집행계획 국회예산정책처 2015회계연도결산분석종합 한국문화정보센터통계개발부 2013 외국인신용카드국내지출액현황보고서 한국문화정보센터통계개발부 2014 외국인신용카드국내지출액현황보고서 한국문화정보센터통계개발부 2015 외국인신용카드국내지출액현황보고서 한국문화관광연구원 관광산업도빅데이터 (Big Data) 시대 한국문화관광연구원 국내쇼핑관광현황과향후발전방향 한국문화관광연구원 한중일관광경쟁력비교분석- WEF 관광경쟁력지수를중심으로 2013년 ~ 2015년네이버뉴스기사 ( 토픽모델링 ) 관광정보시스템입국관광정보통계 32