<C8A3C5DABBEABEF720B0E6B1E2B5BFC7E220BFB9C3F820B8F0B5A8BFA120B4EBC7D120BFACB1B85FC3D6C1BE28C7D1C3A2BFB1292E687770>



Similar documents
<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

제 1 부 연구 개요

<B1A4B0EDC8ABBAB8C7D0BAB8392D345F33C2F75F E687770>

abstract.dvi

hwp

... 수시연구 국가물류비산정및추이분석 Korean Macroeconomic Logistics Costs in 권혁구ㆍ서상범...

#Ȳ¿ë¼®

232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

12È«±â¼±¿Ü339~370

Forecasting Korea Tourism Quarterly

DBPIA-NURIMEDIA

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

ÀÌÁÖÈñ.hwp

DBPIA-NURIMEDIA

hwp

DBPIA-NURIMEDIA

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

44-4대지.07이영희532~

<31372DB9DABAB4C8A32E687770>

04-다시_고속철도61~80p

06_À̼º»ó_0929

에너지경제연구 제13권 제1호

<2D3828C8AE29B9DAC3B5B1D42E687770>

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

<B5B6BCADC7C1B7CEB1D7B7A52DC0DBBEF7C1DF E687770>

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: * Strenghening the Cap

230 한국교육학연구 제20권 제3호 I. 서 론 청소년의 언어가 거칠어지고 있다. 개ㅅㄲ, ㅆㅂ놈(년), 미친ㅆㄲ, 닥쳐, 엠창, 뒤져 등과 같은 말은 주위에서 쉽게 들을 수 있다. 말과 글이 점차 된소리나 거센소리로 바뀌고, 외 국어 남용과 사이버 문화의 익명성 등

2힉년미술

최우석.hwp

<C0CEBCE2BABB2D33C2F7BCF6C1A420B1B9BFAAC3D1BCAD203130B1C72E687770>

교사용지도서_쓰기.hwp

時 習 說 ) 5), 원호설( 元 昊 說 ) 6) 등이 있다. 7) 이 가운데 임제설에 동의하는바, 상세한 논의는 황패강의 논의로 미루나 그의 논의에 논거로서 빠져 있는 부분을 보강하여 임제설에 대한 변증( 辨 證 )을 덧붙이고자 한다. 우선, 다음의 인용문을 보도록

0429bodo.hwp

伐)이라고 하였는데, 라자(羅字)는 나자(那字)로 쓰기도 하고 야자(耶字)로 쓰기도 한다. 또 서벌(徐伐)이라고도 한다. 세속에서 경자(京字)를 새겨 서벌(徐伐)이라고 한다. 이 때문에 또 사라(斯羅)라고 하기도 하고, 또 사로(斯盧)라고 하기도 한다. 재위 기간은 6

과 위 가 오는 경우에는 앞말 받침을 대표음으로 바꾼 [다가페]와 [흐귀 에]가 올바른 발음이 [안자서], [할튼], [업쓰므로], [절믐] 풀이 자음으로 끝나는 말인 앉- 과 핥-, 없-, 젊- 에 각각 모음으로 시작하는 형식형태소인 -아서, -은, -으므로, -음

E1-정답및풀이(1~24)ok

cls46-06(심우영).hwp

<C1B6BCB1B4EBBCBCBDC3B1E2342DC3D6C1BE2E687770>

untitled

민주장정-노동운동(분권).indd


6±Ç¸ñÂ÷

< BDC3BAB8C1A4B1D4C6C75BC8A3BFDC D2E687770>

<C3D6C1BE5FBBF5B1B9BEEEBBFDC8B0B0DCBFEFC8A C3D6C1BEBABB292E687770>

초등국어에서 관용표현 지도 방안 연구

¸é¸ñ¼Ò½ÄÁö 63È£_³»Áö ÃÖÁ¾

177

제주어 교육자료(중등)-작업.hwp

01Report_210-4.hwp

<C3D1BCB15FC0CCC8C45FBFECB8AE5FB1B3C0B0C0C75FB9E6C7E D352D32315FC5E4292E687770>



교육 과 학기 술부 고 시 제 호 초 중등교육법 제23조 제2항에 의거하여 초 중등학교 교육과정을 다음과 같이 고시합니다. 2011년 8월 9일 교육과학기술부장관 1. 초 중등학교 교육과정 총론은 별책 1 과 같습니다. 2. 초등학교 교육과정은 별책

시험지 출제 양식

우리나라의 전통문화에는 무엇이 있는지 알아봅시다. 우리나라의 전통문화를 체험합시다. 우리나라의 전통문화를 소중히 여기는 마음을 가집시다. 5. 우리 옷 한복의 특징 자료 3 참고 남자와 여자가 입는 한복의 종류 가 달랐다는 것을 알려 준다. 85쪽 문제 8, 9 자료

상품 전단지

::: 해당사항이 없을 경우 무 표시하시기 바랍니다. 검토항목 검 토 여 부 ( 표시) 시 민 : 유 ( ) 무 시 민 참 여 고 려 사 항 이 해 당 사 자 : 유 ( ) 무 전 문 가 : 유 ( ) 무 옴 브 즈 만 : 유 ( ) 무 법 령 규 정 : 교통 환경 재

2

DBPIA-NURIMEDIA

화이련(華以戀) hwp

ÆòÈ�´©¸® 94È£ ³»Áö_ÃÖÁ¾

歯1##01.PDF

<5BC1F8C7E0C1DF2D31B1C75D2DBCF6C1A4BABB2E687770>

120229(00)(1~3).indd

세종대 요람

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

,.,..,....,, Abstract The importance of integrated design which tries to i

<3136C1FD31C8A35FC3D6BCBAC8A3BFDC5F706466BAAFC8AFBFE4C3BB2E687770>

380 Hyun Seok Choi Yunji Kwon Jeongcheol Ha 기존 선행연구에서는 이론연구 (Ki, 2010; Lee, 2012), 단순통계분석 (Lee, 2008), 회귀분석 (Kim, 2012)과 요인분석 (Chung, 2012), 경로분석 (Ku,


<313220BCD5BFB5B9CCC1B6BFF8C0CF2E687770>

2. 박주민.hwp

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

DBPIA-NURIMEDIA

- 1 -

ASETAOOOCRKG.hwp

에너지경제연구 Korean Energy Economic Review Volume 9, Number 2, September 2010 : pp. 1~18 가격비대칭성검정모형민감도분석 1

에너지경제연구 제13권 제1호

02김헌수(51-72.hwp

<3036C7E2BCF6C3D6C1BEBABB2E687770>

진단, 표시・광고법 시행 1년

<31372DB9CCB7A1C1F6C7E22E687770>

사회동향1-2장

歯표지_최종H_.PDF


untitled

<B3EDB9AEC1FD5F3235C1FD2E687770>

DBPIA-NURIMEDIA

한국성인에서초기황반변성질환과 연관된위험요인연구

Journal of Educational Innovation Research 2016, Vol. 26, No. 3, pp DOI: Awareness, Supports

Kor. J. Aesthet. Cosmetol., 라이프스타일은 개인 생활에 있어 심리적 문화적 사회적 모든 측면의 생활방식과 차이 전체를 말한다. 이러한 라이프스 타일은 사람의 내재된 가치관이나 욕구, 행동 변화를 파악하여 소비행동과 심리를 추측할 수 있고, 개인의

<B9CCB5F0BEEEB0E6C1A6BFCDB9AEC8AD5F31322D32C8A35FBABBB9AE5FC3CAC6C731BCE25F6F6B5F E687770>

5. 회 의내용 < 제 1호 안 : 2011학년도 법 안 회 제 철 산(안 )> 법인 사무국장의 성왼 보고에 이이 의장이 이사회 개회 용 선언하고 회계판려부장에 게 제 l 호 안인 학년도 입인 회계 결산(안)에 대한 성명융 지시함 회계판리부장이 2011 학년


ePapyrus PDF Document

11¹Ú´ö±Ô

< B3E220C7CFB9DDB1E220BFACB1B8BAB8B0EDBCAD20C1A636B1C72E687770>

<3135C8A3B3EDB9AE DBCF6C1A42E687770>

Transcription:

碩 士 學 位 論 文 호텔산업 경기동향 예측 모델에 대한 연구 - 월별 계절성 더미변수를 활용한 다중회귀모형을 적용 - 2016 年 2 月 韓 南 大 學 校 社 會 文 化 行 政 福 祉 大 學 院 情 報 統 計 學 科 韓 昌 燁

호텔산업 경기동향 예측 모델에 대한 연구 - 월별 계절성 더미변수를 활용한 다중회귀모형을 적용 - 指 導 敎 授 김 명 준 이 論 文 을 碩 士 學 位 論 文 으로 提 出 함 2016 年 2 月 韓 南 大 學 校 社 會 文 化 行 政 福 祉 大 學 院 情 報 統 計 學 科 韓 昌 燁

목 차 국문요약 제 1장 서 론 1 제 1절 연구의 배 경 및 목적 1 제 2절 연구의 범 위 및 방 법 2 제 2장 1차 변 수 선 택 및 자 료 보 완 5 제 1절 호텔산업과 관 련 된 1차 변 수 선 택 5 제 2절 1차 선 택 된 변 수 의 자 료 보 완 6 제 3 장 호텔산업 경기동향 모형 예측 16 제 1절 호텔산업 예측 모형 의 변 수 정 의 16 제 2절 호텔산업 경기동향 모형 예측 17 제 3 절 전 방 예측 없 는 객 실 사 용 률 후 방 예측 29 제 4 장 결 론 및 논 의 3 2 제 1절 1차 변 수 선 택 및 자 료 보 완 3 2 제 2절 호텔산업 경기동향 모형 예측 3 3 제 3 절 한계 점 및 향후 방 향 3 4 참 고 문 헌 3 5 A B S T R A C T 3 6

표 목 차 < 표 1> 수 집 변 수 의 정 의 및 주 기 4 < 표 2> 객 실 사 용 률 자 료 의 역 순 형 태 6 < 표 3 > 전 방 예측) 회 귀 모형 별 결 정 계 수 및 수 정 결 정 계 수 9 < 표 4 > 전 방 예측) 카 이제 곱 검 정 10 < 표 5 > 전 방 예측) 더 빈 - 왓 슨 통 계 량 10 < 표 6> 전 방 예측) 정 규 성 검 정 11 < 표 7 > 전 방 예측) 자 기상 관 제 거 결 과 12 < 표 8 > 전 방 예측) 객 실 사 용 률 전 방 예측값 13 < 표 9 > 후 방 예측) 카 이제 곱 검 정 14 < 표 10> 후 방 예측) 더 빈 - 왓 슨 통 계 량 14 < 표 11> 후 방 예측) 정 규 성 검 정 14 < 표 12> 후 방 예측) 자 기상 관 제 거 결 과 15 < 표 13 > 후 방 예측) 객 실 사 용 률 후 방 예측값 15 < 표 14 > 종 속 변 수 및 설 명변 수 의 정 의 16 < 표 15 > 피 어 슨 상 관 계 수 17 < 표 16> 설 명변 수 간 분 산팽 창 요 인 및 허 용 도 18 < 표 17 > 설 명변 수 간 상 관 계 수 18 < 표 18 > 전 방 선 택 법 20 < 표 19 > 후 방 소 거 법 에 의 해 제 거 된 변 수 20 < 표 20> 후 방 소 거 법 에 의 해 선 택 된 변 수 21 < 표 21> 단 계 별 회 귀 법 21 <표 22> 조정된 선택법 22 < 표 23 > 맬로우스의 선택법 23 < 표 24 > 호텔산업 경기동향 모형 회 귀 계 수 및 표준화 회 귀 계 수 25 < 표 25 > 호텔산업 경기동향 모형 카 이제 곱 검 정 26

< 표 26> 호텔산업 경기동향 모형 더 빈 - 왓 슨 통 계 량 62 < 표 27 > 호텔산업 경기동향 모형 정 규 성 검 정 27 < 표 28 > 호텔산업 경기동향 모형 자 기상 관 제 거 결 과 27 <표 29> 2014 년 실측값 과 예측값의 차이 28 < 표 3 0> 모형 1과 모형 2의 후 방 예측값 비 교 29 < 표 3 1> 모형 1과 모형 2의 수 정 ( o r 총 ) 결 정 계 수 3 1 <표 3 2> 2014 년 실측값 과 모형1, 모형2 예측값 과 차이 3 1 그 림 목 차 ( 그림 1) I n d e x ( 종 속 변 수 ) 와 A c t i v i t y ( 설 명변 수 ) 그래 프 3 ( 그림 2) X - 13 A R I M A - S E A T S 스 펙 트 럼 ( 그래 프 ) 8 ( 그림 3 ) I n d e x ( 종 속 변 수 ) 월 별 그래 프 24 ( 그림 4 ) 전 방 및 후 방 예측된 객 실 사 용 률 3 2 식 목 차 ( 식 1) 객 실 사 용 률 과 시 간 변 수 만 의 회 귀 모형 7 ( 식 2) 4 계 절 계 절 성 더 미 변 수 를 포 함한 회 귀 모형 7 ( 식 3 ) 월 별 계 절 성 더 미 변 수 를 포 함한 회 귀 모형 7 ( 식 4 ) 더 빈 - 왓 슨 통 계 10 ( 식 5 ) 객 실 사 용 률 전 방 예측 최 종 모형 13 ( 식 6) 객 실 사 용 률 후 방 예측 최 종 모형 15 ( 식 7 ) 종 속 변 수 에 대한 전 체 모형 ( F u l l - M o d e l ) 16 ( 식 8 ) 호텔산업 경기동향 모형 최 종 모형 28

국 문 요 약 최근 숙박업의 경기 및 산업구조는 일본 엔저의 영향 및 소득의 변화 그리고 한류열풍에 따른 외국인 입국(중국인(요오커) 관광 방문) 증가 등 으로 급격하게 변화하고 있다. 이런 현상을 반영하기 위해 정확한 현장조사 를 통한 지표가 작성되어야 한다. 그러나 동업종간의 정보 보안문제로 자료제 출을 기피하고 분기 자료 제출(분기 결산) 등 월 별 지 표 작 성 에 어 려 움 을 겪고 있다. 그러므로 최근 사업체의 정보 보안으로 인한 현장 조사의 어려운 부분 과 조사비용 절감을 위해 현장 조사를 지양하고자 한다. 숙박업과 관련된 변수를 이용하여 경기 동향을 나타낼 수 있는 숙박산업 경기동향 예측 모 델을 제시 하고자 한다. 단, 전체적인 숙박업을 예측하기 보다는 숙박업 간의 관계성을 배제하기 위하여 숙박업 중 하나인 호텔업을 선택하여 관 련 된 변수를 수집하고자 한다. 호텔산업 관련 설명변수는 (호텔)객실사용률, 외국인 입국자(일본,미국,중 국,대만, 이외 전체), 환률(달러,엔화,위엔), 관광수입 등으로 동행적 자료 들이다. 자료(크기) 부족분에 대해선 전방예측, 후방예측을 실행하였다. 호텔산업에 경기동향 예측모형에는 i n_t o t al, ac t i v i t y, i n_j an, j py 등 4개의 설명변수와 월별 계절성 더미변수를 포함한 모형이 최종 선택되었으며 수정 결정계수가 0.8531수준으로 대략 8 5. 3 % 설명력을 가진다. 선택된 변수와 표 준화 회귀계수를 보면 관광수입 등 다른 변수 보다는 외국인 관광객 입국자 와 객실사용률에 영향을 많이 받았다. 입국자 중에서도 다른 국적보다는 일 본인 입국자가 호텔 경기동향에 영향을 미치는 것으로 나타났다. 객실사용률의 전방예측을 포함한 모형1과 포함하지 않은 모형2의 예측치 와 실측치의 비교값은 유사하게 나왔다. 즉 자료의 크기를 예측을 통해 맞추거나 크게 한다고 하여 좋은 결과가 나오는 것은 아니라는 것이다. 예측한 결과에 따른 예측 오차가 적합성을 떨어뜨릴수 있다라고 판단할 수 있다.

제 1 장 서 론 제 1절 연구의 배경 및 목적 1. 숙박업 분류 및 지표 1) 숙박업 분류와 지표 한국표준산업분류(KSIC_제9차개정)상 숙박업은 호텔업(관광, 일반, 가족 등)과 여관업, 휴양콘도 운영업, 청소년수련시설 운영업, 기타 관광숙박시 설 운영업, 기숙사 운영업, 그 외 기타 숙박업으로 분류 된다. 우리나라에서 현재 숙박업 관련 경기 동향을 보여주는 지표로는 통계청 서비스업동향과에서 매월 공표하는 서비스업생산지수 중 숙박업(호텔업, 여관업, 휴양콘도 운영업)과 한국은행에서 분기 공표하는 국내총생산 (GDP) 중 도소매 및 음식숙업 지표가 있다. 또 다른 지표는 통계청 산업 통계과에서 공표하는 도소매업조사(숙박 및 음식점업 포함) 중 숙박업 지 표가 있다. 앞에 두 지표는 경기 동향을 속보 형태로 보여준다면 마지막 지표는 산업 구조 변화를 보여준다고 할수 있다. 2. 연구의 배경 및 목적 1) 숙박업의 변화 요인 및 배경 최근 숙박업의 경기 및 산업구조는 일본 엔저의 영향 및 소득의 변화 그 리고 한류열풍에 따른 외국인 입국(중국인(요오커) 관광 방문) 증가 등으 로 숙박업의 경기 및 산업구조가 급격하게 변화하고 있다. 이런 현상을 반 영하기 위해 정확한 현장조사를 통한 지표가 작성되어야 하나 동업종간의 정 보 보안문제로 자료제출을 꺼려하고 분기 자료 제출(분기 결산) 등 월 별 지 표 작성에 어려움을 겪고 있다. 또한 5년 단위 표본 개편 등으로 신설 - 1 -

호텔 등 반영 여부가 불확실한 실정이다. 이에 고정 표본틀로 인해 발생 하는 표본 오차, 응답자 부담 경감, 조사 비용 절감 등을 위하여 숙박업 과 관 련 된 변 수 를 이용 한 숙박업 경기 동향을 나타내는 숙박업 모델을 제 시 하고자 한다. 2) 연구 목적 최근 사업체의 정보보안으로 인한 현장 조사의 어려운 부분과 조사비용 절감을 위해 현장 조사를 지양하고 숙박업과 관련된 변수를 이용하여 경 기 동향을 나타낼 수 있는 숙박업 모델을 제시 하고자 한다. 이는 급격하 게 변하는 숙박업의 동향을 속보형태로 보여 줄 것으로 예상되며 또한 이 모델로 통해 숙박업에 관심 있는 지역의 선행 연구 모델로서 숙박업 정책 의 나침반이 되고자 한다. 제 2절 연구의 범위 및 방법 1. 연구 범위 숙박업은 보건복지부의 관할로 공중위생관리법 규정된 일반 1 및 생 활 2 숙박업으로 구분되며, 문화체육관광부 관할로 관광진흥법 에 규정된 호텔산업 3 과 휴양콘도미니엄업 4 으로 구분 된다. 숙박업의 정의: 1일반숙박업(여관, 여인숙, 모텔): 손님이 잠을 자고 머물 수 있도록 시설 및 설비 등의 서비스를 제공하는 영업(취사시설 제외) 2생활숙박업(서비스드 레지던스): 손님이 잠을 자고 머물 수 있도록 시설 및 설비 등의 서비스를 제공하는 영업(취사시설 포함) 3 호텔산업: 관광 객의 숙박 에 적 합한 시설 을 갖 추어 이를 관광 객에게 제공하거나 숙박에 딸린 음식 운동 휴양 공연 또는 연수에 적합한 시 설 등을 함께 갖추어 이를 이용하 게 하 는 산업으로 관광호텔, 수 상관 광 호텔, 전통 호텔, 가족 호텔 등이 있다. - 2 -

4휴양콘도미니엄업: 관광객의 숙박과 취사에 적합한 시설을 갖추어 이 를 그 시설의 회원이나 공유자, 그 밖의 관광객에게 제공하거나 숙박에 딸리는 음식 운동 휴양 공연 또는 연수에 적합한 시설 등을 함께 갖추어 이를 이용하게 하는 산업 본 연구에서는 관광진흥법 상 등록된 호텔산업과 휴양콘도미니업 중 호텔산업만을 대상으로 모형을 예측하고자 한다. 호텔산업에 영향을 미칠 수 있는 행정 자료를 이용하여 다중회귀식을 추 예측하고자 하는 것이며 이와 관련 된 행정 자료는 외국인 입국수, 관광수 입, 환율, 객실사용률 등이 있다. 2. 연구 방법 - 호텔업의 경기 동향 모형 예측( 전방 (후 방) 예측) 현재 공표하고 있는 서비스업생산지수 호텔업 지수를 종속변수로 하고 <표 1>에서 정의된 모든 변수를 설명변수로 지정 후 변수 선택법을 통해 관심 변수를 선택하고자 한다. (그림 1) 객실사용률처럼 자료가 부족한 변 수에 대해선 전방(후방)예측을 통해 자료를 예측하여 사용하고자 하며 분 기별 자료에 대해선 동일값 대체법 또는 내삽법을 사용할 수 있으나 이번 논문에선 분기별 자료는 제외 하고자 한다. (그림 1) Index(종속변수)와 Activity(설명변수) 그래프 - 3 -

3. 호텔산업에 영향을 미칠 것으로 예상되는 변수 정의 <표 1> 수집 변수의 정의 및 주기 변 주 내 용 인 기 시 기 비 고 종속 호텔산업 월 2000.01. 호텔산업 서비스업생산지수 독 립 변 인 외국인입국자 월 2003.01. 내국인출국자 월 2003.01. 국민해외관광객 관광수입 월 1975.01. 관광지출 월 1975.01. 법무부 출입국 관리사무소의 출입국 통계자료를 체류자자격별 제외되는 항 목(외교, 방문동거, 거주, 군인, 영주) 이외 입국자수 합 방한 외래관광객의 지출금액 (한국은행) 국민 해외관광객의 지출금액 (한국은행) 환 율 월 2000. 01 매매기준(달러/엔/위안) 평균숙박일수 월 2005.12~ 숙박 이용 집단 단위가 1회당 사용한 일 2013.02. 수 호텔객실 사 용률 월 2006.01~ 판매가능객실수/판매객실수/이용률 2013.12. 2014년 객실판매 및 이용율 현황은 2015년 하반기 공표 숙박이용실적 월 2006.01~ 2013.12. 숙박객수/연숙박객수/ 객실수입(외국인)/객실수입(내국인) 호텔객실 수 월 2000.01. 호텔객실수/호텔수(누계값) 가계지출(숙박비) 관광사업체현황 관광소비지출전망 (CSI) 관광사업체 경기동향( BSI ) 캠핑장갯수 카드사용_숙박 분 기 분 기 2003. 1Q. 통계청 가계동향 중 숙박비 2011. 2Q. 분 기 2008. 1Q. 전국 만19세이상 성인남녀, 유효 표본수 1,000명(관광정보시스템) 분 기 2007. 2Q. 관광진흥법상에 등록된 관광사업체, 유효표본수 305개(관광정보시스템) 한국관광사_캠핑장 시계열 요청 했으 나 정확성 문제로 자료 사용 못함 전국캠핑장갯수 (http://www.gocamping.or.kr) 여신금융협회에 자료 요청 _카드사별 보안상 어려움 - 4 -

제 2 장 1차 변 수 선 택 및 자 료 보 완 제 1절 호텔산업과 관련된 1차 변수 선택 1. 자료 제공 형태에 따른 변수 선택 앞장에서 정의된 변수 중 월별 자료로 사용할 수 있는 변수는 외국인입 국자, 관광수입, 환율, 평균숙박일수, 객실사용률, 숙박이용실적, 가계지출 (숙박비), 관광사업체현황, 관광소비지출전망(CSI), 관광사업체경기동향 (BSI) 등이 있으나 관광수입(1975.01.~), 관광지출(1975.01.~), 호텔객실수 ( 2000.01. ~), 환율( 2000. 01.~ ) 변수를 제외한 다른 변수는 최소 3년(36개월) 에서 최대 6년(72개) 변수를 전방예측을 해야 한다. 최근 1년 또는 2년의 예측값은 어느 정도 정확성은 존재한다고 판단되나 6년의 전방예측은 정 확성이 떨어진다고 판단되어 1차 변수 선택에서 제외하고자 한다. 전방 예측을 필요로 하는 변수를 선택하기 위해 서비스업생산지수 지수개편을 기준으로( 2000년기준, 2005 년기준, 2010년기준) 2005 년 부터 자료 를 사용한 다면 호텔객실사용률(이하 객실사용률 )과 숙박이용실적, 평균숙박일수 등 은 12개월(1년)만 예측이 필요하여 예측 오차도 줄일 수 있다고 판단된다. 그러나 객실사용률이 숙박이용실적과 평균숙박일 등과 어떤 수학적 관계, 즉 유사한 자료에서 나오는 변수임에 따라 객실사용률의 변수만을 이번 논문에서 사용하고자 한다. 또한, 가계지출(숙박비), 관광사업체현황, 관광소비지출전망(CSI), 관광사 업체 경기동향( B S I ) 자 료 제공 형 태는 분기별 이다. 분 기별 자료 에 대해 선 동일값 대체법 또는 내삽법 등을 사용하여 자료들을 예측 할 수 있으나 어느 예측법이 자료에 더 정확성을 가지고 있는지 알 수 없어 이번 논문 에선 제외 하고자 한다. - 5 -

제 2절 1차 선택된 변수의 자료 보완 1. 1차 선택된 변수 1차로 선택된 변수는 외국인입국자, 관광수입, 환율, 객실사용률 등이 있다. 이중 객실사용률은 앞절에서도 언급 했듯이 2006년 1월부터 자료가 제공 되어 전방예측이 필요하면 2014년 자료가 2015년 하반기에 공표(시의성이 떨어짐)됨에 따라 후방예측도 필요한 것으로 판단된다. 2. 객실사용률의 자료 보완 1) 객실사용률 전방예측(backcasting) (1) 월별 계절성 더미변수를 활용한 모형 선택 객실사용률에 대한 2005년1월부터 12월까지 값을 예측하기 위한 방법으로 회귀직선 추정방법을 이용하고자 한다. 객실사용률(종속변수)과 시간(설명변수)의 피어슨의 상관계수는 0.65736이며 유의 확률 또한 0. 0001보다 작은 값으로 유의 수준 0. 01에서 의미 가 있는 양의 상관관계가 있다 고 판단된다. 따라서 객실사용률의 전방예측을 위해 두 변수간의 회귀직선 예측을 실행하였다. 단, 회귀직선식을 통해 후방예 측(Forecasting)은 가능하나 전방예측(Backcasting)은 불가능하여 기존 자 료들을 역순위로 배열하였다. 즉, 과거값을 현재값으로 하고 과거자료를 예측하기로 했다. <표 2> 객실사용률 자료의 역순 형태 기존자료 역순자료 본 연구에서 객실사용률을 추정하기 위해 3가지 모형을 제시하고자 한다. 첫 번째 모형은 객실사용률(종속변수)과 시간(설명변수)의 관계로만 - 6 -

이루어진 일반단순회귀모형으로 (1) 두 번째 모형은 종속변수에 계절성이 있다고 가정한 후(존재 여부는 아 래에서 확인 가능) 4계절 계절적 더미변수 생성한 모형으로 (2) 세 번째 모형은 4계절 계절적 더미변수 보다는 월별 계절성이 있다고 가 정한 후 월별 더미변수를 생성한 모형으로 나타내었다. (3) 그리고 세 모형이 가정하고 있는 오차의 독립성, 정규성, 등분산성에 대한 검정은 모형이 택해진 후 해당 모형에만 검정하고자 한다. 식 (1), (2), (3)에 대해 검정하고자 하는 가설은 다음과 같다 귀무가설: (설명변수 유의하지 않음) 대립가설: (설명변수는 유의함) 첫 번 째 모형인 식 ( 1) 에 대한 모형 검 정은 유의 확률이 0.0001보다 작 은 값으로 유의수준 0.01에서 귀무가설을 기각하고 대립가설을 선택할 수 있 다. 즉 설명변수 는 유의한 수준에 있다 라고 할 수 있다. 다만, 설명력 을 말하는 수정 결정계 수가 0.4 261 수준으로 그렇게 높지는 않다. 계절적 더미변수를 포함한 식 (2)와 식 (3)에 대해 모형 검정하기에 앞 서 계절적 더미변수 포함 여부에 대한 타당성을 우선적으로 검토하고자 한다. 일반적 계절성 여부 검토 방법은 X-13ARIMA-SEATS 프로그램을 이용하여 그래프 및 스펙트럼을 이용하는 방법과 통계량에 의한 F-검정 과 크루스칼-왈리스(Kryskal -Wallis) 검정 방법이 있다. 하지만 본 연구 에서는 계절 인자를 구하는 것이 아니라 단순히 계절성만 확인하는 단계로 서 그래프 및 스펙트럼을 이용하는 방법만으로 계절성 존재 여부를 판단 하고자 한다. 또한 명절 또는 요일 효과 등 사전 조정은 하지 않은 상태에 서 원계열에 대한 계절성 존재여부만 확인 하고자 한다. - 7 -

(그림 2) X-13ARIMA-SEATS 스펙트럼(그래프) ( 그림 2) X-13 A RI M A -S EAT S 프로그램을 이용 한 그래프 및 스 펙트럼 이다. 왼쪽 그래프를 보면 객실사용률이 8월 높고 1월에 낮다는 계절성 이 존재하는 것을 나타내고 있으며 오른쪽 스펙트럼을 보면 1/12, 2/12, 3/12, 4/12 주기에 높은 점이 나타나고 있어 계절성이 뚜렷하게 있음을 알 수 있다. 따라서 객실사용률 전방예측에 계절적 더미변수를 사용하는 것 이 타당하다 라는 결론을 내릴 수 있다. 계절성 여부 결과에 따라 식 (1)에 4계절 계절성 더미변수를 부여하여 식 ( 2) 에 대한 모형 검정을 실행하 였다. 귀무가 설은 유 의확률 이 0.0001보 다 작은 값으로 유의수준 0.01에서 기각되어 설명변수 는 유의한 수준 에 있다 라는 대립가설이 채택되었다. 다만, 식 (1)보다 설명력이 높아진 수정결정계수가 0.6034 수준이다. 식 (2)는 4계절 더미변수를 부여했다면 식 (3)은 월별 계절성 더미변수 를 부여하였다. 좀더 세부적인 계절성을 부여한 것이다. 월별 계절성 더미변수가 포함된 식 (3)에 대한 모형 검정 결과 유의확률이 0.0001보다 작은 값으로 유의수준 0.01에서 귀무가설을 기각하고 대립가설을 선 택할 수 있다. 즉 설명변수 는 유의한 수준에 있다 고 할 수 있다. 단, 12월에 비해 1월, 2월, 3월, 4월, 5월, 6월, 7월, 9월, 11월은호텔사용률 정도 차이가 없는 것 으로 나타났다. 또한 설명력을 나타내는 수정결정계수는 0.7863 수준이다. - 8 -

최종적으로 세가지 모형 중 하나의 모형을 선택해야 한다. 선택 방법으 로는 적합도 판정을 이용하고자 한다. 적합도 판정은 크게 결정계수에 의 한 전체적인 적합도 판정과 분산분석표를 이용한 적합도 판정이 있으나 분산분석표에 의한 적합도 판정은 이미 앞에서 귀무가설 검정의 결과와 동일하므로 어느 모형이 좋다 라고 판단하기가 곤란하다. 따라서 결정계 수를 이용한 적합도 판정을 하기로 한다. <표 3> 전방예측) 회귀모형별 결정계수 및 수정결정계수 회귀모형식 결정계수( ) 수정결정계수(Adj ) 일반회귀모형 0.4321 0.4261 4계절 계절성 더미변수 포함 모형 0.6201 0.6034 월별 계절성 더미변수 포함 모형 0.8133 0.7863 <표 3> 월별 계절성 더미변수를 포함한 모형의 수정결정계수(Adj ) 가 다른 회귀모형보다 수정결정계수가 가장 큰 것을 알 수 있다. 이것은 추정된 회귀식이 회귀식으로 설명되는 분산 정도가 크다 라는 의미이기도 하다. 따라서 최종적으로 월별 계절성 더미변수를 포함한 모형에 대하여 오차항의 등분산성, 독립성, 정규성 검정을 하고자 한다. (2) 선택된 모형의 오차항 검정 1 오차항의 등분산성 검정 회귀분석에서는 확률분포 의 분산은 모든 독립변수 값에 관계없이 동일하다는 가정을 하고 있다. 이를 등분산성(homosceda-sticity) 가정이 라고 한다. 본 연구에선 SAS(ACOV(공분산행렬), SPEC(이분산성 검정)) 프로그램을 사용하여 등분산성 가정을 검정을 하고자 한다. - 귀무가설:, - 대립가설: - 9 -

< 표 4> 전 방예측) 카이제 곱 검정 Test of First and Second Moment Specification DF Chi-Square Pr > ChiSq 24 27.09 0.3003 <표 4> χ 2 검정값이 27.09 < χ 2 (24, 0.05 ) = 3 6.4 15 이고 유 의확률 이 0. 05 보 다 큰 0.3003이므로 분산이 같다 라는 귀무가설을 기각할만한 이유가 없 는 것으로 판단할 수 있다. 즉 오차항간의 분산이 95%신뢰수준하에 동일 하다 라고 할 수 있는 것이다. 2 오차항의 독립성 검정 오차항이 서로 독립이라는 의미는 오차항간에는 상관관계가 없어야 한다 는 의미이다. 즉 독립적이지 못하면 오차항들 간에 자기상관이 존재한다 는 의미이며 더빈-왓슨(Durbin-Watson) 검정통계량으로 파악할 수 있다. 더빈-왓슨(DW) = (4) DW값의 변화에 따라 자기상관 여부 판단은 아래의 잣대를 이용할수 있다. 의사결정 양의자기상관 미정 자기상관 없음 미정 음의자기상관 DW값 0.0 2.0 4-4- 4.0 <표 5> 전방예측) 더빈-왓슨 통계량 Durbin-Watson D 0.695 Number of Observations 96 1st Order Autocorrelation 0.632 <표 5> 더빈-왓슨(DW) 검정통계량이 0.695로서 기준값 2와는 거리가 멀어 오차항들 사이에 관련성이 없다 라고 할 수 없다. 또한 값보다 작은 값 으로 양의 자기상관을 가지고 있다고 할 수 있으며 독립성 가정은 위배 된 다. 따라서 모형을 새롭게 선정하거나 자기상관을 제거해야 한다. - 10 -

3 오차항의 정규성 검정 오차항에 대한 정규성 검정은 SAS 프로그램의 샤피로-윌크(Shapiro-Wilk) 검정의 통계량들을 통해 살펴보고자 한다. - 귀무가설: 표본평균(ȳ) = 모평균(μ) - 대립가설: 표본평균(ȳ) 모평균 (μ) <표 6> 전방예측) 정규성 검정 검정 통계량 p-값 Shapiro-Wilk W 0.987883 Pr < W 0.5296 Kolmogorov-Smirnov D 0.058567 Pr > D >0.1500 Cramer-von Mises W-Sq 0.041021 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.289186 Pr > A-Sq >0.2500 < 표 6> 샤 피 로- 윌 크 (SW)의 p-value값이 0.529 > 0.05 이므로 귀무가설을 기각하지 못 하여 표본평균과 모평균이 같다. 즉, 정규분포를 하고 있음을 보 여준다. 4 오차항의 자기상관 제거 회귀모형의 분석 결과 자기상관이 존재하면 선형회귀모형의 모수의 추정 량이 불편성과 일치성이 보장되더라도 효율성이 떨어진다. 김종서.2008. sas v8.2를 이용한 통계분석의 이해 오 차항 의 자 기상 관 발 생 원 인 과 제 거 방법은 다음과 같다. - 오차항의 자기상관 발생원인 모형의 설정시 자기상관이 있는 변수가 생략되면 그 영향이 오차항에 반영되어 오차항 값에 자기상관이 있게 된다 모델의 수학적 형태 설 정에 잘 못이 있 을 때, 예로 X, Y변 수가 선 형관 계인데 비선형으로 분석하게 되면 자기상관이 발생한다. 실제 오차항에 대한 설정오류가 있는 경우(예, 전쟁 파업 등) 그 영향 이 지속적으로 나타나게 되면 자기상관이 발생한다. 모형에 시차( 時 差 ) 가 존재하는 경우도 자기 상관이 발생할 수 있다. - 11 -

시계열자료에서 자기상관이 주로 발생하게 된다 - 자기상관의 제거 방법 Cochranc-Orcutt 반복추정법, Durbin-Watson d 통계량에 근거한 이용법 Durbin의 2단추정법, Paris-Winston의 2단추정법(Yule-Walker = YW법) 일반화최소자승(GLS)법, 최우추정(ML)법,비조건부최소자승(ULS)법, 가능일반화최소자승(FGLS)법, Hildreth-Lu법, 조건부최소자승(CLS)법 위에서 나열한 자기상관 제거 방법에 대한 설명은 본고에서 생략하기로 하 며, Paris-Winston의 2단추정법(Yule-Walker = YW법), 최우추정(ML)법, 비 조건부최소자승(ULS)법을 사용하여 오차항의 자기상관을 제거하고자 한다. <표 7> 전방예측) 자기상관 제거 결과 검정 YW법( 1) Y W법( 2) ML법 ULS법 SSE(오차자승합) 372.341286 344.32651 371.89869 371.86698 MSE(평균오차자승합) 4.54075 4.25094 4.53535 4.53496 SBC(BIC) 베이지안정보판단기준 4 66. 97 1705 4 64. 16407 466.9 0265 466.9 1102 AIC Akaike정보판단기준 43 1. 0708 3 425.69885 431.00178 431.01014 Reg-RSq(회귀결정계수) 0. 8 23 0. 8 15 5 0. 8 23 2 0. 823 3 Total-RSq(총결정계수) 0.8911 0.8993 0.8913 0.8913 Durbin-Watson 통계량 2. 2196 1.8754 2.2696 2.2865 자기상관 판단 미정 자기상관없음 미정 미정 자기상관을 제거한 모형의 선택 방법은 SSE(오차자승합), MSE(평균오 차자승합), SBC(베이지안정보판단기준), AIC(Akaike정보판단기준) 값이 낮아야 하고 Reg-RSq(회귀결정계수), Total-RSq(총결정계수) 값이 큰 모 형을 선택하되 더빈-왓슨(DW)통계량이 2 값에 근사하는 모형을 선택하 여야 한다. =0. 01수준하에 n= 9 6 k= 12의 d L =1.272, d U =1.82, 4-d U= 2. 18 이므 로 Y W 법( 2)만 자기상관없음 이라고 할 수 있다. 따라서 YW법( 2)을 선택하기로 한다. - 12 -

따라서 추정회귀식은 다음과 같이 나타낸다. 일반적인 추정값 표현식인 를 사용하지 않고 형태로 표현 한 것은 차분 에 대한 수치가 프 로그램 상 들 어 있기에 회귀 계수만 으로 예 측값을 추정 할수 없다 는 점으로 표현하기 위함이다. 식 ( 5)에 대한 2005년1월~12월 객실사용률에 대한 예측값은 다음과 같다. <표 8> 전방예측) 객실사용률 전방예측 값 월 1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월 추정값 46.1 49.8 49.8 53.7 52.8 52.4 54.5 60.8 51.9 59.4 55.5 51.6 2) 객실사용률 후방예측(forecasting) (1) 월별 계절성 더미변수를 활용한 모형 검정 앞 절에서 예측한 객 실사용 률을 포 함하여 2014 년 1월~12월 까지 객실 사용 률을 예측하고자 한다. 예측방법은 전방예측과 동일한 방법으로 모형 검 정, 오차항 가정 검정 순으로 처리하고자 한다. 이미 앞에서 계절성이 존 재하고 월별 계절성이 설명력이 높다라는 것이 (표 3)에서 나타났으므로 모형은 월별 계절성 더미변수가 포함된 모형을 선택하고자 한다. 모형에 대한 검정 결과 유 의확률 이 0. 0001보다 작 아 유의 수준 0. 01에서 귀무가설을 기각하고 대립가설을 선택할 수 있다. 설명력을 나타내는 수 정결정계수는 0.8271 수준으로 높은 편이다. (2) 선택된 모형의 오차항 검정 1 오차항의 등분산 검정 오차항의 등분산 검정을 위한 가설은 다음과 같다 - 귀무가설:, - 대립가설: - 13 -

< 표 9> 후 방예측) 카이제 곱 검정 Test of First and Second Moment Specification DF Chi-Square Pr > ChiSq 24 30.98 0.1543 <표 9> χ 2 검정값이 30.98 < χ 2 (24, 0.05 ) = 3 6.4 15 이고 유 의확률 이 0. 05 보 다 큰 0.1543이므로 분산이 같다 라는 귀무가설을 기각할만한 이유가 없 는 것으로 판단할수 있다. 즉 오차항간의 분산이 95%신뢰수준하에 동일 하다라고 할 수 있는 것이다. 2 오차항의 독립성 검정 더빈-왓슨(DW) 검정 통계량을 사용하여 독립성 검정을 시행하였다 <표 10> 후방예측) 더빈-왓슨 통계량 Durbin-Watson D 0.702 Number of Observations 108 1st Order Autocorrelation 0.633 <표 10>더빈-왓슨(DW) 검정통계량이 0.702으로 기준값 2와는 거리가 멀 어 오차항들이 관련성이 없다 고 할 수 없다. 또한 값보다 작은 값으 로 양의자기상관을 가지고 있다고 할 수 있으며 독립성 가정은 위배 된다. 3 오차항의 정규성 검정 오차항에 대한 정규성 검정은 앞절처럼 샤피로-윌크(Shapiro-Wilk) 검정 의 통계량들을 통해 살펴보고자 한다. <표 11> 후방예측) 정규성 검정 검정 통계량 p-값 Shapiro-Wilk W 0.990591 Pr < W 0.6624 Kolmogorov-Smirnov D 0.04906 Pr > D >0.1500 Cramer-von Mises W-Sq 0.041956 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.285854 Pr > A-Sq >0.2500 < 표 11> 샤 피 로- 윌 크 (SW)의 검정 결과가 p-val ue 0. 6624 > 0.05 이므로 귀 무가설을 기각하지 못 하여 표본평균과 모평균이 같다. 즉, 정규성은 만족 되었 다. - 14 -

4 오차항의 자기상관 제거 회귀모형의 분석 결과 자기상관이 존재하여 앞절처럼 자기상관의 제거 방 법을 이용하고자 한다. Paris-Winston의 2단추정법(Yule-Walker = YW법), 최우추정(ML)법, 비 조건부최소자승(ULS)법을 사용하여 오차항의 자기상관을 제거하고자 한다. <표 12> 후방예측) 자기상관 제거 결과 검정 YW법( 1) Y W법( 2) ML법 ULS법 SSE(오차자승합) 373.72005 344.31498 373.37978 373.35503 MSE(평균오차자승합) 3.97575 3.70231 3.97213 3.97186 SBC(BIC) 베이지안정보판단기준 506. 62066 5 02. 58 993 506.5 6161 506.5 689 4 AIC Akaike정보판단기준 469.07083 4 62. 35 796 469.0117 7 4 69. 0191 Reg-RSq(회귀결정계수) 0. 84 23 0.8349 0.8422 0.8421 Total-RSq(총결정계수) 0. 9102 0.9173 0.9103 0.9103 Durbin-Watson 통계량 2. 29 16 1.9378 2.3388 2.355 자기상관 판단 미정 자기상관없음 미정 미정 = 0. 01수 준하 에 n=108 k=12의 d L =1.319, d U =1.813, 4-d U= 2. 187이므로 YW 법( 2)만 자기상관없음 이라고 할 수 있다. 따라서 YW법( 2)을 선택하 기로 한다. 따라서 추정회귀식은 다음과 같이 나타낸다. 식 (6)에 대한 2014.1. ~12. 객 실사용 률에 대한 예측값 은 다 음과 같다. <표 13> 후방예측) 객실사용률 후방예측 값 월 1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월 추정 값 56.8 61.0 61.5 65.8 65.3 65.2 67.5 74.1 65.4 73.1 69.5 65.4-15 -

제 3 장 호텔산업 경기동향 모형 예측 제 1절 호텔산업 예측 모형의 변수 정의 1. 종속변수 및 설명번수 호텔산업의 경기동향을 예측하기 위해 앞장에서 제시한 설명변수를 이용 하여 반응변수에 대한 다중회귀식 모델을 찾아보고자 한다. <표 14> 종속변수 및 설명변수 정의 종 속 변 수 호텔산업 변 수 명 index 설 명변 수 변 수 명 설 명변 수 변 수 명 설 명변 수 변 수 명 객실사용률 Activity 외국인입국자 (일본) In_Jan 외국인입국자 (중국) In_Chi 외국인입국자 (미국) In_Usa 외국인입국자 (대만) In_Tai 외국인입국자 (전체) IN_Total 관광수입 Income 환율(엔화) Jpy 환율(위엔) Cny 환율(달러) Usd 호텔산업의 종속변수인 Index는 통계청 서비스업동향조사에서 공표하고 있는 호텔업 서비스업생산지수(경상지수)이며 외국인 입국자는 목적별 분류 중 관광 으로 분류된 외국인 입국자이며 전체 관광객중 어느 정도 비중이 있는 4개국과 4개국의 관광객 인원을 제외한 전체 외국인 관광객 입국자로 분류하였다. 또한 환율은 4개국과 관련이 있는 달러, 엔화, 위엔에 대해 3개 변수로 지정하였다. 따라서 전체모델(FULL-MODEL)은 다음과 같이 표현한다. I n d e x =α+a c t i v i t y +i n _ j a n +i n _ c h i +i n _ u s a +i n _ t a i +i n _ t o t a l +i n c o me +u s d +j p y +c n y ( 7 ) - 16 -

제 2절 호텔산업 경기동향 모형 예측 1. 설명변수 검정 1) 상관성 검정 설명변수 중 회귀모형에 적합한 모형(변수)선택 하기에 앞서 반드시 상관분 석과 공선성 분석이 선행되어야 한다. 회귀 적합이 잘 이루어지려면 종속변수 와 설명변수들 간에 상관도가 높아야 한다. <표 15> 피어슨 상관계수 activity in_jan in_chi in_tai in_usa in_total income usd jpy cny index 0.78042 0.43367 0.75125 0.74963 0.58237 0.90702 0.85584 0.28493 0.48198 0.67305 P rob <.0001 <. 0001 <. 0001 <.0001 <. 0001 <. 0001 <.0001 0. 0016 <. 0001 <. 0001 <표 15 > 설명변수 중 USD 변수를 제외하고 유의확률이 0. 0001보다 작은 값을 가지므로 상관관계가 있다 라고 할 수 있다. 그러나 일반적으로 상관계수가 0.1보 다 크고 0.3보다 작을 때( 0.1 r 0.3 ) 약한 양의 상관이 존재하는 것으로 인식되고 있어 이 본고에선 유의확률이 0.0016이지만 USD 변수는 상관계수가 0.28493이므로 상관성이 작다 라고 판단하여 제외하고자 한다. 2) 다중 공선성 검정 종속변수와 설명변수간의 상관성은 높아야 되지만 설명변수들 사이에는 상관 도가 낮아야 한다. 만약 설명변수들 사이에 상관도가 높다면 적합된 회귀모형 의 해석에 큰 문제가 생긴다. 이와 같이 설명변수들 사이에 서로 강한 상관관 계가 존재하는 현상을 변수들 사이에 (다중)공선성이 존재한다 라고 한다. 따 라서 회귀모형의 설명력을 높이기 위해 공선성을 제거해야 하는데 김종 서.2008. sas v8.2를 이용한 통계분석의 이해 에서 제시하는 방법 중 변수 간 선형관계가 큰 변수를 제거한다 라는 방법을 선택하여 분산팽창요인(VIF)에 서 공선성이 높다 라고 판단되는 변수에 대해선 변수간 상관도를 참조하여 제 거하는 방식으로 공선성을 제거 하고자 한다. 공선성 판단 기준으로는 분산팽창요인(VIF: variance inflation factor)과 허용 - 17 -

도(TOL : tolerance)가 있으며, 분산팽창요인(VIF)이 10.0 이상이거나, 허용도 (TOL)가 0.1 이하이면 공선성이 존재 한다고 판단한다. <표 16> 설명변수간 분산팽창요인 및 허용도 변수 추정계수 추정오차 Tolerance Variance Inflation 상수(절편) -4.75562 10.01296. 0 a c ti v i t y 0. 755 83 0. 19128 0.3 107 3 3. 218 26 i n _j an 0. 053 12 0. 025 85 0.3 034 3 3. 295 62 i n _ ch i 0. 015 84 0. 015 84 0.11163 8.95833 i n _t ai - 0. 015 08 0. 15131 0.2008 2 4. 979 65 i n _ u s a - 0. 234 27 0. 1091 0.5 089 4 1. 964 86 i n _ to t a l 0. 298 94 0. 0296 0.1757 6 5. 689 65 i n co m e - 0. 000003 42 0. 000005 94 0.10266 9.74133 j p y 0. 0036 0. 008 96 0. 09 9 10. 10098 cn y 0. 07259 0. 08061 0.1015 9 9.84385 <표 16> 변수 jpy(환율_엔화)은 분산팽창요인이 10.0 이상이고 income(관광수 입), cny(환율_위엔)의 분산팽창요인이 9.0 이상인 것을 알 수 있다. 즉 jpy(환 율_엔화) 변수는 공선성이 존재한다는 것이다. 다만, 분산팽창요인이 9.0 이상인 income(관광수입), cny(환율_위엔) 변수는 위험변수로 지정하고자 한다. <표 17> 설명변수간 상관계수 변수 절편 activity in_jan in_chi in_tai in_usa in_total income jpy cny 절편 1-0.68 28 0.0031 0. 3 905-0. 293 5-0. 09 8 6 0. 065 8 0.24 89 0.4 3 22-0.5 3 28 activit y -0. 68 28 1-0.3 3 24-0. 2163-0. 1016-0. 28 5 5-0. 0205-0.0029-0. 077 0.0183 in_jan 0.0031-0.3324 1 0.1499 0.007 0.0424-0.0036-0.1758-0.5648 0.3308 in_ ch i 0. 39 05-0.2163 0.14 99 1-0. 6207-0. 05 04-0. 04 4 6-0.4 047 0.3 215-0.1277 in_ ta i -0. 29 3 5-0.1016 0. 007-0. 6207 1 0. 109 6-0.19 8 0. 062-0.25 73 0.2007 in_ usa -0. 09 8 6-0.28 55 0.04 24-0. 0504 0. 109 6 1-0.3 13 0.0019-0.0148 0.05 24 in_total 0. 065 8-0.0205-0.0036-0. 044 6-0. 19 8-0.3 13 1-0.4 5 64 0.0626-0.0099 income 0. 24 8 9-0.0029-0.17 58-0. 4 04 7 0. 062 0. 0019-0. 45 64 1 0.1249-0.4475 jpy 0. 43 22-0. 077-0.5 648 0. 3 215-0. 257 3-0. 014 8 0. 0626 0.1249 1-0.813 cny -0. 53 28 0.0183 0.3 3 08-0. 127 7 0. 2007 0. 05 24-0. 009 9-0.4475-0.813 1-18 -

분산팽창요인이 10.0 이상인 변수들간(jpy&cny)의 상관계수는 -0.813 이며 분산팽창요인이 9.0 이상인 변수들간(income&cny)의 상관계수는 -0.4475 이 다. 여기서 변수 cny가 공통적으로 관련을 하고 있다. 따라서 jpy, income 변 수가 아닌 cny 변수를 제거 후 공선성 검정을 재확인 하고자 한다. cny 변수 제거 후 분산팽창요인(VIF)이 10.0 이상인 변수는 없었다. 다 만, i n_ chi 변 수의 분산팽 창요인 8. 8 1226 이고, i n_ ch i& in _ ta i 상관계 수는 - 0.6124 로서 위 험 변수에 근 접하고 두 변 수의 상관 성이 높다 고 판단하 여 in_chi 변수와 in_tai 변수 중 하나의 변수만 제외하고자 한다. 그 변수 는 in_tai 변수이며 제외된 이유는 외국인 입국자 구성비 중 in_tai 변수가 in_chi 변수 보다 비중이 낮기 때문이다. 또다시 in_tai의 입국자 수를 in_total 변수에 합한 후 분산팽창요인(VIF)은 모든 변수가 8.0 이하였다. 최종적으로 다중공선성 검정에서 cny 변수와 in_chi 변수가 제외되고 activity, in_jan, in_chi, in_usa, in_total, jpy, income 등 7개 설명변수만 남게 되었다. 3 ) 모형(변수) 선택 모형(변수) 선택의 필요성에 대해 성내경저. sas/stat 회귀분석 반응변수의 원인이 될 만한 회귀변수들의 수는 적지 않을 것이며 이들 가운데 반응변수의 변화 유형을 가장 잘 설명할 수 있는 최소 개수의 회귀변수들을 추리는 것이 경제적이 통계분석일 것이다 라고 말하고 있다. 지금까지 알려진 최적 모형선택방법 중 후방소거법(BACKWARD), 전방선 택법(FORWARD), 단계별회귀법(STEPWISE), 조정 선택법(ADJRSQ), 맬 로우스의 선택법(CP) 등이 있으며 본고에선 이들 선택법을 사용하여 공통 적으로 선택된 변수를 사용하고자 한다. 또한 전방선택, 후방소거, 단계별회귀 등에서 최적으로 판정한 모형이더라도 만일 맬로우스의 값이 최적이 아니 면 추측 능력 면에서 좋은 모형이라 할 수 없기에 맬로우스의 선택법에 무게를 두고 변수를 선택하고자 한다. - 19 -

(1) 전방선택, 후방소거, 단계별 회귀법 결과 상관성과 다중공선성 검정을 거치고 남은 7개 설명변수에 대해 변수 선택법을 진행하고자 한다. 1 전방선택법(FORWARD) 전방선택법(FORWARD)은 변수가 모형에 하나씩 들어오면서 추가되는 설명력 인 Partial R-Square에 의해 선택되고 있다. 즉, 설명력 증가분에 대한 유의성 검정을 위한 통계량이 F Value 값에 의해 결정된다. 결론적으로 Pr > F 의 값이 0.25 ~ 0.5 보다 작으면 전방선택법에 의해 모형에 들어온다고 일반적으 로 보고 있다. <표 18> 전방선택법 Step Variable Number Partial Entered Vars In R-Square R-Square Model C(p) F Value Pr > F 1 in_total 1 0.8279 0.8279 72.0714 567.8 <.0001 2 in _j a n 2 0. 04 99 0. 87 78 19. 53 69 47. 78 <. 0001 3 ac t ivit y 3 0. 0124 0. 89 03 7. 94 85 13. 14 0. 0004 4 jpy 4 0.004 0.8943 5.5876 4.34 0.0395 5 in_usa 5 0.0031 0.8974 4.1487 3.5 0.0641 <표 18> 전방선택법에 의해 선택된 변수는 in_total, activity, jpy, in_jan, in_usa로 총 5개가 선택되었다. 제외 된 변수는 i n _ c h i, i n c o m e 등 2개 설 명 변수이다. 2 후방소거법(BACKWARD) 후방소거법은 완전 모형에서 값을 기준으로 회귀적합에 가장 기여도가 낮은 회귀변수부터 차례로 소거해 나가는 방법이다. 변수 선택의 유의수준이 일반적으로 0.1 이하이면 선택 된다. 즉, 0.1 이상이면 제거가 된다. <표 19>후방소거법에 의해 제외된 변수 Step Variable Number Partial Removed Vars In R-Square R-Square Model C(p) F Value Pr > F 1 in_chi 6 0 0.8975 6.0199 0.02 0.8881 2 income 5 0.0001 0.8974 4.1487 0.13 0.7191-20 -

<표 20> 후방소거법에 의해 선택된 변수 Variable Parameter Estimate Error Standard Type II SS F Value Pr > F Intercept -4.52118 7.5861 19.86336 0.36 0.5524 a ct i v i ty 0.7 126 0. 178 9 887.28763 15. 87 0. 0001 in_jan 0.04212 0.02389 173.83376 3.11 0.0806 in_usa -0.20242 0.10827 195.48813 3.5 0.0641 i n _t o t al 0. 28 059 0.0169 5 15318 273. 91 <. 0001 jpy 0.00902 0.00459 216.49664 3.87 0.0515 <표 19> 후방소거법(BACKWORD)에 의해 제외된 변수들이며 in_chi, i n c o m e 등 2개 설 명변 수 이다. <표 20> 후방소거법에 의해 제외된 후 남은변 수들이다. in_total, activity, jpy, in_jan, in_usa로 총 5개의 설명변수들이다 3 단계별회귀법(STEPWISE) 단계별회귀법(STEPWISE)은 전방선택법에 후방소거법의 개념이 추가 된 것이 며 전방선택법과 차이는 모형에 선택 된 변수도 다시 제거 될 수 있다는 것이다. <표 21> 단계별 회귀법 Step Variable Variable Number Partial Model F C(p) Entered Removed Vars In R-Square R-Square Value Pr > F 1 in _ t ot a l 1 0.8 279 0. 8279 72. 07 14 567. 8 <. 0001 2 in_jan 2 0.0499 0.8778 19.5369 47.78 <.0001 3 ac t ivi ty 3 0.0124 0. 89 03 7. 94 85 13.14 0. 0004 4 j py 4 0. 004 0. 89 43 5. 58 76 4.3 4 0. 039 5 5 in_usa 5 0.0031 0.8974 4.1487 3.5 0.0641 <표 21> 단계별회귀법에서도 전방선택법, 후방소거법과 동일하게 in_total, activity, jpy, in_jan, in_usa 등 5개 변수를 선택하였으며 in_chi, income 등 2개 설명변수는 제외하였다. (2) 조정된 선택법(ADJRSQ), 맬로우스의 선택법 지금까지는 최종 모형이 하나만 출력되는 변수 선택법을 사용했다면 조정된 - 21 -

선택법(ADJRSQ)과 은 맬로우스의 선택법은 모형에 포함되는 설명변수 의 개수별로 최상이라고 생각되는 모형들을 출력하는 방법이다. 1 조정된 선택법(ADJRSQ) 값은 모형에 회귀변수를 더 많이 추가할수록 점점 증가한다. 그러나 값이 단순히 크다고 해서 반드시 좋은 모형은 아니다. 따라서 회귀변수를 모형에 추가하더라도 반드시 그 값이 증가하지 않게끔 변형된 을 생각하면 되는데 그것이 조정된 선택법이다. 조정된 값이 큰 값부터 내림차순으로 모형 을 포함하여 정렬되어 있다. < 표 22> 조 정된 선택법 Number Adjusted in Model R-Square R-Square Variables in Model 5 0.8929 0.8974 activity in_jan in_usa in_total jpy 6 0.8921 0.8975 activity in_jan in_usa in_total income jpy 6 0.892 0.8974 activity in_jan in_chi in_usa in_total jpy 7 0.8911 0.8975 activity in_jan in_chi in_usa in_total income jpy 4 0.8909 0.8946 activity in_usa in_total jpy 4 0.8906 0.8943 activity in_jan in_total jpy 4 0.8902 0.8939 activity in_jan in_usa in_total <표 22> 전체 변수 선택 모델 중 상위(조정된 값의 내림차순) 7개의 모 형만 제시하고자 하며 전방선택, 후방소거, 단계적회귀법에서 선택한 변수들을 참고하여 결정하고자 한다. 조정된 결정계수가 가장 높은 첫 번째 모형은 조 정된 값이 0.8929 이며 in_total, activity, jpy, in_jan, in_usa 등 5개 설명변 수를 선택하여 앞의 변수 선택법과 동일한 결과를 보인다. 2 맬로우스의 선택법 앞에서도 언급했듯이 최적 모형으로 판정되었더라도 값이 최적이 아니면 추측 능력 면에서 좋은 모형이라 할 수 없다고 하였다. 따라서 맬로우스의 값에 무게를 두고 최종적인 변수를 선택하고자 한다. - 22 -

7(r=7)개의 설명변수에 상수항을 포함하여 p의 값의 8이 되며 기준에서는 값이 p보다 크면 편향이기 때문에 p인 모형은 일단 고려 대상에서 제외된다. 따라서 값이 작음과 동시에 설명변수를 줄이기 위해 가급적 p가 작은 모형을 찾아야 한다 <표 23> 맬로우스의 선택법 Number in Model R-Square Variables in Model 5 4.1487 0.8974 activity in_jan in_usa in_total jpy 4 5.2067 0.8946 activity in_usa in_total jpy 4 5.5876 0.8943 activity in_jan in_total jpy 4 5.9572 0.8939 activity in_jan in_usa in_total 6 6.0199 0.8975 activity in_jan in_usa in_total income jpy 6 6.1468 0.8974 activity in_jan in_chi in_usa in_total jpy 3 6.8085 0.8913 activity in_total jpy <표 23> 기준에서 =4.1487이며 R-Square=0.8974인 모델을 선택할 수 있다. 선택된 변수는 in_total, activity, jpy, in_jan, in_usa 등 5개 설명 변수이다. 본고에서 실행한 5가지 변수 선택법에서 공통적으로 in_total, activity, jpy, in_jan, in_usa 등 5개 설명변수를 선택하고 in_chi, income 등 2개의 설명변수를 제외하였다. 최종적인 변수 선택에서 in_chi 변수가 제거 됨에 따라 중국인 입 국자를 버리지 않고 전체 입국자인 in_total 변수에 합산 후 선택된 5개 (i n _ t o t a l, a c t i v i t y, j p y, i n _ j a n, i n _ u s a ) 변수만을 가지고 변수 선택을 다시 하고자 한다. 변수 선택에 앞서 공선성 검정에선 분산팽창도가 모두 5.0(기준값 10.0) 이하 의 값으로 변수간 상관성이 작았으며 5개 변수 선택법에선 in_usa 변수를 제 거하고 4개 변수를 선택하였다. 또 다시 미국인 입국자를 전체 입국자인 in_total 변수에 합산 후 4개(i n _ t o t a l, a c t i v i t y, j p y, i n _ j a n ) 변수만을 가지고 변수 선택을 실행하였다. - 23 -

공선성 검정에선 허용도가 모두 3.0(기준값 10.0) 이하의 값으로 변수간 상관 성이 작았으며 모든 선택법에서 i n _ t o t a l, a c t i v i t y, j p y, i n _ j a n 등 4 개 의 설 명변 수 를 최종적으로 선택하였다. 2. 호텔산업 경기동향 모형 회 귀 분 석 1) 최종 모형 에 대한 회 귀분석 상관분석, 공선성검정, 모형(변수)선택법 등을 거치면서 10개의 설명변수가 최종적으로 4개 설명변수만 남게 되었다. 호텔산업 경기동향 모형에도 객실사용률 예측 모형처럼 월별 더미변수를 포 함하기 위해 계절성 여부를 판단하여야 한다. 그림3) Index(종속변수)의 월별 그래프 객실사용률에선 X - 13 A R I M A - S E A T S 프 로그램 을 통 해 계 절 성 을 알 아 보 았지만 종속변수인 index는 (그림 3) 그래프의 패턴만으로도 계절성이 있 다 는 것 을 알 수 있 다. 따 라 서 최종적인 모형에는 제2장 전방예측과 동일하 게 월별 더미변수를 포함한 다중회귀모형을 예측하고자 한다. 월별 더미변수를 포함한 다중회귀모형의 검정 결과 유의확률이 0. 0001보다 작은 값으로 유의수준 0.01에서 귀무가설을 기각하고 대립가설을 선택하였 다. 즉 전체 모형에서 설명변수 는 유의한 수준에 있다는 것이다. 또한 설명력을 나타내는 수정결정계수는 0.9102 수준으로 매우 높았다. - 24 -

<표 24> 호텔산업 경기동향 모형 회귀계수 및 표준화 회귀계수 변수 회귀계수 T_통계량 유의확률 표준화회귀계수 상수(절편) - 4. 84 978-0. 4 0. 688 8 0.00000 activity 1. 15 678 4.04 0. 0001 0.3 2307 in_jan 0. 104 09 3.5 3 0. 0006 0.2177 0 in_total 0. 07 287 11. 92 <. 0001 0.6074 4 jpy 0.00404 0.75 0.4556 0.04267 i1-10. 044 44-3.02 0. 003 1-0. 1220 i2-22.72127-7.37 <.0001-0.27598 i3-21.78584-6.29 <.0001-0.26461 i4-23. 1767 8-7.4 4 <. 0001-0.2815 1 i5-15. 0427 8-4.8 6 <. 0001-0.1827 1 i6-20. 2224 8-6.5 4 <. 0001-0.24563 i7-25.0186-7.95 <.0001-0.30388 i8-28. 22615-7. 3 <. 0001-0.3 428 4 i9-23.57475-7.49 <.0001-0.28634 i10-22.327 76-6.21 <.0001-0.27120 i11-16. 95616-5.14 <. 0001-0.2059 5 <표 24> 오차항의 검정 전 모형에 대한 표준화 회귀계수이다. 표준화 회귀계 수에 대해 성내경저. sas/stat 회귀분석 반응변수와 회귀변수들 각각에 대하 여 자신의 평균을 빼고 표준편차로 나누는 표준화 변환을 시행한 후 변환된 자료를 기초로 회귀선을 적합하여 얻는다 라고 말하고 있다. 즉 단위가 다른 설명변수들의 중요도를 비교할때는 표준화 하여 상대적 중요도를 봐야 한다는 것이다. 회귀계수에선 객실사용률 설명변수가 다른 변수보다 종속변수에 대한 중요도가 높고 다음으로는 전체 외국인 관광객 입국자보다 일본인 관광객 입국자가 종 속변수에 대한 중요도가 높게 나온다. 그러나 표준화 회귀계수를 보면 외국인 관광객 입국자가 종속변수에 대한 상대적 중요도가 가장 크게 나오며 다음으 로 객실사용률이다. 즉, 회귀계수 값을 이용해 종속변수에 대한 중요도 설명을 마치는 것이 아니라 표준화 회귀계수 값을 이용한 종속변수에 대한 중요도 설 명이 필요하다는 것이다. - 25 -

2) 오차항 검정 1 오차항의 등분산 검정 오차항의 등분산 검정을 위한 가설은 다음과 같다 귀무가설:, 대립가설: < 표 25> 호텔산업 경기동향 모형 카 이제 곱 검 정 Test of First and Second Moment Specification DF Chi-Square Pr > ChiSq 14 67.55 0.527 <표 25> 카이제곱 검정값이 67.55이고 유의확률이 0.05보다 큰 0.527이 므로 분산이 같다 라는 귀무가설을 기각할만한 이유가 없는 것으로 판단 할수 있다. 즉 오차항간의 분산이 95%신뢰수준하에 동일하다라고 할수 있는 것이다. 2 오차항의 독립성 검정 오차항의 독립성 검정은 앞절처럼 더빈-왓슨(Durbin-Watson) 검정통계 량을 사용하고자 한다. <표 26> 호텔산업 경기동향 모형 더빈-왓슨 통계량 Durbin-Watson D 0.623 Number of Observations 120 1st Order Autocorrelation 0.676 <표 26> 더빈-왓슨(DW) 검정통계량이 0.623으로 기준값 2와는 거리가 멀어 오차항들이 관련성이 없다고 할 수 없다. 또한 값보다 작은 값으 로 양의자기상관을 가지고 있다고 할 수 있으며 독립성 가정은 위배 된 다. 따라서 모형을 새롭게 선정하거나 자기상관을 제거해야 한다. 3 오차항의 정규성 검정 오차항에 대한 정규성 검정은 앞절처럼 샤피로-윌크(Shapiro-Wilk) 검정 의 통계량들을 통해 살펴보고자 한다. - 26 -

<표 27> 호텔산업 경기동향 모형 정규성 검정 검정 통계량 p-값 Shapiro-Wilk W 0.991154 Pr < W 0.6409 Kolmogorov-Smirnov D 0.057403 Pr > D >0.1500 Cramer-von Mises W-Sq 0.045094 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.28056 Pr > A-Sq >0.2500 < 표 27 > 샤 피 로- 윌 크 (SW)의 검정 통계결과가 P-value 0.6409 > 0.05 이므 로 귀무가설을 기각하지 못 하여 표본평균과 모평균이 같다. 즉, 정규분포를 하 고 있음을 보여준다. 4오차항 자기상관 제거 회귀모형의 분석 결과 자기상관이 존재하여 앞절처럼 Paris-Winston의 2 단추정법(Yule-Walker = YW법), 최우추정(ML)법을 사용하여 오차항의 자 기상관을 제거하고자 한다. <표 28> 호텔산업 경기동향 모형 자기상관 제거 결과 검정 YW법(시차1) YW법(시차2) ML법 SSE(오차자승합) 2412.515 2413.0047 1891.9391 MSE(평균오차자승합) 23.42248 23.65691 18.36834 SBC(BIC) 베이지안정보판단기준 7 82. 65 565 787.4 674 9 756.3 169 AIC Akaike정보판단기준 735.26829 737.29264 708.92954 Reg-RSq(회귀결정계수) 0.8531 0.8532 0.8567 Total-RSq(총결정계수) 0.9612 0.9612 0.9696 D ur bin - Wa t so n 통계량 1.8 127 1. 813 6 2. 23 68 자기상관 판단 미정 미정 미정 α = 0.01 수준에서 n=120, k=15일 때 d L =1. 3006, d U =1.8758, 4-d U= 2.1242 이므 로 3가지 모든 방법이 자기상관을 완전히 제거하지 못한 미정 판단을 받았다. 하지만 d U 값에 가장 근접하는 YW법( 1, 2) 중 DW값이 큰 차이가 없어 차 분 1인 YW( 1) 자기상관 제거법을 선택하기로 한다. - 27 -

따라서 추정회귀식은 다음과 같이 나타낸다. 2014 년 실측값과 예측값 의 차이는 다음과 같다. (8) <표 29> 2014년 실측값과 예측값의 차이 월 1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월 실측값 109. 6 106. 5 113. 8 115. 9 123. 5 116. 7 118. 0 133. 7 123. 0 139. 4 127. 9 151. 7 예측값 114. 3 101. 6 121. 4 123. 4 123. 8 119. 8 122. 7 130. 3 119. 6 140. 9 129. 4 138. 9 차이 -4.7 4.9-7.6-7.5-0.3-3.1-4.7 3.4 3.4-1.5-1.5 12.8-28 -

제 3 절 전방예측 없는 객실사용률 후방예측 1. 객실사용률 후방예측(forecasting) 호텔산업 경기동향 모형 예측에 앞서 자 료의 크 기를 맞 추기 위 해 제 2장 에선 객실사용률의 전방예측 시행 후 그 값을 포함하여 후방예측을 시행 하였다. 그렇다면 n=96(월단위)이며 어느 정도 크다 고 판단될 때 전방예 측이 필요한가에 대해 논의 해 볼 필요성이 있다고 판단되었다. 따라서객 실사 용률의 전방 예측 후 호텔산업 경기예측 모형 을 모형 1 라하고 객실 사 용률 전방 예측 없이 호텔산업 경기예측 모형 을 모형2 라 정의하 고 모형1 과 모형2의 후방 예측값 을 비 교하고 자 하 며 또 한 호텔산업의 2014 년 경기 동향 예측값 비교를 통해 전방 예측 필요성에 대해 알아보고자 한다. 제2장과 동일하게 월별 계절성 더미변수를 포함한 모형의 검정 결과는 유의 확률( p-va lue ) < 0. 0001 로서 모형은 적합판 단을 받았으나 오 차항의 검정 중 더빈-왓슨통계량이 0.695로서 독립성 가정이 위배되어 자기상관 을 제거하였다. 제거방법은 =0.01 수준하에 YW( 2) 자 기상관 제거법 이 선택되었으며 그에 따른 후방예측값은 다음과 같다. <표 30> 모형 1과 모형 2의 후 방예측값 비교 월 1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월 모형1 56.8 61.0 61.5 65.8 65.3 65.2 67.5 74.1 65.4 73.1 69.5 65.4 모형2 56.8 61.0 61.5 65.8 65.3 65.2 67.5 74.1 65.4 73.1 69.5 65.4 차이 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 <표 30> 두 개의 예측값의 차이를 보면 소수점 두자리 이하에선 차이가 발생했으나 소수점 한자리에선 차이가 없는 것으로 나타나고 있다. 본고 에서는 round 한자리를 사용하기에 추정값은 동일하다고 하겠다. - 29 -

2. 호텔산업 경기동향 모형 예측 호텔산업 경기동향 모형 예측에 사용되는 변수의 크기는 제3장과 달리 2005 년 자료가 없는 상태 에서 제3 장과 동일 하게 예측방 법을 진행하 였다. 피어슨 상관계수에 의해 제3장과 동일하게 usd 변수가 제거 되었으며 다 중 공선성 검정에서도 동일하게 cny 변수와 in_tai 변수를 제거 되었다. 1차 변수선택에선 전방선택법과 조정된 선택법(ADJRSQ)은 제 3 장 과 동일하게 in_total, in_jan, activity, in_usa, jpy 등 5개 설명변수를 선택하 였 으나 후 방 소 거 법 과 단 계 별 회 귀 법, 그리 고 맬로우스의 값의 첫 번째 모 델에서는 jpy 변수를 제외하고 4개의 설명변수만을 선택하였다. 추측 능력면에 서 좋은 모형을 선택하기 위해 맬로우스의 값 첫 번째 변수 선택에 무게를 두고 jpy 변수를 삭제함으로서 제3 장과 다른 모형을 선택하였다. 최종적으로 jpy, in_chi, income 변수를 제외 하였다. 2차 변수선택(in_chi 입국자를 in_total에 포함)에선 모든 선택법이 in_usa 변 수를 제외하고 i n _ t o t a l, i n _ j a n, a c t i v i t y 등 3 개 의 변 수 만 을 선 택 하 였 다. 3차 변수선택(in_usa 입국자를 in_total에 포함)에선 후방소거에선 a c t i v i t y 변수를 제외하였지만 다른 4가지 선택법이 in_total, in_jan, activity 변수 를 선 택 하 여 최 종 적 으로 선 택 된 변 수 는 제 3 장 과 달 리 jpy 변수를 제외한 in_total, in_jan, activity 등 3개의 설명변수가 선택되었다. 3개의 설명 변수에 월별 계절성 더미변수를 포함한 모형 검정은 모형이 유의한 수준에 있다 라는 결론은 내려졌으나 오차항 검정 중 독립성 가정 이 위배되어 자기상관을 제거하였다. 제3장과 동일하게 자기상관을 완전히 제거하지 못한 미정 판단을 받았다. 하지만 d U 값에 가장 근접하는 YW법( 1, 2) 중 DW값이 큰 차이가 없어 차분 1인 YW( 1) 자기상관 제거법을 선택 하였다. - 30 -

3. 두 모형의 비교 두 모형의 수정 결정계수 및 실측값과 예측값의 차이를 비교해보고자 한다. <표 31> 모형1과 모형2의 수정(or 총) 결정계수 모형1 모형2 Reg-RSq(회귀결정계수) 0.8531 0.8678 Total-RSq(총결정계수) 0.9612 0.9570 <표 31> 모형1보다 모형2의 총결정계수는 낮은 것을 볼 수 있다. 이것은 모형2와 달리 모형1에는 jpy 변수 하나 더 있기 때문이다. 하지만 변수 추 가와 관계없는 수정(회귀)결정계수를 보면 모형1보다 모형2가 조금 더 높 은 것을 알 수 있다. 두 모형의 수정결정계수 차이가 0.0147 이며 그 차이 가 크지는 않아 어떤 모형이 좋다 라고 판단하기는 어렵다. 다 음은 2014 년 실 측값& 모형1, 실측값&모형2 예측값의 결과 이다 <표 32> 2014년 실측값&모형1, 실측값&모형2 예측값과 차이 월 1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월 차이합 실 측 109.6 106. 5 113. 8 115. 9 123. 5 116.7 118.0 133. 7 123. 0 139. 4 127. 9 151.7 모형1 114.3 101. 6 121. 4 123. 4 123. 8 119.8 122.7 130. 3 119. 6 140. 9 129. 4 138.9 모형2 112.5 101. 5 121. 6 123. 6 125. 6 120.4 123.3 131. 5 120. 5 141. 1 130. 1 140.8 차이1-4.7 4.9-7.6-7.5-0.3-3.1-4.7 3.4 3.4-1.5-1.5 12.8 383.36 차이2-2. 9 5. 0-7.8-7. 7-2. 1-3. 7-5. 3 2. 2 2. 5-1. 7-2. 2 10.9 337.36 <표 32> 실측값과 모형1, 모형2의 예측값의 차이는 큰 차이를 보이고 있지 않다. 편차 제곱합( )의 결과 값을 비교하면 실측값&모형1 의 차이는 383.36 이고, 실측값과 모형2의 차이는 337.36 으로 통계적으로 는 실측값과 모형2의 예측값이 차이가 작다라고 할 수는 있지만 어느 모 형을 사용하더라도 무방할것으로 보인다. - 31 -

제 4 장 결 론 및 논 의 제 1절 1차 변수 선택 및 자료 보완 숙박산업의 경기동향 지표를 작성하는 지표들의 문제점을 해결하기 위해 월별 계절성 더미변수를 적용한 다중회귀모형을 예측하고자 하였다. 또한 숙박업과 관련 된 변수들을 수집하기에 앞서 전체적인 숙박업을 예측하기 보다는 숙박업 간의 관계성을 배제하기 위하여 숙박업 중 하나인 호텔업 을 선택하여 관련 된 변수를 수집하였다. 수집된 변수 중 자료의 수집 단 위 및 자료의 연속성 등을 고려하여 1차 변수를 선택하였으며 그 중 종속 변수와 크기를 맞추기 위하여 전방예측과 후방예측을 시행 하였다. 모형 예측시 시 간 의 변 수 만 을 고 려 한 것 이 아 니 라 월별 계절성 영향력이 있다고 판단하여 월별 계절성 더미변수를 적용하여 모형을 예측하였으며 그 결과 <표 3>처럼 수정결정계수 즉 설명력이 높아졌다. 다만 시계열의 자 료 로서 오차항의 자기상관이 존재하므로 자기상관을 제거해야 한다. 즉, 계절성 여부를 확인하여 월별 계절성 더미변수를 포함하여 설명력 을 높 일 필 요 성 이 있 다. (그림 4 ) 2005.01월 ~ 12월, 2014.01월 ~ 12월 의 패 턴이 다른 연도와 유사하다는 것을 알 수 있다. 그림 4) 전방 및 후방 예측 된 객실 사용률 - 32 -

제 2절 호텔산업 경기동향 모형 예측 1) 호텔산업 경기동향 모형 예측 1차적으로 선택된 변수를 이용하여 호텔산업 경기동향 모형을 예측하였 다. 설명된 변수들간의 관계성과 모형에 적합한 변수들을 선택하기 위해 다중공선성 검정과 변수 선택법을 시행하였다. 설명변수들이 월별 계절성 이 존재하여 더미변수를 포함하여 최종 모형을 예측하였다. 호텔산업에 경기동향 예측모형에는 i n _t ot a l, act i v i t y, i n_j a n, j py 등 4개의 설명변수와 월별 더미변수를 포함한 모형으로 수정결정계수가 0.8531 수준 으로 대략 85.3% 설명력을 가진다. 선택된 변수와 표준화 회귀계수를 보면 관광수입 등 다른 변수 보다는 외 국인 관광객 입국자와 객실사용률에 영향을 많이 받았다. 입국자 중에서도 다른 국적보다는 일본인 관광객 입국자가 호텔 경기동향에 영향을 미치는 것으로 나타났다. 향후 외국인 관광객 입국자와 일본 경기 및 정책( 엔저 )에 따른 일본인 관광 객들의 예측이 이루어 진다면 호텔 수급 결정에도 도움이 될 것으로 보인다. 호텔산업과 관련된 종사자들의 답변을 인용하며 호텔업 매출이 엔저 로 인해 일본 관광객들이 감소하여 매출이 안 좋다 라고 한다. 2) 전방예측 없는 객실사용률 후방예측 설명변수들의 무의미한 자료 손실을 방지하기 위해 전방 후방예측을 실 행하였다. 하지만 예측이라는 단어에서도 알 수 있듯이 예측은 오차를 가지 고 있다. 따라서 자료의 손실을 감수하더라도 전방예측을 하지 않고 후방예 측만을 한다면 어떤 결과가 나올지에 대해 모형2 예측을 실행하였다. 실측값과 모형1과 모형2 예측값과의 차이는 유사하게 나왔다. 즉, 자료의 크기를 예측을 통해 맞추거나 크게 한다고 하여 좋은 결과가 나오는 것은 아닌 듯 하다. 예측한 결과에 따른 예측 오차가 적합성을 떨어뜨릴수 있 다고 판단되며 어느정도 의 크기일 경우 자료 손실을 감수하더라도 시간 적 손실은 방지 될 것으로 보인다. - 33 -

제 3 절 한계점 및 향후 방향 호텔산업 경기동향 모형을 예측함에 첫 번 째의 한계점 은 예측 모형의 설 명력이 85% 수준으로 15% 정도는 설명할 수 없다는 것이다. 이것은 종속 변수인 호텔산업의 총매출액이 숙박 매출액과 호텔 부대시설 사용비까지 포함 되어 있어 행사와 관련된 변수를 적용하지 못한 것이다. 따라서 행사 가 많이 발생하는 12월(연말)에 유독 차이가 많이 발생하고 있다. 이런 한계점을 극복하기 위해선 첫 번째로 관광정보지식시스템에서 호텔 부대사용 금액 자료를 월단위로 수집하여 설명변수에 포함시키는 방법이 다. 다만 객실사용률처럼 자료가 늦게 나오는 단점이 있다. 두 번째로는 설명변수 보완 대신 12월에 수정 계수를 적용하여 그 차이를 줄이는 방법 들이 제시될 수 있다. 두 번째의 한계점은 객실 사용률의 예측 부분이다. 객실 사용률이 익년 하반기에 공표가 됨에 따라 예측에 따른 오차 부분을 감수 해야 한다는 것이다. 한계점을 극복하기 위해선 자료가 익월에 발표된다면 문제는 해결 될 것이다. 하지만 자료가 지금처럼 자료가 나온다면 제2장 후방예측처럼 시간의 변수만이 아니라 다른 변수를 포함하여 좀더 오차를 줄일수 있는 예측방법이 필요할 것이다. 따라서 종속변수에 대한 모형은 객실사용률과 부대시설 사용금액과 월별 더미변수로만 예측하고 객실사용률은 외국인입국자, 환율, 월별더미변수로 예측하고 부대시설은 시간과 월별더미변수로 예측하는 방법으로 호텔산업 경기동향을 예측하는 방법을 제시 할 수 있다. - 34 -

참 고 문 헌 [1] 김종섭(2008), 개정 2판 SAS v8.2를 이용한 통계분석의 이해, 한올출판사 [2] 김충련(2008), SAS 데이터 분석, 21세기사 [3] 성내경(2004), SAS/STAT 회귀분석, 자유아카데미 [4] 고재현(2012), 비지니스호텔 공급부족과 향후 전망, 한국신용평가 Special report 4월호 p 20-31 [5] 권유홍외 7명(2013), 최근 숙박시설 변화유형 등 실태조사 및 관리 방안 연구, 보건복지부 [6] 김준영외 2명(2011), 여행업 및 관광숙박업 인력수요 전망 (2011~2016), 한국고용정보원 [7] 정귀수외 1명(2007), 숙박업의 경기전망 및 리스크요인 분석, 하나금융경영연구소 제 21 호 p 1-27 [8] 최현경외 1명(2013), 호텔산업 공급주기와 규제 연구, KIET,산업연구원 - 35 -

ABSTRACT Reseach for the hotel industry economic trends forecasting models - Applying the multiple regression model using seasonal dummy variabies - Han, Chang-Youp Advisor : Prof. Kim Myeong Jun Ph.D. Department of Informational Statistics, Graduate School of social & culture Public Administration & Welfare, Hannam University Economic and industrial structure in recent accommodation industry has been rapidly changing by the increase of foreign entrants due to the Korean wave, income changes and drop of exchange ratel. The indicators for the accurate site survey to reflect those phenomena should be considered, but monthly indicators reflecting recent changes have limitation due to the information security issues and only producing the quarterly data. For the reason of field research difficulty, information security and survey cost, lodging industry economic trends forecasting model using related variables is required for predicting the accommodation industry trends. In order to rule out the relationship among the accommodation industry, this study is focusing on the hotel industry by selecting proper variables rather than overall accommodation industry. - 36 -

Room utilization rate, foreign entrants(japan, US, China, Taiwan and others),exchange rates(dollar, yen, yuan) and tourism income are considered as explanatory variables for hotel industry prediction. Also forecasting and backcasting predictions are considered for the data consistency. The hotel industry economic trends forecasting models are also considering monthly seasonal dummy variables with four explanatory variables. Among the selected variables, standardized regression coefficients are more influenced by the foreign tourist arrivals and room utilization rather than other variables and Japanese tourist arrivals are more influential for the economic trends in the hotel. Also two models with and without forecasting methodology are considered for the comparison of effectiveness. - 37 -