데이터마이닝을이용한글로벌리츠투자특성예측 Forecasting of Investment Characteristics of Global REITs Using Data Mining 1) 김경민 * 김천규 ** Kim, Kyeung Min Kim, Cheon Kyu 目次 Ⅰ. 서론 1. 연구의배경및목적 2. 연구의범위및방법 Ⅱ. 선행연구검토및이론적기초 1. 선행연구검토 2. 대체투자의이론적기초 Ⅲ. 실증분석및결과 1. 검증모형및분류모형평가 2. 변수선정및기초통계분석 3. 분석결과 Ⅳ. 결론 1. 연구의결과요약 2. 연구의시사점및한계 <abstract> < 참고문헌 > ABSTRACT 1. CONTENTS (1) RESEARCH OBJECTIVES The results of the analysis of the prospectus and investment characteristics of the global barrel re-indebted fuels will be used by institutional investors and investment company practitioners who want to invest in overseas REITs to select overseas investment region selection and investment items And to contribute to the minimization of risk by providing assistance to the public. (2) RESEARCH METHOD The data used for valuation analysis and classification analysis of REITs Investment consisted of 332 asset management companies' performance data on real estate overseas investment-type REITs investment products, The investment profit ratio of overseas investment-type commodities was 2016. It was 1 year immediately before the end of October 2015 (from May 1, 2015 to October 20, 2010). (3) RESEARCH FINDINGS We use data mining to classify and analyze the investment characteristics of the Global Litigation Re-Induced Firm by securing predictive power using these data mining methods. * 주저자 : 강남대학교부동산학과시간강사, 골드앤코리아리얼티대표, 부동산학박사, kkmin0390@naver.com ** 공동저자 : 강남대학교부동산학과박사과정, kimchg87@hanmail.net 접수일 (2016 년 11 월 29 일 ), 수정일 (1 차 : 2017 년 2 월 9 일 ), 게재확정일 (2017 년 2 월 10 일 ) - 44 -
김경민 김천규 45 2. RESULTS Results Characteristics of Investment in Global Ritz Re-Indirect Fund Using Data Mining As a result of machine learning for predictive analysis, the neural network model has the highest positive classification rate (99.7% accuracy) for predicting investment outcome Indicated. Next, we showed the prediction accuracy (Chon classification rate 98.82%) for the significance analysis of prediction variables of decision tree model (C 5.0) and logistic regression model. Based on the accuracy of such prediction, the independent variables affecting the investment result (IV) of the dependent variable as a result of the importance analysis of the variable are OM (operational maintenance), total net asset (NAV), price standard (BP) I was able to confirm the fact that. 3. KEY WORDS Real Estate Indirect Investment, Global REITs, Investment Value, Forecast Analysis, Sorting Rate, Importance 국문초록 글로벌금융위기및유럽재정위기, 중국의경기둔화등대외적요인과국내경기둔화, 전세시장역전등의대내적요인에따른부동산경기부진으로거래가매우침체되어있다. 리츠 (Real Estate Investment Trusts, REITs) 와부동산펀드 (Real Estate Fund, REF) 등을통해임대수익이나매각수익을향유하는부동산간접투자시장이급성장하고있다. 리츠투자는글로벌포트폴리오및대체투자다변화, 수익률극대화라는기치하에연기금등기관투자자의수임을받은자산운용사를중심으로판매사를통해지속적으로재간접펀드일종인글로벌리츠재간접펀드에글로벌부동산펀드와더불어투자자산을증대시키고있다. 글로벌리츠재간접투자의예측분석및투자특성분석결과를바탕으로투자하고자하는기관투자자및투자회사실무담당자에게투자특성예측분석을통해해외투자지역선별및투자항목선택에조력을줌으로써위험을최소화하는데기여하고자하는목적에서연구를실시하였다. 데이터마이닝을통한분류분석을위한데이터마이닝투자가치예측분석결과예측분석의분류의정확도는 99.7% 로높은정분류율을나타냈다. 따라서인공신경망모형 (ANN) 을활용한분석결과를바탕으로자산운용사및판매사의상품기획및자산운용담당자들에게글로벌리츠상품개발기준및판매기준등을제시해줄것을기대한다. 핵심어 : 부동산간접투자, 글로벌리츠, 투자가치, 예측분석, 정분류율, 중요도 Ⅰ. 서론 1. 연구의배경및목적 글로벌금융위기, 유럽재정위기등대내외적경기침체요건하에부동산거래또한매우침체되어있다. 해외부동산에투자하는글로벌리츠 (REITs 부동산투자신탁 ) 펀드에관심이쏠리고있다. 국내외증시흐름이불안한가운데부동산간접투 자상품인리츠펀드는주식형펀드보다안정적인수익을기대할수있다. 1) 주식과채권모두투자전망이불확실한상황하에서대체투자수단으로부동산간접투자가연기금등기관투자자들을중심으로투자가집중되고있다. 2) 부동산간접투자상품인글로벌리츠또한글로벌대체투자다변화및수익성제고에따라투자자산배분또한꾸준히증대되고있다. 부동산간접투자의증대와자본시장에서의강력한영향력으로인한공개시장의공개요구로언론 1) 한국부동산신문, 글로벌리츠펀드에투자해볼까,2016.06.17 자기사 (http:// 부동산신문.com) 2) 박덕배, 부동산간접투자시장의특징과시사점, VIP REPORT, 현대경제연구원, 2015, 15-7호, p.7.
46 데이터마이닝을이용한글로벌리츠투자특성예측 의불균형또한심화되고있다. 3) 그럼에도부동산간접투자인부동산펀드와리츠는연기금등기관투자자의위험대비수익률이높은관계로해외상품에대한투자할당을늘리고있는추세이다. 연초미국기준금리인상에대한우려가꾸준히제기되고있기는하나인상이지연되면서리츠수익률이증대되고있다. 각국의저금리정책등에힘입어서도글로벌부동산시장이살아나고있으며글로벌리츠펀드수익률도호전되고있다. 국내자산운용사의글로벌리츠펀드투자는연기금등기관투자자들의위탁운용방식을통하여재간접투자라는방식을주로사용하고있다. 자산운용사등을통해글로벌리츠투자가해외여러투자처로증대되고있음에도불구하고기존의리츠관련연구는주로국내리츠와실물부동산그리고거시경제변수간의관계를분석하거나리츠투자수익률결정요인분석에집중되었다. 이에본연구는글로벌리츠재간접투자를포커스로하여예측분석및투자특성분석을실시하였다. 이를통해글로벌리츠펀드에투자하고자하는기관투자자및투자회사실무담당자에게예측분석과투자항목중요도분석을바탕으로글로벌리츠투자지역선별에조력을줌으로써수익성을제고하고리스크를최소시키는데기여함을주된연구목적으로하였다. 2. 연구의범위및방법 최근 1 년간의글로벌리츠재간접투자사례 ( 원데이터 ) 를바탕으로투자수익성의투자가치를투자성과여부로구분하여예측을실시코자하였다. 4) 이러한투자가치판단을위해정제된데이터마트를구성하여데이터마이닝을활용한기계학습예측분석을실시한다. 이러한데이터마 이닝을활용해예측력을확보하여글로벌리츠재간접의투자특성을분석한다. 국내자산운용사가판매사를통하여판매된재간접투자상품의해외리츠투자를통한투자성과예측을위하여데이터마이닝을이용한기계학습분석으로의사결정나무, 인공신경망, 서포트벡터머신, 로지스틱회귀분석을실시하였다. 선행연구및기초이론검토를통하여리츠투자관련선행연구를분석하여본연구와의차별성을부각시킨다. 또한자산운용사의글로벌리츠재간접투자현황및투자수익률을확인하여대체투자로서부동산투자회사 (REITs) 의투자성과를평가한다. 실증분석은국내자산운용사및판매사의글로벌리츠펀드재간접투자실적을원데이터로하여데이터마이닝을이용한투자투특성예측분석을실시한다. 5) 이를위해분류의정확도분석을실시하고정분류율을통한예측력확보를바탕으로종속변수인투자성과에중요한영향을미치는독립변수를검증한다. 리츠투자가치예측분석등을위하여사용된로데이터는글로벌리츠재간접펀드투자상품 332 개의자산운용사및판매사들의실적데이터를로데이터로구성하였다. 글로벌리츠펀드상품들의예측모형판단의기간은최근 1년간의기준을 2016.10 월말로판단하고직전 1년 (2015.11.01~ 2016.10.30자 ) 으로하였다. 분석데이터마트구성을위한로데이터는금융투자협회데이터를참조하였다. 글로벌리치재간접펀드와국내리츠와의비교를위하여 FnGuide Index 로부터국내리츠수익률자료 ( 케이탑, 광희, 트러스 7호 ) 를활용하였다. 데이터마이닝을위하여 SPSS22.0, SPSS 3) Scott R. Muldavin, The New World of Real Estate Finance, Real Estate Finance, The Maldavin Company, Inc., 2001.8, p.75. 4) 글로벌리츠재간접펀드란재간접투자기구로서각국증권거래소에상장된리츠 (REITs) 에투자하여일정수준의지속적인임대수익과리츠가격상승에따른자본차익을추구하며또한부동산관련투자를통한일정부분인플레이션헷지를추구하는상품을말한다. 5) 데이터마이닝을명확히정의하기는어려우나대용량의자료로부터정보의요약과미래에대한예측을그목표로하며자료에존재하는관계, 패턴, 규칙등을탐색하고이를통계적으로모형화함으로써이전에는알려지지않은유용한지식을추출하는일련의과정으로정의할수있다.( 박창이 김용대 김진석 송종우 최호식, R을이용한데이터마이닝, 교우사, 2015, p.3.)
김경민 김천규 47 Modeler, R-program 을활용하였다. 실증분석연구모형은다음 < 그림 1> 과같다. < 그림 1> 데이터마이닝분석모형 Ⅱ. 선행연구검토및이론적기초 1. 선행연구검토 기존선행연구는리츠수익률결정요인분석과리츠와다른거시경제지표등과의관계에관한연구가주류를이루었다. 국내외리츠에대한투자수익률관련한선행연구는다음과같다. 국내선행연구로는허필원외 3명 (2012) 6) 은해외리츠펀드의투자지역별분류와외부거시경제변수와의상호연관성을분석하였다. 해외리츠펀드 3개의상호연관성을분석하기위하여 VAR모형기반으로한검정을실시하였다. 유상철 (2012) 7) 은 2001 년부터 2010 년말까지설립된 62 개리츠중공모로모집되어상장된 13개리츠를대상으로하였다. 부동산의용도, 위치, 자산의규모, 부동산의규모, 자산관리수수료비율이성과에영향을미치는것으로나타났다. 이경순 (2010) 8) 은 2009년 10월기준리츠와부동산펀드가운데임대형자산 ( 오피스, 상업용 ) 에투자한다. 설립후 6개월이지난상품중자료를구할수있는공모형리츠 10 개, 사모형리츠 14 개, 부동산펀드 7개를대상으로배당수익률결정요인을분석하였다. 보수운용비율, 운용기간, 부동산개수, 총자산의크기가영향을미친다고하였다. 원필재 (2010) 9) 는 2010 년운영중인 25 개부동산투자회사를대상으로하였으며, 주당순이익, 재무현금흐름, 현금흐름, 매출액, 영업이익률, 고정자산회전율이배당률에영향을미친다고하였다. 김재훈 (2008) 10) 은리츠의자기자본수익률의지표인배당률과유의한관계가있는독립변수로 LTV, 연간이자율, 자산관리회사, 부동산종류, 리츠의종류임을실증하였다. 장용삼외 2인 (2011) 11) 은리츠와타금융자산의수익-위험분석을통해리츠의특성을확인하였다. 해외선행연구에서는 K.C.Tseng(2010) 12) 이 데이터마이닝을활용한금융주식예측 연구에서주가의예측을위한예측의정확성을증가시키기위해인공지능 (NN) 과 OLS모형을비교하였다. David Enke(2005) 13) 는데이터마이닝을 6) 허필원 허정석 김경수 정미나, 해외리츠펀드와거시경제변수의상호연관성에관한연구, 부동산금융논문현상공모전수상작모음집, 메리츠증권, 부동산금융연구소, 2011, pp.159~198. 7) 유상철, 리츠의운영성과와특성, 강원대학교박사학위논문, 2012, pp.1~131. 8) 이경순, 임대형부동산간접투자상품의배당수익률결정요인분석, 건국대학교석사학위논문, 2010, pp.1~185. 9) 원필재, 재무분석을통한부동산투자회사배당률영향요인분석, 단국대학교석사학위논문, 2010, pp.1~93. 10) 김재훈, 리츠의자기자본수익률에영향을미치는요인에관한실증연구, 연세대학교석사학위논문, 2008, pp.1~66. 11) 장용삼 김진호 김행종, 부동산투자신탁의상관성에관한연구, 한국지적학회지, 한국지적학회, 2008, pp.95~108. 12) K.C..Tseng, "Forecasting Financial Stocks Using Data Mining", California State University Fresno, Forecasting, 2010, pp.1~24. 13) David. Enke Suraphan Thawomwong, "The use of data Mining and neural networks for forcasting stock market returns", Expert Systems with Aplication, 2005. Vol.29, pp.927~940.
48 데이터마이닝을이용한글로벌리츠투자특성예측 위한기계학습에사용되는정보획득방법을소개하였다. 다수의금융및경제변수의예측관계를평가하였다. 수준추정및분류를위한신경망모델이효과적인미래가치예측을위해조사되었다. 본연구의기존선행연구와의차별성은자산운용사및판매사를통하여실무에서투자된부동산해외리츠투자상품의실적데이터를바탕으로투자성과를예측하고투자를결정하는요인을데이터마이닝을이용하여분석하였다는점이다. 2. 이론적기초 1) 리츠의정의 리츠는다수의투자자로부터자금을모집하여부동산및부동산과관련된유가증권에투자 운영하여발생한수익을투자자들에게배당하는부동산간접투자방식이다. 내용적측면에서부동산간접투자기구라할수있다. 법적측면에서는부동산간접투자의기구라고할수있다. 2) 리츠의유형및가치평가 (1) 리츠의유형 리츠의주요한 3 가지유형으로는지분형 (Equity Trusts), 저당대출형 (Mortage Trusts), 혼합형 (Hybrid Trusts) 이있다. 초창기에는지분형이일반적이었다. 1970 년대중반에는저당대출형이더중요하게되었다. 최근들어지분형이다시더욱중요해지고있으며, 회사의수나자본규모에있어서지배적인유형이되었다. 지분형이보유하고있는자산과저당대출형이보유하고있는자산의차이는명확하다. 지분형은부동산에대한소유권지분을취득하는반면, 저당대출형은부동산저당대출채권을매수하여부동산지분소유자보다선순위의저당채권자가된다. 두가지형태의펀드의장점을결합하는더욱복잡한투자형태가발전 하였는데, 이를혼합형펀드라고한다. 14) 저당대출형에있어서는향후일반적인대출형의경우보다수익참여도가높은메자닌금융이활성화될것으로본다. (2) 리츠의가치평가방법 펀드수익률은운영성과를나타내는지표로일정기간동안기준가격이얼마나증감했는지를나타낸다. 15) 리츠가공시하는자료들은다양한정보를제공한다. 이러한자료들에는리츠들이소유하고있는부동산가치를정확하게제공해주지않는다. 이와관련된합리적인해결책은일반인이생각하는것보다어려운작업이다. 16) 펀드평가모형으로는첫째, 순자산가치모형이있다. 펀드기간수익률이란 <( 종료일수정기준가 - 시작일수정기준가 )/ 시작일수정기준가 *100(%)> 로계산한다. 리츠및부동산펀드모두주로개인들이직접투자하는주택보다오피스등상업용부동산에투자한다. 둘째, 소득승수모형 (Income(FFO) Multiple) 이있다. 셋째, 고든모형 (Gorden Dividened Discount Model) 이있다. 이모델에서주식의가치는차기배당금 (D1) 을요구수익률 (K) 와배당성장율 (G) 의차로나눈값이다. 3) 글로벌리츠투자의특성 (1) 글로벌리츠의현황 미국에서는부동산관련간접투자기구로서리츠와부동산뮤추얼펀드 (Real Estate Mutual Fund) 가있다. 리츠는 1993년증권법에의해규유되었다. 투자상품으로서리츠의성격은 중위험 중수익 의상품이다. 수익성측면에서는주식보다는적은반면채권보다는수익성이높다. 위험의측면에서도주 14) 김영곤외 4인, 부동산금융과투자, 부연사 ( 제14판 ), 2014, pp.745~746. 15) 방경식 장희순, 부동산학총론 ( 제4판 ), 부연사, 2016.08, p.580. 16) 김영곤외 4인, 상게서, 2014, p.114.
김경민 김천규 49 식보다는적고채권보다는높은투자처로인식되고있다. 그렇기때문에기관투자가들이자산포트폴리오차원에서위험헤지투자상품으로이용하고있다. 17) 대체투자로서부동산에투자하는글로벌리츠재간접은 2016 년 6월기준최근 1년평균수익률이 4.8% 다. 이는같은기간국내주식형펀드수익률이 -4.41%, 해외주식형펀드수익률이 -19.74% 로부진했던것과비교된다. 18) < 그림 2> 글로벌리츠재간접펀드수익률 ( 최근 3 년 ) (2) 글로벌리츠의특성 글로벌리츠재간접은펀드하나로전세계부동산에간접투자한다. 주식및채권과다른성격으로인해포트폴리오분산투자효과가있다. 상장부동산펀드및리츠는언제든지환매가가능한구조를가지고있다. 리츠펀드는경기회복시임대수요증가에따른수익성향상및보유자산가치증대가기대된다. 물가상승시임대료인상을통해인플레이션헤지효과가있다. 주식, 채권과같은전통자산대비장기성과는우수하며, 낮은상관관계로분산투자에적합한상품이다. Ⅲ. 실증분석및결과 출처 : 네이버금융, http://info.finance.naver.com/fund/fundfinder.nhn 국내리츠도 2013 년 10 월 ~2016 년 10 월까지 49 개월의국내상장리츠중 3 개사 ( 광희, 케이탑, 트러스제 7 호 ) 평균투자수익률과미국리츠의최근 3 년의수익률비교결과국내상장 3 개사평균수익률은 0.77%, 미국다우존스평균리츠수익률이 0.47% 로국내상장 3 개사의리츠수익률이더높다. 19) 이를통해국내의자산운용사의글로벌리츠재간접투자뿐아니라국내상장리츠도꾸준한성장세를지속하고있다는것을보여준다. 이를통해리츠에대한직 간접, 재간접투자의열기는지속될것으로본다. 데이터마이닝은모형의타당성평가를위하여데이터를훈련데이터 (training data) 와평가데이터 (test data) 로구분한다. 20) 훈련데이터는모델을생성하는데이용되고, 평가데이터는최종적인평가를수행하는데사용된다. 평가데이터는모형의생성에전혀사용되지않으며일반화의검토를위하여남겨두는데이터이다. 본연구에서는훈련데이터 80%, 검증용데이터 10%, 평가데이터 10% 로나누어분석을실시하였다. 본연구에서는해외리츠의수익률예측분석을위하여분류모델 (Classification Model) 링통하여예측의정확도를확인하하였다. 이러한예측의정확성을바탕으로판매사별로해외리츠판매된최근1 년수익률을사례로 (332N) 하여투자성과특성을분석한다. 분류모델에사용된이론을살펴본다. 17) 여수진외 2인, 리츠수익률의결정요인에관한연구, 대한부동산학회지, 대한부동산학회, 2014, 제32권1 호, pp.187~188.( 재인용 ) 18) http:// 부동산신문.com/print_paper.php( 펀드평가사 KG재로인 ) 19) Data Guide program 을통한국내외리츠관련데이터를참조하여저자가재구성함 20) Training Data는 Training Data와 Validation Data로구분하여사용되며일반적인구분비율은 7:3이다.
50 데이터마이닝을이용한글로벌리츠투자특성예측 1. 검증모형및분류모형평가 1) 검증모형 (1) 로지스틱회귀분석 (Logistic Regression, LR) 로지스틱회귀분석 (Logistic Regression, LR) 이선형회귀분석과의가장큰차이점은타겟 vfd 가치의규모이다. 선형회귀분석은종속변수가범주형변수일때이를처리하기에부적합하다. 그래서다른접근방법이요구되는데이것이로지스틱회귀분석이다. 중심아이디어는종속변수자체를예측하는데신가능한결과의가능성을예측하는데회귀모형의변환을수행하는것이다. 이모형이바로 LR 모델 이다. 21) 로지스틱회귀분석은어떤사건이발생하는지안하는지를직접예측하는것이아니라, 그사건이발생할확률을예측한다. 따라서종속변수값은 0 또는 1사이의값을갖는다. 로지스틱구조는다음과같다. F(t) = (2) 의사결정나무분석 (Decision Tree, C5.0) 의사결나무모형은비선형회귀분석, 비선형판별분석의하나로분류되는데, Tree 모형그자체로서분류, 또는예측과정으로수행되기도한다. 22) 의사결정나무의분리규칙은각마디에서분리에사용될독립변수의선택과분리가이루어질기준 ( 분리기준 ) 을의미한다. C5.0 은이익비율표준을사용하여이익비율이최대화되는점에서데이터의분할을선택하는다지분리알고리즘이다. 에트로피, 정보이득개념을사용하여분리기준을결정한다. ( 는자료 (S) 내에서 번째범주가차지하는비율을말하며, 은범주의개수이다.) 정보이득은엔트로피의감소량이며, 엔트로피가가장낮아지는속성을찾는것이목적이다. 자료는자료 (S) 를독립변수 (A) 의값에따라 n 개로나누었을때얻게되는정보이득이다. 23) (3) 인공신경망분석 (Artificial Neural Network, ANN) 신경망 (Neural Network) 은뇌구조에영향을받았다. 신경망모형 ((Neural Network Model) 은생물학적신경망의구조로부터착안된학습알고리즘으로서, 특히입력값을바탕으로잠재변수를만들고잠재변수를기반으로출력값을예측하는비선형구조를가지는모형이다. 24) ANN은 SVM같이블랙박스알고리즘이다. 그래서뉴런의이동과데이터변이의구조와메카니즘은매우복잡하고독창적이지않다. 뉴런의기능과활동구조식은다음과같다. 신경망에있어서의신경은정보가통과하는다층구조로하나의 Input layer, 하나또는그이상의 Hidden layer, 그리고 Output layer 로 21) Tilo Wendler Soren Grottrup, Data Mining with SPSS Modeler, Springer, 2016, pp.733~736. 22) 이재길, R프로그램에기반한다변량분석및데이터마이닝, 황소걸음아카데미, 2016, p.321. 23) Begas, BIG DATA, 빅데이터분석전문가교재, 한국데이터베이스진흥원, 2016, pp.300~307. 24) Begas, 상게서, 2016, p.350.
김경민 김천규 51 되어있다. Input 과 Output layer 사이에하나혹은그이상의 Hidden layer 가존재할수있다. 이러한다계층신경은위에서언급한바와같이전의계층의신경으로부터데이터를얻는다. 조작된데이터는다음의 Hidden layer 혹은 Output layer 의신경에전달되어졌다. 25) (4) 서포트벡터머신분석 (Support Vector Merchine, SVM) SVM(Support Vector Merchine) 은비선형분류알고리즘중하나로가장효율적이고유연한방법중하나이다. 초월평면에가장근접한인스턴스들을 Support Vector 라부른다. 선형모델의최대단점은클래스간의선형경계밖에표현하지못한다는점이다. 26) 예측이정확하고여러가지형태의자료에대하여적용이쉽지만확률추정값을요구하는분야에는잘사용되지않는다. 27) SVM 은서포트벡더분류를의미한다. 또한분류문제뿐아니라회귀문제도적용가능하다. 두개의클래스를분리하는초월평면을다음과같은방정식으로표현할수있다. 최대마진초월평면은클래스를가장많이분리하는평면에해당하며다음과같다. 2) 분류모형평가 모형의평가는서로다른모형중어떤모형이가장우수한예측력을보유하는지를비교하여분석하는과정이다. 두개의집단이있고 n개의소속집단을아는 데이터가있다면분류모형을이용하여각데이터를분류한다. 실제집단과모형에의해분류한집단을비교하여그결과를아래와같이 < 표 3> 으로요약할수있다. < 표 3> 데이터의실제집단과분류된집단간의결과교차표 실제집단 구분 A 분류된집단 A A B B A B B 여기서 B 는집단 A 의데이터가집단.A 로분류된수를의미한다. A 는집단1의데이터가집단 2로잘못분류된수, 올바로분류된데이터의수는 (B +B ), 잘못분류된데이터의수는 (B +B ) 이다. 분류모형의정확도 (accuracy) 는전체데이터의수중올바로분류된수의비율로정의한다. 오류율 (error rate) 은전체데이터의중에서오분류된수의비율로정의한다. 정확도 (accuracy) = 오류율 (error rate) = 일반적으로분류모형은정확도를최대화하거나오류율을최소화하는알고리즘을찾기위해노력한다. 여러분류모형의비교및평가를위해서는리프트차트, ROC 그래프등을이용한다. 2. 변수선정및기초통계분석 1) 변수선정 리츠수익률은무위험금융상품인국고채수 25) Tilo Wendler Soren Grottrup, Data Mining with SPSS Modeler, Springer, 2016, pp.843~846. 26) 이안위튼 아이베프랑크 마크홀, 데이터마이닝 ( 기계학습의이론과응용 ), 에이콘, 2013, pp.318~321 27) Begas, BIG DATA, 빅데이터분석전문가교재, 한국데이터베이스진흥원, 2016, p.343.
52 데이터마이닝을이용한글로벌리츠투자특성예측 익률과밀접하게움직인다. 국고채수익률이상승 ( 하락 ) 하면리츠수익률도상승 ( 하락 ) 하는것으로나타난다. 이는안전자산인국고채수익률이상승하게되면국고채수익률보다리츠수익률이높아야하므로리츠수익률역시함께상승하기때문이다. 28) 이에따라본연구에서는자산운용사및판매사의글로벌리츠재간접투자현황을데이터마트로구성하여국고채 5년수익률의최근 1년간평균수익률을투가가치기준으로더미변수화한최근 1년수익률 (IV) 을종속변수로하였다. 독립변수는금융투자협회에서공시하고있는글로벌리츠재간접자산운용사및판매사별글로벌리츠투자현황의항목을독립변수로사용하였다. 세부독립변수항목으로는금융투자협회의글로벌리츠재간접투자펀드별실적데이터중판매회사, 순자산총액, 보유자산금액, 기준가격, 1 개월수익률, 6 개월수익률, 설정 ( 전환 ) 일수익률, 운용보수, 판매보수, 판매수수료, 주요투자지역을독립변수로하여투자성과를예측하였다. 2) 기초통계분석 데이터마이닝을활용한투자성과예측을위한분류분석과군집분석을위한변수들의빈도분석결과는아래 < 표 5> 와같다. 데이터마이닝을활용한분류모델과군집분석결과변수들간의상관관계분석 (Pearson 상관분석 ) 결과투자가치 (IV) 와양 (+) 의상관관계가높은독립변수는기준가격 (BP) 0.530, 1개월수익률 (OMR) 6.11이었으며, 음 (-) 의상관관계가높은독립변수는운용보수 (OM) -0.610로나타났다. 이러한상관분석결과를통하여 1년투자수익률의투자성과와상관관계가높은변수는기준가격, 1개월수익률, 운용보수라할수있다. < 표 4> 변수의정의 변수명판매회사순자산총액 변수명 ( 영문 ) 변수명 ( 단축 ) 변수설명 Sales company Net asset value 보유자산금액 Amount of assets held 기준가격 1 개월수익률 Base price One-mon th return 설정 ( 전 6개월수익률투자가치환 ) 일수익률 Six-mont h return Investme nt performa nce Set (conversi on) daily yield 운용보수판매보수판매수수료 Operatio n Mainten ance Sales rep 주요투자지역 Sales Major commissi Investme on nt Areas SC NAV AAH BP OMR SMR IV SCD OM SR SC MIA 은행 (1), 증권 (2), 기타 ( 보험, 투신등 ) (3) < 표 5> 빈도분석결과 단위 : 억원단위 : 억원 1000 이상 (1) 1000 미만 (0) % % * 투자가치 : 최근 (2016.10.31 자기준 ) 1 년수익률성과 ( 종속변수 ) 무위험수익률인국공채 3 년물최근 1 년평균수익률인 1.57% 를기준으로투자성과 2.00% 이상은투자가치있음 (1), 투자성과 2.00% 미만은투자가치없음 (0) * 설정, 운용보수, 판매보수, 판매수수료 : % * 주요투자지역 : 아시아 (1), 글로벌 (2), 일본 (3), 아시아퍼시픽 (4) 구분 SC_A NAV AAH BP OMR SMR SCD OM SR SC MIA IV 평균 1.89 81.96 82.78.09-4.6154-3.4776 13.1338.78630.823.228 2.28.24 표준편차.638 106.107 106.819.287 2.24492 2.09998 24.57379.159400.3416.4198.788.430 분산.407 11258.666 11410.307.082 5.040 4.410 603.871.025.117.176.621.185 최소값 1 1 1 0-8.07-6.74-21.46.400 0.0 0.0 1 0 최대값 3 376 379 1-1.13 2.98 135.87 1.000 1.5 1.0 4 1 28) 조현민 김경민, 한국부동산시장과자본시장과부동산투자회사 (REITs) 간의연관성분석, 국토연구, 국토연구원, 2011, 제 71 권, p.82.
김경민 김천규 53 3. 분석결과 1) 의사결정나무 (C5.0) 성과에영향을미치는다양한독립변수들을분석한결과투자성과에대한의사결정나무분석은 < 그림 5> 와같다. 테스트데이터로 투자가치있음 (1) 은 41건, 투자가치없음 (0) 은 129 건으로총 170건의데이터가사용되어분석되었다. 먼저최초의가지치기는 '1개월리츠투자수익률 (OMR)' 을기준으로모형검증결과정분류율이 98.82%( 트레이닝 ), 98.82%( 테스트 ) 로높게모형의예측력이확인되었다. 의사결정나무모형을통한분석결과글로벌리츠재간접 1개월투자수익률 (OMR) 투자성과를예측하는가장중요한변수로작용한다는것을알수있었다. 2) 서포트백터머신 (SVM) 예측분석의분류의정확도는 < 표 7> 과같다. 92.35%( 트레이닝 ), 92.35%( 테트스 ) 로높은정분류율을나타냈다. 따라서 SVM 모형을활용하여글로벌리츠재간접의투자성과 (IV) 를예측할수있는설명력이충분히확보되었다고할수있다. 아울러 SVM을통하여예측자의중요도를분석한결과투자성과 (IV) 에영향을미치는중요도분석결과 OMR(1개월투자수익률 ), MIA( 투자지역 ), AAH( 보유자산금액 ) 순으로 IV( 투자가치 ) 라는종속변수설명하는중요한변수임이분석되었다. < 표 7> 정분류율 < 표 6> 정분류율 < 그림 4> 예측자중요도 < 그림 3> 의사결정나무노드 위의결과를종합해보면투자성과에가장큰영향을미치는요인은글로벌재간접투자의 1 개월투자수익률로나타났다.
54 데이터마이닝을이용한글로벌리츠투자특성예측 < 그림 5> ROC 그래프 < 그림 7> 네트워크 강현철 (2009) 에의하면좋은성능을가진모형일수록 ROC 곡선은대각선에위치한다. 이에따라 SVM 예측분석을통한모형판단은좋은성능가졌다고할수있다. 3) 인공신경망 (ANN) < 표 8> 정분류율 인공신경망 (ANN) 을통하여예측자의중요도를분석한결과투자가치 (IV) 에영향을미치는중요도는 OM( 운용보수 ), MIA( 주요투자지역 ), NAV( 순자산총액 ) 순으로중요도가높은것으로분석되었다. 4) 로지스틱회귀분석 (Logostic Regression) < 그림 6> 예측변수의중요도 전체의분류의정확도는 < 표 9> 와같이 98.77%( 훈련 ), 98.82%( 테스트 ) 로비교적높은정분류율을보였다. 이러한예측의정확성을바탕으로종속변수에미치는중요도는 BP( 가격기준 ), NAV( 순자산총액 ), OM( 운용보수 ) 순으로분석되었다. < 표 9> 분류표 예측분석의분류의정확도위 < 표 8> 과같이 99.7% 로높은정분류율을나타냈다. 인공신경망모형 (ANN) 을활용하여글로벌리츠재간접의투자가치 (IV) 를예측할수있는설명력이충분히확보되었다고할수있다.
김경민 김천규 55 < 그림 8> 예측변수의중요도 투자성과의특성을기계학습모델링을통하여실증분석하였다는점이다. 또한연구모형을실증에거시지표등외부요인이아니라실제투자가이루어진투자모형내의변수들을통하여확인하였다는점이연구의큰성과라할수있다. 2. 연구의시사점과한계 Ⅳ. 결론 1. 연구의결과요약 데이터마이닝을이용한글로벌리츠재간접펀드투자특성예측분석을위한기계학습결과신경망모형이투자성과예측을위한가장높은정분류율 (99.7% 의정확도 ) 을보였다. 의사결정나무모형 (C5.0) 과로지스틱회귀모형의예측변수의중요도분석을위한예측의정분류율 ( 98.82% 의정확도 ) 을보였다. 예측의정확도를바탕으로변수의중요도분석결과종속변수인투자성과 (IV) 에영향을미치는독립변수는 OM( 운용보수 ), 순자산총액 (NAV), 가격기준 (BP) 이라는사실을확인할수있었다. 연구성과는부동산금융에도데이터마이닝을통한빅데이터예측분석을통해투자성과라는 리츠펀드는환금성이높은반면투자수익이안정적이지못하다는한계를가지고있다. 본연구의데이터마이닝을이용한기계학습을통한예측력확보와투자성과판단에영향을미치는중요변수도출이이러한한계를극복하는데자산운용사및판매사글로벌리츠재간접투자운용담당자들에게마켓팅분석시기준을제시하였다. 글로벌리츠투자세부항목들중최근 1년의투자수익률인투자성과 (IV) 를판단하는데중요한기준을제시하였다는점에서시사하는바가크다할것이다. 본연구는데이터마이닝을통한예측분석과중요변수선정에있어독립변수를다양하게선정하여예측의설명력을극대화시키지못하였다. 국내리츠투자수익률과의단순비교에그치고세밀한계량화된비교실증을통해글로벌리츠의특성을도출하지못했다는점은연구의한계라할것이다. 차재의연구에서는이점을보완하여국내외리츠투자의특성을데이터마이닝을통하여예측하고비교분석하고자한다.
56 데이터마이닝을이용한글로벌리츠투자특성예측 參考文獻 Tilo Wendler Soren Grottrup, Data Mining with SPSS Modeler, SpringerVerlag, 2016. 이안위튼 아이베프랑크 마크홀, 데이터마이닝 ( 기계학습의이론과응용 ), 에이콘, 2013. 캐빈머피, 머신러닝 (Merchine Learning), 에이콘, 2015. 방경식 장희순, 부동산학총론 ( 제4판 ), 부연사, 2016. 김영곤외 4인, 부동산금융과투자 ( 제14판 ), 부연사, 2014. 박창이외 4인, R을이용한데이터마이닝, 교유사, 2015. 이재길, R프로그램에기반한다변량분석및데이터마이닝, 황소걸음아카데미, 2016. 여수진외 2인, " 리츠수익률의결정요인에관한연구 ", 대한부동산학회지, 대한부동산학회, 2014, 제32권제1호. 최차순, REITs 수익률의 ARIMA Model 설정에관한연구, 부동산학보, 한국부동산학회, 2014, 제58권. 최효비외 1인, 은퇴계층의부동산자산운용에관한결정요인분석, 부동산학보, 한국부동산학회, 2016, 제65권. 홍아름외 2인, 데이터마이닝기법을이용한서울시오피스빌딩투자특성예측에관한연구, 서울도시연구, 서울연구원, 2010, 제11권제2호. 전해정, 자산가격결정이론에기반한주택가격결정요인분석에관한연구, 부동산학보, 한국부동산학회, 2013, 제52권. 이치주외 1인, 리츠와건설경기, 부동산경기, 주식시장과의관계분석, 한국건설관리학회지, 한국건설관리학회, 2010, 제11권제5호. 조현민외1인, 한국부동산시장및자본시장과부동산투자회사 (REITs) 간의연관성분석, 국토연구, 국토연구원, 2011, 71권김병준 이창석, 미국 REITs 시장과주식시장수익률간의상호영향력검정, 부동산학보, 한국부동산학회, 2016, 제66권남연우 고석찬, 부동산펀드성과영향요인분석, 부동산학보, 한국부동산학회, 2015, 제62권김경민외 2인, 국민연금기금운용을통한부동산투자특성에관한연구, 부동산학보, 한국부동산학회, 2015, 제62 권조재영, 프로젝트금융의안정성확보에관한연구, 부동산학보, 한국부동산학회, 2016, 제64권이병훈외 3인, 회귀분석을통한부동산투자회사 (REITs) 오피스빌딩의수익률영향요인분석, 대한건축학회논문집, 대한건축학회, 2011, 제27권제9호. 박덕배, 부동산간접투자시장의특징과시사점, VIP REPORT, 현대경제연구원, 2015, 15-7호. 김홍년, 글로벌리츠시장현황및리츠산업의활성화필요성, 리츠저널, 한국리츠협회, 2015, VOL.16. 금융투자협회 (http://dis.kofia.or.kr/) Fn-Guide(http://www.fnguide.com/)Index During The 2000-2011 Time Period, Journal of Business & Economics Research, 2014, 12(1). K.C..Tseng, "Forecasting Financial Stocks Using Data Mining", California State University Fresno, Forecasting, 2010. David. Enke Suraphan Thawomwong, "The use of data Mining and neural networks for forcasting stock market returns", Expert Systems with Aplication, 2005, Vol.29. Christopher Grandrud, Reproducible Research with R and RStudio(second edition), CRC Press, 2015.