The Korean Journal of Applied Statistics (2016) 29(4), 657 678 DOI: http://dx.doi.org/10.5351/kjas.2016.29.4.657 Effect of online word-of-mouth variables as predictors of box office Seonghyeon Jeon a Young Sook Son a,1 a Department of Statistics, Chonnam National University (Received March 3, 2016; Revised April 21, 2016; Accepted April 26, 2016) Abstract This study deals with the effect of online word-of-mouth (OWOM) variables on the box office. From the result of statistical analysis on 276 films with audiences of more than five hundred thousand released in the Korea from 2012 to 2015, it can be seen that the variables showing the size of OWOM (such as the number of the portal movie rater, blog, and news after release) are associated more with the box office than the portal movie rating showing the direction of OWOM as well as variables showing the inherent properties of the film such as grade, nationality, release month, release season, directors, actors, and distributors. Keywords: predictors of box office, online word-of-mouth (OWOM) variables, correlation coefficient, ANOVA test, chi square test, decision tree, canonical correlation analysis, factor scores plot, star plot 1. 서론 영화진흥위원회 (Korean Film Council; KOFIC) (2013, 2014, 2015, 2016) 의한국영화산업결산에따 르면 2007 년부터 2011 년까지적자상태에놓여있었던한국영화산업의침체기는 2012 년에흑자로돌아 서면서불황을벗어난걸로평가되었다. 2012 년한국영화산업은총관객수와매출액면에서과거에비 해한단계도약한해로기록되었다. 2012 년총관객수는 1 억 9,489 만명으로전년대비 21.9% 상승하 기시작한이래 2015 년에는 2 억 1,729 명에달해최근 3 년연속 2 억명을돌파하였다. 영화산업매출은 극장입장권매출, 디지털온라인시장매출, 해외수출매출을합산하여계산된다. 2015 년한국영화산 업매출은 2 조 1,131 억원을달성하여 2014 년대비 4.2% 증가하여최근 2 년연속 2 조원대를이루었 다. 이렇게총관객수및매출이급격히증가함에따라한국영화산업은세계적인규모로성장할수있 는발판이되었다. 2015 년도에는 1 인당연평균극장관람횟수가 4.22 회로 2014 년도의 4.19 회를갱신하 였다. 글로벌산업정보조사기관인 IHS 자료에의하면 2014 년인구 1 인당연평균극장관람횟수는아이 슬란드가 4.0 회, 싱가포르 3.9 회, 미국 3.6 회로한국은세계 1 위수준에해당한다. 특히 2014 년에개봉 한영화 명량 은 1,761 만명이관람하였는데이는우리나라인구의약 1/3 이넘는수치로역대최고의 박스오피스기록을갱신하였다. 2015 년한국영화개봉작 232 편중투자수익성분석대상이된 73 편중 This research was supported by Basic Science Research Program through the National Research Foundation of Korea (NRF) funded by the Ministry of Education, Science and Technology (NRF-2011-0022864). 1 Corresponding author: Department of Statistics, Chonnam National University, 77, Yongbong-ro, Buk-Gu, Gwangju 61186, Korea. E-mail: ysson@jnu.ac.kr
658 Seonghyeon Jeon, Young Sook Son 에서손익분기점을넘긴영화는 16편으로영화수익성평가측면에서약 21.9% 의영화들이성공적인결과를보였다고한다. 소셜미디어 (social media) 란웹상에서타인과쌍방향커뮤니케이션을할수있는온라인플랫폼을의미한다. 소셜미디어에는대표적으로블로그 (Blog), 소셜네트워크서비스 (SNS), 손수제작물 (UCC) 등이있다. TV, 라디오, 신문, 잡지등과같은전통매체가일방적인정보전달을한다면소셜미디어는온라인상에서수많은이용자들에의해다양한콘텐츠가자유롭게생성되고공유되므로소셜미디어를통하여어떤주제에대해서든지불특정다수의의견을들여다볼수있다. 최근소셜미디어가급격하게발달해감에따라소셜미디어는기업의마케팅뿐만아니라영화산업에도큰영향을미치는요인으로작용하고있다. 우리는영화에관한입소문이영화를보게하는동력이되는것을흔히경험한다. 개인대개인의오프라인입소문도효과는있지만인터넷이발달된현재는블로그, 소셜네트워크서비스, 포털사이트에서의영화평점및영화에대한의견, 온라인영화뉴스등과같은온라인입소문즉, 온라인구전 (online word-of-mouth; OWOM) 의파급효과가속도나양에있어서훨씬크다. 영화의성공을평가하는데있어서경제적인수익은매우중요한기준이된다. 영화산업구조는투자, 제작, 배급, 상영의단계로이루어지는데, 이와관련된기업들은영화의수익성에민감할수밖에없기때문에영화의흥행과관련된요인들을찾아내어가능한초기단계에서영화흥행을예측하는것은관련종사자들에겐매우중요한일일것이다. 최근에 OWOM 변수를활용하여영화의흥행을예측하는연구들이많이이루어지고있다. OWOM 변수중에서도일반인, 전문가의평점혹은영화에대한긍정혹은부정을의미하는메시지의분류등은구전의방향성을나타내는변수이며평가자수혹은메시지의수는구전의크기를나타내는변수로통용된다. 그런데이들각변수가영화매출에주는영향의유의미함의여부는분석에사용하는영화데이터혹은사용한통계적방법론에따라다른결론을볼수있었다. Liu (2006) 는미국에서 2002년 5월부터 9월까지개봉된 40편영화에대하여다중회귀분석에의한 OWOM 효과를분석한결과미국야후영화사이트에게시된메시지의수는영화매출에양의영향을주지만긍정혹은부정으로분류된메시지의평가는매출에영향력이없다고하였다. 반면전문가의평가는매출에양의영향을준다고하였다. 이에반하여 Bae 등 (2010) 은한국에서 2005년부터 2007년까지 3년동안개봉한 439편의영화에대하여연립방정식을통해 OWOM 변수와영화매출간상호영향에관하여분석한결과네이버포털사이트의관람객평점및평가자수는모두매출에양의영향을주는반면전문가평점은음의영향을준다고밝혔다. Kim 등 (2010) 은한국에서 2008년에개봉된영화 379편을대상으로예술영화와상업영화를구분하여다중회귀분석에의해영화흥행예측요인에관하여연구하였다. 평점변수로는씨네 21의전문가평가와네이버포털관람객평가, 씨네 21의관람객평가가사용되었다. 관람객평가는두가지유형의영화에모두유의미한영향을주는것으로나타났고, 전문가평가는예술영화에대해서만유의미한영향을주는결과를보였다. Park 등 (2011) 은한국에서 2009년과 2010년에개봉된영화 202편을대상으로다중회귀분석에의한한국영화의흥행성과요인에관한연구를하였다. 전문가평점으로씨네 21의평점을사용하였고온라인평점으로네이버포털평점을사용하였는데모두유의한결과를보였다. Kim과 Hong (2013) 은 2013년 1사분기에한국에서개봉된상업영화 54편에대하여 LASSO 회귀를이용하여영화흥행에핵심적인영향을주는온라인구전변수로서포털평점과평가자수모두영향력이있지만평가자수가훨씬더영향력이큼을밝혔다. Yim과 Hwang (2014) 은 2013년 4월부터 10월까지한국에서개봉된영화로서무작위로추출된 60편의영화를대상으로트위터를이용한기계학습기반의영화흥행예측연구를진행하였는데, 온라인구전변수로네이버포털사이트의평점과평가자수가포함되었다. 포털평점의경우가장낮은예측정확도를보이는것으로나타났다. Lee와 Cho (2014) 는한국에서 2012년과 2013년에개봉된영화 358편을대
Effect of online word-of-mouth variables as predictors of box office 659 상으로분위수회귀분석을이용한한국영화의흥행결정요인분석에서네이버포털평점과평가자수를사용하였는데, 매출에성공한영화는평점보다는평가자수가유의하였으며매출에성공하지않은대부분의영화의경우는평점이유의한요인으로나타났다. Kim과 Han (2014) 은 2012년한국에서개봉된 67편의상업영화를대상으로다중회귀분석에의한한국영화의흥행성과요인에관한연구를하였다. 씨네 21의전문가평점과평가자수, 그리고네이버포털의평점과평가자수를사용하였다. 이중에서네이버포털의평점만이유의한결과를보였다. Sadikov 등 (2009) 은미국에서 2008년에개봉된상위 300편의영화를대상으로블로그를영화흥행예측변수로활용한국외연구사례이다. 국내에서블로그를영화흥행예측변수로활용한연구는거의없는편이다. Kim과 Hong (2011) 은 2010년한국에서개봉된영화 316편에대하여다항로짓모형을통하여영화흥행요인을분석한결과포털평점은유의미한영향이없는반면블로그, 트위터등소셜미디어로부터생성되는온라인버즈의크기는매출에영향력이있음을보였다. 최근영화산업의 OWOM 효과에관한연구추세를보면씨네 21과같은영화전문잡지사이트의평점및평가자수보다는네이버포털사이트의평점및평가자수를주로사용하는경향을보인다. 이는시대적흐름에따른결과로서많은기능들을갖추어대중화된포털사이트에서영화에대해자발적으로평가하는네티즌의수가해가갈수록많아지고, 누구나간단한검색만으로도특정영화에대한정보및일반대중의생각을쉽게공유할수있기때문이다. 본연구에서는한국영화산업이오랜침체기에서벗어나전성기를걷고있는 2012년부터 2015년까지 4년동안개봉한영화를대상으로포털사이트의영화평점및영화평가자수, 영화블로그수, 영화뉴스수등이영화흥행예측에효과적인 OWOM 변수들로사용될수있는지를연구하고자한다. 인터넷트렌드사이트 (http://trend.logger.co.kr/trendforward.tsp) 의통계에의하면 2012년 1월 1일부터 2015년 12월 31일까지인터넷전체카테고리점유율은네이버 (Naver) 79.73%, 다음 (Daum) 14.59%, 구글 (Google) 3.23%, 줌 (Zum) 0.72%, 네이트 (Nate) 0.68% 등의순이었다. 이러한통계자료로부터점유율합이약 94% 를차지하는네이버포털사이트 (www.naver.com) 와다음포털사이트 (www.daum.net) 를네티즌들의활동성이높고구전이주로발생하는포털로서선택하여이들포털사이트로부터 OWOM 자료를얻었다. 네이버와다음포털을선택한또다른이유는이들포털사이트는영화를중점적으로다루는페이지를따로서비스하고있으며영화정보는물론, 네티즌들이활발하게활동할수있는영화평점, 영화평가자수등의자료를얻을수있고블로그수및뉴스수도시간별로검색에의하여얻을수있다. 하지만구글에서는영화에대한정보만보여지고웹문서위주로검색이가능하다. 만약구글을통하여사용가능한변수를만든다면각영화에대한검색건수가될것이다. 영화흥행성공여부는각영화에대한투자대비수익으로평가해야겠지만현실적으로이러한자료를얻기는어려운실정이다. 따라서관련연구분야에서는보통영화의흥행을측정하는지표로해당영화로인한총수입액즉, 박스오피스 (box office) 를사용한다. 그러나본연구에서는흥행지표로총관객수를사용하였다. 그이유는분석대상이된자료에서총관객수와영화매출액간의상관계수는약 0.997이며보통일반대중들은영화의총관객수로영화흥행을판단하는것에익숙해져있기때문이다. 본연구의결과로서 OWOM 변수중에서포털사이트의평점보다는포털평가자수, 블로그수, 뉴스수가영화흥행예측변수로써훨씬더유용할것으로기대된다. 또한개별영화들의다양한그래프를통하여두주요포털사이트간의성향차이와개별영화에서 OWOM 변수의특징을알아본다. 2. 데이터설명 본연구에서사용한영화데이터는한국에서 2012 년 1 월 1 일이후개봉하여 2015 년 12 월 31 일이내에
660 Seonghyeon Jeon, Young Sook Son Table 2.1. Definition of variables Variable type Variable name Variable description Audience Total number of audience Daudience Number of audience on release date Dscreen Number of screen on release date Nationality Nationality(Domestic films, Foreign films) Properties Grade Film rating(general, 12+, 15+, 18+) of the film Month Release month(january-december) Season Release season(spring, Summer, Autumn, Winter) Dirscore Director score Actscore Film star score Distscore Distributor score Nbscore Naver portal rating before release Nbnum Number of Naver portal rater before release Nascore Naver portal rating after release Nanum Number of Naver portal rater after release Dbscore Daum portal rating before release Online Dbnum Number of Daum portal rater before release word-of-mouth Dascore Daum portal rating after release Danum Number of Daum portal rater after release Bblog Number of blog before release Ablog Number of blog after release Bnews Number of news before release Anews Number of news after release 상영종료가된영화들중누적총관객수가 50만명이상인 276개영화이다. 누적총관객수가 50만명미만인영화들의경우, 독립자본영화혹은상영기간이짧은영화들이많아 OWOM 효과를나타내는변수들의자료수집에어려움이있어서분석에서제외시켰다. Table 2.1은자료분석에사용한변수들을정의한표이다. 영화속성을나타내는변수들에대한자료수집은영화진흥위원회의통합전산망 KOBIS 사이트 (www.kobis.or.kr) 를활용하였다. 총관객수 (Audience) 는최종영화의흥행지표를나타내고, 개봉일관객수 (Daudience) 는개봉당일영화의흥행지표를나타낸다. 개봉일스크린수 (Dscreen) 는배급사및상영사에서개봉하기전영화의기본적인특성들을바탕으로예상되는관객수만큼확보하는것이다. 국적 (Nationality) 은외국영화들중에서빈도수가낮은국적이많았기때문에크게국내영화, 국외영화 2가지로구분하였다. 등급 (Grade) 의경우전체관람가, 12세이상관람가, 15세이상관람가, 18세이상관람가, 즉청소년관람불가로구분하였다. 영화의개봉시기를나타내기위해개봉일의월단위를기준으로 1월부터 12월까지의개봉월 (Month) 을구하였다. 또한개봉계절 (Season) 은 3월에서 5월을봄, 6월에서 8월을여름, 9월에서 11월을가을, 12월에서 2월을겨울과같이 4개계절로구분하였다. 영화의제작과정에서흥행에영향을줄수있는요인으로감독과배우가있다. 감독이최근 3년간제작했던영화들중에서총관객수가최대인값을사용해감독점수 (Dirscore) 를정의하였다. 배우점수 (Actscore) 는주연배우 2명이최근 3년간출연했던영화들중에서총관객수가최대인값을평균으로계산하여나타내었다. 최근 3년간제작혹은출연했던영화가없는경우감독점수혹은배우점수는각각 0으로하였다. 영화의배급과정에서흥행에영향을줄수있는요인으로배급사가있다. 배급사
Effect of online word-of-mouth variables as predictors of box office 661 가최근 3년간배급했던영화들중에서총관객수가최대인값을사용해배급사점수 (Distscore) 로나타내었다. 최근 3년간배급했던영화가없는경우배급사점수는 0으로하였다. OWOM 변수로서개봉전평점 (Nbscore, Dbscore), 개봉전평가자수 (Nbnum, Dbnum), 개봉후평점 (Nascore, Dascore), 개봉후평가자수 (Nanum, Danum) 는네이버및다음포털영화사이트에서각각수집하였다. 포털영화평점변수에해당하는 Nbscore, Nascore, Dbscore, Dascore 등은영화에대한긍정및부정의평가를반영하고있다. 포털네티즌즉, 포털영화평가자는각영화에대해 0, 1, 2,..., 10점으로평가할수있다. 각평가자가부여한평점의총합을총평가자수로나눈값이포털영화평점이다. 이렇게계산된포털영화평점은 10점에가까울수록영화에대한긍정적평가로, 0점에가까울수록부정적평가로간주할수있다. 개인홈페이지와같은블로그는인터넷을통해대형미디어에못하지않은힘을발휘할수있는 1인미디어의성격을갖는다. 뉴스는공신력있는언론사등에의해대중들에게전달되어진다. 블로그수, 뉴스수의수집은국내포털점유율이가장높고회원을가장많이보유하고있는네이버의검색엔진을사용하였다. 개봉전블로그수 (Bblog) 및개봉전뉴스수 (Bnews) 는영화개봉 1달전으로부터개봉전날까지영화제목의검색건수를사용하였고개봉후블로그수 (Ablog) 및개봉후뉴스수 (Anews) 는영화의개봉일로부터 3달후까지영화제목의검색건수를사용하였다. 이는대부분영화의상영기간이 1달내외이고블로그나뉴스의게시물들이상영종료후뒤늦게올라오는경우를감안하였다. 3. 기술통계분석 Table 3.1은 2012년부터 2015년까지 4년간각연도별그리고국적별영화데이터에대한기술통계분석결과를보여준다. 영화속성변수들의평균값의의미로볼때한편의영화당평균총관객수는 260여만명이고총관객수가 50만이상인영화의수는 2013년이후연속으로대략 10개씩줄어들지만총관객수는증가한다. 개봉일관객수와개봉일스크린수도총관객수와같은증가추세를보이고있다. OWOM 변수들의평균값의의미로볼때 OWOM의방향성을나타내는포털평점의경우개봉전평점에비해개봉후평점은항상낮다. 또한네이버평점은다음평점에비해다소높으나표준편차는대부분더작은편이다. OWOM의크기를나타내는변수들중에서포털평가자수를제외하고블로그수와뉴스수는해마다증가하는추세이다. 포털평가자수는네이버가다음에비해월등하게높다. 개봉후평가자수를기준으로약 7배정도의차이가나는데이는약 80% 의점유율을보이는네이버포털과약 15% 의점유율을보이는다음포털간의차이로부터예견할수있다. 2014년의네이버포털평가자수의평균이 10,319로가장높은값을가지는데, 이는국내영화사상총관객수가 1,000만이넘은총 17편의영화들중 4편이 2014년도에개봉하였고그중 1, 2위를차지하는 명량 과 국제시장 이 2014년영화에속한다는것으로설명이될수있을것이다. 국내, 국외영화데이터의경우 50만이상인영화의수가각각 139편및 137편으로비슷한점유율을보이나국내영화의총관객수평균값이약 83만명더많다. OWOM의크기를나타내는변수들은국내영화가국외영화에비해상당히높은값을가진다. 반면에 OWOM의방향성을나타내는포털평점의경우는국외영화가평균값이더높으며표준편차는더작은공통점이발견된다. 국외영화가국내영화보다더높은평가를받았지만이슈화측면에서는관심을끌지못하였던결과라고볼수있다. Figure 3.1은등급, 개봉월, 개봉계절에대하여총관객수평균값의막대도표를나타낸그림이다. 등급은 12세이상관람가, 15세이상관람가의영화가평균적으로약 300만관객수로가장높게나타났다. 전체관람가인영화들의경우어린이들을주대상으로한애니메이션영화들이많고 18세이상관
662 Seonghyeon Jeon, Young Sook Son Table 3.1. Descriptive statistics Variable Total Year Nationality 2012 2013 2014 2015 Domestic Foriegn Frequency 276 76 76 68 56 139 137 Audience Daudience Dscreen Dirscore Actscore Distscore Nbscore Nbnum Nascore Nanum Dbscore Dbnum Dascore Danum Bblog Ablog Bnews Anews Mean 2,616,442 2,327,347 2,560,258 2,805,137 2,855,904 3,029,226 2,197,631 SD 2,730,253 2,347,109 2,598,284 3,196,846 2,807,375 3,243,720 2,011,393 Mean 128,478 118,348 128,998 132,562 136,563 139,571 117,223 SD 113,640 100,511 114,394 119,601 123,673 119,388 106,754 Mean 569 475 559 600 671 579 558 SD 230 175 189 255 267 188 267 Mean 1,044,278 786,153 701,483 1,232,323 1,631,471 1,335,519 748,785 SD 1,878,143 1,432,300 1,203,451 2,071,818 2,643,196 2,193,388 1,440,936 Mean 3,103,440 2,355,356 2,945,775 3,271,067 4,129,122 4,325,708 1,863,328 SD 2,878,031 2,214,522 2,761,371 2,639,286 3,732,392 3,041,044 2,070,945 Mean 8,424,814 7,469,748 8,905,231 8,055,074 9,517,950 9,783,671 7,046,120 SD 4,174,525 3,744,180 3,588,311 4,512,274 4,763,458 4,421,805 3,405,267 Mean 8.85 8.96 8.85 8.82 8.73 8.62 9.09 SD 0.84 0.72 0.64 0.96 1.04 0.99 0.56 Mean 903 594 1,339 858 784 1,308 492 SD 2,195 1,815 3,394 1,230 1,282 2,999 529 Mean 7.83 7.66 7.91 7.83 7.94 7.60 8.06 SD 0.87 0.96 0.77 0.90 0.82 0.89 0.78 Mean 8,925 7,117 9,125 10,319 9,413 10,678 7,145 SD 10,335 8,219 12,756 10,899 8,255 12,670 6,838 Mean 8.45 8.57 8.52 8.34 8.32 8.28 8.62 SD 0.97 0.87 0.72 0.93 1.37 1.11 0.79 Mean 173 178 210 145 149 271 73 SD 554 459 918 154 261 767 66 Mean 7.43 7.45 7.67 7.31 7.25 7.34 7.53 SD 0.94 1.01 0.84 1.00 0.84 0.98 0.89 Mean 1,290 1,232 1,522 1,335 999 1,766 807 SD 2,055 1,215 3,430 1,329 861 2,740 675 Mean 1,027 740 961 1,141 1,367 1,252 798 SD 814 412 682 781 1,205 945 575 Mean 9,708 6,962 8,659 11,167 13,085 11,089 8,306 SD 10,576 10,031 9,649 10,969 11,060 11,653 9,189 Mean 1,663 1,206 1,539 1,797 2,287 2,824 484 SD 1,617 1,051 1,430 1,752 2,075 1,362 790 Mean 2,106 1,466 1,636 2,606 3,006 3,002 1,196 SD 2,653 1,920 1,899 3,154 3,333 3,204 1,469 람가인영화들의경우나이제한으로인해관객수확보에한계가있기때문이라고본다. 개봉월의경우 7월의총관객수평균이 400만이상으로가장높았고다음으로 12월이약 350만, 4월이약 320만으로높게나타났다. 3월은약 150만으로가장낮은값을보였다. 계절은여름의총관객수평균이약 350만관객으로가장높았고다음으로겨울이약 270만으로높았다. 여름과겨울의휴가또는방학시즌에관람객이많다는것을나타낸다.
Effect of online word-of-mouth variables as predictors of box office 663 (a) Grade (b) Month (c) Season Figure 3.1. Bar graph of categorical variables. Table 4.1. Audience group Group 1 2 3 4 5 Audience > 10 million 5 10 million 3 5 million 1 3 million < 1 million 4. 흥행예측변수의선정이절에서는영화흥행지표인총관객수를예측하는데영향력있는예측변수를선택하려고한다. 흔히총관객수를예측하는확률모형에서총관객수는양적변수로사용할수도있고적절한범주로나누어범주형변수로만들어사용하기도한다. 총관객수가양적변수일때는목표변수인총관객수와각양적예측변수와의피어슨상관계수가그리고총관객수와각질적예측변수와의 ANOVA 검정에서 p-value가변수선택의정보를줄수있다. 총관객수가범주형변수일때는양적예측변수는범주화하여총관객수와각범주형예측변수와의독립성검정인카이제곱검정의 p-value가변수선택의정보를줄수있다. Table 4.1은카이제곱독립성검정을위해총관객수를 1,000만이상, 500 1,000만, 300 500만, 100 300만, 100만이하인 5개의범주로나눈것이다. 카이제곱독립성검정에사용될모든양적예측변수들은사분위수에따라각각 4개의범주로나누었다. Table 4.2는각연도별및국적별로총관객수와각예측변수들과의상관분석, 카이제곱독립성검정, 그리고 ANOVA 검정결과를보여준다. 상관분석에서각상관계수에대한유의성검정의 p- value가 0.05(0.01) 보다크면총관객수와각예측변수간에상관관계가존재하지않는다는귀무가설이 5%(1%) 유의수준하에서기각되지않음을의미한다. 또한카이제곱독립성검정및 ANOVA 검정의 p-value가 0.05(0.01) 보다크면각예측변수의범주값에따라총관객수의차이가없다는귀무가설이 5%(1%) 유의수준하에서기각되지않음을의미한다. 즉, 3개의각검정에서 p-value가 0에가까울수록총관객수예측에영향력있는예측변수라고판단할수있다. 상관분석및카이제곱검정결과 OWOM 변수들중에서개봉후포털평가자수, 개봉후블로그수, 그리고개봉후뉴스수가총관객수와매우높은관련성을보인다. 개봉전 OWOM 변수들은영화속성변수들과더불어영화개봉전혹은개봉일시점에서총관객수예측에사용될중요한변수들이다. 그러나개봉전블로그수를제외한개봉전 OWOM 변수들은전반적으로좋은예측변수로사용되기어려운결과를보여주고있다. 특히개봉전포털평점은총관객수를예측하는데전혀도움이되지않을것으로예상된다. 관객수와 OWOM 변수들간의산점도행렬인 Figure 4.1에서개봉후평점의경우총관객수가적은영화일지라도저평점부터고평점까지고르게분포한다. 이것은총관객수와개
664 Seonghyeon Jeon, Young Sook Son Table 4.2. Relationship between Audience and each predictors Variable Statistics Total Year Nationality 2012 2013 2014 2015 Domestic Foriegn Daudience Corr. 0.68 0.60 0.68 0.66 0.80 0.68 0.71 p-value 0.000 0.001 0.000 0.000 0.002 0.000 0.000 Dscreen Corr. 0.61 0.64 0.59 0.57 0.71 0.62 0.72 p-value 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Grade Month Season Dirscore Actscore Distscore Nbscore Nbnum Nascore Nanum Dbscore Dbnum Dascore Danum Bblog Ablog Bnews Anews ANOVA 0.009 0.173 0.085 0.342 0.528 0.071 0.019 p-value 0.048 0.115 0.034 0.512 0.909 0.437 0.261 ANOVA 0.010 0.503 0.650 0.501 0.590 0.001 0.012 p-value 0.309 0.674 0.354 0.534 0.455 0.093 0.198 ANOVA 0.007 0.676 0.261 0.223 0.240 0.001 0.640 p-value 0.075 0.846 0.011 0.112 0.692 0.059 0.372 Corr. 0.43 0.42 0.10 0.61 0.58 0.41 0.43 p-value 0.000 0.005 0.000 0.000 0.002 0.000 0.000 Corr. 0.33 0.26 0.50 0.12 0.42 0.30 0.29 p-value 0.001 0.712 0.099 0.798 0.007 0.229 0.017 Corr. 0.14 0.06 0.13 0.25 0.06 0.17 0.05 p-value 0.787 0.125 0.623 0.788 0.384 0.261 0.255 Corr. 0.02 0.04 0.11 0.03 0.12 0.03 0.16 p-value 0.236 0.874 0.912 0.676 0.920 0.668 0.017 Corr. 0.28 0.12 0.53 0.15 0.17 0.25 0.61 p-value 0.000 0.013 0.000 0.037 0.803 0.002 0.000 Corr. 0.37 0.37 0.22 0.41 0.47 0.48 0.34 p-value 0.000 0.073 0.309 0.091 0.242 0.000 0.008 Corr. 0.84 0.66 0.81 0.96 0.96 0.81 0.90 p-value 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Corr. 0.01 0.02 0.03 0.05 0.01 0.01 0.04 p-value 0.699 0.538 0.824 0.250 0.769 0.471 0.437 Corr. 0.30 0.26 0.45 0.55 0.09 0.30 0.48 p-value 0.000 0.030 0.000 0.061 0.435 0.008 0.001 Corr. 0.21 0.27 0.14 0.22 0.25 0.31 0.09 p-value 0.049 0.829 0.619 0.629 0.460 0.138 0.733 Corr. 0.57 0.61 0.61 0.86 0.74 0.56 0.76 p-value 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Corr. 0.46 0.55 0.47 0.63 0.32 0.36 0.63 p-value 0.000 0.001 0.000 0.029 0.063 0.000 0.000 Corr. 0.88 0.91 0.88 0.93 0.84 0.88 0.89 p-value 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Corr. 0.34 0.51 0.50 0.16 0.30 0.29 0.44 p-value 0.000 0.040 0.212 0.425 0.037 0.159 0.000 Corr. 0.80 0.67 0.88 0.86 0.84 0.80 0.87 p-value 0.000 0.000 0.000 0.001 0.000 0.000 0.000 Note: Corr. means correlation coefficient, p-value means the p-value of chi-square test, ANOVA means the p-value of ANOVA test. ( ): highly significant at significance level α = 0.01, ( ): significant at significance level α = 0.05.
Effect of online word-of-mouth variables as predictors of box office 665 Figure 4.1. Scatter plot matrix between Audience and OWOM variables. 봉후평점의상관관계를낮추는원인이된다. 그럼에도불구하고개봉후네이버평점은개봉후다음평점에비해서총관객수예측에다소더도움이될수있다. 상관분석및카이제곱검정결과영화속성에관한변수들중에서개봉일관객수와개봉일스크린수는개봉시점에영화의흥행여부를판단할수있는중요한예측변수가될수있음을보인다. 그외에감독점수가배우점수에비해서다소더좋은예측변수일수있으며배급사점수는중요하지않다. 질적변수에해당되는등급, 개봉월, 개봉계절변수에대해서는 ANOVA 검정결과연도별로보았을때거의대부분유의하지않지만전체데이터및국적별데이터에서는국외영화에대한개봉계절변수를제외하고대체로모두유의하였다. 감독점수및네이버평점의경우도유독 2013년엔다른해와다른결과를준다. 즉, 어느해의자료를쓰느냐에따라서선택되는주요한예측변수는달라질수있다. 이것은이미 2절에서언급되었던여러연구에서중요하게선택되는예측변수가다른이유가될수있다. 의사결정나무는의사결정규칙을나무구조형태로도표화하여목표변수를분류하거나예측하는분석방법으로서가장핵심이되는예측변수의선정을할수있으며분류및예측결과의해석이쉬운장점이있다. 이절에서는또다른예측변수선정방법으로서의사결정나무를활용하였다. 보통 1,000만영화, 대박영화, 중박영화로부르는기준인총관객수 1,000만이상, 500만이상, 300만이상을기준으로각영화의총관객수가기준값보다클경우이항범주형목표변수값으로 1의값을주고, 기준값보다작을경우 0의값을주었다. 분리규칙은최대가지의수를 2로하고최대깊이를 5, 최소범주형크기를 5로하였다. 분리기준은카이제곱검정의유의수준을 0.2로주고분석하였다.
666 Seonghyeon Jeon, Young Sook Son (a) Audience criterion: 10 million (b) Audience criterion: 5 million Figure 4.2. Classification of box office by decision tree. (c) Audience criterion: 3 million Figure 4.2(a) 는목표변수를총관객수 1,000 만을기준으로한분석결과이다. Table 2.1 에서정의된 예측변수들중에서가장영향력있는예측변수로서네이버포털개봉후평가자수와개봉후뉴스수가 우선적으로선택된것을알수있다. 네이버포털개봉후평가자수가 27,400 이상이고개봉후뉴스수
Effect of online word-of-mouth variables as predictors of box office 667 가 8,212이상인영화들의 100% 는 1,000만관객을넘긴영화라는것을나타낸다. 네이버포털개봉후평가자수가 27,400미만인 262편의영화들중 99.6% 는 1,000만관객을넘지못한영화임을보인다. Figure 4.2(b) 는총관객수 500만을기준으로한분석결과이다. 네이버포털개봉후평가자수, 개봉후뉴스수, 그리고개봉일관객수가중요한예측변수로선택된것을알수있다. 네이버포털개봉후평가자수가 13,050.5이상이고개봉후뉴스수가 4,984이상인영화들의 100% 는 500만관객을넘긴영화라는것을나타낸다. 네이버포털개봉후평가자수가 13,050.5미만인 227편의모든영화는 500만관객을넘지못한영화임을보인다. Figure 4.2(c) 는총관객수 300만을기준으로한분석결과이다. 네이버포털개봉후평가자수와감독점수가선택된것을알수있다. 네이버포털개봉후평가자수가 11,972이상인영화들중 96.4% 는 300만관객을넘긴영화들이고네이버포털개봉후평가자수가 8121.5미만인영화들중 96.2% 는 300만관객을넘기지못한영화들을나타낸다. 1,000만, 500만, 그리고 300만의 3가지총관객수기준으로볼때공통적으로모든의사결정나무분석결과에나타난네이버포털개봉후평가자수가영화의성공을좌우하는가장중요한변수로나타났다. 개봉후뉴스수도총관객수를 1,000만, 500만을기준으로하였을때성공을좌우하는중요한 OWOM 변수이다. 상관분석, 카이제곱독립성검정, ANOVA 검정, 그리고의사결정나무분석의결과로부터 2012년부터 2015년까지의 3년간통합자료, 혹은년도별자료, 그리고국내외자료등어느자료를사용하든지포털의개봉후평가자수, 개봉후블로그수, 개봉후뉴스수와같은개봉후 OWOM의크기를나타내는변수들이 OWOM의방향성을나타내는포털의개봉후평점그리고영화의내재적인속성을나타내는변수들인감독, 배우, 배급사, 등급, 국적, 개봉월, 개봉계절등의변수들에비해영화흥행과의연관성이상대적으로더높다. 5. 영화의성공과온라인구전크기와의연관성본연구에서는편의상영화의경제적성공을판단하는기준으로영화의수익성대신총관객수로판단하기로하였다. 포털영화평점은일반네티즌들이내린각영화에대한종합적인평가로서포털영화평점으로높은점수를받은영화는물질적성공과는다른면에서성공한영화라고할수있다. 이제총관객수와포털개봉후평점을영화의성공지표변수군으로놓고 4절에서관객수예측에매우영향력있는변수로판단된포털개봉후평가자수, 개봉후블로그수, 개봉후뉴스수를 OWOM 크기변수군으로놓는다. 정준상관분석은변수집단간의연관성을다루는통계분석방법이다. 이절에서는정준상관분석에의해영화의성공변수군과 OWOM 크기변수군간의연관성을알아보고자한다. 변수들간의단위가다르기때문에표준화과정을거친후에영화의성공변수군과 OWOM 크기변수군간의제1정준상관함수의분석결과가 Table 5.1에제시되었다. 제2정준상관함수의경우설명력이 1.6% 밖에되지않아분석결과에서제외시켰다. 제1정준상관계수는 0.9257로두변수군간에강한양의상관관계가존재함을보인다. 제1정준상관함수의 Wilk s lambda의값은 0.1297로유의수준 0.05하에서유의한결과를보였다. 정준중복지수의값은 0.6123으로제1정준상관함수의설명력이약 61.2% 로나타났다. 본논문에서는두변수군간의관계를설명하는데표준화된정준상관계수와정준적재량중해석에더용이한정준적재량을이용하였고이값이절댓값 0.3이상인것을기준으로해석하였다. 정준적재량의값이모두같은부호를가지므로두변수군간의관계가같은방향임을나타낸다. 영화의성공지표변
668 Seonghyeon Jeon, Young Sook Son Table 5.1. Results of canonical correlation analysis Factors Canonical function 1 Standardized canonical Canonical loadings Correlation coefficient Movie success indicator Audience 1.0085 0.9998 Nascore 0.0360 0.3505 Dascore 0.0216 0.2024 OWOM scale Nanum 0.6480 0.9075 Danum 0.2502 0.6183 Ablog 0.4090 0.9505 Anews 0.2055 0.8654 Canonical correlation: 0.9257 Redundancy coefficient: 0.6123 Wilk s lambda: 0.1297 p-value: 0.000 수군에서정준적재량값이총관객수는 0.9998로매우높아 OWOM 크기변수군과매우높은연관성을가지며, 네이버포털개봉후평점은 0.3505로 OWOM 크기변수군과어느정도관계가있다는것을보여준다. 다음포털개봉후평점의정준적재량값은 0.2024로네이버포털평점에비해서 OWOM 크기변수군과연관이더적음을나타낸다. 영화의성공을나타내는변수들중총관객수의경우 OWOM 크기변수군과매우연관성이높기때문에 OWOM 크기변수들이중요함을나타낸다. OWOM 크기변수군에서는정준적재량값이개봉후블로그수는 0.9505, 네이버포털개봉후평가자수는 0.9075, 개봉후뉴스수는 0.8654, 다음포털개봉후평가자수는 0.6183의순서로높게나타났다. 즉, 총관객수및포털영화평점을종합한영화의성공지표에는개봉후블로그수가가장큰영향력이있음을보였고, 네이버포털개봉후평가자수와개봉후뉴스수역시큰영향력을보였다. 다음포털개봉후평가자수의경우네이버포털개봉후평가자수에비해영향력이떨어짐을알수있다. 6. 관객수그룹별온라인구전효과의비교이절에서는총관객수그룹별 OWOM 변수의특징을살펴보기로한다. Figure 6.1의상자그림은 OWOM 변수들과총관객수와의관련성을잘표현하고있다. 가로축은 Table 4.1에서정의한 5개총관객수그룹의번호를표시하였고세로축은각 OWOM 변수에해당되는값을나타내었다. 포털평점을제외한개봉후포털평가자수, 개봉후블로그수, 개봉후뉴스수는총관객수가많아질수록확연히증가하는경향을보인다. 이는 Table 4.2에서보았던높은상관계수로부터예견할수있다. 그러나네이버포털평점은 1,000만이상인그룹은비교적산포가작으면서높은평점을가지지만그외모든그룹에서저평점부터고평점까지널리분포할정도로산포가매우큰편이다. 다음포털평점은특히 1,000만이상그룹에서도산포가크다. 포털평가자수는대체적으로산포가작게나타났고뉴스수의경우는 1,000만이상그룹에서산포가크게나타났다. Figure 6.2부터 Figure 6.4는영화총관객수그룹에따른각포털사이트에서 OWOM 변수의특징을파악하기위한산점도를보여준다. 영화이름은비교를위한경우나특이값인경우에만표시하였다.
Effect of online word-of-mouth variables as predictors of box office 669 (a) Nascore (b) Dascore (c) Nanum (d) Danum (e) Ablog (f) Anews Figure 6.1. Box plot of OWOM variables by Audience group. Figure 6.2와 Figure 6.3의경우지면관계상네이버포털변수의경우만나타내었지만다음포털변수도네이버포털변수와비슷한결과를주었다. Figure 6.2는네이버포털개봉전평점을가로축으로, 네이버포털개봉후평점을세로축으로나타낸산점도이다. 전체그룹산점도에서대각선을기준으로위쪽에분포되어있는영화들은개봉전에비해개봉후에평점이높아진영화들이고, 아래쪽에분포있는영화들은개봉전에비해개봉후에평점이낮아진영화들이다. 몇몇영화들을제외하면대체적으로개봉전에비해개봉후에평점이낮아지는경향을보인다. 1,000만이상그룹에서영화 변호인 은개봉전에낮은평점 6.07을받았음에도불구하고개봉후에높은평점 8.96을받았다. 300 500만그룹의영화 타짜-신의손 과 100 300만그룹의영화 뷰티인사이드 역시마찬가지이다. 반면 1,000만이상그룹의영화 도둑들, 500 1,000만그룹의영화 숨바꼭질, 50 100만그룹의영화 미쓰GO 는개봉전에비해개봉후평점이매우낮게나타난다. Figure 6.3은네이버포털개봉후평점을가로축으로, 네이버포털개봉후평가자수를세로축으로나타낸산점도이다. 총관객수가많아질수록평가자수역시많아진다. 영화 변호인 과 명량 은매우높은평가자수값을가진다. 특히 변호인 은이상치로평가된다. 100 300만그룹에서영화 26년 은낮은총관객수그룹에속함에도불구하고평가자수가매우높은이상치이다. 영화 변호인 과 26년 이정치적으로이슈가되었던영화인것을데이터가잘설명해주고있다. 평점의경우대체적으로총관객수가많아질수록낮은평점을받은영화의수가줄어드는경향을보이지만, 총관객수가낮은그룹에서도높은평점을받은영화들이다수분포되어있다. 낮은평점을받게되면흥행하기힘들지만높은평점을받는다고해서꼭흥행하는것이아님을보여준다.
670 Seonghyeon Jeon, Young Sook Son Figure 6.2. Scatter plot of Nbscore(Naver portal rating before release) vs. Nascore(Naver portal rating after release) by Audience group. Figure 6.3. Scatter plot of Nascore(Naver portal rating after release) vs. Nanum(Number of naver portal rater after release) by Audience group.
Effect of online word-of-mouth variables as predictors of box office 671 Figure 6.4. Scatter plot of Dascore(Daum portal rating after release) vs. Nascore(Naver portal rating after release) by Audience group. Figure 6.4는다음포털개봉후평점을가로축으로, 네이버포털개봉후평점을세로축으로나타낸산점도이다. 전체산점도를보면네이버포털이다음포털에비해대체적으로평점이높게나타난다. 다음포털에서는정치및사회적이슈가되었던영화들로서 변호인, 부러진화살, 26년 과같은영화들의평점이높았지만 국제시장, 연평해전 과같은영화들의평점은상대적으로낮았다. 반면네이버포털에서는 국제시장, 연평해전 과같은영화들의평점이매우높게나타났고 어벤져스 : 에이지오브울트론, 인터스텔라, 메이즈러너 : 스코치트라이얼 등과같은스토리중심의영화라기보다오락성이주가되는영화들의평점이다음포털에비해높았다. 이는각포털사이트에서활동하는네티즌들의관심및정치적성향차이라고보여진다. 수상한그녀, 크루즈패밀리 등처럼가족물, 코미디, 애니메이션장르의영화들은거의비슷한평점을받았다. 7. 개별영화의온라인구전효과비교요인분석은변수들간의내재된상호연관성을분석하여유사한변수끼리묶어적은수의요인으로내재적의미를해석하는통계적분석방법이다. 총관객수와 OWOM 변수즉, 포털의개봉후평점, 포털의개봉후평가자수, 개봉후블로그수, 개봉후뉴스수를표준화하여요인분석을실시하였다. 요인의크기를정하는 Scree Test에의해요인을 3개로정하였고, 요인구조를단순화하기위한방법으로 Varimax 직교회전을사용하였다. 요인해석을위한 cutoff 값으로 0.4를사용하기로하였다. Table 7.1은요인적재값을나타낸다. 3개의요인에의하여약 86.5% 의설명력을가진다. 첫번째요인의경우총관객수, 네이버포털평가자수, 개봉후블로그수, 개봉후뉴스수가포함되었고두번째요인에는네이버및다음포털의개봉후평점이포함되었고, 세번째요인에는네이버및다음포털의개봉후평가자수가포함되었다. 첫번째요인은대중의많은관심과애호속에수익을얻은영화인지
672 Seonghyeon Jeon, Young Sook Son Table 7.1. Results of factor analysis Variables Loadings (cutoff = 0.4) Factor 1 Factor 2 Factor 3 Audience 0.914 0.172 0.246 Nascore 0.223 0.972 0.021 Nanum 0.721 0.120 0.623 Dascore 0.043 0.822 0.119 Danum 0.365 0.060 0.914 Ablog 0.881 0.138 0.228 Anews 0.804 0.070 0.227 Sums of squared loadings 2.963 1.693 1.402 Proportion of variance 0.423 0.242 0.200 Cumulative proportion of variance 0.423 0.665 0.865 Figure 7.1. Factor scores plot of Factor 1 vs. Factor 2. 를나타내는 영화흥행성공 요인, 두번째요인은 포털네티즌들의평가 요인, 세번째요인은영화에대한 포털네티즌들의관심도 라고정의할수있다. Figure 7.1은가로축에 Factor 1( 영화흥행성공 ) 요인을세로축에 Factor 2( 포털네티즌들의평가 ) 요인을나타낸인자점수 (factor score) 도표이다. 제1사분면에나타난영화들은흥행에성공했고포털에서의평가또한좋은영화들이라고할수있다. 대표적으로영화 베테랑, 국제시장, 암살, 광해 : 왕이된남자, 겨울왕국, 인터스텔라, 7번방의선물 등이속한다. 제4사분면에나타난영화들은흥행성공에걸맞은평가를받지못한영화들이라판단할수있다. 영화 명량 의경우흥행에는가장성공했지만포털에서의평가가상대적으로다소낮다. 영화 도둑들 역시흥행성공에비해포털에서의평가가낮은편이다. 제2사분면의윗쪽에위치한 변호인 은양포털에서의높은평가에비해서는다소부족한흥행성적으로평가할수있다. 대다수의영화들은흥행성적이저조한편이다.
Effect of online word-of-mouth variables as predictors of box office 673 Figure 7.2. Factor scores plot of Factor 2 vs. Factor 3. Figure 7.2는가로축에 Factor 2( 포털네티즌들의평가 ) 요인과세로축에 Factor 3( 포털네티즌들의관심도 ) 요인을나타낸인자점수도표이다. 제1사분면의영화들은네이버와다음두포털네티즌들로부터많은관심과좋은평가를받았고제2사분면의영화들은평가에비해많은관심을받았다고볼수있다. 세로축에서높은값을보이는영화들은포털네티즌들사이에서이슈화가된영화들이다. 영화 변호인 의경우관심을매우많이받았고두포털네티즌들로부터평가또한매우좋은영화로나타난다. 반면영화 26년 은핫이슈에걸맞게좋은평가를받지는못했다. Figure 7.3은가로축에 Factor 1( 영화흥행성공 ) 요인을세로축에 Factor 3( 포털네티즌들의관심도 ) 요인을나타낸인자점수도표이다. 영화 명량 은제1사분면에서, 변호인, 26년 은제2사분면에서이상치로나타났다. 즉, 변호인 및 26년은양포털에서의매우높은관심에비해서흥행성적이따라잡지못하였고 명량 은한국영화사상최고의흥행성적에비해양포털의관심도는다소낮았다고해석할수있다. 별도표 (star plot) 는다변량자료의그래픽표현에의해관측치들간의특성을동시에비교할수있게하는유용한도표이다. 본연구에서는각영화의총관객수및포털개봉후평점, 포털개봉후평가자수, 개봉후블로그수, 개봉후뉴스수와같은 OWOM 변수들을사용하여개별영화가갖는이들변수의특성을별도표에의해한눈에비교하고자한다. 포털평점의경우산포가작고정규분포의형태를띠고있어서그대로사용하였고총관객수, 포털평가자수, 블로그수, 뉴스수와같이이상치가존재하고산포가큰변수들에대해서는로그변환과정을거쳤다. Figure 7.4는 5개의총관객수그룹별로그린별도표이다. 지면관계상각그룹마다총관객수상위 1위, 2위인영화들과특이한형태를보이는 1편의영화를추가하여각그룹별로 3편씩의영화만제시하였다. Figure 7.4(a) 의 1,000만이상그룹의별도표에는총관객수가각 1, 2위에해당하는 명량, 국제시
674 Seonghyeon Jeon, Young Sook Son Figure 7.3. Factor scores plot of Factor 1 vs. Factor 3. 장 을기본으로포함하고총관객수 8위에기록된 변호인 을특색있는영화로추가하였다. 명량 과 국제시장 은다음포털의평가가상대적으로낮은점이눈에띈다. 별그림의크기로보았을때전체영화 276개중에서영화 변호인 의별그림이가장큰 7각형을나타낸다. 이는모든변수들이높은값을가지고있는것을의미하는것으로비록총관객수가가장높은영화는아니지만이영화는대중들의최고의관심및평가를받았으며총관객수면에서도크게성공한영화라고할수있다. Figure 7.4(b) 의 500 1,000만그룹에서총관객수의별도표에는총관객수가각 1, 2위에해당하는 설국열차, 관상 이포함되었다. 이그룹에서대부분의영화들은개봉후블로그수, 개봉후뉴스수가높게나타난다. 영화 설국열차 는관심도는높은반면에포털평가가낮은편이다. 영화 관상 은관심도와평가가낮은데에비해상대적으로총관객수가높다고볼수있다. 14위에해당되는영화 연평해전 은다음포털에서의평가가이례적으로매우낮은특징이있다. Figure 7.4(c) 의 300 500만그룹에서총관객수 1위인영화 인사이드아웃 은다음포털의평가자수가비교적적은반면평점은높은편이고, 총관객수 2위인 바람과함께사라지다 는전체적인변수들의값이작게나타난다. 총관객수 25위에해당되는영화 신의한수 는개봉후뉴스수가매우높은데이는주연배우의영향력이큰것으로판단된다. Figure 7.4(d) 의 100 300만그룹에서총관객수 1위임에도불구하고 친구 2 는 7각형의크기가매우작은모양을보여준다. 즉, 모든변수들의값이작다. 총관객수 2위인 26년 은포털개봉후평가자수가매우많아포털네티즌들사이에서큰이슈가되었던영화이지만네이버포털에서는다음포털에서와는달리매우낮은평가를받았다. 총관객수 9위에해당되는애니메이션영화인 빅히어로 는네이버포털개봉후평점이다른영화들에비해매우높은값을가진다. Figure 7.4(e) 의 50 100만그룹에서총관객수 1위인 방황하는칼날 은매우작은 7각형의모양을보여대중들의관심과호평을받지못한영화임을알수있다. 이에반해총관객수 2위인 미쓰와이프
Effect of online word-of-mouth variables as predictors of box office 675 (a) More than 10 million group (1st, 2nd, 8th) (b) Between 5 and 10 million group (1st, 2nd, 14th) (c) Between 3 and 5 million group (1st, 2nd, 25th) (d) Between 1 and 3 million group (1st, 2nd, 9th) Figure 7.4. Star plot by Audience group. (e) Less than 1 million group (1st, 2nd, 31th)
676 Seonghyeon Jeon, Young Sook Son 는흥행엔실패했지만포털네티즌으로부터호평을받았다고볼수있다. 총관객수 31위인영화 손님 은높은개봉후블로그수및개봉후뉴스수에비해포털평점및평가자수그리고총관객수가매우낮다. 즉, 블로그와뉴스에서의관심도가매우컸음에도불구하고대중의관심과호평을받지못하였으며흥행에도실패했다. 8. 결론본연구에서는영화에대한네이버및다음포털의평점과평가자수, 블로그수, 뉴스수와같은온라인구전 (OWOM) 변수들이영화의경제적성공을나타내는총관객수예측에영향력있는변수인지를알아보기위해서 2012년부터 2015년까지 4년동안국내에서상영된총관객수 50만이상의영화 276편을대상으로통계적자료분석을수행하였다. 통계분석결과포털의개봉후평가자수, 개봉후블로그수, 개봉후뉴스수와같은 OWOM의크기를나타내는변수들이 OWOM의방향성을나타내는포털의개봉후평점그리고영화의내재적인속성을나타내는변수들인감독, 배우, 배급사, 등급, 국적, 개봉월, 개봉계절등의변수들에비해영화흥행과의연관성이상대적으로더높음을알수있었다. 한편분석에사용된영화데이터의연도별, 국적별자료에따라또는사용통계분석기법에따라예측변수들간의중요성에차이가있지만네이버포털의개봉후평가자수, 개봉후블로그수, 그리고개봉후뉴스수는일관성있게중요한예측변수로나타났다. 기존관련연구에서포털평점은때때로주요한예측변수로다루어져왔다. 그러나적은총관객수를가진영화들도포털의개봉후평점이높은영화들이다수존재하여포털개봉후평점을총관객수예측변수로서사용하기에는적절하지않음을볼수있었다. 총관객수예측문제는영화산업분야에서매우중요한문제이다. 이분야에서예측은시간에따른투자와관련이있어영화개봉전초기단계에서는영화의내재적인속성변수만을예측변수로사용가능하다. 그후시간이흘러개봉전에는 OWOM 변수중에서는개봉전블로그수가유용한예측변수로더해질수있음을보았다. 개봉일, 개봉 1주, 2주후에는각그시점에서의네이버포털평가자수, 블로그수, 뉴스수, 총관객수, 스크린수를매우유용한예측변수로추천한다. 개봉후 OWOM 크기변수들이영화속성변수들보다총관객수예측에더높은관련성을보이지만이들개봉후 OWOM 변수들은영화상영이모두마쳤거나혹은개봉후석달이지났을때자료를얻게되므로이자료들이초기시점의예측에직접사용될수는없다. 그러나이들각시점에서이들변수들을추정하여간접적으로사용할수있다. 이와같은본연구결과에근거하여다중회귀모형, 다항로짓모형, 신경망모형, 의사결정모형, SVM(support vector machine) 과같은다양한확률통계모형에의해총관객수를예측하는주제를후속연구로진행하고있다. 본연구에서는그외에인자점수도표혹은별도표를활용하여개별영화들이갖는 OWOM 변수의특징을살펴보았다. 특히영화 변호인 이두주요포털사이트로부터동시에높은평가와더불어네티즌들의지대한관심그리고 1,000만관객영화명단에이름을올린성공적인영화로드러났다. References Bae, J., Shim, B. J., and Kim, B.-D. (2010). Simultaneous effect between ewom and revenues: Korea movie industry, Asia Marketing Journal, 12, 1 25. Kim, S. H. and Han, J. M. (2014). An analysis of motion picture box office performance: focusing on Korean movies released in 2012, Institute of Social Science, 53, 191 214. Kim, S.-Y., Im, S., and Jung, Y. (2010). A comparison study of the determinants of performance of motion pictures: art film vs. commercial film, The Journal of the Korea Contents Association, 10, 381 393.
Effect of online word-of-mouth variables as predictors of box office 677 Kim, Y. H. and Hong, J. H. (2011). A study for the development of motion picture box-office prediction model, The Korean Journal of Applied Statistics, 18, 859 869. Kim, Y. H. and Hong, J. H. (2013). A study for the drivers of movie box-office performance, The Korean Journal of Applied Statistics, 26, 441 450. Korean Film Council (2013). 2012 Korean film industry settlement, Korean Film, 35, 20 31. Korean Film Council (2014). 2013 Korean film industry settlement, Korean Film, 47, 16 33. Korean Film Council (2015). 2014 Korean film industry settlement, Korean Film, 59, 15 32. Korean Film Council (2016). 2015 Korean film industry settlement, Korean Film, 71, 12 27. Lee, I. H. and Cho, S. B. (2014). The analysis of the relationship between the box-office performance and the movie attributes using a quantile regression, Journal of the Korea Management Engineers Society, 19, 117 134. Liu, Y. (2006). Word of mouth for movies: its dynamics and impact on box office revenue, Journal of Marketing, 70, 74 89. Park, S.-H., Song, H.-J., and Jung, W.-K. (2011). The determinants of motion picture box office performance: evidence from Korean movies released in 2009 2010, Journal of Communication Science, 11, 231 258. Sadikov, E., Parameswaran, A., and Venetis, P. (2009). Blogs as predictors of movie success. In Proceedings of the Third International ICWSM Conference, 304 307. Yim, J. Y. and Hwang, B. Y. (2014). Data engineering: predicting movie success based on machine learning using twitter, KIPS Transactions on Software and Data Engineering, 3, 263 270.
678 Seonghyeon Jeon, Young Sook Son 영화흥행예측변수로서온라인구전변수의효과 전성현 a 손영숙 a,1 a 전남대학교통계학과 (2016 년 3 월 3 일접수, 2016 년 4 월 21 일수정, 2016 년 4 월 26 일채택 ) 요약본연구는영화흥행에미치는온라인구전변수들의영향을다루었다. 2012 년부터 2015 년까지 4 년동안국내에서개봉한총관객수 50 만이상인 276 편의영화에대한통계분석결과개봉후포털의평가자수, 개봉후블로그수, 개봉후뉴스수와같은온라인구전의크기를나타내는변수들이온라인구전의방향을나타내는개봉후포털의평점이나혹은영화의내재적속성을나타내는변수들로서감독, 배우, 배급사, 등급, 국적, 개봉월, 개봉계절등보다영화흥행과더욱연관성이있었다. 주요용어 : 영화흥행예측변수, 온라인구전변수, 상관계수, 분산분석검정, 카이제곱검정, 의사결정나 무, 정준상관분석, 인자점수도표, 별도표 이논문은 2011 년도정부 ( 교육과학기술부 ) 의재원으로한국연구재단의기초연구사업지원을받아수행된것임 (NRF-2011-0022864). 1 교신저자 : (61186) 광주광역시북구용봉로 77( 용봉동 ), 전남대학교통계학과. E-mail: ysson@jnu.ac.kr