ISSN 2288-4866 (Print) ISSN 2288-4882 (Online) http://www.jiisonline.org J Intell Inform Syst 2014 March: 20(1): 49~65 http://dx.doi.org/10.13088/jiis.2014.20.1.049 오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 * 진위 한양대학교 일반대학원 경영학과 (jinyulogin@hotmail.com) 김정수 한양대학교 일반대학원 경영학과 (lost17@hanyang.ac.kr) 김종우 한양대학교 경영대학 경영학부 (kjw@hanyang.ac.kr) 구전(WOM: Word of Mouth)는 주변 사람들에게 상품에 대한 경험을 입에서 입으로 전달하는 현상을 말하며 소셜 미 디어의 발전으로 온라인 구전(eWOM: Electronic Word of Mouth) 형태로 발전하였다. 구전 효과의 중요성으로 인해서 대부분의 기업들의 자사의 상품이나 서비스에 대한 온라인 구전에 촉각을 세우고 있으며, 특히 영화와 같은 경험재의 경 우에는 그 영향력이 더욱 크다. 본 연구에서는 영화 커뮤니티에 대한 사회 네트워크 분석을 통해서 영화 흥행성과 지표인 매출에 미치는 영향요인을 규명하고자 한다. 영화 흥행성과 연구들에서 주요하게 다루어진 영화에 대한 구전의 크기 (volume)와 방향성(valence)과 같은 구전 요인들을 추가하여, 구전 네트워크의 중심성 척도를 영향 요인에 고려하였다. 구전의 크기, 방향성, 그리고 3가지 중심성 척도(연결 중심성, 매개 중심성, 근접 중심성)의 최종 영화 매출에 영향 관계 를 가설로 설정하였다. 제시한 연구 모형을 검증하기 위하여 대표적인 온라인 영화 커뮤니티 사이트인 IMDb(Internet Movie Database)에서 영화 구전 데이터를 수집하였고, Box-Office-Mojo사이트에서 영화 매출 데이터를 수집하였다. 2012년 9월부터 1년 동안, 주간 Top-10에 포함된 적이 있는 영화들을 대상으로 하였으며, 총 103개의 영화가 선정되어 이 영화들에 대한 메타 데이터와 커뮤니티 데이터가 수집되었다. 영화 커뮤니티 네트워크는 평가자들간의 댓글 관계를 기초로 구축하였다. 본 연구에서 사용한 3가지 중심성 척도는 사회 네트워크 분석 도구인 NodeXL을 사용하여 계산되었 으며, 각 영화별 커뮤니티 참여자들의 중심성 척도의 평균값을 활용하였다. 가설 검증의 사전 분석을 위한 상관관계 분석 에서는 3가지 중심성 척도간에 상관 관계가 높은 것으로 파악되어서, 각각에 대하여 별도로 회귀분석을 수행하였다. 분 석 결과, 기존 연구와 일관성 있게 구전의 크기와 방향성은 영화 성과지표인 최종 매출에 긍정적인 영향을 미치는 것으로 파악되었다. 또한 구전 네트워크 내의 참여자 매개중심성 평균은 영화의 최종 매출에 영향을 미치는 것으로 파악되었다. 하지만 연결중심성과 근접중심성은 최종 매출에 영향을 주지 못하는 것으로 나타났다. 주제어 : 네트워크 분석, 온라인 구전, 온라인 영화 커뮤니티 논문접수일 : 2014년 2월 6일 논문수정일 : 2014년 3월 3일 게재확정일 : 2014년 3월 6일 투고유형 : 국문일반 교신저자 : 김종우 1. 서론 일반적으로 소비자들은 상품을 구매하기 전에 비슷한 경험을 가진 다른 사람들의 의견에 귀를 기울이는 경향이 있다(Jung, 2013). 구전(WOM: Word of Mouth)은 주변 사람들에게 상품에 대한 경험을 입에서 입으로 전달하는 현상으로 인터 넷의 보급과 대중화로 시간과 지리적인 제약을 받지 않는 온라인 구전(eWOM: Electronic Word of Mouth)형태로 변화되었다(Lee and Park, 2006). 온라인 구전 마케팅은 기업이 소비자들에 게 일방적으로 제품 및 서비스에 대한 정보를 제 * 이 논문은 2011년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 연구되었음(NRF-2011-327-B00186) 49
진위 김정수 김종우 공하는 광고나 홍보 등과는 달리, 고객 상호간에 양방향으로 전파되는 특징을 가지고 있으며, 소 비자들은 자발적인 참여를 통해서 파급효과를 극대화 될 수 있다(Lee and Park, 2006). 특히 소 비자들은 영화와 같은 경험재를 선택할 시에 다 른 상품들에 비하여 온라인 영화 커뮤니티에서 형성된 구전 정보에 더욱 의존하는 경향을 보이 고 있다(Kim, 2003; Senecal and Nantel, 2004). 이 것은 경험재 상품의 경우 소비하지 않고서는 상 품의 가치를 정확하게 확인 할 수 없기 때문이다 (Park and Park, 2001; Lee, 2004). 따라서 소비자 들은 스스로의 구매 위험을 감소시키기 위하여 미리 경험한 소비자들의 의견을 받고 구매의사 결정을 내리게 된다(Lee et al., 2012). 이러한 상 품 커뮤니티의 중요성으로 인해 많은 기업들이 온라인 구전을 통해 소비자들의 의견에 촉각을 곤두세우고 있다(Kim and Kim, 2013). 영화는 막대한 제작비를 투자하고 실패하는 경우 투자 원금도 회수하지 못 할 수 있는 높은 불확실성이 존재한다. 그러나 영화는 흥행을 통 해 관객에 따른 매출 향상뿐만 아니라 영화라는 하나의 소스를 통해 다양한 부가적인 수익을 창 출할 수 있기에 많은 기업들은 영화 산업에서 지 속적으로 투자를 하고 있다(Ahn and Kim, 2003). 이처럼 영화는 고수익 고위험의 특성을 가지고 있다. 새로운 영화 개봉 이후에 성패 여부가 기 업의 존속에 있어서 중요한 만큼 영화에 대한 흥 행성과에 영향을 미치는 요인들을 파악하는 것 은 영화 산업에 있어서 주요한 이슈이며, 이에 대한 관련 연구들이 과거부터 현재까지 진행되 고 있다(Ahn and Kim, 2003). 기존의 여러 연구 들에서 온라인 구전 정보의 특성들이 영화 매출 에 영향을 준다는 것으로 파악되었으며, 특히 정 보의 양을 나타나는 구전의 크기와 정보의 긍 부 정 정도를 나타내는 방향성이 영화 성과지표인 매출에 영향을 준다는 결과를 제시하고 있다 (Bae et al., 2010). 사회적 공동체에서 사람들 간의 상호작용에 관한 다양한 관계를 연구하는 것이 사회 네트워 크 분석(SNA: Social Network Analysis)이다(Cho and Bang). 사회 네트워크 분석은 자연과학 뿐만 아니라 사회학, 경제학, 경영학을 비롯한 다양한 분야에서 활발히 적용되고 있다(Kim, 2012). 경 영학의 한 분야인 마케팅 분야에서는 소비자 간 의 교류되는 구전 행위들을 네트워크 분석을 통 해 파악하려는 연구들이 진행되었다(Money et al., 1998). 따라서 소비자들 간에 발생되는 영화 에 대한 구전 커뮤니티에 대한 네트워크 분석을 통해서, 영화 흥행성과에 네트워크 구조가 어떻 게 영향을 미치는지에 대한 연구도 흥미로운 주 제이다. 따라서, 본 연구의 목적은 영화 산업과 온라인 구전과의 관계를 다룬 기존 연구에서 주 로 다루어졌던 구전의 크기와 방향성 뿐만 아니 라, 기존 연구에서 잘 다루어지지 않았던 영화에 관한 온라인 커뮤니티 상의 구전 참여자들의 네 트워크 중심성(연결, 매개, 근접중심성)이 영화 흥행성과 지표인 매출에 어떠한 영향을 미치는 지를 살펴보고자 한다. 2. 이론적 배경 2.1 구전과 온라인 구전 구전 커뮤니케이션(WOM: Word of Mouth)은 제품과 서비스에 대해 자신들의 상업적 이익과 는 무관하게 소비자들 간의 직접적인 대화나 전 화 등과 같은 의견을 교환하는 것을 의미한다. 50
오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 또한 구전은 기업에서 제공하는 광고에 대해 주 변 친구 및 동료들과 그 내용을 교류하는 과정으 로서, 이와 같은 구전은 주변 사람들에게 강력 한 설득력을 가지고 있다. 즉 구전은 오랫동안 소비자들이 기업의 제품 및 서비스에 대한 선택 과 구매에 있어서 중요한 요인으로 인식되고 있 다(Yi and Lee, 2010; Aaker and Myers, 1982). 따 라서 이런 구전효과는 소비자들 사이에서 발생 하는 대인 커뮤니케이션을 의미하며, 그들 간에 발생하는 기업, 브랜드, 제품 및 서비스에 대한 경험적 의견 교류를 통해서 소비자들이 전달자 로서의 역할을 겸하게 되는 특징을 가지고 있다. 온라인 구전이란 인터넷 상에 발생하는 커뮤 니케이션을 말하며, 메일이나 하이퍼텍스트를 매개로 소비자들 간에 제품이나 서비스에 대한 직 간접적 경험을 통해 얻어진 긍정 부정적 정보 를 교환하는 커뮤니케이션의 한 형태 또는 과정 이라고 할 수 있다(Sung et al., 2002). 과거에 소 비자들의 구전은 면대면(Face to Face) 형태의 커 뮤니케이션으로 한정되었지만, 최근 인터넷의 급속한 발달로 인해 오프라인에서는 상상할 수 없는 온라인 구전 정보가 빠르고도 쉽게 퍼져나 가고 있다(Kim and Kim, 2013). 이는 오프라인에 서 주로 소수의 의견 선도자(Opinion Leader)들 이 정보의 흐름을 주도하였지만 온라인 상의 소 비자들 간에 발생한 구전은 기업의 제품 및 서비 스에 대한 정보를 대량으로 생산하고 공유할 수 있게 되었다(Park and Suh, 2013). 이렇듯 과거 마케팅 환경에서는 기업에 의해서 일방적으로 소비자들에게 제품 및 서비스에 대한 광고나 홍 보로 전달하였지만, 최근 인터넷의 발달로 인해 소비자들은 기업과의 양방향 커뮤니케이션이 가 능해졌다. 2.2 영화의 흥행 요인으로서의 구전효과에 대한 연구 영화와 같은 경험재적 성격이 있는 서비스 상 품은 이미 경험한 소비자들의 의견에 의존하는 경향이 높다. 이를 위해서 앞서 이미 경험한 소 비자들의 구전의 한 형태인 관람 후기 등에 대한 정보를 찾게된다(Linton and Petrovich, 1983; Chen et al., 2004). 이런 이유로 최근에는 온라인 상에서 발생하는 영화에 대한 구전효과가 중요 한 요인으로 인식되고 있다. 영화 산업에서 온라 인 구전 연구들을 살펴보면, 영화 흥행성과에 영 향을 주는 다양한 요인들이 연구되었다. Park and Lee(2004)의 연구에서는 신문보도의 게재 시 기와 기사 방향에 따라 관객 동원에 미치는 영향 이 다른 것으로 나타났으며, 개봉 전 3주 기사의 수와 개봉 전 3주의 긍 부정 기사의 수가 영화 흥 행성과에 유의한 영향을 미친다는 결과를 제시 하였다. Bae (2010) 등은 구전의 크기와 방향성 이 영화 매출에 유의한 영향을 준다는 결과를 제 시하였으며, 특히 구전의 크기는 개봉 후 1-8주 기간 영화 매출에 모두 유의한 영향을 미치는 것 으로 파악되었다. Eliashberg and Shugan(1997)은 영화에 대한 평가가 영화 개봉 초기(1주부터 4주 까지) 영화 흥행성과와 상관관계가 작은 반면에 개봉 후반기(5주부터 8주까지) 및 누적 흥행성과 에는 유의한 상관관계가 있음을 제시하였다. Liu(2006)는 야후(Yahoo!) 사이트에서 영화에 대 한 온라인 구전을 수집하여 영화 흥행성과의 관 계를 분석하였는데, 분석 결과 영화 개봉 전과 개봉 후 첫째 주에 구전의 크기가 영화 흥행성과 에 영향을 미치는 것으로 제시하였다. Duan et al.(2008b)의 연구에서는 소비자들의 구매행위와 온라인 구전효과가 강한 상관관계가 있다는 것 51
진위 김정수 김종우 으로 나타났으며, 이를 기초로 하여 온라인 상에 서 영화에 대한 구전의 크기가 영화 판매량에 직 접적으로 영향을 미친다는 연구 결과를 제시하 였다. 2.3 사회 네트워크 분석(Social Network Analysis)의 활용 최근 급속하게 성장한 소셜 미디어의 확산으 로 소비자들 간에 발생하는 온라인 구전의 관계 에 대해 다양한 형태의 사회 네트워크 분석 연구 가 가능해졌다. 일반적으로 사회 네트워크 분석 을 적용하기 위해서는 노드와 연결로 이루어진 그래프(네트워크)를 구성한다. 즉, 네트워크 분 석은 노드들이 어떻게 연결되어 있는가의 문제 및 그 연결 구조의 성질을 파악하고 사회관계에 서 노드가 차지하는 상대적 위치와 관계 구조를 탐색한다. 사회 네트워크 분석을 적용한 Faulkner(1983) 의 영화산업에 관한 연구는 미국 할리우드의 시 나리오 작가와 영화제작자의 거래관계에 대하여 분석하였다. 네트워크 분석에 따르면, 가장 생산 적인 영화제작자 10%가 전체 영화 가운데 약 1/3에 관여하였지만, 가장 생산성이 높은 10%의 시나리오 작가들은 전체 영화 제작 편수 중 5% 이하에 관여했다는 결과를 제시하였다. 이와 마 찬가지로 국내에서도 1990년부터 2000년까지의 한국 영화를 대상으로 분석한 결과 역시 시장의 양극화 현상이 나타는 것을 볼 수 있었다(Park and Shin, 2004). Jung(2003) 등은 2002년 말 국내 영화 6402편에 등장한 7906명의 영화배우를 대 상으로 하여 분석한 결과로 해당 배우들은 평균 적으로 한 다리를 건너면 서로 연결되는 작은 세 계인 것으로 나타났다. 이들 연구에서 흥미로운 점은 국내 배우가 할리우드 진출로 인해 충무로 연결망이 미국의 할리우드 연결망에 연결된 결 과가 나타났다. 이는 네트워크의 약한 연결(weak ties)의 역할이 국내 배우와 할리우드 배우들에게 적용된다는 결과이다. 본 연구에서는 사회 네트워크 분석에서 가장 많이 쓰이는 척도 중에 하나인 중심성() 를 활용하기로 한다. 중심성은 사회 네트워크 내에서 개인이 가지는 영향력 중심에 위치하는 정도를 측정한다. 중심성 지표로는 연결중심성 (degree ), 근접중심성(closeness ), 매개중심성(betweenness ), 아이겐벡터 중심성(eigenvector )등이 있다(Kim et al., 2009 Park and Suh, 2013; Barnett and Danowski, 1992; Broderick et al., 2007; Opsahl et al, 2010). 3. 연구 방법 3.1 연구 모형의 설계 3.1.1 연구 모형 본 연구에서는 온라인 영화 커뮤니티 상의 구 전 네트워크의 중심성(연결, 매개, 근접중심성) 이 영화 흥행성과 지표인 매출에 영향을 미치는 지를 파악하고자 한다. 구체적으로 영화 흥행성 과 연구들에서 주요하게 다루어진 영화에 대한 구전의 크기와 구전의 방향성과 같은 요인들과 본 연구에서 추가적으로 제시하는 영화 구전 네 트워크 중심성이 영화의 성과지표인 매출에 미 치는 영향을 파악하고자 한다. 본 연구에서 측정하고자 하는 영화의 매출은 영화 종영까지 누적된 최종 매출로 정의하였다. 52
오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 영화 개봉 주를 0시점으로 보고, 5주간(t = 0,...,4)의 구전의 크기와 방향성과 함께 네트워 크 평균 중심성이 영화의 최종 매출에 영향을 미 치는지를 실증적으로 검증하기 위해서 <Figure 1>과 같이 연구 모형을 설정하였다. <Figure 1> Research Model 3.1.2 가설 설정 구전의 효과는 제품 성과를 나타나는 매출에 영향을 미치는 주요한 요인으로 마케팅 분야에 서 오랫동안 연구들을 진행해 왔다(Mizerski, 1982; Mahajan et al., 1984). 영화 산업의 특성으 로 흥행성과에 영향을 미치는 다양한 요인들이 연구되었으며, 구전효과는 주요 원인 중 하나로 인식되고 있다. 구전효과를 나타나는 중요한 속성으로는 크기 (volume)와 방향성(valence)이 연구되었다(Duan et al., 2008a; Liu, 2006; Moon et al., 2010; Bae et al., 2010). 구전의 크기는 구전 메시지의 양을 말하며, 구전의 방향성은 구전의 메시지의 긍정 적, 부정적인 정도를 가리킨다. Duan et al(2008a) 은 영화 산업을 대상으로 영화 판매량과 온라인 구전효과의 상호관계를 연립방정식을 통해 살펴 보았다. 분석 결과, 소비자들의 구매행위와 온라 인 구전효과가 강한 상관관계가 있다는 것으로 나타났다. 다시 말해 온라인 상에서 영화에 대한 구전의 크기가 강한 상관관계가 있다는 것으로 나타났다. 그리고 온라인 상에서 영화에 대한 구 전의 크기가 영화 판매량에 직접적으로 영향을 미친다는 결과를 제시하였다. Liu(2006)는 야후 (Yahoo!) 사이트에서 영화에 대한 온라인 구전을 수집하여 영화 흥행성과의 관계를 분석하였다. 분석 결과, 영화 개봉 전과 그리고 개봉 주에 영 화에 대한 구전효과 중 구전의 크기가 영화 흥행 성과 지표인 매출에 정(+)의 영향을 미치는 것으 로 나타났다. Moon et al.(2010)은 영화의 매출 이 일반 관객들의 평가인 구전의 방향성에 정(+) 의 영향을 주고, 구전효과(전문가의 평점 및 일 반 관객의 평점)는 광고와 동시에 사용될 경우만 영화 매출에 유의한 영향을 미친다고 주장하였 다. Bae et al.(2010)은 구전의 크기와 구전의 방 향성이 영화 매출에 정(+)의 영향을 준다는 결과 를 제시하였다. 이와 같이 기존 연구들을 기초로 다음과 같은 가설을 설정하였다. 구전의 크기와 방향성에 대한 가설: 가설1: 시간에 따라 누적된 영화 커뮤니티 상의 구전 크기가 영화의 최종 매출에 (+)영향 을 줄 것이다. 가설2: 시간에 따라 누적된 영화 커뮤니티 상의 구전 방향성이 영화의 최종 매출에 (+)영 향을 줄 것이다. 53
진위 김정수 김종우 네트워크 분석을 조직 연구에 적용한 연구들 의 일환으로 네트워크의 중심성과 집단 또는 조 직의 성과간의 관계에 대한 연구들이 수행되었 다(Kim, 2012). Balkundi and Harrison의 연구 (2006)에서는 친교 네트워크에서의 리더의 중심 성과 팀간 네트워크에서의 팀의 중심성이 팀 성 과에 정의 관계를 가진다는 것으로 나타났다. Yang and Tang(2004)의 IS 개발팀에 대한 네트워 크 분석에서 도메인 지식에 대한 중심성을 가지 는 개인의 존재가 IS 개발팀 성과에 긍정적인 영 향을 준다는 결과를 도출하였다. 바이오 산업의 기업간 협업 네트워크를 분석한 Powell et al.의 연구(1996)에서는 기업의 네트워크에서의 중심 성이 기업 성과에 긍정적인 영향을 주는 것을 확 인하였다. 대학 동창 네트워크를 분석한 Naan et al.의 연구(2010)에서는 창업자의 중심성이 사업 성공에 가능성을 높이는 것을 확인하였다. 이를 종합하면, 사회적 구성원의 네트워크 중심성은 집단 또는 조직의 성과에 긍정적인 영향을 미친 다는 결과로 볼 수 있다. 영화와 같은 경험재 상품의 시장 확산은 초기 정보의 확산에 의존하며, 이러한 정보는 정보 매 체의 네트워크에 따라 달라질 수 있다(Jun, 2004). 이와 같은 논리를 영화에 적용하면, 흥행 영화가 선풍적인 인기를 얻는 데에는 사람들 간의 구전 이 중요하다는 것을 추론할 수 있다. 구전을 통 해 특정 영화에 질적 평가가 이루어지기 때문이 다. 또한 혁신 확산(Diffusion of Innovation) 이론 에 따르면, 중심성이 높은 구성원은 네트워크의 중심에서 혁신 정보를 먼저 수용하고 커뮤니케 이션을 통제할 수 있는 능력을 가진다(Rogers, 2003; Park and Suh, 2013). 이런 네트워크 중심 성 능력은 영화 개봉 초기부터 영화 커뮤니티 내 에서 형성되는 영화 정보에 대한 빠른 획득과 전 달이 가능해지면서, 영화 정보 확산과 영화 평가 형성에 있어서 영향력을 발휘하는 의견 선도자 인 오피니언 리더의 역할이 중요하다. 이런 오피 니언 리더의 영화에 대한 구전은 영화 흥행성과 에 영향을 미칠 것이다. 그리고 영화 개봉 후 시 간이 지남에 따라 영화 제품을 경험한 소비자 간 에 그리고 영화에 대한 정보를 습득하려는 소비 자들은 영화 커뮤니티 내에서 다른 여러 구성원 들과 영화에 대한 정보를 교류하면서 영화 구전 의 네트워크가 형성되고 확산될 것이다. 이와 같 이 시간이 지남에 따라 영화 커뮤니티에서 형성 되는 영화에 대한 온라인 상의 구전 네트워크 중심성이 높은 구성원들은 다른 구성원들에게 영향력이 미친다고 할 수 있다. 즉, 영화 개봉 후 시간이 지남에 따라 형성되는 영화에 대한 커뮤니티 내 구전 네트워크 중심성이 커질수록 영화 흥행성과 지표인 매출에 긍정적인 영향을 주게 될 것이다. 따라서 다음과 같은 가설을 설 정하였다. 구전의 네트워크 중심성에 대한 가설: 가설3: 시간에 따라 누적된 영화 커뮤니티 구전 네트워크 내 참여자들의 연결중심성의 평균이 영화의 최종 매출에 (+) 영향을 줄 것이다. 가설4: 시간에 따라 누적된 영화 커뮤니티 구전 네트워크 내 참여자들의 매개중심성의 평균이 영화의 최종 매출에 (+) 영향을 줄 것이다. 가설5: 시간에 따라 누적된 영화 커뮤니티 구전 네트워크 내 참여자들의 근접중심성의 평균이 영화의 최종 매출에 (+) 영향을 줄 것이다. 54
오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 3.1.3 변수의 조작적 정의 (1) 종속변수 영화 매출 데이터는 Box-Office-Mojo 1) 에서 수 집하였다. 본 연구에서 사용한 종속변수인 매출 은 해당 영화의 상영 마지막 주까지 누적된 총 매출이다. 본 연구의 실험에서 사용한 대상 영화 의 매출 최대값은 409,013,994 USD이고 최소값 은 2,052,425 USD으로 편차가 심한 것을 볼 수 있다. 따라서 정규분포를 이루지 못하므로 종속 변수인 매출에 로그 변환을 적용하였다. (2) 독립변수 독립변수는 구전 데이터와 네트워크 데이터로 구분이 된다. 구전 데이터는 IMDb(Internet Movie Database) 2) 영화 사이트의 사용자 리뷰 페이지에 서 해당 영화에 대한 리뷰 작성자, 리뷰 내용, 리 뷰 별점, 작성시간 정보를 개봉 주를 기준으로 5 주간을 날짜별로 수집하였다. 초기 5주로 한정한 것은 본 연구를 위해 수집한 영화들은 최소 개봉 주가 5주이기 때문이다. 구전의 크기(volume) 변 수는 해당 영화에 대한 리뷰의 수를 개봉일 기준 으로 5주간 날짜별로 수집한 후 주간단위로 합 산하여 설정하였다. 또한 구전의 방향성(valence) 변수는 개봉일 기준으로 개인들이 평가한 별점 의 평균을 주간 단위로 측정하였다. 사회 네트워크 변수 생성을 위한 네트워크 정 보는 IMDb 영화 사이트의 사용자 게시판 페이 지에서 수집하였다. 구체적으로 네트워크 변수 를 추출하기 위해 본 연구에서 수집한 해당 영화 의 데이터는 영화에 대한 댓글 작성자, 댓글 응 답자, 댓글 내용, 응답 내용, 댓글 관계, 댓글시간 1) www.boxofficemojo.com 2) www.imdb.com 으로 구성되어 있다. 이 중에 댓글 작성자와 댓 글 응답자는 사회 네트워크 분석의 개체를 구성 하는 노드(Node)로 표현하였으며, 그들 간의 댓 글 관계는 링크(Link)로 나타내었다. 수집한 데 이터를 Edge List 형태로 변환하여 노드엑셀 (NodeXL)을 사용하여 네트워크 중심성인 연결 중심성, 매개중심성, 근접중심성을 구하여 이들 의 평균값을 계산하였다. 3.2 자료의 수집 본 연구에서는 IMDb와 Box-Office-Mojo 영화 웹 사이트를 대상으로 분석하였으며, JAVA 프 로그램 언어를 기반으로 웹 크롤링 프로그램을 코딩하여 데이터를 수집하였다. 영화 구전 데이 터를 가지고 있는 수많은 웹 사이트 중에서 IMDb을 선택하는 이유는 다음과 같다. 첫째, IMDb는 서비스를 1995년부터 시작하여 타사에 비해 월등히 많은 영화 데이터를 보유하고 있다. 영화 구전에 관련된 다양한 표본을 수집할 수 있 으며, 전 세계 개봉 영화에 대해 평가가 가능한 시스템을 갖추고 있다. 둘째, IMDb의 서비스는 영어로 제공되어 있어 전 세계적으로 접속이 가 능하기 때문에 구전에 참여하는 소비자가 보다 대표성을 가지고 있다. 본 연구의 수집대상은 2012년 9월 1일부터 2013 9월 1일까지 매주 상영하는 영화 중 10위권 안에 진입한 개봉영화로 한정하였으며, 예술영 화 및 재개봉영화들의 경우는 관객이 너무 적거 나 전 시즌 데이터도 포함하고 있기 때문에 구전 의 효과에 적절치 않은 자료라고 판단하여 제외 하였다. 따라서 최종적으로 분석 대상에 포함된 영화는 103편이다. 영화의 매출 데이터는 Box-Office-Mojo 커뮤 55
진위 김정수 김종우 니티에서 2012년 9월부터 2013년 9월까지 주간 (weekly) 단위로 제공하는 기간별 매출 정보를 수집하였다. 영화 흥행성과 지표인 매출의 기간 은 금주 금요일부터 다음 주 목요일까지의 주간 데이터이다. 4. 분석 결과 4.1 연구 모형 분석 결과 영화 개봉 전 주에 발생한 구전의 크기, 구전 의 방향성, 영화 커뮤니티 상의 구전 네트워크 내 참여자의 중심성 평균값의 독립 변수가 영화 개봉 첫째 주에 발생한 영화 매출에 미치는 영향 을 검증하기 위해 다중회귀분석을 실시하였다. 다중회귀분석을 실시하기에 앞서, 선행연구에서 영화 흥행성과 지표인 매출에 영향을 주는 구전 의 크기, 구전의 방향성 과 본 연구에서 추가적 으로 제시한 독립변수인 영화 커뮤니티 상의 구 전 네트워크 내 모든 참여자의 연결, 매개, 근접 의 중심성의 평균값 간에 상관분석을 실시 하여 이들 독립변수들 간에 서로 독립적인지를 파악하였다. <Table 1>은 종속변수인 영화 개봉 첫째 주에 발생한 영화 매출 및 독립변수들 간의 상관관계 를 분석한 결과를 보여준다. 영화 매출과 상관관 계가 높은 것으로 구전 크기(.493), 매개중심성 평균(.245), 구전 방향성(.241), 연결중심성 평균 (.221) 순으로 유의미한 상관관계를 보이고 있다. 그리고 독립 변수들 중 참여자의 연결, 매개, 근접 의 중심성의 평균값 간에 상관관계가 매우 높은 것을 볼 수 있었다. 이들 중심성 변수들 간 에 높은 상관관계를 가짐으로 다중공산성이 의 심한 것으로 판단된다. 따라서 본 연구에서는 영 화 매출에 영향을 미치는 독립변수인 중심성의 평균값(연결중심성 평균, 매개중심성 평균, 근접 중심성 평균)을 개별적으로 나눠 사용하고 구전 의 크기, 구전의 방향성 변수를 더불어 다중회귀 분석을 실시하였다. 영화 개봉 첫 주부터 다섯 주까지 시간 경과에 따른 구전의 크기, 구전의 방향성, 네트워크 중심성의 평균 이 영화를 누적된 최종 매출과의 다중 회귀분석 결과는 다음과 같다(<Table 2> ~ <Table 4> 참조). <Table 1> Correlation Analysis 1 1st week revenue volume valence degree betweenness closeness 1st week revenue 1.493**.241*.221*.245* -.097 volume 1.201*.345**.426** -.241* valence 1 -.022.109 -.216* degree 1.638** -.043 betweenness 1 -.265** closeness 1 ** 0.01 significance level * 0.05 significance level 56
오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 <Table 2> Multiple Regression Analysis with Degree Centrality Time (R 2 ) t=0 (.305) t=1 (.354) t=2 (.342) t=3 (.349) t=4 (.346) Independent variable t Sig. VIF (Constant) 31.5.000 volume 5.92.000 1.01 valence 3.53.001 1.00 degree -.77.439 1.01 (Constant) 30.7.000 volume 6.60.000 1.02 valence 3.83.000 1.00 degree -.53.597 1.02 (Constant) 31.2.000 volume 6.28.000 1.03 valence 3.52.001 1.00 degree -.10.917 1.03 (Constant) 32.0.000 volume 6.39.000 1.04 valence 3.41.001 1.00 degree.028.978 1.04 (Constant) 32.1.000 volume 6.33.000 1.05 valence 3.22.002 1.00 degree.226.822 1.04 Dependent variable: total revenue <Table 2>에서 볼 수 있듯이, 상영을 끝나고 누적된 영화의 최종 매출에 영향을 미치는 요인 으로 영화 개봉 첫 주부터 다섯 주까지 시간의 흐름에 따라 구전 크기(t = 0 ~ 4: p=.000) 와 구 전 방향성(t=0: p=.001; t=1: p=.000; t=2: p=.001; t=3: p=.001; t=4: p=.002) 이 유의미한 정(+)의 영 향을 미치는 것으로 나타났다. 또한 본 연구에서 영화 매출에 미치는 요인으로 살펴보고자 하는 변수인 영화 커뮤니티 상의 구전 네트워크 내 모 든 참여자의 중심성의 평균 중에 연결중심성 은 모든 시점에서 유의한 결과를 제시하지 못하 였다. <Table 3> Multiple Regression Analysis with Betweenness Centrality Time (R 2 ) t=0 (.312) t=1 (.375) t=2 (.375) t=3 (.395) t=4 (.402) Independent variable t Sig. VIF (Constant) 37.239.000 volume 5.18.000 1.01 valence 3.36.001 1.00 betweenness 1.26.207 1.01 (Constant) 35.8.000 volume 5.44.000 1.02 valence 3.62.000 1.00 betweenness 1.88.062 1.02 (Constant) 36.8.000 volume 5.09.000 1.03 valence 3.28.001 1.00 betweenness 2.29.024 1.03 (Constant) 37.9.000 volume 5.07.000 1.04 valence 3.216.002 1.00 betweenness 2.71.008 1.04 (Constant) 38.5.000 volume 4.98.000 1.05 valence 3.03.003 1.00 betweenness Dependent variable: total revenue 3.03.003 1.04 <Table 3>을 살펴보면, 영화의 최종 매출에 영 향을 미치는 요인으로 영화 개봉 첫 주부터 다섯 주까지 시간의 흐름에 따라 구전 크기(t = 0 ~ 4: p=.000) 와 구전 방향성(t=0: p=.001; t=1: p=.000; t=2: p=.001; t=3: p=.002; t=4: p=.003) 이 유의미한 정(+)의 영향을 미치는 것으로 나타났 다. 또한 본 연구에서 영화 매출에 미치는 요인 으로 살펴보고자 하는 변수인 영화 커뮤니티 상 의 구전 네트워크 내 모든 참여자의 중심성의 57
진위 김정수 김종우 평균 중에 매개중심성(t=1: p=.062; t=2: p=.024; t=3: p=.008; t=4: p=.003) 은 둘째 주부터 유의한 정(+)결과를 나타났으며 시간의 흐름에 따라 유 의확률이 증가한 것으로 확인 할 수 있다. <Table 4>를 살펴보면, 영화의 최종 매출에 영 향을 미치는 요인으로 영화 개봉 첫 주부터 다섯 주까지 시간의 흐름에 따라 구전 크기(t = 0 ~ 4: p=.000) 와 구전 방향성(t=0: p=.001; t=1: p=.000; t=2: p=.001; t=3: p=.001; t=4: p=.002) 이 유의미한 정(+)의 영향을 미치는 것으로 나타났 <Table 4> Multiple Regression Analysis with Closeness Centrality Time (R 2 ) t=0 (.301) t=1 (.360) t=2 (.344) t=3 (.350) t=4 (.346) Independent variable t Sig. VIF (Constant) 36.2.000 volume 5.80.000 1.02 valence 3.51.001 1.00 closeness.153.879 1.02 (Constant) 33.5.000 volume 6.66.000 1.08 valence 3.87.000 1.00 closeness 1.08.281 1.08 (Constant) 34.2.000 volume 6.34.000 1.07 valence 3.55.001 1.00 closeness.653.515 1.07 (Constant) 35.2.000 volume 6.35.000 1.08 valence 3.42.001 1.00 closeness.212.832 1.08 (Constant) 35.2.000 volume 6.37.000 1.07 valence 3.23.002 1.00 closeness Dependent variable: total revenue.272.786 1.07 다. 또한 본 연구에서 영화 매출에 미치는 요인 으로 살펴보고자 하는 변수인 영화 커뮤니티 상 의 구전 네트워크 내 모든 참여자의 중심성의 평균 중에 근접중심성 은 모든 시점에서 유의 한 결과를 제시하지 못하였다. <Table 2>, <Table 3>, <Table 4>의 분석 결과 를 통해 연구 가설 중 가설 1, 2, 4는 채택되었 고, 가설 3, 5는 기각된 것으로 판단된다. 단 가 설 4의 경우는 시점 t=0 은 유의하지 않는 것으 로 나타났으며, 시점 t=1은 유의수준이 10% 내 에서 유의한 분석결과가 나타났다. 이후 시점인 t=2, 3, 4는 유의 수준이 5% 이내로 유의한 것으 로 나타났다. 가설 검정결과를 종합하면, 첫째, 영화 흥행성 과지표인 매출의 영향요인으로 구전의 크기, 구전의 방향성 은 모든 시점에서 영화 최종 매 출에 유의미한 정(+)의 영향을 미치는 것으로 나 타났다. 둘째, 네트워크 중심성 중에는 매개중심 성만이 영화 매출에 유의한 영향을 미치는 것으 로 파악되었다. 따라서 구전 네트워크의 중심성 중에 참여자들간의 연결의 양에 대한 척도인 연 결중심성이나 참여자들간의 평균 거리에 해당하 는 근접중심성은 매출에 영향을 미치지 않지만, 의사소통의 연결고리 역할의 정도를 의미하는 매개중심성은 매출에 양의 영향을 주는 것을 확 인할 수 있다. 5. 결론 본 연구의 목적은 온라인 영화 커뮤니티의 네 트워크 특성이 영화 흥행성과 지표인 매출에 영 향을 미치는 지를 규명하는데 있다. 영화 흥행성 과 연구들에서 주요하게 다루어진 영화에 대한 58
오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 구전의 크기(volume)와 방향성(valence)과 같은 요인들과 본 연구에서 추가적으로 제시하는 영 화 커뮤니티 상의 구전 네트워크의 중심성이 영 화의 성과지표인 매출에 미치는지를 실증적으로 분석하였다. 영화 개봉 첫 주부터 다섯 주까지 시간 경과에 따른 구전의 크기 및 방향성, 그리고 구전 네트 워크 중심성이 영화의 최종 매출에 미치는 영향 을 분석한 결과, 네트워크 매개중심성(평균)은 시간에 따라 영화의 최종 매출에 정(+)의 영향을 미치는 것으로 나타났다. 특히 영화 개봉 둘째 주부터 다섯째 주까지의 매개중심성(평균)을 고 려한 다중회귀모형은 시간에 따라 설명력이 점 차적으로 증가하는 것으로 나타났다. 하지만, 연 결중심성과 근접중심성의 평균은 누적된 영화 흥행성과 지표인 최종 매출에 영향을 주지 못하 는 결과로 나타났다. 이는 단순히 영화 커뮤니티 참여자들의 의사소통의 양에 기초하는 중심성이 나 참여자간 간의 근접도에 기초한 중심성보다 참여자간의 의사소통의 연결고리 역할의 중심성 이 더 중요한 것으로 볼 수 있다. 따라서 영화 커 뮤니티 내의 영향력 있는 참여자를 파악하는 데 에 있어서 연결중심성과 근접중심성보다는 매개 중심성을 기초로 판단하는 것이 영화 흥행성과 측면에서 더 유용하다는 것을 파악할 수 있었다. 추후 연구 과제와 관련해서, 본 연구에서는 기 존의 영화 흥행성과에 관련한 연구에서와 마찬 가지로 구전의 방향성을 소비자들의 영화에 대 해 평점을 기초로 측정하였다. 하지만 향후에는 평점에 기반한 영화 별점뿐만 아니라 영화 커뮤 니티에서 작성된 소비자들의 방대한 구전 정보 인 관람후기와 같은 텍스트 문서들을 텍스트 마 이닝 기법 중 하나인 감성 분석을 적용하여 구전 의 방향성을 파악할 필요가 있다. 또한 영화뿐만 아니라 음악, 드라마 등의 콘텐츠에 대한 커뮤니 티 분석을 통해서 본 연구 결과를 일반화하는 노 력이 필요하다. 참고문헌 Aaker, D. and J. Myers, Advertising Management 2nd edition, Prentice-Hall, 1982 Ahn, S. A. and T. J. Kim, The Determinants of Opening Share and Decay Rate in Motion Pictures, Korean Marketing Association, Vol.18, No.3(2003), 1~17 Bae, J. H., B. J. Shim, and B. D. Kim, "Simultaneous Effect between ewom and Revenues: Korea Movie Industry," Korean Journal of Marketing Association, Vol.12, No.2(2010), 1~25 Balkudi, P. and D. A. Harrison, Ties, Leaders and Time in Tearms: Strong Inference about Network Structure s Effects on Team Viability and Performance, The Academy of Management Journal, Vol.49, No.1(2006), 49~68 Barnett, G. A. and J. A. Danowski, The Structure of Communication: A Network Analysis of the International Communication Association, Human Communication Research, Vol.19, No.2(1992), 264~285 Broderick, A. J., J. Brown, and N. Lee, Wordof-mouth Communication within Online Communities: Conceptualizing the Online Social Network, Journal of Interactive Marketing, Vol.21, No.3(2007), 2~20 Chen, P. Y., S. Y. Wu, and J. Yoon, The Impact of Online Recommendations and Consumer 59
진위 김정수 김종우 Feedback on Sales, Proceedings of the International Conference on Information System, (2004). Cho, Y. H. and J. H. Bang, Social Network Analysis for New Product Recommendation, Journal of Intelligence and Information Systems, Vol.15, No.4(2009), 183~200 Duan, W., B. Gu, and A. Whinston, Do Online Reviews Matter? An Empirical Investigation of Panel Data, Decision Support Systems, Vol.45, No.4(2008), 1007~1016 Duan, W., B. Gu, and A. Whinston, The Dynamics of Online Word-of-month and Product Sales - An Empirical Investigation of the Movie Industry. Journal of Retailing, Vol.84, No.2(2008), 233~242 Eliashberg, J. and M. S. Shugan, Film Critics: Influencers or Predictors?, Journal of Marketing, Vol.61, No.2(1997), 68~78 Faulkner, R. R, Music on Demand: Composers and careers in the Hollywood Film Industry, Transaction Books, New Brunswick, NJ, 1987 Jin, Y., Network Diffusion Factors Affecting Movie Performance Based on Online Word-of- Mouth, MS Thesis, Hanyang University, 2013 Jun, South Korea Film Industry Size and Growth Factors Predictive Analysis Report, Korean Film Council, 2004 Jung, H. W, Complex Networks and Smart World, Conference of Korea Association of Theoretical Sociology, (2003) Jung, Y. H., The Influence of Characteristics (Volume, Consensus, Informant) of Electric Word-of-Mouth on Customers Choice, Broadcasting and Communication, Vol.14, No.1(2013), 47~76 Kim, H. K., J. K. Kim, and Q. Y. Chen, A Network Approach to Derive Product Relations and Analyze Topological Characteristics, Journal of Intelligence and Information Systems, Vol.15, No.4(2009), 159~182 Kim, J. S. and J. W. Kim, "Relationship between Internet Buzz Share and Markets Share: Movie Ticket Case," The Journal of Society for e-business Studies, Vol.14, No.2(2013), 242~255 Kim, J. W., Social Network Approach for Organizational Research, Entrue Journal of Information Technology, Vol.11, No.1(2012), 29~43 Kim, S. H., The Influence of Product Involvement and Knowledge on Internet WOM, The Korean Journal of Advertising, Vol.14, No.1(2003), 257~280 Lee, J. C, The Influence on the Moviegoer Perception of Movie Selection by the Marketing Variables, Film Studies Association of Korea, No.23(2004), 293~330 Lee, J. Y., I. S. Son, and D. W. Lee, Does Online Social Network Contribute to WOM Effect on Product Sales?, Journal of Intelligence and Information Systems, Vol.18, No.2(2012), 85~106 Lee, T. M. and C. Park, Effects of Direction and Type of Electronic Word of Mouth Information on Purchase Decision: Cross- Cultural Comparison Between Korea and U.S., Korean Marketing Association, Vol.21, No.1(2006), 29~56 Linton, J. and J. Petrovich, The Application of the Consumer Information Acquisition Approach to Movie Selection, Current Research in Film, Vol.4(1988), 24~44 60
오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 Litman, B. R. and L. S. Kohl, Predicting Financial Success of Motion Pictures: The Early '80s Experience, Journal of Media Economics, Vol.2, No.2(1989), 35~50 Litman, B. R., Predicting Success of Theatrical Movies: An Empirical Study, Journal of Popular Culture, Vol.16, No.4(1983), 159~175 Liu, Y., Word of Mouth for Movies: Its Dynamics and Impact on Box Office Revenue, Journal of Marketing, Vol.70, No.3(2006), 74~89 Mahajan, V., E. Muller, and R. Kerin, Introduction Strategy for New Products with Positive and Negative Word-of-mouth, Management Science, Vol.30, No.12(1984), 1389~1404 Mizerski, R., An Attribution Explanation of the Disproportionate Influence of Unfavorable Information, Journal of Consumer Research, Vol.9, No.3(1982), 301~310 Mizruchi, M. S., Social Network Analysis: Recent Achievements and Current Controversies, Acta Sociologica, Vol.37(1994), 327~343 Money, R. B., M. C. Gilly, and J. L. Graham, Explorations of National Culture and Word-of-mouth Referral Behavior in the Purchase of Industrial Services in the United States and Japan, Journal of Marketing, Vol.62, No.4(1998), 76~87 Moon, S., P. Bergey, and D. Lacobucci, Dynamic Effects among Movie Ratings, Movie Revenues, and Viewer Satisfaction, Journal of Marketing, Vol.74, No.1(2010), 108~121 Naan, S. J., M. Krauss, P. A. Schober, K. Gloor, H. F. Fischbach, Comparing the Structure of Virtual Entrepreneur Networks with Business Effectiveness, Procedia-Social and Behavioral Sciences, Vol.2, No.4 (2010), 6483~6496 Opsahl, T., F. Agneessens, and J. Skvoretz, Node Centrality in Weighted Networks: Generalizing Degree and Shortest Paths, Social Networks, Vol.32, No.3(2010), 245~251 Park, H. H. and C. S. Park, The Relationship between Critical Reviews and Performance of Movies: Does it Hold in the Internet Era?, Korean Marketing Association, Vol.16, No.4 (2001), 71~85 Park, J. H. and B. M. Suh, The Impact of Influential s Betweenness Centrality on the WOM Effect under the Online Social Networking Service Environment, Journal of Information Technology Applications & Management, Vol.20, No.2(2013), 127~146 Park, J. W. and G. O. Lee, A Study on the Effects of the Newspaper Coverage of Motion Pictures on Box Office Performance, Korean Journal of Journalism and Communication Studies, Vol.48, No.6(2004), 62~83 Park, S. and E. H. Shin, Patterns of Market Polarization and Market Matching in the Korean Film Industry, Journal of East Asian Studies, Vol.4(2004), 285~300 Powell, W. W., K. W. Koput, and L. Smith-Doerr, Interorganizational Collaboration and the Locus of Innovation: Networks of Learning in Biotechnology, Administrative Science Quarterly, Vol.41, No.1(1996), 116~145 Rogers, Diffusion of innovations, Free Press, 2003 Senecal, S. and J. Nantel, The Influence of Online Product Recommendations on Consumers Online Choices, Journal of Retailing, Vol.80, No.2(2004), 159~169 Sung, Y. S., J. Y. Park, and E. A. Park, The Influence of On-line Word of Mouth Information On Viewing Intention toward 61
진위 김정수 김종우 Motion Picture, Korean Association For Advertising Public Relations, No.57(2002), 31~52 Yang, H. L. and J. H. Tang, Team Structure and Team Performance in IS Development: A Social Network Perspective, Information and Management, Vol.41, No. 3(2004), 335~349 Yi, Y. J. and C. L. Lee, The Dynamic Effects of Customer Satisfaction and Referral on Firm Performance: Focusing on KCSI and KNPS, The Korean Academic Society of Business Administration, Vol.39, No.2(2010), 279~307 62
오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 Abstract Product Community Analysis Using Opinion Mining and Network Analysis: Movie Performance Prediction Case 3) Yu Jin* Jungsoo Kim* Jongwoo Kim** Word of Mouth (WOM) is a behavior used by consumers to transfer or communicate their product or service experience to other consumers. Due to the popularity of social media such as Facebook, Twitter, blogs, and online communities, electronic WOM (e-wom) has become important to the success of products or services. As a result, most enterprises pay close attention to e-wom for their products or services. This is especially important for movies, as these are experiential products. This paper aims to identify the network factors of an online movie community that impact box office revenue using social network analysis. In addition to traditional WOM factors (volume and valence of WOM), network measures of the online community are included as influential factors in box office revenue. Based on previous research results, we develop five hypotheses on the relationships between potential influential factors (WOM volume, WOM valence, degree, betweenness, closeness ) and box office revenue. The first hypothesis is that the accumulated volume of WOM in online product communities is positively related to the total revenue of movies. The second hypothesis is that the accumulated valence of WOM in online product communities is positively related to the total revenue of movies. The third hypothesis is that the average of degree centralities of reviewers in online product communities is positively related to the total revenue of movies. The fourth hypothesis is that the average of betweenness centralities of reviewers in online product communities is positively related to the total revenue of movies. The fifth hypothesis is that the average of betweenness centralities of reviewers in online product communities is positively related to the total revenue of movies. To verify our research model, we collect movie review data from the Internet Movie Database (IMDb), which is a representative online movie community, and movie revenue data from the * Dept. of Business Administration, Graduate School, Hanyang University ** Corresponding Author: Jong Woo Kim School of Business, Hanyang University 17, Haengdang-Dong, Sungdong-Gu, Seoul 133-791, Korea Tel: +82-2-2220-1067, Fax: +82-2-2220-1169, E-mail: kjw@hanyang.ac.kr Bibliographic info: J Intell Inform Syst 2014 March: 20(1): 49~65 63
진위 김정수 김종우 Box-Office-Mojo website. The movies in this analysis include weekly top-10 movies from September 1, 2012, to September 1, 2013, with in total. We collect movie metadata such as screening periods and user ratings; and community data in IMDb including reviewer identification, review content, review times, responder identification, reply content, reply times, and reply relationships. For the same period, the revenue data from Box-Office-Mojo is collected on a weekly basis. Movie community networks are constructed based on reply relationships between reviewers. Using a social network analysis tool, NodeXL, we calculate the averages of three centralities including degree, betweenness, and closeness for each movie. Correlation analysis of focal variables and the dependent variable (final revenue) shows that three measures are highly correlated, prompting us to perform multiple regressions separately with each measure. Consistent with previous research results, our regression analysis results show that the volume and valence of WOM are positively related to the final box office revenue of movies. Moreover, the averages of betweenness centralities from initial community networks impact the final movie revenues. However, both of the averages of degree centralities and closeness centralities do not influence final movie performance. Based on the regression results, three hypotheses, 1, 2, and 4, are accepted, and two hypotheses, 3 and 5, are rejected. This study tries to link the network structure of e-wom on online product communities with the product s performance. Based on the analysis of a real online movie community, the results show that online community network structures can work as a predictor of movie performance. The results show that the betweenness centralities of the reviewer community are critical for the prediction of movie performance. However, degree centralities and closeness centralities do not influence movie performance. As future research topics, similar analyses are required for other product categories such as electronic goods and online content to generalize the studyresults. Key Words : Network Analysis, Online Word Of Mouth, Online Movie Community 64 Bibliographic info: J Intell Inform Syst 2014 March: 20(1): 49~65
오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 저 자 소 개 진 위 가톨릭대학교 경영학과에서 학사를 마쳤으며, 한양대학교 경영학과 경영정보시스템으 로 석사학위를 취득하였다. 방송통신위원회에서 지원하는 클라우드서비스정책 연구센 터에서 소속되어 연구를 수행하였으며 그 밖에도 다수의 프로젝트에 참여하고 있다. 주 요 관심분야는 빅 데이터, 데이터마이닝, 오피니언마이닝, 소셜 네트워크 분석, 클라우드 컴퓨팅 서비스, ERP시스템 등이다. 김 정 수 협성대학교 경영정보학과에서 학사, 한양대학교에서 경영학과 경영정보시스템으로 석 사학위, 박사학위를 취득하였다. 현재 방송통신위원회에서 지원하는 클라우드서비스정 책 연구센터에서 소속되어 연구를 수행하고 있다. 주요 관심분야는 빅 데이터, 데이터마 이닝, 사회 네트워크 분석, 클라우드 컴퓨팅 등이다. 김 종 우 서울대학교 수학과에서 학사를 마쳤으며, 한국과학기술원에서 경영과학으로 석사학위 를 산업경영학으로 박사학위를 취득하였다. 현재 한양대학교 경영대학에 재직 중이며, 주요 연구 관심분야는 빅 데이터, 데이터마이닝, 오피니언 마이닝, 상품추천기술, 지능형 정보시스템, 사회 네트워크 분석, 클라우드 컴퓨팅 서비스 등이다. 65