목차 ( 요약 ) 본연구는영화리뷰값이 1000 개이상인 673 개의영화를대상으로영화 1. 서론 1-1. 연구의배경및필요성 1-2. 연구의목적및방법 2. 관련연구 2-1. 영화흥행관련연구 2-2. 영화감정어휘관련연구 3. 데이터수집및정제 3-1. 영화리뷰데이터수집 3-2

Similar documents
목차 1. 서론 1-1. 연구배경및필요성 1-2. 연구의목적및방법 2. 이론및선행연구의고찰 2-1. 의사결정나무분석관련연구 2-2. 시각화분석관련연구 3. 예제데이터설명 4. 통계를활용한예측분석 4-1. 의사결정나무분석의정의 4-2. 의사결정나무분석결과 5. 시각화구축

DBPIA-NURIMEDIA

WRIEHFIDWQWF.hwp

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

860 김연형, 홍정한 를사용하였으며, 정완규 (2009), 김미현등 (2010), 김소영등 (2010) 은포털사이트영화디렉토리의네티즌평점을영화흥행결정요인으로확인하였다 년이후에는서로의의견, 생각, 경험, 관점등을공유하기위한온라인플랫폼인소셜미디어를통해상품, 브

DBPIA-NURIMEDIA

유선종 문희명 정희남 - 베이비붐세대 소유 부동산의 강제매각 결정요인 분석.hwp

서론 34 2

27송현진,최보아,이재익.hwp

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 35~55 학술 전력시장가격에대한역사적요인분해 * 35

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )

<31372DB9CCB7A1C1F6C7E22E687770>

1. KT 올레스퀘어 미디어파사드 콘텐츠 개발.hwp


212 영상기술연구 세대라고 할 수 있다. 이 뉴 뉴웨이브 세대란 60년대 일본의 영화사에서 과거세대와는 단 절된 뉴웨이브 의 흐름이 있었는데 오늘날의 뉴웨이브 세대를 뛰어넘는다는 의미에서 뉴 뉴웨이브 세대로 불린다. 뉴 뉴웨이브 세대 감독들의 경향은 개인적이고 자유분

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

Output file

<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

아태연구(송석원) hwp

DBPIA-NURIMEDIA

논총13집.PDF


1


232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

230 한국교육학연구 제20권 제3호 I. 서 론 청소년의 언어가 거칠어지고 있다. 개ㅅㄲ, ㅆㅂ놈(년), 미친ㅆㄲ, 닥쳐, 엠창, 뒤져 등과 같은 말은 주위에서 쉽게 들을 수 있다. 말과 글이 점차 된소리나 거센소리로 바뀌고, 외 국어 남용과 사이버 문화의 익명성 등

<35335FBCDBC7D1C1A42DB8E2B8AEBDBAC5CDC0C720C0FCB1E2C0FB20C6AFBCBA20BAD0BCAE2E687770>

<3138C8A32BC7D0C8B8C1F628C3D6C1BEC6EDC1FDBFCFBCBABABB2DBED5BFDCC7A5C1F6BFCDB5DEC7A5C1F6BFB5B9AEB8F1C2F7C1A6BFDC292E687770>

다문화 가정의 부모

11이정민

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S


27 2, 17-31, , * ** ***,. K 1 2 2,.,,,.,.,.,,.,. :,,, : 2009/08/19 : 2009/09/09 : 2009/09/30 * 2007 ** *** ( :

27 2, * ** 3, 3,. B ,.,,,. 3,.,,,,..,. :,, : 2009/09/03 : 2009/09/21 : 2009/09/30 * ICAD (Institute for Children Ability

<5B D B3E220C1A634B1C720C1A632C8A320B3EDB9AEC1F628C3D6C1BE292E687770>

#Ȳ¿ë¼®

44-4대지.07이영희532~

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Analysis of

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: * Suggestions of Ways

: 4 2. : (KSVD) 4 3. :

2013년 국내 영화 관객수는 2억명을 처음으로 초과. 이중 한국영화 관객 비중은 약 60%로 2006년 이후 최대 비중 차지. 2006년 이후 마이너스 수익률을 지속적으로 보 였던 수익률 역시 2012년에 (+)전환 하였으며, 2013년에는 약 15.2% 수익률 달성

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

인문사회과학기술융합학회

, ( ) * 1) *** *** (KCGS) 2003, 2004 (CGI),. (+),.,,,.,. (endogeneity) (reverse causality),.,,,. I ( ) *. ** ***


<5B335DC0B0BBF3C8BF2835B1B35FC0FAC0DAC3D6C1BEBCF6C1A4292E687770>

272 石 堂 論 叢 49집 기꾼이 많이 확인된 결과라 할 수 있다. 그리고 이야기의 유형이 가족 담, 도깨비담, 동물담, 지명유래담 등으로 한정되어 있음도 확인하였 다. 전국적인 광포성을 보이는 이인담이나 저승담, 지혜담 등이 많이 조사되지 않은 점도 특징이다. 아울

DBPIA-NURIMEDIA

언론정보학석사학위논문 영화흥행결정요인이 유료방송 VOD 구매에미치는영향 2018 년 6 월 서울대학교대학원 언론정보학과 최융

DBPIA-NURIMEDIA

11¹Ú´ö±Ô

<B7CEC4C3B8AEC6BCC0CEB9AEC7D B3E23130BFF9292E687770>

목 차 1. 서론 1.1. 문제제기 및 연구목적 1.2. 연구대상 및 연구방법 2. 이론적 배경 2.1. 신화론과 롤랑바르트의 이해 2.2. 에니어그램의 이해 3. 분석 3.1. 아이언맨 3.2. 캡틴 아메리카 3.3. 헐크 3.4. 토르 3.5. 블랙 위도우 3.6.

(JH)

< 서식 5> 탐구보고서표지 제 25 회서울학생탐구발표대회보고서 출품번호 유글레나를이용한산소발생환경의탐구 소속청학교명학년성명 ( 팀명 ) 강서교육청서울백석중학교 3 임산해 [ 팀원이름 ]

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: * Strenghening the Cap

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

A Time Series and Spatial Analysis of Factors Affecting Housing Prices in Seoul Ha Yeon Hong* Joo Hyung Lee** 요약 주제어 ABSTRACT:This study recognizes th

대한한의학원전학회지26권4호-교정본(1125).hwp

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

IKC43_06.hwp

<C3D6C1BE2DBDC4C7B0C0AFC5EBC7D0C8B8C1F D32C8A3292E687770>

Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ

Kor. J. Aesthet. Cosmetol., 및 자아존중감과 스트레스와도 밀접한 관계가 있고, 만족 정도 에 따라 전반적인 생활에도 영향을 미치므로 신체는 갈수록 개 인적, 사회적 차원에서 중요해지고 있다(안희진, 2010). 따라서 외모만족도는 개인의 신체는 타

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

DBPIA-NURIMEDIA

1학년-방학활용.hwp

자연채무에대한재검토 1. 서론 2. 선행연구 9 Journal of Digital Convergence 214 May; 12(5): 89-99

<C7D1B1B9C7D0BFACB1B820C1A63336C1FD28BABBB9AE E687770>

Microsoft Word _CJ CGV_K_1.docx

09È«¼®¿µ 5~152s

<C1A63137B1C720C1A631C8A320B9AEC8ADB0E6C1A6BFACB1B C2F720BCF6C1A4BABB292E687770>

???춍??숏

<C7D1B7F9C7F6C8B2B0FAC8B0BFEBC0FCB7AB28C3D6C1BE292E687770>

(001~006)개념RPM3-2(부속)

07ÃÖ°æÈñ

이용석 박환용 - 베이비부머의 특성에 따른 주택유형 선택 변화 연구.hwp

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

exp

<B1B3B9DFBFF83330B1C7C1A631C8A35FC6EDC1FDBABB5FC7D5BABB362E687770>

1. 서론 1.1 연구의 배경과 목적 현시대의 인간들은 넘쳐나는 미디어의 영향 속에서 살고 있다. 특히 영상매체인 가 대중문화로써 접 근하는 힘은 여타 다른 매체의 영향력보다 강하며, 그 중에서도 SF는 빠르게 변화하는 이 미래 에 가져올 영향에 대한 인간의 궁금증을

에너지경제연구 Korean Energy Economic Review Volume 11, Number 2, September 2012 : pp. 1~26 실물옵션을이용한해상풍력실증단지 사업의경제성평가 1

09김정식.PDF

효학연구 제 호 목 차 인성교육의 위기와 가족문화 정범모 기독교위임체계에 의한 대리의 효 연구 박철호 성경적 효사상 연구 김시우 삼국유사 를 통해본 삼국시대의 효문화 김덕균 글로벌 시대 효학의 방향과 역할 서은숙 고령화 사회와 출산장려정책에 관한 고찰 노인의 재혼과정

6 영상기술연구 실감하지 못했을지도 모른다. 하지만 그 이외의 지역에서 3D 영화를 관람하기란 그리 쉬운 일이 아니다. 영화 <아바타> 이후, 티켓 파워에 민감한 국내 대형 극장 체인들이 2D 상영관을 3D 상영관으로 점차적으로 교체하는 추세이긴 하지만, 아직까지는 관

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 95~118 학술 탄소은행제의가정용전력수요절감효과 분석 1) 2) 3) * ** *** 95

행정학석사학위논문 공공기관기관장의전문성이 조직의성과에미치는영향 년 월 서울대학교행정대학원 행정학과행정학전공 유진아

,.,..,....,, Abstract The importance of integrated design which tries to i

에너지경제연구 제13권 제1호

DBPIA-NURIMEDIA

2002년 2학기 자료구조

15 홍보담당관 (언론홍보담당) 김병호 ( 金 秉 鎬 ) 16 (행정담당) 박찬해 ( 朴 鑽 海 ) 예산담당관 17 (복지행정담당) 이혁재 ( 李 赫 在 ) 18 (보육담당) 주사 이영임 ( 李 泳 任 ) 기동근무해제. 19 (장애인담당) 박노혁 ( 朴 魯 爀 ) 기동

歯1.PDF

DBPIA-NURIMEDIA

한국정책학회학회보

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

Transcription:

논문투고일 :2015.06.05, 논문심사일 :2015.06.05~2015.07.13, 게재확정일 :2015.07.13 영화의흥행성과와리뷰감정어휘와의관계분석 Relationship Analysis between the Box Office Performance and Sentimental Words in Movie Review 주저자 문성민 (Mun, Seong Min) 아주대학교라이프미디어협동과정통합디자인연구실연구원 공동저자 하효지 (Ha, Hyo Ji) 아주대학교라이프미디어협동과정통합디자인연구실연구원 교신저자이경원 (Lee, Kyung Won) 아주대학교미디어학과 kwlee@ajou.ac.kr 본논문은 2013 학년도아주대학교일반연구비지원과아주대학교 2015 년 BK 사업의지원을받아게재되었습니다.

목차 ( 요약 ) 본연구는영화리뷰값이 1000 개이상인 673 개의영화를대상으로영화 1. 서론 1-1. 연구의배경및필요성 1-2. 연구의목적및방법 2. 관련연구 2-1. 영화흥행관련연구 2-2. 영화감정어휘관련연구 3. 데이터수집및정제 3-1. 영화리뷰데이터수집 3-2. 감정어휘사전구축 3-3. 영화리뷰데이터정제 3-4. 데이터특성파악 4. 시각화기능및제안 4-1. Parallel coordinates의개념 4-2. Parallel coordinates의기능 4-3. Parallel coordinates를활용한분석 5. 결론및제안참고문헌 장르별로관객들이느끼는감정어휘의분포를탐색하고영화흥행도와감정어휘의관계를파악하는데목적이있다. 분석을위해네이버영화리뷰를크롤링하고감정어휘사전을활용하여 7개의대표감정어휘, 영화티켓판매액, 영화관람관객수, 상영스크린수, 한스크린당영화관람관객수, 영화의장르, 영화의영문이름으로구성된데이터를생성하였다. 연구목적을위한분석은상관관계분석방법과 Parallel coordinates 시각화분석방법을사용하였다. 연구결과로는첫째, 장르에따른영화흥행도를분석하여영화흥행도가가장높은장르는코미디이고가장낮은장르는호러라는결과를확인하였다. 둘째, 모든장르에서 Happy 와 Surprise 의값이높게나오지만다른장르들에비해판타지장르의영화는지루한감정이많이느껴지고, SF장르의영화는화나는감정이많이느껴진다는결과를확인하였다. 셋째, 모든장르의감정어휘별상관관계를분석하여 Disgust 의값이높아질때 Anger 의값도높아지고, Happy 의값이높아질때 Surprise 의값은낮아진다라는결과를확인하였다. 넷째, 영화흥행도에따른감정어휘를분석하여영화흥행도와 Happy 는선형관계이지만영화흥행도와 Fear 는비선형관계인것을확인하였다. (Abstract) This study aims to understand distribution of the sentimental words on each genre and find relationship between box office performance and sentimental words in movie review using 673 movies that have more than 1,000 reviews. For the analysis, crawling movie reviews and made data was composed movie genre, movie name, sales, attendance, screen, normal attendance, 7 sentimental words. For analysis results, we used correlation analysis and Parallel coordinates. As a results, First, the highest box office value of the genre is comedy and the lowest box office value of the genre is horror through analyze box office on each genre. Secondly, Movie genre of fantasy feel a lot of boring emotion and Movie genre of SF feel a lot of anger emotion even if 'Happy' and 'Surprise' have highest sentiment value on every genre. Third, We found 'Anger' increase sentimental value when 'Disgust' increase sentimental value and 'Surprise' decrease sentimental value when 'Happy' increase sentimental value through analyze correlation relationship between sentimental words using total data. Fourth, We found 'Happy' have linear relationship between box office and 'Fear' have non-linear relationship between box office through analyze sentimental words according to box office performance. (Keyword) Box Office Performance, Movie genre, Parallel coordinates, Sentimental dictionary, Visual analysis 2 Design Convergence Study 53 Vol.14. no.4 (2015.8)

1. 서론 1-1. 연구의배경및필요성문화산업의큰부분을차지하는영화산업은매년성장하고있으며최근미디어기술의발달로영화시장의규모가더커지고있다. 영화진흥위원회가 2014년에발표한영화산업결산원고에따르면 2014년극장입장권매출액은역대최대액수인 1조 6,641억원을기록, 2013년대비 7.3% 증가했고관객수도 2억명을돌파하며 2013년대비약 0.8% 증가한 2억 1,506만명에달하였다. 또한인구 1인당평균관람횟수는 2013년보다증가하며 4.19회에달하였다. 1) 영화산업의성장과함께영화흥행에영향을미치는요인을도출하기위한다양한연구가진행되어왔다. 한국영화산업에대한연구는주로영화의흥행을높이기위해영화흥행에영향을미치는요인을도출하기위한방향으로진행되어왔다. 국내에서는 1997년김휴종의 한국영화스타의스타파워분석 이라는연구를시작으로김영현외 1명 (2011), 박승현외 2명 (2011) 등의연구가진행되어왔으며이러한연구를통해감독의명성, 제작, 유통사의역량, 평론가의리뷰, 감독, 작가, 제작자등영화와관련된관계자들의역할및상호간의연결등이영화의성공여부를결정할수있는요인으로밝혀졌다. 2)3)4) 그러나이제까지연구된영화흥행에영향을미치는요인들만으로는영화의흥행을설명하는데한계점이존재한다. 선행연구에서도출된영화의성공여부를결정할수있는요인들을충족하지만영화흥행에실패한영화의예로 2014년개봉한영화 익스펜더블 3 가있다. 이영화의경우유명한해외스타들이다수등장하고유명한감독이연출하고해외에서이미흥행에성공을했지만국내시장에선흥행 ( 누적관객 152,025명 ) 에성공하지못했다. 익스펜더블 3 에대한영화리뷰는 1,2편과스토리가똑같고지루하다., 팬서비스용재연액션, 그러니까그들의팬들에게만 등이있었고리뷰를통해영화에서지루한감정을느꼈다는것을확인할수있었다. 반면에영화흥행에영향을미치는요인들을충족하지못하지만영화흥행에성공한영화의예로 2014년개봉한영화 님아, 그강을건너지마오 가있다. 영화 님아, 그강을건너지마오 는독립영화로써영화흥행에영향을미치는요인들을충족하지못하지만독립영화로써흥행기록을새로이갱신하며흥행 ( 누적관객 4,801,445 명 ) 에성공한영화이다. 5) 님아, 그강을건너지마오 에대한영화리뷰는 노부부가살아온인생여정이너무나가슴아프고감동스러웠습니다., 정말가슴이먹먹해집니다. 상영관좀늘려주세요 ~ 보고싶어하는사람들이많아요. 등이있었고리뷰를통해영화에서슬픈감정을느꼈다는것을확인할수있었다. 영화흥행에영향을미치는요인은객관적인정보에의한요인과주관적인정보에의한요인으로나뉠수있다. 객관적인정보에의한요인은감독의명성, 제작, 유통사의역량, 영화평론가의리뷰, 감독, 작가, 제작자등과같은요인이며, 주관적인정보에의한요인은구전의의한정보전달측면에서매우중요하며영화에대한관객들의생각, 관객들이영화를통해느낀감정등관객에의해발생하는요인들이라고할수있다. 6) 1) 2014 년한국영화산업결산, 영화진흥위원회정책연구부, p.6, 2014. 2) 김휴종, 한국영화스타의스타파워분석, 삼성경제연구소연구보고서, 1997. 3) 김연형, 홍정한, 영화흥행결정요인과흥행성과예측연구, 한국통계학회논문집, 제 18 권, 제 6 호, p.865, 2011. 4) 박승현, 송현주, 정완규, 한국영화의흥행성과결정요인에관한연구, 언론과학연구, 제 11 권, 제 4 호, p.240, 2011. 5) 영화진흥위원회, http://www.kobis.or.kr/kobis/business/mast/mvie/searchmovielist.do 6) 성영신, 박진영, 박은아, 온라인구전정보가영화관람의도에미치는영향, 광고연구, 제 57 권, p.39, 2002. 3

위의사례를통해객관적인정보에의한요인만으로영화흥행과의관계를규명하기에는한계가있 다고볼수있다. 따라서주관적인정보에의한요인과영화흥행과의관계를규명하는연구등다 양한관점에서연구가진행되어야한다. 1-2. 연구의목적및방법본연구는주관적인정보에의한요인중하나인영화를보고관객들이느끼는감정과영화흥행과의관계를규명하기위해각영화의장르별로관객들이영화를보고느끼는감정의분포를탐색하고영화흥행도와감정어휘의관계를파악하는데연구목적을두고있다. 이러한연구목적을달성하기위한방법은다음과같다. 첫째, 영화를통해관객들이느끼는감정을확인하기위해네이버영화평에서리뷰의개수가 1000 개이상인 673개의영화를선정하고전체리뷰텍스트데이터를 JAVA언어를사용하여크롤링 (Crawling) 하였다. 둘째, 표본으로선정된 673개의영화리뷰텍스트데이터에서감정어휘를추출하기위해선행연구를기반으로감정어휘사전을구축하였다. 셋째, 감정어휘사전을사용하여영화리뷰텍스트데이터를정제하여감정어휘값을생성하고 TF-IDF 공식을활용하여각영화에대한감정어의분포를표준화하였다. 또한영화의주요장르, 누적매출액, 누적관객수, 상영스크린수등영화에대한객관적인정보를나타내는요인과병합하였다. 넷째, 정제된데이터를분석하기위해 Parallel coordinate 시각화를제작하고 Parallel coordinate 를활용하여각영화의장르별로대표감정어휘의분포를탐색하고영화흥행도와감정어휘의관계를도출하였다. 다섯째, 분석결과를해석하고연구의시사점과연구의한계, 향후연구방향을제시하였다. 2. 관련연구 2-1. 영화흥행관련연구영화산업시장의규모가확대됨에따라영화의흥행에영향을미치는요인을도출해내기위한다양한연구들이진행되어오고있다. 국내에서는 1997년김휴종의 한국영화스타의스타파워분석 이라는연구와 2011년박승현, 송현주, 정완규의 한국영화의흥행성과결정요인에관한연구 등다양한연구가있다. 김휴종의연구에서는 1988년부터 1995년까지의 529편의영화를분석하여배우와감독의스타파워가흥행에미치는영향력을검증하였으며 7) 박승현외 2명의연구에서는개봉스크린규모, 제작비, 전문가평가, 온라인평가등이흥행에미치는영향력을검증하였다. 8) 해외에서는 1983년리트만 (Litman) 의 Predicting Success of Theatrical Movies: An Empirical Study 와 1991년와이어트 (Wyatt) 의 High concept, product differentiation, and the contemporary U.S film industry 등의연구가있다. 리트만의연구는 1970년대개봉한영화 155편 7) 김휴종. 8) 박승현, 송현주, 정완규. 4 Design Convergence Study 53 Vol.14. no.4 (2015.8)

에대한정보를수집하고회귀분석을실시하여제작비, 개봉스크린규모, 전문가평점, 배급사파워, 아카데미수상실적등의요소와공상과학 / 판타지, 코미디, 공포의세가지장르요소가유의미한영향력을지닌다는결과를도출하였고 9) 와이어트의연구는제작비, 전문가평점, 스타배우의파워, 아카데미수상실적, 여름시즌개봉의요인이영화흥행에영향을미친다는결과를도출하였다. 10) 영화흥행도관련선행연구의내용은 < 표1> 과같다. < 표 1> 영화흥행도관련논문 저자논문흥행에영향을미치는요인 김휴종한국영화스타의스타파워분석 (1997) 배우의스타파워, 감독의스타파워 박승현외 2 명 한국영화의흥행성과결정요인에관한연구 (2011) 개봉스크린규모, 제작비, 전문가평가, 온라인평가 송현주외 1명이윤정외 1명 Litman, B Wyatt, R. O 영화의흥행성과와제작비규모와의관계 (2012) 원작의유무와형태가영화흥행에미치는영향 (2013) Predicting Success of Theatrical Movies: An Empirical Study(1983) High concept, product differentiation, and the contemporary U.S film industry(1991) 온라인평가, 영화평점, 제작비, 코미디장르 소설원작의존재, 소설원작의형태, 소설원작의영향력, 영화관련외부콘텐츠 제작비, 개봉스크린규모, 전문가평점, 배급사파워, 아카데미수상실적, 공상과학 / 판타지, 코미디, 공포 (3 가지장르 ) 제작비, 전문가평점, 스타배우의파원, 아카데미수상실적, 여름시즌개봉 2-2. 영화감정어휘관련연구주관적인정보에의한요인은영화를관람한관객에의해생성되며영화에대한평가리뷰안에서감정어휘를추출하여분석하면영화흥행과감정어휘사이의관계를파악할수있다. 감정어휘에대한연구는언어에따라연구방법이상이한데한글의텍스트기반감정언어에대한연구는 2008년이준웅, 송현주, 나은경, 김현석의연구가있고영화리뷰를활용하여감정어휘를분석한연구는 2014년박지연, 전범수의연구가있다. 이준웅외 3명의연구 (2008) 에서는유사성분류자료를근거로군집분석을수행하였고, 감정어휘를기본수준에서 기쁨, 긍지, 사랑 등긍정적인정서들과 공포, 분노, 연민, 수치, 좌절, 슬픔 등부정적인정서로총 9개의정서범주로나눌수있음을제시하였다. 또한 기쁨 의경우다시 기쁨 과 통쾌 로나누어지며나누어진 기쁨 도 재미, 즐겁, 유쾌, 흥겹, 신나, 기쁘, 열망 으로나누는등대표감정어휘가포함하는세부감정어휘에대한온톨로지를구축하였다. 11) 박지연외 1명의연구 (2014) 에서는한국및외국흥행영화에대한네티즌리뷰를중심으로네티즌리뷰에사용된감정동사와흥행영화와의관계를분석하였다. 연구결과로는네티즌들이영화를판단할때재미를가장큰요인으로생각하고있다는점과한국영화의경우재미를기준으로몰입 9) Litman, B, Predicting Success of Theatrical Movies: An Empirical Study, Journal of Popular Culture, 16 (Spring), p.166, 1983. 10) Wyatt, R. O, High concept, product differentiation, and the contemporary U.S film industry, Current research in film Audiences, economics, and law, Vol. 5, p.93, 1991. 11) 이준웅, 송현주, 나은경, 김현석, 정서단어분류를통한정서의구성차원및위계적범주에관한연구, 한국언론학보, 제 52(1) 권, p.101, 2008. 5

이나감동등감정적동사를기준으로영화가군집화되고외국영화는재미있는영화와재미없는 영화로군집화된다는결과를얻었다. 12) 3. 데이터수집및정제 3-1. 영화리뷰데이터수집본연구에서는영화의장르별로감정어휘의분포를탐색하고영화흥행도와감정어휘의관계를파악하기위해아래와같이두단계의데이터수집과정을거쳤다. 첫째, 영화리뷰의수집을자동화하기위해데이터를수집할수있게 JAVA를사용하여해당사이트에대한웹크롤러를제작하였다. 크롤러는네이버영화홈페이지에서특정영화의관람객댓글과리뷰들을정제되지않은데이터형태로수집하도록설계되었다. 둘째, 수집된영화데이터중에서도리뷰의개수가 1000개이상인영화들만다시필터링하였고최종적으로는 2289개의영화중 673개의영화에대한리뷰데이터가수집되었다. 3-2. 감정어휘사전구축본연구에서는감정어휘사전을구축하기위해여러방법을거쳤으며감정어휘사전구축과정은다음과같다. 첫째, 본연구의기반이된선행연구중하효지외 2명의연구 (2013) 를참고하여 68개의감정어휘를선정하고 7개의대표감정어휘범주 ( Happy, Sad, Fear, Anger, Surprise, Disgust, Boring ) 로분류및군집화하는작업을시행하였다. 13) 해당감정어휘사전을바탕으로리뷰데이터를분류하여 673개영화리뷰에대한 1차감정어휘데이터를생성하였다. 둘째, 본연구에서는실제영화리뷰데이터에서영향력이미미한감정어휘를제거하여조금더정확한결과를얻고자하였으며이를위해 1차적으로 TF-IDF공식을활용하여감정어휘데이터를표준화시켰다. TF-IDF는각감정어집단의단어빈도수 (tf : Term Frequency) 와역문서빈도 (idf : Inverse Document Frequency) 를곱하여감정어휘를표준화시킨공식으로써 TF-IDF값에관한공식은다음과같다. 셋째, 감정어휘개수를줄이기위해각감정어휘에서나타날수있는 TF-IDF 스코어의최대치를구하였다. 예를들어 경악하다 의경우모든영화에서 TF-IDF 스코어의비율이 0.8% 이하인반면에 달콤하다 의경우는적어도한개의영화에서는 TF-IDF 스코어의비율이 42% 에달하는것을뜻한다. 따라서 TF-IDF스코어의비율이 10% 미만인감정어휘를제거하고최종적으로 36개의감정어휘를선택하였다. 최종적으로선택된 36개의감정어휘는크게 Happy, Surprise, Boring, Sad, Anger, Disgust, Fear 의성격으로나뉘게되며, 감정어휘에관한내용은 < 표 2> 와같다. 12) 박지연, 전범수, 네티즌의흥행영화리뷰에포함된감정동사이용특성연구, 한국콘텐츠학회, 제 14(5) 권, p.88, 2014. 13) 하효지, 김기남, 이경원, 영화리뷰의감정어휘공간및영화관람의상황분석연구, 디자인융복합학회, 제 12(6) 권, p.51, 2013. 6 Design Convergence Study 53 Vol.14. no.4 (2015.8)

< 표 2> 최종선정된 36 개의감정어휘표 대표감정어휘 Happy Surprise Boring Sad Anger Disgust Fear 세부감정어휘 Happy, Sweet, Funny, Exited, Pleasant, Fantastic, Gratified, Enjoyable, Energetic Surprised, Ecstatic, Awesome, Wonderful, Great, Touched, Impressed Calm, Drowsy, Bored Pitiful, Lonely, Mournful, Sad, Heartbroken, Unfortunate Outraged, Furious Ominous, Cruel, Disgusted Scared, Chilly, Horrified, Terrified, Creepy, Fearsome 3-3. 영화리뷰데이터정제본연구는영화의장르별로관객들이영화를보고느끼는감정의분포를탐색하고영화흥행도와감정어휘의관계를파악하는데연구목적을두고있으며이를위해앞의과정을통해얻은데이터중대표감정어휘와각영화의객관적인정보를담은데이터를병합하여최종적인데이터를생성하였다. 병합된영화에대한객관적인정보데이터는영화티켓판매액, 영화관람관객수, 상영스크린수, 한스크린당영화관람관객수, 영화의장르, 영화의영문이름등이었으며영화진흥위원회의통계결과를바탕으로데이터를생성하였다. 14) 영화흥행도를나타내는요인으로 1983년리트만 (Litman) 의연구에서는누적매출액을영화흥행도로사용하였으며, 15) 최근연구들중 2012 년박승현외 1명의연구에서는누적관객수를영화흥행도를나타내는요인으로사용하였다. 16) 본연구에서는누적관객수를상영스크린수로나누어한스크린에서의누적관객수를영화흥행도로사용하였으며위의데이터와병합하여분석에사용하였다. 3-4. 데이터의특성파악 3-4-1. 영화장르별흥행도의분포와감정어휘분포분석 673개의영화에대한총판매액의평균은 10,170,432,626 원이고누적관객수의평균은 1,470,000 명, 평균상영스크린은 330개상영관, 흥행도를나타내는한스크린당누적관객수의평균은 4,010명이었다. 또한영화의장르는드라마 (25.9%), 액션 (19.2%), 코미디 (13.8%), 멜로로맨스 (7.6%), SF(7.3%) 순으로드라마가제일많은비중을차지하였으며, 제작국가는한국 (44.1%), 미국 (38.2%), 일본 (4%), 프랑스 (1%), 미국 & 독일 (0.7%) 순으로한국과미국이대부분의비중을차지하였다. 마지막으로 673개의영화에대한리뷰에서감정어의분포는 Happy (34.3%), Surprise (31.7%), Sad (13.3%), Boring (7.6%), Fear (5.7%), Anger (4.5%), Disgust (2.7%) 순으로 Happy 와 Surprise 가차지하는비율이높았다. 최종적으로분석에사용될데이터의특징은 < 표 3> 의내용과같다. 14) 영화진흥위원회. 15) Litman, B. 16) 박승현, 송현주, 영화의흥행성과와제작비규모와의관계 : 2011 년한국영화의흥행결정요인분석, 사회과학연구, 제 51 집 1 호, p.67, 2012. 7

< 표 3> 영화데이터의특징 장르 제작국가 감정어휘 구분 빈도 비율 (%) 드라마 174 25.9 액션 129 19.2 코미디 93 13.8 멜로로맨스 51 7.6 SF 49 7.3 한국 297 44.1 미국 257 38.2 일본 27 4 프랑스 7 1 미국 & 독일 5 0.7 Happy 1143281 34.3 Surprise 1054108 31.7 Sad 443010 13.3 Boring 253862 7.6 Fear 189763 5.7 Anger 150013 4.5 Disgust 89827 2.7 4. 시각화기능및제안 4-1. Parallel coordinates의개념본연구에서다변량으로되어있는영화데이터를분석하기위해여러시각화분석방법중 Parallel coordinates( 평행좌표계 ) 를사용하였다. Parallel coordinates 시각화분석방법은 N차원공간안의점들의집합을보여주기위한방법으로일반적으로수직의형태이며 N개의등간격평행라인으로이루어져있다. 또한시계열데이터시각화에도밀접한관계가있으며데이터내변수간의관계를파악하는데용이하다. 17) 이방법은 1985년 Inselberg. A. 가구체적으로제안하였고최근까지다양한학문영역에서사용되고있다. Inselberg. A. 의연구에따르면 Parallel coordinate 는각변수의대부분라인이평행일때두차원사이에유사한관계가형성된다고해석할수있으며, 대부분의라인이교차할때는상이한관계가형성된다고해석한다. 18) 또한본연구에서는 Parallel coordinates 시각화방법에선택된데이터의평균값을나타내는기능, 영화의장르를선택하는기능, 축을변경하는기능, 축을제거하는기능, 하나의영화를선택하여데이터의특징을확인하는기능, 영화의제목명으로데이터를검색하는기능등분석에필요한다양한인터렉션기능을추가하였다. 4-2. Parallel coordinates의기능본연구에서는정확한시각화분석을시행하기위해기존의 Parallel coordinates 시각화방법에다양한기능을추가하였다. 연구에사용된 Parallel coordinates 시각화의기능은다음과같다. 4-2-1. 번들링 (Bundling) Parallel coordinates 시각화는일반적으로축이변경될때데이터의연결표현을직선으로표현하고있다. 하지만직선으로데이터사이의연결을표현할경우데이터의양이많으면축이전혀보이지않고데이터사이의패턴또한발견하기어렵다. 본연구에서는 < 그림 1> 의오른쪽과같이데이터사이의연결표현에번들링기능을추가하였으며번들링기능을통해데이터사이의연결을표 17) 위키백과사전, Parallel coordinate 의정의, http://ko.wikipedia.org/ 18) Inselberg, A, The plane with Parallel coordinates, The Visual Computer, p. 79, 1985, 8 Design Convergence Study 53 Vol.14. no.4 (2015.8)

현하면해당축의데이터들을일정수준으로묶어서표현하기때문에데이터들이군집화되는경향 을쉽게확인할수있다. < 그림 1> ( 왼쪽 ) 일반적인 Parallel coordinates ( 오른쪽 ) 번들링기능을추가한 Parallel coordinates 4-2-2. 축 (Axes) 일반적인 Parallel coordinates 시각화는데이터변수를축으로설정하고데이터변수사이에서변화하는데이터들의패턴을확인하는데매우용이하다. 본연구에서는 Parallel coordinates에 < 그림 2> 와같이데이터변수축의삭제기능과축의순서를이동시키는기능을추가하여분석을용이하게하였다. < 그림 2> ( 왼쪽 ) 기본적인데이터축의순서 ( 오른쪽 ) Happy 의데이터변수축순서변경 4-2-3. 색상 (Colour) 장르별로비교분석을하기위해서는영화의장르별로구분할수있는기능이필요한데, 본연구에서는 < 그림 3> 과같이영화가속하는주요장르에따라 line 그래프의색상을다르게지정하여사용자가영화의장르별로데이터를구분할수있게하였다. < 그림 3> 영화의장르별로지정된색상 9

4-2-4. 기술통계 (Descriptive statistic) 일반적으로시각화분석에서사용되는 Parallel coordinates 는데이터패턴, 데이터변수축에서발생하는군집화, 변수축사이의직선기울기등시각적으로확인이가능한부분만으로해석을해야한다. 본연구에서는다양한관점으로분석을시행하기위해 < 그림 4> 와 < 그림 5> 와같이선택된데이터의평균을나타내는평균선, 선택된각각의데이터변수축의평균값, 선택된영화수의합계를내타내는기능을추가하였다. < 그림 4> 선택된데이터변수들의평균값과영화수의합계 < 그림 5> 선택된데이터변수들의평균값과평균선 ( 굵은 line 그래프 ) 4-2-5. 데이터선택 (Data Selection) 영화의장르별로대표감정어휘의분포를탐색하고영화흥행과감정어휘사이의관계를파악하기위해서는장르별데이터의패턴비교, 분포확인, 조건에따른패턴변화등을확인하여야한다. 본연구에서는분석을용이하기위해 < 그림 6> 과 < 그림 7> 과같이장르선택기능, 영화검색기능, 조건에따른데이터필터링기능, 하이라이트기능등을추가하여분석을용이하게하였다. < 그림 6> 데이터선택 : 장르가액션 & 코미디이고 상영스크린수가 100 개이상인영화 < 그림 7> 2009 년개봉작김씨표류기 (Castaway on the Moon) 에대한하이라이트 View 4-3. Parallel coordinates 를활용한분석 10 Design Convergence Study 53 Vol.14. no.4 (2015.8)

본연구는영화리뷰를사용하여영화의장르별로대표감정어휘의분포를탐색하고영화의흥행도와감정어휘의관계를파악하는데연구목적두고있다. 분석을위해 7개의대표감정어휘, 영화티켓판매액, 영화관람관객수, 상영스크린수, 한스크린당영화관람관객수, 영화의장르, 영화의영문이름등으로이루어진최종데이터를생성하였으며연구목적을위한분석은상관관계분석방법과 Parallel coordinates 시각화분석방법을사용하였다. 4-3-1. 영화장르별흥행도의분포와대표감정어휘의분포본연구에사용된 673개의영화의대표장르는드라마 (25.9%), 액션 (19.2%), 코미디 (13.8%), 멜로로맨스 (7.6%), SF(7.3%) 등의순서이며데이터의개수가 15개이상인영화의장르별흥행도와감정어휘분포는 < 표4> 와같다. < 표 4> 데이터의개수가 15개이상인영화의장르별감정어휘분포 ( 평균값 ) 대표장르 흥행도 Happy Surprise Boring Sad Anger Disgust Fear 드라마 (174) 4,270 0.249 0.333 0.0935 0.186 0.054 0.035 0.0476 액션 (129) 4,060 0.351 0.233 0.0926 0.13 0.0774 0.0455 0.0715 코미디 (92) 4,860 0.465 0.213 0.0849 0.122 0.0561 0.0397 0.0177 멜로로맨스 (52) 3,590 0.325 0.330 0.102 0.161 0.0438 0.021 0.019 SF(49) 4,130 0.274 0.227 0.102 0.163 0.0833 0.0504 0.102 호러 (41) 2,480 0.120 0.176 0.0573 0.113 0.0495 0.080 0.404 스릴러 (40) 3,520 0.207 0.253 0.0898 0.118 0.0828 0.0688 0.182 범죄 (27) 3,680 0.283 0.250 0.101 0.121 0.0715 0.0722 0.103 판타지 (18) 3,310 0.368 0.240 0.104 0.159 0.0728 0.0239 0.0339 미스터리 (17) 2,480 0.225 0.217 0.0912 0.123 0.0506 0.0347 0.259 본연구에서는누적관객수를상영스크린수로나누어한스크린에서의누적관객수를영화흥행도로사용하였으며영화의흥행도가제일높은장르인코미디의경우, 한스크린당평균누적관객수는 4,860명이었고감정어의분포는 < 그림 8> 과같이 Happy (0.465), Surprise (0.213), Sad (0.122), Boring (0.0849), Anger (0.0561), Disgust (0.0397), Fear (0.0177) 순이었으며평균적으로행복한감정이다른감정에비해많이느껴진다는결과를 Parallel coordinates 를통해확인할수있다. 다음으로영화의흥행도가제일낮은장르인호러의경우, 한스크린당평균누적관객수는 2,480명이었고감정어의분포는 < 그림 9> 와같이 Fear (0.404), Surprise (0.176), Happy (0.120), Sad (0.113), Disgust (0.0800), Boring (0.0573), Anger (0.0495) 순이었으며다른감정에비해무서운감정이많이느껴진다는결과를 Parallel coordinates 를통해확인할수있다. < 그림 8> 영화의대표장르가코미디인영화에대한감정어휘분포 11

< 그림 9> 영화의대표장르가호러인영화에대한감정어휘분포 4-3-2. 영화의대표감정어휘사이의상관관계 본연구에서는감정어휘를 36개로세분화하였으며이를다시 Happy, Surprise, Boring, Sad, Anger, Disgust, Fear 로군집화하였다. 장르구분없이전체영화를대상으로상관계수 (Correlation) 공식을활용해대표감정어휘별상관관계를분석한결과는 < 표5> 와같으며모든변 수들은 P < 0.05로선형연관성이있었다. < 표 5> 전체영화의대표감정어휘별상관관계표 Happy Surprise Boring Sad Anger Disgust Fear Happy 1.00-0.286 0.016-0.444-0.175-0.300-0.466 Surprise -0.286 1.00-0.136 0.042-0.407-0.338-0.300 Boring 0.016-0.136 1.00 0.052 0.068-0.173-0.205 Sad -0.444 0.042 0.052 1.00 0.202 0.045-0.215 Anger -0.175-0.407 0.068 0.202 1.00 0.514-0.097 Disgust -0.300-0.338-0.173 0.045 0.514 1.00 0.122 Fear -0.466-0.300-0.205-0.215-0.097 0.122 1.00 전체영화를대상으로대표감정어휘별상관관계를분석한결과상관관계가정 ( 正 ) 의방향으로가장높은감정어휘는 Disgust 와 Anger 로상관관계는 0.514이다. 이를 Parallel coordinates 를통해확인한결과는다음과같다. Disgust 에대한구간값이 0.1이하인경우 Disgust 와 Anger 의감정어휘값은 0.0295와 0.0560, Disgust 에대한구간값이 0.1부터 0.3인경우 Disgust 와 Anger 의감정어휘값은 0.160와 0.123, Disgust 에대한구간값이 0.3이상인경우 Disgust 와 Anger 의감정어휘값은 0.350와 0.143이었다. 이는 Disgust 의값이높아질때 Anger 의값도같이높아진다고볼수있으며분석결과는 < 그림 10> 과같다. < 그림 10> Disgust 값이 0.1 이하 ( 왼쪽 ), 0.1 이상 0.3 이하 ( 가운데 ), 0.3 이상 ( 오른쪽 ) 일때의분석결과 12 Design Convergence Study 53 Vol.14. no.4 (2015.8)

다음으로상관관계가부 ( 不 ) 의방향으로가장높은감정어휘는 Happy 와 Sad 로상관관계는 -0.444이다. 이를 Parallel coordinates 를통해확인한결과는다음과같다. Sad 에대한구간값이 0.175이하인경우 Happy 와 Sad 의감정어휘값은 0.341와 0.110, Sad 에대한구간값이 0.175 부터 0.35인경우 Happy 와 Sad 의감정어휘값은 0.226와 0.224, Sad 에대한구간값이 0.35 이상인경우 Happy 와 Sad 의감정어휘값은 0.110와 0.433이었다. 이는 Sad 의값이높아질때 Happy 의값은낮아진다고볼수있으며분석결과는 < 그림 11> 과같다. < 그림 11> Sad값이 0.175이하 ( 왼쪽 ), 0.175이상 0.35이하 ( 가운데 ), 0.35이상 ( 오른쪽 ) 일때의분석결과마지막으로모든영화장르에서값이높게나왔던 Happy 와 Surprise 의상관관계를분석한결과부 ( 不 ) 의방향으로상관관계 (-0.286) 가있는것을확인하였다. 이를 Parallel coordinates 를통해확인한결과는다음과같다. Surprise 에대한구간값이 0.2이하인경우 Happy 와 Surprise 의감정어휘값은 0.330과 0.144, Surprise 에대한구간값이 0.2부터 0.4인경우 Happy 와 Surprise 의감정어휘값은 0.324와 0.282, Surprise 에대한구간값이 0.4이상인경우 Happy 와 Surprise 의감정어휘값은 0.203와 0.468이었다. 이는 Surprise 의값이높아질때 Happy 의값은낮아진다고볼수있으며분석결과는 < 그림 12> 와같다. < 그림 12> Surprise값이 0.2이하 ( 왼쪽 ), 0.2이상 0.4이하 ( 가운데 ), 0.4이상 ( 오른쪽 ) 일때의분석결과 4-3-3. 영화흥행도에영향을미치는대표감정어휘분석본연구에서는누적관객수를상영스크린수로나누어한스크린에서의누적관객수를영화흥행도로사용하였으며모든장르의영화를대상으로흥행도값에조건을주어영화의흥행도와감정어휘의관계를분석한결과는다음과같다. < 그림 13> 영화흥행도가 10,000 명이상인경우분석결과 13

영화흥행도가 10,000명이상인경우, < 그림 13> 과같이조건에해당하는영화는 41개의영화였으며대표감정어휘의분포는 Happy (0.346), Surprise (0.294), Sad (0.149), Boring (0.0685), Fear (0.0634), Anger (0.0461), Disgust (0.0341) 의순서로영화의흥행도가높을때값이높게분포하는대표감정어휘는행복한감정과놀라운감정이라는결과를도출하였다. < 그림 14> 영화흥행도가 10,000 명이하이고 1,000 명이상인경우분석결과 영화흥행도가 10,000명이하이고 1,000명이상인경우, < 그림 14> 과같이조건에해당하는영화는 556개의영화였으며대표감정어휘의분포는 Happy (0.309), Surprise (0.258), Sad (0.148), Boring (0.0941), Fear (0.0848), Anger (0.0633), Disgust (0.0427) 의순서로값이높게분포하는대표감정어휘는조건이흥행도가 10,000명이상인경우일때와같다는결과를도출하였다. < 그림 15> 영화흥행도가 1,000명이하인경우분석결과영화흥행도가 1,000명이하인경우, < 그림 15> 와같이조건에해당하는영화는 75개의영화였으며해당대표감정어휘의분포는 Surprise (0.275), Happy (0.269), Sad (0.132), Fear (0.117), Boring (0.0823), Anger (0.0680), Disgust (0.0556) 의순서로영화의흥행도가낮을때값이높게분포하는대표감정어휘는놀라운감정과행복한감정이었으며영화의흥행도가낮은경우무서운감정의값이다른조건들에비해높다는것을확인하였다. 5. 결론및제안영화산업의성장과함께영화흥행에영향을미치는요인을도출하기위한다양한연구가진행되어왔으며이제까지의연구들을통해감독의명성, 제작, 유통사의역량, 영화평론가의리뷰, 감독, 작가, 제작자등영화와관련된관계자들의역할및상호간의연결등이영화의성공여부를결정할수있는요인으로밝혀졌다. 하지만객관적인정보에의한요인만으로영화흥행과의관계를규명하기에는한계가있으며주관적인정보에의한요인과흥행사이의관계를규명하는연구의필요성이제기되었다. 14 Design Convergence Study 53 Vol.14. no.4 (2015.8)

본연구는이러한상황에서주관적인정보에의한요인과영화흥행과의관계를규명하고자하였으며특히영화의장르별로관객들이느끼는감정어휘의분포를탐색하고영화의흥행도와감정어휘사이의관계를파악하는데연구목적을두고진행하였다. 최종적으로 7개의대표감정어휘, 영화티켓판매액, 영화관람관객수, 상영스크린수, 한스크린당영화관람관객수, 영화의장르, 영화의영문이름등으로이루어진데이터를분석에활용하였으며분석도구로는 Parallel coordinates 시각화분석방법을사용하였다. 본연구를통해도출된결과는다음과같다. 첫째, 영화의흥행도값이가장높은장르와가장낮은장르를확인한결과, 영화의흥행도가제일높은장르는코미디 (4,860명) 였고, 대표감정어의분포는 Happy (0.465), Surprise (0.213), Sad (0.122), Boring (0.0849), Anger (0.0561), Disgust (0.0397), Fear (0.0177) 순이었다. 다음으로영화의흥행도가제일낮은장르는호러 (2,480명) 였고, 대표감정어의분포는 Fear (0.404), Surprise (0.176), Happy (0.120), Sad (0.113), Disgust (0.0800), Boring (0.0573), Anger (0.0495) 순이었다. 코미디영화중하나인 스윙걸즈 의리뷰는 너무나깔끔하게유쾌한영화, 정말재미있고풋풋하네요. 등행복한감정을나타내는리뷰들이있었고, 호러영화중하나인 새벽의저주 의경우 좀비영화중이보다무서운영화는없는듯단연최고, 무서워서지릴뻔했음 등무서운감정을나타내는리뷰들이있었다. 둘째, 대부분의장르에서 Happy 와 Surprise 의값이가장높았으나각각의대표감정어휘값이가장큰장르는다음과같았다. Happy (0.465) 의값이가장높은장르는코미디, Surprise (0.333) 의값이가장높은장르는드라마, Boring (0.0849) 의값이가장높은장르는판타지, Sad (0.122) 의값이가장높은장르는드라마, Anger (0.0561) 의값이가장높은장르는 SF, Disgust (0.0397) 의값이가장높은장르는범죄, Fear (0.0177) 의값이가장높은장르는호러인것을확인하였다. 이를통해대부분의장르에서 Happy 와 Surprise 의값이높게나오지만다른장르들에비해판타지장르의영화는지루한감정이많이느껴지고, SF장르의영화는화나는감정이많이느껴진다는결과를도출하였다. 판타지영화중하나인 해리포터와불사조기사단 의리뷰는 시리즈중가장지루한듯함, 재미도없는데지루하기까지함 등지루한감정을나타내는리뷰들이있었고, SF 영화중하나인 엘리시움 의경우 배우들이아깝다. 쓰레기영화., 예고편에속은듯욕나온다. 등화나는감정을나타내는리뷰들이있었다. 셋째, 영화의대표감정어휘사이의상관관계를분석한결과, 정 ( 正 ) 의상관관계값이가장높은감정어휘는 Disgust 와 Anger (0.514) 였고, Disgust 의값이높아짐에따라 Anger 의값도높아지는것을확인하였다. 다음으로부 ( 不 ) 의상관관계값이가장높은감정어휘는 Happy 와 Sad (-0.444) 였고, Sad 이값이높아질때 Happy 의값은낮아지는것을확인하였다. 또한 Happy 와 Surprise (-0.286) 도부 ( 不 ) 의상관관계를가졌으며이를통해대부분의장르에서 Happy 와 Surprise 의감정이많이분포하지만 Happy 의값이높아질때 Surprise 의값은낮아진다는결과를확인할수있었다. 넷째, 모든장르를대상으로영화의흥행도와감정어휘의관계를분석하여확인한결과, 영화흥행도가 10,000명이상인경우, 대표감정어휘의분포는 Happy (0.346) 와 Surprise (0.294) 가가장높았다. 다음으로영화흥행도가 10,000명이하이고 1,000명이상인경우에도마찬가지로 Happy (0.309), Surprise (0.258) 가가장높았다. 마지막으로영화흥행도가 1,000명이하인경우, 위의경우와마찬가지로 Surprise (0.275), Happy (0.269) 의값이가장높았으며 Fear (0.117) 의경우다른조건보다높은값을가졌다는점에서두조건과상이하였다. 이를통해영화흥행도의값높아질때 Happy 값도같이높아졌고, 영화흥행도값이낮아질때 Fear 값은높아진다는결과를 15

확인하였다. 기존의선행연구들은객관적인정보에의한요인을중심으로흥행도에영향을미치는요인을탐색하는방향으로이루어졌지만본연구는주관적인정보에의한요인중하나인영화를보고관객들이느끼는감정과영화흥행과의관계를규명하기위해영화장르별로감정어휘의분포를탐색하고영화의흥행도와감정어휘의관계를파악하였다는데시사점이있다. 하지만감정어휘값을생성할때영화리뷰안의명사표현만으로데이터를생성하였다는데한계점이있다. 따라서향후에는관용표현처리방법, 논항구조파악방법, 강도에따른인식방법에대한형태소분석연구를진행하여본연구에도입하여야한다. 참고문헌 논문 Adel Ahmed, Vladimir Batagelj, Xiaoyan Fu, Seok-Hee Hong, Damian Merrick, Andrej Mrvar, Visualisation and Analysis of the Internet Movie Database, Asia-Pacific Symposium on Visualisation 2007 IEEE, 2007. Litman, B, Predicting Success of Theatrical Movies: An Empirical Study, Journal of Popular Culture, 16 (Spring), pp.159-175, 1983. Hyoji Ha, Wonjoo Hwang, Hanmin Choi, Gi-nam Kim, Hansung Kang, Kyungwon Lee, CosMovis: Semantic Network Visualization on Sentiment Words for Movie Recommendation System, VIS 2014 Computer society IEEE, 2014. Inselberg, A, "The plane with Parallel coordinates", The Visual Computer, pp. 69 91, 1985. Parrott, W, "Emotions in Social Psychology", Philadelphia: Psychology Press, 2001. Rolf A. Zwaan, Mark C. Langston and Arthur C. Graesser, "The Construction of Situation Models in Narrative Comprehension: An Event-Indexing Model", Psychological Science, Vol. 6, No. 5, pp.292-297, 1995. 김연형, 홍정한, 영화흥행결정요인과흥행성과예측연구, 한국통계학회논문집, 제 18 권, 제 6 호, pp.859-869, 2011. 박승현, 송현주, 정완규, 한국영화의흥행성과결정요인에관한연구, 언론과학연구, 제 11 권, 제 4 호, pp.231-258, 2011. 성영신, 박진영, 박은아, 온라인구전정보가영화관람의도에미치는영향, 광고연구, 제 57 권, pp.31~52, 2002. 김휴종, 한국영화스타의스타파워분석, 삼성경제연구소연구보고서, 1997. 이준웅, 송현주, 나은경, 김현석, 정서단어분류를통한정서의구성차원및위계적범주에관한연구, 한국언론학보, 제 52(1) 권, pp.85-116, 2008. 김정호, 김명규, 차명훈, 인주호, 채수환, 한국어특성을고려한감성분류, 감성과학, 제 13(3) 권, pp.449-458, 2010. 하효지, 김기남, 이경원, 영화리뷰의감정어휘공간및영화관람의상황분석연구, 디자인융복합학회, 제 12(6) 권, pp.43-59, 2013. 한덕웅, 강혜자, " 한국어정서용어들의적절성과경험빈도 ", 한국심리학회지, 제 19 권, pp.78-98, 2000. 박지연, 전범수, 네티즌의흥행영화리뷰에포함된감정동사이용특성연구, 한국콘텐츠학회, 제 14(5) 권, pp.85-94, 2014. 박승현, 송현주, 영화의흥행성과와제작비규모와의관계 : 2011 년한국영화의흥행결정요인분석, 사회과학연구제 51 권 1 호, pp. 45~79, 2012. 인터넷사이트 위키백과사전, Parallel coordinate 의정의, http://ko.wikipedia.org/ 영화진흥위원회, http://www.kobis.or.kr/kobis/business/mast/mvie/searchmovielist.do 16 Design Convergence Study 53 Vol.14. no.4 (2015.8)