2015. 8. 19.
트위터 메시지를 활용한 K CON 2015 분석 이 보고서는 한국콘텐츠진흥원 미국사무소가 빅데이터 연구 전문가 김선호 교수( 美 USC Viterbi School of Engineering, Integrated Media Systems Center)의 협력을 얻어 조사, 분석하여 작성하였습니다. 작성순서 들어가기 주요 분석 결과 상세 분석 결과 정리 및 시사점 1. 들어가기 - K CON은 한류의 모든 것'을 주제로 CJ E&M이 주최하는 컨벤션과 콘서트를 결합한 한국 대중문화 축제임 - 대중문화 콘텐츠를 중심으로 한국의 음식, 관광, 패션, 공산품을 아우르는 종합 컨벤션은 K CON이 최초인데, 지난 2012년 미국에서 처음 열린 이후, 올해로 4회 째를 맞이했음 - K CON'이라는 이름은 사람을 많이 모을 수 있는 콘서트(Concert)를 매개로 한류 콘텐츠(Contents)와 국내 기업의 제품을 체험하는 컨벤션 (Convention)을 융합하여 한국(Korea)에 대한 종합적인 브랜드 체험을 제공한다는 의미를 가짐 - 한류에 열광하는 해외 팬을 직접 만나고 소통하는 동시에 국내 기업의 해외 진출을 도와 한류의 산업화를 이끌고 국가 브랜드를 높이자는 전략임
- K CON 2015는 미국 두 도시에서 일주일 간격으로 열림 - 2015년 7월 31일(금)부터 8월 2일(일)까지 미국 LA에 있는 LA 컨벤션 센터'와 스테이플스 센터 에서 열렸으며 참석자는 약 55,000명을 기록함 1) - 2015년 8월 8일(토), 미국 뉴저지 주 뉴어크의 푸르덴셜 센터 (Newark Prudential Center)에서 열렸으며 참석자 약 17,000명을 기록함 2) - 트위터(Twitter)는 소셜 네트워크 서비스(SNS)의 대표적인 한 형태로 트윗(tweet) 이라 불리는 단문 메시지(140자 한도)를 이용해 사용자 간에 대화를 함 - 영어를 비롯해 여러 언어를 지원하며 지역에 제한 없이 전 세계 이용자들과 짧은 글로 대화를 주고받을 수 있음 - 모바일에 최적화 된 서비스로 스마트폰의 급속한 대중화에 힘입어 높은 이용률을 보이며 전 세계적으로 매달 10-50억 개의 메시지가 발생함 - 트위터 메시지는 대중에 공개되기에 전 세계 사용자들의 대화를 실시간으로 확인 및 분석할 수 있어 좋은 정보원이 될 수 있음 - 특히 사용자들 간의 대화를 감성 분석하여 특정 브랜드, 주제, 사람에 대한 인기나 호불호 조사에 많이 활용됨 * 감성 분석 [Sentiment Analysis, 感 性 分 析 ] 소비자의 감성과 관련된 텍스트 정보를 자동으로 추출하는 텍스트 마이닝(Text Mining) 기술의 한 영역. 문서를 작성한 사람의 감정을 추출해 내는 기술로 문서의 주제보다 어떠한 감정을 가지고 있는가를 판단하여 분석함. 주로 온라인 쇼핑몰에서 사용자의 상품평에 대한 분석이 대표적 사례로 하나의 상품에 대해 사용자의 좋고 나쁨에 대한 감정을 표현한 결과임 - NAVER 지식백과 - 트위터 메시지 분석을 위해서는 최소한 2개의 모듈이 필요함 - 특정 이슈에 대해 얼마나 많은 사람들이 영향을 받는가에 대한 평가함 트위터에 접속해 특정 키워드를 담고 있는 메시지들을 검색해 다운받음 메시지 수, 팔로우 등 정량화된 평가 비교적 직접적이고 이해하기 쉬운 통계적 분석 1) www.munhwa.com 2) www.koreatimes.co.kr
- 그 이슈에 대해 사람들이 어떻게 생각하는가를 평가 사람들의 의견을 평가하는 것은 쉽지 않음 자동적으로 호불호, 주관, 감정을 파악하는 감성 분석이 필요 머신 러닝이나 자연어 처리가 필요 - 트위터 메시지는 단문 트윗으로 구성되어 있고 짧고 함축적이고 속어나 이모티콘, 해시 태그를 사용하기 때문에 장문의 비평이나 기사에 비해 감성 분석이 어려워서 주로 메시지 안의 단어들을 기반으로 메시지의 극성(긍정적, 부정적, 중립)을 평가함 - 이번 조사는 K CON 행사기간을 전후로 한국 대중문화의 주요 키워드가 트위터 상에서 어떤 변화를 일으키고, SNS를 통해 대중들이 어떻게 반응하는지 살펴보고자 하였음 2. 주요 분석 결과 - 2015년 7월 27일 오후 6시부터 8월 9일 자정까지 2주에 걸쳐 K CON 2015 관련 영문 트위터 메시지를 수집했음 - 트위터 메시지 수집에 사용된 관련 키워드들을 K CON, K CONLA, K CON NY, KPop, 등 K CON 행사 관련 유사 키워드와 GOT7, Super Junior, VIXX, AOA 등 참석한 아티스트 이름 및 유사 이름, 두 그룹으로 분류함 - 한 메시지에 여러 개의 키워드가 있을 경우 두 그룹에 동시에 속할 수 있음 - 기간 중 수집된 총 메시지 수는 916,031 개로 총 데이터 크기는 17GB에 달함 - 기간 중 시간대별 관련 트위터 메시지 수 변동 상황을 살펴보면 LA 시간 8월 1일 오후 9시-10시에 가장 큰 피크 3) 를 기록했는데 이는 콘서트 시간이었기 때문으로 보임 - 1시간 동안 38,101개를 기록하였고 그 중 32,503개의 메시지에 K CON 관련 키워드가 있었음 - 뉴욕 시간 8월 8일 오후 9시-10시에 두 번째로 큰 피크를 기록하였는데 이 역시 뉴욕 콘서트 시간으로, 한 시간 동안 16,317개의 메시지가 있었으며 그 중 13,244개의 메시지에 K CON관련 키워드가 있었음 3) 본 리포트의 모든 시간은 미국 로스앤젤레스 시간인 Pacific Time Zone에 맞춰 변환된 것임
<시간대별 트위터 메시지 수> - 전 세계 200여 개 도시 및 다른 타임 존에서 K CON 관련 트위터 메시지와 리트윗이 발생함 - 이는 K CON 행사가 세계적인 관심을 받았다는 증거임. - 가장 많이 발생한 지역은 미 서부, 방콕, 자카르타, 미 동부, 중국 북경의 순이었음 - 수집된 메시지들에 대한 K CON 및 참가 아티스트들에 대한 감성 분석 (sentiment analysis) 결과는 전반적으로 긍정적이고 호의적이었음 - 가장 많이 사용된 단어는 K CON, K CONLA, GOT7, Super Junior, KPop, crush, Girls Generation, K CONNY의 순이었음 3. 상세 결과 분석 - 실제 행사기간은 LA K CON이 7월 31일부터 8월 2일, 그리고 뉴욕 K CON은 8월 8일이었으나 사람들의 관심도를 살펴보기 위해 3일 전부터 메시지를 수집하였음
- 수집기간은 2015년 7월 27일 오후 6시부터 8월 9일 자정까지였음 (미국 서부 시간 기준) - 현지인들 및 전 세계적 반응을 분석하기 위해 영문 메시지만 수집하였음 - 수집된 메시지는 리트윗(Retweet)된 메시지들을 포함해 총 916,031개에 달했음 시간대별 메시지 발생 횟수 - 행사관련 메시지 발생 횟수는 사람들의 관심이 언제 집중되는가를 알 수 있는 척도이므로 수집 기간 중 발생한 메시지를 시간대별로 측정하여 그래프로 작성하였음 - K CON 행사관련 키워드가 들어간 메시지와 참가 아티스트들의 키워드가 들어간 메시지를 분리 측정하여 사람들의 관심이 행사 자체에 있는지 참가하는 가수, 배우에게 있는지 살펴볼 수 있음 - 결과는 K CON 관련 행사 키워드가 들어간 메시지의 수가 아티스트들의 이름이 들어간 메시지들의 수보다 약간 적은 것으로 집계되었음 - 하지만 행사 당일만의 집계는 거의 비슷하였고 이는 실질적으로 K CON 브랜드에 대한 인식이 높은 편이라고 해석할 수 있음 - 편의상 7월 26일에서 8월 3일 사이에 수집된 메시지들은 LA K CON 관련으로, 8월 6일에서 8월 9일 사이의 메시지들은 뉴욕 K CON 관련으로 분류했음 - 트윗 숫자는 행사 시작 전에 비해 행사 당일이 압도적으로 많이 발생함 - 행사 기간 전에는 주로 티켓을 구매하고 행사장에 직접 방문하는 적극적 팬 층들이 메시지를 만든 것으로 분석됨 - 하지만 행사 기간이 가까워질수록 트윗수가 증가했고 LA K CON행사의 첫 번째 콘서트가 열린 8월 1일 저녁에 폭발적으로 증가했음 - 이는 행사에 관심이 있으나 직접 참가하지 못한 사람들이 현장 관람객들이 전송한 메시지를 전 세계적으로 리트윗하면서 급격하게 증가한 것으로 추측됨 - 이러한 추세는 뉴욕 K CON에서도 동일한 패턴으로 발생하여 역시 출연 가수, 연예인과 콘서트에 관심이 집중되었음을 확인함 - 또 다른 가능성은 행사 전에는 집이나 사무실에서 주로 다른 SNS를
통해, 예를 들면 페이스북 등을 이용하여 트위터 메시지의 발생 횟수가 적으나, 이벤트 기간 중에는 행사장에서 스마트폰을 이용하기에 이동성 좋은 소셜 미디어인 트위터의 사용이 증가된다고 생각할 수도 있음 - 많이 리트윗 된 메시지들은 @K CONusa, @MnetMAMA 같은 행사 주최측 으로부터 나오거나 연예인, 가수의 팬클럽 같이 팔로워가 많은 개인들로 부터 나옴 - GOT7의 메시지 수가 높은 것과 방콕에서의 메시지가 많은 것은 GOT7의 멤 버인 뱀뱀이 태국 트위터 랭킹 최상위를 차지하고 있는 것과 연관이 있음 <시간대별 트위터 메시지 발생 추세 K CON LA>
< 시간대별 트위터 메시지 발생 추세 K CON NY> - 각 아티스트별 메시지들의 시간대별 발생 추세도 전반적으로 K CON 행사 관련 메시지들의 추세와 유사함 - 아래 그래프는 가장 많이 언급된 상위 다섯 아티스트들의 추세를 나타냄 - GOT7, Girls Generation, Monsta X, Super Junior, VIXX의 순임 <가장 많이 언급된 상위 5 아티스트의 추세>
지역별 메시지 발생 횟수 - 지역별 메시지 발생 횟수는 어느 곳에 있는 사람들이 행사에 관심 있는 지 알 수 있는 척도이므로 수집 기간 중 발생한 메시지를 지역별로 집계함 - 트위터 메시지에는 사용자가 미리 설정한 주 거주지의 타임존(Time Zone)이 들어있음 - 타임존 설정시 자신의 거주지 도시 이름으로 설정하는 사용자가 메시지를 보내면 그 도시(또는 타임존) 이름이 메시지에 포함되게 되므로 특정 지역을 알 수 있음 - 수집된 90여만 개의 메시지들은 전 세계 200여 도시에서 발생 또는 리트윗 되었음. 아래의 표는 지역별 메시지 발생 횟수 기준 상위 30개 도시 또는 타임존 랭킹임 - 참고로 미국에선 도시 이름보다는 Pacific Time, Mountain Time, Central Time, Eastern Time을 주로 쓰기에 정확한 도시 위치를 알 수 없으나 다른 많은 나라에서는 세분화된 대도시의 이름으로 타임존을 나타내 비교적 정확한 위치를 알 수 있음 - 상위에 랭크된 지역들을 보면 행사의 주최지인 미국과 동남아시아 주요 도시, 북경 등으로 미국 이외 지역에서도 K CON에 대한 관심이 많다는 것 을 알 수 있음 Total Tweets from each time zone LA+NYK CON:Jul28-Aug9 Time Zone Number of Tweets Rank None 318,380 1 Pacific Time (US & Canada) 105,369 2 Bangkok 88,084 3 Jakarta 72,736 4 Eastern Time (US & Canada) 29,557 5 Beijing 28,591 6 Central Time (US & Canada) 19,691 7 Kuala Lumpur 19,065 8 Seoul 18,452 9 Hanoi 15,413 10 Arizona 14,045 11 Singapore 13,938 12 Novosibirsk 10,709 13 Hawaii 10,535
14 Alaska 9,172 15 Brasilia 8,948 16 Atlantic Time (Canada) 8,930 17 London 8,325 18 Amsterdam 6,398 19 Hong Kong 6,298 20 Urumqi 5,828 21 Athens 5,617 22 Tokyo 5,417 23 Quito 5,028 24 Irkutsk 4,711 25 Krasnoyarsk 4,176 26 Taipei 3,916 27 Santiago 3,596 28 Mountain Time (Us & Canada) 3,582 29 Baghdad 3,546 30 Buenos Aires 3,142 수집된 메시지들 내에서 많이 사용된 단어들 - 수집 시 사용된 키워드들과는 별로도 수집된 메시지들 안에서 특정 단어 들이 사용된 횟수를 집계해 사람들의 관심을 알아볼 수 있음 - 가장 많이 사용된 상위 10 단어들로 만든 Wordgram 4) 을 보면 K CON이 가장 많이 사용된 단어였고 아티스트 관련해서는 GOT7이 가장 많이 사용되었음 <가장 많이 사용된 상위 10 단어들로 만든 Wordgram> 4) 발생 횟수에 비례해 단어의 크기를 정해 그림
<상위 10 단어들을 제외하고 가장 많이 사용된 단어들로 만들어 본 Wordgram> - 아래의 표는 기간별 가장 많이 사용된 상위 50개의 단어들과 그 발생 횟수를 나타내는데 이 정보로 여러 다양한 결과들을 유추해 낼 수 있음 - 슈퍼 주니어의 멤버들이 각기 많이 언급되어 큰 인기가 있음을 알 수 있고, GOT7 멤버 뱀뱀에 대한 방콕 지역 내 높은 관심도가 GOT7 관련 메시지의 발생 횟수를 크게 증가시켰음을 알 수 있었으며, K CON에 참 여하지는 않았지만 인기 있는 이름도 발견되었음 - 또한 love, beautiful, like, laugh, cute, thanks와 같은 긍정적인 단어들이 많아 K CON에 대한 팬들의 호감도가 높았음을 알 수 있음 - 트위터 파워 유저들이 상위에 상당수 랭크되어 있는 것으로 보아 이들이 K CON 행사기간에도 영향력을 발휘한 것으로 보임 - 트윗 내용의 대부분은 K-Pop 연관 단어로 K-drama나 K-food, K-beauty와 같은 다른 분야의 한류 콘텐츠에 관한 단어들은 별로 언급되지 않았음 - K-CON LA 행사를 방문한 김수현, 다니엘 헤니 같은 유명 배우의 이름이 거의 거론되지 않은 것은 다소 의외임 - 팬들이 K-CON을 K-Pop 관련 행사로 인식하고 있는 것으로 보임
K CON Word Count Analysis LA+NY K CON : Jul 27 - Aug 9 LA K CON : Jul 27 - Aug 3 NY K CON : Aug 4 - Aug 9 Rank Word Count Word Count Word Count 1 K CON 559,528 K CON 434,729 K CON 124,799 2 K CONla 291,383 K CONla 278,235 crush 98,127 3 GOT7 208,123 GOT7 142,433 GOT7 77,346 4 Super Junior 157,534 Super Junior 97,654 K CONny 69,145 5 k-pop 109,765 k-pop 57,205 Girls Generation 63,577 6 crush 100,530 Monsta X 32,182 Super Junior 59,880 7 Girls Generation 78,174 raichanxd 23,574 k-pop 52,560 8 K CONny 69,954 Red Velvet 21,883 VIXX 43,771 9 VIXX 67,144 BamBam 21,553 Teen Top 20,479 10 BamBam 34,095 Mark Tuan 20,557 allkpop 19,436 11 Mark Tuan 33,548 Elf 18,972 music 18,863 12 Monsta X 33,279 Airport 17,591 Choi Siwon 18,635 13 Choi Siwon 31,356 Lax 17,526 beautiful 18,450 14 allkpop 29,980 Show 17,140 oneshots 18,125 15 Teen Top 29,309 Sistar 16,659 Devil 18,041 16 elf 27,451 Girls Generation 14,597 SHINee 14,998 17 Red Velvet 27,095 Fans 13,983 Exo 14,688 18 Devil 25,435 Dance 13,446 K CONla 13,148 19 raichanxd 25,266 Choi Siwon 12,721 Mark Tuan 12,991 20 pic 25,115 VIXX 11,749 BamBam 12,542 21 music 24,523 amp 11,728 AOA 12,264 22 fans 24,202 Cho Kyuhyun 11,703 laugh 12,023 23 show 23,553 concert 11,387 festival 11,775 24 beautiful 23,185 jb 11,079 suho 11,682 25 airport 22,616 fashion 10,583 fans 10,219 26 amp 20,526 allkpop 10,544 tiffany 9,141 27 AOA 20,459 Shinhwa 10,293 japan 8,937 28 Sistar 19,910 mlnnyk 9,883 amp 8,798 29 like 19,856 love 9,173 summer 8,549 30 love 19,567 like 9,080 elf 8,479 31 SHINee 18,987 Teen Top 8,830 new york 7,203 32 see 18,832 fancam 8,347 best 7,164 33 oneshots 18,143 AOA 8,195 Jackson Wang 6,741 34 lax 18,016 Block B 8,179 congratulati ons 6,633 35 Exo 17,648 song 8,042 show 6,413
36 Cho Kyuhyun 17,450 Kim Heechul 7,862 party 5,885 37 jb 16,415 Bangtan Boys 7,585 Cho Kyuhyun 5,747 38 dance 15,856 yugyeom 7,417 soompi 5,738 39 festival 13,751 Devil 7,394 fancam 5,385 40 fancam 13,732 battle 7,122 jb 5,336 41 thanks 13,622 sorry 7,029 gamekyulogy 5,334 42 concert 13,593 lilbear 6,963 Red Velvet 5,212 43 tiffany 13,361 dinobeom 6,954 airport 5,025 44 laugh 12,953 engagement 6,918 Ravi 4,935 45 song 12,383 cute 6,747 thailand 4,902 46 wish 12,345 donghae 6,622 husband 4,802 47 video 11,958 leaderjb 6,117 Bangtan Boys 4,878 48 suho 11,705 special 6,024 harry 4,690 49 Shinhwa 11,614 moonroknews 6,011 instagram 4,513 50 engagement 11,174 hyukkiss 5,906 backstage 4,452 감성 분석 (Sentiment Analysis) - 트위터 감성 분석은 메시지에 담긴 사용자의 감성을 긍정과 부정으로 분류함 - 감성 분석을 통해 사용자들의 반응이나 생각을 보다 더 잘 이해할 수 있음 - Taxt Blob이라는 Python 라이브러리를 이용해 각 트위터 메시지의 극성을 [-1.0, +1.0] 범위 안에서 계량화 함 (+1.0 가장 긍정적, -1.0 가장 부정적) - 짧은 단문이라는 특성과 각종 축약어, 은어, 해시태그가 사용되는 트윗에서의 감성 분석은 상당히 어렵고 오차가 클 수 있음 - 따라서 본 리포트는 기존의 일반적인 소프트웨어 라이브러리를 사용하여 행해졌으므로 결과는 큰 흐름을 참고하는데 활용하는 것이 바람직함 - K CON 관련 키워드 메시지들에 대한 시간대별 감성 분석 결과는 대체로 긍정적임 - 7월 31일 밤에 예외적으로 부정적인 메시지가 많았던 것에 대해서는 이유를 분석할 필요가 있음
<트위터 메시지 감성 분석 결과> - 특정 연예인, 가수에 대한 시간대별 감성 분석 결과도 행사 기간 전반적으로 긍정적임 - Super Junior, 소녀시대(Girls Generation), 신화와 같이 지속적으로 인기 있는 아티스트들은 거의 부정적인 시기가 없이 다른 참여 아티스트들보다 더 긍정적이라는 결과를 보였음 - 다른 아티스트들은 대체로 긍정적이나 예외적으로 VIXX에 대해 부정적인 감성이 지속적으로 나타나는 이유는 좀 더 세밀한 분석이 필요함
<여러 출연진에 대한 트위터 메시지 감성 분석 결과> 4. 정리 및 시사점 - K CON 2015 관련해 14일 동안 90만 개 이상의 영문 트윗 메시지 발생 횟수에서 보듯이 많은 팬들이 행사에 관심이 있었음 - 전 세계 200여개 이상의 지역에서 메시지가 발생한 것으로 보아 미국 현지뿐 아니라 전 세계적으로 관심이 있는 이벤트였음 - 감성 분석 결과는 K CON 행사와 참여 아티스트들에 대해 전반적으로 긍정적임 - @KCONusa와 같은 주최 측의 메시지가 많이 리트윗된 것을 보아 트위터를 통한 홍보가 효과적인 커뮤니케이션 방법이었음을 확인함 - 또한 뱀뱀과 같이 트위터를 잘 활용하는 가수나 일반 트위터 파워 유저들이
트위터 SNS에서 아주 큰 영향력을 가졌음을 확인할 수 있었음 - 많이 쓰인 단어들을 분석한 결과 K-pop에 대한 관심 그리고 특정 인기 아이돌 스타들에 대한 언급이 대부분이었고 K-drama나 K-food 등 다른 한류 콘텐츠에 대한 내용은 많지 않았음 - K CON이 한류 종합 컨벤션으로 자리매김하기 위해서는 K-Pop 이외에도 드라마, 영화, 애니메이션, 게임, 캐릭터 등 다양한 콘텐츠를 포함하고, 홍보해야 할 것임
미국사무소 담당자 연락처 김일중 소장 : +1-323-935-5001 / kimpd@kocca.kr 엘리홍 대리 : +1-323-935-5001 / ehong@kocca.kr