5 AI 를활용한콘텐츠및 이용자반응분석 1. 들어가며 2. AI를활용한콘텐츠및이용자반응분석 2.1. 콘텐츠분석 : Player Spotlight 2.2. 이용자반응분석 : Twitter Sentiment Analysis 3. 마치며 50 51
미디어산업에서 AI의활용이확산되고있다. 그중에서도인간의일상언어를이해하는자연어처리기술의활용도가높다. Fox Sports의콘텐츠분석서비스인 Player Spotlight와 Twitter 의이용자반응분석기술인 Twitter Sentimental Analysis 등이그예이다. Player Spotlight는선수개개인의경기데이터와비교데이터등의정보를기존보다상세하고세분화해실시간으로제공하고있으며, Twitter는인공지능 Sentiment Analysis를활용하여특정인물, 제품, 서비스에대한이용자의반응을분석하고있다. 1. 들어가며 방송산업계에서인공지능 (Artificial Intelligence, 이하 AI) 에대한관심이날로높아지고있다. AI는미디어기업이생산하는콘텐츠의질을높이는다양한혜택을제공한다. AI는데이터에숨겨진의미를추출하고, 분석과정을가속함으로써미디어콘텐츠를풍부하게할수있다. 미디어업계에서의 AI의활용은콘텐츠제작, 편집, 보안등다방면에걸쳐있으며앞으로도지속적으로확대될것으로보인다. 본고에서는 AI의활용분야중에서도방송콘텐츠분석에활용되는사례를살펴보고자한다. 특히방송콘텐츠분석기술중자연어처리기술을중점으로해당기술의활용사례를고찰하고자한다.
2. 2.1 콘텐츠분석 : Player Spotlight 스포츠중계방송은 AI 기술을적극적으로활용하는분야중하나이다. 스포츠중계는실시간성이중요한영역이다. 이용자에게실시간으로경기내용이나선수에대한부가정보를제공하는것은스포츠중계방송서비스의큰차별점이될수있다. 이에실시간으로데이터를추출하고분석할수있는 AI 기술이주목받고있다. 실제로다수의방송 미디어사업자들이스포츠중계에 AI 기술을도입하고있다. 미국의스포츠전문방송사인 Fox Sports는 2019년프랑스에서개최된제8회 FIFA 여자월드컵경기중계에 AI를활용한 Player Spotlight를선보였다. Player Spotlight는스포츠경기에대한다양한정보를수집하고분석해, 이용자에게실시간으로해당정보를제공하는 AI 기반영상중계플랫폼이다. 현재 Player Spotlight는 Fox Sports의홈페이지와모바일애플리케이션에서제공되고있다. Player Spotlight 플랫폼에는 IBM이개발한 AI 분석기술인 IBM Watson이적용되었다. 이기술은선수의움직임과패스, 골, 킥등다양한정보를수집해경기데이터를구축한다. Player Spotlight의이용자는타플랫폼에서얻기어려운, 구체적이고세분된정보를얻을수있다. 예를들어 2018 월드컵에서영국팀의수비수가시도한크로스 1 를모두나타내시오 라고 IBM Watson에입력하면 ( 그림 1) 과같은결과가나타난다. Player Spotlight는선수개개인의공점유율등을축적해, 특정선수의경기기여도를예측할수도있다. IBM Watson에 각영국선수의경기기여도를나타내시오 라고입력하면선수별로볼터치, 반칙, 골, 태클등의기록이나열되고이를종합적으로분석해기여도순위를그래프화해보여준다. 1) 필드반대쪽이나상대골대에가까운쪽으로공을길게띄워서패스해주는축구기술 52 53
그림 1 IBM Watson 의경기분석프로세스 출처 : IBM 그림 2 IBM Watson 으로분석한선수순위 출처 : IBM IBM Watson이특정데이터를추출, 분석할수있는이유는일상언어를이해하고, 그언어로소통할수있는자연어처리기능덕분이다. 기계가일상언어를이해하려면우선적으로문장의문법구조를파악해야한다. 기계는문장에서명사, 동사, 형용사등의문법적요소를파악해야하며, 사람들 처럼복수형으로쓰인문법요소는원형인 사람 으로재분석해야한다. 또한, 문장의개체명과의도를정확히파악해야한다. 오늘서울교통상황은어때? 라는문장
을이해하려면 1) 서울교통상황이어떤지묻는의도, 2) 시간개체인 오늘 과장소개체인 서울 을모두파악해야한다. ' 미용실 ' 과 ' 헤어샵 ' 처럼표기는상이하지만유사한의미를지닌 요소를찾아내동일한표현으로이해하는기술도필요하다. IBM Watson은방대한언어데이터를분석하고학습하는머신러닝 (machine leanring) 을반복하여일상언어학습경험을극대화한다. 위와같이 IBM Watson이스포츠경기분석에사용될경우에는팀명, 선수명, 포지션명등경기관련용어등의머신러닝을반복하는것이다. IBM Watson이분석한정보는실시간으로중계화면에반영된다. 하지만 IBM Watson이분석한방대한정보를중계화면안에모두담기는어렵다. 이에 Fox Sports는자사 Twitter 계정을통해 IBM Watson이분석한경기기록을추가로제공하고있다. 그림 3 Player Spotlight 에서제공한경기영상 출처 : IBM 스포츠경기의실시간정보는기존스포츠중계영상에서도제공되어왔지만, 각팀의점유율, 슈팅개수등거시적정보에국한된다는한계를지녔다. 반면에, Player Spotlight는선수개개인의경기데이터와개인별비교분석데이터등상세하고세분화된정보를제공한다. 이는자연어를처리하는 AI 기술의발전덕분이다. Nielsen Media Research 의발표에따르면 2019 년 7 월에 FIFA 여자월드컵결승전을 Fox 54 55
Sports 채널로시청한미국인은 1,427 만명에이르며, 실시간인터넷방송시청자또한 4 년 전인 2015 년결승전보다 400% 상승했다. 시청률상승은 OTT 확산의영향이크겠으나, AI 기술을활용한실시간경기정보제공또한간과할수없는요소이다. 2.2 이용자반응분석 : Twitter Sentiment Analysis 각종사업자들이소셜미디어플랫폼을제품, 서비스등의광고수단으로활용하면서, 소셜미디어플랫폼이기업과소비자가상호작용하는공간으로거듭나고있다. 이에소셜미디어플랫폼인 Twitter는특정인물, 제품, 서비스에대한이용자의반응을평가하는솔루션인 Twitter Sentiment Analysis를기업및일반인에게제공하고있다. Twitter Sentiment Analysis는해시태그 (#) 가작성된데이터 2 에서감정적표현을추출, 분석하여선호도를파악하는콘텐츠분석기술로, 데이터의문맥과상황을종합하여감정의미묘한차이를파악해야하기때문에매우복잡한알고리즘을사용한다. 좋다, 싫다 와같이직설적표현뿐만아니라 잘도한다 와같은반어적표현까지도이해해야하기때문이다. 그림 5 Twitter Sentimental Analysis 처리과정 Twitter Streaming API Text 추출 SQL (Structured Query Language) 감정분석 수치화 출처 : Medium 2) 일례로, 넷플릭스콘텐츠중 <Stranger Things> 에대한 Twitter 사용자반응을알고자하는경우 #Stranger Things 라는해시태그가작성된데이터를추출
( 그림 5) 는 Twitter Sentimental Analysis 처리과정을도식화한것이다. Twitter Streaming API 3 에서데이터를전송받은후, 이중텍스트자료를선별해감정분석과정을거쳐특정숫자로수치화한다. 수치화한자료는그래프로시각화한후 SQL 4 에저장한다. Twitter Sentiment Analysis는긍정적감정과부정적감정을서로다른숫자로분류하여수치화하는데, 숫자분류기준은이용자가자율적으로설정할수있다. 이용자는긍정적 부정적감정을수치화할때숫자 0과 1을활용할수있으며, 긍정적 중립적 부정적감정을각각 1, 0, 1 등으로설정할수있다. 이렇게수치화에쓰이는기술이자연어처리기술이다. 머신러닝을통해데이터표현을학습한 Twitter Sentimental Analysis는 ( 그림 6) 처럼 1과 0으로수치화된데이터를제공하며, 해당데이터는그래프로추출가능하다 ( 그림 7). 그림 6 Twitter Sentiment Analysis 의수치화된데이터 label text 0 0 is so sad for my APL friend... 1 0 I missed the New Moon trailer... 2 1 omg its already 7:30 : O 3 0... Omgaga. Im sooo im gunna CRy. I've been at this dentist since 11.. I was suposed 2 just get a crown put on (30 mins)... 4 0 i think mi bf is cheating on me!!! T_T 5 0 or i just worry too much? 6 1 juuuuuuuuuuuuuuuuuuussssst Chillin!! 7 0 Sunny Again Work Tomorrow : - TV Tonight 8 1 handed in my uniform today. i miss you already 9 1 hmmmm... i wonder how she my number @-) 출처 : Towards Data Science 3) Application Programming Interface, 응용프로그램에서사용할수있도록, 운영체제나프로그래밍언어가제공하는기능을제어할수있게만든인터페이스 4) Structured Query Language, 데이터베이스를추가, 삭제, 편집할때사용하는명령어 56 57
그림 7 Twitter Sentiment Analysis 의그래프화된데이터 250000 긍정적반응 200000 부정적반응 150000 100000 50000 0 0 5 10 15 20 25 30 35 40 45 글자수 출처 : Towards Data Science Twitter의월간이용자수는 1억 3,000만명을상회한다 (2018년 2월기준 ). 특정제품, 서비스에대한 Twitter 이용자반응이메타데이터가될수있는규모이다. Twitter Sentimental Analysis는특정방송콘텐츠에대한반응을추정하는데도유용하게쓰일수있다. 앞서소개한 2019년 FIFA 여자월드컵의이용자반응을 Twitter Sentimental Analysis로분석한결과, 월드컵에대해중립적인입장을표시한콘텐츠는 52.7% 로가장많았으며, 긍정적인반응은 12.8%, 부정적반응은 3.4% 로나타났다. 이처럼 Twitter Sentimental Analysis를활용해방영예정인콘텐츠에대한반응을사전에짐작할수있으며, 부정적인반응이우세한경우에는콘텐츠개선안을미리마련하는데도움이된다. 그림 8 Twitter Sentimental Analysis 를이용하여 2018 년러시아월드컵관련 Twitter 메시지를분석한결과 트위터사용자중각반응비율 트위터화제의콘텐츠중각반응비율 트위터메시지중각반응비율 75.87 감성분석지수 3.7% 13.7% 5.9% 11.7% 29.1% 21.2% 53.5% 61.2% 12.8% 3.4% 52.7% 31.1% 긍정적반응 중립적반응부정적반응반응없음 출처 : Tweet Binder
3. 마치며 AI 기술은미디어영역에서도다양하게활용되고있다. 본고에서는 AI 기술의미디어활용영역중에서도콘텐츠와이용자반응분석에활용되는사례를소개했다. 특히기계가인간의일상언어를이해하도록돕는기술인자연어처리기술은 Fox Sports가제공하는 Player Spotlight와 Twitter가제공하는 Sentimental Analysis에서유용하게활용되고있다. 전체적인경기상황 선수개개인의데이터를폭넓게제공하는 Fox Sports는향후스포츠중계기술의판도를바꿀수있다. 또한, 특정콘텐츠에대한사용자반응을분석하는 Twitter Sentimental Analysis는방송콘텐츠에대한사전반응과선호도를파악하는데유용하게쓰일수있다. 자연어처리기술은방송시장에적용된 AI 기술의일부일뿐이며, 앞으로 AI 기술이적용된방송 미디어업계의진화가어디까지이루어질지기대되는상황이다. REFERENCES 1. IBM 홈페이지. https://www.ibm.com/blogs/emerging-technology/ibm-player-spotlight-built-with-ibm-watson/ https://www.ibm.com/blogs/emerging-technology/raise-their-game/ https://www.ibm.com/blogs/emerging-technology/ibm-player-spotlight-built-with-ibm-watson/ 2. Insights Atlas (2017.06.01.) 7 Benefits of Sentiment Analysis You Can t Overlook. https://blog.insightsatlas.com/7-benefits-of-sentiment-analysis-you-cant-overlook 3. LA Times (2019.07.08.) Viewership of Women s World Cup final exceeds 14 million on Fox. https://www.latimes.com/sports/soccer/la-sp-world-cup-tv-ratings-20190708-story.html 4. SK 공식블로그홈페이지. https://blog.skcc.com/2808 5. Towards Data Science 홈페이지. https://towardsdatascience.com/the-real-world-as-seen-on-twitter-sentiment-analysis-part-one- 5ac2d06b63fb 6. Tweet Binder 홈페이지. https://www.tweetbinder.com/blog/twitter-sentiment-analysis/ 58 59