국어산책 누리소통망에서사람들의생각과마음에귀기울이기 이기황 ( 주 ) 다음소프트 1. 빅데이터시대의소셜미디어 우리는바야흐로빅데이터시대에살고있다. 빅데이터란기존의자료처리방법으로는수집, 저장, 분석할수없을만큼큰규모의자료를말한다. 빅데이터의주요특징은자료의규모가방대할뿐만아니라자료의형태또한다양하다는것이다. 즉, 빅데이터에는숫자, 문자, 사진, 동영상, 음악등다양한형태의자료가포함된다. 이들가운데문자, 사진, 동영상, 음악등은일반적으로구조화가잘되어있는정형자료인숫자형태의자료에대비하여비정형자료로분류한다 ( 함유근 채승병 2012). 그림 1은자료가최근에폭발적으로증가하고있으며, 그자료의많은부분이비정형자료임을보여주고있다. 비정형자료의대부분은문자로표현된텍스트인데, 이는최근에크게활성화된누리소통망을포함한소셜미디어의보급과무관하지않다. 122 새국어생활제 23 권제 1 호 (2013 년봄 )
그림 1 자료량의증가와비정형자료의비율 출처 : http://www.it.com/technology 소셜미디어의큰특징은그야말로 소셜, 즉 사회성 을지니고있다는점이다. 소셜미디어에서는기존미디어에서와는달리사회구성원들이정보의생성과소통의과정에자발적으로참여하여사회적인관계를형성하고다양한형태의사회적상호작용을이끌어간다. 사회적상호작용은친하지않은사람들, 나아가전혀알지못하는사람들사이에서도광범위하게이루어지며, 사적생활의요소가높은수준으로공개되기까지한다. 소셜미디어상의언어활동은여론과사회적의견을형성할수있을만큼큰영향력을갖게되었다 ( 황유선 2012). 이렇듯영향력이큰소셜미디어는여러분야에서활용되고있다. 그가운데하나가공중보건분야이다. 공중보건에서가장중요한일 국어산책 123
가운데하나는전염성이높은유행성질환에대한대처이다. 특히독감은매년발생하는계절질환으로많은사람들에게영향을미친다. 최근미국존스홉킨스대학교에서대표적인누리소통망인트위터를이용하여미국내독감발생및확산양상을파악하는연구가진행되었다 (Sneiderman 2013). 이연구에서는 140자이내로작성된트위터글귀에서독감이언급된경우를지역별로분류하여독감의확산양상을추적하였다. 물론엄청난양으로생성되는트위터글귀를사람이읽는것은불가능하기에컴퓨터로사람의언어를처리하는자연언어처리기술을사용하였다. 이때실제독감에걸린상황 ( 나지금독감때문에머리가너무아파 ) 이아닌일반적인독감에대한이야기 ( 독감을예방하려면손을잘씻어야한다 ) 나자신이아닌유명한사람이독감에걸린이야기 ( 가수 이독감에걸려서공연이취소되었대 ) 등을제외하고순수하게독감감염에관련된글귀만을가려내기위한첨단기술이동원되었다. 그림 2는이러한방식으로파악한 2013년 1월첫주의독감발생양상과 2012년같은기간의독감발생양상을함께보인그림이다. 그림 2에서짙은색으로나타나는지역이독감이창궐한지역으로 2013년 1월첫주에 2012년같은기간에비해독감이심하게번지고있음을알수있다. 이방법의유용성은미국질병관리센터에서보유하고있는독감발생자료와의비교를통해검증되었다. 누리소통망에서위와같은자료를얻는데에는많은이점이있다. 가장큰장점은이러한자료를거의실시간으로얻을수있다는점이다. 실시간으로생성되는누리소통망의글을수집하여빠른속도로분석하여원하는자료를얻을수있는것이다. 위와같은자료를전통적인방법에의존하여수집할경우두주가걸린다고한다. 자료수집에소요 124 새국어생활제 23 권제 1 호 (2013 년봄 )
그림 2 2012/2013 년 1 월첫주미국의독감발생양상 (Sneiderman 2013) 되는시간과비용을줄여효율성을높이는것은매우중요한일이다. 하지만국민전체의삶에큰영향을미칠수있는독감의발생과확산에 조기대응을할수있다는점이그보다더중요할것이다. 국어산책 125
2. 누리소통망을통해살펴본사람들의생각과마음 위의사례는누리소통망의언어자료분석을질병의발생과확산의추적이라는특정과제에적절히활용한예이다. 그런데우리들이정말로관심을갖고있는것은독감등의질병이아니라누리소통망에글을쓰는사람들, 그리고그사람들의생각과마음이다. 나는이세계안에다른사람들과더불어살고있으며, 나아닌다른사람들이어떤생각을가지고있는지, 어떤마음을가지고있는지아는것이야말로그무엇보다도중요한일이다. 글쓴이의일터에서는소셜미디어로부터수집된문서로이루어진빅데이터 ( 소셜빅데이터 ) 의분석을통해사람의생각과마음을읽는일을하고있다. 이글에서는그사례몇가지를소개하고자한다. 1) 2.1. 기분 이어떠신가요? 사람은감성적인존재이다. 다른동물과구별되는사람의큰특징으로이성을들기도하지만, 사람의행동에감성이미치는영향이매우큰것은부인할수없다. 우리는사람들의감성의단면, 구체적인언어표현으로는 기분 이어떠한지를누리소통망을통해살펴보았다. 그림 3은소셜메트릭스 (SOCIALmetrics ) 2) 에서관심어 기분 에대한연관어들가운데감성어들만추려보인것이다. 3) 해당기간에우 1) 이후의내용은전적으로송길영 (2012) 에의존하여작성되었다. 구체적이고개별적인인용은생략하였으며, 본문의 우리 는글쓴이의일터에서함께일하는동료들을지칭한다. 2) 소셜메트릭스 (SOCIALmetrics ) 는글쓴이의일터에서개발하여사용하는소셜빅데이터분석도구이다. 일반인들이무료로이용할수있는서비스는 http://www.some.co.kr/ socialsearch.html에서제공한다. 126 새국어생활제 23 권제 1 호 (2013 년봄 )
그림 3 기분 의연관어 (SOCIALmetrics, 2011. 5. 1. 10. 31.) 리말로작성된특정누리소통망글 5 억여건가운데 기분 이포함된문 서는 550 만 4,018 건이었는데, 긍정률을측정해보니대략 66.4% 였다. 4) 안타깝게도이수치는큰의미가없다. 예를들어, 우리나라사람들, 적 3) 연관어란주요분석대상인관심어와함께쓰이는언어표현을말하며, 감성어는다양한언어표현들가운데사람의감성을표현하는데사용되는것들을가려뽑은것으로긍정어와부정어로나뉜다. 4) 긍정률은 긍정표현언급량 /( 긍정표현언급량 + 부정표현언급량 ) 의공식으로계산한다. 국어산책 127
그림 4 요일별기분의변화 (SOCIALmetrics 2011. 5. 1. 10. 31.) 어도누리소통망에글을올리는사람들은 66.4% 만큼기분이좋다 와같은해석을할수없다. 이긍정률에조금이나마의미를부여하려면, 다른기간에는어떠했는지, 다른나라에서는어떠한지등의비교분석이이루어져야할것이다. 기분은일정한상태에머물러있지않고계속해서변화한다. 반복되는매주의삶을살면서특히기분이좋은요일이있고그렇지않은요일이있을것이다. 그림 4는일주일간기분의언급량과이에대한긍정률의변화를보인것이다. 5) 이그림에따르면 기분 은주중에거의일정하게언급되다가주말에는언급량이줄어든다. 기분에대한긍정률의변화추이는상식적인예측과크게다르지않다. 지친몸을이끌고등교혹은출근을하는월요일에가장부정적이었다가주말을향하여갈수록점차로긍정률이높아져금요일에는정점에이른다. 흥미로운 5) 언급량은상대적비교를위해정규화한것이다. 128 새국어생활제 23 권제 1 호 (2013 년봄 )
그림 5 시간대별기분의변화 (SOCIALmetrics, 2012. 4. 1. 4. 15.) 것은기분의긍정률이토요일에급격히떨어진다는것이다. 주말을즐겁게보내야하지만막상기분은좋지않은것이다. 아마도주말이지나면다시일상으로돌아가고달픈생활을해야한다는생각에그런것이아닐까한다. 월요일은생각만해도기분이나쁜것이다. 오늘을즐기기보다는내일을걱정하며살아가는것이현대한국인의삶일것이라는짐작도해본다. 그러면주중의하루일과에서기분의변화는어떠할까? 그림 5에서는하루동안 기분, 우울, 기분좋다 의세언어표현언급비율의변화를살펴보았다. 이에따르면가장우울한시점은출근직전과잠들기전이며, 가장기분이좋은시점은점심직전과퇴근직전이다. 그럴것같다. 하루의고달픔이시작되기직전인출근직전, 그리고내일을염려하는잠들기전이가장우울한시점이고, 잠시나마이에서벗어나기직전인점심직전과퇴근직전이가장기분이좋은시점이다. 앞서살 국어산책 129
펴본일주일간기분의변화와마찬가지로하루를놓고봐도사람들의기분은가까운미래에대한기대와염려에따라좋기도하고나쁘기도한것이다. 그리고그느낌을누리소통망에토로하여다른사람들의공감을얻고이를통해위로받고자한다. 2.2. 누가가장 미인 일까요? 감성은매우주관적인것이다. 위에서살펴본기분도사람에따라좋고나쁘고의기준이상당히다를수있다. 사람마다살아온배경과경험, 심성이다른데같은느낌을가진다는것은불가능하다. 하지만이러한주관적인감성도사안에따라다른사람들과상호작용을하면서어느정도합의가이루어지는경우가있다. 이러한상호작용은몇안되는사람들로부터시작해서짧은시간안에큰확산을일으킬수있는네트워크효과에의해증폭된다. 가수싸이의뮤직비디오가 86일만에유튜브조회수 4억회를넘은것은네트워크효과의한예다. 주관적감성이사회적합의를이루는한단면을살펴보기위해우리는누리소통망에서누가가장예쁘다고언급되는지를알아보았다. 미의기준역시단일하지않기에우리는먼저사람들이 미인 을이야기할때에어떤감성표현을함께언급하는지살펴보았다. 그림 6은그결과다. 그림 6에서 미인 의연관감성어의점유율을살펴보면당연하게도 예쁘다 (36%) 와 아름답다 (23%) 가절반이상을차지하고 스타일 (18%), S라인 (7%), 귀엽다 (7%), 매력적이다 (5%), 섹시하다 (4%) 가뒤를따른다. 여기서주목할것은 귀엽다 의점유율은 7% 에그친다는점이다. 다른문화권에서는 귀엽다 와 예쁘다 가거의같은개념을나타내기도하는모양이지만적어도우리나라에서는예쁜사람은미인이지만귀여 130 새국어생활제 23 권제 1 호 (2013 년봄 )
그림 6 미인 의연관감성어점유율 (SOCIALmetrics, 2010.9.1. 2012.12.31.) 매력적이다 5% 섹시하다 4% S 라인 7% 귀엽다 7% 예쁘다 36% 스타일 18% 아름답다 23% 운사람은그다지미인이아닐가능성이높다. 그림 7에서는 예쁘다 와 귀엽다 와함께언급되는유명인들을살펴보았다. 이그림은예쁘지만귀엽지는않은유명인들과귀엽지만예쁘지는않은유명인들을나누어준다. 물론가운데위치한예쁘면서귀여운이들도있다. 이들은대부분한국의으뜸모델들이다. 재미있는것은예쁘고도귀여운유명인으로남자인 현빈, 송중기, 샤이니 등이언급된다는것이다. 전통적인성별구분이점차옅어지고있는현상을잘반영하고있다. 이제는남자들도꾸미고가꾸는시대가되었다. 2005년이래남성복매출점유율이여성복매출점유율보다항상높다고한다. 관련업계에서는경기가좋지않아서여성들이옷을사지않는것으로알았는데, 3년내내같은양상을보이자남성들 국어산책 131
그림 7 예쁘면서귀여운유명인 (SOCIALmetrics, 2010. 9. 1. 2011. 4. 30.) 이옷을적극적으로산다는사실을인정하게되었다. 또한최근남성화 장품시장이확대되고있는것도이러한세태에걸맞은현상이다. 2.3. 감성의지도를그리다감성은매우주관적인것이고또변화하는것이지만, 다분히보편적이기도한것또한사실이다. 사람들이전혀다른시대에, 다른문화에서쓰인문학작품을읽고울고웃으며공감하는것이그증거이다. 이사실에근거해서비교적보편적인감성을바탕에두고다른개체들을그위에나타내보려는시도에서나온것이감성지도 (sentimental map) 다. 그림 8의감성지도에서는서로비슷한것으로파악되는감성어들을묶어서상대적인거리를반영하여배치하였다. 전체적으로볼때왼쪽은여성적인느낌이강하고오른쪽은상대적으로남성적이다. 이제이위에감성어들과자주함께언급되는, 즉비슷한감성을공유하는것 132 새국어생활제 23 권제 1 호 (2013 년봄 )
그림 8 유명인들의감성지도 국어산책 133
으로유추되는유명인들의이름을올려놓았다. 예를들면, 아이유, 설리, 박보영은 귀엽고깜찍한 인물들이다. 물론이세사람이항상함께언급되는것은아니다. 각각의인물이언급될때에비슷한감성어가언급될뿐이다. 유명인감성지도를자세히살펴보면얼핏보기에비슷한이미지를가진이들이세부적으로는어떤차이를가지고있는지드러난다. 요즘인기가많은미스에이의수지도앞서예를든이들처럼귀엽고깜찍하다. 그런데한편으로는 씩씩하고사랑스러운 쪽에도속한다. 송중기와장근석은남성이지만여성적인면이강하고현빈, 차승원은남성적이다. 여성중에서도하지원과이지아는남성적인쪽에기울어있으며, 2NE1은극단적으로남성적이다. 아마도처음선보일때부터그렇게의도했을것이고그의도대로받아들여진것으로보인다. 구체적인감성들이무리를지으며한단계추상화하면메타감성이형성된다. 예를들어, 흐뭇하다 는 씩씩하고사랑스럽고예쁘고풋풋한 느낌을반영한다. 또한 스타일리시하다 는것은 예쁘고마르고날씬하다 는뜻이며, 부럽다 고할때에는유명인들을보며 섹시하고빛나고완벽하다 고느끼는것이다. 감성지도를시간의흐름에따라그려보면분석대상의이미지변화를추적할수있다. 예를들어, 그림9 에서확인할수있는것처럼소녀시대는처음에는예쁘고깜찍한감성의이미지였는데 3년정도의기간을거치며점차예쁘고마른이미지로바뀌었다. 한편아이유는데뷔이후계속귀엽고깜찍한동생의감성을유지해왔다. 아이유는이제 20 대가되었고배우로서의역할도넓혀가고있으니앞으로어떻게이미지가변화할지기대된다. 134 새국어생활제 23 권제 1 호 (2013 년봄 )
그림 9 소녀시대 의이미지변화 국어산책 135
3. 맺는말 이글에서글쓴이는이른바빅데이터시대에매우큰영향력을가지게된누리소통망의언어자료가어떻게활용될수있는지, 특히사람들의생각과마음을읽는일에어떻게사용될수있는지를글쓴이의일터에서의경험을중심으로소개하였다. 누리소통망은누구나자기의생각과느낌을자유롭게표현하고공감할수있다는점에서매우유용하고훌륭한도구이지만, 바로그자유로움때문에때로는다른사람에게큰상처를줄수도, 혹은받을수도있음을우리는잘알고있다. 이전에는듣지못하던많은이웃들의생각과마음에귀를기울이고그들의삶에관심을갖는것, 그리고진정으로더불어사는세상을만들어나가는것, 그것이빅데이터가우리에게주는교훈이아닐까하며글을맺는다. 136 새국어생활제 23 권제 1 호 (2013 년봄 )
참고문헌 소셜미디어연구포럼 (2012), 소셜미디어의이해, 미래인. 송길영 (2012), 여기에당신의욕망이보인다, 쌤앤파커스. 이재현엮음 (2012), 트위터란무엇인가, 커뮤니케이션북스. 한국방송학회방송과수용자연구회엮음 (2012), 소셜미디어연구, 커뮤니케이션북스. 함유근 채승병 (2012), 빅데이터경영을바꾸다, 삼성경제연구소. 황유선 (2012), 소셜미디어의언어와맥락, 소셜미디어연구, 커뮤니케이션북스. Sneiderman, Phil(2013), Using Twitter to track the flu, http://hubjhu.edu/2013/ 01/24/using-twitter-to-track-flu, 2013.3.13 검색. 참고웹사이트다음소프트 http://www.daumsoft.com 소셜메트릭스 http://www.some.co.kr 오피니언마이닝워크숍 http://www.omw.or.kr It.com http://www.it.com 국어산책 137