우수논문신청여부 ( 표시 ) Fast Track 심사신청여부 ( 표시 ) 예 예 아니오 아니오 한국지능정보시스템학회 [2016 년춘계학술대회 ] 논문투고 소셜네트워크분석을활용한추천시스템의정확도 개선에관한연구 최슬비 ( 국민대학교비즈니스 IT 전문대학원, 제 1 저자, seulbimon@kookmin.ac.kr) 곽기영 ( 국민대학교비즈니스IT전문대학원, 제2저자, kykwahk@kookmin.ac.kr) 안현철 ( 국민대학교비즈니스IT전문대학원, 교신저자, hcahn@kookmin.ac.kr) A Study on Improving Accuracy of Recommender Systems using Social Network Analysis Seulbi Choi (Master s Candidate, Graduate School of Business IT, Kookmin University) Kee-Young Kwahk (Professor, Graduate School of Business IT, Kookmin University) Hyunchul Ahn (Associate Professor, Graduate School of Business IT, Kookmin University) - 원고매수 : 18 페이지 [ 교신저자연락처 ] 안현철 - 주소 : 서울특별시성북구정릉로 77 국민대학교경영대학 - 전화번호 : 02-910-4577, 휴대폰 : 010-3227-7310 - E-mail주소 : hcahn@kookmin.ac.kr - 1 -
소셜네트워크분석을활용한추천시스템의정확도 개선에관한연구 A Study on Improving Accuracy of Recommender Systems using Social Network Analysis 1) 목차 Ⅰ. 서론 Ⅱ. 이론적배경 Ⅲ. 제안알고리즘 Ⅳ. 실증분석 Ⅴ. 결론 참고문헌 Abstract 협업필터링 (Collaborative Filtering) 은유용성과정교성면에서가장성공적인추천알고리즘으로평가받으며산업계나학계에서많이활용및연구되고있지만, 기본적으로사용자들이평가한점수에만기반하여추천결과를생성하는한계점이있다. 이에본연구는사용자가상품을구매할때자신이신뢰하는타인의추천을더적극적으로수용할것이라는점에착안하여, 사용자의평점외에사용자간신뢰관계를소셜네트워크분석으로분석한결과를추가로반영하는추천알고리즘들을제안하였다. 구체적으로본연구에서는소셜네트워크분석에서네트워크내의중심적위치를나타내는척도인내향및외향중심성을활용하여사용자간유사도를산출하는알고리즘들과사용자신뢰네트워크를탐색하여추천대상이되는사용자가직접 간접적으로신뢰하는사용자의평가점수를보다높게반영하는알고리즘을제안한뒤그성능을비교해보았다. 실제데이터에적용하여분석한결과, 사용자신뢰네트워크의내향중심성지수를조건없이적용한경우에는오히려정확도의감소만을야기하는것으로나타났고, 일정임계치이상의외향중심성을갖는사용자에한해내향중심성지수를고려한추천알고리즘은전통적인협업필터링에비해약간의정확도개선이이루어짐을확인할수있었다. 아울러, 사용자신뢰네트워크를기반으로탐색하는알고리즘이가장우수한성능을보이는것을알수있었으며, 전통적인협업필터링과비교해서도통계적으로유의한수준의정확도의개선이이루어짐을확인할수있었다. Key Words : 추천시스템, 협업필터링, 소셜네트워크분석, 중심성, 신뢰관계네트워크 - 2 -
Ⅰ. 서론 협업필터링추천시스템은상품에대한사용자들의평가데이터를가지고추천의대상이되는사용자와선호도가유사한즉, 평가패턴이비슷한사용자들 ( 이웃 ) 을식별한후, 과거에구매했거나선호했던상품들중추천대상자에게적합한상품을추천하는시스템이다. 협업필터링기반의추천시스템을구현하는과정에서가장중요한것은추천대상자와유사한선호도패턴을보이는사용자가누구인지를정확하게식별하는것이다. 그러나전통적인협업필터링에서사용자간유사도는구매여부, 클릭스트림 (clickstream) 데이터혹은평점과같은정보들을활용해산출되어왔다 (Jeon and Ahn, 2015). 이와같은정량적 (quantitative) 인정보는연산처리에큰어려움이없다는장점이있지만, 사용자들의선호도를뚜렷이대표하는기준이라고확실하게담보하기어려우며이에따라의문이제기되고있다 (Zhang et al., 2014). 인터넷의사용이활성화되고보편화되면서전연령대에서상품을구매하는패턴이온라인쇼핑으로변화하고있다. 더불어 Web 2.0 시대의도래와함께, 인터넷상에자신의의견을상대방과공유하는참여중심의인터넷환경이활성화되고있다 (Chen et al., 2007). 이러한배경가운데기존연구들에따르면사용자들은일반적으로본인과친분관계가있는사용자들의추천을더신뢰하고선호하는것으로알려져있다 (Kim and Ahn, 2010; Liu and Lee, 2010; Shinha and Swearingen, 2001). 이는사용자간의친분관계가신뢰성을제고하는효과가있기때문인것으로판단된다 (Kim and Kim, 2014). 본연구에서새롭게제안하는추천알고리즘은단순히상품에대한사용자평가점수의유사성만을고려한것이아니라, 사용자들사이에서신뢰하는사용자를나타내는데이터를활용하여, 사용자간신뢰관계까지함께고려할수있도록설계되었다. 이때, 신뢰관계데이터를분석하기위해서소셜네트워크분석기술을사용하였다. 본논문의구성은다음과같다. 우선 2장에서는협업필터링과소셜네트워크분석의기본개념과원리에대해서살펴본다. 아울러소셜네트워크분석을이용해추천시스템의성능을개선하고자시도한관련기존연구들에대해서도살펴본다. 이어 3장에서는본연구에서제안하는협업필터링과소셜네트워크분석을이용한새로운추천알고리즘에대해서설명하고, 4장에서는실증분석을위한데이터소개, 실험설계및실험결과에대하여제시한다. 마지막 5장에서는실험결과에따른연구성과및의의를설명하고, 본연구의한계점및향후연구방향을제시한다. - 3 -
Ⅱ. 이론적배경 1. 추천시스템추천시스템은사용자의행동살펴보기 (Breese et al., 1998), Top-N 상품추천리스트만들기또는사용자의평가점수를묻거나예측하는방법을통해그들이흥미를갖거나구매하기원하는상품을쉽게찾도록도와주는데이터분석기술기반의정보필터링 (information filtering) 시스템을일컫는다 (Sarwar et al., 2001). 추천시스템의주된목적은사용자와상품에대한접근가능한다양한정보를분석하여선호도가높을것으로예측되는상품을추천하는것이다 (Lee and Park, 2007). 추천시스템에적용되는알고리즘에는크게내용기반필터링 (Content-based filtering, CB) 과협업필터링 (Collaborative Filtering, CF) 이있다. 내용기반필터링은상품간의유사성 (item-to-item similarity) 을기반으로하여추천결과를생성하지만, 협업필터링은사용자간유사성 (user-to-user similarity) 에따라추천결과를생성한다. 협업필터링이내용기반필터링보다상대적으로우수한추천정확도를보이기때문에가장대표적인추천기법으로알려져있다 (Kim and Ahn, 2009; Kim and Ahn 2011). 2. 협업필터링 일반적으로협업필터링알고리즘기반추천프로세스는다음과같은절차에의해 사용자를위한추천대상상품을결정한다 (Herlocker et al., 1999). 단계 1. 사용자 - 상품평가점수행렬구성 Item 1 User 1 5 User 2 User 3 2 < 그림 1> 사용자 - 상품평가점수행렬의예 - 4 -
협업필터링추천알고리즘의첫단계는 < 그림 1> 과같이 개의상품에대한 명사용자의평점을 의사용자 - 상품평가점수행렬로구성하는것으로시작된 다. 단계 2. 사용자간유사도계산단계 2에서는사용자간의유사도를계산하여선호도가유사한사용자를탐색하는작업이수행된다. 유사도를측정하는방법으로는주로피어슨상관계수 (Pearson correlation coefficient, PCC) 혹은코사인유사도 (Cosine similarity) 가사용된다. 이중, PCC가가장많이사용되며식 (1) 과같이계산된다. (1) 위의식에서 는사용자 와사용자 의유사도이고, 은사용자 의상품 에대한평가점수이고, 은사용자 의상품 에대한평가점수이다. 은사용자 의평가점수평균값이고, 은사용자 의평가점수평균값이다. 단계 3. 이웃선택 사용자간의유사도가산출된후, 단계 3 에서는이유사도를기반으로추천대상 사용자와가장유사한 N 명의이웃을선택하게된다. 단계 4. 추천상품결정마지막 4단계에서는각상품에대한고객의선호도를예측하여최종추천상품을결정하는작업이이루어진다. 특정상품에대한추천대상사용자의평가점수예측은다음의식 (2) 를통해서이루어진다. 이때, 는추천대상자 의상품 에대한평가점수를나타낸다. (2) 위식에서 는사용자 의평가점수평균값이고, 는이웃사용자 의상품 - 5 -
에대한평가점수이다. 는추천대상자 와이웃사용자 사이의유사도를나타 낸다. 그리고 은유사한사용자를탐색하는작업에서선택된가장이웃하는이웃사 용자들의집합을의미한다. 3. 소셜네트워크분석과연결정도중심성연결된네트워크의의미를이해하는데있어, 각노드 (node) 의개별적특성보다는전체적인네트워크의패턴을분석하는데초점을맞추고수행되는소셜네트워크분석은오늘날사회과학뿐만아니라물리학, 의학, 마케팅등다양한분야에서많은주목을받고있다 (Park and Kwahk, 2013). 특히컴퓨팅기술이발전하고인터넷사용이보편화되면서대규모의네트워크데이터분석이용이해짐에따라, 그활용범위는더욱광범위해져서다양한연구의분석기법으로활용되고있다 (Kim and Im, 2014). 소셜네트워크분석에서네트워크구조를파악하기위한척도로는밀도, 호혜성, 이행성, 중심성, 구조적공백등이사용된다. 이중, 중심성은어떤개체가전체네트워크에서중심에위치하는정도를나타낸다. 구체적으로중심성에는연결정도중심성 (degree centrality), 근접중심성 (closeness centrality), 매개중심성 (betweenness centrality), 아이겐벡터중심성 (Eigenvector centrality) 등이있다 (Kwahk, 2014). 이중에서본연구는가장대표적인중심성척도인연결정도중심성을기반으로연구를진행하고자한다. 연결정도중심성은액터가네트워크내에서연결되어있는정도를기반으로측정된다. 가장간단하게중심성을측정할수있는방법으로, 한액터와직접연결관계를맺고있는액터의개수를합하여구할수있다 (Jeong and Kim, 2013; Sohn, 2002). 연결정도중심성척도는방향성을고려해볼수있는데, 비방향네트워크 (nondirected network) 는내향 외향연결정도측정이아닌, 단순히연결관계의개수로중심성을평가한다. 하지만방향네트워크 (directed network) 에서는내향 외향연결정도중심성을구분하여중심성을평가할수있다. 일반적으로외향연결정도 (outdegree) 는개방적성향 (expansiveness) 을나타내고내향연결정도 (indegree) 는액터의인기를반영한다 (Kwahk, 2014). 4. 소셜네트워크분석과추천시스템소셜네트워크분석을추천시스템연구에반영하고자하는최초의시도들은단순히소셜네트워크정보를추천과정에반영하는것이많았으며본격적으로사용하지는않았다. Golbeck(2006) 은웹으로부터수집한소셜네트워크정보를기반으로 FilmTrust - 6 -
라는새로운영화추천시스템을제안하였다. 이연구에서는평균과비교하여사용자들의다양한평가데이터가존재할때더정확도가높은추천이가능하다는것을보여주었다. Kim and Kim(2014) 과 Liu and Lee(2010) 는친구관계네트워크정보를이용하여사용자와친구관계인사용자의선호도정보를활용하거나가중하는새로운추천시스템을제안하였다. 그들의연구는추천대상자의친구인사용자의선호도를추천과정에더많이고려하였을때성능이기존보다더개선되는것을확인할수있었다. 최근에는소셜네트워크정보를탐색하는데그치는것이아니라, 소셜네트워크분석을통한결과물을추천과정에이용하는연구들이진행되었다. Cho and Bang(2009) 과 Park et al.(2009) 은모두상품추천시스템에소셜네트워크분석의중심성척도를접목하였다. 다만 Cho and Bang(2009) 은동일한사용자들이구매하는상품들의소셜네트워크를활용한반면, Park et al.(2009) 은동일한상품을구매하는사용자들의소셜네트워크를활용했다는점에서서로차이가있다. 한편, Kim and Kim(2014) 은구조적공백분석을실시하여네트워크내의주요한개체를추출한후이들을중심으로한군집을형성하여군집색인협업필터링을수행하였다. 실험결과, 제안한모형이다른비교모형에비해서추천성과의정확도가가장우수하였다. 앞서언급된연구들은소셜네트워크분석과협업필터링을통합한추천시스템을제안하였다는의의가있다. 하지만, 외향연결정도와내향연결정도의의미를갖는방향성네트워크를분석하거나사용자간의직접적인신뢰관계를나타내는네트워크를추천시스템에활용한사례는기존연구에서찾아보기어렵다. Ⅲ. 제안알고리즘 본연구에서는소셜네트워크분석을활용한신뢰네트워크데이터를추가로반영하 여, 전통적인협업필터링의성능을개선할수있는새로운추천알고리즘을제안한 다. 본연구의제안알고리즘은 < 그림 2> 와같이총 5 단계로구성된다. 단계 1. 사용자 - 상품평가점수행렬도출 협업필터링기반추천시스템의첫번째단계는사용자들의상품평점데이터들을 종합하여, 앞서 < 그림 1> 에서예시된것과같은사용자 - 상품평가점수행렬을도출 하는것이다. - 7 -
User Rating Dat (Quantitative Step1 User-Item Rating Creation < 그림 2> 제안알고리즘의수행절차 단계 2. 신뢰관계네트워크구축및척도계산 2단계에서는사용자간의링크로구성되어신뢰관계를표현하는소셜네트워크를만들고, 이로부터중심성척도를계산한다. 본연구에서는신뢰관계데이터가방향 이진네트워크로나타나기때문에내향연결정도와외향연결정도로구분할수있다. 따라서내향연결정도를기반으로한중심성과외향연결정도를기반으로한중심성을모두계산한다. 단계 3. 사용자간유사도산출 1 단계에서도출된사용자 - 상품평가점수행렬을참조하여추천대상자와나머지사 용자들을대상으로평가점수유사도를산출한다. 본연구에서는평가점수유사도계 - 8 -
산방법으로 PCC 를사용한다. PCC 식은앞서 2 장에서설명한식 (1) 에의해산출된 다. 단계 4. 소셜네트워크분석을통한유사도조정이단계에서는 2단계와 3단계에서도출된사용자신뢰관계네트워크데이터와사용자간유사도를통합하여전체적으로사용자간유사도를조정하게되는데, 이를반영한사용자간유사도 는다음식 (3) 과같이산출된다. (3) 위식에서 는신뢰관계네트워크정보를추가로고려하여사용자 와사용자 의조정된유사도를의미한다. 는사용자 와사용자 사이의유사도를확 대해주는조정계수이다. 본연구에서는유사도조정작업즉, 를도출하기위해크게 3가지접근법을제시한다. 첫번째접근법 (Trust CF-All) 은사용자 의신뢰관계네트워크에대한내향연결정도중심성을고려하여유사도를확대하는것이다. 예를들어, A 사용자의내향연결정도중심성값이높다면, 이는다른사용자들로부터높은신뢰를받고있다는의미이므로다른사용자들이 A의추천을적극적으로수용할가능성이높다. 이러한배경에서, 첫번째접근법에서는 를다음의식 (4) 와같이적용한다. (4) 상기식에서 는승수이고, 는사용자 의내향연결정도중심성이다. 여기서 승수 는유사도에서내향연결정도중심성을비중있게반영하기위해결정해야하 는지표로써, 시행착오 (trial-and-error) 를거쳐최적의값을찾아야한다. 두번째접근법 (Trust CF-Conditional) 은앞서설명한첫번째접근법과유사하지만이를확장한방법으로, 외향연결정도중심성이특정임계치 (threshold) 이상인사용자 에대해서만다른사용자 의내향연결정도중심성을고려하는것이다. 예를들어, B 사용자의외향연결정도중심성의값이높다면, 이는사용자 B가다른사람을신뢰하는성향이강하다고볼수있기때문에내향연결정도중심성의값이높은사용자 A의추천을긍정적으로받아들일수있다. 반대로 B 사용자의외향중심 - 9 -
성이어떤임계치이하수준으로낮은상황이라면, 이사용자의경우타인에대한전반적인신뢰가낮은상황이므로타인의신뢰정도를추가적으로고려하지않는것이더나을수있다. 이러한특징을반영하여, 두번째접근법에서는 를다음의식 (5) 와같은방식으로계산하도록하였다. (5) 위식에서 는모형설계자가결정할특정임계치이고, 는사용자 의외향 연결정도중심성을나타낸다. 마지막세번째접근법 (Trust CF-Search) 은 2단계에서구축된신뢰네트워크데이터를직접탐색하여유사도에반영하는방법이다. 이접근법에서는 직접적인신뢰관계 와 간접적인신뢰관계 를고려하는데, 예를들어 사용자 A는사용자 B를신뢰한다 고응답했거나, 사용자 B가사용자 C를신뢰한다 고응답한경우, A와 B, B와 C 는직접적인신뢰관계가있는것으로정의한다. 하지만, < 그림 3> 에제시된상황과같이만약 A B, B C 간에는직접신뢰관계가있지만, 사용자 A가사용자 C를신뢰한다 는응답은없는상황이라면, 이경우에도비록 A는 C를직접적으로신뢰하지않지만, A가직접적으로신뢰하는사람인 B가 C를직접적으로신뢰하고있기때문에, 사용자 A는중개자 B를매개로사용자 C와간접적인신뢰관계를형성하고있다고볼수있다. 이러한사용자 A와 C의관계를본연구에서는간접적인신뢰관계로정의한다. < 그림 3> 직접적인신뢰관계와간접적인신뢰관계예시 - 10 -
이러한특징을반영하여, 세번째접근법에서는 를다음의식 (6) 와같은방 식으로계산한다. (6) 위식에서 은사용자 와사용자 의간접신뢰관계승수이고, 는직접신뢰관계승수이다. 직접적인신뢰관계의경우, 간접적인신뢰관계보다더높은수준으로가중치를반영하는것이합리적이므로, 가항상만족되어야한다. 단계 5. 선호도예측마지막 5단계에서는추천대상자의각상품별선호도 ( 예상평점 ) 를예측하는작업이이루어진다. 각상품별선호도예측은앞서 2장에서소개된식 (2) 를변형한식 (7) 을사용하여계산한다. (7) 이처럼선호도예측작업이끝나면, 예상평가점수가높게나온상품들을중심으로 추천대상자가아직경험해보지않은상품들을중심으로추천대상상품을결정한다 (Jeon and Ahn, 2015). Ⅳ. 실증분석 1. 실험데이터선정본연구에서제안하는추천알고리즘들의예측정확도를확인하기위하여 LibRec으로부터제공받은데이터를사용해실험을수행한다. 제공된연구데이터는사용자들의영화선호도평가점수자료와사용자간신뢰관계네트워크에대한자료이다 (Golbeck, 2006). 영화선호도평가점수자료는사용자 ID, 영화 ID, 평점으로구성되어있으며, 총 35,497건의평가데이터이다. 사용자간신뢰관계데이터는신뢰하는 - 11 -
사용자 ID, 신뢰받는사용자 ID로구성되어있으며, 방향 / 이진네트워크그래프로표현이가능하다. 본연구에서제안하는추천알고리즘에대한다양한접근법들 (Trust CF-All, Trust CF-Conditional, Trust CF-Search) 의유용성을확인하기위하여, 본연구에서는사용자간신뢰관계네트워크데이터에 UCINET 6를이용하여내향및외향중심성지수를산출하고, Microsoft Excel VBA로프로그램된별도의 SW를활용하여사용자간직접및간접신뢰관계를나타내는사용자-사용자간신뢰관계행렬 (User-to-User Trust Matrix) 을산출하였다. 아울러, 신뢰관계를가중하여사용자간유사도를산출하는본연구의제안알고리즘역시 Microsoft Excel VBA로실험용소프트웨어를구현하여실험하였다. 제안추천알고리즘의경우, (1) 조건없이신뢰관계네트워크의내향중심성을고려하는방식 (Trust CF-All) 과, (2) 외향중심성이특정임계치이상인사용자에한하여신뢰관계네트워크의내향연결정도중심성을반영하는방식 (Trust CF-Conditional) 그리고 (3) 직접신뢰및간접신뢰관계를적용하는방식 (Trust CF-Search) 을모두적용해본후, 그성능을비교해보고자하였다. 그리고, 전통적인 CF 알고리즘을적용하여그결과를상기세접근법의벤치마크대상으로사용하였다. 2. 실험결과본연구에서는사용자의평가점수가입력된영화에대해서제안한추천알고리즘으로예상평가점수를도출한다음, 실제평가점수와비교했을때평균오차가가장적은추천알고리즘이무엇인지를확인해보는방식으로검증을진행하였다 (Kim and Kim 2014). 이때, 점수간의오차는추천시스템관련연구에서가장많이사용되는척도인평균 MAE(Mean Absolute Error) 를활용하였다 (Breese et al., 1998; Sarwar et al., 2001). 우선첫번째로제시한조건없이신뢰관계네트워크의내향중심성을고려하는접근법 (Trust CF-All) 의결과는다음의 < 표 1> 과같다. 이표에서볼수있듯이, Trust CF-All은유감스럽게도전통적인협업필터링보다성능의개선을가져오지못함을확인하였다. 특히승수의값이커질수록성능이더나빠지는것으로나타나, 신뢰관계네트워크의내향중심성지수를더강하게고려할수록오히려추천알고리즘의성능에악영향을끼침을알수있었다. 즉, 상대적으로사용자들사이에서신뢰도가높은사용자의의견을추천과정에반영한다는점에서성능의개선을기대했지만, 결과적으로성능개선효과는없는것으로분석되었다. - 12 -
< 표 1> Trust CF-All 의예측정확도 Approach Multiplying Coefficient( ) Average MAE Conventional CF (Comparison) Trust CF-All 0 0.564966 1 0.565134 2 0.565212 3 0.565792 4 0.568665 5 0.580273 한편두번째로제시한외향중심성이특정임계치이상인사용자에한하여신뢰관 계네트워크의내향연결정도중심성을반영하는접근법 (Trust CF-Conditional) 의실 험결과가다음의 < 표 2> 에제시되어있다. < 표 2> Trust CF-Conditional 의예측정확도 Threshold for Outdegree Centrality( ) 0.5 0.45 0.4 0.35 0.3 0.25 0.2 Multiplying Coefficient for Average MAE Indegree Centrality( ) 1 0.564966 2 0.564968 3 0.564987 1 0.564961 2 0.564958 3 0.564967 1 0.564961 2 0.56496 3 0.564974 1 0.564956 2 0.564952 3 0.564990 1 0.564948 2 0.564943 3 0.564981 1 0.564948 2 0.564943 3 0.564984 1 0.564947 2 0.564946 3 0.565005-13 -
0.15 0.1 0.05 1 0.564946 2 0.564927 3 0.564996 1 0.564959 2 0.564909 3 0.564927 1 0.564972 2 0.564962 3 0.565114 이표에서볼수있듯이, 외향중심성을기준으로적절하게임계치를설정하고, 해당임계치이상의중심성을보인사용자에한하여내향중심성을가중반영할경우예측정확도가소폭상승함을알수있다. 본실험에서적용한여러설정값들중에서는 가 0.1이고, 가 2일때, 평균 MAE가 0.564909가되어가장높은예측정확도가산출되었다. 이는전통적인 CF의평균 MAE에비해 감소한수치이다. 이러한실험의결과는사용자신뢰관계의개방적성향 ( 일종의사용자가갖는신뢰에대한본원적성향 ) 이높아야만다른사용자의신뢰관계네트워크에대한내향중심성을추천과정에서고려하는것이의미가있다는점을시사한다. < 표 3> 에는직접신뢰및간접신뢰관계를적용하는방식 (Trust CF-Search) 의실험결과가제시되어있다. 이표의결과를보면, < 표 1> 이나 < 표 2> 에제시된다른접근법들과비교해 Trust CF-Search 방식이월등히우수한예측정확도를산출함을알수있다. 특히승수값이커질수록예측정확도가상승하는패턴을보여,, 일때가장낮은평균 MAE(0.564846) 를나타내고있음을알수있는데, 이는직 간접적인신뢰관계를추천과정에서고려하는것이중심성을고려하는다른접근법에비해훨씬효과적이라는사실을우리에게보여주고있다. < 표 3> Trust CF-Search 의예측정확도 Approach Trust CF-Search Multiplying Coefficient( ) Average MAE 0.564912 0.564871 0.564846-14 -
이상소개한세가지접근법의예측정확도와비교기법인전통적인 CF의예측정확도를종합적으로정리한결과가다음의 < 표 4> 에제시되어있다. 이표를통해서알수있듯이, Trust CF-All < 전통적인 CF < Trust CF-Conditional < Trust CF-Search 순으로예측정확도가산출됨을알수있다. 이러한성과의차이가과연통계적으로유의한지를검증하기위해, 대응표본 t-검정을수행하였다. 그결과, Trust CF-All이나 Trust CF-Conditional은전통적인 CF 대비통계적으로유의한성과차이를만들어내지못했지만, Trust CF-Search는 95% 신뢰수준하에서통계적으로유의한수준의차이가나고있음을확인할수있었다. < 표 4> 전체실험결과 Recommendation Algorithms Average MAE Optimal Setting Conventional CF 0.564966 - Trust CF-All 0.565134 Proposed Algorithm Trust CF-Conditional 0.564909 Trust CF-Search 0.564846 Ⅴ. 결론 본연구에서는사용자들의영화평점만을활용해추천결과를생성하는기존의협업필터링을개선하기위해, 신뢰기반사용자네트워크를추가로고려하여협업필터링의성능높일수있는새로운추천알고리즘을제안하였다. 구체적으로, 사용자의신뢰관계네트워크에서내향연결정도중심성을고려하여유사도를확대하거나혹은외향연결정도중심성이특정임계치이상인사용자에한하여이웃사용자의내향연결정도중심성을활용하는방법, 마지막으로네트워크를직접적으로탐색하여직접적및간접적신뢰관계를반영하는 3가지접근법을제시하였다. 아울러, 이 3가지접근법중어느것이더우수한예측정확도를보이는지실증분석을통해확인하였다. 그결과, 두번째와세번째접근법이전통적인 CF에비해더우수한예측정확도를보인다는사실과그중에서도세번째접근법이가장우수한추천성능을보인다는사실을확인할수있었다. 그리고이를통해소셜네트워크데이터를추천알고리즘에반영할경우사용자간의신뢰관계를직접적으로탐색한결과를고려하는것이예측의효 - 15 -
과성을제고하는데있어가장좋은대안임을제시하였다. 대다수의추천시스템연구에서사용되어온평점데이터에만의존하지않고, 오늘날중요성이크게대두되고있는사용자간신뢰관계네트워크데이터를활용하여예측성능을제고하는새로운접근법을제시하였다는점은기존연구와본연구가크게차별화되는부분이라고할수있다. 특히기존연구에서시도되지않았던내 외향중심성을차별적으로적용하는방법론을새롭게제안하여그가능성을확인한점과직 간접신뢰관계를반영하여유의미하게기존 CF의예측정확도를개선할수있는방안을제시한점은본연구가갖는중요한학술적의의라생각된다. 하지만, 본연구에서예측정확도를유의미하게개선하는것으로나타난 Trust CF-Search 의경우, 사용자간유사도를계산할때마다매번사용자신뢰관계네트워크를탐색해야하므로다른접근법에비해훨씬많은컴퓨팅자원을요구하게된다. 따라서 Trust CF-Search의효율성을개선하기위한후속연구가추후이루어져야할것으로보인다. 또한, Trust CF-Search에서는현재중개인이 1명인경우에한해서만간접신뢰관계를정의하여사용하고있는데, 중개인이 2명이상인간접신뢰관계까지고려하면더높은예측정확도를얻을가능성이있다. 때문에이러한부분에대한확장연구역시추후필요할것으로판단된다. 끝으로현재제안된연구모형에는임계치 ( ), 승수 ( ) 등실험자가임의로설정해야할변수들이포함되어있다. 이러한변수들의값을최적화하기위한방법역시의미있는후속연구의주제가될것으로예상된다. 참고문헌 Breese, J. S., Heckerman, D., and C. Kadie, Empirical analysis of predictive algorithms for collaborative filtering, Proceedings of the 14 th Conference on Uncertainty in Artificial Intelligence, 1998, pp. 43-52. Chen, P.-Y., S. Dhanasobhon, and M. D. Smith, An Analysis of the Differential Impact of Reviews and Reviewers at Amazon.Com, Proceedings of International Conference on Information Systems(ICIS), 2007. Cho, Y., and Bang J., Social network analysis for new product recommendation, Journal of Intelligence and Information Systems, Vol. 15, No.4, 2009, pp. 183-200 - 16 -
Golbeck, J., Generating predictive movie recommendations from trust in social networks, Proceedings of the 4 th International Conference on Trust Management, Lecture Notes in Computer Science, Vol. 3986, 2006, pp. 93-104. Herlocker, J., Konstan, J., Borchers, A., and Riedl, J., An Algorithm Framework for Performing Collaborative Filtering, Proceedings of the 22 nd Annual International ACMSIGIR Conference on Research and Development in information Retrieval, 1999, pp. 230-237. Jeon, B. K., and Ahn H., A Collaborative Filtering System Combined with Users Review Mining: Application to the Recommendation of Smartphone Apps, Journal of Intelligence and Information Systems, Vol. 21, No. 2, 2015, pp. 1-18. Jeong, J. -H., and Kim, J. -W., Collaborative Filtering Techniques Using Social Network Analysis for UCC Recommendation, Journal of Intelligence and Information Systems, Vol. 11, No. 1, 2013, pp. 185-195. Kim, K. -j. and H. Ahn, Hybrid recommender systems using cluster-indexing collaborative filtering and soial network analysis, Proceedings of the 2010 Fall Conference of the Korean Society of Management Information Systems, 2010, pp. 604-609. Kim, K. -J., and Ahn, H., User-Item Matrix Reduction Technique for Personalized Recommender Systems, Journal of Information Technology Application & Management, Vol. 16, No. 1, 2009, pp. 97-113 Kim, K.-j., and Ahn, H., Collaborative Filtering with a User-Item Matrix Reduction Technique for Recommender Systems, International Journal of Electronic Commerce, Vol. 16, No. 1, 2011, pp. 107-128. Kim, M. G., and Kim, K. -j., Recommender Systems using Structural Hole and Collaborative Filtering, Journal of Intelligence and Information System, Vol. 20, No. 4, 2014, pp. 107-120. Kim, M. S., and Im, I., Resolving the Gray sheep Problem Using Social Network Analysis (SNA) in Collaborative Filtering (CF) Recommender Systems, Journal of Intelligence and Information System, Vol. 20, No. - 17 -
2, 2014, pp. 137-148. Kwahk, K. Y., Social Network Analysis, Cheongram, 2014. Lee, J. S., and Park, S. D., Performance Improvement of a Movie Recommendation System using Genre-wise Collaborative Filtering, Journal of Intelligence and Information Systems, Vol. 13, No. 4, 2007, pp. 65-78. Liu, F., and H. J. Lee, Use of social network information to enhance collaborative filtering performance, Expert Systems with Applications, Vol. 37, No. 7, 2010, pp. 4772-4778. Park, J. H., Cho. Y. H., and Kim, J. K., Social network: a novel approach to new customer recommendations, Journal of Intelligence and Information Systems, Vol. 15, No. 1, 2009. pp. 123-140. Park, J. H., and Kwahk, K. -Y., "The Effect of Patent Citation Relationship on Business Performance: A Social Network Analysis Perspective," Journal of Intelligence and Information Systems, Vol. 19, No. 3, 2013, pp. 127-139. Sarwar, B., Karypis G., Konstan, J., and Riedl, J., Item-based collaborative filtering recommendation algorithms, Proeeding of the 10 th International Conference on World Wide Web, 2001, pp. 285-295. Shinha, R., and K. Swearingen., Comparing recommendations made by online systems and friends, Proceedings of the DELOS-NSF Workshop on Personalization and Recommender Systems in Digital Libraries, 2001. Sohn, D. W., Social Network Analysis, Kyungmoon Publishing, 2002. Zhang, Z., D. Zhang, and J. Lai., urcf: User Review Enhanced Collaborative Filtering, Proceedings of the 20 th Americas Conference on Information Systems, 2014. - 18 -