168 정보과학회논문지 : 데이타베이스제 41 권제 3 호 (2014.6) 인터넷게시물을이용한온라인사용자사회구성망분석 (An Analysis of Online User Social Networks using Internet Bulletin Posts) 탁해성 조환규 (Haesung Tak) (Hwan-Gue Cho) 요약최근소셜네트워크서비스를이용한온라인의사소통이급격하게증가하고있다. 거대한소셜네트워크에대한연구가진행되면서, 소셜네트워크를시각화하는시스템이필요하다. 이중에서도사용자관계망의주요특성을고려한시각화방법은매우중요한연구주제이다. 본논문은온라인게시판에서획득한자료로부터구성한사용자사회구성망그래프를시각화하기위한방법을제시한다. 이를위하여특정온라인게시판의글 120 만개를수집하였다. 수집한온라인게시물을활용하여, 사용자의게시판참여정도와사용자간논쟁관계가잘드러나도록사회구성망그래프를시각화하여시각화방법을검증하였다. 키워드 : 사회구성망, 시각화, 인터넷게시물, 그래프이론 Abstract Recently, we witnessed that the online communication based on social networks is growing so rapidly. In order to analyze huge social networks, firstly, a good visualization system is required. Especially, the visualization for characteristics of a network graph is crucial in social network analysis. This paper proposes an algorithm for user social networks obtained from online bulletins. For this, we have collected 1.2 million articles posted on an online bulletin in Korea. With lots of online bulletin articles we have collected, our experiments have shown the proposed algorithm has successfully visualized the degree of disputing strength and the confronting groups in online bulletins. Keywords: social network, visualization, internet posts, graph theory 1. 서론 IT 기술의발전에따라인터넷은사람들에게보다더밀접한관계를맺게되었다. 웹서비스접근성증가로 이논문또는저서는 2013년정부 ( 교육과학기술부 ) 의재원으로한국연구재단의지원을받아수행된연구임 (NRF-2013S1A5B6053791) 이논문은 2013 한국컴퓨터종합학술대회에서 인터넷게시물을이용한온라인사용자사회구성망분석 의제목으로발표된논문을확장한것임 학생회원 : 부산대학교컴퓨터공학과 tok33@pusan.ac.kr 종신회원 : 부산대학교컴퓨터공학과교수 hgcho@pusan.ac.kr (Corresponding author임 ) 논문접수 : 2013년 7월 15일심사완료 : 2014년 1월 8일 CopyrightC2014 한국정보과학회 ː개인목적이나교육목적인경우, 이저작물의전체또는일부에대한복사본혹은디지털사본의제작을허가합니다. 이때, 사본은상업적수단으로사용할수없으며첫페이지에본문구와출처를반드시명시해야합니다. 이외의목적으로복제, 배포, 출판, 전송등모든유형의사용행위를하는경우에대하여는사전에허가를얻고비용을지불해야합니다. 정보과학회논문지 : 데이타베이스제41권제3호 (2014.6) 인해사용자간의물리적거리를무시할수있게되면서, 인터넷소통공간이증가하고사용자의활동시간이다양해졌다. 활발한인터넷사용자간의소통으로인해웹환경에서수많은자료가쏟아지게되었다. 이러한방대한웹데이터를활용하기위해컴퓨터공학에서사용되는많은방법론이적용되고있으며, 다른학문에서도이를활용하고자하는시도가이루어지고있다. 그중에서도현재각광받고있는소셜네트워크서비스에대한분석이많이이루어진다. 이가운데가장많이사용되고있는페이스북이나트위터에서작성되는게시물정보를활용하여사회관계망을구축하거나통계적분석이활발히이루어지고있다 [1]. 특정사용자들끼리관심있는분야에대해정보를주고받거나, 불특정다수의사용자가서로다른개인의의견을나누며토론하는의사소통이현재사회의오프라인행동양식과유사해짐에따라인터넷속에서사회연결망을구축하여네트워크로나타내는노력이이루어지고있다 [2]. 인터넷커뮤니티의사회연결망구성방식에대한연구이외에도사
인터넷게시물을이용한온라인사용자사회구성망분석 169 용자들이얘기하는주제에의한소통방식에대한연구 [3] 와인터넷커뮤니티에서정보가확산되는과정에서형성되는관계에대한연구 [4], 인터넷토론사이트에서일어나는댓글사이의논쟁을시각화하는연구 [5] 가진행되고있다. 실제사회에서한집단을대상으로접근방식이다양하듯이인터넷에서일어나는현상에대해다양하게접근하는것을알수있다. 또한거대한사용자연결망을시각화하기위한연구가진행되고있다 [6,7]. 본논문에서는인터넷커뮤니티에서사용자들이커뮤니티에참가하는활동이나타내는관계를시각화한다. 이를위해 MLBPark에서작성되는게시물및댓글을활용하며, 사용자간관계망시각화를위해에지생성규칙과에지분류방식을정의한다. 정의한규칙을활용하여생성한관계망을활용하여실제게시물에서나타나는의사소통간에발생하는관계와유사한지알아본다. 또한관계망전체가아닌의미있는관계망을시각화하기위한노드와에지선별방식을검증한다. 2장에서는실험에사용된인터넷커뮤니티사이트인 MLBPark 게시물을이용하여그래프구성에필요한정보를분석하고그래프에대한정보를분석하고연결망구성에필요한사항을점검한다. 3장에서는분석결과를통해나타난사용자들이형성하는연결관계에대한관계강도를선정하기위한방안에대해서술한다. 4장에서는사용자관계그래프시각화하기위해 Big Graph 시각화도구인 Gephi[8] 를활용하여결과를분석한다. 끝으로 5장에서는실험결과를이용하여사용자간의관계망에대한결론및추후에진행할연구방향에대해살펴본다. 2. 분석대상사이트선정소셜네트워크서비스인페이스북과트위터의경우다수의사용자들이서로관계를형성한다 [9,10]. 하지만소셜네트워크서비스는개인의관계를중시하기때문에임의의사용자에대한게시물정보를획득하기에어려움이있다. 이러한특징을바탕으로게시물및댓글정보를획득하기용이한인터넷커뮤니티중하나를선정하였다. 현재국내에서남녀노소를불문하고많은사람들이관심을가지는구기종목으로축구와야구를꼽을수있다. 이러한특징을인터넷커뮤니티의사회연결망분석하는데이용하기위해국내에서활성화되어있는야구커뮤니티 MLBPark를선정하였다. MLBPark는한국야구뿐만아니라 MLB에대한정보를취득할수있으며, 관련뉴스들도볼수있다. MLBPark는야구커뮤니티라는한정된분야의커뮤니티임에도불구하고, 다양한주제에대한게시물과이에대한댓글이달리는 표 1 MLBPark 게시판분석결과 Table 1 MLBPark Documents Analysis Result Contents Value Number of Internet Bulletin Posts 1,294,798 Number of Post Writers 24,300 Number of Reply Writers 34,762 Number of Internet Bulletin Users 36,408 Number of Reply 8,403,817 Average of Reply / Post 6.5 것을통해의사소통이활발하게이루어지는것을확인할수있다. 본논문에서는이러한게시물및댓글을수집하고분석함으로서, 해당커뮤니티의게시물이가지는특성에대해알아본다. 게시물정보를추출하기위해 HTML 정보를축약하여게시물번호, 제목, 작성자, 조회수, 내용, 댓글수, 댓글작성자목록, 댓글의길이와같은정보만을별도의파일에저장하였다. 본보고서에서는추출결과중에서게시물작성자와댓글작성자목록을사용하여분석을시행하였으며, 활용되지않은나머지정보는추후에다른연구를진행하는데활용한다. MLBPark 내부에있는 Bullpen 게시판에는현재약이백삼십만개정도의글이등재되어있으며, 하루에약 4000개정도의글이작성되는것을확인할수있다. 본보고서에서게시물에대한분석을시행하기위해서, 2011년도 12월부터 2013년 2월까지의약 130만개정도의게시물을수집하여정보분석을시행하였다. 표 1은추출을진행한커뮤니티게시판에대한분석지표를나타낸결과이다. 연결망형성을위해사용된게시물은총 1,294,798개이며, 게시물작성자와댓글참여자를합산한참여사용자수는 36,408명이다. 게시물에달린댓글을합산하여, 하나의게시물에약 6.5개의댓글이달리는것을통계적으로나타내었다. 표 1의결과를통해약 130만개의게시물에대해 830 만개에달하는댓글이달려있는것을확인할수있다. 댓글의수만으로는실제사용자들이말하는바가무엇인지알수없다. 본보고서에는댓글의내용을활용하여사용자간에나타나는관계를분석하는것이아닌, 댓글이나타나는순서를이용하여관계를분석한다. 3. 인터넷사회연결망관계선정방안인터넷커뮤니티는다수의사용자가서로다른의견을공유하는것이므로상호보완적인관계를나타낸다. 하지만 MLBPark 커뮤니티게시물에서댓글은선형구조로되어있어, 댓글작성자가다른댓글작성자에게의견을제시하는것인지게시물작성자에게의견을제시하는지소통구조를확인하기어렵다. 이러한특성을
170 정보과학회논문지 : 데이타베이스제 41 권제 3 호 (2014.6) 고려하였을때그래프구조를활용하여사용자관계망을시각화하는것이가장효과적이라고판단하였다. 게시판을하나의큰그래프로가정하였을때, 노드와에지는각각커뮤니티에서활동하는실제사용자와댓글을달았을때발생하는연결관계를의미한다. 임의의사용자 에대해최대발생할수있는에지의총수는완전그래프에방향성까지고려하였을때, 개이다. 이는커뮤니티에참가하는사용자의수가많을수록에지의수가크게증가하는것을알수있다. 따라서사용자들간에연관관계를선정하는방식에따라에지개수가크게좌우되는것을알수있다. 토론형식의글이나일반흥미의글과같은다른유형의게시물에대해서도의미있는관계를추려낼수있는방식을선정한다. 사용자들이작성하는게시물과댓글사이에에지를생성하는규칙은두가지로아래와같다. 첫째, 임의의게시물에서댓글이달리는경우해당댓글의앞에언급된댓글이나작성자와의관계를에지로형성한다. 임의의게시물에서나타나는작성자리스트중임의의두사용자를선택하였을때, 두사용자사이의거리가멀수록관계의정도는적다고할수있다. 이러한특성을반영하기위해아래와같은식을사용한다. 거리가중치 거리 위의식에서거리가중치 는 1보다작거나같고 0보다큰실수로이는거리가멀수록관계가더깊어지지않는것을보장한다. 또한거리 는댓글목록전체를반영하는것이아닌일정거리이전의사용자의거리만반영한다. 이는거리가중치의값이 1미만의실수일경우거리가멀어짐에따라가중치가 0으로수렴하기때문이다. 그림 1은임의의게시물에서확인할수있는사용자목록이다. 이를활용하여거리에따른에지생성량의변화를알아보았다. 실험을위해거리가중치의값은 1로고정한다. 표 2는첫번째규칙중댓글작성자가작성자목록의바로이전에해당하는사용자와관계를맺었을때의에지분포이다. 또한표 3은첫번째규칙에서거리 를 2로하였을때의에지분포이다. 표 2와표 3 을비교하였을때, 허용하는사용자간거리가길어질수록생성되는관계의양이많아지는것을볼수있다. 사용자간거리에따른관계생성량비교와더불어거리가중치에따라생성되는에지가중치의합이다름을표 4와표 5를통해알수있다. 표 4에서는거리가중치를 1로가정하고, 표 5에서는거리가중치를 0.8로가정한다. 에지를생성함에있어서발생가능한모든에지를고려할경우의미가없는에지가늘어나게된다. 이에대한필터링을위해위의식에서거리 의값을제한하는데이를최대거리라고한다. 표 3과표 4의실험 그림 1 게시물작성자및댓글작성자목록예시 Fig. 1 Example of Document Comments List 표 2 작성자간거리에따른관계분포표 [ ] Table 2 Example of Relations Distribution [ ] A 0 1 0 0 1 0 2 B 2 0 0 0 0 0 2 C 0 1 0 0 0 0 1 D 0 0 1 0 0 0 1 E 0 0 0 1 0 0 1 F 1 0 0 0 0 0 1 3 2 1 1 1 0 8 표 3 작성자간거리에따른관계분포표 [ ] Table 3 Example of Relations Distribution [ ] A 0 1 0 1 1 0 3 B 2 0 0 0 0 0 2 C 1 1 0 0 0 0 2 D 0 1 1 0 0 0 2 E 0 0 1 1 0 0 2 F 1 0 0 0 1 0 2 4 3 2 2 2 0 13 표 4 거리가중치가 1 일때의에지가중치합분포표 Table 4 Distribution of Edge Weight Sum [ ] A 0 2 1 1 1 0 5 B 2 0 0 0 0 0 2 C 2 2 0 0 0 0 4 D 2 2 1 0 0 0 5 E 2 2 1 1 0 0 6 F 2 1 1 1 0 0 5 10 9 4 3 1 0 27 에서는최대거리를 5로두어사용자로부터최대 5번째앞의사용자와관계를맺도록한다. 표 4의결과를통해실제에지생성규칙에서나오는에지가중치는생성횟수만을의미하기때문에전체게시물에대한관계를분석하는데있어서의미있는값을얻기힘들다. 이를첫번째에지생성규칙의식을활용하여계산한수치는아래표 5와같다. 이는거리가중치가 0.8일경우에거리가 6 이상일때에지가중치는 0.26
인터넷게시물을이용한온라인사용자사회구성망분석 171 표 5 거리가중치가 0.8 일때의에지가중치합분포표 Table 5 Distribution of Edge Weight Sum [ ] A 0 1.21 0.51 0.64 0.80 0 3.16 B 1.80 0 0 0 0 0 1.80 C 1.64 1.31 0 0 0 0 2.95 D 1.51 1.05 0.80 0 0 0 3.36 E 1.41 0.84 0.64 0.80 0 0 3.69 F 1.80 0.33 0.41 0.64 0 0 3.18 8.16 4.74 2.36 2.08 0.80 0 18.14 이하가되기때문에두사용자사이의관계정도가큰의미를가지지못하기때문이다. 거리가중치를위에서정의한에지생성규칙을적용하기위해거리가중치를 0.8로지정하고최대거리를 5 로하였을때아름표 4와같은에지의수가나타낸다. 표 2에서표 4에나타나는 와 는작성자사이의관계를나타낸다. 각관계에는방향성이존재하기때문에 와 의 와 가동일한값을가지더라도각기다른값이저장된다. 해당결과를통해생성된에지수가같더라도거리가중치에의해더의미있는에지를추려낼수있다. 이는각게시물에대해표 4와같은결과가나올경우, 일정수치이하의값을가지는에지는그래프정보로추가하지않는방법으로활용가능하다. 또한전체게시물에대해생성된에지를취합한결과를활용하여일정이하의가중치를가지는에지를제거함으로서그래프생성에사용되는에지수를줄일수있다. 이러한결과를그래프시각화도구인 Gephi [8] 를활용하여분석해본다. 표 6은임의의데이터에대해최대거리와필터링을각기적용하였을때그래프의구성변화를나타낸표이다. 이때필터링값과거리가중치의값이일정할경우최대거리의값이클수록시각화되는노드와에지의수가증가하는것을알수있다. 표 6의실험을진행하는데있어서필터값은그래프를형성한정보에서 15이하의가중치를제외하였을때의정보를저장한다. 표 7의경우거리가중치의변화량에따라생성되는그래프양을비교분석한결과이다. 거리가중치가 0에가까울수록많은수의데이터가소실되며 1에가까울수록작성자리스트에서뽑아내는그래프양과유사해짐을알수있다. 둘째, 한게시물에댓글을작성하는행위는게시물작성자에대해댓글작성자가관심을표한것으로볼수있으며이는사용자간에관계를맺었음을의미한다. 따라서게시물작성자와댓글사용자는반드시관계가있다고할수있다. 이를바탕으로한게시물에대해댓글 표 6 최대거리에따른그래프변화량분석표 Table 6 Maximum Distance Change based on Graph Weight Filter Node Edge 1 0.8 15 2,489 10,082 2 0.8 15 3,396 13,825 3 0.8 15 3,830 17,054 4 0.8 15 4,088 19,725 5 0.8 15 4,154 20,636 6 0.8 15 4,207 21,145 표 7 거리가중치에따른그래프변화량분석표 Table 7 Distance Weight Change based on Graph Distance Node Edge 0.1 10 3,325 12,288 0.2 10 3,336 12,484 0.3 10 3,344 12,762 0.4 10 3,374 13,356 0.5 10 3,431 14,170 0.6 10 3,600 16,024 0.7 10 3,954 18,578 0.8 10 4,283 21,969 0.9 10 4,587 25,660 1.0 10 4,749 31,523 을작성한사람들과게시물작성자사이에에지를생성 한다. 해당에지를생성할때연결되는방향에따라형 성되는사이클의수가결정되기때문에댓글의사용자 로부터게시물작성자의방향으로에지를생성한다. 이 를통해사이클수를조절할수있다. 두가지에지생성규칙에서첫번째규칙을통해생 성된에지의거리 안에작성자가있을경우계산된값 대신두번째규칙을적용된다. 이는해당에지가작성 자와댓글작성자사이의관계를나타낼때의미있는 관계를중점적으로부각시키기위해필요하다. 4. 사용자간관계그래프시각화및분석 현재그래프를시각화하기위해그래프정보를저장 하는파일포맷으로 GraphML이있다. 이는그래프를 구성하는노드와에지에대한기본정보와사용자가별 도로사용하기위한값들을저장할수있다. 정보의가공이외에도연결망을얼마나효과적으로시 각화해주는가에대한문제와해당연결망에서나타나 는특성을분석할수있어야한다. 이에대한작업을효 과적으로수행하기위해 Gephi[8] 를활용한다. Gephi는 오픈소스로되어있는네트워크분석및구축이가능한 소프트웨어이다. 이도구는그래프를시각화하는작업 이외에도필터링하는기능과정보분석그리고파일형 식을변환하여저장하는등의그래프관련작업을수행
172 정보과학회논문지 : 데이타베이스제 41 권제 3 호 (2014.6) 한다. 본보고서에서수행하는작업은시각화가주요목적이아닌특성분석이므로정보가얼마나시각화되어있는지는중점적으로고려하지않는다. MLBPark 게시판에서활동하는사용자간의관계그래프를형성하기위해 2장에서분석한 1,294,798개의게시물에대한정보를바탕으로하였다. 3장에서정의한관계선정방식에의거하여사용자에대한에지정보를생성하였을때, 약 8백만개의에지가발생한다. 커뮤니티활동에참가한 36,408명에대한관계를시각화하기위해생성한에지를모두사용할경우, GraphML을구성하는정보가많아진다. 이는그래프시각화과정에서메모리부족으로인해프로그램이종료될수있으며, 사용자간의의미있는관계를나타내기어렵다. GraphML에저장하는정보를줄이면서사용자간의의미있는관계를추출하기위해서, 생성한에지가중치합과사용자의출현빈도를측정하였다. 측정값에서임의의 k개이하의에지나사용자에대하여데이터를제거하여, 사용자간의관계를분석해보았다. 이때, k개이하의에지와노드빈도수제거를나타내기위해각각, 로구분한다. 표 8은제거하는커뮤니티사용자등장빈도수에따라관계그래프변화량을나타낸것이다. 표 8에서등장빈도수를증가시킬수록걸러지는사용자는증가하였으나, 관계를나타내는에지감소량은크지않았다. 표 9는관계빈도에따른관계그래프변화량을나타낸것이다. 관계빈도수의변화에따른관계그래프형성사용자의수는변화하지않지만, 에지감소량이많은것을알수있다. 노드와에지에대한필터링이복합적으로적용될경우더욱의미있는관계그래프를얻을수있으므로다음과같은과정을거치면서관계그래프정보를가공한다. 첫째, 수집한게시물데이터를가공하여게시물및댓글작성자목록을생성및정렬한다. 가공된데이터에서나타난사용자빈도수를파악하여, 고유한작성자및나타낸횟수를저장하는사전을구축한다. 둘째, 구축한사전을이용하여일정횟수이하로등장한작성자를목록에서제거한다. 셋째, 각게시물에대해작성자목록에없는작성자를제거하거나연속으로등장하는작성자를한번만등장하도록수정한다. 필터링된사용자목록을활용하여에지생성규칙에따라게시물당에지를생성한다. 넷째, 모든게시물에대한에지정보를취합하고일정수치이하의가중치를가지는에지는제거한다. 취합한정보를활용하여그래프정보저장형식인 GraphML 파일을생성하고, 그래프시각화도구인 Gephi를활용하여연결망특성을분석한다. 표 8 에서 에따른관계그래프변화 Table 8 Change Network according to = 4 Node Edge Component Avg. Deg. Avg. Path Len. 1 36,408 140,718 30,871 3.87 2.923 5 27,936 140,709 22,406 5.04 2.922 10 23,891 140,683 18,377 5.89 2.918 50 14,929 140,466 9,542 9.41 2.887 100 11,554 140,133 6,333 12.13 2.846 1,000 2,486 126,616 37 50.93 2.331 표 9 에서 에따른관계그래프변화 Table 9 Change Network according to = 1000 Node Edge Component Avg. Deg. Avg. Path Len. 3 2,486 201,842 2 81.19 2.17 4 2,486 126,616 37 50.93 2.331 5 2,486 85,216 174 34.28 2.452 6 2,486 60,202 343 24.22 2.533 7 2,486 44,364 516 17.85 2.596 8 2,486 33,574 704 13.51 2.631 위와같은방법에의해사용자관계그래프를생성할경우아래그림 2와같은하나의커다란군집과제거된관계에의해생기는다수의개별적인사용자들이발생했다. 이는 MLBPark 커뮤니티에활동하는대다수가다양한분야에대해중복되게참여하는것으로보인다. 또한그림에서나타나는굵은에지가실제게시물에서발생하는사용자들의의사소통관계와유사한것을확인하였다. 5. 결론및향후연구방향 본논문에서는인터넷커뮤니티에작성된게시물과댓글정보를이용하여사용자관계그래프를나타낼수있는방안에대해알아보고자하였다. 에지생성방식에따라떨어져있는사용자와도관계가있는것을보장하므로의미있는관계를분석하는데도움이되었다. 하지만 MLBPark 커뮤니티의특성상한정되어있는사용자들이게시물에참여하기때문에노드나에지를아무리제거하더라도하나의큰그래프를형성하는것으로나타났다. 이는의사소통이빈번하게일어나는집단이하나임을뜻하며, 실제분야가다른글에대해서대다수의사람들이의견을공유하는것으로해석할수있다. 현재진행한연구에서는실제사용자에해당하는노드와에지정보를추출하기위해각각출현빈도수와가중치합을고려한다. 후추에는이러한지표이외에도
인터넷게시물을이용한온라인사용자사회구성망분석 173 그림 2 Gephi를이용한사용자관계그래프예시 : 전체노드수는 2,486개이며에지의수는 33,574이다. 노드의크기는사용자의연결차수와비례하도록설정하였다. 그림에서가운데보라색노드는연결차수가가장큰사용자를나타내고있다. Fig. 2 An Example of Social Network with 3,486 nodes, 33,574 edges, which is visualized by Gephi. The size of node circle is proportional to the node degree. The center purple circle denotes the maximum degree. 사용자연결그래프의시각화에사용되는요소에대한연구가필요하다. 또한현재하나의커뮤니티를대상으로연결망구축및특성분석을시행하고있기때문에, 표본사이트를선정하여다른사이트에서나타나는현재분석하고있는 MLBPark와유사한지검증한다. 향후연구로는이러한사회연결망특성을웹에서쉽게확인할수있는시스템을개발한다. 이때, 현재연구되고있는관계망시각화문제에서나온제시하는시각화알고리즘을활용하여육안으로도알아보기쉬운연결망을시각화하는방법을연구한다 [6,7]. References [4] E. Bakshy, I. Rosenn, C. Marlow, and L. Adamic, "The role of social networks in information diffusion," Proc. of ACM World Wide Web, pp.519-528, 2012. [5] Y.J. Lee, I.J. Jung, and G. Woo, "Extracting and Visualizing Dispute comments and Relations on Internet Forum Site," Journal of the Korea Contents Association, vol.12, no.2, pp.40-51, 2012. [6] J.F. Rodrigues, et al., "Large graph analysis in the gmine system," Journal of Knowledge and Data Engineering, vol.25, no.1, pp.106-118, 2013. [7] S. Jie. Luo, C.L. Liu, B.Y. Chen, and K.L. Ma, "Ambiguity-free edge-bundling for interactive graph visualization," Journal of Visualization and Computer Graphics, vol.18, no.5, pp.810-821, 2012. [8] B. Mathieu, H. Sebastien, and J. Mathieu, "Gephi: An open source software for exploring and manipulating networks," Proc. of AAAI Conference on Weblogs and Social Media, pp.361-362, 2009. [9] A.L. Traud, J.M. Peter, and A.P. Mason, "Social structure of Facebook networks," Physica A: Statistical Mechanics and its Applications, vol.391, no.16, pp.4165-4180, 2012. [10] J. Heer, and D. Boyd. "Vizster: Visualizing online social networks," Information Visualization, IEEE Symposium on. IEEE, pp.32-39, 2005. 탁해성 2013 년부산대학교정보컴퓨터공학부 ( 공학사 ). 2013 년 ~ 현재부산대학교전자전기컴퓨터공학과석사과정. 관심분야는정보검색, 소셜네트워크, 데이터마이닝 조환규 1984년서울대학교계산통계학과 ( 이학사 ) 1986년 KAIST 대학원전산학과 ( 공학석사 ). 1990년 KAIST 대학원전산학과 ( 공학박사 ). 1990년~현재부산대학교정보컴퓨터공학부교수. 관심분야는알고리즘, 응용그래프이론, 생물정보학 [1] H. Kwak, C. Lee, H. Park, and S. Moon, "What is twitter, a social network or a news media?," Proc. of ACM World Wide Web, pp.591-600, 2010. [2] K. Zhongbao and Z. Changshui, "Reply networks on a bulletin board system," Phys. Rev. E, vol.67, no.3, p.036117, 2003. [3] M. Sachan, D. Contractor, T. A. Faruquie, and L. V. Subramaniam, "Using content and interactions for discovering communities in social networks," Proc. of ACM World Wide Web, pp.331-340, 2012.