1 / 10 사이람은약 200여개의내부알고리즘을보유하고이를구현하여제품화및프로젝트에활용하고있습니다. 네트워크 분석알고리즘 146 개 통계기반 분석알고리즘 26 개 기계학습 알고리즘 21 개 Domain Specific 알고리즘 5개 이중사이람이다양한분야의프로젝트에서가장활발하게활용하고있는알고리즘및향후여러분야에서활용될수있을것이라전망하는알고리즘을선정하여소개합니다. 구분 알고리즘명 주요내용 활용분야 네트워크분석 Social Central 개체의영향력및중심성분석 전분야 알고리즘 군집분석 끼리끼리뭉친그룹판별 전분야 Link Prediction 생성될가능성이높은링크예측 전분야 Cascading Behavior 전염병및정보확산구조분석 전분야 네트워크분석 Social SVD 이용자및상품추천 고객분석 응용 의견성향판별 찬반및지지성향분석 소셜미디어분석 알고리즘 Expert Finding 분야별전문가분석 지식네트워크 Emerging Topic Detection 급상승이슈분석 소셜미디어분석
2 / 10 목차 1. 네트워크분석알고리즘 1-1. Social Central 1-2. 군집그룹분석 1-3. Link Prediction 1-4. Cascading Behavior 분석 2. 네트워크분석응용알고리즘 2-1. Social SVD 2-2. 의견성향판별 2-3. Expert finding 2-4. Emerging Topic Detection
3 / 10 1. 네트워크분석알고리즘 1-1. Social Central 네트워크구조에서가장중심이되는인물, 사이트, 혹은특정 object를추출하는알고리즘입니다. 사이람은 중심성 의의미와측정방식에따라다양한알고리즘을보유및개발하고있으며, 그종류만 20여가지에달합니다. 동일한네트워크라할지라도활용목적에따라, 국소적구조관점의중심성을분석할수도있고, 전역적구조관점의중심성을분석할할수도있습니다. 중심성분석알고리즘은교우관계에서중심이되는학생, 소셜미디어에서서핵심이되는인물, 학계네트워크에서대표성을가진저자, 기업네트워크에서영향력있는기업, 조직네트워크에서가장많은지식을보유하고전파하는중심인물등을파악하는데활용되고있습니다. 여러분야에서중심성분석을적용하여축적된사이람의경험과노하우를기반으로의미있는결과를산출할수있습니다. [Social Central] 1-2. 군집그룹분석 군집그룹분석이란, 네트워크내형성되어있는끼리끼리뭉쳐있는그룹을파악하는분석방법입니다. 군집그룹분석알고리즘의종류는파악하고자하는그룹의특징과의미에따라굉장히다양합니다. 단, 군집그룹분석은분석의특징상알고리즘복잡도가가매우높은편입니다. 하지만사이람은빅데이터에서도빠른시간내에효율적으로분석할수있도록특화된알고리즘을보유하고있습니다.
4 / 10 네트워크군집분석에서가장많이활용하는분석중의하나인컴퍼넌트트분석은약한연결의컴퍼넌트 (Weak Component) 와강한연결의컴퍼넌트 (Strong Component) 로구분할수있는데, 강한연결의컴퍼넌트를파악하는분석은복잡도가높은편입니다다. 그래서사이람은사이람은강한연결의컴퍼넌트을가장빠르게수행할수있는알고리즘을을연구개발하여사용하고있습니다. [Strong Component algorithm process] 커뮤니티분석또한가장활발하게활용되고있는군집분석방법중의하나입니다. 커뮤니티분석은즉같은커뮤니티내연결관계는최대화하고, 다른커뮤니티간연결은최소화하는연결을갖는그룹을찾아내는분석입니다. 커뮤니티분석역시시간복잡도가높기때문에가장최적의결과를가장최소의시간으로수행할수있는알고리즘을채택하여사용하고있습니다. 해당알고리즘은특히큰사이즈의네트워크에대해서도상당히빠르게수행되며, 타알고리즘에비해더높은 modularity를제공합니다.
5 / 10 1-3. Link Prediction 관계예측분석알고리즘이란, 현재네트워크에서 Missing link를파악하거나, 미래에생성될가능성이높은링크를찾는알고리즘입니다. 예를들어논문공저자네트워크에서 Link Prediction을통해앞으로어떤사람과어떤사람이공저를하게될지를예측할수있으며, 이를좀더확장하여, 어떤기술과기술이접목되어새로운기술이생성되게게되는경향에대해서미리예측해볼수도있습니다. 생물학네트워크등에활용하게된다면, 단백질간의상호작용에대한좀더근본적인원인을이해하는데도움을줄수있습니다. 사이람은네트워크의가중치와방향성을모두고려하여관계예측분석알고리즘을적용하고있습니다. 또한네트워크의 local topology와 global topology를모두고려하여링크를예측하여정확도를향상시켰습니다. 단 Global topology를고려해예측할때시간복잡도가매우높아질수있기때문에, 검색범위 (Global topology의범위 ) 를동시에에고려해빠른시간내에문제를해결할수있도록고안되었습니다. [Link Prediction을위한 RSS measure]
6 / 10 1-4. Cascading Behavior 분석 정보의전파또는전염병의확산등에대한진행과정의특징을파악할수있는알고리즘입니다. 예를들어특정지역에서전염병이발생했을때, 해당전염병이어느느지역까지지확산될것인지, 전체적인확산에가장영향을주는지역은어디인지등을파악할수있습니다. 분석의정확도가높을수록알고리즘의시간복잡도가매우높은편인데데, 사이람은이러한문제를해결하기위하여, 정확도가가장높은 basic 알고리즘부터정확도는는낮아지지만속도가가장빠른 greedy알고리즘과, 이를적절하게혼합한 Branchh & Boundd 알고리즘등을다양하게보유하고있어목적에따라활용하고있습니다. 특히본알고리즘은은네트워크가중치와방향이모두고려되는전파모형이기때문에, 질병전파뿐만아니라, 운송지점최적화문제등다양한분야에활용될수있습니다. [ 단계별전파 과정 ]
7 / 10 2. 네트워크분석응용알고리즘 2-1. Social SVD Social SVD는기존의 SVD 알고리즘에사이람이 Social Network 데이터를를결합하여독창적으로고안한분석알고리즘입니다. 일반적인추천시스템은대부분이용자들이남긴상품추천행위데이터만을활용한추천알고리즘을사용합니다. 하지만기존의이용자-상품간데이터뿐만아니라, 이용자와이용자간관계데이터를함께고려하여추천을한다면, 추천정합성을훨씬더향상시킬수있습니다. Social SVD는기존 SVD와달리더다양한유형의데이터를고려하여추천의정합성을높인알고리즘입니다. [ 이용자 -상품, 이용자-이용자의데이터를 통한분석 알고리즘프로세스 ] 2-2. 의견성향판별 소셜미디어에나타난사람들의의견또는성향을파악하기위해기존에는주로텍스트마이닝에의존해왔습니다. 하지만소셜미디어데이터는맞춤법, 띄어쓰기, 신조어등노이즈가많아텍스트마이닝을적용하는데한계가많습니다. 하지만소셜데이터의특성에중요한요소인사람들간의관계데이터를를함께고려하면, 기존의사람의의견또는성향을좀더정확하게파악할수있는중요한단서가될수있습니다. 사이람의의견성향판별알고리즘은이러한관계데이터를기반으로하여의견에중심에있는소수의성향을파악하여, 관계데이터구조를활용하여다수의성향을예측하는분석알고리즘입니다. 해당분석알고리즘을이용한대표적인사례는소셜미디어이용자들의지지후보예측입니다. 기존후보이름과긍정어 / 부정어비율로판단하는 1차원적인분석을탈피하여, 기본적인성향을텍스트기반으로분석하되, 좀더명확한의견파악을위해사람들간의의관계구조를이용하여, 이사람은어떤후보를지지하고있는지를좀더정확하고정교하게파악할수있는분석방법입니다.
8 / 10 [ 의견전파 / 확산프로세스 ] 2-3. Expert finding 사이람에서자체개발한 Expert Finding 알고리즘은특정텍스트데이터를분석해해당분야의전문가를찾아내는알고리즘입니다. 특히텍스트데이터에내재되어있는관계데이터를활용해보다정교하게해당분야의전문가를찾아냅니다. 사이람의 Expert Finding알고리즘은 Hybrid Expert Findingg 방식의알고리즘을사용하고있습니다. 이는두가지의모델을혼합한방식으로, 텍스트기반으로사용자의전문분야를구분해주는역할을하는모델과, 전문가가될수있는후보의관계를통한 authority( 권위 ) 를측정함으로써특정분야의전문가로판단되는사람을완벽하게찾아주는알고리즘입니다. 해당알고리즘을활용해, 논문데이터에서각분야의저명한저자를찾는는것은물론, e-mail 이나웹페이지데이터에서특정토픽에대한전문가를찾을수있습니다. 특히최근에는소셜미디어상의전문가를찾는데많이활용되고있으며, 그외텍스트데이터와관계데이터가포함된어떤데이터에서든활용가능합니다. [Hybrid expert finding 알고리즘 : 전문가의분야관련성모델 + 전문가의전문성 모델 ]
9 / 10 [ 단어기반의전문 토픽분류 ] [ 전문가연결관계에의한전문성파악 ] 2-4. Emerging Topic Detection Emerging Topic Detection 이란특정시간동안축적된텍스트컨텐츠로부터급작스럽게떠오르고있는토픽을탐지하고, 해당토픽의연관키워드네트워크를동시에추출하여, 원하는기간및날짜에따라어떤주요한토픽이있었는지를쉽게파악할수있는알고리즘입니다. Emerging Topic Detection 알고리즘을수행하기위해서는해당텍스트데이터의형태소분석이필요합니다. 텍스트데이터처리후, 각단어에대한에너지값및단어간상관관계등을
10 / 10 측정하여, 에너지가가장급격하게상승하는키워드네트워크를 Emerging Topic으로추출합니다. 해당분석은소셜미디어및컨텐츠가매일생성되는사이트에적용이가능하며, 최대한빠른시간에수행할수있도록적절하게다양한파라미터를조정할수있습니다. [ Emerging Topic Detection measure]
www. cyr am. com Emai l.mkt @cyr am. com Tel. 02-886-6077 Fax. 02-886-6104