03( ) CPL12-17.hwp

Similar documents
09구자용(489~500)

강의지침서 작성 양식

À±½Â¿í Ãâ·Â

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석

09오충원(613~623)

°í¼®ÁÖ Ãâ·Â


지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

위해 사용된 기법에 대해 소개하고자 한다. 시각화와 자료구조를 동시에 활용하는 프로그램이 가지는 한계와 이를 극복하기 위한 시도들을 살펴봄으로서 소셜네트워크의 분석을 위한 접근 방안을 고찰해 보고자 한다. 2장에서는 실험에 사용된 인터넷 커뮤니티인 MLBPark 게시판

I

05( ) CPLV12-04.hwp

DBPIA-NURIMEDIA

08SW

정보기술응용학회 발표

<333820B1E8C8AFBFEB2D5A B8A620C0CCBFEBC7D120BDC7BFDC20C0A7C4A1C3DFC1A42E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

±è¼ºÃ¶ Ãâ·Â-1

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

Output file

Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ

< FBEC8B3BBB9AE2E6169>

DBPIA-NURIMEDIA

무선데이터_요금제의_가격차별화에_관한_연구v4.hwp

[ReadyToCameral]RUF¹öÆÛ(CSTA02-29).hwp

09한성희.hwp

소셜네트워크분석을활용한추천시스템의정확도 개선에관한연구 A Study on Improving Accuracy of Recommender Systems using Social Network Analysis 1) 목차 Ⅰ. 서론 Ⅱ. 이론적배경 Ⅲ. 제안알고리즘 Ⅳ. 실증분

09권오설_ok.hwp

김기남_ATDC2016_160620_[키노트].key

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

Microsoft PowerPoint - XP Style

大学4年生の正社員内定要因に関する実証分析

Output file

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

2017 년 6 월한국소프트웨어감정평가학회논문지제 13 권제 1 호 Abstract

정진명 남재원 떠오르고 있다. 배달앱서비스는 소비자가 배달 앱서비스를 이용하여 배달음식점을 찾고 음식 을 주문하며, 대금을 결제까지 할 수 있는 서비 스를 말한다. 배달앱서비스는 간편한 음식 주문 과 바로결제 서비스를 바탕으로 전 연령층에서 빠르게 보급되고 있는 반면,

08원재호( )

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

Journal of Educational Innovation Research 2016, Vol. 26, No. 1, pp.1-19 DOI: *,..,,,.,.,,,,.,,,,, ( )

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

- 1 -

<B9CCB5F0BEEEB0E6C1A6BFCDB9AEC8AD5F31322D32C8A35FBABBB9AE5FC3CAC6C731BCE25F6F6B5F E687770>

2015

6.24-9년 6월

<33312D312D313220C0CCC7D1C1F820BFB0C3A2BCB12E687770>

ÀÌÀç¿ë Ãâ·Â

Portal_9iAS.ppt [읽기 전용]

09È«¼®¿µ 5~152s

À¯Çõ Ãâ·Â

45-51 ¹Ú¼ø¸¸

19_9_767.hwp

<332EC0E5B3B2B0E62E687770>

<C1F6B8AEC1A4BAB82DC3D6C1BEC0CEBCE E687770>

10 이지훈KICS hwp

REP - CP - 016, N OVEMBER 사진 요약 25 가지 색상 Surf 를 이용한 사진 요약과 사진 배치 알고리즘 Photo Summarization - Representative Photo Selection based on 25 Color Hi

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Analysis of


232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

3. 클라우드 컴퓨팅 상호 운용성 기반의 서비스 평가 방법론 개발.hwp

<3136C1FD31C8A35FC3D6BCBAC8A3BFDC5F706466BAAFC8AFBFE4C3BB2E687770>

½½¶óÀ̵å Á¦¸ñ ¾øÀ½

38이성식,안상락.hwp

½Éº´È¿ Ãâ·Â

Voice Portal using Oracle 9i AS Wireless

<32382DC3BBB0A2C0E5BED6C0DA2E687770>

06_ÀÌÀçÈÆ¿Ü0926

PowerPoint 프레젠테이션

20(53?)_???_O2O(Online to Offline)??? ???? ??.hwp

임베디드시스템설계강의자료 6 system call 2/2 (2014 년도 1 학기 ) 김영진 아주대학교전자공학과

07.045~051(D04_신상욱).fm

<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

example code are examined in this stage The low pressure pressurizer reactor trip module of the Plant Protection System was programmed as subject for

Model Investor MANDO Portal Site People Customer BIS Supplier C R M PLM ERP MES HRIS S C M KMS Web -Based

<B1E2C8B9BEC828BFCFBCBAC1F7C0FC29322E687770>

07변성우_ok.hwp

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

04서종철fig.6(121~131)ok

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: A Study on Organizi

<372E20B9DAC0B1C8F12DB0E62E687770>

1. 서론 1-1 연구 배경과 목적 1-2 연구 방법과 범위 2. 클라우드 게임 서비스 2-1 클라우드 게임 서비스의 정의 2-2 클라우드 게임 서비스의 특징 2-3 클라우드 게임 서비스의 시장 현황 2-4 클라우드 게임 서비스 사례 연구 2-5 클라우드 게임 서비스에

<31325FB1E8B0E6BCBA2E687770>

¨ë Áö¸®ÇÐȸÁö-¼Û°æ¾ðOK

서현수

DBPIA-NURIMEDIA

SchoolNet튜토리얼.PDF

#유한표지F

UPMLOPEKAUWE.hwp

untitled

슬라이드 1

<353020B9DAC3E1BDC42DC5ACB6F3BFECB5E520C4C4C7BBC6C3BFA1BCADC0C720BAB8BEC820B0EDB7C1BBE7C7D7BFA120B0FCC7D120BFACB1B82E687770>

디지털포렌식학회 논문양식

목순 차서 v KM의 현황 v Web2.0 의 개념 v Web2.0의 도입 사례 v Web2.0의 KM 적용방안 v 고려사항 1/29

우리들이 일반적으로 기호

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., -

(JBE Vol. 23, No. 1, January 2018) (Special Paper) 23 1, (JBE Vol. 23, No. 1, January 2018) ISSN 2287-

DBPIA-NURIMEDIA

Special Theme _ 모바일웹과 스마트폰 본 고에서는 모바일웹에서의 단말 API인 W3C DAP (Device API and Policy) 의 표준 개발 현황에 대해서 살펴보고 관 련하여 개발 중인 사례를 통하여 이해를 돕고자 한다. 2. 웹 애플리케이션과 네이

#Ȳ¿ë¼®

Transcription:

쿼드트리를이용한위치기반협업필터링추천시스템 15 쿼드트리를이용한위치기반협업필터링추천시스템 (A Location-based Collaborative Filtering Recommender using Quadtree) 신홍철 조성배 (Hongchol Shin) (Sung-Bae Cho) 요약최근위치기반서비스 (Location-based Service; LBS) 와사회망서비스 (Social Networking Service; SNS) 의사용이증가함에따라, LBS 와 SNS 가결합되어위치기반사회망 (Location based Social Networks; LBSNS) 이라는새로운서비스가등장하였다. LBSNS 를기반으로공간적으로유사한사용자간의콘텐츠추천에대한연구가활발히진행되었고그중에그리드색인을적용하여사용자간의공간적유사도를계산하는기술이소개되었다. 그러나그리드색인은인구밀도가높은시내중심가지역과낮은시외지역에서사용자의위치로그를같은크기로클러스터링하는문제가노출되었다. 본논문에서는유동인구의밀도에따라가변적으로클러스터링할수있는쿼드트리를적용한추천시스템을제안하여그리드색인을적용한추천시스템보다정확도와성능을개선하였다. 제안한방법의성능을검증하기위해사용자가맛집을추천하거나평가하는 A 사의실제서비스에서 7,756 명의사용자, 112,926 개의맛집평가데이터, 1,136 개의맛집데이터를사용하였다. 기존의그리드색인뿐아니라 R- 트리를적용한방법과비교분석한결과, 제안한방법이효과적임을입증하였다. 키워드 : 추천시스템, 협력적필터링, 공간색인, 위치기반서비스 Abstract With increasing usage of location based services and social networking services, a new type of service that serves as a combination of the aforementioned services emerged: location based social networking service. Based on LBSNS, various researches regarding content recommendation for users in spatial proximity are widely being undertaken. Among them included calculation methods of inter-user spatial proximity using grid indices. However, grid indexing has shown problems of clustering densely populated urban areas and spaciously populated suburban areas with the same size. In this paper, we suggest a recommendation method using quad-tree to variably cluster based on population density and have improved upon the grid indexing system in accuracy and performance. To verify this paper's assertions, we have also compared R-trees as well as grid indices to compare and contrast with our system and we have successfully determined that our system performs better. Key words : recommendation system, collaborative filtering, spatial indexing, quad-tree, location based service 본연구는 2010년도정부 ( 교육과학기술부 ) 의재원으로한국연구재단뇌과학원천기술개발사업의지원을받아수행된연구임 (2010-0018948) 정회원 : 연세대학교컴퓨터공학과 redfe01@naver.com 종신회원 : 연세대학교컴퓨터과학과교수 sbcho@cs.yonsei.ac.kr (Corresponding author임 ) 논문접수 : 2012년 8월 13일심사완료 : 2012년 11월 9일 CopyrightC2013 한국정보과학회 ː개인목적이나교육목적인경우, 이저작물의전체또는일부에대한복사본혹은디지털사본의제작을허가합니다. 이때, 사본은상업적수단으로사용할수없으며첫페이지에본문구와출처를반드시명시해야합니다. 이외의목적으로복제, 배포, 출판, 전송등모든유형의사용행위를하는경우에대하여는사전에허가를얻고비용을지불해야합니다. 정보과학회논문지 : 컴퓨팅의실제및레터제19권제1호 (2013.1) 1. 서론모바일기기와무선네트워크및위치측위기술이발전함에따라위치기반서비스가점차증가하는추세이다. 한편웹 2.0 기술이도래하면서사회망서비스는몇년동안폭넓게사용되었고사회망사이트에서사용자는자신의사진과동영상및유용한링크정보를친구와쉽게공유할수있게되었다. 최근위치기반서비스와사회망서비스가결합하여위치기반사회망 (Location based Social Networks; LBSNS) 이라는새로운서비스가만들어졌다 [1-4].

16 정보과학회논문지 : 컴퓨팅의실제및레터제 19 권제 1 호 (2013.1) LBSNS는사용자가경험한위치기반콘텐츠 ( 상점, 영화관, 공원, 음식점등 ) 를평가하고리뷰를작성하는기능과개인의동의를얻어사용자위치정보를친구에게공개하는기능을제공한다. 모든사용자의관계, 아이템에대한평가및리뷰형태의정보는자신과유사한프로필을가진사용자를찾아새로운위치기반콘텐츠를추천하는기회를제공한다. 추천시스템은급격히증가되는방대한콘텐츠중에서필요한정보를필터링하는기술로널리사용되고있다. 예로 amazon.com은특정사용자가미리구입했거나경험해봤던새로운제품을추천해준다 [5]. 이러한서비스는사용자가콘텐츠를평가하고리뷰했던내용을시스템에기록하여사용자취향을분석한후의미있는정보를제공한다. 추천시스템의관련문헌들에서다양한기술이소개되었는데이중에서협업필터링 (collaborative filtering) 은사용자가경험해보지않은여러콘텐츠에대한선호도를예측하여사용자에게제안하는방법이다. 일반적인추천시스템의문제로사람들은대체로자신이활동하는영역에서가까이있는콘텐츠를선호하기때문에먼곳에있는콘텐츠는유용하지않은것이될가능성이있다 [1]. 최근추천시스템관련연구중이러한문제를해결하기위해그리드색인을적용하여사용자간의공간적유사도를계산하는기술이소개되었다 [1]. 그리드색인은 2 차원공간에고정된크기의격자형태로구성하고 [6], 각셀안에포함된사용자들의위치로그를저장하여사용자간에위치로그가포함된셀이동일할경우공간적으로유사하다고판단하였다. 하지만그리드색인은다음과같은문제가발생하였다. 시내중심가와시외지역은사용자위치로그의밀도와사용자활동반경에차이가있어고정된크기의격자형태로사용자위치로그를클러스터링하면시내지역에서는사용자간의유사도가높아질수있지만시외에서는같은지구에살고있지만격자크기가작을경우유사도가낮아질수있다. 본논문에서는이러한문제를해결하기위해쿼드트리를적용하여공간적유사도를계산하는방법을제안한다. 그리고쿼드트리성능을비교하기위해 R-트리를적용하였으나 R-트리는단말노드간의겹침현상 [6-8] 과사용자위치로그가서로다른노드에포함되는현상으로인해유사도의신뢰도가낮았다. 쿼드트리는그리드의단점과 R-트리의단점 [6,9,10] 을보완하여위치기반의협업적필터링추천시스템에서공간적유사도를계산하기적합한방법이다. 본논문은다음과같이구성된다. 1장은연구배경및목적을소개한다. 2장에서는기존에연구된위치기반추 천시스템의방법과문제를논의하고, 협업적필터링을활용한추천과공간색인연구를소개한다. 3장에서는본논문에서제안하는방법인쿼드트리를적용한추천알고리듬을소개한다. 4장에서는실험데이터와방법및환경에대해소개를하고, 실험결과를분석한다. 그리고 5장에서는결론과함께향후연구과제에대해서논의한다. 2. 관련연구 2.1 LBS 연구동향 LBS는사람및사물등객체의위치정보를이용하여특정한용도로사용한다. LBS를기능적으로구분하면사람이나사물등의위치를측위하는위치추척시스템, 위치정보를서버나다른사용자에게전송하기위한무선네트워크 (communication network system), 지리정보를제공하는지리정보시스템 (geographic information system) 으로나뉜다. 초기군사용으로개발된 LBS는공공부문에서널리활용되었으며, 물류차량등을추적하는 B2B 산업분야에널리사용되었다. 이후 GPS 단말기가격의하락과위치측위의정확도가높아지고, 무선인터넷의발달과스마트폰이대량으로보급되어 B2C 기반의 LBS 어플리케이션들이증가되었다. 최근사회망서비스가활성화되면서 LBSNS라는신규서비스가등장하였다 [1-4]. LBSNS 서비스에중점을둔연구중에서추천시스템적용과관련된연구를살펴보면, 베이지안네트워크를이용하여개인사용자모델링을통한콘텐츠추천서비스를제공하고자했던연구 [5], 사용자의현재위치를파악하여해당지역의날씨정보와사용자프로파일등을분석하여사용자가선호할것이라판단되는음식점을추천하고자했던연구 [11], 사용자관심영역 (Point of Interest; POI) 설정에기반한위치추천방법에관한연구등이있다 [12]. 2.2 추천시스템에대한연구추천시스템은기하급수적으로증가하는방대한양의콘텐츠를사용자기호에알맞게필터링하여선호도가높을것같은콘텐츠를제안하는시스템으로사용자들에게아이템을찾는시간을줄일수있도록도와준다. 전통적인추천시스템은규칙기반 (rule based) 의추천방법으로사용자선호도에대한정보를기반으로콘텐츠를추천하는방법이고 1990 년이후크게내용기반추천방법 (contents based recommendation) 과협업필터링추천방법으로나뉜다 [13]. 본논문에서는협업필터링추천방법을적용하였다. 이방법은모델기반 (model based) 과이웃기반방법 (neighbor based) 으로나뉘는데모델기반방법은훈련

쿼드트리를이용한위치기반협업필터링추천시스템 17 데이터를이용하여모델을만들고선호도를예측한다 [16]. 이러한방법은훈련데이터를가지고학습시간이별도로필요하며많은실험적매개변수를결정해야하며데이터의특성에따라다른매개변수를설정해야하는단점이있다. 이웃기반모델방법 (neighbor based) 은메모리기반방법 (memory based) 이라고도불리우며사용자기반협동필터링 (user based filtering) 과아이템기반의협동적필터링 (item based filtering) 이있으며예측속도가빠르며선호도데이터를즉시반영할수있는장점이있다. 하지만사용자와아이템수가많아지면예측시간이증가하고선호도데이터가적으면예측에대한신뢰도가낮아지게되는희소성문제가발생하게된다 [13]. 이러한희소성문제를해결하기위해서 conceptnet을활용하여감정벡터를추출하고장르별로분류하는방법을결합한새로운형태의추천방법이소개되었다 [17]. 2.3 사용자기반공간적유사도관련연구사용자는주로 사용자활동영역 ( 집, 회사혹은학교주변과같은평소에주로다니는영역 ) 안에서이동하므로활동영역에서먼곳에위치한아이템을추천할경우신뢰가낮아질가능성이있다 [1-3]. 이러한가능성을고려해서활동영역이유사한사용자를 1단계로필터링하여후보집합을만들고후보집합에서사용자평가로그를분석하여콘텐츠에대한선호도를예측할수있다. 최근위치기반추천시스템연구중에공간적유사도를계산하기위해서그리드색인을적용한연구가소개되었다 [1]. 이러한연구는그림 1과같이 2차원공간상에사용자 a, b, c의사용자활동로그를각그리드셀에저장한다. 이와같이사용자로그가저장된셀을최근접이웃 (neighborhood) 이라부른다. 최근접이웃 을구성하는방법은표 1과같이각셀에사용자가방문한횟수를기록한다. 이와같이만들어진방문횟수데이터를가지고사용자별각셀의아이디와해당하는셀에방문한횟수를리스트형태로저장하여최근접이웃을구성한다. 이렇게구성된최근접이웃은사용자간에활동패턴을분석하여공간적유사도를계산할수있다. cos (1) 식 (1) 은사용자 U 와사용자 I 간의공간적유사도를계산하는코사인유사도식이다. 아래식 (2) 는공간적유사도가높은사용자를추출하기위한 후보집합 으로사용자간의공간적유사도를계산하고임계수치 T 보다큰유사도를가진사용자를후보집합에추가한다. 임계수치 T 는 0 에서 1 사이의값을사용한다. (2) 그림 1 사용자활동로그를그리드색인으로구성표 1 그리드색인방식의최근접이웃구성 C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 a 1 1 1 2 1 1 b 1 1 2 1 c 1 1 2 1

18 정보과학회논문지 : 컴퓨팅의실제및레터제 19 권제 1 호 (2013.1) 3. 제안하는위치기반협업필터링 이전그리드색인을이용한연구방법은 2장에그림 1 과같이사용자위치로그와콘텐츠를저장할때고정된크기의셀에데이터가저장되기때문에공간적으로데이터의분포가균일하지않으면비어있는셀이많아지거나데이터가몰려있는가능성이있어공간적효율성과검색성능이떨어질수있다. 이러한문제점을보완하기위해본논문에서는쿼드트리를적용한공간적유사도를분석하는방법에대해소개한다 3.1 쿼드트리기반공간적유사도방법쿼드트리를이용한사용자간의공간적유사도를측정하는방식은그리드색인과유사한방식이지만데이터분포한밀도에따라셀크기를가변적으로구성할수있어공간효율성이좋다 [6]. 아래그림 2는쿼드트리를이용해서 2차원공간상에사용자 a, b, c의활동로그를저장한그림이다. 쿼드트리를이용한최근접이웃을구성하는방법은알고리듬 (1) 을이용하여 2.3장의집합과같이구성한다. 알고리듬 (1) 은쿼드트리의자식노드를이용해서최근접이웃을구성하는함수이다. 줄 2에 UserLogBuffer는자식노드에포함되어있는사용자들의활동로그를저장할리스트변수이다. 줄 3,5는함수의인수로전달된사용자활동로그의개수가 MIN 값보다작을경우최근접이웃집합에추가하고작업을끝낸다. 줄 6~9번은사용자활동로그의위치가해당하는자식노드범위안에포함되었는가를검사하여포함되었으면포함된자식노드의사용자활동로그버퍼에추가한다. 줄 10~13번은위에서처리된사용자활동로그버퍼에사용자활동로그가 MAX 보다클경우자식노드를생성하고각자식노드에해당하는 UserLog- Buffer[i] 를 AddUserHistory 에인수로전달하여줄 3,5 번이수행될때까지반복적으로재귀호출하는방법으로수행한다. 이와같이쿼드트리를이용하여사용자활동로그의밀도에따라가변적인분포로최근접이웃을구성할수있다. 알고리듬 (1) 을이용해서최근접이웃이구성되었다면 2.3장에서의식 (1) 을이용하여사용자 U 와사용자 I 간의공간적유사도를계산할수있다. 그리고각사용자간의공간적유사도를비교해서식 (2) 와같이임계수치 T 보다큰유사도를가진사용자를필터링하여 후보집합 으로구성한다. 그림 2 사용자활동로그를쿼드트리로구성 알고리듬 1. 쿼드트리를이용한최근접이웃생성 1. Node::AddUserHistory(List UserLog) 2. List UserLogBuffer[4] 3. if IsLeaf && sizoeof(userlog) < MIN 4. Neighborhood..Add(P) 5. return 6. for k = 1 to sizeof(userlog) do 7. for i = 1 to i <= 4 do 8. if ChildNode[i].IsContain(UserLog[k]) 9. UserLogBuffer[i].Add(UserLog[k]) 10. for i = 1 to i <= 4 do 11. if sizeof(userlogbuffer[i]) > MAX 12. ChildNode[i].CreateNode 13. ChildNode[i].Add_UserHistory (UserLogBuffer[i]) 3.2 공간적유사도기반에협업적필터링방법 3.1장에서는사용자의활동영역을분석하여각사용자별유사도가높은후보집합 C를구성하였다. 이번장에서는사용자기반에협업적필터링방법과 3.1장에서구성한후보집합 C를가지고사용자가선호도를평가하지않은아이템에대한선호도를예측하는방법에대해설명한다 [1]. (3) 표 2 쿼드트리방식의최근접이웃구성 C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 a 1 2 1 1 1 1 b 3 1 2 c 1 1 2 1 1

쿼드트리를이용한위치기반협업필터링추천시스템 19 식 (3) 은사용자가경험하지않은아이템에대한예측선호도를계산하는방법으로 은사용자 k 가아이템 m 에대해예측한선호도이다. 는사용자 k 가아이템에선호도를평가한평균이고, 는사용자 a 가아이템에선호도를평가한평균이다. 는 3.2장에서구성된사용자후보집합이다. 은사용자 a 가아이템 m 에대한선호도점수이고 는사용자 k 와최근접이웃사용자 a와의유사도로아래식 (4) 에서설명한다 [1]. (4) 식 (4) 는식 (3) 의 를계산하는식으로 m 은사용자 k 가평가한아이템개수이다, 는사용자 k 가아이템 j 에대해선호도를평가한점수이고 는사용자 k 가평가한아이템선호도를평균한값이다. 는사용자 a 가평가한아이템선호도점수를평균한값이다. 는사용자 k 가평가한아이템선호도에대한표준편차이고 는사용자 a 가평가한아이템의선호도에대한표준편차이다 [1]. 3.3 쿼드트리를적용한아이템선호도예측프로세스이번장은 3.1장의쿼드트리를적용한공간적유사도방법과 3.2장의사용자기반의협업적필터링을연계하여공간적으로유사한사용자간의경험하지않은아이템에대한선호도를예측하는프로세스전체를설명한다. ( 가 ) 3.1장에서와같이쿼드트리를이용한알고리듬 (1) 을가지고최근접이웃을구성한다. ( 나 ) 최근접이웃을가지고사용자간의공간적유사도를계산하여유사도의임계수치보다높은사용자후보집합을구성한다. 식 (2) 참조. ( 다 ) 사용자후보집합을가지고협업적필터링방법인식 (3) 과같이사용자가경험하지않은아이템에대한선호도를예측할수있다. 3.4 R-트리기반공간적유사도방법이번장은쿼드트리의성능을비교하기위해서공간데이터를가변적인크기로클러스터링할수있는 R-트리를적용하여공간적유사도를계산하는방법을설명한다. R-트리는균형트리의특성상사용자위치로그의밀 그림 3 사용자활동로그를 R-트리로구성도에따라검색성능의차이가동일하기때문에쿼드트리의단점을보완할수있다 [6,8]. 아래그림 3과같이 2 차원공간상에사용자 a, b, c의활동로그를 R-트리를이용해서저장한다. R-트리데이터구조에리프노드는최근접이웃이라부른다. 최근접이웃을구성하는방법은아래표 3과같이각노드에사용자가방문한횟수를기록한다. 4. 실험및결과 4.1 실험환경및데이터실험환경은인텔듀얼코어 2.53GHz 프로세서와 4 GB 메모리의윈도우7 운영체제의비쥬얼스튜디오 2005 환경에서실험하였다. 실험데이터는사용자가맛집을추천하거나평가하는 A 서비스의데이터를사용하였고데이터구성으로는사용자데이터와맛집데이터그리고맛집평가데이터로구성되어총 7,756명의사용자와총 112,926 개의맛집평가데이터, 그리고총 1,136 개의맛집데이터로구성되었고, 사용자가방문한체크인데이터로총 112,929 개의위치로그로구성되었다. 실험데이터는 A 사와보안서약을하여공개할수없음을명시한다. 4.2 실험방법본실험의성능평가방법은총 3가지로첫번째후보집합의개수를변경하면서 3가지의공간색인알고리듬이아이템에대한예측선호도의성능변화를관찰 표 3 R-트리방식의최근접이웃구성 C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 a 1 2 1 1 1 1 b 3 1 2 c 1 1 2 1 1

20 정보과학회논문지 : 컴퓨팅의실제및레터제 19 권제 1 호 (2013.1) 하는것이다. 두번째는후보집합의개수를변경하면서절대평균오차 (Mean Absolute Error; MAE) 를관찰한다. 마지막으로후보집합의개수를변경하면서전체사용자에서선호도예측이가능한사용자개수의변화를관찰하는것이다. 후보집합의개수를변경하는방법은사용자간의공간적유사도임계수치를조절하여후보집합의개수를변경할수있다. 이밖에도공간적필터링을사용하지않은사용자기반의협업적필터링 (Global Collabrative Filter; GCF) 과위치기반의협업적필터링의성능을비교하는방식이소개되었다 [1]. 하지만전 / 후처리방식 ( 후보를선택하는데걸리는시간 + 후보를가지고실제선호도를예측하는시간 ) 에서서로다른전처리방식을가지고있어성능을비교하는것이모호한결과를가져올수있으므로본논문에서는명시하지않았다. 성능평가지표로예측의정확도를측정하기위해아래식 (5) 와같이 MAE를사용한다 [1,14,15]. MAE를계산하기위한식 (5) 에서 p 는실제사용자가아이템을평가한점수이다. q 는실제사용자가평가하지않은아이템에대한예측점수이다. n 은예측시도횟수이다 [1,5,14]. 협업필터링에서사용자평가로그가적을경우희소성문제가발생한다. 이번실험은평가로그가 5개이상인사용자를대상으로예측선호도를실험했고아래실험에사용된식은유사도임계수치의변화에따른전체사용자에서선호도예측이가능한사용자에대한비율을측정하였다. 계산방법은아래식 (6) 과같이측정할수있다. N 는총사용자수그리고 C 는선호도예측이가능한사용자이다 [1]. (6) 4.3 예측평가지표비교결과본실험은사용자간의공간적유사도임계수치를변경하면서쿼드트리, 그리드색인그리고 R-트리의후보집합개수의변화량과 MAE 의변화그리고선호도예측이가능한사용자의비율 (coverage) 의변화를분석하면서세가지알고리듬에대한성능을측정하였고마지막으로위치기반의협업적필터링과사용자기반의협업적필터링의성능을비교하였다. 4.4 임계수치변화에따른후보집합변화량분석그림 4에서 3가지공간색인방법들이공간적유사도의임계수치가높아질수록후보집합의개수는감소하는결과를볼수있다. 쿼드트리와그리드색인모두균 (5) 그림 4 임계수치변화에따른후보집합사용자개수변화량일한비율로감소되는반면 R-트리는후보집합 200 아래에서점점감소되었다. 이러한결과 R-트리경우는노드간에겹침이발생하면서최근접후보집합의개수를확보하지못하는문제가발생하였다. 쿼드트리는그리드색인보다후보집합의개수를약 0.4 배많이보유하고있어선호도예측에대한신뢰도가높을가능성이있다. 4.5 임계수치변화에따른 MAE 변화량분석그림 5에서확인된것과같이쿼드트리와그리드색인은임계수치 0.1에서 0.7 구간에서 MAE 값에큰변화가없었지만그리드색인은임계수치 0.8에서부터오차량이증가하였다. 이결과를보면후보집합의개수가감소하면서협업필터링의단점인희소성문제가발생한것으로볼수있다. 반면쿼드트리의경우는임계수치 0.9 에서도큰폭의변화는없었고, R-트리는후보집합의개수가적어임계수치 0.7에서부터오차량이큰폭으로변동되는것을볼수있다. 그림 5 임계수치변화에따른 MAE 변화량 4.6 위치기반의협업적필터링알고리듬간의커버리지분석그림 6의그래프의실험은 4.2장에서식 (6) 을가지고

쿼드트리를이용한위치기반협업필터링추천시스템 21 그림 6 위치기반의협업적필터링알고리듬간의커버리지분석 사용자간의유사도임계수치의변화에따른전체사용자에서선호도예측이가능한사용자에대한비율을측정하였다. 임계수치 0.1에서 0.4 구간에서그리드와쿼드트리간의커버리지비율에차이가없으나 0.5 구간이후부터차이가생기면서임계수치 0.9 구간에서 0.01 % 이상차이가발생하였다. 그리드가쿼드트리보다커버리지비율이낮은이유는사용자위치로그의밀도가낮은곳에서도고정크기로최근접이웃을구성하기때문에쿼드트리의공간적유사도보다낮아선호도예측이가능한사용자의비율이낮아지는결과를보였다. 5. 결론및향후연구 본논문의실험은이전에 LBS 분야에서그리드색인을이용한추천시스템은공간적으로데이터의밀도에따라효율성이떨어지는문제를보완하기위해쿼드트리알고리듬을적용하였다. 추천성능을검증하기위한실험으로그리드색인과 R-트리를대상으로예측선호도에대한 MAE 와후보집합개수를비교분석하여쿼드트리가그리드색인과 R-트리보다적합한것으로분석되었다. 본실험에서공간유사도를계산하기위해쿼드트리를적용하였지만 R+-트리와같은다양한공간색인알고리듬을적용하면성능을향상시킬것으로기대한다그리고위치가유사한사용자간의공간색인을적용하여클러스터링을뿐아니라사용자와콘텐츠가가지고있는특성들은위치외에다양한데이터들을가지고있기때문에나이, 성별, 좋아하는취향에따라퍼지클러스터링이나스펙트럴클러스터링그리고계층적클러스터링과같은다양한클러스터링알고리듬을사용하면더효과적인맞춤형추천이가능할것으로기대한다. 참고문헌 [1] G. Gupta, W. C. Lee, "Collaborative Spatial Object Recommendation in Location Based Services," Proc. of the 39th International Conference on Parallel Processing Workshops, pp.24-33, 2010. [2] T. Sandholm, H. Ung, "Real-time, Location-aware Collaborative Filtering of Web Content," Proc. of the 2011 Workshop on Context-awareness in Retrieval and Recommendation, pp.14-18, 2011. [3] T. Sandholm, H. Ung, C. Aperjis, B. A. Huberman, "Global budgets for local recommendations," Proc. of the 4th ACM conference on Recommender systems, pp.13-20, 2010. [4] H. A. Karimi, B. Zimmerman, A. Ozcelik, D. Roongpiboonsopit, "SoNavNet: a framework for social navigation networks," Proc. of the 2009 International Workshop on Location Based Social Networks, pp.81-87, 2009. [5] G. Linden, B. Smith, J. York, "Amazon.com recommendations item-to-item collaborative filtering," IEEE Internet Computing, vol.7, no.1, pp.76-80, 2003. [6] Y. Zhou, X. Xie, C. Wang, Y. Gong, W. Y. Ma, "Hybrid index structures for locationbased web search," Proc. of the 14th ACM international conference on Information and knowledge management, pp.155-162, 2005. [7] B. Zheng, J. Xu, W. C. Lee, D. L. Lee, "Gridpartition index: a hybrid method for nearestneighbor queries in wireless location-based services," Journal The VLDB Journal The International Journal on Very Large Data Bases, vol.15, no.1, pp.21-39, 2006. [8] N. Beckmann, H. P. Kriegel, R. Schneider, B. Seeger, "The R*-tree: an efficient and robust access method for points and rectangles," Proc. of the 1990 ACM international conference on Management of data, vol.19, no.2, pp.322-331, 1990. [9] A. Markowetz, Y. Chen, T. Suel, X. Long, B. Seeger, "Design and implementation of a geographic search engine," Technical Report TR-CIS- 2005-03, Polytechnic University, New York, 2005. [10] F. Lee, S, Bressan, B. C. Ooi, "Global atlas: calibrating and indexing documents from the internet in the cartographical paradigm," Proc. of the 1st International Conference on Web Information Systems Engineering, vol.1, pp.125-132, 2000. [11] J. Ryu, C. Hong, K. Kang, D. Kang, D. Yang, J. Jwa, "Development of Mobile Context Awareness Restaurant Recommendation Services," Journal of Korea Contents Association, vol.7, no.5, pp.138-145, 2007. (in Korea) [12] K. Michael, G. Damianos, M. Aristides, "A mobile tourism recommender system," Proc. of the 2010 IEEE Symposium on Computers and Communications, pp.840-845, 2010. (in Korean) [13] B. Sarwar, G. Karypis, J. Konstan, J. Reidl, "Item-based collaborative filtering recommendation

22 정보과학회논문지 : 컴퓨팅의실제및레터제 19 권제 1 호 (2013.1) algorithms," Proc. of the 10th international conference on World Wide Web, pp.285-295, 2001. [14] M. Deshpande, G. Karypis, "Item-based top-n recommend- ation algorithms," ACM Transactions on Information Systems, vol.22, no.1, pp.143-177, 2004. [15] C. Kim, J. Lee, J. Kang, "An improved itembased collaborative filtering approach," Proc. of the 2009 Korea Computer Congress, vol.22, no.1, pp.469-473, 2009. (in Korea) [16] J. S. Breese, D. Heckerman, C. Kadie, "Empirical Analysis of Predictive Algorithms for Collaborative Filtering," Proc. of the 14th conference on Uncertainty in artificial intelligence, pp.43-52, 1998. (in Korean) [17] H. Choi, S. Cho, "A Collaborative Filtering Recommendation System using ConceptNet-based Mood Classification by Genre," Proc. of the 2008 Korea Computer Congress, vol.38, no.1, pp.216-219, 2011. (in Korean) 신홍철 2012 년 2 월연세대학교컴퓨터공학과석사. 2007 년 ~ 현재 NHN 지도서비스개발 1 팀팀장 조성배 1988년연세대학교전산과학과 ( 학사 ). 1990 년한국과학기술원전산학과 ( 석사 ). 1993 년한국과학기술원전산학과 ( 박사 ). 1993 년~1995년일본 ATR 인간정보통신연구소객원연구원. 1998년호주 Univ. of New South Wales 초청연구원. 1995년~ 현재연세대학교컴퓨터과학과정교수. 2005년~2006년캐나다 Univ. of British Columbia 방문교수. 관심분야는신경망, 패턴인식, 지능정보처리