이동원 근소비자들은다양한정보를습득하고이로부터자신의취향에맞는상품을찾기위해노력하고있다. 아마존을비롯한많은온라인쇼핑몰에서는이런소비자의요구에부응하고매출을증대하기위한목적으로추천상품을제시하려는노력을기울이고있다. 연관상품추천은이러한필요를충족시킬수있는방법으로서많은기업들이추천시스템구축

Similar documents
지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

04-다시_고속철도61~80p

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

#Ȳ¿ë¼®

DBPIA-NURIMEDIA

이동원 로써소비자가좀더쉽게상품을선택하도록돕는다. 연관상품추천기능은소비자가관심을보인특정한상품에밀접하게관련된상품들을보여줌으로써, 다른대안으로비교가능한유사상품또는추가적으로구매가능한상품을제공하는수단으로활용되고있다. 하지만, 이런연관상품추천기법은동시혹은순차적인주문과같이이미발생한



정진명 남재원 떠오르고 있다. 배달앱서비스는 소비자가 배달 앱서비스를 이용하여 배달음식점을 찾고 음식 을 주문하며, 대금을 결제까지 할 수 있는 서비 스를 말한다. 배달앱서비스는 간편한 음식 주문 과 바로결제 서비스를 바탕으로 전 연령층에서 빠르게 보급되고 있는 반면,

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

0125_ 워크샵 발표자료_완성.key

09권오설_ok.hwp

°í¼®ÁÖ Ãâ·Â

11¹ÚÇý·É

04김호걸(39~50)ok

11¹Ú´ö±Ô

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

20(53?)_???_O2O(Online to Offline)??? ???? ??.hwp

<C7D1B1B9B1A4B0EDC8ABBAB8C7D0BAB85F31302D31C8A35F32C2F75F E687770>

에너지경제연구 제13권 제1호

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석

DBPIA-NURIMEDIA

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

<31325FB1E8B0E6BCBA2E687770>

歯1.PDF

44-4대지.07이영희532~

자연채무에대한재검토 1. 서론 2. 선행연구 9 Journal of Digital Convergence 214 May; 12(5): 89-99

Output file

... 수시연구 국가물류비산정및추이분석 Korean Macroeconomic Logistics Costs in 권혁구ㆍ서상범...

에너지경제연구 Korean Energy Economic Review Volume 9, Number 2, September 2010 : pp. 1~18 가격비대칭성검정모형민감도분석 1

공연영상

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

10송동수.hwp

06_ÀÌÀçÈÆ¿Ü0926

- 2 -

Microsoft PowerPoint - XP Style


<31362DB1E8C7FDBFF82DC0FABFB9BBEA20B5B6B8B3BFB5C8ADC0C720B1B8C0FC20B8B6C4C9C6C32E687770>

정보기술응용학회 발표


THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),


1. KT 올레스퀘어 미디어파사드 콘텐츠 개발.hwp


12È«±â¼±¿Ü339~370

Journal of Educational Innovation Research 2017, Vol. 27, No. 1, pp DOI: * The

DBPIA-NURIMEDIA

歯kjmh2004v13n1.PDF

Buy one get one with discount promotional strategy


10 이지훈KICS hwp

DBPIA-NURIMEDIA

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

03-ÀÌÁ¦Çö

<332EC0E5B3B2B0E62E687770>

<BFA9BAD02DB0A1BBF3B1A4B0ED28C0CCBCF6B9FC2920B3BBC1F62E706466>

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: NCS : * A Study on

<30382E20B1C7BCF8C0E720C6EDC1FD5FC3D6C1BEBABB2E687770>

04서종철fig.6(121~131)ok

???? 1

05( ) CPLV12-04.hwp

원고스타일 정의

DBPIA-NURIMEDIA

09È«¼®¿µ 5~152s

에너지경제연구 제13권 제1호

pdf 16..

강의지침서 작성 양식

제19권 제3호 Ⅰ. 문제제기 온라인을 활용한 뉴스 서비스 이용은 이제 더 이 상 새로운 일이 아니다. 뉴스 서비스는 이미 기존의 언론사들이 개설한 웹사이트를 통해 이루어지고 있으 며 기존의 종이신문과 방송을 제작하는 언론사들 외 에 온라인을 기반으로 하는 신생 언론사

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Analysis of

본문01

Vol.257 C O N T E N T S M O N T H L Y P U B L I C F I N A N C E F O R U M

Output file

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

DBPIA-NURIMEDIA

레이아웃 1

,.,..,....,, Abstract The importance of integrated design which tries to i

퍼스널 토이의 조형적 특성에 관한 고찰

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: * Suggestions of Ways

07_À±ÀåÇõ¿Ü_0317

DBPIA-NURIMEDIA

Portal_9iAS.ppt [읽기 전용]

한국성인에서초기황반변성질환과 연관된위험요인연구

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

30이지은.hwp

UPMLOPEKAUWE.hwp

<31332EBEC6C6AEB8B6C4C9C6C3C0BB20C8B0BFEBC7D120C6D0C5B0C1F6B5F0C0DAC0CE20BFACB1B82E687770>

27 2, 1-16, * **,,,,. KS,,,., PC,.,,.,,. :,,, : 2009/08/12 : 2009/09/03 : 2009/09/30 * ** ( :

Æ÷Àå½Ã¼³94š

디지털포렌식학회 논문양식

에너지경제연구 Korean Energy Economic Review Volume 9, Number 2, September 2010 : pp. 19~41 석유제품브랜드의자산가치측정 : 휘발유를 중심으로 19

untitled

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 27(12),

(2005) ,,.,..,,..,.,,,,,

Transcription:

J Intell Inform Syst 2017 March: 23(1): 127~141 ISSN 2288-4866 (Print) ISSN 2288-4882 (Online) http://www.jiisonline.org http://dx.doi.org/10.13088/jiis.2017.23.1.127 이동원한성대학교경영학부 (dongwonlee@hansung.ac.kr) 인터넷과모바일관련기술의발전과기기의보급은물리적공간의제약을극복하게하고, 다양한상품과서비스를소비자에게제공함으로써, 소비자에게선택의폭을넓히는기회를제공하는반면, 많은시간과노력을기울이고도소비자가자신의기호에적합한품목을선택하기힘들어지는부작용을낳았다. 이에따라, 기업은추천시스템을활용하여소비자가원하는품목을더쉽게찾는수단을제공하고있다. 상품간의연관성을통계적으로분석하는연관규칙마이닝기법은직관적인형태의척도를규칙과함께제공함으로써, 이로부터도출된규칙에포함된품목간의관계를이해하고, 이를추천에적용하기쉽다는강점을갖는다. 그러나, 서로다른규칙의척도가일관되게어느한쪽의규칙이더우위에있음을알려주지못한다면, 수많은품목중추천에적합한품목을적절히선별해내기힘든상황이발생한다. 본연구에서는추천상품의순위를결정할수있도록연관규칙마이닝기법에회귀분석모형을보완적으로적용하는방안을제시하고자수행되었다. 연관규칙마이닝에서보편적으로사용되고있는지지도, 신뢰도, 향상도를활용하여모형을구현함으로써, 직관적으로이해하기쉬울뿐만아니라, 실무에서도활용하기쉬운방안을제시하고자하였다. 국내최대규모의온라인쇼핑몰의주문데이터를활용한실험을통해, 제안된모형으로부터얻어진추천점수를기반으로추천상품을결정하고, 이를추천에적용함으로써추천적중률을향상시킬수있음을보였다. 특히, 최근모바일상거래가빠르게확산됨에따라, 제한된화면에한정된수의추천품목을제시해야하는상황에서적합한추천기법임을확인할수있었다. 주제어 : 추천시스템, 연관규칙마이닝, 회귀분석모형, 온라인쇼핑, 모형기반추천시스템 논문접수일 : 2017년 3월 6일논문수정일 : 2017년 3월 6일게재확정일 : 2017년 3월 13일원고유형 : 일반논문교신저자 : 이동원 인터넷이보편화되면서급속도로성장한전자상거래는최근스마트폰, 태블릿PC 와같은모바일기기의보급이확산됨에따라또다른성장기회를맞고있다. 물리적인공간의제약을받는오프라인상점과는달리온라인상점은인터넷이라는가상공간에무한에가까운상품을보다 적은비용으로진열하고판매할수있다는장점을갖는다. 이는주력상품의판매에의존하던기존과는달리다양한상품의판매를통해매출을크게늘릴수있는기회로작용하고있다. 그러나, 또다른한편으로이렇게많아진상품은소비자가자신이원하는상품을찾기힘든부작용을야기시키고있다. 한정된상품만을보고이로부터구매결정을내리던과거와는달리, 최

이동원 근소비자들은다양한정보를습득하고이로부터자신의취향에맞는상품을찾기위해노력하고있다. 아마존을비롯한많은온라인쇼핑몰에서는이런소비자의요구에부응하고매출을증대하기위한목적으로추천상품을제시하려는노력을기울이고있다. 연관상품추천은이러한필요를충족시킬수있는방법으로서많은기업들이추천시스템구축에활용하고있는방안이다. 이는소비자가방문한상품페이지의일부영역에추천상품을제시함으로써원하는상품에빠르고쉽게접근할수있도록한다. 이런방식을통해소비자는자신이방문한페이지의상품뿐만아니라추천상품까지도자신의구매대안으로함께고려할수있게된다. 즉, 소비자는자신이더선호하는상품을고를수있는기회를얻게될수있고, 미처인지하지못하던상품에대한니즈를알게되는기회를갖게된다. 이런연관상품을추천하기위해널리활용되고있는방법이연관규칙마이닝인데 (Agrawal, 1993), 이는상품간의연관성을지지도, 신뢰도, 향상도라는세가지척도로평가하고이를연관규칙이라는형태로표현하는기법이다. 연관규칙마이닝에서제시되는규칙의형태는아래의예와같이표현된다. 규칙1: 햄 계란 ( 지지도 2%, 신뢰도 30%) 규칙2: 햄 식빵 ( 지지도 1%, 신뢰도 40%) 위의예시에나타난두개의규칙은햄이라는상품에대해연관성이높은계란과빵을통계적인방법으로발견하고, 이를지지도, 신뢰도라는척도와함께정형화된형태로제시하고있다. 이런규칙은계란과빵을추천하면햄만을구매한 소비자로부터추가구매를유발할수있다는것을암시적으로표현하기때문에연관상품추천시에활용될수있다. 그러나, 제한된화면에한정된수의추천상품을제시해야하는온라인쇼핑상황에서, 연관규칙마이닝기법은우선적으로배치해야할추천상품을어떻게선별할것인지에대한적절한해답을제시하기위한일관적이고보편적인방법을제시하지못한다. 위의예에서, 연관규칙의척도는햄이라는상품페이지를방문한소비자에게계란과식빵중어느것이더추천에적합할것인지에대한해답을제공하지못한다. 지지도가더높다는것은해당규칙을적용할기회가상대적으로더많음을암시한다. 위의규칙에서햄과계란을함께구매한경우가전체장바구니의 2%, 햄과식빵이 1% 에서발견되었음을보임으로써앞으로도햄은식빵보다계란과함께더많이구매될것임을암시한다. 이는앞으로햄을구매하는고객에게식빵보다계란을추천하는것이더유리한것처럼보일수있다. 그러나, 햄을구매한고객중 30% 가계란을구매한데반해, 40% 가식빵을구매했다는것을보여주는신뢰도는, 지지도와는반대로계란보다식빵이더유리할수있다는것을암시한다. 이와같이연관규칙마이닝기법의두척도는상충되는결과를보일수있다. 이와같이서로다른규칙간에서로절대적우위를판단하는것이불가능한경우, 어느규칙이더우선적으로적용되어야할지결정하기힘든상황이발생한다. 온라인상점에서거래되는상품의수가수십만개에이른다는점을감안하면, 다양한상품간에수많은연관규칙이존재할수있으므로, 어떤상품을우선적으로추천해야할것인지를결정하는것은쉬운일이아니다. 더구나, 모바일기기와같이한정된크기의

연관상품추천을위한회귀분석모형기반연관규칙척도결합기법 화면에제한된수의상품을배치하려면, 소비자가선호할만한상품을최우선적으로제시하는것이매우중요하다. 따라서, 추천상품의우선순위를결정할수있는일관된척도를개발하는것이필요하다. 이러한통합척도는서로상충되는추천결과를중재하는역할을해야함은물론이고, 우수한추천성과를보장할수있어야할것이다. 또한, 기존의척도와마찬가지로직관적을이해될수있고, 실무에적용이용이해야한다. 따라서, 본연구는이런요건을갖춘척도를개발하되기존척도를효과적으로결합하여통합된척도를만드는방법을제시하려는목적으로수행되었다. 본연구는추천시스템에관한기존연구들을이론적배경으로한다. 추천시스템은기존에사용자가표현한선호도나상품간유사도를기반으로상품이나서비스를추천하는일종의의사결정지원시스템으로서의기능을수행한다. 이는사용자로하여금구매와관련된상품이나서비스의검색노력을줄이고, 기업으로하여금고객충성도와매출을증대하는효과를가져온다 (Ansari et al., 2000). 효과적인추천기법을개발하거나 (Balabanovic and Shoham, 1997; Ansari et al., 2000; Adomavicius and Tuzhilin, 2011; Choi et al., 2016), 추천시스템의성과를측정거나 (Bodapati, 2008; Fleder and Hosanagar, 2009), 다양한분야에활용하기위한목적으로 (Choi et al., 2015; Kim and Lee, 2013; Kim et al., 2010), 추천시스템과관련한다양한연구들이수행되었다. 추천시스템의개발과관련한다양한기법이널리연구되고있으며, 그중에서도내용기반필터링 (content-based filtering) 과협업필터링 (collaborative filtering) 이주류를이루고있다. 내용기반필터링기법은상품또는서비스의유사성에기반을두고추천상품이나서비스를찾는반면, 협업필터링은사용자간의유사성을활용하는방법이다 (Konstan et al., 1997; Ansari et al., 2000). 내용기반필터링은상품간의유사성을찾기위해의사결정나무, 최근접이웃기법등다양한분류기법을활용한다. 사용자가기존에선호한상품과유사한특성을갖는상품중아직경험하지않은상품을추천하는방식이다. 반면에, 협업필터링은사용자가상품이나서비스에대해표현한선호도를기반으로다른사용자와의유사도를측정한다. 사용자와유사한다른사용자가선호한상품중아직사용자가경험하지않은상품이추천대상으로선정된다. 본연구의또다른이론적배경은연관규칙마이닝이다. 이는 Agrawal et al. (1993) 이제시한기법으로, 품목 ( 상품또는서비스 ) 이주문과같은거래에서동시출현한패턴을연관규칙의형태로표현한것이다. 연관규칙마이닝기법은, 두품목이동시에같은거래에나타난빈도를측정함으로써, 한품목의판매가다른품목의판매에얼마나강하게영향을미치는지를표현한다는점에서마케팅프로모션과교차판매등에적용될수있다 (Anand, 1998; Chen et al., 2006; Kim and Street, 2004; Lee et al., 2013; Kim and

이동원 Kim, 2005). 연관규칙은선행품목 (antecedent item, A) 과후행품목 (consequent item, C) 을지지도 (support, sup), 신뢰도 (confidence, conf) 와함께아래와같이정형화된형태로표시된다. A C (sup%,conf%) 지지도와신뢰도는연관규칙의강도를표현하기위해사용되는데, 지지도는전체거래에서선행품목과후행품목이동시에나타난거래의비율로측정되며, 신뢰도는선행품목이나타난거래중후행품목이포함된거래의비율로계산된다. 선행품목을구매한소비자에게여러후행품목중신뢰도가더높은품목이추천되는경우, 이를소비자가받아들일확률이더높을수있음을암시하는것으로해석가능하다는점에서중요한의미를갖는다. 그러나, 이런거래가사전에충분히발생하지않았다면이런추천에대한확신이부족할것이라는측면에서지지도도함께고려되어야한다. 즉, 신뢰도와지지도가상대적으로높은규칙이그렇지않은규칙보다더우선적으로적용되는것이타당할것이다. 그러나, 동일한선행품목에대해서로다른후행품목을갖는두개이상의연관규칙이존재하는경우, 이들중어느규칙도다른규칙에비해지지도와신뢰도가모두우세하지않다면, 어떤규칙을적용하는것이더바람직할것인지에대한판단에어려움이발생할수있다. 즉, 신뢰도가더높지만지지도가낮은품목과반대로신뢰도는낮지만지지도가더높은품목중어느것이추천에적합할것인지를결정해야하는고민에빠지게된다. 주어진기준상품에대해어떤상품을우선적으로추천하는것이적합한지를결정하기위해추천상품의순위를결정할수있는점수의계산이필요하다. 연관상품의추천은상품간의연관성에기반하여특정상품에대해추천에적합한연관상품을찾는방식으로이루어진다. 온라인쇼핑에서는일반적으로개별상품페이지의특정영역에대략 10개정도의상품들이노출되는데, 소비자의선택가능성을높이기추천상품의선정과배치가매우중요하다. 본연구에서는추천상품의노출순서를결정하기위한방안으로서연관규칙마이닝기법과회귀분석모형을활용하여개별상품에대한추천상품의선호도를점수로계산하는방안을제시한다. 본연구에서제안하는기법을적용하기위한프로세스는 <Figure 1> 과같이 5단계로이루어진다. 첫째, 주문데이터를학습용집합과검증용집합으로구분한다. 주문데이터는임의추출방식에의해두개의집합으로구분하되, 동일한소비자의주문은동일한집합에포함되도록한다. 둘째, 학습용집합으로부터연관규칙을추출한다. 동일한소비자가구매한상품끼리같은장바구니에포함된것으로간주하고, 연관규칙마이닝기법을활용하여상품의구매과정에서서로연관성을갖는상품을찾아연관규칙을작성한다. 이과정에서각규칙별로지지도, 신뢰도, 향상도를측정한다. 셋째, 검증용집합에규칙을적용하여, 각규칙별추천성공률을구한다. 검증용집합의소비자별로기준상품 ( 선행품목 ) 이포함된경우추천상품도함께포함되었는지를확인하는방식으

연관상품추천을위한회귀분석모형기반연관규칙척도결합기법 <Figure 1> Research Model 로추천의성공여부를측정한다. 각규칙별로전체추천회수에대해적중된수를비율로계산하여 0에서 1사이의값을갖는추천성공률을구한다. 넷째, 각규칙의추천성공률과연관규칙척도를이용하여회귀모형을작성한다. 앞서구한추천성공률 (HitRate) 을종속변수, 규칙의지지도 (sup) 뿐만아니라기준상품의지지도 (supa) 와추

이동원 천상품의지지도 (supb), 규칙의신뢰도 (conf) 와향상도 (lift) 를변수에포함하여아래의식과같이회귀모형을구축한다. HitRate = β0 + β1supa + β2supb + β3supasupb + β4sup + β5conf + β6lift + ε (1) 다섯째, 회귀모형의계수를이용하여연관규칙의추천점수를계산한다. 추천점수는연관규칙모형에서등호의우측에놓인수식으로부터오차항 (ε) 을제외하고계산하여얻을수있다. 즉, 학습용집합으로부터생성된연관규칙의지지도, 신뢰도, 향상도와함께기준상품과추천상품의지지도를함께식 (1) 에포함하여적중률을계산하고이를추천점수로사용한다. 이로부터하나의기준상품에대해추천대상상품의목록을정할수있는데, 추천상품을그추천점수가높은순서대로노출시킬수만큼선정한다. 실험은본연구에서제안한기법의유효성을검증하기위한목적으로실시되었다. 즉, 회귀모형을활용하여선택된추천상품이기존의방식에의해선택된추천상품보다더높은추천적중률을보이는지를평가하기위한것이다. 본연구에서사용된기존추천방식은신뢰도를기반으로추천상품을선택하는방식을취하였다. 본실험에사용된데이터는국내최대규모의쇼핑몰중하나인 11번가의주문데이터로서, 웹과모바일을통해주문한내역이다. 온라인에서 는상품의수명주기가다소짧은편이므로, 주문기간의간격이너무긴경우상품간의연관성이낮아진다고보여, 2010년 6월부터 2011년 5월까지 1년간의거래데이터만을활용하였다. 본실험에서는온라인쇼핑몰의주문정보를활용하여일부의데이터로부터추천규칙을추출하고, 나머지데이터를검증에활용함으로써추천적중률을확인하는방식으로진행되었다. 새로제안된추천방식과기존의방식에대해동일한과정을수행하여그결과를비교함으로써, 새로제시된방안이기존의방식에비해얼마나개선된결과를보여주는지를확인하였다. 본실험은 3장에서소개된프로세스에따라진행되었으며, 본연구에서제안한방식의개선도를보여주기위한평가과정을추가로실시하였다. 구체적인방법은다음과같다. 우선, 임의추출방식으로주문데이터를 3개의집합으로나누어, 각각을학습용, 검증용, 평가용으로활용하였다. 주문데이터는온라인쇼핑몰의 1년치데이터를사용하였다. 다음으로, 학습용집합에서연관상품규칙을추출하였다. 두경쟁모형에대해동일하게, 각기준상품당 100개의추천상품을확보하고, 각모형에서의추천상품순위선정방식에따라추천상품에대해 1부터 100까지의순위를부여하였다. 기존모형에대해서는신뢰도가높은순서에따라추천상품의순위를결정하였고, 제안모형에서는회귀모형의추천적중률이높은순서로추천상품의순위를결정하였다. 두모형으로부터추출된규칙의추천성과를비교하기위해각모형에서추출된규칙을평가

연관상품추천을위한회귀분석모형기반연관규칙척도결합기법 집합에적용하여추천성공여부를확인하고그성과를상호비교하였다. 이과정에서평가에적용된고객의수는 10,004명이며추천대상이된기준상품의수는 36,550개로서, 이를고객별로누적한결과는 129,975 개이며이는고객당평균 13개의상품에대해, 상품당평균 3.56명의고객에게추천이이루어진것에해당한다. <Table 1> 과 <Table 2> 는각각실험에사용된변수의기술통계량과변수간상관계수를보여준다. 변수에는학습용집합으로부터추출된연관규칙을검증용집합에적용하여측정한결과로부터얻어진적중률 (hit rate) 과연관규칙의지지도, 신뢰도, 향상도, 선행품목의지지도 (sup1) 후행품목의지지도 (sup2) 를포함하고있다. 변수 들간의강한상관관계가발견되지않아그대로분석에사용되었다. <Table 3> 은연관규칙에서얻어진설명변수들로부터종속변수인적중률을추정하는회귀분석을실시한결과이다. 연관규칙의기본척도인지지도, 신뢰도, 향상도만을설명변수로포함한모형 (Model 1) 과이척도들에선행품목, 후행품목의지지도를추가로포함시킨모형 (Model 2) 에대해분석을실시한결과 2번모형이더설명력이우수한것으로판단되어이를본연구에서제안하는최종모형으로선정하고이후의실험과정을진행하였다. <Table 4> 는제안모형과경쟁모형의성과를비교한결과로서, 추천순위 1위부터 20위까지의상품이보인추천결과를보여준다. 경쟁모형에대해서는, 보편적으로추천기준으로많이사용 <Table 1> Descriptive Statistics hit_rate 160,674 0.1599701 0.2266645 0.003876 1 sup 160,674 0.000184 0.0001436 0.0001325 0.0055666 conf 160,674 0.1640605 0.2302552 0.0043478 1 lift 160,674 219.1239 792.6603 0.4851154 7545 sup1 160,674 0.0040229 0.0050981 0.0001325 0.0304838 sup2 160,674 0.0040229 0.0050981 0.0001325 0.0304838 sup1sup2 160,674 0.0000124 0.0000222 1.76E-08 0.0006141 <Table 2> Correlation Coefficients sup 1 conf -0.0153 1 lift -0.0675 0.5497 1 sup1 0.2311-0.4055-0.1775 1 sup2 0.2311 0.0966-0.1775-0.1467 1 sup1sup2 0.5623-0.2191-0.1436 0.4458 0.4458 1

이동원 <Table 3> Regression Analysis of Experiment Data Constant 0.0543619*** (0.0006333) 0.063724*** (0.0007833) sup -97.28487*** (2.479409) -80.76567*** (3.036262) conf 0.7324337*** (0.0018465) 0.6844672*** (0.0020559) lift 0.0000153*** (0.000000537) 0.0000215*** (0.00000056) sup1-3.428722*** (0.0895096) sup2 2.130937*** (0.0901961) sup1sup2-54.34277** (25.7462) Observations 160674 160674 Adjusted R-squared 0.6058 0.6135 <Table 4> Performance Comparison of Two Models 1 7,868 7,747 7,868 7,747 6.05% 5.96% 1.6% 2 5,018 4,754 12,886 12,501 4.96% 4.81% 3.1% 3 3,939 3,969 16,825 16,470 4.31% 4.22% 2.2% 4 3,283 2,998 20,108 19,468 3.87% 3.74% 3.3% 5 2,799 2,834 22,907 22,302 3.52% 3.43% 2.7% 6 2,618 2,585 25,525 24,887 3.27% 3.19% 2.6% 7 2,329 2,298 27,854 27,185 3.06% 2.99% 2.5% 8 2,198 2,133 30,052 29,318 2.89% 2.82% 2.5% 9 1,942 2,039 31,994 31,357 2.74% 2.68% 2.0% 10 1,839 1,977 33,833 33,334 2.60% 2.56% 1.5% 11 1,756 1,872 35,589 35,206 2.49% 2.46% 1.1% 12 1,679 1,813 37,268 37,019 2.39% 2.37% 0.7% 13 1,602 1,695 38,870 38,714 2.30% 2.29% 0.4% 14 1,519 1,665 40,389 40,379 2.22% 2.22% 0.0% 15 1,495 1,561 41,884 41,940 2.15% 2.15% -0.1% 16 1,403 1,446 43,287 43,386 2.08% 2.09% -0.2% 17 1,305 1,594 44,592 44,980 2.02% 2.04% -0.9% 18 1,259 1,390 45,851 46,370 1.96% 1.98% -1.1% 19 1,226 1,410 47,077 47,780 1.91% 1.93% -1.5% 20 1,224 1,364 48,301 49,144 1.86% 1.89% -1.7%

연관상품추천을위한회귀분석모형기반연관규칙척도결합기법 되고있는신뢰도를순위결정에적용하였다. 즉, 신뢰도가가장높은상품으로부터추천순위가결정되도록하였다. 추천에대해적중된상품의수와이를누적한값을표기했으며, 이로부터누적적중률을구했고, 두모형을비교하여제안모형의개선도를계산한결과를포함하고있다. 각추천상품의추천순위가증가함에따라추천성과가감소하는경향이두모형에서공통적으로뚜렷이나타나는것으로보아두모형모두적중률이높은순서대로추천규칙이추출되었음을확인할수있다. 두모형의성과를비교하면, <Figure 2> 에서볼수있는것처럼, 두모형의 1위추천상품이각 각 6.05%, 5.96% 의누적적중률로제안모형이더우세함을보이다가, 추천상품의추천순위가증가함에따라그차이가점차감소하는경향을확인할수있다. <Figure 3> 의누적개선도에서도확인할수있듯이, 13위의추천상품까지는제안모형이우세하다가 15위이후부터는기존모형이더우세하게나타나는것을관찰할수있었다. 제한된수의상품이추천되어야하는온라인쇼핑환경에서일반적으로 10개정도의추천상품을제시한다는것을전제로본다면, 제안모형의성과가기존모형에비해더우수하게나타날것이라고기대할수있다. <Figure 2> Cumulative Hit Rate

이동원 <Figure 3> Cumulative Degree of Hit Rate Improvement 인터넷과모바일관련기술의발전과기기의보급은물리적공간의제약을극복하게함으로써, 다양한상품과서비스를소비자에게제공할수있게되었다. 이런변화는소비자에게선택의폭을넓히는기회라는측면과더불어많은시간과노력을기울이고도자신의기호에적합한품목을선택하기힘들어지는위기의측면도함께가져왔다. 소비자는자신이원하는상품과서비스를더찾기쉬운환경을원하고있고, 기업은이에부응하기위하여추천시스템을활용하고있다. 상품간의연관성을통계적으로분석하여규칙의형태로제공하는연관규칙마이닝기법은최근많은온라인기업들이활용하고있는추천알고리즘이다. 이기법은직관적인형태의척도를규칙과함께제공함으로써, 이로부터도출된규칙에포함된품목간의관계를이해하고, 이를추천에적용하기쉽다는강점을갖는다. 서로다른규칙의척도가일관되게어느한쪽의규칙이더우위에있음을알려주지못한다면, 온라인상점에서거래되는수십만개의품목중추천에가장적합한소수의품목을구별해내기힘든상황이발생한다. 적합하지못한추천품목은외면당할뿐만아니라, 추천자체에대한신뢰를잃을

연관상품추천을위한회귀분석모형기반연관규칙척도결합기법 수도있다. 본연구에서는추천상품의순위를결정할수 있도록회귀분석모형을적용하는방안을제시하 였다. 실무에서활용하기쉬운방안을제시하는 것이중요하다는판단하에, 연관규칙마이닝에 서보편적으로사용되고있는지지도, 신뢰도, 향상도를활용하여모형을구현하였다. 국내최 대규모의온라인쇼핑몰인 11 번가의주문데이 터를활용한실험은, 모형으로부터얻어진추천 점수를기반으로추천상품을결정하고, 이를적 용함으로써추천적중률을높일수있음을보여 준다. 특히, 최근모바일상거래가빠르게확산 됨에따라, 제한된화면에한정된수의추천품 목을제시해야하는상황에서적합한추천기법 임을확인할수있었다. 본연구는상품을취급하는온라인쇼핑몰에 서교차판매에적용되는것을전제로수행되었 으나, 본연구에서제안한방법은연관규칙을 적용하는다양한상황에서모두적용할수있을 것으로기대할수있다. 또한, 모형의정교화를 위해추가적인변수를고려해볼필요가있을것 이다. 즉, 연관규칙으로부터얻은지지도, 신뢰 도, 향상도와선후행품목의지지도외에도, 가 격과같은변수를추가로고려하는노력을통해 더욱정교한추천시스템을구축하는것이가능 할것으로기대해볼수있을것이다. Agrawal, R., T. Imielinski, A. Swami. Mining association rule between sets of items in large databases, Proc. 1993 ACM SIGMOD international conference on management of data, (1993), 207~216. Adomavicius, G., A. Tuzhilin. Context-Aware Recommender Systems. Recommender Systems Handbook, Springer US, (2011), 217~253. Anand, S.S., A.R. Patrick. A Data Mining methodology for cross-sales, Knowledge- Based Systems, Vol.10, No.7(1998), 449~461. Ansari, A., S. Essegaier, R. Kohli. Internet recommender systems, Journal of Marketing Research, Vol.37, No.3(2000), 363~375. Balabanovic, M., Y. Shoham. Content-Based, Collaborative, Recommendation, Communications of the ACM, Vol.40, No.3(1997), 66~72. Bodapati, A.V. Recommender systems with purchase data, J. Marketing Research, Vol.45, No.1(2008), 77~93. Chen, Y.L., J.M. Chen, C.W. Tung. A data mining approach for retail knowledge discovery with consideration of the effect of shelf-space adjacency on sales, Decision Support Systems, Vol.42, No.3(2006), 1503~1520. Choi, S., Hyun, Y., Kim, N. Improving Performance of Recommendation Systems Using Topic Modeling, Journal of Intelligence and Information Systems, Vol.21, No.3(2015), 101~116. Choi, S., Kwahk, K.-Y., Ahn, H. Enhancing Predictive Accuracy of Collaborative Filtering Algorithms using the Network Analysis of Trust Relationship among Users, Journal of Intelligence and Information Systems, Vol.22, No.3(2016), 113~127. Fleder, D., K. Hosanagar. Blockbuster culture's

이동원 next rise or fall: The impact of recommender systems on sales diversity, Management Science, Vol.55, No.5(2009), 697~712. Kim, H. K., Choi, I. Y., Ha, K. M., Kim, J. K. Development of User Based Recommender System using Social Network for u-healthcare, Journal of Intelligence and Information Systems, Vol.16. No.3(2010), 181~199. Kim, J., Lee, S.-W. The Ontology Based, the Movie Contents Recommendation Scheme, Using Relations of Movie Metadata, Journal of Intelligence and Information Systems, Vol.19, No.3(2013), 25~44. Kim, K.-J., Kim, B.-G. Product Recommender System for Online Shopping Malls using Data Mining Techniques, Journal of Intelligence and Information Systems, Vol.11, No.1(2005), 191~205. Kim, Y., W.N. Street. An intelligent system for customer targeting: a data mining approach, Decision Support Systems, Vol.37, No.2(2004), 215~228. Konstan, J.A., B.N. Miller, D. Maltz, J.L. Herlocker, L.R. Gordon, J. Riedl. GroupLens: applying collaborative filtering to Usenet news, Communications of the ACM, Vol.40, No.3(1997), 77~87. Lee, D., S. Park, S. Moon. Utility-based association rule mining: A marketing solution for cross-selling, Expert Systems with Applications. Vol.40, No.7(2013), 2715~25.

연관상품추천을위한회귀분석모형기반연관규칙척도결합기법 Abstract 1) Dongwon Lee* Advances in Internet technologies and the proliferation of mobile devices enabled consumers to approach a wide range of goods and services, while causing an adverse effect that they have hard time reaching their congenial items even if they devote much time to searching for them. Accordingly, businesses are using the recommender systems to provide tools for consumers to find the desired items more easily. Association Rule Mining (ARM) technology is advantageous to recommender systems in that ARM provides intuitive form of a rule with interestingness measures (support, confidence, and lift) describing the relationship between items. Given an item, its relevant items can be distinguished with the help of the measures that show the strength of relationship between items. Based on the strength, the most pertinent items can be chosen among other items and exposed to a given item s web page. However, the diversity of the measures may confuse which items are more recommendable. Given two rules, for example, one rule s support and confidence may not be concurrently superior to the other rule s. Such discrepancy of the measures in distinguishing one rule s superiority from other rules may cause difficulty in selecting proper items for recommendation. In addition, in an online environment where a web page or mobile screen can provide a limited number of recommendations that attract consumer interest, the prudent selection of items to be included in the list of recommendations is very important. The exposure of items of little interest may lead consumers to ignore the recommendations. Then, such consumers will possibly not pay attention to other forms of marketing activities. Therefore, the measures should be aligned with the probability of consumer s acceptance of recommendations. For this reason, this study proposes a model-based approach to combine those measures into one unified measure that can consistently determine the ranking of recommended items. A regression model was designed to describe how well the measures (independent variables; i.e., support, confidence, and lift) explain consumer s acceptance of * Corresponding Author: Dongwon Lee School of Business Administration, College of Social Sciences, Hansung University 116 Samseongyoro-16gil, Seongbuk-gu, Seoul 02876, Korea Tel: +82-2-760-4250, Fax: +82-2-760-4482, E-mail: dongwonlee@hansung.ac.kr Bibliographic info: J Intell Inform Syst 2017 March: 23(1): 127~141

이동원 recommendations (dependent variables, hit rate of recommended items). The model is intuitive to understand and easy to use in that the equation consists of the commonly used measures for ARM and can be used in the estimation of hit rates. The experiment using transaction data from one of the Korea s largest online shopping malls was conducted to show that the proposed model can improve the hit rates of recommendations. From the top of the list to 13th place, recommended items in the higher rakings from the proposed model show the higher hit rates than those from the competitive model s. The result shows that the proposed model s performance is superior to the competitive model s in online recommendation environment. In a web page, consumers are provided around ten recommendations with which the proposed model outperforms. Moreover, a mobile device cannot expose many items simultaneously due to its limited screen size. Therefore, the result shows that the newly devised recommendation technique is suitable for the mobile recommender systems. While this study has been conducted to cover the cross-selling in online shopping malls that handle merchandise, the proposed method can be expected to be applied in various situations under which association rules apply. For example, this model can be applied to medical diagnostic systems that predict candidate diseases from a patient s symptoms. To increase the efficiency of the model, additional variables will need to be considered for the elaboration of the model in future studies. For example, price can be a good candidate for an explanatory variable because it has a major impact on consumer purchase decisions. If the prices of recommended items are much higher than the items in which a consumer is interested, the consumer may hesitate to accept the recommendations. Key Words : Recommender system, association rule mining, regression model, online shopping, model-based recommender system Received : March 6, 2017 Revised : March 6, 2017 Accepted : March 13, 2017 Publication Type : Regular Paper Corresponding Author : Dongwon Lee Bibliographic info: J Intell Inform Syst 2017 March: 23(1): 127~141

연관상품추천을위한회귀분석모형기반연관규칙척도결합기법 이동원 LG CNS 에서시스템엔지니어로근무하였으며, KAIST 경영대학원에서 MIS 전공으로석사 / 박사학위를취득하였다. 현재한성대학교경영학부조교수로재직중이다. 현재빅데이터에기반한연구를주로수행하고있으며, 주요관심분야는고객관계관리, 추천시스템, 데이터마이닝기법의정교화, 디지털콘텐츠마케팅등이다.