Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft s Bing Search Engine Thore Graepel et al., ICML, 2010 P

Similar documents
160322_ADOP 상품 소개서_1.0




204

종합물가정보 2016년 4월호

005- 4¿ùc03ÖÁ¾š

2009 April


statistics

(주)나우프로필의 이동형 대표 개편의 방향이 시민참여를 많이 하는 방향이라, 홈페이지 시안 이 매우 간편해져서 소통이 쉬워질 것 같다. 다만 웹보다 모바일 이용자가 지속적으로 급증하는 추세이므로 이에 적합한 구조가 되도록 보장해야 한다. 소셜미디어전략연구소 배운철 대표

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

PowerPoint 프레젠테이션

untitled


늘푸른세상4월-136호

김기남_ATDC2016_160620_[키노트].key

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):

untitled

Recommender Systems - Beyond Collaborative Filtering

산선생의 집입니다. 환영해요


1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

HWP Document


Precipitation prediction of numerical analysis for Mg-Al alloys

2002년 2학기 자료구조

특집....,.,., (good jobs) (rent-sharing) (fairness)..... Ⅱ. 임금과생산성구조의분석모형 ) 1),,,, 2_ 노동리뷰

HW5 Exercise 1 (60pts) M interpreter with a simple type system M. M. M.., M (simple type system). M, M. M., M.

Probability Overview Naive Bayes Classifier Director of TEAMLAB Sungchul Choi


untitled

untitled

슬라이드 1

intro


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

? Search Search Search Search Long-Tail Long-Tail Long-Tail Long-Tail Media Media Media Media Web2.0 Web2.0 Web2.0 Web2.0 Communication Advertisement

PowerPoint 프레젠테이션

PowerPoint Template

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표


untitled


PQ 비만과 건강 초등부 비만은 건강을 해친다. 그리고 균형적인 성장에 장애가 되며 활동량이 줄면서 근력과 운동 능력이 약화되며 성인이 되어서도 정상적인 운동 능력을 회복하기가 어려워집니다. 비만은 왜 생길까요? 1. 활동량의 절대적 부족 학습시간의 증가 외에도 TV시

Microsoft PowerPoint - AC3.pptx

1 n dn dt = f v = 4 π m 2kT 3/ 2 v 2 mv exp 2kT 2 f v dfv = 0 v = 0, v = /// fv = max = 0 dv 2kT v p = m 1/ 2 vfvdv 0 2 2kT = = vav = v f dv π m

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구


Lecture12_Bayesian_Decision_Thoery

성도

슬라이드 1

메타분석: 통계적 방법의 기초

(132~173)4단원-ok

untitled

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

, ( ) 1) *.. I. (batch). (production planning). (downstream stage) (stockout).... (endangered). (utilization). *

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Building Mobile AR Web Applications in HTML5 - Google IO 2012

모바일 플랫폼 기반


논총13집.PDF

DBPIA-NURIMEDIA

R을 이용한 텍스트 감정분석

Vostit Product Offerings

融合先验信息到三维重建 组会报 告[2]

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

G Power

Turbine Digital Flowmeter SEMI U+ 특징 PVC, PTFE, P.P, PVDF 등 다양한 재질 Size, 유량, Connection별 주문제작 정밀성, 내화학성이 우수 4~20mA, Alarm, 통신(RS485) 등 출력 제품과 Controll

<C804><CCB4>.pdf



Microsoft Word - KSR2014S042

Scopus 한국어이용가이드-3차수정

- 2 -

3장 ION M74 자동변속기.ppt

이제는 쓸모없는 질문들 1. 스마트폰 열기가 과연 계속될까? 2. 언제 스마트폰이 일반 휴대폰을 앞지를까? (2010년 10%, 2012년 33% 예상) 3. 삼성의 스마트폰 OS 바다는 과연 성공할 수 있을까? 지금부터 기업들이 관심 가져야 할 질문들 1. 스마트폰은

Communications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는

abstract.dvi

제이쿼리 (JQuery) 정의 자바스크립트함수를쉽게사용하기위해만든자바스크립트라이브러리. 웹페이지를즉석에서변경하는기능에특화된자바스크립트라이브러리. 사용법 $( 제이쿼리객체 ) 혹은 $( 엘리먼트 ) 참고 ) $() 이기호를제이쿼리래퍼라고한다. 즉, 제이쿼리를호출하는기호

Microsoft Word - USB복사기.doc

슬라이드 1

유기 발광 다이오드의 전하주입 효율 향상을 통한 발광효율 향상 연구

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

PowerPoint 프레젠테이션

Multi Channel Analysis. Multi Channel Analytics :!! - (Ad network ) Report! -! -!. Valuepotion Multi Channel Analytics! (1) Install! (2) 3 (4 ~ 6 Page

00-1CD....


목순 차서 v KM의 현황 v Web2.0 의 개념 v Web2.0의 도입 사례 v Web2.0의 KM 적용방안 v 고려사항 1/29

<4D F736F F F696E74202D205B444D435D36BFF95FB5F0C1F6C5D0B9CCB5F0BEEE20B5BFC7E220BAB8B0EDBCAD5F C5EBC7D5BABB29>

KAERITR hwp

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

Google Inc. is an American public corporation, earning revenue from advertising related to its Internet search, , online m

PDF

Windows 8에서 BioStar 1 설치하기

09구자용(489~500)

Intra_DW_Ch4.PDF

SRC PLUS 제어기 MANUAL

Transcription:

Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft s Bing Search Engine Thore Graepel et al., ICML, 2010 Presented by Boyoung Kim April 25, 2018 Boyoung Kim (SNU) April 25, 2018 1 / 12

Sponsored Search Bing 에서의 컴퓨터 검색결과 Boyoung Kim (SNU) April 25, 2018 2 / 12

Sponsored Search Sponsored Search란 광고주가키워드제공하면 검색엔진은광고 ( 웹페이지 ) 를사용자 ( 탐색자 ) 에게제공, 사용자의클릭수에따라광고주에광고비청구하는과정또는구조. 정확한클릭률 (CTR) 추정의중요성 더좋은정보제공을통해사용자만족도를높임 광고주에게더나은거래제시 사용자에게높은클릭률의광고를보여줌으로써수익을올림 Boyoung Kim (SNU) April 25, 2018 3 / 12

Notation 입력변수 이산형변수 N개가있고, i {1,..., N} 번째변수는 M i 개값을갖는다하자. 입력변수는 Sparse binary feature vector로다음과같이나타냄. x := (x T 1,..., x T N ) T 이때, 모든 i {1,..., N} 에대해 x i = (x i,1,..., x i,mi ) T, x i,j {0, 1}, M i j=1 x i,j = 1. ex) 광고주, 광고카테고리, Search 키워드, display 위치, 사용자정보등. 라벨 y { 1, 1}, 여기서 -1 은 non-click, 1 은 click 을나타냄. Boyoung Kim (SNU) April 25, 2018 4 / 12

Bayesian Linear Probit Regression GLM with probit link function ( y w T ) x p(y x, w) := Φ β (1) 여기서 Φ (t) := t N (s; 0, 1)ds, β 는 Hyper parameter. Boyoung Kim (SNU) April 25, 2018 5 / 12

Bayesian Linear Probit Regression Prior : factorizing Gaussian prior distribution 가정 N M i p(w) = N (w i,j ; µ i,j, σi,j) 2 (2) i=1 j=1 Posterior p(w x, y) p(y x, w)p(w) (3) 사후분포의계산이어려워서 approximate message passing algorithm 으로추정 Boyoung Kim (SNU) April 25, 2018 6 / 12

Update Equations for Online learning 업데이트 (µ, σ 2, x, y) ( µ, σ 2 ) µ i,j = µ i,j + yx i,j σ2 i,j Σ v σ 2 i,j = σ 2 i,j [ 1 x i,j σ2 i,j Σ w ( y x T ) µ Σ (4) ( y x T ) ] µ (5) 여기서 Σ 2 := β 2 + x T σ 2 ( 전체변동 ), µ := (µ 1,1,..., µ N,MN ) T, σ 2 := (σ 2 1,1,..., σ2 N,M N ) T, Σ v(t) := N (t; 0, 1) Φ(t; 0, 1), w(t) := v(t) [v(t) + t] Boyoung Kim (SNU) April 25, 2018 7 / 12

Predictive Distribution 예측 p(y x) = ( y x T ) µ = Φ Σ p(y x, w) p(w)dw (6) (7) Boyoung Kim (SNU) April 25, 2018 8 / 12

Some Issues 입력변수 dimension 에따른메모리문제 특정 weight 에대해 pruning(prior 값으로하는것 ) 시킴. prior 분포와 posterior 분포의차이가작으면그 weight 를 prunning 함. Boyoung Kim (SNU) April 25, 2018 9 / 12

Some Issues Exploration & Exploitation Exploration : 새로운광고에대해사용자의반응필요 Exploitation : 이미알려진높은 CTR 의광고보여주길원함. weight 의평균만사용할것이아니라, uncertainty 를부여하여 CTR 을다양하게추정하여노출시킨다. Boyoung Kim (SNU) April 25, 2018 10 / 12

Experiments Display 위치에따른 weight 의사후평균, 분산 광고가 Mainline 에보여질수록, 위쪽에보여질수록평균크고분산작다. Boyoung Kim (SNU) April 25, 2018 11 / 12

Experiments 사용자 ID 에따른 weight 의사후평균, 분산 - 위쪽에있는점은 weight 의 prior 에가까운점들이고, 더아래쪽에있는것은자주관찰되서 prior 로부터멀어짐. - 오른쪽극단값들은 bot 임! Boyoung Kim (SNU) April 25, 2018 12 / 12

Personalized Click Model through Collaborative Filtering Si Shen et al., WSDM, 2013 Presented by Boyoung Kim April 25, 2018 Boyoung Kim (SNU) PCM April 25, 2018 1 / 9

PCM Introduction 목적 쿼리가주어졌을때문서 ( 검색결과 ) 클릭률예측 개인화 자연검색결과 ( 광고를제외한결과 ) 만을고려 Boyoung Kim (SNU) PCM April 25, 2018 2 / 9

PCM Notation 각각의관측값은다음과같은구성요소를갖음 C : 클릭여부. C = 1 은클릭을나타냄 u : 사용자, 총 M u 명 q : 쿼리, 총 M q 개 d : 문서 ( 검색결과 ), 총 M d 개 i : 문서위치 ( 검색결과가나타난위치 ) Boyoung Kim (SNU) PCM April 25, 2018 3 / 9

PCM Position model ( 기존모형 ) 가정 사용자의문서에대한클릭여부는문서의제목, 내용일부를검토한후이뤄진다. 사용자가문서를검토할지여부는문서의위치에의존한다. E i = 1 이사용자가 i 번째문서를검토한다는것을나타낼때모형은 P(C i = 1 q, d) = E i P(C i = 1 E i, q, d)p(e i ) (1) = P(C i = 1 E i = 1, q, d)p(e i = 1) (2) := α qd β i (3) 여기서 α qd := P(C i = 1 E i = 1, q, d) ( 문서관련성 ), β i := P(E i = 1) ( 위치편의 ) 라한다. Boyoung Kim (SNU) PCM April 25, 2018 4 / 9

PCM Matrix Factorization Click Model (MFCM) 식 (3) 의문서관련성모수 (α qd ) 에쿼리, 문서각각의특성벡터고려. P(α qdi Q q, D di, σ) N ((Q q D di ), σ 2 ) P(Q q σ Q ) N (0, σ 2 QI ) P(D di σ D ) N (0, σ 2 DI ) 여기서 d i 는 i 번째문서인덱스, Q R F Mq, D R F M d, F 는잠재요인의수이다. Q q 는 Q 의 q 번째열벡터, D d 는 D 의 d 번째열벡터를나타낸다. 쿼리, 문서의잠재벡터로부터 insight 얻을수있음 새로운쿼리, 문서조합에대해서도예측가능 Boyoung Kim (SNU) PCM April 25, 2018 5 / 9

PCM Tensor Factorization Click Model (PCM) 개인화 N i 를사용자의 i 번째문서에대한흥미여부라하자. P(C i = 1 q, d, u) = P(E i = 1, N i = 1 q, d, u) = P(N i = 1 E i = 1, q, d, u)p(e i = 1) α uqdi := P(N i = 1 E i = 1, q, d, u) 라하면 P(α uqdi U u, Q q, D di, σ) N ((U u Q q D di ), σ 2 ) (4) P(U u σ U ) N (0, σ 2 UI ) (5) P(Q q σ Q ) N (0, σ 2 QI ) (6) P(D di σ D ) N (0, σ 2 DI ) (7) 여기서 U R F Mu 이고, U u Q q D di = F f =1 U fu Q fq D fdi. Boyoung Kim (SNU) PCM April 25, 2018 6 / 9

PCM Tensor Factorization Click Model (PCM) PCM 의 Graphic representation Boyoung Kim (SNU) PCM April 25, 2018 7 / 9

PCM Hybrid Personalized Model (HPCM) 식 (4) 에서쿼리와문서사이의상호작용을강조하고, 개인화실현을위해 residual 부분만사용자의 latent factor 고려 P(α uqdi Q q, D di U u, Q q, D di, σ) N ( Q q D di + U u Q q D di, σ 2 ) 사전분포는다음과같다. P( Q q σ Q ) N (0, I ) σ2 Q P( D di σ D ) N (0, I ) σ2 D P(U u σ U ) N (0, σ 2 UI ) P(Q q σ Q ) N (0, σ 2 QI ) P(D di σ D ) N (0, σ 2 DI ) Boyoung Kim (SNU) PCM April 25, 2018 8 / 9

PCM Hybrid Personalized Model (HPCM) HPCM 의 Graphic representation Boyoung Kim (SNU) PCM April 25, 2018 9 / 9