27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () 27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () pª yp º º wxm O* ** *** G ƒ¹ * * ƒ {sun2@ntop O, sn}.snu..r ** ƒ z tsou@sunyu.u *** wooy@m.om R W Sr Mnsm usn Ln Inormton Sun Km O* TSoo Lm ** Wooy L *** Su Ho Kn * * pt. o Inustr nnrn, Sou Nton Unvrsty ** pt. o omputr nnrn, Sunyu Unvrsty *** pt. o Inustr nnrn, In Unvrsty Ž ˆ «s ³ ³ s m t, popurty, «qž, «ª ¼ ƒ t (srty prom)p. y ƒ p ƒ p x ³ Ž ³ pª m º wx ˆ. º pª v zƒ º x ³ pª p «, n. y ƒ Ž º wx ¼ ƒ t º y.. ƒ m ³v ƒ, ¹ ƒ s y ˆˆ y. ƒ m y w rƒ ƒ º yp ƒx., y º m º y ƒ. um y º, º ƒ t ƒ ˆ ƒ. v m yp t y zž prson r ƒ ±Ž y. ƒ Knr[] zo op ³yr. ƒ (Sp qury) ) "os Ntsp support t JK. o-snn PI?" y³ƒ (ro-top qury) ) "Fn normton out t Jv prormmn nu." ƒ (Smr-p qury) ) "Fn ps 'smr' to v.sun.om." ƒº q n ƒ prson, r Ž m ƒ ª, ˆ q ¼ ƒ t (srty prom)m. v m x y³ƒ ³ t (unn prom),, r ƒ vƒ t mƒ, ƒ t p ƒ. v.sun.om ³ p. v m ³ p ƒ t ˆ VSM(Vtor Sp Mo) v p ½ t. VSM v ƒ p t m (omonym), (poysmy) t vƒ top-rt t. tvst[2] Goo[3][4] y (rwr) v ƒ. Top-rt t tƒp s m prson t p v r, p ²pª v zƒ(ln nyss) º wx Ž [5]. ²pª º ƒp ymƒ, ³ p zƒ r. ²pª ³ ¹ p ƒ z m r, ³«(Goo om) zz. zƒ OnStt.om[6] pr ƒ ([ p] ).
27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () 27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () r º p p«¼ ƒ t p ƒ. p ƒ popurty ƒ., popurty z r p ¼ ƒ t p ºo Ž. [ p ] p xº [6] t ¹ s x «p s ³ ³ s m. σ, σ 2, σ 3, zz σ σ 2 σ 3 p ³ ³ ()p m ˆ p. ƒ s p ³ ³ p., (P: Prossor L) Ž(L: Ltur Nots) ƒ º(W: W Struturn) Ž ˆ σ = P, σ 2 = L, σ 3 = W ¹. v m ¼ ƒ t 3 om zo. š, «rƒ r ½ ¼ ƒ t yÿ, š, ¹ ³ p, š, ³ p. t Ž p z, p ¹ z ywˆ(v & onqur)., zz, σ σ 2 mz σ 3, ¹ σ σ 2 σ 3 p, ¹ σ 2 σ 3 x m ¹ ºˆ m ˆ. wˆ ƒ ª v, ƒ x y³ƒ ª z v. t ƒwš mƒ ³ p m ³ p ˆ wˆ m t p. y p ƒ t x p ³ z ³ p z x p ³ ³ pª r ³ m Ž ƒ v. tm ³ pª ³ «s p ³ Ž t mƒ p Ž. p, y ƒ, ƒ, ƒ ¼ ƒ t p pª v zƒ º º Ž p Ž. ³ pªm n ³ ( )m. x º r z (mutp su-top qury) p º m p. 2. Ž p y ƒ «m y, ³ ² pª( pª)p. ƒr Ž p «, «³ mz ƒm pª p «m ³ pª p m wˆ. r, m ˆ ³ ³ Sσ Ž ƒ. Sσ ª m Sσ z x t ³ ³ (rvnt p) q Sσ z rvnt p š op m pª Sσ p. r, (qury trm)p σ ƒ z σ,,σ t ƒ ³ ƒ p RootSt R,,R m. ˆ RootSt ƒm pª º r, º º p op m, º ³ sst,, m. pª w ƒ(noun, outoun) tˆ. sst ³ oxm yr.
27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () 27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () o : σ ~ σ ³ (RootSt) o :RootSt mz op pªm º ³ (sst) o : o r, sst y ³ o : o r, o o ³ p pªm ³ o : o ƒ o, ³ Ž ³ p om n Sσp ˆ. p2 ƒ t=3, 3³ m ƒ RootSt =2, RootSt 2w º p sst, p Ž p mƒ «, ³ ( ) pª «. 4σ #TF4FU # J # K 3PPU4FU 3 J 3 K UI [ p 2] Sσ ƒƒ Ž p ª zz m n. wš zz σ ~ σ RootSt p (Ž p3, RIH-SRH 3~5 ). RIH-SRH (σ, t) Mn sr ortm w nput s rry σ onsstn o qury trms Grp[] [NoURL[],NoWt[], []] 2 Stor strutur o Grp 3 or to σ 4 o R[,..t] USTOM-SRH (σ[]) 5 or qury trm, rtrv top t rvnt ps usn ustom sr nn Goo. 6 or to t 7 o Grp[] MINIMUM-XPN(R[,]) 8 or s p n R[,..t], rtrv mnmy xpn ntwor. 9 or to t o quty[] NTROI-STIMT (Grp[], µ) rturn mxmum[quty[]..quty[t]] [ p 3] RIH-SRH Ž p wš zz x RootSt š pª p «RootSt sst m º sst y ³ p (zm MINIMUM-XPN ~3 ). ƒwš zz ˆ p sst w pª( ) mz m ³ pª p (ny mtrx) (zm MINIMUM-XPN 4~23 ). p p m wš zz ³ ( )mz zz (zm NTROI-STIMT). Ž p RIH-SRH p3. p4 p2 x RootSt z Ž p wš ƒ n sst º v ³ URL w ƒƒ y (zm MINIMUM-XPN ~3 ). r σ, σ m RootSt R, R ƒƒ. p4 ƒ =, =+ r,» =- vy. sst RootSt R ³, R m. NoURL w y ³ Ž r p opž º rƒ y³ tp y³ ƒƒ n. p4 ƒ 2op º ƒ ³ p º y. Ž p wš ƒƒ ¹ (----)p w Rm =- vy.. (ny Mtrx) m n n (n ³ ). = ³, otrws. pª...() 2. º (ny Mtrx xpnson) q º m n. nymtrx, =...(2) T, ¹ -, º ³ ³ ³ ³,.
ŽŒ ŽŒ u Œ ys ˆS SŠ u Œ ys 3PPU4FU 3J 3K#K #J [] 3J #J 3K #K ŽŒ ŽŒ u Œ ys ˆS SŠS SŒS SŽS u Œ ys SS 3J #J 3K #K ŽŒ ŽŒ u Œ ys GG ˆS SŠS SŒS SŽS S S S S S u Œ ys SSSS zro xpnson xpnson 2 xpnson [ p 4] RootSt sst m º p xº n uv SS "KFOZ.USJY#J "KFOZ.USJY#K n uv SSS S [ p 5] ³ p5 Ž p ³ p º sst, mz m ³ pª p «y. p 4 ƒ ƒ ---- ³ v pª. ³ p º, ( p 4 {). r mz wš ƒz p p ˆ p p r ˆ p w m ˆ z p p p vyˆ rƒ p Ž, vy r RootSt R ³ mz ³ m m ³ pª p. ˆ º vy r x σ σ ³ v pª p. 3. pª v zƒ zž ƒ ˆ t, zƒ(tton nyss) ˆ. ƒ p ƒ º p y m. Ž Gr[7] mpt tor [5]. zƒ ƒ º ƒ ³ pª m y r, pª v zƒ pª yp º n. y ƒ ¼ ƒ t p pª v zƒ º, pª v zƒ 27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () 27 한국컴퓨터종합학술대회논문집 Vo. 34, No. ()
27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () 27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () VSM v ƒ ³ t [,4] ƒ t []p º. ³, ¹ n «³. p x Ž m, pp ƒ t m ( p ƒ m), ³ ³ m r ƒ, r m ¼ ƒ t p. ƒ t m º (Qury xpnson)[8]. º psuo-rvn wx m š p m º m wx. º wx ˆ ¼ ƒ t p y m s r z t º m ½. 4. m y ƒ t,, s «p ³ ³ wž ˆ. p y ƒ x «pª p «Ž p ˆ Ž p m p Ž. y ƒ ˆ wx., popurty ( z r p ) ¹ ³ p m Ž ¼ ƒ t º Ž y. 5. t. Knr, M., utorttv Sours n Hyprn nvronmnt, T Journ o t M, Vo.46, No.5, pp.64 632, 998. 2. tvst, ttp://www.tvst.om/ 3. Goo, ttp://www.oo.om/ 4. rn, S., P, L., T ntomy o r-s yprtxtu w sr nn, omputr Ntwors, Vo.3, No.-7, pp7 7, 998. 5. Hou, J., Zn, Y., tvy Fnn Rvnt W Ps rom Ln Inormton, I TK, Vo.5, No.4, pp94 95, 23. 6. OnStt.om, ttp://onstt.om/ 7. Gr,., tton nyss s Too n Journ vuton, Sn, Vo.78, pp.47 479, 972. 8. n, N.J., oo,., Ky,., Km, G., Km, J.-Y., L, H.-J., Mursn, G., Tn, M.-., Yun, X.-J., Qury Lnt n Intrtv Inormton Rtrv, In Pro. SIGIR, pp. 25-22, 23
27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () 27 한국컴퓨터종합학술대회논문집 Vo. 34, No. () zm - Ž p MINIMUM-XPN(R[,]) o [] R[,] 2 so, upt NoURL_, NoWt_, _ wt R[,] 3 or to t 4 o 2[] R[2,] 5 onstruton o two s st or xpnson 6 so, upt NoURL_2, NoWt_2, _2 wt R[2,] 7 or to σ - 8 o nx 9 trntvy xpn n 2 t op unt 2 NIL so, upt NoURL_, NoWt_, _ wt so, upt NoURL_2, NoWt_2, _2 wt 2 2 TmpNo 2 3 Grp[] Grp[] + [URL o TmpNo, Wt o TmpNo, ] 4 oumn TmpNo nx t NoURL_, sz nt[nourl_] 5 or row to sz 6 o _[row,oumn] = 7 tn Grp[] Grp[] + [NoURL_[row], NoWt_[row],] 8 oumn row, sz oumn, nx nx+ 9 oumn TmpNo nx t NoURL_2, sz nt[nourl_2] 2 or row to sz 2 o _2[row,oumn] = 22 tn Grp[,nx] Grp[] + [NoURL_2[row], NoWt_2[row],] 23 oumn row, sz oumn, nx nx+ 24 or to Grp[]. NoURL[] 25 o [] Grp[].NoURL[] 26 so, upt NoURL_, NoWt_, _ wt Grp 27 or to t 28 o 2[] R[+2,] 29 so, upt NoURL_2, NoWt_2, _2 wt R[+2,] 3 rturn Grp[] NTROI-STIMT (Grp[], µ) o rn 999, urstp 2 w rn > trso 3 o urstp urstp + 4 or no n Grp[] 5 or t otr nos ( ) 6 o Grp[].NoWt[] Grp[].NoWt[] + Inun(,, µ) 7 nun(,, µ) s ut usn quton (4) 8 o TotWt[] TotWt[] + Grp[].NoWt[] 9 o rn, PrvStp urstp or no n Grp[] o Grp[].NoWt[] Grp[].NoWt[] / TotWt[] 2 or no n Grp[] 3 o rn rn + rn o Grp[].NoURL[] twn PrStp n urstp 4 rturn mxmum[nourl[]] G