本文作者從具體的工作實(shí)踐出發(fā),結(jié)合案例等分享了非常實(shí)用的大范圍排序中的類目預(yù)測(cè)知識(shí),供大家一同參考和學(xué)習(xí)。
在上一章節(jié)中,給大家簡(jiǎn)要的介紹了下搜索的具體流程,從輸入關(guān)鍵詞點(diǎn)擊搜索按鈕那一刻起,到搜索結(jié)果頁(yè)呈現(xiàn)給用戶的眨眼間,是經(jīng)過了怎樣的步驟和流程才呈現(xiàn)到我們面前。
其中有一些步驟我覺得可以深入講解一下,但是睡了一覺后,覺得可能對(duì)于產(chǎn)品運(yùn)營(yíng)的讀者你們有點(diǎn)過于晦澀和枯燥,即便知道了其中的奧妙對(duì)你們未來的運(yùn)營(yíng)工作也沒有太大的幫助比如分詞算法。
因此為了節(jié)省大家的時(shí)間,我還是挑重點(diǎn)說,本章就著重講解一下大范圍排序中的類目預(yù)測(cè)環(huán)節(jié)。以及結(jié)合我現(xiàn)在所在的單位起初的一些沙雕的操作,也順帶給各位立志想進(jìn)入產(chǎn)品圈的小年輕一些產(chǎn)品設(shè)計(jì)以及溝通中的建議,方法論什么的我就不想說了,太虛,就直接上操作吧。
類目預(yù)測(cè)
什么叫類目預(yù)測(cè)?舉個(gè)簡(jiǎn)單的例子吧。如果輸入關(guān)鍵詞“手機(jī)”排在前面出來的是手機(jī)類目而不是手機(jī)殼類目,這就是類目預(yù)測(cè)。
根據(jù)搜索全詞匹配的原則,只要商品標(biāo)題或者屬性或者類目名稱等帶有“手機(jī)”關(guān)鍵詞的商品,都會(huì)被召回,而類目預(yù)測(cè)的作用就是將這些已經(jīng)召回的商品按照類目?jī)?yōu)先級(jí)進(jìn)行排序的過程。
說起來簡(jiǎn)單,做起來就老費(fèi)勁了!如果僅僅從營(yíng)銷數(shù)據(jù)來進(jìn)行排序,手機(jī)殼單價(jià)低,商品數(shù)量眾多,相比于手機(jī)類目 單價(jià)高,數(shù)量可能遠(yuǎn)遠(yuǎn)不及配件。
那么如果我是個(gè)沒有感情的排序機(jī)器,我應(yīng)該優(yōu)先排哪個(gè)呢?
肯定是手機(jī)殼在最前面,因?yàn)槭謾C(jī)殼類目全方位的數(shù)據(jù)都比手機(jī)類目要好,為什么不排手機(jī)殼呢?很有道理。但是從消費(fèi)者意圖來講,用戶要的是手機(jī),不是手機(jī)殼,你這個(gè)數(shù)據(jù)再好看,對(duì)于消費(fèi)者肯定也是不準(zhǔn)的。
所以對(duì)于消費(fèi)者來說,類目預(yù)測(cè)的效果如何,是衡量搜索準(zhǔn)確性的入門指標(biāo)。由于目前國(guó)內(nèi)的電商巨頭都已經(jīng)通過了前期的人工收集,機(jī)器算法輔助階段,亦或已經(jīng)通過第三方的搜索解決方案提供商能夠提供比較完備的預(yù)測(cè)算法和方案。
那么此篇文章針對(duì)那些初創(chuàng),或者對(duì)搜索結(jié)果頁(yè)還不甚滿意且有至于自己優(yōu)化的企業(yè)有參考意義。(我將在最后一期給大家介紹一下,如何搭建一個(gè)比較完備且經(jīng)濟(jì)的站內(nèi)搜索產(chǎn)品方案)
類目預(yù)測(cè)我們分為兩部分講解,人工和機(jī)器算法
人工
很簡(jiǎn)單,直接在產(chǎn)品后臺(tái)搭建一個(gè)關(guān)鍵詞和類目的關(guān)聯(lián)表。做這個(gè)產(chǎn)品時(shí),產(chǎn)品經(jīng)理需要注意的問題點(diǎn)有如下幾個(gè):
- (1)該產(chǎn)品面向的使用用戶是誰(shuí)?肯定是搜索運(yùn)營(yíng)人員。首先要滿足的是用戶的使用方便,可以批量導(dǎo)入和導(dǎo)出功能,增刪改查一個(gè)都不能少。
- (2)該產(chǎn)品運(yùn)營(yíng)的主要內(nèi)容是什么?關(guān)鍵詞,因此對(duì)于關(guān)鍵詞我們要區(qū)分語(yǔ)言,如果app涉及到多個(gè)語(yǔ)言區(qū)國(guó)家,因此就要分開運(yùn)營(yíng),而且不同語(yǔ)言之間的互通生效;且對(duì)于音型文字需要對(duì)多種時(shí)態(tài)變體,以及同義詞生效。
同樣的關(guān)鍵詞,互換位置后也一樣生效,比如“手機(jī)蘋果”和“蘋果手機(jī)”等。這樣可以減少人工維護(hù)的詞量。(我現(xiàn)在所在的單位依舊采用的是絕對(duì)匹配的邏輯,這個(gè)坑依舊沒有填。這個(gè)也給了我一個(gè)啟示,做產(chǎn)品規(guī)劃時(shí)一定要先期做好細(xì)節(jié)處理,雖說不用100%的面面俱到,但是最起碼的主要矛盾還是要考慮的)
- (3)精確全詞匹配還是以中心詞匹配,一直是我入職以來的爭(zhēng)論,從一個(gè)站內(nèi)搜索體系搭建以來,人工全詞匹配一直是領(lǐng)導(dǎo)層最相中的。因?yàn)槟軌蚋斐龀煽?jī),只需要幾個(gè)人 每天對(duì)著top詞來維護(hù)一遍就能達(dá)到數(shù)據(jù)提升的效果。
①精確全詞匹配預(yù)測(cè)
什么叫精確全詞匹配預(yù)測(cè),就是我搜索“蘋果手機(jī)128g”如果在人工維護(hù)的詞庫(kù)里只有“蘋果手機(jī)”這個(gè)詞,一樣是無(wú)法命中人工類目預(yù)測(cè),因此人工維護(hù)的全詞匹配的詞量是極其巨大的。
而且用戶輸入的關(guān)鍵詞是沒有規(guī)律可循的,什么樣的順序都無(wú)法預(yù)測(cè),因此詞功能只能作為快速修補(bǔ)關(guān)鍵詞呈現(xiàn)bug的功能。
②中心詞匹配預(yù)測(cè)
那什么叫中心詞匹配預(yù)測(cè),這個(gè)其實(shí)是基于一個(gè)合理的假設(shè),即電商網(wǎng)站是來購(gòu)物的,用戶進(jìn)行app瀏覽和搜索都是基于某種物品或者品牌需求,那么我們有理由相信只需要收集有限物品詞以及品牌詞就能涵蓋絕大部分搜索類目預(yù)測(cè)需求,那么這些物品詞或者品牌詞就是我們的中心詞。
比如用戶搜索“手機(jī)128g”那么“手機(jī)”就是中心詞,人工的中心詞詞庫(kù)只需要維護(hù)“手機(jī)”對(duì)應(yīng)前端/后端類目就能起到類目預(yù)測(cè)的效果,以點(diǎn)帶面會(huì)取得不錯(cuò)的效果。
也許有人會(huì)說,如果用戶輸入“手機(jī)殼”不也是預(yù)測(cè)到手機(jī)類目了么,也是預(yù)測(cè)錯(cuò)了。因此在此需要引入n-gram的策略,一般而言詞組優(yōu)先級(jí)要高于單詞。也就是說詞庫(kù)是優(yōu)先匹配詞比較長(zhǎng)的,如果詞長(zhǎng)的沒有,再去匹配詞短的。
類目預(yù)測(cè)的邏輯是,某個(gè)關(guān)鍵詞只要通過算法或者人工預(yù)測(cè)到了類目,則會(huì)在預(yù)測(cè)的類目?jī)?yōu)先進(jìn)行and查詢并召回排序,然后在非預(yù)測(cè)類目and查詢并召回排序。
也就是說如果在預(yù)測(cè)的類目里如果搜索不到產(chǎn)品,這個(gè)預(yù)測(cè)也沒啥用?;蛘哒f是預(yù)測(cè)錯(cuò)類目。(當(dāng)然也有例外,當(dāng)一個(gè)用戶搜了一個(gè)特別刁鉆的詞“蘋果土豪金128g送給媽媽的禮物”算法或者人工預(yù)測(cè)到的類目是手機(jī)類目,但是and查詢?cè)谠擃惸繜o(wú)結(jié)果,此時(shí)可以采用減詞算法進(jìn)行智能減詞,提取關(guān)鍵詞主干供用戶選擇)。
機(jī)器算法
所謂機(jī)器算法是根據(jù)用戶的行為數(shù)據(jù)以及商品本身的固有信息得來的。
那么采用機(jī)器算法的邏輯基于詞頻和用戶的點(diǎn)擊行為基于貝葉斯理論(百度的意思就是:如果你看到一個(gè)人總是做一些好事,則那個(gè)人多半會(huì)是一個(gè)好人。這就是說,當(dāng)你不能準(zhǔn)確知悉一個(gè)事物的本質(zhì)時(shí),你可以依靠與事物特定本質(zhì)相關(guān)的事件出現(xiàn)的多少去判斷其本質(zhì)屬性的概率。 用數(shù)學(xué)語(yǔ)言表達(dá)就是:支持某項(xiàng)屬性的事件發(fā)生得愈多,則該屬性成立的可能性就愈大)。
貝葉斯算法需要有一定的數(shù)據(jù)訓(xùn)練集,而這些數(shù)據(jù)訓(xùn)練集是需要商品數(shù)據(jù)以及關(guān)鍵詞對(duì)應(yīng)的(關(guān)鍵詞與用戶點(diǎn)擊類目商品的概率)。
通過不斷的對(duì)訓(xùn)練集訓(xùn)練結(jié)果的優(yōu)化和評(píng)估,最后得出一個(gè)比較好的貝葉斯模型。這樣關(guān)鍵詞即與商品數(shù)據(jù)結(jié)合在一起,成了我們的機(jī)器類目預(yù)測(cè)。
作者:王歡,微信:wanghuan314400,運(yùn)營(yíng)小灰一枚。
愛盈利-運(yùn)營(yíng)小咖秀(www.jza6.com) 始終堅(jiān)持研究分享移動(dòng)互聯(lián)網(wǎng)App運(yùn)營(yíng)推廣經(jīng)驗(yàn)、策略、全案、 渠道等純干貨知識(shí)內(nèi)容;是廣大App運(yùn)營(yíng)從業(yè)者的知識(shí)啟蒙、成長(zhǎng)指導(dǎo)、進(jìn)階學(xué)習(xí)的集聚平臺(tái);
想了解更多移動(dòng)互聯(lián)網(wǎng)干貨知識(shí),請(qǐng)關(guān)注微信公眾號(hào)運(yùn)營(yíng)小咖秀(ID: yunyingshow)
【轉(zhuǎn)載說明】  若上述素材出現(xiàn)侵權(quán),請(qǐng)及時(shí)聯(lián)系我們刪除及進(jìn)行處理:[email protected]