本篇文章介紹了電商搜索的工具——搜做引擎,其3個核心能力:詞庫、權(quán)重、索引。
最簡單的電商搜索是針對商品名稱,隨著技術(shù)進步,用戶搜索的內(nèi)容五花八門,只僅針對商品名稱的搜索已經(jīng)遠遠不能滿足用戶的需求,這個時候行業(yè)里面引入了一個工具——搜索引擎。
搜索引擎主要為我們提供3個核心能力:詞庫、權(quán)重、索引,還可能包含其他一些附屬功能,比如評價體系、數(shù)據(jù)統(tǒng)計等,下面我們主要來說下搜索引擎的這3個核心能力。
一、詞庫
1.1 數(shù)據(jù)準(zhǔn)備
搜索引擎可以對用戶輸入的搜索詞做預(yù)處理,以此提供用戶更想要的搜索結(jié)果,比如近義詞、分詞、兼容拼音、糾錯功能等,除了有通用的詞庫可以解決掉一般性的輸入問題之外,最主要的就是針對用戶以往的搜索詞去定期完善相應(yīng)的詞庫。
所以在構(gòu)建相應(yīng)的詞庫之前,需要對用戶以往的搜索詞做好相應(yīng)的統(tǒng)計,包括每個搜索詞的搜索人數(shù)占比、搜索結(jié)果點擊率以及每個搜索詞的下單轉(zhuǎn)化情況等,有了這些數(shù)據(jù),我們就可以有針對性的優(yōu)先優(yōu)化最有價值的搜索詞,另外還可以通過這些數(shù)據(jù)查看優(yōu)化后的結(jié)果。
1.2 近義詞
比如用戶搜索的是“充電寶”,但實際上專業(yè)名詞叫“移動電源”,再比如“充電器”,專業(yè)名詞叫“電源適配器”等等,根據(jù)用戶的搜索數(shù)據(jù),我們需要定期把這些對應(yīng)關(guān)系更新到近義詞庫,如圖15-1。
圖15-1 近義詞詞庫(圖片來源:小米商城)
1.3 分詞
分詞的意思是說,如果用戶的搜索詞比較長,比如“防霧霾口罩”,但是商品標(biāo)題是“過濾防護口罩”,這個時候如果按照完全匹配是匹配不到的,分詞的作用就是把搜索詞分成“防霧霾”+“口罩”,這樣搜索的結(jié)果集就會大大增加。如圖15-2:
目前已經(jīng)有通用的分詞詞庫,用來處理常見的分詞,但是對于一些專有名詞,或者一些需要系統(tǒng)特別處理的詞,比如手機行業(yè)里的“全面屏”,需要我們自己根據(jù)數(shù)據(jù)統(tǒng)計的結(jié)果定時更新到分詞詞庫。
圖15-2 分詞(圖片來源:天貓)
1.4 其他
包括錯別字、兼容拼音、去重等,原理跟近義詞、分詞類似,這里想討論一個問題:如果用戶的搜索詞是錯的,我們應(yīng)該如何處理?如圖15-3,第一張圖,用戶搜索了“xiaomi”,小米商城直接給用戶顯示了“小米”的搜索結(jié)果,也就是幫用戶糾正了錯誤。而第二張圖,用戶搜索“永衣”,天貓先給用戶顯示了“永衣”的搜索結(jié)果,再問用戶是不是在找“泳衣”。
那到底是先顯示“永衣”的搜索結(jié)果,再問用戶是不是搜索“泳衣”,還是直接幫用戶糾正為“泳衣”的搜素結(jié)果,再問用戶是否仍然搜“永衣”?
我個人的建議是,在“永衣”有搜索結(jié)果的情況下,先幫用戶顯示“永衣”的搜索結(jié)果,再問用戶是不是搜索“泳衣”。因為“永衣”有搜索結(jié)果,所以我們并不能完全確認用戶的搜索詞是否錯誤,如果直接幫用戶糾正錯誤,從尊重用戶的角度來說是不合適的,甚至可能是多余的。
如果“永衣”沒有搜索結(jié)果,則直接給用戶顯示“泳衣”的搜索結(jié)果,并且不是提示用戶是否仍然搜索“永衣”,因為“永衣”沒有搜索結(jié)果,還讓用戶搜索干嘛?而是類似圖15-2,告訴用戶“永衣”沒有搜索結(jié)果,已為您推薦“泳衣”的相關(guān)商品。
圖15-3 糾錯(圖片來源:小米、天貓)
二、權(quán)重
權(quán)重就是跟搜索結(jié)果排序相關(guān)的,從電商的角度來說,包括但不限于商品、用戶、運營等維度。
商品可能包括品類、商品名稱、副標(biāo)題、顏色、規(guī)格參數(shù)等,用戶相關(guān)的就包括購買、推薦、收藏、點擊等,運營相關(guān)的包括促銷、新品、熱賣等。
每一項有一個權(quán)重值,經(jīng)過一系列的算法計算,權(quán)重越高的商品搜索結(jié)果越靠前。跟詞庫類似,權(quán)重也是需要定期更新不斷完善的過程。
三、索引
索引是搜索引擎的一個重要特性,我們知道一般的數(shù)據(jù)庫也可以創(chuàng)建索引,但主要是針對具體數(shù)據(jù)類型確切數(shù)值的精確篩選,而大數(shù)據(jù)量下的實時處理能力,以及基于語義、相關(guān)性方面的搜索,還需要搜索引擎的支持。
搜索引擎需要定期從商城獲取數(shù)據(jù)創(chuàng)建索引,數(shù)據(jù)內(nèi)容包括了之前提到的商品、用戶、運營等相關(guān)的數(shù)據(jù),如果對實時性要求比較高,就增量同步,實時性要求不高,則可以定期全量同步。
用戶從搜索到最終獲得搜索結(jié)果的流程如圖15-4:
圖15-4 用戶搜索流程
總結(jié)
本文以電商為例,詳細講解了搜索引擎提供的詞庫、權(quán)重、索引3個核心能力,包括它們是如何應(yīng)用在我們的產(chǎn)品當(dāng)中,以及在日常的搜索優(yōu)化工作中,需要做哪些事情,希望對各位有所幫助。
文章來源:人人都是產(chǎn)品經(jīng)理
【轉(zhuǎn)載說明】  若上述素材出現(xiàn)侵權(quán),請及時聯(lián)系我們刪除及進行處理:[email protected]