一個(gè)成熟的個(gè)性化推薦系統(tǒng),不會(huì)讓用戶變得狹隘,反而會(huì)擴(kuò)寬用戶視野。
當(dāng)你看著網(wǎng)易云音樂(lè)的推薦歌單,一樣的歌手、一樣的類型,是不是有點(diǎn)厭倦?
當(dāng)你看著今日頭條的Feeds流,一樣的八卦、一樣的娛樂(lè)新聞,是不是想卸載app?
你是不是覺(jué)得,個(gè)性化推薦讓你愈發(fā)狹隘?
為什么要做個(gè)性化推薦系統(tǒng)
討論個(gè)性化推薦是否會(huì)讓用戶變得狹隘,我們不妨先從“為什么要做個(gè)性化推薦系統(tǒng)”這個(gè)角度進(jìn)行思考。
從背景出發(fā):人們正逐漸從信息匱乏的時(shí)代走入信息過(guò)載的時(shí)代。這一背景帶來(lái)了兩個(gè)問(wèn)題:信息過(guò)載、用戶目的性不強(qiáng),典型場(chǎng)景是:你打開(kāi)網(wǎng)易云音樂(lè),很多歌曲,你不知道想聽(tīng)什么。
在個(gè)性化推薦未出現(xiàn)之前,解決這兩個(gè)問(wèn)題采取的方法一是類目管理,二是搜索,三是熱門(mén)物品展示。
一不適用于物品多的情況,二需要用戶準(zhǔn)確描述需求,三的弊端是會(huì)加劇長(zhǎng)尾效應(yīng),且命中率低。而個(gè)性化推薦系統(tǒng)根據(jù)用戶歷史行為挖掘用戶需求,與搜索引擎互補(bǔ)。
因此,做個(gè)性化推薦的目的是:在物品數(shù)量多的情況下,聯(lián)系用戶與產(chǎn)品,挖掘用戶潛在需求,解決長(zhǎng)尾問(wèn)題。
如何考評(píng)個(gè)性化推薦效果
進(jìn)而,我們可以從“如何考評(píng)個(gè)性化推薦效果”這個(gè)角度進(jìn)行思考
以下是綜合市面上相關(guān)個(gè)性化產(chǎn)品,總結(jié)而出的相關(guān)指標(biāo):
- 用戶滿意度
- 準(zhǔn)確度
- 覆蓋率(長(zhǎng)尾 馬太效應(yīng) 用基尼系數(shù))
- 多樣性 、新穎性(是否聽(tīng)說(shuō)過(guò)這個(gè)推薦結(jié)果)
- 驚喜度(和歷史興趣不同 卻滿意)
- 信任度(給出推薦理由 給出推薦源于那個(gè)好友)
- 實(shí)時(shí)性(推薦相關(guān)產(chǎn)品實(shí)時(shí) 將新加入的產(chǎn)品推薦)
- 健壯性(即魯棒性 抗作弊能力 可以通過(guò)加大用戶行為成本來(lái)實(shí)現(xiàn))
- 其他商業(yè)目標(biāo)
不展開(kāi)細(xì)講,我們著重討論用戶滿意度、多樣性、驚喜度和準(zhǔn)確度
- 用戶滿意度:這個(gè)不用細(xì)說(shuō)
- 準(zhǔn)確度:推薦系統(tǒng)最為重要的指標(biāo)(沒(méi)有之一),但是準(zhǔn)確的預(yù)測(cè)不一定是好的預(yù)測(cè)。舉個(gè)例子:用戶早就準(zhǔn)備買(mǎi)A書(shū),無(wú)論是否系統(tǒng)向他推薦,均會(huì)購(gòu)買(mǎi)。那么對(duì)于用戶來(lái)說(shuō),他會(huì)覺(jué)得這個(gè)結(jié)果不新穎,沒(méi)有新鮮感。
- 多樣性:用戶興趣廣泛,可能喜歡看AV,也喜歡看新聞聯(lián)播;多樣性描述了推薦列表中物品兩兩之間的不相似性。
- 新穎性:用戶之前沒(méi)有聽(tīng)說(shuō)過(guò)的產(chǎn)品具有新穎性。
接下來(lái),回想一下,在網(wǎng)易云音樂(lè)界面,系統(tǒng)推薦的音樂(lè)分為幾類
- “你愛(ài)吃肉,那我給你各種肉”
- “你愛(ài)吃肉,我發(fā)現(xiàn)你是缺乏肉類富含的脂肪,那我給你推薦富含脂肪的牛油果”。
回到我們的問(wèn)題,是不是就是因?yàn)榈谝环N情況,讓你覺(jué)得“個(gè)性化推薦會(huì)讓用戶變得狹隘”?
其實(shí)就是推薦系統(tǒng)在滿足準(zhǔn)確性的基礎(chǔ)上,沒(méi)有滿足多樣性與新穎性,進(jìn)而降低了用戶滿意度。簡(jiǎn)而言之,對(duì)于潛在需求挖掘不夠深。
所以在這里,第一個(gè)結(jié)論是:不夠全面的個(gè)性化推薦會(huì)讓用戶變得狹隘
那么,個(gè)性化推薦怎么才能讓用戶信息接觸面擴(kuò)寬,而不是狹隘呢?
我們以常用的協(xié)同過(guò)濾為例(具體請(qǐng)百度),從相似度矩陣(Similarity Matrix)說(shuō)起
“你愛(ài)吃肉,那我給你各種肉”
這種情況下,我們用筷子往下翻,可能會(huì)看到蔬菜。但是用戶的視野就那么大,再好的推薦不能忍用戶看見(jiàn)也是扯淡。所以我們可以引入懲戒機(jī)制,適當(dāng)降低同類物品權(quán)重,降低其排位。
小澤瑪利亞發(fā)新片,用戶蜂擁去看,包括蒼井空的一眾擁躉們也跑去觀望了一下。這樣的情況持續(xù)了一個(gè)多月,這下好了,喜歡蒼井空的用戶看到的推薦里面現(xiàn)在幾乎都能看到小澤瑪利亞的片,盡管兩者實(shí)際上不至于這么相關(guān)。
由于這個(gè)效應(yīng),許多用戶從個(gè)性化推薦點(diǎn)開(kāi)小澤瑪利亞的片,造成了一個(gè)惡性循環(huán),使得你的Similarity以為他們真的相關(guān),這時(shí)候其他真正相關(guān)的優(yōu)質(zhì)推薦卻被擠壓到后面了。所以我們可以再次引入懲戒機(jī)制,把熱門(mén)片推后吧。
假設(shè)現(xiàn)在有一個(gè)素人,身材好,長(zhǎng)得像蒼井空,技術(shù)好,反正就是非常相關(guān),蒼井空的球迷肯定會(huì)喜歡那種。但是她剛剛出道,公司資源也不多,宣傳力度不大,片源也少,只有少數(shù)幾個(gè)網(wǎng)站有片源,只有被少數(shù)的幾個(gè)蒼井空迷發(fā)掘。
現(xiàn)在問(wèn)題來(lái)了,這么讓她被挖掘出來(lái)呢?這個(gè)基本上與上一個(gè)問(wèn)題相反,這是冷門(mén)的優(yōu)秀推薦很難被發(fā)掘,長(zhǎng)尾物品關(guān)注量少,馬太效應(yīng)加劇。這時(shí)候我們可以用點(diǎn)歸一化(Normalization)的小伎倆微調(diào)一下。
以上是常見(jiàn)的幾個(gè)狹隘化現(xiàn)象,分別用相關(guān)方法加以算法微調(diào),得以解決。
因此,結(jié)論是:一個(gè)成熟的個(gè)性化推薦系統(tǒng),不會(huì)讓用戶變得狹隘,反而會(huì)擴(kuò)寬用戶視野。
分享干貨我們是認(rèn)真的,更多干貨盡在愛(ài)盈利!