无码日韩精品一区二区三区浪潮_99国产精品久久久久9999高清_亚洲熟妇无码久久观看_亚洲a∨无码一区二区猫咪

微信掃碼登錄

其他登錄方式

綁定手機(jī)號

注冊

忘記密碼

用戶協(xié)議

綁定手機(jī)號

近期有不法分子打著愛盈利的旗號,制作“愛盈利”名稱的App,并偽造愛盈利證件,騙取用戶信任,以抖音點贊賺錢或其他方式賺錢為名義,過程中以升級會員獲得高傭金為名讓用戶充值。
愛盈利公司鄭重聲明:我司沒有研發(fā)或運營過任何名為“愛盈利”的APP,我司做任務(wù)賺錢類產(chǎn)品從沒有讓任何普通用戶充值升級會員。我公司產(chǎn)品均在本網(wǎng)站可查詢,請將網(wǎng)站拉至底部,點擊“關(guān)于我們”可查看愛盈利相關(guān)產(chǎn)品與服務(wù)。
溫馨提示:當(dāng)遇到此類問題請撥打官方電話或添加官方微信,以免財產(chǎn)損失。愛盈利官網(wǎng)地址:www.jza6.com。
  • 推廣與合作
X

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!

來源: 2592

本文通過結(jié)合統(tǒng)計學(xué)知識,可以計算各個連續(xù)不活躍月份數(shù)(0-12)下的用戶流失概率,從而預(yù)測用戶流失。

簡單來說,用戶流失率是指用戶的流失數(shù)量與全部使用/消費產(chǎn)品(或服務(wù))用戶的數(shù)量的比例,是用戶流失的定量表述,以及判斷用戶流失的主要指標(biāo),直接反映了產(chǎn)品的市場接受程度如何,以及運營工作的好壞。

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


一般來說,這個指標(biāo)用在“訂閱型產(chǎn)品”的情形居多,如信息訂閱類 App “錘子閱讀”、絕大多數(shù)的在線 SaaS 產(chǎn)品,甚至傳統(tǒng)的牛奶訂購。

由于留住當(dāng)前的用戶要比獲取新用戶來的劃算,所以預(yù)測流失率的目標(biāo)在于,預(yù)測用戶將會在哪個時間點離開(在訂閱期結(jié)束前),在合適的時間點對這些用戶施加影響,挽留他們。

如通過短信、郵件或APP,利用超低價商品吸引回訪或者專屬優(yōu)惠券等,這些策略對于一些流失用戶是很有效的!

接下來,筆者將利用簡單的統(tǒng)計學(xué)知識,介紹一種基于用戶不活躍記錄的用戶流失預(yù)測模型。

該模型在不使用機(jī)器學(xué)習(xí)算法的情況下,可以給出一個容易理解的用戶流失預(yù)測,以便我們對將要離開的用戶有一個相當(dāng)準(zhǔn)確的洞察。

廢話不多說,進(jìn)入正題吧~

01  用戶活躍的操作性定義

在我們正式開始預(yù)測用戶流失率之前,我們需要記錄用戶的歷史活躍情況。做這個的目的在于,了解用戶是否在使用我們的產(chǎn)品或服務(wù)。

那么,問題就來了,用戶的“活躍”該做怎樣的操作性定義(即根據(jù)可觀察、可測量、可操作的特征來界定變量含義的方法)?

實際上,“用戶活躍”的定義取決于你的業(yè)務(wù)背景,跟產(chǎn)品或者服務(wù)場景密切相關(guān),不同類型的產(chǎn)品對“用戶活躍”有不同的定義。

以新浪微輿情的“信息監(jiān)測”為例,它是一款訂閱型的大數(shù)據(jù)產(chǎn)品,用戶通過各種關(guān)鍵詞的組合檢索到信息后,然后選擇郵件或者客戶端訂閱,按照自定義的接收頻次來收取訂閱信息。

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


對于這款數(shù)據(jù)產(chǎn)品來說,用戶的活躍可以這樣定義——如果一個用戶是活躍的,那么在指定時間段內(nèi)(分析單位取決于分析者,可以是天、周、月、季度或年),應(yīng)該包含如下付費、使用或者互動行為:

  • 該用戶對“信息監(jiān)測”的訂閱尚未過期;
  • 該用戶在web端或者移動端登錄產(chǎn)品頁面;
  • 該用戶使用了產(chǎn)品的部分或全部功能,如基于信息源或者地域的定向監(jiān)測功能;
  • 該用戶在此期間產(chǎn)生了一些消費,如文本數(shù)據(jù)下載、訂閱續(xù)費等;
  • 該用戶在此期間對該產(chǎn)品有各種反饋,包括投訴。
        ……

對于這款產(chǎn)品來說,以月份為單位來分析用戶行為是很有意義的——因為該產(chǎn)品最短的訂閱期是一個月,最長的訂閱期是一年。

一旦清晰的界定了“用戶活躍”的定義,我們就可以用這些操作性定義來對每個月份的用戶(不)活躍情況進(jìn)行編碼,利用二進(jìn)制值(0,1)——假如在X月份,用戶是活躍的,將ta的活躍值設(shè)定為 1 ,否則設(shè)定為 0 。
 
02  建立“用戶不活躍檔案”

現(xiàn)在,對于每位用戶,我們有了一個以月為單位的“活躍標(biāo)記”,接下來我們以此為基礎(chǔ),建立起“用戶不活躍檔案”。這意味著,對于每個用戶,筆者想對他們連續(xù)不活躍的月份數(shù)進(jìn)行計數(shù)統(tǒng)計。

在這里,筆者選擇了一年的“分析窗口”(也就是把12個月作為分析的時間范圍),將“活躍檔案”和“不活躍檔案”以表格的形式呈現(xiàn)——藍(lán)色表單顯示每位用戶在各個月份上的活躍記錄,綠色表單則顯示用戶的不活躍記錄。

根據(jù)用戶在此時間段內(nèi)可能出現(xiàn)的活躍情形,筆者枚舉出3種典型用戶,如下表所示:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!

用戶A:

該用戶在剛進(jìn)入“分析窗口”時是活躍的,然而在5月變得不活躍(也就是說,5月份是第一個不活躍的月份)。接下來,這個用戶的不活躍狀態(tài)持續(xù)到了12月,也就一直持續(xù)到了“分析窗口”的末尾。

因此,從5月到12月,“用戶不活躍檔案”對用戶連續(xù)不活躍的月份進(jìn)行逐月累加的計數(shù)統(tǒng)計。

用戶B:

跟用戶A一樣,該用戶剛開始也是活躍的。不同的是,該用戶在3~6月期間是不活躍的,在7月僅維持了一個月的活躍狀態(tài), 接著在8月和9月又進(jìn)入不活躍狀態(tài),最后在“分析窗口”的10月,11月和12月又回到活躍狀態(tài)。

在這種情況下,每當(dāng)用戶由不活躍狀態(tài)返回活躍狀態(tài)時,前面的不活躍月份計數(shù)需要重置。也就是說,當(dāng)我們再次對該用戶的連續(xù)不活躍月份進(jìn)行計數(shù)時,需要重新從1開始計數(shù),前面的不活躍月份計數(shù)不再累加。

用戶C:

與上述提及的兩類用戶不同,該用戶剛進(jìn)入“分析窗口”時,是不活躍的狀態(tài)。

這種情形的發(fā)生,可能是用戶的訂閱早已過期(最好在正式分析前排除這種情形,因為很難處理),或者該用戶在“分析窗口”開始前就是不活躍的。因為我們看不到“分析窗口”前的用戶活躍情況,所以用戶在此之前的活躍狀態(tài),我們是不了解的。

鑒于此狀況,我們對這些月份進(jìn)行特殊的標(biāo)記——使用 -1 標(biāo)記用戶C頭幾個不活躍的月份。該用戶其他的不活躍情形,可以參照前面兩類用戶方式進(jìn)行計數(shù)。

Note:后面綠色的表單,也就是“用戶不活躍檔案”,才是我們接下來建立用戶流失模型所需要關(guān)注的數(shù)據(jù)。

03  構(gòu)建用戶流失模型

有了上述的關(guān)于用戶不活躍的操作性定義,我們就可以在“分析窗口”內(nèi)(1月份到12月份)以月份為單位,對從0到12的連續(xù)不活躍月份數(shù)上的用戶數(shù)量進(jìn)行計數(shù)統(tǒng)計。

這個步驟可以通過數(shù)據(jù)透視表實現(xiàn)——通過聚合每個月、每個不活躍級別的用戶數(shù)量。

 如下表所示:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


上表中,從列的方向上來看,每個單元格的數(shù)值表示每個月的連續(xù)不活躍X個月的用戶的數(shù)量。

舉個例子來說,上表中第一個高亮數(shù)值(574),代表1月份已經(jīng)不活躍1個月的用戶數(shù)量,該數(shù)值來自于前面 12 月份的 4815 個活躍用戶。第二個高亮數(shù)值(425)表示在 2 月份已經(jīng)連續(xù)不活躍 2 個月的用戶數(shù)量—— 425 來自于 574(1月份不活躍1個月的用戶數(shù),它是 2 月份不活躍 2 個月的用戶數(shù)的基數(shù))。

值得注意的是,第一行的 0 個連續(xù)不活躍月份數(shù),其實表示的是基數(shù)中活躍用戶的數(shù)量。

使用這些數(shù)據(jù),我們可以計算出在“分析窗口”內(nèi),每個月連續(xù)不活躍月份數(shù)的用戶占比情況

如下面的綠色表格所示:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


上表中,高亮的數(shù)值(74%)表示2月份已經(jīng)連續(xù)2個月不活躍的用戶占比。該百分比是這樣計算得到的:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


筆者想獲得最具代表性的數(shù)值,由此可以對分析窗口的最末4個月(9月,10月,11月和12月)取平均值。

我們可能沒有足夠的數(shù)據(jù)去計算這些平均值(比如10月份,11月份和12月份)——在這種情況下,我們?nèi)∷锌捎脭?shù)值的平均值(用于計算平均值的數(shù)值區(qū)域以紅色線框標(biāo)記):

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


04  計算用戶流失概率

哈哈,如果你還在看這篇文章,那么恭喜你!我們將要探討最激動人心的部分!在這部分,我們將用上一點統(tǒng)計學(xué)的小知識。

讓我們回顧一下本文的終極目標(biāo)——計算各個連續(xù)不活躍月份數(shù)(0-12)下的用戶流失概率。

也就是說,如果某個用戶已經(jīng)連續(xù) X 個月不活躍,那么這個用戶接下來將要流失的可能性有多大?從數(shù)學(xué)上來說,我們可以使出貝葉斯公式這個大殺器來計算用戶流失率。

貝葉斯公式盡管是一個數(shù)學(xué)公式,但它的原理不要數(shù)字也能明了:如果你看到一個人總是做一些好事,則那個人多半會是一個好人。

這就是說,當(dāng)你不能準(zhǔn)確知悉一個事物的本質(zhì)時,你可以依靠與事物特定本質(zhì)相關(guān)的事件出現(xiàn)的多少去判斷其本質(zhì)屬性的概率。用數(shù)學(xué)語言表達(dá)就是:支持某項屬性的事件發(fā)生得愈多,則該屬性成立的可能性就愈大。它的數(shù)學(xué)形式如下:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


在這里,P是概率,A和B都代表事件(event),同時P(B)≠0。P(A)和P(B) 分別代表A和B的先驗概率或邊緣概率。

之所以稱為"先驗"是因為它不考慮任何A(B)方面的因素。P(A|B)是已知B發(fā)生后A的條件概率,也由于得自B的取值而被稱作A的后驗概率。P(B|A)是已知A發(fā)生后B的條件概率,也由于得自A的取值而被稱作B的后驗概率。

在本案例中,對應(yīng)的公式如下所示:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


然并卵,上面公式里有一項是沒啥意義的——P(連續(xù)X個月不活躍|流失),它的含義是“在已經(jīng)流失的情況下,連續(xù)X個月不活躍的概率”。

試想一下,假如你已經(jīng)流失掉了,你不可能是一個不活躍的狀態(tài),這個概率值是沒有啥業(yè)務(wù)意義的。鑒于此種情形,筆者果斷拋棄這一項(謹(jǐn)記?。?/font>

由此,我們得到了一個終極版的流失率計算公式:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


接下來,讓我們看看公式右端的兩項(分子和分母),然后計算它們在每個不活躍月份上的數(shù)值,進(jìn)而得到我們想要的用戶流失概率值(注意,它是一個條件概率值,也就是在連續(xù)不活躍X個月的情況下的用戶流失概率)。

先說說分母,P(連續(xù)X個月不活躍)是筆者之前計算過的數(shù)值---最后4個月的用戶占比平均值:

P(1) = 19%
P(2) = 81%
P(3) = 89%
P(4) = 92%
P(5) = 93%
P(6) = 95%
P(7) = 96%
P(8) = 97%

接下來,我們再來通過例子求解分子P(流失)。

首先,1個月不活躍的用戶的流失概率P(C1)是多少呢?對于這些將要流失的用戶,他們將要連續(xù)性的不活躍的月份數(shù)已經(jīng)在我們所考慮的集合之內(nèi)了,換言之,這些用戶將要不活躍的月份數(shù)為1個月,2個月,3個月,…,。

因而,我們這樣定義已經(jīng)不活躍1個月的用戶的流失概率P(C1)

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


現(xiàn)在, 以同樣的方式, 持續(xù)2個月不活躍的用戶的 P(流失) ,也就是P(C2)是多少呢?對于這些將要流失的用戶,他們將要持續(xù)性的不活躍,2個月,3個月,4個月,…,12個月。

因而,我們這樣定義已經(jīng)連續(xù)不活躍2個月的用戶的流失概率P(C2):

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


通過歸納和演繹,我們以同樣的方式來計算每個不活躍月份的用戶流失概率:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


在這里,n是連續(xù)不活躍月份數(shù)的極限值,而我們發(fā)現(xiàn),這個概率是穩(wěn)定的。從上面的表單里可以到,這個發(fā)生在第7個連續(xù)的月份,這里的概率值維持在95~96%。

簡化起見,我們假設(shè),在連續(xù)月份上不活躍是相互獨立的事件。

此時, P(A ∩ B )= P(A)* P(B)。因而,我們可以采用如下的公式:


不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


現(xiàn)在,我們已經(jīng)算出了每個不活躍月份概率對應(yīng)的分子和分母,那我們就可以啟動最后一步——算出每個各個連續(xù)不活躍月份數(shù)的用戶流失概率。

先前我們已經(jīng)討論過了,n的值為7。

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


最終的計算結(jié)果如下表所示:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


請注意,活躍用戶(也就是第一行連續(xù)0個月不活躍的情形)的流失率由P(1) Ⅹ P(2) Ⅹ P(3) Ⅹ P(4) Ⅹ … Ⅹ P(7)計算得出。這里我們并沒有除以任何值,這是因為——當(dāng)用戶處于活躍狀態(tài)時, P(連續(xù)0個月不活躍)為1。

最后,我們還可用一條流失率曲線來直觀的反映流失率的變化情況,由此決定對非活躍用戶進(jìn)行挽留操作的最佳時機(jī),該曲線所下圖所示:

不會機(jī)器學(xué)習(xí),用這個模型照樣可以預(yù)測用戶流失!


05  結(jié)語

在本文中,筆者并沒有提供該模型批量化使用的具體執(zhí)行細(xì)節(jié),假若你理解了這個模型建立的邏輯,那么你可以使用SQL、Python,甚至是Excel來實現(xiàn)它。

此外,在實踐中,這個模型最好是分不同的用戶群進(jìn)行運行。在本文中,筆者僅僅在某一類用戶上運行,然而,根據(jù)不同的標(biāo)準(zhǔn)來劃分用戶群體會對實際業(yè)務(wù)更有意義。

比如,你可以根據(jù)用戶價值進(jìn)行劃分,然后對每個用戶子群體進(jìn)行用戶流失預(yù)測。當(dāng)然,筆者只是在月份的尺度上進(jìn)行用戶流失分析,但是,對于很多業(yè)務(wù)場景,更細(xì)粒度的分析視角可能更有意義,比如按周和按天。

 
參考資料:
1 維基百科“Customer ChurnRate”詞條,https://en.wikipedia.org/wiki/%E9%A1%BE%E5%AE%A2%E6%B5%81%E5%A4%B1%E7%8E%87
2 維基百科“貝葉斯定理”詞條,https://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%AE%9A%E7%90%86
3 PredictingChurn without Machine Learning,http://jonathansacramento.com/posts/20170416_churn_model.html
4 新浪微輿情“信息監(jiān)測”,http://wyq.sina.com/keyword.shtml

作者:蘇格蘭折耳喵
來源:鳥哥筆記(ID:niaoge8)
本文為作者授權(quán)鳥哥筆記發(fā)布,轉(zhuǎn)載請聯(lián)系作者并注明出處。
愛盈利(aiyingli.com)移動互聯(lián)網(wǎng)最具影響力的盈利指導(dǎo)網(wǎng)站。定位于服務(wù)移動互聯(lián)網(wǎng)創(chuàng)業(yè)者,移動盈利指導(dǎo)。我們的目標(biāo)是讓盈利目標(biāo)清晰可見!降低門檻,讓缺乏經(jīng)驗、資金有限的個人和團(tuán)隊獲得經(jīng)驗和機(jī)會,提高熱情,激發(fā)產(chǎn)品。

評論

相關(guān)文章推薦

SELECT dw_posts.ID,dw_posts.post_title,dw_posts.post_content FROM dw_posts INNER JOIN dw_term_relationships ON (dw_posts.ID = dw_term_relationships.object_id) WHERE 1=1 AND(dw_term_relationships.term_taxonomy_id = 3154 ) AND dw_posts.post_type = 'post' AND (dw_posts.post_status = 'publish') GROUP BY dw_posts.ID ORDER BY RAND() LIMIT 0, 6

京ICP備15063977號-2 ? 2012-2018 aiyingli.com. All Rights Reserved. 京公網(wǎng)安備 11010102003938號