无码日韩精品一区二区三区浪潮_99国产精品久久久久9999高清_亚洲熟妇无码久久观看_亚洲a∨无码一区二区猫咪

微信掃碼登錄

其他登錄方式

綁定手機(jī)號

注冊

忘記密碼

用戶協(xié)議

綁定手機(jī)號

近期有不法分子打著愛盈利的旗號,制作“愛盈利”名稱的App,并偽造愛盈利證件,騙取用戶信任,以抖音點(diǎn)贊賺錢或其他方式賺錢為名義,過程中以升級會員獲得高傭金為名讓用戶充值。
愛盈利公司鄭重聲明:我司沒有研發(fā)或運(yùn)營過任何名為“愛盈利”的APP,我司做任務(wù)賺錢類產(chǎn)品從沒有讓任何普通用戶充值升級會員。我公司產(chǎn)品均在本網(wǎng)站可查詢,請將網(wǎng)站拉至底部,點(diǎn)擊“關(guān)于我們”可查看愛盈利相關(guān)產(chǎn)品與服務(wù)。
溫馨提示:當(dāng)遇到此類問題請撥打官方電話或添加官方微信,以免財產(chǎn)損失。愛盈利官網(wǎng)地址:www.jza6.com。
  • 推廣與合作
X

【深度長文】互聯(lián)網(wǎng)人必須要懂的“幸存者偏差”

來源: 343363

不管你是否聽過這個詞,這篇文章都會讓你對“幸存者偏差”理解的更加深刻,先讓我們來看幾個段子:

  1. 學(xué)校組織郊游,老師問:沒來的同學(xué)舉個手,好,人齊了,我們出發(fā)吧!

  2. 央視記者在一輛高鐵上問:您買到票了嗎?買到了!您呢,您買到了票了嗎?買到了!

  3. 媽媽為什么不挑食?因?yàn)樗I菜的時候已經(jīng)挑過了!

  4. 降落傘的電商店鋪為什么都是好評?因降落傘有問題而失事的人想給差評也給不了!

 

這些都是關(guān)于幸存者偏差的段子,大家看完都哈哈大笑,是因?yàn)槲覀兌继菀鬃R別它了,然而我列出下面的案例,我們可能未必能得出正確的結(jié)論了:

  1. 1936年,美國總統(tǒng)大選,《文學(xué)文摘》雜志通過140萬人的電話調(diào)研顯示蘭登會贏得大選,這個調(diào)研有多大的可信度?

  2. 在古埃及的文物中發(fā)現(xiàn)了莎草紙,而在同期其他地中海文明如腓尼基、古希臘、古羅馬則沒有發(fā)現(xiàn)莎草紙,能否說明該時期莎草紙在埃及應(yīng)用廣泛而在其他地中海文明則沒有應(yīng)用?

  3. 某新游戲上線一個月,游戲策劃隨機(jī)找了游戲中高度活躍用戶進(jìn)行調(diào)研,確定了游戲下一步迭代的核心方案,會不會存在致命缺陷?

  4. 某記者在網(wǎng)上搜出“民國小學(xué)生作文”,文采極好,于是記者總結(jié)道:現(xiàn)在的小學(xué)語文教育和民國時沒法比??!

 

事實(shí)上,以上的案例都極有可能得出錯誤的結(jié)論:

  1. 1936年美國大選的調(diào)查,由于是電話調(diào)查,而電話在30年代的美國還是富人的專利,而這些富人并非美國選民的隨機(jī)樣本,最終羅斯福而不是雜志預(yù)測的蘭登當(dāng)選。

  2. 古埃及的發(fā)現(xiàn)了莎草紙而其他地方?jīng)]有,真實(shí)原因是其他三個地方——腓尼基、古希臘、古羅馬氣候比古埃濕潤,而埃及則比較干燥,而這些莎草紙在潮濕環(huán)境中并沒有保存下來。

  3. 新游戲上線一個月,有留存用戶,也有流失用戶,關(guān)注留存用戶需求固然重要,但對于一個新游戲而言更重要的是關(guān)注那些流失用戶的流失原因。

  4. 民國小學(xué)生作文之所以能流傳到今天,必然是當(dāng)時就是佼佼者,它是幸存者,代表不了當(dāng)時民國小學(xué)生的整體水平。

 

在我們?nèi)粘9ぷ鞯臎Q策中,幸存者偏差是如此普遍,常常在不經(jīng)意中影響我們的決策與判斷,那么這個概念的本質(zhì)是神馬?它容易在哪些情況下發(fā)生?它的作用機(jī)制是怎樣的?我們?nèi)绾伪苊馑?/strong>今天的文章我們就一起來探討一下這個問題:

 

“幸存者偏差”的歷史

 

“幸存者偏差”來源于二戰(zhàn)中一個著名的故事:

1941年,第二次世界大戰(zhàn)中,空軍是最重要的兵種之一,盟軍的戰(zhàn)機(jī)在多次空戰(zhàn)中損失嚴(yán)重,無數(shù)次被納粹炮火擊落,盟軍總部秘密邀請了一些物理學(xué)家、數(shù)學(xué)家以及統(tǒng)計學(xué)家組成了一個小組,專門研究“如何減少空軍被擊落概率”的問題。

當(dāng)時軍方的高層統(tǒng)計了所有返回的飛機(jī)的中彈情況——發(fā)現(xiàn)飛機(jī)的機(jī)翼部分中彈較為密集,而機(jī)身和機(jī)尾部分則中彈較為稀疏,于是當(dāng)時的盟軍高層的建議是:加強(qiáng)機(jī)翼部分的防護(hù)。

【深度長文】互聯(lián)網(wǎng)人必須要懂的“幸存者偏差”

但這一建議被小組中的一位來自哥倫比亞大學(xué)的統(tǒng)計學(xué)教授——沃德(Abraham Wald)駁回了,沃德教授提出了完全相反的觀點(diǎn)——加強(qiáng)機(jī)身和機(jī)尾部分的防護(hù)。

那么這位統(tǒng)計學(xué)家是如何得出這一看似不夠符合常識的結(jié)論的呢?沃德教授的基本出發(fā)點(diǎn)基于三個事實(shí)是:(1)統(tǒng)計的樣本只是平安返回的戰(zhàn)機(jī);(2)被多次擊中機(jī)翼的飛機(jī),似乎還是能夠安全返航;(3)而在機(jī)身機(jī)尾的位置,很少發(fā)現(xiàn)彈孔的原因并非真的不會中彈,而是一旦中彈,其安全返航的機(jī)率極小,即返回的飛機(jī)是幸存者,僅僅依靠幸存者做出判斷是不科學(xué)的,那些被忽視了的非幸存者才是關(guān)鍵,他們根本沒有回來!

軍方采用了教授的建議,加強(qiáng)了機(jī)尾和機(jī)身的防護(hù),并且后來證實(shí)該決策是無比正確的,盟軍戰(zhàn)機(jī)的擊落率大大降低,這就是“幸存者偏差”故事的來源。

 

“幸存者偏差”的本質(zhì)

 

廣義的幸存者偏差用統(tǒng)計學(xué)的專業(yè)術(shù)語來解釋是——“選擇偏倚”,即我們在進(jìn)行統(tǒng)計的時候忽略了樣本的隨機(jī)性和全面性,用局部樣本代替了總體隨機(jī)樣本,從而對總體的描述出現(xiàn)偏倚。

統(tǒng)計學(xué)的簡單描述是這樣的:統(tǒng)計全集為A,觀察到A的子集A1有特征X,A1為幸存者,而A另外的子集A2并沒有觀察到或者被人為忽略,于是判斷全集A都有特征X,事實(shí)上A2的特征為Y。

【深度長文】互聯(lián)網(wǎng)人必須要懂的“幸存者偏差”

用上述記者調(diào)查買火車票的案例來代入解釋為:A為全體想買火車票的人,A1為已經(jīng)在火車上的人,A2為想買但沒買到的人,特征X為買到票,特征Y為未買到票,即幸存者偏差將一小部分顯性樣本代替了隨機(jī)樣本,從而導(dǎo)致了統(tǒng)計的偏差。

【深度長文】互聯(lián)網(wǎng)人必須要懂的“幸存者偏差”

有了這個框架,我們就能從理論的角度理解這些“幸存者偏差”的具體案例了:

  1. 亞裔學(xué)生案例:美國學(xué)生會發(fā)現(xiàn)亞裔同學(xué)在數(shù)學(xué)方面要超出其同齡孩子很多——“幸存者偏差”:能到美國上學(xué)的孩子在中國的教育水平和成長環(huán)境通常都會相對優(yōu)越,要是中國的母語是英文,想必語文成績也會優(yōu)于美國同齡學(xué)生。

  2. 住院研究案例:假如北京長庚醫(yī)院對心臟病人住院病人的飲食習(xí)慣進(jìn)行研究,從而發(fā)表一篇《心臟病與飲食習(xí)慣之間的關(guān)系》的論文,該論文是否有可信度?答案是沒有!因?yàn)殚L庚醫(yī)院為北京高端私立醫(yī)院,該院病人和普通病人的飲食習(xí)慣會存在差異,同時住院的病人也并非能代表所有病例(不住院就已經(jīng)去世的、住不起院的等等),事實(shí)上,排除這些干擾因素是現(xiàn)代醫(yī)學(xué)研究的基本準(zhǔn)則。

  3. 健身房案例:我每周一三五中午都會去公司的健身房,這個習(xí)慣堅持了很長一段時間,然而有一段時間我一度沮喪——因?yàn)槲野l(fā)現(xiàn)公司健身房的同事基本上身材都比我好,這其實(shí)就是典型的“幸存者偏差”——那些健身房的人身材好當(dāng)然是大概率事件,身材不好也不鍛煉的人通常很少去健身房。

  4. 章魚保羅案例:2010年世界杯最大的明星不是來自某個球員,而是來自德國奧博豪森海洋館的章魚”保羅“,它神奇地連續(xù)7次百發(fā)百中地預(yù)測了世界杯德國隊的比賽結(jié)果,章魚保羅成為那個夏天世界媒體熱情追逐的對象,然而事實(shí)上它就是一次典型的”幸存者偏差“,那年夏天其實(shí)有很多動物都參與了世界杯的預(yù)測:菲律賓的猴子、墨西哥的羊駝、非洲的大象、保加利亞的奶牛甚至還有中國的熊貓,只是因?yàn)檫@些動物預(yù)測失敗了于是并沒有媒體報道,而章魚保羅成為那個幸運(yùn)兒。

【深度長文】互聯(lián)網(wǎng)人必須要懂的“幸存者偏差”

在以上四個案例中,全集A分別為:中國的所有孩子、所有心臟病患者、我公司的所有同事、預(yù)測世界杯的所有動物;

幸存者A1分別為:有條件去美國念書的孩子、在長庚醫(yī)院的心臟患者、去健身房的同事、章魚保羅;

特征X分別為:數(shù)學(xué)好、飲食獨(dú)特、身材好、預(yù)測準(zhǔn);

特征Y分別為:數(shù)學(xué)平庸、飲食正常、身材一般、預(yù)測不準(zhǔn)。

這就是“幸存者偏差”的分析框架。

 

警惕“幸存者偏差”的濫用

 

很多人對“幸存者偏差”這個名詞一知半解的時候,往往會造成它的濫用,在作者看來,警惕“幸存者偏差”和警惕“幸存者偏差”的濫用同樣重要。

很多人看到一些媒體報道的創(chuàng)業(yè)“成功故事”立馬嗤之以鼻——“這是幸存者偏差,不知道有多少個失敗的案例呢?”,然后對成功者的方法和經(jīng)驗(yàn)一概摒棄;

很多行賄的工作人員看到“某人行賄被抓”的新聞見怪不怪,認(rèn)為這是幸存者偏差——“媒體只會報道那些行賄被抓的人,其實(shí)還有更多沒抓住呢!”于是他們繼續(xù)行賄。

那么“幸存者偏差”這個概念是如何被濫用的呢?還是舉記者調(diào)查高鐵買票的例子,明白“幸存者偏差”理論,只能讓我們明白——"記者在高鐵上進(jìn)行調(diào)查來判斷所有人都買到票"這種方法是不科學(xué)的。

注意——它并不能直接推斷出"所有人都買到票"這個結(jié)論一定是錯的,因?yàn)槭O碌娜擞袥]有買到票這一信息——我們不知道:春運(yùn)的時候我們能根據(jù)常識判斷他們可能買不到票,但平時的高鐵,基本上是想買到票的人都能買到票,因此,直接判斷“肯定有人沒買到票”就屬于“幸存者偏差”的濫用,錯誤的反面不一定就是正確。

從統(tǒng)計學(xué)的角度我們來看我們是如何濫用幸存者偏差的——我們觀察到了A1有特征X,同時我們意識到可能存在幸存者偏差,我們預(yù)先把A1定義為幸存者,于是直接判斷非幸存者A2一定不會有特征X,而真相是:A2是否有特征X這個信息我們并不知道,可能有,也可能沒有。

警惕“幸存者偏差”濫用非常重要,事實(shí)上前面提到的二戰(zhàn)統(tǒng)計學(xué)教授沃德的故事也只是后人及其簡化之后的版本,稍微思考一下就會知道,一個受過科學(xué)訓(xùn)練的統(tǒng)計學(xué)教授是不可能只憑直觀判斷就直接給出結(jié)論的。

事實(shí)上沃德教授關(guān)于飛機(jī)擊落問題先后提交了八份不同方面的報告,其中主論文為《A Method of Estimating Plane Vulnerability Based on Damage of Survivors》,即《一種根據(jù)幸存飛機(jī)損傷情況推測飛機(jī)要害部位的方法》。

【深度長文】互聯(lián)網(wǎng)人必須要懂的“幸存者偏差”

這篇論文就有80多頁,僅后人對他貢獻(xiàn)的綜述就有10多頁,(公眾號回復(fù)關(guān)鍵詞——“沃德教授”獲取論文),這位寫過巨著《序列分析》的權(quán)威教授顯然是對框架中A2的特征做過詳細(xì)而嚴(yán)謹(jǐn)?shù)姆治霾诺贸鼋Y(jié)論滴!

如果拍拍腦袋就能成為統(tǒng)計學(xué)家,那大家都是統(tǒng)計學(xué)家!

 

互聯(lián)網(wǎng)人如何避免“幸存者偏差”?

 

“幸存者偏差”是數(shù)據(jù)分析的常見邏輯錯誤,而數(shù)據(jù)又是驅(qū)動互聯(lián)網(wǎng)的動力之一,那么互聯(lián)網(wǎng)人應(yīng)該在分析數(shù)據(jù)、決策判斷時如何避免“幸存者偏差”的存在呢?衛(wèi)夕總結(jié)了三個步驟:

一、判斷樣本的隨機(jī)性,即必須知道樣本是否是隨機(jī)的。

二、判斷樣本和剩余樣本中會不會存在顯著差異。

三、分析剩余樣本數(shù)據(jù),驗(yàn)證結(jié)論。

我們來看幾個案例直接進(jìn)行訓(xùn)練:

  • 微信公眾號打賞案例:“衛(wèi)夕聊廣告”既開通了公眾號也開通了微博賬號“衛(wèi)夕君”,這時候我發(fā)現(xiàn)同一篇文章在相同的閱讀的情況下微信的打賞特別少,而微博則多一些,因此我起初大致判斷微信粉絲的打賞意愿低于微博,直到我想起來微信的iOS用戶由于蘋果的政策限制目前并不能打賞之后才明白我之前的猜想是錯滴,這存在幸存者偏差,于是我嘗試在最近的兩篇文章末尾專門加上IOS贊賞碼,文章的贊賞金額果然提升了接近4倍。

在這個案例中避免幸存者偏差的標(biāo)準(zhǔn)三步為:1.判斷樣本的隨機(jī)性,即看微信公眾號的打賞用戶是否能代表整體?答案是否定的,因?yàn)橹桓采w了安卓用戶。2.判斷樣本和剩余樣本會不會存在顯著差異?即安卓用戶和iOS在打賞這件事上會不會存在差異?答案是:可能存在差異。3.分析剩余樣本數(shù)據(jù),驗(yàn)證結(jié)論,即加上iOS的打賞碼再次驗(yàn)證結(jié)果。

  • 視頻網(wǎng)站案例:某視頻網(wǎng)站在VIP中新上線了一部美劇,該美劇每一集的觀看人數(shù)之前一直穩(wěn)定,但當(dāng)它播到第七集的時候,觀看人數(shù)有一個相對明顯的流失,運(yùn)營人員開始分析認(rèn)為是該部美劇從第七集開始劇情急轉(zhuǎn)直下主角忽然掛掉引起的,然而當(dāng)他們仔細(xì)分析流失用戶的時候,發(fā)現(xiàn)流失的都是因?yàn)槿齻€月前某次大規(guī)模贈送的免費(fèi)會員到期引起的,只是時間正好和第七集重合而已,普通會員根本沒有流失。

在這個案例中三步分別為:1.判斷樣本隨機(jī)性,即分析流失用戶是不是所有會員的隨機(jī)樣本。答案是否定的——流失的都是免費(fèi)會員。2.判斷樣本和剩余樣本會不會存在顯著差異?即正常會員和免費(fèi)會員有沒有差異?當(dāng)然有。3.分析剩余樣本數(shù)據(jù),驗(yàn)證結(jié)論,即看正常會員是否流失。

  • Facebook視頻廣告案例:2016年9月年Facebook關(guān)于視頻廣告數(shù)據(jù)偏差的問題變成了該公司廣告歷史上不大不小的負(fù)面新聞,F(xiàn)acebook在其官方博客中承認(rèn):其提交給廣告主的數(shù)據(jù)報告中,視頻廣告平均播放時長的數(shù)字只統(tǒng)計了那些播放時長超過3秒的播放行為,也就是說,如果視頻播放沒超過3秒,F(xiàn)acebook居然就把它舍去了,很顯然,廣告主的平均播放時長被拉長了,因?yàn)椴シ艜r間短的壓根不統(tǒng)計,而這一偏差居然存在了長達(dá)兩年之久。

這個案例中,分析依然分為三步:1.判斷樣本隨機(jī)性——廢話!3秒以下的都舍去了!當(dāng)然沒有隨機(jī)性!2.判斷樣本和剩余樣本是否存在顯著差異?廢話,3秒以下和3秒以上肯定有差異!3.分析剩余樣本數(shù)據(jù)、驗(yàn)證結(jié)論。這.....就不用驗(yàn)證了吧!

以上的分析前提是我們需要對我們的業(yè)務(wù)進(jìn)行深刻的理解,只有你深刻理解了你業(yè)務(wù)中具體重要的影響因素你才能做出正確的猜想和判斷。

好了:以上就從理論到實(shí)踐的角度介紹了幸存者偏差,這時候有人會問衛(wèi)夕,你覺得中文互聯(lián)網(wǎng)上哪一個平臺的內(nèi)容出現(xiàn)幸存者偏差的概率會比較大?哈哈哈,毫無疑問是知乎!我們來感受一下:

【深度長文】互聯(lián)網(wǎng)人必須要懂的“幸存者偏差”

愛盈利-運(yùn)營小咖秀(www.jza6.com) 始終堅持研究分享移動互聯(lián)網(wǎng)App運(yùn)營推廣經(jīng)驗(yàn)、策略、全案、渠道等純干貨知識內(nèi)容;是廣大App運(yùn)營從業(yè)者的知識啟蒙、成長指導(dǎo)、進(jìn)階學(xué)習(xí)的集聚平臺;

想了解更多移動互聯(lián)網(wǎng)干貨知識,請關(guān)注微信公眾號運(yùn)營小咖秀(ID: yunyingshow)

評論

相關(guān)文章推薦

SELECT dw_posts.ID,dw_posts.post_title,dw_posts.post_content FROM dw_posts INNER JOIN dw_term_relationships ON (dw_posts.ID = dw_term_relationships.object_id) WHERE 1=1 AND(dw_term_relationships.term_taxonomy_id = 5 ) AND dw_posts.post_type = 'post' AND (dw_posts.post_status = 'publish') GROUP BY dw_posts.ID ORDER BY RAND() LIMIT 0, 6

京ICP備15063977號-2 ? 2012-2018 aiyingli.com. All Rights Reserved. 京公網(wǎng)安備 11010102003938號