最近有很多看了《運營實操|如何利用微信后臺數據優(yōu)化微信運營》的小伙伴,加我微信后都不約而同的問我這樣一個問題:嗨,運營小喵,你寫的“根據后臺數據優(yōu)化微信文章內容”,似乎只適合在運營時間不長、擁有少量數據的情況下才有用,畢竟你的文章才十幾篇文章呢,而我運營的是企業(yè)號,運營最少幾個月,而且每天都更新的,數據量特別大~所以,能不能有適合數據量大的、企業(yè)級的公眾號的內容優(yōu)化分析方法呢?
我抓耳撓腮,苦思冥想了好幾天,借助一位好哥們的某公眾號的“歷史遺留數據”,進行了一番探索…終于,運營喵我終于摸索出一個適合分析企業(yè)號、大批量數據的分析方法,好東西不敢獨享,特來分享給各位。
文章中的貨很干,同時也意味著燒腦無下限,但看完數據運營的功力大增。所以,在開始正文前,先說下本文的布局,讓大家有個心理準備:
先講講聚類分析的一些基本原理,為接下來的數據分析做好理論儲備;
關于微信文章/內容評估體系的建立和數據的抓取,為接下來的數據分析提供上等“原料”;
案例實操,用鮮活的實際案例將方法落地,讓大家在一個案例里徹底搞明白聚類分析這一方法;
應用延伸,一通百通—除了微信內容優(yōu)化可以用,聚類分析還可以用在APP及網站數據分析、用戶畫像分析上。
二、聚類分析的基本原理
1.什么是聚類分析
聚類分析就是把看得見的實體對象(如桌子、人、樹木等)或看不見的抽象對象(如情緒、觀念等)進行分組,將它們中具有類似特征的對象劃分到一塊,形成很多總體特征不同的“小團體”,同時這個過程是人為主觀的—最終由我們來給這些分類及其特征下定義,從而在具體的業(yè)務場景中應用它們。生活中我們經常講“物以類聚,類以群分”,說的就是不同的人和事物因特征的相似而歸并成一類,形成了很多大大小小的分組/類。
人以群分
聚類分析作為一種多元統(tǒng)計分析方法(研究多個自變量與因變量相互關系的一組統(tǒng)計理論和方法),其目的在于按照個體或樣本的特征將其分類,使得同一類別下的個體具有盡可能高的同質性,而不同類別/組別之間則是盡可能高的異質性。舉例來講,有2個不同的愛好者組成的松散組織—球迷協(xié)會、攝影協(xié)會。球迷協(xié)會中清一色的足球狂熱者,個個談起足球來眉飛色舞;攝影協(xié)會內的成員個個手握“長槍短炮”,最大的愛好就是對著美女和美景一通“咔咔”。這2個團體中的成員“臭味相投”,有共同的愛好和志趣;而作為集體的球迷協(xié)會和攝影協(xié)會,因團體各自的偏好不同,毫無共性,小團體和小團體之間的價值觀和思想傾向也大相徑庭。
在進行聚類分析時,需要在相似的基礎上收集數據并對其進行分類,衡量不同數據間的相似性,以及把數據分類到不同的組/類中。下圖是存在2個變量的數據聚類的情形,根據二維空間中點的
距離遠近來確定分類。
二維維度(2個變量)下的聚類分析圖
值得注意的是,聚類分析的用武之地在于探索性分析,得出的結果可以提供許多個可能的“解”,選擇哪個“解”取決于分析者對具體業(yè)務的判斷和自身的知識結構。
2.主要步驟
復雜的原理運營喵就不說了,怕大家看著發(fā)暈,這些環(huán)節(jié)我就一帶而過,因為在接下來的分析中小喵會用鮮活的案例讓大家好好“反芻”一下。進行聚類分析的工具是SPSS 20.0,用的聚類方法是K-means聚類法,進行分析的步驟分為4個環(huán)節(jié),及數據預處理、定義距離函數、聚類或分組及評估結果。
聚類分析的4個步驟
三、文章質量評價體系和數據抓取
運營喵做這個聚類分析的目的在于:在凌亂復雜的各項微信后臺數據中,將其中數以百計的文章進行分類,分類的原理是—這些文章合理地按各自的特性來進行合理的分類,具體來說是在若干指標上因指標數值的不同而進行自然分類。所以,我們需要先找出進行聚類的若干指標),然后對這些指標進行有意義的分類,劃分成幾大維度,便于我們對文章進行質量評估。
分析數據選取—構建微信文章的內容質量評估體系
一般情況下,對于文章質量的分析和評估,我們只關注閱讀量、點贊量這樣的指標,深層次一些的就是分享轉發(fā)指標,但很少有全方位的去評價文章質量和分析受眾內容偏好的。
因此,我們有必要去多維度的評價一篇文章的質量,而不僅限于閱讀量、點贊量之類的“初級指標”,而是要盡量多的去挖掘能反映文章
整體情況的多維度評價指標,為我們的內容運營優(yōu)化提供指導。
本文中,運營小喵認為:文章質量不是僅僅是文章的閱讀量、轉發(fā)量等情況,還包括文章的傳播效率、文章自身對于目標群體的價值,以及能夠激起粉絲量的增長等。因此,評價微信文章質量需要有一個完整的指標評價體系,從籠統(tǒng)的粉絲、閱讀和轉發(fā)數據中發(fā)掘更細致、更全面“文章畫像”指標評估體系,由表及里的從多個維度、多個層次區(qū)分析文章的質量情況。
這種多維度分析的目的在于,內容運營是有階段性的,囿于精力不濟和經驗不多,每個階段我們要對內容運營制定出有不同側重點的策略:初期(粉絲不多)需要迅速漲粉,這時文章的傳播力就很重要;成熟期(粉絲量很大,增長快,流失也快)需要沉淀用戶,需要創(chuàng)作出有價值的內容,留住粉絲;到平臺期或是衰落期(粉絲流失多于增長),競品出現及用戶口味大變,內容需要創(chuàng)新,挽留或是招攬新粉,這時文章的傳播力和價值性兼具了。
值得注意的是,文章的傳播力和的自身價值沒有必然的關系,一篇很好質量很高的文章,可能收藏量、點贊量很多,但閱讀量、傳播量不一定很大;相反,很多價值不大的文章,因其易讀且迎合用戶部分心理需求,傳播力會大不少,閱讀量和轉發(fā)量“蹭蹭”的上漲。
基于此,有一套完整、全面的文章/內容評估體系至關重要。以下是運營小喵根據研究,歸納出的微信文章/內容質量評估體系,共羅列出了5個維度,即粉絲增長指標、粉絲活躍指標、文章信息指標、文章傳播指標和文章價值指標,5類指標下又包含若干類型數據,盡量將分析的“顆?!奔毣?,詳情見下圖:
微信文章質量評估體系
粉絲增長指標
粉絲增長指標反映粉絲在某天當中的增長/取關情況,下面涵蓋3類數據—新關注人數、取消關注人數和凈增關注人數。其中,“新關注人數”和“凈增關注人數”是正向指標,也就是越大越好,而“取消關注人數”則是反向指標,越少越好。在不做活動的情況下,這3個指標綜合起來看,可以反映出當天總體人群的閱讀質量怎樣—閱讀量足夠大,文章足夠好的情況下,粉絲的增長會多,取關的人數會少;假使標題黨,誘使粉絲閱讀或關注,粉絲的取關數量會很多。
粉絲活躍指標
粉絲活躍指標反映了所關注粉絲的活躍度情況,這里包含有圖文閱讀人數、公眾號會話閱讀人數和來自歷史消息的閱讀人數。值得注意的是,這3個指標都是發(fā)文后7天內的統(tǒng)計數據,具有一定的時效性,能反映出粉絲對本公眾號的關注/重視程度(如果不重視的話,可能過很久甚至從不打開,出現極端的情況是,文章從朋友圈或是好友轉發(fā)處看到。)其中,“圖文閱讀人數”是7天內對某篇文章的總閱讀用戶數。“公眾號會話閱讀人數”是指從公眾號推送的會話里打開的,反映出讀者已經養(yǎng)成了在訂閱號里查看推文的習慣,有一定忠誠度和活躍性了。從歷史消息里看,可能有兩種情況:一是粉絲新關注公眾號后,會在歷史消息里翻閱過往推文,表示ta對公眾號的內容很感興趣;另一種情形是,粉絲忘記查看之前的推送消息,看到目前的這篇后,會興致盎然的查看過往推送記錄,兩者都反映出粉絲對公眾號的感興趣,能體現粉絲活躍性。
文章信息指標
文章信息指標是文章發(fā)布的基本信息,包含文章標題、文章發(fā)布日期和文章發(fā)布時間點,這3類數據/信息不能單獨進行分析,需要結合其他維度的數據進行關聯(lián)分析,用以判斷文章質量的優(yōu)劣。
文章傳播指標
文章傳播指標反映微信推送內容的傳播力度/效率,因為在一般情況下,微信推文的生命周期基本維持在一周(絕大部分的閱讀量在此期間完成)。該指標下轄4類數據—從公眾號分享到朋友圈人數、在朋友圈再次分享人數、在朋友圈閱讀人數和來自好友轉發(fā)的閱讀人數,這幾個指標都是發(fā)文后7天內的統(tǒng)計數據,具有一定的時效性,能反映文章在7天內的傳播效果?!皬墓娞柗窒淼脚笥讶θ藬怠敝阜劢z在公眾號會話里查看推送內容后,再轉發(fā)到朋友圈再次被閱讀的人數,也稱之為“二次傳播率”;“在朋友圈再次分享人數”和“來自好友轉發(fā)的閱讀人數”可以理解成“三次傳播率”,它們的傳播路徑過于復雜,見下圖所示:
幾種不同的閱讀路徑
文章價值指標
文章價值指標表示閱讀者對文章內容的認同和贊許,認為文章給他們帶來了某種價值(如心情放松、獲得新知等),該指標下轄4個指標—總閱讀數量、分享人數、微信收藏人數和點贊數量。其中,
分享人數、微信收藏人數是發(fā)文后7天內數據,而閱讀數量和點贊數量是文章從發(fā)文之日起至今的總數量。
下表是各指標的說明以及抓取位置:
各指標抓取位置及涵義
數據抓取位置
(1)群發(fā)功能-已發(fā)送
要注意,這兩個數據跟“圖文分析”里的數據不同,這兩個數據是某一篇文章歷史上總的閱讀量(次數)和點贊量(次數),且具有實時性、即時性,就是當前看到的數據就是從發(fā)布文章到目前所有的閱讀量和點贊量。這里的閱讀數據跟“圖文分析”里的不同,“圖文分析”只記錄了發(fā)文之日起7天內的閱讀,且無“點贊”的數據統(tǒng)計。
總閱讀量和點贊量的數據抓取位置
(2)用戶分析-用戶增長
在“用戶分析”一欄里,需要抓取的數據為取關數、增長粉絲數、凈增粉絲數,這三個數據較容易獲得,在“用戶分析”下方下載excel表格即可得到。
粉絲增長數據抓取位置
(3)圖文分析-單篇圖文
在“圖文分析”這一欄,文章標題、推送時間、送達人數、圖文閱讀人數和分享人數皆可在數據概況處獲得。值得注意的是,這里的圖文閱讀人數和分享人數是7日內的統(tǒng)計總數,且分享人數是轉發(fā)或分享到朋友、朋友圈、微博的去重用戶數(包括非粉絲)的總和。
文章基本信息及價值數據抓取位置
在公眾號分享到朋友圈和在朋友圈再次分享這兩個數據指標可以在圖文分析à單篇圖文à圖文詳情里獲取。
文章傳播指標抓取位置
來自好友轉發(fā)的閱讀人數、來自歷史消息的閱讀人數和來自其他渠道的閱讀人數可從圖文分析à單篇圖文à圖文詳情à趨勢圖這一路徑獲取,不過這3個數據需要將7天的數據進行加總。
文章傳播指標、文章活躍指標抓取位置
從朋友圈打開人數(其實也可以在上圖中的“在朋友圈閱讀”處獲取)、分享轉發(fā)人數、微信收藏人數可以在圖文分析à單篇圖文à圖文詳情的最下方獲取,通過excel下載處理可得。
文章價值指標抓取位置
上述處理的獲得如果用人工手動操作的話,費時費力,如果要統(tǒng)計一年的數據,那可得把運營喵們累死。。。這里提供一個更簡便的做法,那就是用“網絡爬蟲”(注:爬蟲是一種自動獲取網頁內容的程序,是搜索引擎的重要組成部分)來抓取數據,可以在節(jié)省人工的情況下準確無誤的獲得大量上述提到的原始數據。
以下是上述提到的抓取數據指標的信息匯總表格。
經人工手動/網絡爬蟲處理,得到以下原始數據,篇幅有限,所以只展示了局部:
微信后臺的若干原始數據
四、數據分析實操
1.案例背景
某新媒體培訓機構的賬號,從今年年初的1月中旬到近期的7月中旬,時間跨度剛好半年。半年時間里,推文近200篇(包含副文,即第二、第三圖文)。我們接下來要分析的原材料就是這段期間的文章數據、粉絲數據。
做這個聚類分析的主要目的在于:
發(fā)現其中質量較好的文章及質量最差的文章,從數據中發(fā)掘出它們,并發(fā)現它們身上存在的特征,以便將優(yōu)良文風(選題、標題、內容、排版設計等)發(fā)揚下去,并避免以后再出質量不佳的文章,以期閱讀量、轉發(fā)分享量的提升,最終實現憑借公眾號自身內容促進粉絲增長的目的。
注:處于商業(yè)保密,部分內容或數據在不影響數據分析的情況下稍加處理~
2.數據預處理和選擇聚類方法
按上述抓取數據的方法獲得原始數據,需要注意的是,作分析的時候,需要將主副圖文分開分析,因為一般情況下越往下所獲得的點擊量/閱讀量就越低,分析只在同一層級的圖文中進行,然后再在各類層級中進行總的內容分析。本文接下來的分析以主圖文為主,。
主副圖文分析要分開
對獲取的原始數據中的異常值進行剔除,即除去數據中明顯異常大或異常小的數據值,以免對整體分析形成干擾。
將上述Excel原始數據導入SPSS中,檢查一下數據的“度量標準”是否有誤?!岸攘繕藴省毕旅嬗兴姆N類型的數據,即名義、序號、度量。其中,名義是對數據分類的數據類型,如姓名、標題等;序號是對數據進行排序得到的變量;度量則是數據進行測量得到的數值型變量。在原始數據中,日期、標題和發(fā)文時間點等數據也屬于名義型變量(時間點在SPSS中不分析),其他的變量皆為度量變量,是著重分析的變量。
數據預處理后,按“分析à分類àK-均值聚類”的路徑選擇聚類方法。
選擇K-均值聚類(K-means聚類)方法
打開“K-均值聚類”會話框,將其中的變量輸入到“變量”框中,在“保存”項里,勾選“聚類成員”“與聚類中心的距離”這兩項,以便運算后將得到的分類信息顯示在表格里,判斷分類。
其中,最重要的一環(huán)是選擇“聚類數”,這里需要根據經驗和數據的數量來確定,有時需要進行“試錯”。我依次按2次、3次、5次、6次和7次進行運算,發(fā)現輸入5次得到的“解”最為理想,分類不多不少,特征很突出,有分析和參考的價值。
進行“聚類分析”選項設置
設置好項目后,進行確定,得到如下圖所示的運算結果:
聚類分析運算結果
注意上圖中紅色虛線框部分的數據,分別是“分類數據”和“距離分類中心距離”的數據,然后將結果另存為“excel2007至2010”格式,得出的數據和spss中所呈現的保持一致。
輸出數據
3.處理經聚類分析得到的數據
先將得出的數據進行替換處理,即分類數據中的“1”“2”…“5”替換成“第一類“”第二類”…”第五類“,然后再
進行透視表處理,各個變量在“值字段設置“里皆取平均值,見下表:
運用透視表處理經聚類分析得到的數據
經透視表處理好數據后,將該數據“全選”并“粘貼”“復制”到新的sheet里,以便按之前的評價指標體系將不同類型數據進行分類整理。將各數據進行“熱力圖示化”,以顏色深淺和冷暖顯示數值的高低差異,直觀的反映數據的大小變化情況。從而得到下表:
微信文章質量評估體系表
從上表中可以看到,近200篇文章可以分為5類,按照上述提及的微信文章質量評估體系,每一類的特征都不一樣(以下各指標的程度由低到高依次分為“非常差-較差-一般-較好-非常好”,這種比較在這5個類別之間進行,具有相對性):
第一類:傳播力非常強,在一周內傳播時效性顯著,但粉絲增長度低,且文章具有非常高的價值(對目標用戶來說很“值”),同時相應的粉絲也非常活躍,;
第二類:文章一周內的傳播力較強,粉絲增長量較高,文章的價值度較高,粉絲活躍性良好;
第三類:文章傳播效率地,粉絲取關量大,文章價值度低,粉絲活躍性非常差;
第四類:文章傳播效率一般,粉絲增長量較大,文章價值度一般,粉絲活躍度一般;
第五類:文章傳播效率一般,粉絲增長度一般,文章價值度一般,粉絲活躍度一般。
如果微信運營的經驗不足和對數據不敏感,可以進一步將上述指標數據值進行標準化,乘以權重系數(根據過往經驗和公司強調的KPI來決定)后相加,從而使多指標合并起來(如粉絲增長指標=-取消關注標準值*權重1+新關注數標準值*權重2+凈增粉絲數標準值*權重3),在同一維度的不同分類下的指標值可以進行比較,其大小用“★”和“☆”的五角星來表示,得到這5類文章各指標的量化表:
微信文章質量量化評估表
各個分類的特征明晰之后,我們需要找到各分類對應的文章,查看他們的標題、內容和發(fā)文時間點,也就是上文所提及的“文章信息指標”,值得注意的是,此處通過函數“weekday”可以查詢出發(fā)文日屬于“周幾”,多添加一個“時間維度”對于我們分析發(fā)文時間很有幫助。結果如下表所示:
各分類下的具體圖文信息
從中可以看到,其中有些廣告性的一篇軟文會在不同日期出現很多次,這是為了達到一定的營銷轉化目的,我們在分析時僅保留最初的一篇。
分析的順序是這樣的:先分析文章質量最佳的和最差的,然后再分析一般性的文章所具有的特點。
第一類文章
從上表可以看出,這篇文章的傳播效果和文章價值度、粉絲活躍度都非常好,但粉絲增長量很小。這篇文章發(fā)布于支付寶“集五?!钡哪嵌螘r間,很好的借助了外部的熱點,且“尷尬”和大家參與的火熱形成鮮明的反差,在某種程度上能勾起讀者的閱讀欲望,這是一個搶點借勢、內容區(qū)分度較好的文章。
第二類文章
從上表中可以看出,文章質量次優(yōu)的2篇文章都是關于微信功能方面的文章,對運營公眾號的人(本公眾號的定位人群)來說,微信功能上的升級或新玩法都會激起他們的強烈關注。第二類文章的各項指標相對均衡,是這五類文章中質量最佳的類型。
第三類文章(局部)
第三類文章在這5個分類中屬于“最差”的,其中的營銷類(廣告)較多,再就是講座類的內容,缺少“干貨性”的內容,不符合目標受眾的口味,所以各項指標都不太理想。
第四類和第五類依次類推,同時也不放過某一類別下具體的文章,結合各項指標來進行診斷分析,得出規(guī)律性的結論。以下是今后該公眾號內容采編的方向,相對來說,這些內容更符合目標受眾的口味。
經分析得出偏好度較好的一些內容采編方向
此外,關于發(fā)布時間的分析,上一篇文章《如何利用微信后臺數據優(yōu)化微信運營》分析了2種類型的時間分析,即日期和時間段的分析,分別以日和小時為單位,現再介紹一種按周的分析方法,具體做法是在excel中調用“weeknum”函數,重點選取凈增粉絲數、總閱讀數和(總)分享人數的“總攬性”數據,形成關于周的數據,這種分析適用于數據量很大的時候,找到重點的分析對象,節(jié)省分析時間,見下表:
以周為分析單位的凈增粉絲數、總閱讀數和分享人數熱力表
聚類分析在運營中的延伸應用
1.細分市場
市場細分
聚類分析是細分市場的有效工具,可以幫我們在做市場/運營戰(zhàn)略決策時找到新的、可行的潛在市場。通過市場調研,我們可以獲取本公司和主要競爭者是品牌方面的“第一提及知名度”、“提示前知名度”和“提示后知名度”等指標值,將這些作為聚類分析的變量,將本公司和潛在對手的產品或品牌進行劃分。在聚類以后,結合每一產品/品牌的多維度屬性研究,可以發(fā)現哪些屬性組合目前還沒有融入所要進行的產品/品牌中,從而找到公司在市場中的機會,不至于身處競爭激烈的市場“紅?!敝?。
2.用戶畫像
用戶畫像的主要維度
聚類分析可以用來發(fā)現不同的用戶群體,并且通過消費者的人口統(tǒng)計學特征、社會屬性和消費屬性來刻畫出不同的用戶群體的特征,也就是對不同的用戶群體進行“用戶畫像”分析。我們在網站上、APP上獲取了大量的用戶數據后,通過分組聚類出具有相似瀏覽行為的用戶,并分析用戶的共同特征,可以更好的幫助我們了解自身的產品/服務所面向的顧客,以便我們能及時做出適銷對路的產品/服務,或是及時的產品/服務優(yōu)化。
可用于“用戶畫像”聚類分析的后臺數據(經處理)
結語
通過這個實際案例,大家應該能領略到聚類分析的魅力了吧。但是,運營喵要說的是,聚類分析方法只是“術”,是工具而已,重要的是對運營事務的深刻理解,以及一整套的數據分析流程(也可以稱之為“數據分析方法論”)。根據上面的實際案例,運營喵認為數據分析的整個流程應該是這個樣子的:
數據分析的一整套流程
最后呢,運營喵再來說說數據之于運營的作用,它們很多時候體現在:
發(fā)現運營中存在的若干問題,及時調整運營策略和方法;
根據自身積累的歷史數據/信息或行業(yè)內一般標準,實時監(jiān)控數據的變化趨勢,及時遏止負面結果的發(fā)生;
從數據的背后洞察出用戶的行為及心理,從而把自己真正放置在于用戶的立場上去看問題,對產品/服務有一個更全面、更準確的理解。
掌握盡可能多的數據分析方法和工具,培養(yǎng)數據分析的方法論,對于我們最大限度的發(fā)揮數據分析在運營的作用大有裨益,誰說運營不需要懂數據挖掘?懂得高階數據分析—數據挖掘的運營喵才更有競爭力,因為通過數據,你能夠用數據驅動運營,在做運營的時候知己知彼,收放自如,知道自己的運營的目的地在哪里~
文章來源:人人都是產品經理
【轉載說明】  若上述素材出現侵權,請及時聯(lián)系我們刪除及進行處理:[email protected]