鑒于上一篇《第一個產(chǎn)品安裝量破千萬,我總結了這3句話》有人說沒有干貨,所以今天帶來一篇誠意滿滿的干貨。請自備酒水飲料。
先說一下我要做什么:為了解行業(yè)老大做線上手游陪玩業(yè)務的基本情況,想通過他們在app提供的月排行榜的數(shù)據(jù),做初步營收相關的數(shù)據(jù)分析。
作為萬能的產(chǎn)品經(jīng)理,不懂技術和代碼也一樣可以數(shù)據(jù)抓取。
準備工作:
- 百度、bing必應
- charles或者其他的app抓包工具
- excel
- sublime(可以做一些基本的批量處理,沒有也可以)
1. 獲取源數(shù)據(jù)
大部分app中使用https鏈接,所以正常使用charles抓包之前,先安裝描述文件。不然會出現(xiàn)亂碼(先百度“charles教程”和“charles https 抓取”這幾個關鍵字)
在抓到的URL中,選擇json格式,我們需要的東西就在這里面,保存到sublime中內(nèi)容如下(不知道這玩意要不要打碼)
這里面更多的東西是跟我無關的,我需要的字段有這些:
nickname ? ? ? ?用戶昵稱
property_value ? ? ? ?游戲段位
gender??????? 性別(1=男;2=女)
birthday??????? 生日
city_name??????? 城市
price??????? 單價
nickname??????? 昵稱
order_count??????? 訂單量
跟這些沒關系的統(tǒng)統(tǒng)過濾掉(工具:sublime、excel)。
漢字在 json 中顯示的是 UNICODE 編碼(別問我這是啥,我也不認識他),所以還需要把 UNICODE 編碼轉(zhuǎn)換成漢字,所以請百度“UNICODE 編碼 轉(zhuǎn)換”。
經(jīng)過上面的工具,把得到的結果放到excel里面,得到如下內(nèi)容:
至此,抓取過程結束。然后對數(shù)據(jù)進行加工。
2. 數(shù)據(jù)加工
我想要的數(shù)據(jù)是:
- 總收入
- 總訂單
- 人均收入
- 投入時間
- 訂單量
- 平均每單交易額
- 用戶基本屬性(年齡、性別、城市分布)
其中投入時間、年齡、城市分布的信息是抓不到的。
估算投入產(chǎn)出比較重要的一個維度是時間,所以要先估算一個完成一筆交易要多久。
考慮到他們的段位在游戲里面都比較高,就算每局15分鐘。也就是說完成一筆訂單需要花費15分鐘。
月排行第一名那哥們,接了2003單。對他來說,月薪30K,每天工作16.7個小時(當然,他可能是做外包)。
- 出生日期經(jīng)過簡單的計算,可以得到年齡;
- 找一份最新的全國城市排名,我用抓包得來的數(shù)據(jù)做匹配,城市分布搞定。
3. 數(shù)據(jù)分析
抓取的內(nèi)容都是可以在app中可以看到的,抓取的目的,是不用自己手動計算排行里面500多個人的信息。所以這個算是免責聲明嗎?
對了,上個月也做了類似的分析,爬取了7w個頁面。同樣不需要懂代碼,感興趣的話我們下次聊聊吧。
作者:王也,產(chǎn)品經(jīng)理(QQ/wx:867611672;個人公眾號:野生產(chǎn)品經(jīng)理),歡迎與我交流。ps:最近想換份工作
本文由 @王也 原創(chuàng)發(fā)布于愛盈利-運營小咖秀。未經(jīng)許可,禁止轉(zhuǎn)載。
愛盈利-運營小咖秀 始終堅持研究分享移動互聯(lián)網(wǎng)App運營推廣經(jīng)驗、策略、全案、渠道等純干貨知識內(nèi)容;是廣大App運營從業(yè)者的知識啟蒙、成長指導、進階學習的集聚平臺;