這篇是基于成本考量的分享內(nèi)容——關(guān)于效果與成本兼顧的APP反作弊策略分享。
APP反作弊是一個實踐性很強的業(yè)務(wù)。在現(xiàn)實的環(huán)境中,沒有絕對有效的反作弊方法,這里有一個核心底線,就是成本。
你要投入的成本跟收獲的價值相比,合算嗎?畢竟這是一個生意,而不是一個學(xué)識研究,或探究真理。
說到底,反作弊最后算的還是經(jīng)濟賬,是一個效率問題。
量江湖在實踐中摸索出一套經(jīng)濟高效的反作弊策略。關(guān)于高效,大家已經(jīng)比較清楚了,我們現(xiàn)在回答另外一個問題——如何做到經(jīng)濟的。
針對行業(yè)現(xiàn)狀,量江湖的反作弊處理策略是:
1) 錨定原點:數(shù)字DNA指紋技術(shù),標識硬件設(shè)備,是構(gòu)成量江湖整套作弊防護體系中的參照系、坐標系;
2) 分層過濾:多層獨立防護技術(shù),能在初層解決的問題,就在初層解決,不用增加處理后續(xù)的處理成本,同時,針對疑難雜癥,加深作弊的防護深度和精細度,確保萬無一失;
3) 軟硬兼施:硬件信息和軟件環(huán)境綜合考慮,全面考慮各種因素、各項指標;
4) 模式識別:建立如同殺毒軟件一樣的病毒庫——異常行為特征庫技術(shù)是量江湖的獨門秘籍,不僅覆蓋全部的作弊手段,還提供實時的更新機制,把作弊殲滅在信息源頭,降低機器計算的開銷和處理成本;
(一)多層獨立識別技術(shù)
先說分成過濾。作弊識別是一個極其復(fù)雜的工程,有的作弊特征非常明顯,有的則隱藏很深,還有少量情況是特征不夠明顯,甚至是個概率事件。為此,量江湖在識別作弊行為上采用了多層防護、多維判定、獨立識別、綜合評定的全套作弊識別解決方案。目的在于提高防范強度和精度的同時,兼顧方案的時效性和實用性:對于70%以上的作弊行為,可以在10分鐘內(nèi)給出判斷;剩余下的大約20%高度仿真作弊行為,可以在3小時內(nèi)給出判定;但其余大概5%左右的疑似作弊但特征不明顯的行為,則需要2天的時間給出判定(跟版本有關(guān)),并對最終所有結(jié)果給出最終的判定:
1.1:初濾識別層
硬件設(shè)備異常嗅探技術(shù):
第一步是判斷設(shè)備本身、app、以及工作環(huán)境,是否處于被調(diào)試狀態(tài),當處于調(diào)試狀態(tài),系統(tǒng)會啟動更加嚴格的設(shè)備驗證算法,可識別目前所有通過調(diào)試方式刷量的行為;
第二步是判斷設(shè)備的OS是否被劫持。一旦操作系統(tǒng)被劫持,就可以通過軟件方式篡改設(shè)備信息。而量江湖的嗅探技術(shù),不依賴操作系統(tǒng)接口的方式,而是獨立獲取設(shè)備信息,不受任何劫持木馬或程序的干擾,通過對比得到準確的判斷。
第三步是判斷模擬器作假。量江湖對模擬器的作假判斷有豐富的經(jīng)驗與獨特技術(shù),可以100%識別基于模擬器技術(shù)的作弊。
軟硬件信息一致性校驗技術(shù)
量江湖還對所取得關(guān)鍵設(shè)備信息、軟件信息,如制造商ID、CPU、Mac地址、IMEI、操作系統(tǒng)版本、機型版本等各種進行一致性的校驗,并與數(shù)據(jù)庫中的用戶數(shù)據(jù)進行比對校驗,進行雙保險的一致性校驗比對。加深了對作假的審查深度。
1.2再濾識別層
IP甄別:對其IP地址的來源、性質(zhì)、分布進行全面的審查判斷;
大數(shù)據(jù)比對:量江湖擁有5億以上的用戶畫像,對所取得硬件關(guān)鍵設(shè)備ID進行合規(guī)校驗以及數(shù)據(jù)庫行為校驗,分析其異常概率;
群體行為分析:包括接入網(wǎng)絡(luò)類型、運營商分布、操作系統(tǒng)分布、機型分布、地理位置分布等特征,逐個與先驗數(shù)據(jù)所構(gòu)建的行為分布模型進行模式校驗比對;
1.3終濾識別層
對上兩層還不能確定的疑似情況作最后的審查,一方面綜合評定所有的指標,另一方面與異常行為特征庫所有的特征進行一一Match,并計算其匹配度。從而對這些疑難案例給出最終的結(jié)論。
(二)模式識別——異常行為特征庫技術(shù)
再說模式識別。原理介紹每一種作假手段制造出來的,實際上是用戶行為,通過機器學(xué)習(xí)對海量用戶行為的洞察,抽象出這些異常用戶或者異常來源的行為特征,這種行為特征稱之為異常行為特征。這些各種各樣的異常行為特征就構(gòu)成了量江湖反作弊異常行為特征庫,類似于殺毒軟件中的“病毒庫”。
量江湖目前已經(jīng)收集、識別和記錄存儲了當前所有流量作弊方式的行為特征。
實時更新:量江湖密切關(guān)注任何一種新的作弊手段,發(fā)現(xiàn),收集,學(xué)習(xí),并輸出更新異常行為特征庫。確??蛻粼诘谝粫r間發(fā)現(xiàn)作假行為。
(三)錨定原點——數(shù)字DNA指紋技術(shù)
量江湖采用獨特的數(shù)字DNA指紋技術(shù),而不是使用IMEI、MAC、設(shè)備SN、藍牙地址、ICCID等設(shè)備標識,以防止篡改。對于通過動態(tài)修改設(shè)備參數(shù)如MAC、IMEI、IMSI、ICCID、藍牙地址等核心硬件的作弊行為,量江湖通過以數(shù)字DNA指紋技術(shù)為中心,參考硬件多維度參數(shù)檢測,綜合網(wǎng)絡(luò)側(cè)技術(shù)的風(fēng)險評估以及異常行為特征庫的匹配度評估,給出最終的判定。
(四)底層技術(shù)——機器學(xué)習(xí)及大數(shù)據(jù)技術(shù)
4.1機器學(xué)習(xí)技術(shù)
機器學(xué)習(xí)的優(yōu)勢就是能從海量數(shù)據(jù)中抽象出更加系統(tǒng)、更加深刻、更加完整的智慧、模式、特征;
機器學(xué)習(xí)不僅學(xué)習(xí)的更加深入透徹,還學(xué)習(xí)的非??欤跀?shù)據(jù)充分的情況下,對一種新作弊方法的學(xué)習(xí)可以在1小時內(nèi)完成;
機器學(xué)習(xí)可以在人類的監(jiān)督下自動學(xué)習(xí),也就是說他不僅24小時在干活,而且還24小時在學(xué)習(xí)和進步,換句話說,其學(xué)習(xí)的速度不僅遠超人類,而其學(xué)習(xí)的加速度更加令人生畏,實在是防作弊制勝之法寶。
4.2大數(shù)據(jù)
大數(shù)據(jù):5億以上的用戶數(shù)據(jù)是量江湖做用戶識別準確率的基礎(chǔ):
基本參考:5億以上的用戶量已經(jīng)涵蓋了半數(shù)以上的移動互聯(lián)網(wǎng)用戶,活生生的數(shù)據(jù)就是硬邦邦的證據(jù);
機器學(xué)習(xí)的基礎(chǔ),機器學(xué)習(xí)的一個關(guān)鍵是有多少數(shù)據(jù)和多少種數(shù)據(jù)可以給機器喂,這個量級的數(shù)據(jù),已經(jīng)基本上涵蓋了所有的用戶行為類型
后續(xù)見二篇...