來源|鳥哥筆記 ID:niaoge8
作者|appbk@劉新鳴
所謂“組詞”,就是把一些具有“共同部分”的詞組合到一起,如App的關(guān)鍵詞包含“騰訊新聞”和“網(wǎng)易新聞”這兩個詞,就可以組合成“騰訊網(wǎng)易新聞”,而用戶搜索時,搜索“騰訊新聞”或“網(wǎng)易新聞”也還是能搜到該App的。
之所有“組詞”的需求,主要是由于Appstore對填寫的關(guān)鍵詞長度有限制(不得大于100個字符),而我們需要填寫的關(guān)鍵詞串經(jīng)常大于100字符,因此需要對填寫的一堆詞進行組詞,對可以合并的詞盡可能地進行合并,從而能在100字符內(nèi)盡可能多地展示我們的app信息,增加app被搜索詞命中的概率。
組詞看似簡單,但涉及搜索引擎的分詞和檢索的基礎(chǔ)知識,如果對這些不清楚,就經(jīng)常會產(chǎn)生如“支付寶”和“寶貝”能否組合成“支付寶貝”這樣的疑惑。因此,本文就首先簡要介紹下分詞和搜索的基本知識,然后再講下appbk的自動組詞方法。
分詞技術(shù)
現(xiàn)代搜索引擎,都是以“詞”為基礎(chǔ)單位進行設(shè)計的。詞是最小的有意義的語言成分。英語等字母語言,其單詞天然按照空格隔開,但中文等東亞語種,其詞之間并沒有明顯的分隔符,因此就產(chǎn)生了“分詞”的需求。“分詞”就是把一個漢語字符串分成一個個詞的過程。
分詞的例子如“騰訊新聞”的分詞為:“騰訊 | 新聞”,“網(wǎng)易新聞” 的為“網(wǎng)易 | 新聞”。
由于中文分詞經(jīng)常會有“歧義”現(xiàn)象,如“兵乓球拍賣完了”可切分為“乒乓球 | 拍賣 |完了”又可以切分為“乒乓球拍| 賣 | 完了”,針對這種情況,搜索系統(tǒng)一般會把兩種分詞形式都記錄下來,以供搜索時使用。
搜索的基礎(chǔ):詞袋模型(word of bag)
“詞袋模型”是搜索引擎中的一種簡單假設(shè),其不考慮詞的“順序”,認(rèn)為一個文本就是
是一堆詞的“集合”。也就是如兩個文本“騰訊新聞”、“新聞騰訊”,對搜索引擎而言,是完全一樣的。這種假設(shè)也是我們能夠進行組詞的基礎(chǔ)。
我們還是以“騰訊新聞”和“新聞騰訊”,以及其組詞“騰訊網(wǎng)易新聞”為例,其“詞袋”模型如下圖所示:
圖1 “騰訊新聞”和“新聞騰訊”,及其組詞“騰訊網(wǎng)易新聞”的詞袋模型
由于“詞袋”模型是一個“集合”模型,可以不考慮重復(fù)元素,因此上面袋子中的兩個“新聞”可以視為一個。從上圖中可以看到,“騰訊新聞”+“新聞騰訊”,和“騰訊網(wǎng)易新聞”的詞袋模型是完全等價的,也就是說對搜索引擎而言,他們是完全一樣的。
然后,我們還可以利用上述模型,簡單描述用戶搜索的過程。搜索的時候,搜索系統(tǒng)首先會在對用戶輸入的搜索詞進行分詞,然后在關(guān)鍵詞的“袋子”里面依次查找搜索詞的分詞。還是上面的例子,如用戶搜索“騰訊新聞”時,流程如下圖所示:
圖2 基于“詞袋”模型的查找流程,搜索系統(tǒng)在“詞袋”中分別查找“騰訊”和“新聞”這兩個搜索詞的分詞
然后我們再看下“支付寶”和“寶貝”的例子 ,說明為啥他們不能組詞。我們把“支付寶”和“寶貝”組成“支付寶貝”,但其分詞的時候,可能會分成“支付 | 寶貝”,這種分詞歧義就可能造成搜索“支付寶”的時候,搜不到該App,具體如下圖所示:
圖3 關(guān)鍵詞“支付寶”和“寶貝”組成“支付寶貝”后,由于可能的分詞歧義,用戶搜索“支付寶”時,可能會搜索不到該App。
組詞方法
因為搜索系統(tǒng)是以“詞”為基礎(chǔ)單位進行檢索的,因此,首先需要對關(guān)鍵詞進行“分詞”。然后就是具體的“組詞”過程了。
“組詞”就是一個分組的過程,我們利用的是機器學(xué)習(xí)中的“在線聚類”技術(shù),其實就是把字符串中有相同子串的詞組合在一起,然后不斷循環(huán),直到?jīng)]有重合的詞出現(xiàn)。組詞過程中,我們考慮到蘋果的規(guī)則,一個“詞”不能過長,否則可能會被認(rèn)為是關(guān)鍵詞堆砌,因此,我們限制了組詞的最大個數(shù),就是最多組合5個詞。
在appbk上有一個“組詞工具”服務(wù),具體見appbk.com網(wǎng)站的菜單導(dǎo)航欄。它的“推薦組詞”結(jié)果設(shè)置了最大組詞個數(shù)限制,以‘美女直播,yy視頻,交友網(wǎng)站,明星直播’為例,其在上面的組詞結(jié)果如下圖所示:
圖4 appbk的組詞服務(wù)
其中,‘美女直播’和明星直播兩個詞組合在了一起,省了兩個字符和一個逗號的空間。
當(dāng)然,這個組詞工具還給出了不考慮組詞長度的結(jié)果,就是“最大限度組詞”的結(jié)果。
逗號問題
“最大限度組詞”,其實已經(jīng)把所有可能組合的詞,都組到了一起,但還有用戶經(jīng)常會問,這樣的組詞還是有“逗號”存在,能不能干脆把全部的逗號都干掉,這樣不是能加更多的詞嗎?
根據(jù)上述的“詞袋”模型,即使把所有的逗號都干掉,其關(guān)鍵詞的“詞袋”是沒有變化的,因此對搜索的影響不是很大。但考慮到下面的因素,并不建議這樣做:
1、蘋果規(guī)則限制。在2015年之前,很多ASO服務(wù)商給出的關(guān)鍵詞建議都是沒有任何逗號的,但這種情況多了后,蘋果的關(guān)鍵詞審核就會更嚴(yán)格,這樣的形式會被認(rèn)為是“關(guān)鍵詞堆砌”,審核就不通過,因此,組詞需要“適度”。
2、權(quán)重影響。根據(jù)“詞袋”模型,用戶搜索“騰訊新聞”時,關(guān)鍵詞填寫“騰訊新聞”或者“騰訊網(wǎng)易新聞”,是都能搜到的,這個是沒有問題的。但是,關(guān)鍵詞“騰訊新聞”與用戶搜索詞是完全一致的,這種情況,搜索引擎一般都會有少量的加分。
綜合我們的一些實踐經(jīng)驗,給出以下建議:
1、組詞不宜過長,以不超過5個為宜。
2、對下載量較少的App,不需要刻意的組詞,因為你的App基本處在長尾位置,一點點的加分,就可能讓你的搜索排名有大幅提升。
3、對應(yīng)需要“刷”的詞,還有核心帶量的關(guān)鍵詞,建議都用逗號隔開,不進行組詞。
【相關(guān)推薦】
揭秘ASM(二):蘋果競價廣告后臺設(shè)置步驟詳解
緊急通知!蘋果再次更新《App Store審核指南》,新增內(nèi)容多達25處!
有哪些值得一試的APP推廣小技巧?
這些坑你要避開,從ASO的角度看iPhone7發(fā)布會
iOS搜索競價廣告(一):基礎(chǔ)篇,揭秘ASM
史上最全App推廣渠道(包含8個方向37個方法)
姑婆那些事兒推廣服務(wù) 點擊 :http://www.gupowang.com/news/4585.html
大家都愛搜:ASM 互聯(lián)網(wǎng)資訊類類有話說App推廣運營經(jīng)驗線下推廣活動推薦微信營銷姑婆專題姑婆圈ASO校園推廣地推ASO100渠道刷量校園運營團隊
姑婆那些事兒(www.gupowang.com)是互聯(lián)網(wǎng)推廣運營知識分享平臺,關(guān)注移動推廣(android,ios)運營,網(wǎng)站推廣運營、校園推廣及互聯(lián)網(wǎng)領(lǐng)域最新動態(tài) 。歡迎關(guān)注我們的微信(gupo520),新浪微博(姑婆那些事兒)。
版權(quán)聲明:本文來源于互聯(lián)網(wǎng),僅作分享學(xué)習(xí)之用,姑婆那些事兒負(fù)責(zé)整理推薦。文章僅代表原作者獨立觀點,不代表本平臺運營者觀點與立場。如有版權(quán)問題,請聯(lián)系姑婆那些事兒—小秘書(微信號:gpxms001)協(xié)商解決 。
App Store ASO優(yōu)質(zhì)渠道推薦:
A、業(yè)務(wù)描述
App Store搜索結(jié)果排名即App Store ASO。讓您的關(guān)鍵詞在App Store排名靠前。
B、優(yōu)勢。
1、高效。上排名速度快。
2、價格優(yōu)勢。市場低價。
3、服務(wù)好。定期的投放報告以及策略,讓您安心,省事。
C、相關(guān)鏈接
http://www.gupowang.com/zhuanti/3964.html
D、聯(lián)系方式
姑婆那些事兒2013年開始研究ASO,最近在重新整理相關(guān)知識(本月整理為文檔,電子書),也可以為大家免費答疑,歡迎大家加下善小玉微信,一起交流討論。
愛盈利-運營小咖秀(www.jza6.com) 始終堅持研究分享移動互聯(lián)網(wǎng)App運營推廣經(jīng)驗、策略、全案、渠道等純干貨知識內(nèi)容;是廣大App運營從業(yè)者的知識啟蒙、成長指導(dǎo)、進階學(xué)習(xí)的集聚平臺;
想了解更多移動互聯(lián)網(wǎng)干貨知識,請關(guān)注微信公眾號運營小咖秀(ID: yunyingshow)