0 楔子
5月11日,讓眾多安迪粉期待已久的《歡樂(lè)頌》第二季終于播出。相比首季,《歡樂(lè)頌2》在造型和場(chǎng)景上顯得更為精致時(shí)尚,且其中每個(gè)角色的造型卻都是遵從的其身份和背景,并不突兀。
正所謂“外行看熱鬧,內(nèi)行看門(mén)道”,作為數(shù)據(jù)分析愛(ài)好者的筆者,自然想從數(shù)據(jù)的角度去解讀這部熱播劇的方方面面,包括輿情傳播、網(wǎng)絡(luò)口碑、人物社交網(wǎng)絡(luò)分析及,以及小說(shuō)內(nèi)容的文本分析。以下是筆者在這篇文章想要著重分析的內(nèi)容:
這部分在互聯(lián)網(wǎng)上的輿情傳播如何?包括該劇的全網(wǎng)傳播趨勢(shì)、關(guān)注人群畫(huà)像,及網(wǎng)絡(luò)營(yíng)銷(xiāo)手法。
和大獲成功的第一部相比,第二部的口碑如何?主要涉及本劇豆瓣影評(píng)的文本分析。
對(duì)第一、二季的小說(shuō)文本分析。主要涉及關(guān)鍵詞提取、主要人物的社交網(wǎng)絡(luò)關(guān)系及關(guān)聯(lián)詞分析等。
在筆者進(jìn)行分析的過(guò)程中,會(huì)用到一些常用的(大)數(shù)據(jù)分析工具,以及環(huán)環(huán)相扣的數(shù)據(jù)分析討論,雖然對(duì)于常規(guī)的數(shù)據(jù)運(yùn)營(yíng)并無(wú)直接的幫助,但“他山之石,可以攻玉”,分析的思路卻可以作為參考,以期應(yīng)用到其他實(shí)際的場(chǎng)景中。
1 《歡樂(lè)頌2》的大數(shù)據(jù)輿情分析
在第一部分中,筆者選取了2017.05.07~2017.05.29期間關(guān)于《歡樂(lè)頌2》的全網(wǎng)輿情數(shù)據(jù)作為數(shù)據(jù)分析對(duì)象,利用新浪微輿情的“信息監(jiān)測(cè)”和“全網(wǎng)事件分析”作為數(shù)據(jù)采集、數(shù)據(jù)分析和可視化的工具。
以下分別從《歡樂(lè)頌2》的全網(wǎng)傳播概況及傳播趨勢(shì)兩方面進(jìn)行分析。
1.1《歡樂(lè)頌2》的全網(wǎng)傳播概況
(1)全網(wǎng)傳播走勢(shì)
上圖是《歡樂(lè)頌2》在這段時(shí)間內(nèi)信息傳播走勢(shì)圖,自開(kāi)播之日起,該劇的全網(wǎng)聲量出現(xiàn)了明顯的提升,而且里面出現(xiàn)了幾個(gè)信息傳播的“波峰”,說(shuō)明當(dāng)日全網(wǎng)關(guān)于該劇的討論(包括媒體和網(wǎng)民個(gè)體)較多。尤其需要注意的是,本劇開(kāi)播當(dāng)日(5-11)的波峰峰值是該時(shí)間段內(nèi)最大的一個(gè),這是不是一個(gè)巧合呢?不要急,筆者會(huì)在后面為各位小伙伴解開(kāi)謎底。
(2)全網(wǎng)正負(fù)面信息占比
從上圖中可以看到,這段時(shí)間內(nèi),全網(wǎng)關(guān)于《歡樂(lè)頌2》的信息量有5,564,016條,其中負(fù)面信息的占比達(dá)到152,315條,占到總信息量的2.74%。
同時(shí),在總體上,負(fù)面信息隨著時(shí)間的推移又不斷增長(zhǎng)的趨勢(shì)。
結(jié)合二者來(lái)看,如此這般的負(fù)面信息占比和發(fā)展情形對(duì)于該劇來(lái)說(shuō)不太有利,說(shuō)明全網(wǎng)關(guān)于該劇的負(fù)面口碑評(píng)價(jià)比較顯著,需要引起制片方的重視,筆者會(huì)在接下來(lái)的分析中,探明到底出現(xiàn)了哪些負(fù)面口碑,以及它們出現(xiàn)的原因。
(3)全網(wǎng)關(guān)注度來(lái)源
因?yàn)樵谟耙晞〉膫鞑ヂ暳恐校⒉┻@塊占據(jù)較大的比重,所以筆者在排除微博這一信息來(lái)源后,對(duì)余下的信息來(lái)源TOP10進(jìn)行了統(tǒng)計(jì),如下圖所示:
從上圖可以看出,除開(kāi)微博外,微信、今日頭條這兩大社會(huì)化媒體平臺(tái)上關(guān)于本劇的信息量貢獻(xiàn)最多,尤其微信在近日推出了「微信實(shí)驗(yàn)室」,通過(guò)新增加的“搜一搜”和“看一看”這兩個(gè)入口,使用戶能夠主動(dòng)搜索關(guān)鍵詞,能夠?yàn)g覽熱點(diǎn)資訊、好友關(guān)注的資訊以及自己感興趣的文章,這樣的動(dòng)作加上數(shù)年的優(yōu)質(zhì)內(nèi)容沉淀,使得微信在社會(huì)化媒體內(nèi)容生產(chǎn)方面的重要性日漸突出。
(4)全網(wǎng)信息地域分布
有點(diǎn)意外,全網(wǎng)關(guān)注度(關(guān)于這部劇的全網(wǎng)信息量)排名榜首的是江蘇,竟然不是北京和上海這兩大年輕白領(lǐng)云集的現(xiàn)代化的都市,尤其是上海,關(guān)于本劇的信息量分布在TOP10中墊底,難道上海的網(wǎng)民和媒體絕大部分都棄劇了?或者說(shuō)是本劇的口碑極差?
對(duì)于此種疑問(wèn),筆者將會(huì)在第二部分進(jìn)行分析。
1.2 人群畫(huà)像
因?yàn)殛P(guān)于本劇的探討,微博(主要是新浪微博)占據(jù)大頭,所以筆者選取該平臺(tái)上的人群作為分析對(duì)象。
(1) 性別分布
毫無(wú)疑問(wèn),女生是該劇的忠實(shí)擁簇,他們對(duì)該劇的狂熱絕對(duì)超過(guò)男生。
(2) 年齡分布
從下圖中可以看出,19-34這個(gè)年齡區(qū)間占據(jù)關(guān)注人群的70%左右,也就是說(shuō)青年群體對(duì)該劇很感興趣。
(3) 興趣圖譜
下圖給出了關(guān)注該劇的人群的興趣標(biāo)簽TOP5,可以看出,這部分人群比較追星,熱愛(ài)生活,都是一些極具年輕人特質(zhì)的興趣愛(ài)好。
(4)用戶情感狀態(tài)
根據(jù)關(guān)注《歡樂(lè)頌2》的微博用戶給自己打的情感類(lèi)別標(biāo)簽,可以得知此類(lèi)用戶的情感狀態(tài)分布情況:
由此可以看到,大部分用戶(80.75%)處于情感空白/開(kāi)窗期(“單身”和“求交往”狀態(tài)),再次是“戀愛(ài)中”,結(jié)合前面的年齡分布,說(shuō)明關(guān)注人群大都是未婚青年。
(5)用戶學(xué)歷分布
毫無(wú)疑問(wèn),這類(lèi)都市情感劇的受眾以受過(guò)高等教育的人群為主,因?yàn)樵搫≈v述的是高學(xué)歷白領(lǐng)在大城市工作生活和戀愛(ài)的故事。
(6)用戶城市類(lèi)型
有點(diǎn)出乎意料的是,4線及以下城市的關(guān)注人群所占比重最高,為30.26%,其次是2線和3線城市,而一線城市的關(guān)注人群則僅為14.41%,難道是一線城市的人群對(duì)本劇比較挑剔?
結(jié)合前面的信息地域分布,關(guān)注《歡樂(lè)頌2》的主體是一群熱愛(ài)生活、熱衷于追星的高學(xué)歷青年女性,她們生活在一線城市開(kāi)外,情感狀態(tài)多為單身。
1.3 《歡樂(lè)頌2》開(kāi)播當(dāng)日的營(yíng)銷(xiāo)宣傳分析
在前面提及的全網(wǎng)傳播趨勢(shì)中,筆者提到了該劇在開(kāi)播當(dāng)日就出現(xiàn)明顯的聲量高峰,很明顯,這絕非偶依然。
從前面的信息來(lái)源分布可以得知,該劇絕大部分的聲量都來(lái)源于微博,尤其是新浪微博。為此,筆者單獨(dú)調(diào)出5-11的微博信息趨勢(shì)數(shù)據(jù)。
從上圖可以看到,新浪微博上關(guān)于該劇的信息量大體上是呈現(xiàn)上升趨勢(shì)的。在當(dāng)日的23時(shí)左右達(dá)到高峰,而且這種增長(zhǎng)趨勢(shì)很有節(jié)奏感---從工作時(shí)間段9:00開(kāi)始,聲量隨時(shí)間的推移不斷上漲。
為了進(jìn)一步發(fā)現(xiàn)其中的傳播規(guī)律,筆者利用新浪微輿情的“信息監(jiān)測(cè)”模塊對(duì)其中有影響力的微博進(jìn)行了進(jìn)一步的搜尋和排查,也就是發(fā)現(xiàn)其中轉(zhuǎn)發(fā)次數(shù)較多的微博,以及順藤摸瓜,發(fā)現(xiàn)傳播源頭。
經(jīng)過(guò)逐步的抽絲剝繭,筆者發(fā)現(xiàn)了其中轉(zhuǎn)發(fā)量較多的幾條微博,也就是傳播源頭,主要是《歡樂(lè)頌2》的幾位主演的微博賬號(hào)和一些跟該劇有關(guān)的微博話題。從實(shí)際效果來(lái)看,《歡樂(lè)頌2》的幾位主演---劉濤、王凱、楊紫等人在新浪微博上的影響力較高,粉絲數(shù)量龐大,主動(dòng)轉(zhuǎn)發(fā)積極,使得對(duì)劇集宣傳的效果也相對(duì)較好。
除了主創(chuàng)人員的主動(dòng)推廣外,《歡樂(lè)頌2》的推廣營(yíng)銷(xiāo)方式也是豐富多樣。在微博推廣上,《歡樂(lè)頌2》的宣傳物料準(zhǔn)備充足,預(yù)告片、小花絮、主題曲MV等一應(yīng)俱全;宣傳矩陣搭建完整,不僅注意與微博官方賬號(hào)“新浪娛樂(lè)”、“新浪電視”、“東方衛(wèi)視番茄臺(tái)”和”@微博電視劇“等)、廣告品牌等多方聯(lián)動(dòng),而且KOL輿論引導(dǎo)投入巨大,還邀請(qǐng)其他明星助力宣傳(如范冰冰)。
然而,從上面的傳播效果來(lái)看,媒體大號(hào)的傳播效果沒(méi)有明星個(gè)人的微博賬號(hào)傳播效力大,那么,其中的原因又是什么呢?我們接著往下看。
1.4 微博傳播效果分析
為了深入了解媒體大號(hào)和明星個(gè)人微博傳播特點(diǎn)和規(guī)律,筆者特地找了5-11當(dāng)天粉絲互動(dòng)量較大的2條微博---分別為@微博電視劇和劉濤的個(gè)人微博賬號(hào)@劉濤tamia,它們的轉(zhuǎn)發(fā)評(píng)論幾近一致,方便在同等條件下發(fā)現(xiàn)其中的傳播規(guī)律。
將這兩條微博的轉(zhuǎn)發(fā)傳播關(guān)系數(shù)據(jù)導(dǎo)出,制成能夠清晰反映傳播路徑的可視化“力導(dǎo)向傳播圖“:
上圖是@微博電視劇關(guān)于《歡樂(lè)頌2》的營(yíng)銷(xiāo)微博的傳播路徑圖,其中紫色“簇群“的中心就是賬號(hào)@微博電視劇,除了它自己帶來(lái)的轉(zhuǎn)發(fā)傳播(也就是紫色簇群區(qū)域內(nèi)的小圓點(diǎn))之外,周?chē)€有一些次級(jí)傳播中心,比如“十三點(diǎn)半的kings”、“影視大米FAN”、“吳侃侃kkw”這樣營(yíng)銷(xiāo)性質(zhì)很強(qiáng)的自媒體賬號(hào)進(jìn)行協(xié)助宣傳,顯然這是宣傳方砸錢(qián)買(mǎi)的流量,不是自帶的。
而下面劉濤的該條微博就呈現(xiàn)出明顯的“中心化”特點(diǎn),也就是除了劉濤個(gè)人微博賬號(hào)以外,就沒(méi)有特別明顯的次級(jí)傳播中心,絕大部分的傳播都來(lái)自于劉濤的賬號(hào)粉絲。
由此,結(jié)論不言自明:
明星個(gè)人微博的傳播較媒體大號(hào)而言更有效力,因?yàn)槊餍且蚱鋫€(gè)人魅力,吸聚的粉絲多,發(fā)的微博貼近生活,跟粉絲之間有較強(qiáng)的互動(dòng)關(guān)系,而且他們的粉絲團(tuán)體也會(huì)不遺余力的去散播此類(lèi)消息,所以傳播效力更強(qiáng)一些。相比之下,微博大號(hào)因?yàn)樽陨淼臓I(yíng)銷(xiāo)屬性,除非有利益驅(qū)動(dòng),粉絲才會(huì)主動(dòng)參與互動(dòng),一般而言不會(huì)太強(qiáng),更有甚者,會(huì)發(fā)動(dòng)水軍進(jìn)行操作,通過(guò)不正當(dāng)?shù)氖侄我灾\取利益。
好了,上面是關(guān)于《歡樂(lè)頌2》的大數(shù)據(jù)輿情傳播分析,下面會(huì)進(jìn)入到另一個(gè)板塊---對(duì)該劇的口碑(主要是豆瓣影評(píng))和小說(shuō)文本進(jìn)行文本挖掘,期待發(fā)現(xiàn)一些更有趣的內(nèi)容。
2 《歡樂(lè)頌2》的豆瓣口碑分析和小說(shuō)文本分析
一般來(lái)說(shuō),對(duì)于文本的深入挖掘往往能實(shí)現(xiàn)“知其然并知其所以然”的效力,因?yàn)槲谋静幌駭?shù)字那般空洞和抽象,內(nèi)容往往能直接揭示出原因。
這部分的數(shù)據(jù)主要有:
《歡樂(lè)頌》第一季和第二季的豆瓣影評(píng)
《歡樂(lè)頌》第一季和第二季對(duì)應(yīng)的原著小說(shuō),《歡樂(lè)頌2》的劇集將把后兩季的小說(shuō)內(nèi)容進(jìn)行打包拍攝,所以第二、第三季的小說(shuō)內(nèi)容都會(huì)出現(xiàn)在《歡樂(lè)頌2》的劇情里
豆瓣電影是中國(guó)最大與最權(quán)威的電影分享與評(píng)論社區(qū),收錄了百萬(wàn)條影片和影人的資料,有2500多家電影院加盟,更匯聚了數(shù)千萬(wàn)熱愛(ài)電影的人,因而這里關(guān)于影視劇的評(píng)論具有一定的代表性和公信力,可以在很大程度上反映一部影視劇作品的口碑狀況。所以,筆者抓取豆瓣上《歡樂(lè)頌》一二季的影評(píng)作為口碑分析的依據(jù)。
2.1《歡樂(lè)頌》一、二季的總體口碑對(duì)比分析
(1)評(píng)價(jià)星級(jí)
從總評(píng)分來(lái)看,《歡樂(lè)頌》第二季要明顯遜色于第一季,前者拿到了7.3的高分,而后者僅獲得了5.2的評(píng)分。
從第一季和第二季的評(píng)價(jià)星級(jí)占比可以看出,出現(xiàn)第二季總評(píng)分低于第一季的原因在于:第二季在中高分區(qū)間“4星”和“3星”中的占比要小于第一季,而在低分區(qū)間“2星”和“1星”中的比重要高于第一季。
(2)《歡樂(lè)頌2》的豆瓣影評(píng)情感傾向分析
由于第一季的口碑要好于第二季,所以筆者接下來(lái)著重分析一下第二季的豆瓣影評(píng)的“情感傾向”。
這里的“情感傾向”是以一個(gè)介于0~1之間的“情感極性值”來(lái)表征---如果某條評(píng)論的情感極性值越接近于0,說(shuō)明它的負(fù)面情感傾向越明顯,越接近于1,說(shuō)明它的正面情感傾向越明顯,而取值在0.5左右徘徊,這說(shuō)明這種情感傾向不明顯,是為“中性”。筆者將情感傾向值的取值區(qū)間0~1細(xì)分為3個(gè)子區(qū)間,分別對(duì)應(yīng)不同的情感傾向:
豆瓣影評(píng)具有獨(dú)特的語(yǔ)言風(fēng)格---反諷,貶義褒用,不像商品評(píng)論那般直白外露,它的語(yǔ)義往往含蓄且幽默。所以在分析之前,筆者找到大量有標(biāo)注的豆瓣影評(píng)語(yǔ)料,利用機(jī)器學(xué)習(xí)進(jìn)行情感語(yǔ)義模型訓(xùn)練,以期達(dá)到良好的情感正負(fù)面判斷效果。初步結(jié)果如下:
經(jīng)情感傾向標(biāo)簽映射處理,得到如下結(jié)果:
從上圖可以看到,第一季和第二季的情感傾向的最大差異在于正負(fù)面情感的比重不同:第一季的評(píng)論正負(fù)面情感占比旗鼓相當(dāng),而第二季的負(fù)面情感明顯占據(jù)主導(dǎo)地位,正面占比大幅壓縮,這也是本劇豆瓣評(píng)分不高的原因之一。
再看一下情感傾向隨時(shí)間發(fā)展的走勢(shì)情況,筆者選取的分析時(shí)間段是3.31~5.22,也就是該劇播出前一個(gè)多月和播出后一段時(shí)間的情感傾向走勢(shì)。這里采用的是情感傾向值累加的數(shù)值,越高說(shuō)明口碑評(píng)價(jià)越好,這也兼顧了評(píng)論數(shù)量上的增減情況(豆油愿意參與評(píng)分,哪怕是負(fù)面評(píng)分,也說(shuō)明對(duì)本劇有一定的關(guān)注度)。由此得到下圖:
可以看出,在本劇播出次日,情感傾向值達(dá)到高峰,隨后一路下降,結(jié)合這段時(shí)間內(nèi)的總體情感傾向占比可知,豆油們對(duì)于該劇播出后的劇集的關(guān)注度和口碑評(píng)價(jià)都呈現(xiàn)出下降的趨勢(shì)。
那么,究竟是什么原因讓廣大豆油們對(duì)該劇如此嫌棄呢?請(qǐng)接著往下看。
(3)《歡樂(lè)頌》一、二季豆瓣評(píng)論內(nèi)容的關(guān)鍵詞對(duì)比分析
以下是關(guān)于《歡樂(lè)頌》一、二季豆瓣評(píng)論文本的關(guān)鍵詞對(duì)比分析,可以在這張直觀的可視化效果圖上看到“豆油”們對(duì)《歡樂(lè)頌》一二季方方面面的評(píng)價(jià)。
上圖中,對(duì)于一二季的評(píng)論文本分別按照“高提及率(Frequent)”和“低提及率(Infrequent)”進(jìn)行了劃分。上圖以橫縱軸的“Average”進(jìn)行切分,則可以分為4個(gè)象限,右上角的為2類(lèi)文本提及率皆高的詞匯,左下角為二者提及率皆低的詞匯。左上和右下僅是二者之一高提及率的詞匯。
另外,藍(lán)色點(diǎn)陣代表的詞匯屬于對(duì)《歡樂(lè)頌》第一季的評(píng)價(jià),黃色點(diǎn)陣所代表的的詞匯屬于對(duì)《歡樂(lè)頌》第二季的評(píng)價(jià),右上角的象限二者的評(píng)語(yǔ)趨于重合。
在右邊的TOP Terms(重點(diǎn)關(guān)鍵詞匯)一欄中可以看到,對(duì)于第一季的評(píng)論,豆油們主要提到了該劇的cast/卡司( 演員陣容強(qiáng)大)、山影(山東影視制作有限公司,該劇的出品方)、(看該?。┩2幌聛?lái)、(人物形象)豐滿,以及關(guān)于安迪和奇點(diǎn)(魏渭)的情感主線的探討,但沒(méi)有出現(xiàn)明顯的負(fù)面評(píng)價(jià),甚至以褒贊為主。
而第二季里,很多豆油拿第一季和第二季進(jìn)行對(duì)比,認(rèn)為本劇和第一季沒(méi)得比,還有就是本劇里的插曲太多,好似一個(gè)MV大集合(“MV”、“mv”、“歌曲”、“就唱”),正如某位豆油的評(píng)論所說(shuō)“一開(kāi)始就狂配bgm,而且感覺(jué)和劇情并不搭嘎,什么咖喱歌一股鄉(xiāng)村風(fēng)”。。。值得玩味的是,也有都有拿本劇和同一時(shí)間段的《白鹿原》做對(duì)比,兩部劇均包含對(duì)時(shí)代環(huán)境和個(gè)體發(fā)展的探討,但在格局、視野以及最終呈現(xiàn)方式上都有較大不同。
點(diǎn)擊其中的關(guān)鍵詞,看到關(guān)于這些關(guān)鍵詞的評(píng)論詳情(語(yǔ)句經(jīng)過(guò)分詞和去停用詞)。
總之,豆油們關(guān)于第二季的吐槽很多。
由此,筆者想進(jìn)一步看看豆油們到底還有哪些關(guān)于該劇的槽點(diǎn)。
(4)第二季的典型意見(jiàn)挖掘?qū)Ρ确治?/strong>
將經(jīng)預(yù)處理得到的5000條典型評(píng)論進(jìn)行文本聚類(lèi),每一個(gè)文本聚類(lèi)“簇群”都會(huì)有一個(gè)中心語(yǔ)句,也就是該“簇群”的典型意見(jiàn),所以這種文本處理也叫做“典型意見(jiàn)挖掘”,用來(lái)從海量的文本里發(fā)掘主要的觀點(diǎn)或意見(jiàn)。
經(jīng)筆者處理,5000條評(píng)論被劃分為300多個(gè)成分占比不一的“話題簇群”,筆者僅選取其中占比TOP10的典型意見(jiàn)進(jìn)行展示。
從上表可以看出,豆油們關(guān)于本劇的典型意見(jiàn)多為負(fù)面,集中在以下幾個(gè)方面:
比第一部差,主要詬病的地方在于本劇的劇情、編劇和演員演技,以及硬生生的人物專(zhuān)屬插曲/配樂(lè)亂入
三觀不正,被吐槽為“高配版小時(shí)代”,倡導(dǎo)“紙醉金迷”的富人價(jià)值觀
對(duì)本劇中的個(gè)別角色及其主演的喜好,如邱瑩瑩和趙啟平及其扮演者
除此之外,本劇廣告植入太多也是很多豆油吐槽的地方,本劇為了配合植入廣告,角色人物的吃穿用度多處設(shè)定明顯違和,甚至有豆油表示“《歡樂(lè)頌1》是在劇情里插播恰到好處的廣告,而《歡樂(lè)頌2》是在硬生生的廣告里插播劇情。。。”
(5)“五美”人物點(diǎn)評(píng)詞云
綜合豆油們關(guān)于《歡樂(lè)頌》第一季和第二季關(guān)于劇中“五美”的評(píng)論,筆者制作出安迪、曲筱綃、樊勝美、關(guān)雎?tīng)柡颓瘳摤摰膫€(gè)性化評(píng)論關(guān)鍵詞詞云。
不消筆者多說(shuō),小伙伴們就能看出這些人物關(guān)鍵詞詞云,主要反映了豆油們對(duì)于“五美”的人物印象及其主要的關(guān)聯(lián)人物。對(duì)于這五個(gè)人的性格特征,由上述關(guān)鍵詞詞云可以總結(jié)為:
外冷內(nèi)熱、氣場(chǎng)強(qiáng)大的冰山御姐安迪
古靈精怪、魅力超群的小妖精曲筱綃
虛榮拜金、獨(dú)立自強(qiáng)的驕傲女王樊勝美
文靜內(nèi)斂、一團(tuán)和氣的優(yōu)質(zhì)女孩關(guān)雎?tīng)?/strong>
單純可愛(ài)、精力充沛的元?dú)馍倥瘳摤?nbsp;
2.2 《歡樂(lè)頌》一、二季的小說(shuō)文本分析
(1)一、二季的小說(shuō)文本關(guān)鍵詞對(duì)比
此處,對(duì)于小說(shuō)文本的關(guān)鍵詞提取,筆者沒(méi)采取一般文本分析時(shí)所采用的詞頻統(tǒng)計(jì),而采用的是TF-IDF(term frequency–inverse document frequency)關(guān)鍵詞統(tǒng)計(jì)方法,從而更有效的提取文本中的關(guān)鍵信息。詳情可以參閱《以<大秦帝國(guó)之崛起>為例,來(lái)談大數(shù)據(jù)輿情分析和文本挖掘》的第三部分。
以下是《歡樂(lè)頌》一二季原著小說(shuō)的關(guān)鍵詞TOP20。
可以看出,一二季小說(shuō)文本的關(guān)鍵詞絕大部分是其中的主要人物,而主要人物的總體順序(對(duì)于小說(shuō)而言是人物的重要性)變動(dòng)不大,個(gè)別人物出現(xiàn)重要性的“位移”:
安迪、曲筱綃和樊勝美是一二季中妥妥的一號(hào)、二號(hào)和三號(hào)女主人公
包奕凡在第二季的重要性有所提升,而魏渭的重要性則呈現(xiàn)下降的趨勢(shì)
電視劇第二季中出現(xiàn)的謝濱(也就是電視劇中的音樂(lè)達(dá)人謝童)、舒展和陳家康也出現(xiàn)在小說(shuō)二三季的關(guān)鍵詞TOP20中,不過(guò)排名較為靠后。
這也說(shuō)明,小說(shuō)和劇本在人設(shè)上保持有連貫性,沒(méi)有明顯大的變動(dòng)。
(2)一、二季劇中人物社交網(wǎng)絡(luò)分析
通過(guò)設(shè)置人物詞典,筆者從中提取出《歡樂(lè)頌》一二季對(duì)應(yīng)小說(shuō)文本的人物社交關(guān)系圖譜,用來(lái)發(fā)現(xiàn)2部電視劇中人物關(guān)系的特征。
在人物社交網(wǎng)絡(luò)中,每個(gè)節(jié)點(diǎn)代表一個(gè)人物,線條代表人物之間的關(guān)系,線條顏色的人物節(jié)點(diǎn)代表他們之間有著較為頻繁的交往(或友或敵)。節(jié)點(diǎn)及其代表人物字體的大小表征的是“Betweenness Centrality (中介性核心性)”,該詞學(xué)術(shù)的說(shuō)法是“兩個(gè)非鄰接的成員間的相互作用依賴(lài)于網(wǎng)絡(luò)中的其他成員,特別是位于兩成員之間路徑上的那些成員,他們對(duì)這兩個(gè)非鄰接成員的相互作用具有某種控制和制約作用“,說(shuō)人話就是—字體大的人物具有更大的人際關(guān)系影響,能接觸和影響的人物較多,而在小說(shuō)中出現(xiàn)次數(shù)多的未必就是這類(lèi)人物,這里的存在感需要以人脈和影響作為基石。詳情可參看《以<大秦帝國(guó)之崛起>為例,來(lái)談大數(shù)據(jù)輿情分析和文本挖掘》的第三部分。
從上圖可以看出,第一季中的安迪和幾個(gè)主要人物都有很強(qiáng)的人際聯(lián)系,他們之間的連線較粗,而譚宗明、曲筱綃、樊勝美等人的人脈資源豐富,或者是他們?nèi)穗H交往/應(yīng)酬較多。
在第二季的人物社交網(wǎng)絡(luò)中,則呈現(xiàn)出“去中心化”的趨勢(shì),除了成為愛(ài)人的包奕凡外,第一主角安迪與其他人的交往沒(méi)之前那么密切了。按照劇情發(fā)展,他們之間迎來(lái)了情感的新可能,卻也面臨來(lái)自身世及包家內(nèi)部帶來(lái)的新困擾,加之后媽魏太太的不斷責(zé)難,這樣也不久難理解安迪和其他人的交往較第一季要少了,自身麻煩不斷,所以無(wú)暇顧及。。。
當(dāng)然,第二季的人物情感脈絡(luò)也很清晰了,即使有攪局者的出現(xiàn)(魏渭、舒展、陳家康等),固定的CP組合也沒(méi)有出現(xiàn)變化,如安迪-包奕凡、邱瑩瑩-應(yīng)勤,曲筱綃-趙啟平,樊勝美-王柏川,以及關(guān)雎?tīng)?謝濱(謝童)。
(3)小說(shuō)文本的人物關(guān)聯(lián)詞分析
在最后,筆者把《歡樂(lè)頌》小說(shuō)1、2、3季合并,經(jīng)過(guò)文本預(yù)處理后,再進(jìn)行小說(shuō)文本的詞向量訓(xùn)練,將這些詞匯映射到向量空間,變成一個(gè)個(gè)詞向量(Word Vector),以使這些詞匯在便于被計(jì)算機(jī)識(shí)別和分析的同時(shí),還具有語(yǔ)義上的相關(guān)性,而不僅僅是基于詞匯之間的共現(xiàn)關(guān)系。
由于篇幅原因,筆者僅涉及跟“五美”相關(guān)的關(guān)聯(lián)詞分析,各呈現(xiàn)TOP10的關(guān)聯(lián)詞,由此發(fā)現(xiàn)跟主設(shè)人物相關(guān)的詞匯,發(fā)掘人物深層次的特點(diǎn)。
從上面“五美”的TOP10關(guān)聯(lián)詞可以得到兩類(lèi)關(guān)聯(lián)詞:
第一類(lèi)詞是跟主設(shè)關(guān)系密切的人物,如魏渭、包奕凡之于安迪,趙啟平、劉歆華之于曲筱綃等,這些都符合大家對(duì)于電視劇的認(rèn)知。
另一類(lèi)是反映人物行為的詞匯。如安迪和曲筱綃,二人常用的通信工具都有電話,其他三人只用手機(jī)進(jìn)行通訊。而電話一般指固定電話,設(shè)在辦公室,較為正式,領(lǐng)導(dǎo)或是管理層用的比較多;而手機(jī)具有便攜性,無(wú)論室內(nèi)和外出都用的多。
安迪、曲筱綃和樊勝美的關(guān)聯(lián)詞里有涉及“昨晚”,再對(duì)照小說(shuō)原本,三人都有很多晚上交際應(yīng)酬的場(chǎng)景。
此外,在樊勝美、關(guān)雎?tīng)柡颓瘳摤摰年P(guān)聯(lián)詞里,都出現(xiàn)了“連忙”一詞,有“立即”、“馬上”的意思,也就是經(jīng)常會(huì)出現(xiàn)倉(cāng)促、手忙腳亂的情形。
字字珠璣間,折射出“五美”所處的社會(huì)階層和自身心態(tài)。
結(jié)語(yǔ)
雖然分析下來(lái),《歡樂(lè)頌2》在劇情和各種細(xì)節(jié)上多有瑕疵,加之違和感很強(qiáng)的硬廣植入,所以它的口碑遠(yuǎn)不及第一季。然而,《歡樂(lè)頌2》還是較好的繼承了第一季典型的人物設(shè)定,很多觀眾能夠通過(guò)“五美”看到自己或者身邊人的影子,雖是小說(shuō),但也緊密觀照當(dāng)下現(xiàn)實(shí),擁有一種天然的熟悉感和代入感,更能引發(fā)劇集和觀眾之間的情感共鳴,聯(lián)想到前面的用戶情感狀態(tài)畫(huà)像,它甚至被許多都市白領(lǐng)奉為生存指南和戀愛(ài)擇偶教科書(shū)。
或許,像很多毀譽(yù)參半的影視劇那樣,關(guān)于它們的評(píng)判本來(lái)就是模棱兩可的,不能立即蓋棺定論:
譽(yù)滿天下,未必不為爛片;謗滿天下,未必不為佳劇~
那么,看完本文或本劇的小伙伴,你覺(jué)得呢?
ps:筆者寫(xiě)完這篇文章的時(shí)候,第二季還一集沒(méi)看哦,有對(duì)劇情誤讀的地方還請(qǐng)資深劇迷見(jiàn)諒哦,哈哈哈。
參考資料及工具:
1.新浪微輿情:“全網(wǎng)事件分析”、“信息監(jiān)測(cè)”及“微博傳播效果分析”模塊(數(shù)據(jù)采集、數(shù)據(jù)分析和數(shù)據(jù)可視化呈現(xiàn))
2.微指數(shù)、微博數(shù)據(jù)中心冰鑒用戶洞察平臺(tái)(人物畫(huà)像)
3.《歡樂(lè)頌》1、2、3季的小說(shuō)原著(文本數(shù)據(jù))
4.《歡樂(lè)頌1》和《歡樂(lè)頌2》的豆瓣影評(píng)(評(píng)分?jǐn)?shù)據(jù)和文本數(shù)據(jù))
5.Python,jieba分詞、snownlp、gensim、tagul(文本分詞、情感分析、詞向量和詞云制作)
蘇格蘭折耳喵:某大數(shù)據(jù)公司數(shù)據(jù)分析師。擅長(zhǎng)數(shù)據(jù)分析和可視化表達(dá)。微信號(hào):g18818233178。
本文由專(zhuān)欄作者 @蘇格蘭折耳喵 原創(chuàng)發(fā)布于產(chǎn)品社區(qū)(www.jza6.com),未經(jīng)許可,禁止轉(zhuǎn)載。
愛(ài)盈利-運(yùn)營(yíng)小咖秀(aiyingli.com)始終堅(jiān)持研究分享移動(dòng)互聯(lián)網(wǎng)App運(yùn)營(yíng)推廣經(jīng)驗(yàn)、策略、全案、渠道等純干貨知識(shí)內(nèi)容;是廣大App運(yùn)營(yíng)從業(yè)者的知識(shí)啟蒙、成長(zhǎng)指導(dǎo)、進(jìn)階學(xué)習(xí)的集聚平臺(tái);
【轉(zhuǎn)載說(shuō)明】  若上述素材出現(xiàn)侵權(quán),請(qǐng)及時(shí)聯(lián)系我們刪除及進(jìn)行處理:[email protected]