介紹
最近在網(wǎng)易云上找歌聽(tīng),發(fā)現(xiàn)比較熱門(mén)的歌曲一般評(píng)論數(shù)比較多锌唾,于是想著用爬蟲(chóng)去爬歌曲中的評(píng)論數(shù)锄码,順便找找好聽(tīng)的歌曲的同時(shí)分析熱門(mén)歌曲的特點(diǎn)。
首先我根據(jù)所有歌單中的歌曲去爬取評(píng)論數(shù)晌涕,并保存評(píng)論數(shù)超過(guò)10000的歌曲滋捶,爬取結(jié)果按評(píng)論數(shù)排序,以下各種分析基于截止到2017年2月22日的爬取結(jié)果余黎,如下圖所示(排名前50首):
周杰倫同志不負(fù)眾望的奪得了排行榜第一的位置重窟!然后前五十很多來(lái)自最近一兩年非常紅的綜藝大咖薛之謙和一些老牌歌手,從排名的情況可以簡(jiǎn)單看出惧财,一般很紅或者曾經(jīng)很紅的歌手的歌曲或者風(fēng)格特殊的歌曲會(huì)更容易引發(fā)人評(píng)論巡扇。歌手熱門(mén)歌曲數(shù)排名如下圖所示:
看了一下排行榜前50,主要分為民謠歌手垮衷、熱門(mén)歌手厅翔、情懷歌手、小眾歌手搀突,根據(jù)每個(gè)歌手熱門(mén)歌曲分析特征(以中文歌曲為主刀闷、不考慮版權(quán)因素沒(méi)有的歌曲):
首先我們來(lái)分析一下熱門(mén)歌手的一些特點(diǎn)
提取評(píng)論數(shù)大于10000的歌曲并統(tǒng)計(jì)每一個(gè)歌手熱門(mén)歌曲數(shù),熱門(mén)歌曲精確評(píng)論數(shù)仰迁。得到結(jié)果如下圖所示(橫軸為熱門(mén)歌手的熱門(mén)歌曲數(shù),縱軸為歌手歌曲平均熱度
由圖中可以看到周杰倫熱門(mén)歌曲數(shù)遠(yuǎn)遠(yuǎn)超過(guò)其他人甸昏,從抓取到專(zhuān)輯時(shí)間來(lái)看,第一張同名專(zhuān)輯Jay(2000-11-07)到最新的專(zhuān)輯周杰倫的床邊故事(2016-06-24)徐许,跨過(guò)了21世紀(jì)的第一個(gè)十年施蜜,平均每張專(zhuān)輯有6首熱門(mén)歌曲,而每張專(zhuān)輯一般10首歌左右雌隅,這意味著什么呢翻默?也就是說(shuō)周杰倫每發(fā)一張專(zhuān)輯,走過(guò)街邊小巷你都能聽(tīng)到熟悉的聲音澄步。
陳奕迅熱門(mén)歌曲主要是經(jīng)典老歌冰蘑,如下表所示:
排名上更多都是國(guó)語(yǔ)歌和泌,但小編覺(jué)得醫(yī)生的粵語(yǔ)歌才更能體現(xiàn)一種歲月的感覺(jué)村缸。就好比大家都看過(guò)的那篇文章《這十年,有多少人從周杰倫到陳奕迅》所講武氓。
其他熱門(mén)歌手大部分都是有很強(qiáng)的自我風(fēng)格的歌手梯皿,如林俊杰仇箱、BIGBANG、Alan Walke等等东羹,另外一部分有實(shí)力但比較小眾剂桥,缺乏大舞臺(tái),音樂(lè)得不到發(fā)現(xiàn)属提,在經(jīng)歷過(guò)某些事件后得到爆發(fā)(如趙雷权逗、鄧紫棋)。如下圖所示(來(lái)自趙雷的歌曲《理想》):
由上圖可見(jiàn)冤议,《理想》這首歌創(chuàng)作于2014年斟薇,當(dāng)時(shí)每天評(píng)論數(shù)幾十條左右,隨著時(shí)間的推移恕酸,2017年趙雷參加了《歌手》演唱了這首歌堪滨,隨著而來(lái)歌曲每天評(píng)論數(shù)飆增,最高時(shí)達(dá)到13401蕊温,之后趨于每天平均300左右評(píng)論袱箱。可見(jiàn)义矛,一個(gè)好的平臺(tái)對(duì)一個(gè)歌手來(lái)說(shuō)是多么重要发笔。
分析了熱門(mén)歌手我們?cè)賮?lái)分析一下熱門(mén)歌曲
為了搞清楚熱門(mén)歌手歌曲特點(diǎn),我爬取了所有熱門(mén)歌曲歌詞并進(jìn)行分詞凉翻、去重等處理筐咧,得到歌曲特征。以周杰倫為例:
周杰倫的歌曲中很大一部分以描述凄美的場(chǎng)景來(lái)表達(dá)逝去的愛(ài)情為主噪矛,歌詞里出現(xiàn)比較多的如回量蕊。憶、離開(kāi)艇挨、時(shí)間残炮、眼淚、等待缩滨、沉默势就、思念、心碎脉漏、歲月苞冯、挽回、無(wú)奈等等
“回憶”出現(xiàn)的歌詞:
“離開(kāi)”出現(xiàn)的歌詞:
詞語(yǔ)出現(xiàn)權(quán)重直方圖如下圖所示:
結(jié)合以上分析侧巨,將熱門(mén)歌手歌曲類(lèi)型根據(jù)歌詞內(nèi)容按機(jī)器學(xué)習(xí)相關(guān)分類(lèi)算法進(jìn)行分類(lèi)(悲傷舅锄、中性、積極)司忱,結(jié)果如下圖所示(挑選了幾個(gè)有代表性的歌手):
從結(jié)果可以看出周杰倫主要還是以情歌為主皇忿,輔以一些中國(guó)風(fēng)的歌曲和說(shuō)唱R&B畴蹭,而薛之謙的歌大部分都是很傷感的歌曲,歌詞如掩飾鳍烁、難過(guò)叨襟、害怕、犧牲幔荒,而民謠歌手趙雷更多的是緩緩吟唱糊闽,歌詞如依依不舍、溫柔爹梁、輕吻墓怀,許嵩則大部分歌曲都是中國(guó)風(fēng),有批判現(xiàn)實(shí)的卫键、但大部分還是以物述事傀履、借景抒情。
最后分析熱門(mén)歌曲評(píng)論
一般我們可以認(rèn)為一首歌的評(píng)論能夠反映聽(tīng)眾對(duì)這首歌曲的直觀感受莉炉,而網(wǎng)易云音樂(lè)上評(píng)論多且有趣钓账。例如薛之謙的歌曲《演員》下面的精彩評(píng)論:
于是我爬取熱門(mén)歌曲下的評(píng)論,分析歌曲帶給人的感受絮宁。將評(píng)論類(lèi)型分為懷舊梆暮、流行、共鳴绍昂。分別對(duì)應(yīng)的時(shí)間節(jié)點(diǎn)為過(guò)去啦粹、現(xiàn)在、平穩(wěn)時(shí)間點(diǎn)窘游。抓取熱門(mén)歌曲評(píng)論建立詞向量空間模型進(jìn)行聚類(lèi)唠椭。得到結(jié)果如下圖所示:
其中共鳴評(píng)論為表達(dá)對(duì)歌曲的直接感受的評(píng)論,懷舊評(píng)論更多是回憶聽(tīng)這首歌的場(chǎng)景和一些無(wú)關(guān)歌曲的評(píng)論忍饰,流行評(píng)論可能是明星帶來(lái)的明星效應(yīng)贪嫂,或者電視節(jié)目的宣傳等等的評(píng)論,這個(gè)結(jié)果說(shuō)明一首熱門(mén)的歌曲最重要的還是出彩的詞曲唱艾蓝,能讓人產(chǎn)生共鳴力崇,找到自己,一些宣傳和明星效應(yīng)還是輔助赢织。
結(jié)論
分析了一下熱門(mén)歌曲的一些特征后亮靴,我們可以嘗試著去思考一下,在一個(gè)信息急速傳播的時(shí)代于置,怎么創(chuàng)作一首歌才能更容易被大眾所接受茧吊、喜歡。首先你要紅啊,要能讓大家聽(tīng)到你的作品饱狂;其次你的歌曲要用強(qiáng)烈的區(qū)分度和特色;再者你的歌詞能讓人產(chǎn)生共鳴宪彩;最后休讳,如果什么xx歌手能演唱你的作品,那你就離出名不遠(yuǎn)啦尿孔。
?更多債券及大數(shù)據(jù)金融風(fēng)控資訊俊柔,請(qǐng)關(guān)注“itSaiD 它說(shuō)”