Python WordCloud對(duì)電視劇<<獵場(chǎng)>>短評(píng)生成詞云

獵場(chǎng)

Scrapy爬蟲教程一 Windows下安裝Scrapy的方式和問題總結(jié)

Scrapy爬蟲教程三詳細(xì)的Python Scrapy模擬登錄知乎

Scrapy爬蟲教程四 Scrapy+Selenium有瀏覽器界面模擬登錄知乎

Scrapy爬蟲教程五爬蟲部署

要說最近大火的影視劇當(dāng)中<<獵場(chǎng)>>無疑是這其中之一吧，我也一直在追劇中...由于這階段正好趕上在學(xué)習(xí)selenium來操作瀏覽器爬取數(shù)據(jù)，所以就爬取了豆瓣中對(duì)<<獵場(chǎng)>>的短評(píng)內(nèi)容并生成了詞云。

下面簡(jiǎn)短的介紹一下這次生成詞云的環(huán)境以及使用的庫：

1.Python 3.6.1

2.selenium 3.7.0 這是一個(gè)可以操作瀏覽器的庫宪哩，模擬真實(shí)人的操作(包括點(diǎn)擊按鈕等操作)韧骗，還可以抓取動(dòng)態(tài)頁面(js生成的頁面)

3.wordcloud 1.3.2 生成詞云的模塊

4.jieba 0.39 很好的中文分詞庫瞎饲，功能強(qiáng)大并使用簡(jiǎn)單，由于wordcloud對(duì)于分詞是弱勢(shì)权旷，所以借助jieba來進(jìn)行分詞

生成詞云的流程：

? ? 1.使用selenium抓取<<獵場(chǎng)>>短評(píng)(前十頁短評(píng))色洞，并將每一條短評(píng)存到.txt文件中(其實(shí)第一步應(yīng)該進(jìn)行登錄操作的戏锹，但是限于公司網(wǎng)絡(luò)原因又或者是豆瓣服務(wù)器原因，導(dǎo)致我這邊獲取二維碼的接口調(diào)不通火诸，所以這里我就不登錄景用，直接獲取十頁的數(shù)據(jù)(不登陸只能獲取十頁的數(shù)據(jù))，但是下邊我也會(huì)附上使用selenium登錄的代碼)

? ? 2.使用jieba對(duì)爬取下來的短評(píng)進(jìn)行分詞惭蹂，將分詞存入新的文本

? ? 3.使用wordcloud對(duì)分詞生成詞云(由于我這里只爬取了十頁的短評(píng)，所以進(jìn)行分詞得到的詞比較少割粮，這里我就沒有對(duì)分此后得到的數(shù)據(jù)進(jìn)行生成詞云盾碗，而是直接對(duì)十頁的短評(píng)生成的詞云，這樣生成的詞云效果比較好)

下邊就附上代碼舀瓢，要好好的手敲代碼廷雅，所以這里直接附圖：

最后附上生成的詞云：

這篇博客只是熟悉和使用selenium進(jìn)行抓取數(shù)據(jù)，好了該吃午飯了京髓。

最后編輯于：2017.12.10 08:43:12

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末航缀，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子堰怨，更是在濱河造成了極大的恐慌芥玉，老刑警劉巖，帶你破解...
沈念sama閱讀 216,372評(píng)論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件备图，死亡現(xiàn)場(chǎng)離奇詭異灿巧，居然都是意外死亡赶袄，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門抠藕，熙熙樓的掌柜王于貴愁眉苦臉地迎上來饿肺，“玉大人，你說我怎么就攤上這事盾似【蠢保” “怎么了？”我有些...
開封第一講書人閱讀 162,415評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵零院，是天一觀的道長(zhǎng)溉跃。經(jīng)常有香客問我，道長(zhǎng)门粪，這世上最難降的妖魔是什么喊积？我笑而不...
開封第一講書人閱讀 58,157評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮玄妈，結(jié)果婚禮上乾吻，老公的妹妹穿的比我還像新娘。我一直安慰自己拟蜻，他們只是感情好绎签，可當(dāng)我...
茶點(diǎn)故事閱讀 67,171評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著酝锅，像睡著了一般诡必。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上搔扁，一...
開封第一講書人閱讀 51,125評(píng)論 1贊 297
城市分裂傳說
那天爸舒，我揣著相機(jī)與錄音，去河邊找鬼稿蹲。笑死扭勉，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的苛聘。我是一名探鬼主播涂炎，決...
沈念sama閱讀 40,028評(píng)論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼设哗！你這毒婦竟也來了唱捣？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,887評(píng)論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤网梢，失蹤者是張志新（化名）和其女友劉穎震缭，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體澎粟，經(jīng)...
沈念sama閱讀 45,310評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡蛀序，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,533評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年欢瞪，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片徐裸。...
茶點(diǎn)故事閱讀 39,690評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡遣鼓，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出重贺，到底是詐尸還是另有隱情骑祟，我是刑警寧澤，帶...
沈念sama閱讀 35,411評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布气笙，位于F島的核電站次企，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏潜圃。R本人自食惡果不足惜缸棵，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,004評(píng)論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望谭期。院中可真熱鬧堵第，春花似錦、人聲如沸隧出。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽胀瞪。三九已至针余，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間凄诞，已是汗流浹背圆雁。一陣腳步聲響...
開封第一講書人閱讀 32,812評(píng)論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留帆谍，地道東北人摸柄。一個(gè)月前我還...
沈念sama閱讀 47,693評(píng)論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像既忆，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子嗦玖，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,577評(píng)論 2贊 353

Python WordCloud對(duì)電視劇<<獵場(chǎng)>>短評(píng)生成詞云

Python WordCloud對(duì)電視劇<<獵場(chǎng)>>短評(píng)生成詞云

Scrapy爬蟲教程一 Windows下安裝Scrapy的方式和問題總結(jié)

Scrapy爬蟲教程二淺析最煩人的反爬蟲手段

Scrapy爬蟲教程三詳細(xì)的Python Scrapy模擬登錄知乎

Scrapy爬蟲教程四 Scrapy+Selenium有瀏覽器界面模擬登錄知乎

Scrapy爬蟲教程五爬蟲部署

推薦閱讀更多精彩內(nèi)容

Python WordCloud對(duì)電視劇<<獵場(chǎng)>>短評(píng)生成詞云

Scrapy爬蟲教程一 Windows下安裝Scrapy的方式和問題總結(jié)

Scrapy爬蟲教程二 淺析最煩人的反爬蟲手段

Scrapy爬蟲教程三 詳細(xì)的Python Scrapy模擬登錄知乎

Scrapy爬蟲教程四 Scrapy+Selenium有瀏覽器界面模擬登錄知乎

Scrapy爬蟲教程五 爬蟲部署

推薦閱讀更多精彩內(nèi)容

Scrapy爬蟲教程二淺析最煩人的反爬蟲手段

Scrapy爬蟲教程三詳細(xì)的Python Scrapy模擬登錄知乎

Scrapy爬蟲教程五爬蟲部署