西游記中出現(xiàn)最多的字竟然是這個(gè)字

前言

最近在學(xué)習(xí)python數(shù)據(jù)統(tǒng)計(jì)相關(guān)的知識(shí)，基于‘實(shí)踐出真知’以及‘知之者不如好之者,好之者不如樂(lè)之者’兩大亙古不變的理論撒穷，特撰寫本文。

統(tǒng)計(jì)結(jié)果

為了滿足部分同學(xué)強(qiáng)烈的好奇心芯义，小碼哥先將部分統(tǒng)計(jì)結(jié)果公布出來(lái)趁舀。若想了解詳細(xì)操作流程且有一定python基礎(chǔ)的同學(xué)可以繼續(xù)閱讀。

部分統(tǒng)計(jì)結(jié)果

由上圖我們可以知道蛇捌，西游記中出現(xiàn)最多的字是"道" 出現(xiàn)了11078次

數(shù)據(jù)分析

數(shù)據(jù)獲取

本次小碼哥使用的數(shù)據(jù)是問(wèn)度娘要來(lái)的抚恒，不想麻煩的同學(xué)可以直接用小碼哥的數(shù)據(jù)(點(diǎn)擊下載)

數(shù)據(jù)讀入

數(shù)據(jù)下載到本地后，用python內(nèi)置函數(shù)open() 將數(shù)據(jù)讀入

    fr = open('數(shù)據(jù)文件路徑','r')
    characters = [] #存儲(chǔ)所有漢字
    stat = {}   #存儲(chǔ)每個(gè)漢字出現(xiàn)的次數(shù)

數(shù)據(jù)處理

由于原數(shù)據(jù)中含有大量標(biāo)點(diǎn)符號(hào)络拌、空白俭驮、換行等，為了不影響分析結(jié)果我們應(yīng)該先把這些雜質(zhì)剔除春贸。

    for line in fr:
        # 去掉每一行兩邊的空白
        line = line.strip()
        # 如果為空行則跳過(guò)該輪循環(huán)
        if len(line) == 0:
            continue
        # 將文本轉(zhuǎn)為unicode混萝，便于處理漢字
        line = unicode(line)
        # 遍歷該行的每一個(gè)字
        for x in xrange(0, len(line)):
            # 去掉標(biāo)點(diǎn)符號(hào)和空白符
            if line[x] in [' ', '\t', '\n', '。', '萍恕，', '(', ')', '（', '）', '：', '□', '逸嘀？', '！', '《', '》', '允粤、', '　',']', '崭倘；', '“', '”', '……']:
                continue
            # 尚未記錄在characters中
            if not line[x] in characters:
                characters.append(line[x])
            # 尚未記錄在stat中
            if not stat.has_key(line[x]):
                stat[line[x]] = 0
            # 漢字出現(xiàn)次數(shù)加1
            stat[line[x]] += 1

數(shù)據(jù)輸出

為了便于觀察，小碼哥將結(jié)果輸出為一個(gè).csv 文件(可導(dǎo)入Excel)

    # lambda生成一個(gè)臨時(shí)函數(shù)
    # d表示字典的每一對(duì)鍵值對(duì)类垫，d[0]為key司光，d[1]為value
    # reverse為True表示降序排序
    stat = sorted(stat.items(), key=lambda d:d[1], reverse=True)
    fw = open('result.csv', 'w')
    for item in stat:
        # 進(jìn)行字符串拼接之前，需要將int轉(zhuǎn)為str
        fw.write(item[0] + ',' + str(item[1]) + '\n')

后記

鑒于有熱心同學(xué)在評(píng)論里建議小碼哥生成詞云悉患，小碼哥很愉快的采納了這個(gè)建議残家，后續(xù)將上傳。
閱讀完本文售躁，你有什么感受或建議都可以寫在評(píng)論里讓小碼哥知道坞淮，小碼哥看到后會(huì)第一時(shí)間回復(fù)。
若大家覺(jué)得本篇文章還不錯(cuò)陪捷，麻煩在右下角給小碼哥點(diǎn)個(gè)喜歡回窘，鼓勵(lì)小碼哥繼續(xù)創(chuàng)作！

最后編輯于：2018.09.18 21:38:30

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末市袖，一起剝皮案震驚了整個(gè)濱河市啡直，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌凌盯，老刑警劉巖付枫，帶你破解...
沈念sama閱讀 207,248評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件烹玉，死亡現(xiàn)場(chǎng)離奇詭異驰怎，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)二打，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,681評(píng)論 2贊 381
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門县忌，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人，你說(shuō)我怎么就攤上這事症杏∽盎瘢” “怎么了？”我有些...
開(kāi)封第一講書人閱讀 153,443評(píng)論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵厉颤，是天一觀的道長(zhǎng)穴豫。經(jīng)常有香客問(wèn)我，道長(zhǎng)逼友，這世上最難降的妖魔是什么精肃？我笑而不...
開(kāi)封第一講書人閱讀 55,475評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮帜乞，結(jié)果婚禮上司抱，老公的妹妹穿的比我還像新娘。我一直安慰自己黎烈，他們只是感情好习柠，可當(dāng)我...
茶點(diǎn)故事閱讀 64,458評(píng)論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著照棋，像睡著了一般资溃。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上必怜，一...
開(kāi)封第一講書人閱讀 49,185評(píng)論 1贊 284
城市分裂傳說(shuō)
那天肉拓，我揣著相機(jī)與錄音，去河邊找鬼梳庆。笑死暖途，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的膏执。我是一名探鬼主播驻售，決...
沈念sama閱讀 38,451評(píng)論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼更米！你這毒婦竟也來(lái)了欺栗？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書人閱讀 37,112評(píng)論 0贊 261
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤征峦，失蹤者是張志新（化名）和其女友劉穎迟几，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體栏笆，經(jīng)...
沈念sama閱讀 43,609評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡类腮，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,083評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蛉加。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蚜枢。...
茶點(diǎn)故事閱讀 38,163評(píng)論 1贊 334
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡缸逃，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出厂抽，到底是詐尸還是另有隱情需频，我是刑警寧澤，帶...
沈念sama閱讀 33,803評(píng)論 4贊 323
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布筷凤，位于F島的核電站昭殉，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏藐守。R本人自食惡果不足惜饲化，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,357評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望吗伤。院中可真熱鬧吃靠，春花似錦、人聲如沸足淆。這莊子的主人今日做“春日...
開(kāi)封第一講書人閱讀 30,357評(píng)論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)巧号。三九已至族奢，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間丹鸿，已是汗流浹背越走。一陣腳步聲響...
開(kāi)封第一講書人閱讀 31,590評(píng)論 1贊 261
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留靠欢，地道東北人廊敌。一個(gè)月前我還...
沈念sama閱讀 45,636評(píng)論 2贊 355
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像门怪，于是被迫代替她去往敵國(guó)和親骡澈。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,925評(píng)論 2贊 344