python面試題-2018-01-29

用python實(shí)現(xiàn)統(tǒng)計一篇英文文章內(nèi)每個單詞的出現(xiàn)頻率,并返回出現(xiàn)頻率最高的前10個單詞及其出現(xiàn)次數(shù)纽谒,并解答以下問題祷肯?(標(biāo)點(diǎn)符號可忽略)

(1) 創(chuàng)建文件對象f后,解釋f的readlines和xreadlines方法的區(qū)別妄壶?

(2) 追加需求:引號內(nèi)元素需要算作一個單詞,如何實(shí)現(xiàn)寄狼?

問題答案:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

from collections import Counter

file_path = './article.txt'
count = Counter()

with open(file_path) as file:
    for item in file.readlines():
        count.update(Counter(item.split()))
print(count.most_common(10))

(1)關(guān)于readlines和xreadlines的區(qū)別
readlines是會自動分析換行符丁寄,然后將其存在一個列表中,這個方法有個參數(shù)可以控制輸出多少行泊愧。
xreadlines是會返回一個迭代器伊磺,但是在python2.3之后文檔就不建議使用了。
推薦使用上下文管理器with,這個方法你可以不用操心文件的打開和關(guān)閉拼卵,同時他會自動對文件進(jìn)行處理奢浑,意思就是不管你打開的是幾M或者
幾十GB的文件,都不用擔(dān)心會在讀取的時候會把內(nèi)存的爆滿的情況腋腮,with語句已經(jīng)替你處理了雀彼。

(2)追加需求:引號內(nèi)元素需要算作一個單詞,如何實(shí)現(xiàn)即寡?
解決思路是:以"分割徊哑,轉(zhuǎn)換成列表,取其奇數(shù)分割聪富,其偶數(shù)不做處理,代碼如下:

with open(file_path) as file_1:
    tmp_list1 = []
    for line in file_1.readlines():
        tmp_list = line.split('"')
        for index in range(len(tmp_list)):
            if (index + 1) % 2 != 0:
                tmp_list_handle = tmp_list[index].strip()
                tmp_list2 = tmp_list_handle.split()
                tmp_list1.extend(tmp_list2)
            else:
                tmp_list1.extend([tmp_list[index]])
    count1 = Counter(tmp_list1)
    print(count1.most_common(10))

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末莺丑,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子墩蔓,更是在濱河造成了極大的恐慌梢莽,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件奸披,死亡現(xiàn)場離奇詭異昏名,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)阵面,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進(jìn)店門轻局,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人样刷,你說我怎么就攤上這事仑扑。” “怎么了置鼻?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵镇饮,是天一觀的道長。 經(jīng)常有香客問我箕母,道長盒让,這世上最難降的妖魔是什么梅肤? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任司蔬,我火速辦了婚禮邑茄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘俊啼。我一直安慰自己肺缕,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布授帕。 她就那樣靜靜地躺著同木,像睡著了一般。 火紅的嫁衣襯著肌膚如雪跛十。 梳的紋絲不亂的頭發(fā)上彤路,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天,我揣著相機(jī)與錄音芥映,去河邊找鬼洲尊。 笑死,一個胖子當(dāng)著我的面吹牛奈偏,可吹牛的內(nèi)容都是我干的坞嘀。 我是一名探鬼主播,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼惊来,長吁一口氣:“原來是場噩夢啊……” “哼丽涩!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起裁蚁,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤矢渊,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后枉证,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體矮男,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年刽严,在試婚紗的時候發(fā)現(xiàn)自己被綠了昂灵。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,605評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡舞萄,死狀恐怖眨补,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情倒脓,我是刑警寧澤撑螺,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站崎弃,受9級特大地震影響甘晤,放射性物質(zhì)發(fā)生泄漏含潘。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一线婚、第九天 我趴在偏房一處隱蔽的房頂上張望遏弱。 院中可真熱鬧,春花似錦塞弊、人聲如沸漱逸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽饰抒。三九已至,卻和暖如春诀黍,著一層夾襖步出監(jiān)牢的瞬間袋坑,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工眯勾, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留枣宫,地道東北人。 一個月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓咒精,卻偏偏與公主長得像镶柱,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子模叙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評論 2 348

推薦閱讀更多精彩內(nèi)容