python基礎(chǔ)第三課

文檔讀取贰健,詞云辑鲤,分詞

1.詞云的生成

安裝wordcloud庫(kù)呻粹,imageio庫(kù)
若在線pip install wordcloud庫(kù)失敗勇哗,選擇離線安裝:(解決c++環(huán)境缺失的問題)在工作目錄保存wordcloud.whl文件后昼扛,打開終端 pip install [文件路徑]文件名進(jìn)行安裝

import jieba
from wordcloud import WordCloud
text = '''詞語是詞和語的合稱,包括單詞詞組及整個(gè)詞匯文字組成語句文章的最小組詞結(jié)構(gòu)形式欲诺。新詞典詞語豐富抄谐,信息量大。詞是由語素組成的最小的造句單位扰法。詞語有2字蛹含、3字及4字的分類   '''
txt_list = jieba.lcut(text)
txt = ' '.join(txt_list)
print(txt)
 w = WordCloud(
     background_color = 'white', #背景顏色
     font_path = 'msyh.ttc', #字體
     width = 400, #寬
     height = 300 #高
 ).generate(text)

w.to_file('詞云.jpg')#保存詞云

A.jpg
2.文本讀取
import jieba
with open('build/novel/threekingdom.txt', 'r', encoding = 'utf-8')as f:
     print(f.read)

另一種形式

txt = open('build/novel/threekingdom.txt', 'r', encoding = 'utf-8').read()
3.生成任意形狀的詞云
import jieba
import imageio
from wordcloud import WordCloud
mask = imageio.imread('china.jpg')
with open('build/novel/threekingdom.txt', 'r', encoding= 'UTF-8') as f:
    data = f.read()
    # print(data)
    # print(len(data))
    word_list = jieba.lcut(data)
    word = " ".join(word_list)
    #print(word_list)
    print(len(word_list))
    w = WordCloud(
        background_color = 'white',
        font_path = 'msyh.ttc',
        width = 800,
        height = 600,
        mask = mask
        # max_words = 40,        # min_font_size = 80
        # max_font_size = 80
    ).generate(word)

    w.to_file('threekingdom.png')
threekingdom.png
4.排序

生成一個(gè)列表,然后隨機(jī)隨機(jī)打亂列表順序

li = []
for i in range(10):
    li.append(i)
print('生成的li:',li)
from random import shuffle
shuffle(li)
print('打亂順序之后的li:', li)

對(duì)列表重新進(jìn)行排序
這里采用兩種方法:
1.使用 list對(duì)象的sort方法

li.sort()
print('使用sort方法進(jìn)行排序之后:', li)
# reverse=True倒序排序
li.sort(reverse=True)
print('使用sort方法,指定reverse進(jìn)行排序之后:', li)
  1. 使用內(nèi)置函數(shù)sorted
li = sorted(li)
print('使用sorted函數(shù)排序之后', li)
li = sorted(li, reverse=True)
print('使用sorted函數(shù), reverse=True 排序之后', li)

總結(jié): sort和sorted的區(qū)別

  1. sort僅針對(duì)列表進(jìn)行排序, 無返回值,會(huì)在原來的列表基礎(chǔ)上修改
  2. sorted 是python中單獨(dú)的內(nèi)置函數(shù)塞颁,可以對(duì)可迭代(iterable)對(duì)象進(jìn)行排序浦箱,不局限于list, 它不改表原生的數(shù)據(jù)吸耿,重新生成一個(gè)新的隊(duì)列
5.函數(shù)
  • 以 def 關(guān)鍵詞開頭,后接函數(shù)標(biāo)識(shí)符名稱和圓括號(hào)()
  • 任何傳入?yún)?shù)和自變量必須放在圓括號(hào)中間酷窥,圓括號(hào)之間可以用于定義參數(shù)咽安。
  • 函數(shù)的第一行語句可以選擇性地使用文檔字符串—用于存放函數(shù)說明,函數(shù)內(nèi)容以冒號(hào)起始蓬推,并且縮進(jìn)妆棒。
  • return [表達(dá)式] 結(jié)束函數(shù),選擇性地返回一個(gè)值給調(diào)用方沸伏。不帶表達(dá)式的return相當(dāng)于返回 None糕珊。
def 函數(shù)名(參數(shù)):
    function_suite
    return [表達(dá)式]

實(shí)例:

def calculatNum(num):
    sum = 0
    for i in range(1, num + 1):
        sum += i
    return sum
num = int (input('請(qǐng)輸入任意整數(shù):'))
print('1到{}之間的累積和為{}'.format(num, calculatNum(num)))

stu_info_list = [
    {'name': 'zhangsan', 'age': 18, 'addr': '渾南'},
    {'name': 'lisi', 'age': 50, 'addr': '渾南'},
    {'name': 'wangwu', 'age': 3, 'addr': '渾南'},
    {'name': 'zhaoliu', 'age': 35, 'addr': '渾南'},
    {'name': 'tianqi', 'age': 20, 'addr': '渾南'}

]
print('排序前', stu_info_list)
def sort_by_age(x):
    return x['age']

stu_info_list.sort(key = sort_by_age)
print('排序后', stu_info_list)
6.匿名函數(shù)

python 使用 lambda 來創(chuàng)建匿名函數(shù)。

  • lambda只是一個(gè)表達(dá)式
  • lambda的主體是一個(gè)表達(dá)式馋评,而不是一個(gè)代碼塊放接。僅僅能在lambda表達(dá)式中封裝有限的邏輯進(jìn)去。
  • lambda函數(shù)擁有自己的命名空間留特,且不能訪問自有參數(shù)列表之外或全局命名空間里的參數(shù)纠脾。
  • 雖然lambda函數(shù)看起來只能寫一行,卻不等同于C或C++的內(nèi)聯(lián)函數(shù)蜕青,后者的目的是調(diào)用小函數(shù)時(shí)不占用棧內(nèi)存從而增加運(yùn)行效率苟蹈。
lambda [arg1 [,arg2,.....argn]]:expression

實(shí)例:

sum_two_num = lambda x, y : x + y
print(sum_two_num(1, 5))#6

使用帶有匿名函數(shù)的表達(dá)式進(jìn)行排序

stu_info_list = [
    {'name': 'zhangsan', 'age': 18, 'addr': '渾南'},
    {'name': 'lisi', 'age': 50, 'addr': '渾南'},
    {'name': 'wangwu', 'age': 3, 'addr': '渾南'},
    {'name': 'zhaoliu', 'age': 35, 'addr': '渾南'},
    {'name': 'tianqi', 'age': 20, 'addr': '渾南'}
]
stu_info_list1 = sorted(stu_info_list, key=lambda items:items['age'], reverse = True)
print(stu_info_list1)

利用上述所學(xué)實(shí)現(xiàn),實(shí)例:三國(guó)人物出現(xiàn)頻率top10分析

  • 出現(xiàn)頻率前20的詞匯統(tǒng)計(jì)代碼
import jieba
with open('build/novel/threekingdom.txt', 'r', encoding = 'utf-8')as f:
    data = f.read()#讀取文件
    words_list = jieba.lcut(data)#分詞
    #print(words_list)
    #構(gòu)建一個(gè)容器右核,存儲(chǔ)我們的數(shù)據(jù)
    counts = {}
    #遍歷wordlist慧脱,篩選出人名
    for word in words_list:
        #print(word)
        if len(word) <= 1:
            #過濾無關(guān)詞語
            continue
        else:
            #向counts內(nèi)更新值
            counts[word] = counts.get(word, 0) + 1
#print(counts)
items = list(counts.items())
items.sort(key = lambda x:x[1], reverse = True)
#print(items)
for i in range(20):
    word,count = items[i]
    print('"{}"出現(xiàn)次數(shù):{}'.format(word, count))
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市贺喝,隨后出現(xiàn)的幾起案子菱鸥,更是在濱河造成了極大的恐慌,老刑警劉巖躏鱼,帶你破解...
    沈念sama閱讀 212,222評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件氮采,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡染苛,警方通過查閱死者的電腦和手機(jī)鹊漠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,455評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來茶行,“玉大人躯概,你說我怎么就攤上這事∨鲜Γ” “怎么了娶靡?”我有些...
    開封第一講書人閱讀 157,720評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)茉唉。 經(jīng)常有香客問我固蛾,道長(zhǎng)结执,這世上最難降的妖魔是什么度陆? 我笑而不...
    開封第一講書人閱讀 56,568評(píng)論 1 284
  • 正文 為了忘掉前任艾凯,我火速辦了婚禮,結(jié)果婚禮上懂傀,老公的妹妹穿的比我還像新娘趾诗。我一直安慰自己,他們只是感情好蹬蚁,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,696評(píng)論 6 386
  • 文/花漫 我一把揭開白布恃泪。 她就那樣靜靜地躺著,像睡著了一般犀斋。 火紅的嫁衣襯著肌膚如雪贝乎。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,879評(píng)論 1 290
  • 那天叽粹,我揣著相機(jī)與錄音览效,去河邊找鬼。 笑死虫几,一個(gè)胖子當(dāng)著我的面吹牛锤灿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播辆脸,決...
    沈念sama閱讀 39,028評(píng)論 3 409
  • 文/蒼蘭香墨 我猛地睜開眼但校,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了啡氢?” 一聲冷哼從身側(cè)響起状囱,我...
    開封第一講書人閱讀 37,773評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎倘是,沒想到半個(gè)月后亭枷,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,220評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡辨绊,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,550評(píng)論 2 327
  • 正文 我和宋清朗相戀三年奶栖,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片门坷。...
    茶點(diǎn)故事閱讀 38,697評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡宣鄙,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出默蚌,到底是詐尸還是另有隱情冻晤,我是刑警寧澤,帶...
    沈念sama閱讀 34,360評(píng)論 4 332
  • 正文 年R本政府宣布绸吸,位于F島的核電站鼻弧,受9級(jí)特大地震影響设江,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜攘轩,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,002評(píng)論 3 315
  • 文/蒙蒙 一叉存、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧度帮,春花似錦歼捏、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,782評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至率翅,卻和暖如春练俐,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背冕臭。 一陣腳步聲響...
    開封第一講書人閱讀 32,010評(píng)論 1 266
  • 我被黑心中介騙來泰國(guó)打工腺晾, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人浴韭。 一個(gè)月前我還...
    沈念sama閱讀 46,433評(píng)論 2 360
  • 正文 我出身青樓丘喻,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親念颈。 傳聞我的和親對(duì)象是個(gè)殘疾皇子泉粉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,587評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容