python基礎(chǔ)第三課

文檔讀取贰健，詞云辑鲤，分詞

1.詞云的生成

安裝wordcloud庫(kù)呻粹，imageio庫(kù)
若在線pip install wordcloud庫(kù)失敗勇哗，選擇離線安裝：（解決c++環(huán)境缺失的問題）在工作目錄保存wordcloud.whl文件后昼扛，打開終端 pip install [文件路徑]文件名進(jìn)行安裝

import jieba
from wordcloud import WordCloud
text = '''詞語是詞和語的合稱，包括單詞詞組及整個(gè)詞匯文字組成語句文章的最小組詞結(jié)構(gòu)形式欲诺。新詞典詞語豐富抄谐，信息量大。詞是由語素組成的最小的造句單位扰法。詞語有2字蛹含、3字及4字的分類   '''
txt_list = jieba.lcut(text)
txt = ' '.join(txt_list)
print(txt)
 w = WordCloud(
     background_color = 'white', #背景顏色
     font_path = 'msyh.ttc', #字體
     width = 400, #寬
     height = 300 #高
 ).generate(text)

w.to_file('詞云.jpg')#保存詞云

A.jpg

2.文本讀取

import jieba
with open('build/novel/threekingdom.txt', 'r', encoding = 'utf-8')as f:
     print(f.read)

另一種形式

txt = open('build/novel/threekingdom.txt', 'r', encoding = 'utf-8').read()

3.生成任意形狀的詞云

import jieba
import imageio
from wordcloud import WordCloud
mask = imageio.imread('china.jpg')
with open('build/novel/threekingdom.txt', 'r', encoding= 'UTF-8') as f:
    data = f.read()
    # print(data)
    # print(len(data))
    word_list = jieba.lcut(data)
    word = " ".join(word_list)
    #print(word_list)
    print(len(word_list))
    w = WordCloud(
        background_color = 'white',
        font_path = 'msyh.ttc',
        width = 800,
        height = 600,
        mask = mask
        # max_words = 40,        # min_font_size = 80
        # max_font_size = 80
    ).generate(word)

    w.to_file('threekingdom.png')

threekingdom.png

4.排序

生成一個(gè)列表，然后隨機(jī)隨機(jī)打亂列表順序

li = []
for i in range(10):
    li.append(i)
print('生成的li:',li)
from random import shuffle
shuffle(li)
print('打亂順序之后的li:', li)

對(duì)列表重新進(jìn)行排序
這里采用兩種方法：
1.使用 list對(duì)象的sort方法

li.sort()
print('使用sort方法進(jìn)行排序之后:', li)
# reverse=True倒序排序
li.sort(reverse=True)
print('使用sort方法,指定reverse進(jìn)行排序之后:', li)

使用內(nèi)置函數(shù)sorted

li = sorted(li)
print('使用sorted函數(shù)排序之后', li)
li = sorted(li, reverse=True)
print('使用sorted函數(shù), reverse=True 排序之后', li)

總結(jié)： sort和sorted的區(qū)別

sort僅針對(duì)列表進(jìn)行排序, 無返回值,會(huì)在原來的列表基礎(chǔ)上修改
sorted 是python中單獨(dú)的內(nèi)置函數(shù)塞颁，可以對(duì)可迭代（iterable）對(duì)象進(jìn)行排序浦箱，不局限于list, 它不改表原生的數(shù)據(jù)吸耿，重新生成一個(gè)新的隊(duì)列

5.函數(shù)

以 def 關(guān)鍵詞開頭，后接函數(shù)標(biāo)識(shí)符名稱和圓括號(hào)()
任何傳入?yún)?shù)和自變量必須放在圓括號(hào)中間酷窥，圓括號(hào)之間可以用于定義參數(shù)咽安。
函數(shù)的第一行語句可以選擇性地使用文檔字符串—用于存放函數(shù)說明，函數(shù)內(nèi)容以冒號(hào)起始蓬推，并且縮進(jìn)妆棒。
return [表達(dá)式] 結(jié)束函數(shù)，選擇性地返回一個(gè)值給調(diào)用方沸伏。不帶表達(dá)式的return相當(dāng)于返回 None糕珊。

def 函數(shù)名(參數(shù)):
    function_suite
    return [表達(dá)式]

實(shí)例：

def calculatNum(num):
    sum = 0
    for i in range(1, num + 1):
        sum += i
    return sum
num = int (input('請(qǐng)輸入任意整數(shù)：'))
print('1到{}之間的累積和為{}'.format(num, calculatNum(num)))

stu_info_list = [
    {'name': 'zhangsan', 'age': 18, 'addr': '渾南'},
    {'name': 'lisi', 'age': 50, 'addr': '渾南'},
    {'name': 'wangwu', 'age': 3, 'addr': '渾南'},
    {'name': 'zhaoliu', 'age': 35, 'addr': '渾南'},
    {'name': 'tianqi', 'age': 20, 'addr': '渾南'}

]
print('排序前', stu_info_list)
def sort_by_age(x):
    return x['age']

stu_info_list.sort(key = sort_by_age)
print('排序后', stu_info_list)

6.匿名函數(shù)

python 使用 lambda 來創(chuàng)建匿名函數(shù)。

lambda只是一個(gè)表達(dá)式
lambda的主體是一個(gè)表達(dá)式馋评，而不是一個(gè)代碼塊放接。僅僅能在lambda表達(dá)式中封裝有限的邏輯進(jìn)去。
lambda函數(shù)擁有自己的命名空間留特，且不能訪問自有參數(shù)列表之外或全局命名空間里的參數(shù)纠脾。
雖然lambda函數(shù)看起來只能寫一行，卻不等同于C或C++的內(nèi)聯(lián)函數(shù)蜕青，后者的目的是調(diào)用小函數(shù)時(shí)不占用棧內(nèi)存從而增加運(yùn)行效率苟蹈。

lambda [arg1 [,arg2,.....argn]]:expression

實(shí)例：

sum_two_num = lambda x, y : x + y
print(sum_two_num(1, 5))#6

使用帶有匿名函數(shù)的表達(dá)式進(jìn)行排序

stu_info_list = [
    {'name': 'zhangsan', 'age': 18, 'addr': '渾南'},
    {'name': 'lisi', 'age': 50, 'addr': '渾南'},
    {'name': 'wangwu', 'age': 3, 'addr': '渾南'},
    {'name': 'zhaoliu', 'age': 35, 'addr': '渾南'},
    {'name': 'tianqi', 'age': 20, 'addr': '渾南'}
]
stu_info_list1 = sorted(stu_info_list, key=lambda items:items['age'], reverse = True)
print(stu_info_list1)

利用上述所學(xué)實(shí)現(xiàn)，實(shí)例：三國(guó)人物出現(xiàn)頻率top10分析

出現(xiàn)頻率前20的詞匯統(tǒng)計(jì)代碼

import jieba
with open('build/novel/threekingdom.txt', 'r', encoding = 'utf-8')as f:
    data = f.read()#讀取文件
    words_list = jieba.lcut(data)#分詞
    #print(words_list)
    #構(gòu)建一個(gè)容器右核，存儲(chǔ)我們的數(shù)據(jù)
    counts = {}
    #遍歷wordlist慧脱，篩選出人名
    for word in words_list:
        #print(word)
        if len(word) <= 1:
            #過濾無關(guān)詞語
            continue
        else:
            #向counts內(nèi)更新值
            counts[word] = counts.get(word, 0) + 1
#print(counts)
items = list(counts.items())
items.sort(key = lambda x:x[1], reverse = True)
#print(items)
for i in range(20):
    word,count = items[i]
    print('"{}"出現(xiàn)次數(shù):{}'.format(word, count))

最后編輯于：2019.10.23 17:01:35

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市贺喝，隨后出現(xiàn)的幾起案子菱鸥，更是在濱河造成了極大的恐慌，老刑警劉巖躏鱼，帶你破解...
沈念sama閱讀 212,222評(píng)論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件氮采，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡染苛，警方通過查閱死者的電腦和手機(jī)鹊漠，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,455評(píng)論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來茶行，“玉大人躯概，你說我怎么就攤上這事∨鲜Γ” “怎么了娶靡？”我有些...
開封第一講書人閱讀 157,720評(píng)論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)茉唉。經(jīng)常有香客問我固蛾，道長(zhǎng)结执，這世上最難降的妖魔是什么度陆？我笑而不...
開封第一講書人閱讀 56,568評(píng)論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任艾凯，我火速辦了婚禮，結(jié)果婚禮上懂傀，老公的妹妹穿的比我還像新娘趾诗。我一直安慰自己，他們只是感情好蹬蚁，可當(dāng)我...
茶點(diǎn)故事閱讀 65,696評(píng)論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布恃泪。她就那樣靜靜地躺著，像睡著了一般犀斋。火紅的嫁衣襯著肌膚如雪贝乎。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,879評(píng)論 1贊 290
城市分裂傳說
那天叽粹，我揣著相機(jī)與錄音览效，去河邊找鬼。笑死虫几，一個(gè)胖子當(dāng)著我的面吹牛锤灿，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播辆脸，決...
沈念sama閱讀 39,028評(píng)論 3贊 409
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼但校，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了啡氢？” 一聲冷哼從身側(cè)響起状囱，我...
開封第一講書人閱讀 37,773評(píng)論 0贊 268
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎倘是，沒想到半個(gè)月后亭枷，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,220評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡辨绊，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,550評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年奶栖，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片门坷。...
茶點(diǎn)故事閱讀 38,697評(píng)論 1贊 341
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡宣鄙，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出默蚌，到底是詐尸還是另有隱情冻晤，我是刑警寧澤，帶...
沈念sama閱讀 34,360評(píng)論 4贊 332
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布绸吸，位于F島的核電站鼻弧，受9級(jí)特大地震影響设江，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜攘轩，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 40,002評(píng)論 3贊 315
男人毒藥：我在死后第九天來索命
文/蒙蒙一叉存、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧度帮，春花似錦歼捏、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,782評(píng)論 0贊 21
一樁弒父案瞳秽，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至率翅，卻和暖如春练俐，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背冕臭。一陣腳步聲響...
開封第一講書人閱讀 32,010評(píng)論 1贊 266
情欲美人皮
我被黑心中介騙來泰國(guó)打工腺晾，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人浴韭。一個(gè)月前我還...
沈念sama閱讀 46,433評(píng)論 2贊 360
代替公主和親
正文我出身青樓丘喻，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親念颈。傳聞我的和親對(duì)象是個(gè)殘疾皇子泉粉，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,587評(píng)論 2贊 350