學(xué)習(xí)計(jì)劃：第02周(20190722-20190728)

知識(shí)點(diǎn)：Python數(shù)據(jù)分析基礎(chǔ)

Python基礎(chǔ)

Python環(huán)境安裝

下載奇唤、安裝Anaconda3

    wget https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh
    bash Anaconda3-2019.03-Linux-x86_64.sh

這里選擇yes

配置路徑

    source ~/.bashrc

部署jupyter notebook過(guò)程

<1>配置環(huán)境，通過(guò)遠(yuǎn)程方式訪(fǎng)問(wèn)jupyter notebook，記錄配置文件的路徑/root/.jupyter/jupyter_notebook_config.py

    jupyter notebook --generate-config

<2>生成登陸密碼布近，進(jìn)入Python

    from notebook.auth import passwd
    passwd()

保存密碼，例如：'sha1:9196ad6d9d4a:a63068b5e26b0ea608bbd31675a517ef5c49de1a'

<3>修改<1>生成的配置文件

    vi ~/.jupyter/jupyter_notebook_config.py #對(duì)應(yīng)你的路徑
    c.NotebookApp.ip='*'
    c.NotebookApp.password = '你保存的密碼'
    c.NotebookApp.open_browser = False
    c.NotebookApp.port =8888    #隨便指定一個(gè)端口扫茅，使用默認(rèn)8888也可以

<4>啟動(dòng)Jupyter服務(wù)

   jupyter notebook --ip=0.0.0.0 --no-browser --allow-root
   nohup jupyter notebook --ip=0.0.0.0 --no-browser --allow-root & #后臺(tái)啟動(dòng)

<5>瀏覽器訪(fǎng)問(wèn)暂衡，并輸入密碼

http://服務(wù)器地址:端口號(hào)

<6>結(jié)束進(jìn)程

   netstat -tunpl 
   kill -9 PID號(hào)、PID號(hào)浊服、PID號(hào)等 或 killall 進(jìn)程名

Python基本用法：控制語(yǔ)句统屈、函數(shù)、文件讀寫(xiě)等

控制語(yǔ)句由條件語(yǔ)句牙躺、循環(huán)語(yǔ)句構(gòu)成愁憔，控制語(yǔ)句根據(jù)條件表達(dá)式控制程序的流轉(zhuǎn)

條件判斷語(yǔ)句

if else語(yǔ)句

a = input("a:")
a = int(a)
b = input("b:")
b = int(b)
if(a > b):
   print (a, " > ", b)
else:
   print (a, " < ", b)

if elif else語(yǔ)句

score = float( input("score:"))  # 接受用戶(hù)輸入并轉(zhuǎn)換為float類(lèi)型,當(dāng)輸入的為小數(shù)時(shí)孽拷，使用int轉(zhuǎn)換會(huì)報(bào)錯(cuò)
if 90 <= score <= 100:
    print("A")
elif 80 <= score < 90:
    print("B")
elif 60 <= score < 80:
    print("C")
else:
    print("D")

嵌套if語(yǔ)句吨掌，盡可能避免使用，不便于閱讀脓恕，而且容易忽略一些可能性

x = -1
y = 99
if(x >= 0):
    if(x > 0):          #嵌套的if語(yǔ)句
        y = 1
    else:
        y = 0
else:
    y = -1
print ("y =", y)

switch替代方案1

class switch(object):
    def __init__(self, value):      # 初始化需要匹配的值value
        self.value = value
        self.fall = False           # 如果匹配到的case語(yǔ)句中沒(méi)有break膜宋，則fall為T(mén)rue。

    def __iter__(self):
        yield self.match           # 調(diào)用match方法 返回一個(gè)生成器
        raise StopIteration     # StopIteration 異常來(lái)判斷for循環(huán)是否結(jié)束

    def match(self, *args):         # 模擬case子句的方法
        if self.fall or not args:       # 如果fall為true炼幔，則繼續(xù)執(zhí)行下面的case子句
                                 # 或case子句沒(méi)有匹配項(xiàng)秋茫，則流轉(zhuǎn)到默認(rèn)分支。
            return True
       elif self.value in args:        # 匹配成功
            self.fall = True
            return True
        else:                   # 匹配失敗
            return False

operator = "+"
x = 1
y = 2
for case in switch(operator):        # switch只能用于for in循環(huán)中
    if case('+'):
        print (x + y)
        break
    if case('-'):
        print (x - y)
        break
    if case('*'):
        print (x * y)
        break
    if case('/'):
        print (x / y)
        break
    if case():                      # 默認(rèn)分支
        print ""

switch替代方案2

# 使用字典實(shí)現(xiàn)switch語(yǔ)句  
from __future__ import division  
x = 1 
y = 2 
operator = "/" 
result = {  
 
 
"+" : x + y,  
"-" : x - y,  
"*" : x * y,  
"/" : x / y   
}  
print result.get(operator)

循環(huán)語(yǔ)句江掩，注意不要死循環(huán)

while循環(huán)

x = float(input("輸入x的值："))        # 接收用戶(hù)輸入的數(shù)字并轉(zhuǎn)換為float類(lèi)型
i = 0
while(x  != 0):                     # python3中不等于拋棄了<>学辱，一律使用!=
    if(x > 0):
        x -= 1                      # 如果x大于0則減1
    else:
        x += 1                     # 如果x小于0則加1
    i = i + 1
    print( "第%d次循環(huán)：" %(i, x))
else:
    print ("x等于0：", x)

for循環(huán)

# for in語(yǔ)句
for x in range(-1, 2):
    if x > 0: 
        print ("正數(shù)：",x)
    elif x == 0 : 
        print ("零：",x)
    else:
        print ("負(fù)數(shù)：",x)
else:
    print ("循環(huán)結(jié)束")

break,continue

參考switch替代方案2例子

函數(shù)

switch替代方案2封裝成函數(shù)

from __future__ import division
def arithmetic(x, y, operator):
    result = {
        "+" : x + y,
        "-" : x - y,
        "*" : x * y,
        "/" : x / y 
    }
    return result.get(operator)     # 返回計(jì)算結(jié)果

return返回多個(gè)值，可以把這些值打包到元祖中环形，在調(diào)用時(shí)，對(duì)返回的元祖進(jìn)行解包即可

def func(x, y, z):
    l = [x, y, z]
    l.reverse()
    numbers = tuple(l)
    return numbers

x, y, z = func(0, 1, 2)
print (x, y, z)

多個(gè)return語(yǔ)句

def func(x):
    if x > 0:
        return "x > 0"
    elif x == 0:
        return "x == 0"
    else:
        return "x < 0"
print (func(-2))

多個(gè)return語(yǔ)句重構(gòu)衙傀，增加變量

def func(x):
    if x > 0:
        result = "x > 0"
    elif x == 0:
        result = "x == 0"
    else:
        result = "x < 0"
    return result    
print (func(-2))

嵌套函數(shù)

def sum(a, b):
    return a + b
def sub(a, b):
    return a - b
def func():
    x = 1
    y = 2
    m= 3
    n = 4
    return sum(x, y) * sub(m, n)

print (func())

嵌套函數(shù)抬吟，內(nèi)部函數(shù)

def func():
    x = 1
    y = 2
    m= 3
    n = 4
    def sum(a, b):              # 內(nèi)部函數(shù)
        return a + b
    def sub(a, b):              # 內(nèi)部函數(shù)
        return a - b
    return sum(x, y) * sub(m, n)

print (func())

遞歸函數(shù)，經(jīng)典例子统抬，計(jì)算階乘

def refunc(n):
    i = 1
    if n > 1:                           # 遞歸的結(jié)束判斷
        i = n
        n = n * refunc(n-1)             # 遞推
    print ("%d! =" %i, n)
    return n                            # 回歸

refunc(5)

lambda函數(shù)

lambda函數(shù)用于創(chuàng)建一個(gè)匿名函數(shù)，函數(shù)名未和標(biāo)識(shí)符進(jìn)行綁定聪建，使用lambda函數(shù)可以返回一些簡(jiǎn)單的運(yùn)算結(jié)果。lambda函數(shù)的格式如下

lambda 變量1,變量2,... :表達(dá)式

其中擎析，變量列表用于表達(dá)式的計(jì)算挥下，lambda屬于函數(shù)桨醋，因此變量列表后需要一個(gè)冒號(hào)喜最，通常把lambda賦值給一個(gè)變量，變量就可作為函數(shù)使用

def func():
    x = 1
    y = 2
    m= 3
    n = 4
    sum = lambda x, y : x + y
    print (sum)
    sub = lambda m, n : m - n
    print (sub)
    return sum(x, y) * sub(m, n)

print (func())

lambda也可以直接作為函數(shù)使用

print ((lambda x:-x)(-2))

Generator函數(shù)

生成器(Generator)的作用是一次產(chǎn)生一個(gè)數(shù)據(jù)項(xiàng)瞬内，并把數(shù)據(jù)項(xiàng)輸出，Generator函數(shù)可以用在for循環(huán)中遍歷限书，Generator函數(shù)虫蝶，每次返回一個(gè)數(shù)據(jù)項(xiàng)的特性，使得迭代器的性能更佳蔗包。Generator函數(shù)的定義和普通函數(shù)的定義沒(méi)什么區(qū)別秉扑，只要在函數(shù)體內(nèi)使用yield生成數(shù)據(jù)項(xiàng)即可。Generator函數(shù)可以被for循環(huán)遍歷调限，而且可以通過(guò)next()方法獲得yield生成的數(shù)據(jù)項(xiàng)舟陆。

def func(n):
    for i in range(n):
        yield i
# 在for循環(huán)中輸出
for i in func(3):
    print (i)
# 使用next()輸出
r =  func(3)
print (r.next())
print (r.next())
print (r.next())
print (r.next())

yield關(guān)鍵字與return關(guān)鍵字的返回值和執(zhí)行原理都不相同，yield生成值并不會(huì)中止程序的執(zhí)行耻矮，返回值后程序繼續(xù)往后執(zhí)行秦躯。return返回值后，程序?qū)⒅兄箞?zhí)行裆装。

def func(n):
    for i in range(n):
        return i
def func2(n):
    for i in range(n):
        yield i

print (func(3))
f = func2(3)
print (f)
print (f.next())
print (f.next())

文件讀寫(xiě)

使用readline()讀文件踱承，按行讀取，需要使用永真表達(dá)式循環(huán)讀取文件哨免。但當(dāng)文件指針移動(dòng)到文件的末尾時(shí)茎活，依然使用readline()讀取文件將出現(xiàn)錯(cuò)誤，因此程序需要添加1個(gè)判斷語(yǔ)句琢唾，判斷文件指針是否移動(dòng)到文件的尾部载荔，并且通過(guò)該語(yǔ)句中斷循環(huán)。

f = open("hello.txt")
while True:
    line = f.readline()
    if line: 
        print (line)
    else:
        break
f.close()

使用readlines()讀文件采桃，需要通過(guò)循環(huán)訪(fǎng)問(wèn)readlines()返回列表中的元素懒熙。函數(shù)readlines()可以一次性讀取文件多行數(shù)據(jù)。

f = file('hello.txt')
lines = f.readlines()
for line in lines:              # 一次讀取多行內(nèi)容
    print (line)
f.close()

使用read()最簡(jiǎn)單普办，將從文件中一次性讀出所有內(nèi)容工扎，并賦值給1個(gè)字符串變量

f = open("hello.txt")
context = f.read() 
print (context)
f.close()

可以通過(guò)控制read()參數(shù)的值肢娘，返回指定字節(jié)的內(nèi)容

f = open("hello.txt")
context = f.read(5)           # 讀取文件前5個(gè)字節(jié)內(nèi)容
print (context)
print (f.tell())                # 返回文件對(duì)象當(dāng)前指針位置
context = f.read(5)          # 繼續(xù)讀取5個(gè)字節(jié)內(nèi)容
print (context)
print (f.tell())               # 輸出文件當(dāng)前指針位置
f.close()

使用writelines()寫(xiě)文件

f = file("hello.txt", "w+")
li = ["hello world\n", "hello China\n"]
f.writelines(li)
f.close()

追加新的內(nèi)容到文件

f = file("hello.txt", "a+")         # 寫(xiě)入方式為追加a+
new_context = "goodbye"
f.write(new_context)
f.close()

使用writelines()寫(xiě)文件的速度更快。如果需要寫(xiě)入文件的字符串非常多笨忌，可以使用writelines()提高效率官疲。如果只需要寫(xiě)入少量的字符串途凫，直接用write()即可。

Python基本數(shù)據(jù)結(jié)構(gòu)：字典犀盟、集合等

元組

元組是Python中常用的一種數(shù)據(jù)結(jié)構(gòu)阅畴，元組由不同的元素組成，每個(gè)元素可以存儲(chǔ)不同類(lèi)型的數(shù)據(jù)纽哥，如字符串昵仅，數(shù)字，甚至元組垦写。元組是“寫(xiě)保護(hù)”的，即元組創(chuàng)建后不能再做任何修改操作分蓖，元組通常代表一行數(shù)據(jù)终娃，而元組中的元素代表不同的數(shù)據(jù)項(xiàng)棠耕。

如果創(chuàng)建的元組只包含一個(gè)元素，通常會(huì)錯(cuò)誤忽略單元素后的逗號(hào)蕊退，這樣瓤荔，python無(wú)法區(qū)分變量tuple是元組還是表達(dá)式茉贡，python誤認(rèn)為圓括號(hào)中的內(nèi)容為表達(dá)式，因此tuple[0]輸出的結(jié)果并非期望的值愉粤，并且其類(lèi)型也不是tuple衣厘。正確的寫(xiě)法如下：

tuple = ["apple" , ]   #定義元組影暴，注意后面的逗號(hào)不可少
print (tuple[0])  #打印第一個(gè)元素
print (type(tuple))   #打印定義的tuple的類(lèi)型

元組的訪(fǎng)問(wèn)

訪(fǎng)問(wèn)格式：tuple[n] ，n可以是0妆兑、正負(fù)整數(shù)。

輸出：print (tuple[n])

可以把元組理解為C或者Java中的數(shù)組芯勘。

注意：元組創(chuàng)建后其內(nèi)部元素的值不能被修改。元組中的元素不支持賦值操作屉来。

提示：元組不能添加或刪除任何元素茂契。因此掉冶，元組不存在任何添加厌小、刪除元素的方法，元組也不存在任何其他方法癣蟋。

元組的訪(fǎng)問(wèn)還有一些特殊的用法疯搅，例如負(fù)數(shù)索引和分片索引。這兩個(gè)特性是python的特殊用法礁蔗，C或者Java語(yǔ)言并不支持瘦麸。負(fù)數(shù)索引從元組的尾部開(kāi)始計(jì)數(shù)滋饲，最尾端的元素索引表示“-1”，次尾端的元素索引表示“-2”呵曹，以此類(lèi)推奄喂。

分片是元組的一個(gè)子集跨新，分片是從第1個(gè)索引到第2個(gè)索引（不包含第2個(gè)索引所指向的元素）所指定的所有元素。分片索引可以為正數(shù)或負(fù)數(shù)肖揣，兩個(gè)索引之間用冒號(hào)分隔龙优。分片的格式如下：

tuple[m:n] 其中m彤断、n可以是0瓦糟、正整數(shù)或負(fù)整數(shù)菩浙。

tuple=("apple","banana","grape","orange") #定義元組
print (tuple[-1])
print (tuple[-2])
tuple2 = tuple[1:3]  #分片，第二個(gè)元素到第三個(gè)元素（不包括第四個(gè)）
tuple3 = tuple[0:-2]  #分片，從第一個(gè)元素到倒數(shù)第二個(gè)元素（不包括倒數(shù)第二個(gè)）
tuple4 = tuple[2:-1]    #分片楚堤，從第三個(gè)元素到倒數(shù)第一個(gè)元素（不包括倒數(shù)第一個(gè)）
print (tuple2)
print (tuple3)
print (tuple4)

元組還可以由其他元組組成衅胀。例如滚躯，二元元組可以表示為：

tuple = (('t1' , 't2'), ('t3' , 't4'))

該元組是一個(gè)二元元組茁影，該元組由('t1' , 't2')和('t3' , 't4')組成。

fruit1 = ("apple", "banana")
fruit2 = ("grape", "orange")
tuple = (fruit1, fruit2)
print (tuple)
print ("tuple[0][1] =", tuple[0][1])  #打印輸出第一個(gè)元組的第二個(gè)元素
print ("tuple[1][1] =", tuple[1][1])　 #打印輸出第二個(gè)元組的第二個(gè)元素

創(chuàng)建元組的過(guò)程蝇更，python稱(chēng)為“打包”。相反厨幻，元組也可以執(zhí)行“解包”的操作况脆。“解包”可以將打包元組中的各個(gè)元素分別賦值給多個(gè)變量盛末，降低了代碼的復(fù)雜性悄但，使表達(dá)方式更自然檐嚣∥撕兀“打包”和“解包”例：

#打包
tuple = ("apple", "banana", "grape", "orange")
#解包
a, b, c, d = tuple  #將元組中的元素分別賦值給a暑刃，b溜嗜，c，d
print(a,b,c,d)

元組的遍歷

元組的遍歷是指通過(guò)循環(huán)語(yǔ)句依次訪(fǎng)問(wèn)元組中各元素的值炸宵。遍歷元組需要用到兩個(gè)函數(shù)range()和len()辟躏。range()和len()都是python的內(nèi)建函數(shù)，這些函數(shù)可直接調(diào)用土全，不需要import語(yǔ)句導(dǎo)入模塊捎琐。內(nèi)建函數(shù)是Python自動(dòng)導(dǎo)入的函數(shù)，相當(dāng)與Java中的lang包裹匙。

len()計(jì)算出tuple元組中元素的個(gè)數(shù)瑞凑，range()返回一個(gè)由數(shù)字組成的列表籽御。

tuple = (("apple","banana"),("grape","orange"),("watermelon", ),("grapefruit", ))
for i in range(len(tuple)):
        print("tuple[%d]:" %i)
        for j in range(len(tuple[i])):
                print(tuple[i][j])
        print()

也可以用for實(shí)現(xiàn)遍歷元組

tuple = (("apple","banana"),("grape","orange"),("watermelon", ),("grapefruit", ))  #定義一個(gè)二元元組
for i in tuple:
        for j in i:
                print(j)

列表

列表是Python中非常重要的數(shù)據(jù)類(lèi)型绘盟，通常作為函數(shù)的返回類(lèi)型撤嫩。列表和元組相似丈牢，也是由一組元組組成，列表可以實(shí)現(xiàn)添加霹粥、刪除和查找操作，元素的值可以被修改舶斧。

列表的創(chuàng)建

List(列表)是Python內(nèi)置的一種數(shù)據(jù)結(jié)構(gòu)怀酷。它由一系列元素組成友瘤，所有元素被包含在一對(duì)方括號(hào)中甥桂。列表創(chuàng)建后懂诗，可以執(zhí)行添加或刪除操作问窃。格式如下：

list = [元素1熟呛，元素2昔逗， ...]

列表的添加可以調(diào)用append(),該方法的聲明如下所示。

append(object)

其中，object可以是元組姥饰、列表瘩蚪、字典或任何對(duì)象棚贾。

列表的刪除可以調(diào)用remove()沛贪，該方法的聲明如下所示塘偎。

remove(value)

該方法也可刪除元素value。如果value不在列表中赔退，python將拋出異常

list = ["apple","banana","grape","orange"] #定義列表
print(list)
print(list[2])
list.append("watermelon")  #在列表末尾添加元素
list.insert(1,"grapefruit")  #向列表中插入元素
print(list)
list.remove("grape")    #從列表中移除grape
print(list)
print(list.pop())    #打印從列表中彈出的元素，即最后一個(gè)元素规揪。pop()表示取出最后一個(gè)元素
print(list)

注意：如果list列表中存在兩個(gè)相同的元素桥氏，此時(shí)調(diào)用remove()移除同名元素，將只刪除List列表中靠前的元素猛铅。

列表的使用字支，與元組十分相似，同樣支持負(fù)數(shù)索引奸忽、分片以及多遠(yuǎn)列表等特性堕伪，但是列表中的元素可修改，而且存在一些處理列表的方法栗菜。

list = ["apple","banana","grape","orange"] #定義列表
print(list[-2])
print(list[1:3])
print(list[-3:-1])
list = [["apple","banana"],["grape","orange"],["watermelon"],["grapefruit"]]
for i in range(len(list)):
        print("list[%d]:" %i)
        for j in range(len(list[i])):
                print(list[i][j])
        print()

列表實(shí)現(xiàn)了連接操作的功能刃跛，列表的連接同樣提供了兩種方式，一種是調(diào)用extend()連接兩個(gè)不同的列表苛萎，另一種是使用運(yùn)算符“+”或“+=”桨昙。

list1=["apple","banana"]
list2=["grape","orange"]
list1.extend(list2) #list1連接list2
print(list1)
list3=["watermelon"]
list1=list1+list3  #將list1與list3連接后賦給list1
print(list1)
list1+=["grapefruit"] #使用+=給list1連接上["grapefruit"]
print(list1)
list1=["apple","banana"]*2  #連接兩個(gè)相同的列表
print(list1)

列表的查找检号、排序、反轉(zhuǎn)

list列表可以進(jìn)行添加蛙酪、刪除操作齐苛，此外List列表還提供了查找元素的方法。list列表的查找提供了兩種方式桂塞，一種是使用index方法返回元素在列表中的位置凹蜂，另一種方法是使用關(guān)鍵字“in”來(lái)判斷元素是否存在列表中。

list=["apple","banana","grape","orange"]
print(list.index("grape")) #打印grape的索引
print(list.index("orange"))  #打印orange的索引
print("orange" in list)   #判斷orange是否在列表中

列表的排序和反轉(zhuǎn)

list=["banana","apple","orange","grape"]
list.sort()  #排序阁危，按首字母升序排序
print("Sorted list:",list)
list.reverse()  #反轉(zhuǎn)玛痊，反轉(zhuǎn)列表中元素的排列順序
print("Reversed list:",list)

集合(Set)

set與dict大致相同，但set沒(méi)有Value狂打，只有key擂煞。因此，set只是一組key的集合趴乡。由于key不能重復(fù)对省，所以，在set中晾捏，沒(méi)有重復(fù)的key蒿涎。

創(chuàng)建空集合

在集合中，創(chuàng)建空集合（set）必須使用函數(shù)set()惦辛。不能使用{}劳秋，{}用于創(chuàng)建空字典。

#創(chuàng)建空集合
>>>a = set()
>>>a
set()
>>>type(a)
<class 'set'>

創(chuàng)建非空集合

非空集合可以用大括號(hào){}或 set()函數(shù)來(lái)創(chuàng)建胖齐。

#創(chuàng)建集合
>>>a={'a','b','c','d'}
>>>b=set('abcdefabcd')
>>>c=set({'a':1,'b':2,'c':3})
>>>d=set(['a','b','c','a'])
#運(yùn)行結(jié)果
>>>print(a,type(a))
{'c', 'd', 'b', 'a'} <class 'set'>
>>>print(b,type(b))
{'f', 'e', 'b', 'c', 'd', 'a'} <class 'set'>
>>>print(c,type(c))
{'b', 'a','c'} <class 'set'>
>>>print(d,type(d))
{'c', 'b', 'a'} <class 'set'>

添加元素

在集合中添加元素俗批，可以使用add()方法，并且不生成一個(gè)新的集合市怎。add()方法可以向set中添加元素，可以重復(fù)添加辛慰，但不會(huì)有效果区匠。

#添加元素：add()
>>>s = {1,2,3}
>>>s.add(4)
>>>s
{1,2,3,4}
>>>s.add('g')
>>>s
{1,2,3,4,'g'}
>>>s.add(4)
>>>s
{1,2,3,4,'g'}

刪除元素

set中利用remove()方法可以刪除集合中的元素。

#刪除元素
>>>s
{1,2,3,4,'g'}
>>>s.remove('g')
>>>s
{1,2,3,4}

清空元素

clear()方法可以清空set中的元素帅腌。

#清空元素
>>>a = {1,2,3,4}
>>>b = a.clear()
>>>print(a,type(a))
set() <class 'set'>
>>>print(b,type(b))
None <class 'NoneType'>

復(fù)制元素

copy()方法只能淺拷貝set中的元素驰弄，并生成一個(gè)新的集合。

#淺拷貝：copy()
>>>a = {1,(9,2),3}
>>>b = a.copy()
>>>print(a,id(a))
{(9, 2), 1, 3} 2097937619880
>>>print(b,id(b))
{(9, 2), 1, 3} 2097937620776

#賦值
>>>s = {1,2,3,4}
>>>d = s
>>>print(s,id(s))
{1, 2, 3, 4} 2097937785128
>>>print(d,id(d))
{1, 2, 3, 4} 2097937785128

pop()

pop()方法用于從set中隨機(jī)取一個(gè)元素速客。記住，是隨機(jī)的~~~

#pop()方法
>>>s = {1,2,3,4,5,'g','s'}
>>>s.pop()
'g'
>>>s.pop()
3

set集合操作

#set集合操作
>>>s = {1,2,3,4}
>>>d = {2.3.5.6}
>>>s & d
{2.3}
>>>s | d
{1,2,3,4,5,6}
>>>s - d
{1,4}
>>>d - s
{5,6}

字典(Dict)

字典結(jié)構(gòu)

字典是Python中重要的數(shù)據(jù)類(lèi)型，字典的由“鍵-值”對(duì)組成的集合沟优，字典中的“值”通過(guò)“鍵”來(lái)引用赛不。

字典的創(chuàng)建

字典由一系列的“鍵-值”（key-value）對(duì)組成位喂，“鍵-值”對(duì)之間用“逗號(hào)”隔開(kāi)，并且被包含在一堆花括號(hào)中乱灵。字典與java語(yǔ)言中的HashMap類(lèi)作用類(lèi)似塑崖，都是采用“鍵-值”對(duì)映射的方式存儲(chǔ)數(shù)據(jù)。

字典的創(chuàng)建格式如下：

dictionary={key1：value1, key2：value2,...}

其中,key1痛倚、key2等表示字典的key值规婆，value1、value2等表示字典的value值蝉稳。

如果需要?jiǎng)?chuàng)建一個(gè)空的字典抒蚜，只需要一對(duì)花括號(hào)即可，代碼如下：

dictionary = {}

dict={"a":"apple","b":"banana","g":"grape","o":"orange"}
print(dict)
print(dict["a"]) #打印建a對(duì)應(yīng)的值
print(dict[2]) #打印建2對(duì)應(yīng)的值耘戚，不用雙引號(hào)

print()的使用非常靈活嗡髓，也可以在print()中使用字典。下面示例字典在print()中的使用毕莱。

print("%s,%(a)s,%(b)s" %{"a":"apple", "b":"banana"})

解釋?zhuān)浩渲须[式的創(chuàng)建了字典{“a”:"apple","b":"banana"}器贩。這個(gè)字典用來(lái)定制print()中的參數(shù)列表∨蠼兀“%s”輸出這個(gè)字典的內(nèi)容蛹稍，"%(a)s"獲取字典中對(duì)應(yīng)的key值“a”的value值，“%(b)s”獲取字典中對(duì)應(yīng)key值"b"的value值部服。

字典的訪(fǎng)問(wèn)

字典的訪(fǎng)問(wèn)與元組唆姐、列表有所不同，元組和列表是通過(guò)數(shù)字索引來(lái)獲取對(duì)應(yīng)的值廓八，而字典是通過(guò)key值獲取相應(yīng)的value值奉芦。訪(fǎng)問(wèn)字典格式如下:

value = dict[key]

字典的添加、刪除和修改非常簡(jiǎn)單剧蹂，添加或修改操作只需要編寫(xiě)一條賦值語(yǔ)句声功，例如：

dict["x"] = "value"

如果索引x不在字典dict的key列表中，字典dict將添加一條新的映射(x:value);如果索引x在字典dict的key列表中宠叼，字典dict將直接修改索引x對(duì)應(yīng)的value值先巴。

字典與列表不同，字典并沒(méi)有remove()操作冒冬。字典元素的刪除可以調(diào)用del()實(shí)現(xiàn)伸蚯，del()屬于內(nèi)建函數(shù)，直接調(diào)用即可简烤。列表可以調(diào)用pop()彈出列表中的一個(gè)元素剂邮，字典也有一個(gè)pop()，該方法的聲明和作用與列表的pop()有些不同横侦。pop()的聲明如下所示挥萌。

D.pop(k[,d]) -> v

pop()必須指定參數(shù)才能刪除對(duì)應(yīng)的值绰姻。其中，參數(shù)k表示字典的索引瑞眼，如果字典D中存在索引k龙宏，返回值v等于D[k];如果字典D中沒(méi)有找到索引k，返回值為d伤疙。

如果需要清除字典中所有的內(nèi)容银酗，可以調(diào)用字典的clear()

#字典的添加、刪除徒像、修改操作
dict={"a":"apple","b":"banana","g":"grape","o":"orange"}
dict["w"]="watermelon"　#添加字典元素　　　
del(dict["a"]) #刪除字典中鍵為a的元素
dict["g"]="grapefruit"   #修改字典中鍵為g的值
print(dict.pop("b"))    #彈出字典中鍵為b的元素
print(dict)
dict.clear()    #清除字典中所有元素
print(dict)

由于字典是無(wú)序的黍特，因此字典中沒(méi)有append()、remove()等方法锯蛀。如果需要向字典插入新的元素灭衷，可以調(diào)用setdefault()。

字典的遍歷有多種方式旁涤，最直接的方式是通過(guò)"for...in..." 語(yǔ)句完成遍歷的任務(wù)

dict={1:"apple",2:"banana",3:"grape",4:"orange"}
for k in dict:
        print("dict[%s]" %k,dict[k])

語(yǔ)句循環(huán)訪(fǎng)問(wèn)字典dict翔曲，變量k獲取的是字典dict的key值，并沒(méi)有直接獲取value值劈愚。因此打印輸出時(shí)瞳遍，通過(guò)dict[k]來(lái)獲取value值。

此外菌羽，還可以使用字典的items()實(shí)現(xiàn)字典的遍歷操作掠械，items()返回一個(gè)由若干元組組成的列表

dict={"a":"apple","b":"banana","c":"grape","d":"orange"}
print(dict.items())

可見(jiàn)，items()把字典中每對(duì)key和value組成一個(gè)元組注祖，并把這些元組存放在列表中返回猾蒂。下面將使用字典item()實(shí)現(xiàn)字典的遍歷。

dict={"a":"apple","b":"banana","c":"grape","d":"orange"}
for(k,v) in dict.items():　　#變量k和v分別與字典dict中的key和cvalue值對(duì)應(yīng)
        print("dict[%s]" %k,v)

除了能采用字符串作為字典的value值是晨，元組肚菠、列表甚至字典都可以作為字典的value值。使用元組罩缴、列表或字典作為value值創(chuàng)建字典蚊逢，稱(chēng)為混合型字典。格式如下：

dict={"key1":(tuple), "key2":[list], "key3":[dictionary] ...}

dict={"a":("apple",),"g":["grape","grapefruit"],"bo":{"b":"banana","o":"orange"}}
print(dict["a"])
print(dict["a"][0])
print(dict["g"])
print(dict["g"][1])
print(dict["bo"])
print(dict["bo"]["b"])

字典的方法

get()方法

#get()的等價(jià)語(yǔ)句
D = {"key1" : "value1", "key2" : "value2"}
if "key1" in D:
    print (D["key1"])
else:
    print ("None")

#字典中元素的獲取方法
dict = {"a" : "apple", "b" : "banana", "c" : "grape", "d" : "orange"} 
print (dict)
print (dict.get("c", "apple"))          # 使用get獲取鍵為c的值靴庆，若不存在返回默認(rèn)值apple
print (dict.get("e", "apple"))          # 使用get獲取鍵為e的值，若不存在返回默認(rèn)值apple

update()方法

#udpate()的等價(jià)語(yǔ)句
D = {"key1" : "value1", "key2" : "value2"}
E = {"key3" : "value3", "key4" : "value4"}
for k in E:
    D[k] = E[k]
print (D)

#字典E中含有字典D中的key
D = {"key1" : "value1", "key2" : "value2"}
E = {"key2" : "value3", "key4" : "value4"}
for k in E:
    D[k] = E[k]
print (D)

#字典的更新
dict = {"a" : "apple", "b" : "banana"}
print (dict)
dict2 = {"c" : "grape", "d" : "orange"}
dict.update(dict2)                # 使用update方法更新dict
print (dict)

setdefault()方法

# 設(shè)置默認(rèn)值
dict = {}
dict.setdefault("a")
print (dict)
dict["a"] = "apple"
dict.setdefault("a", "None")
print (dict)

sorted()方法

dict = {"a" : "apple", "b" : "grape", "c" : "orange", "d" : "banana"} 
print (dict)   
#按照key排序  
print (sorted(dict.items(), key=lambda d: d[0]))
#按照value排序  
print (sorted(dict.items(), key=lambda d: d[1]))

淺拷貝

#字典的淺拷貝
dict = {"a" : "apple", "b" : "grape"} 
dict2 = {"c" : "orange", "d" : "banana"} 
dict2 = dict.copy()           # 拷貝dict并賦給dict2
print (dict2)

深拷貝

#字典的深拷貝
import copy
dict = {"a" : "apple", "b" : {"g" : "grape","o" : "orange"}} 
dict2 = copy.deepcopy(dict)         # 深拷貝
dict3 = copy.copy(dict)              # 淺拷貝
dict2["b"]["g"] = "orange"
print (dict)
dict3["b"]["g"] = "orange"
print (dict)

字典B淺拷貝字典A的數(shù)據(jù)怒医，如果字典B的數(shù)據(jù)發(fā)生添加炉抒、刪除或修改操作，字典A的數(shù)據(jù)也將發(fā)生變化稚叹；相反焰薄，如果字典B深拷貝字典A的數(shù)據(jù)拿诸，字典B的數(shù)據(jù)即使發(fā)生變化，也不會(huì)影響到字典A

Pandas基礎(chǔ)

Pandas環(huán)境安裝

安裝Anaconda3塞茅，已經(jīng)內(nèi)置Pandas

Pandas數(shù)據(jù)結(jié)構(gòu)：Series和Dataframe

將在云主機(jī)操作Anaconda3亩码，鏈接：

實(shí)踐

import numpy as np
import stats as sts
scores = [31, 24, 23, 25, 14, 25, 13, 12, 14, 23,
          32, 34, 43, 41, 21, 23, 26, 26, 34, 42,
          43, 25, 24, 23, 24, 44, 23, 14, 52,32,
          42, 44, 35, 28, 17, 21, 32, 42, 12, 34]
#集中趨勢(shì)的度量
print('求和：',np.sum(scores))
print('個(gè)數(shù)：',len(scores))
print('平均值:',np.mean(scores))
print('中位數(shù):',np.median(scores))
print('眾數(shù):',sts.mode(scores))
print('上四分位數(shù)',sts.quantile(scores,p=0.25))
print('下四分位數(shù)',sts.quantile(scores,p=0.75))
#離散趨勢(shì)的度量
print('最大值:',np.max(scores))
print('最小值:',np.min(scores))
print('極差:',np.max(scores)-np.min(scores))
print('四分位差',sts.quantile(scores,p=0.75)-sts.quantile(scores,p=0.25))
print('標(biāo)準(zhǔn)差:',np.std(scores))
print('方差:',np.var(scores))
print('離散系數(shù):',np.std(scores)/np.mean(scores))
#偏度與峰度的度量
print('偏度:',sts.skewness(scores))
print('峰度:',sts.kurtosis(scores))

#中位數(shù)實(shí)現(xiàn)
def median(data):
    data.sort()
    half = len(data) // 2
    return (data[half] + data[~half])/2

l = [1,2,3,7,5,6,4,9,8,10]
if __name__ == '__main__':
    print(median(l))

最后編輯于：2019.07.28 09:06:20

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市野瘦，隨后出現(xiàn)的幾起案子描沟，更是在濱河造成了極大的恐慌，老刑警劉巖鞭光，帶你破解...
沈念sama閱讀 211,265評(píng)論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件吏廉，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡惰许，警方通過(guò)查閱死者的電腦和手機(jī)席覆，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,078評(píng)論 2贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)汹买，“玉大人佩伤，你說(shuō)我怎么就攤上這事』薇校” “怎么了生巡？”我有些...
開(kāi)封第一講書(shū)人閱讀 156,852評(píng)論 0贊 347
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)结序。經(jīng)常有香客問(wèn)我障斋，道長(zhǎng)，這世上最難降的妖魔是什么徐鹤？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,408評(píng)論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任垃环，我火速辦了婚禮，結(jié)果婚禮上返敬，老公的妹妹穿的比我還像新娘遂庄。我一直安慰自己，他們只是感情好劲赠，可當(dāng)我...
茶點(diǎn)故事閱讀 65,445評(píng)論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布涛目。她就那樣靜靜地躺著，像睡著了一般凛澎。火紅的嫁衣襯著肌膚如雪霹肝。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 49,772評(píng)論 1贊 290
城市分裂傳說(shuō)
那天塑煎，我揣著相機(jī)與錄音沫换，去河邊找鬼。笑死最铁，一個(gè)胖子當(dāng)著我的面吹牛讯赏，可吹牛的內(nèi)容都是我干的垮兑。我是一名探鬼主播，決...
沈念sama閱讀 38,921評(píng)論 3贊 406
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼漱挎，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼系枪！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起磕谅，我...
開(kāi)封第一講書(shū)人閱讀 37,688評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤私爷，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后怜庸，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體当犯，經(jīng)...
沈念sama閱讀 44,130評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,467評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年割疾，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了嚎卫。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 38,617評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡宏榕，死狀恐怖拓诸，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情麻昼，我是刑警寧澤奠支，帶...
沈念sama閱讀 34,276評(píng)論 4贊 329
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站抚芦，受9級(jí)特大地震影響倍谜，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜叉抡，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,882評(píng)論 3贊 312
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一尔崔、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧褥民，春花似錦季春、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,740評(píng)論 0贊 21
一樁弒父案载弄，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至撵颊，卻和暖如春宇攻，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背倡勇。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,967評(píng)論 1贊 265
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工逞刷，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 46,315評(píng)論 2贊 360
代替公主和親
正文我出身青樓亲桥，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親固耘。傳聞我的和親對(duì)象是個(gè)殘疾皇子题篷，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,486評(píng)論 2贊 348

學(xué)習(xí)計(jì)劃：第02周(20190722-20190728)

知識(shí)點(diǎn)：Python數(shù)據(jù)分析基礎(chǔ)

Python基礎(chǔ)

Python環(huán)境安裝

下載奇唤、安裝Anaconda3

這里選擇yes

配置路徑

部署jupyter notebook過(guò)程

<1>配置環(huán)境，通過(guò)遠(yuǎn)程方式訪(fǎng)問(wèn)jupyter notebook，記錄配置文件的路徑/root/.jupyter/jupyter_notebook_config.py

<2>生成登陸密碼布近，進(jìn)入Python

保存密碼，例如：'sha1:9196ad6d9d4a:a63068b5e26b0ea608bbd31675a517ef5c49de1a'

<3>修改<1>生成的配置文件

<4>啟動(dòng)Jupyter服務(wù)

<5>瀏覽器訪(fǎng)問(wèn)暂衡，并輸入密碼

http://服務(wù)器地址:端口號(hào)

<6>結(jié)束進(jìn)程

Python基本用法：控制語(yǔ)句统屈、函數(shù)、文件讀寫(xiě)等

控制語(yǔ)句由條件語(yǔ)句牙躺、循環(huán)語(yǔ)句構(gòu)成愁憔，控制語(yǔ)句根據(jù)條件表達(dá)式控制程序的流轉(zhuǎn)

條件判斷語(yǔ)句

if else語(yǔ)句

if elif else語(yǔ)句

嵌套if語(yǔ)句吨掌，盡可能避免使用，不便于閱讀脓恕，而且容易忽略一些可能性

switch替代方案1

switch替代方案2

循環(huán)語(yǔ)句江掩，注意不要死循環(huán)

while循環(huán)

for循環(huán)

break,continue

參考switch替代方案2例子

函數(shù)

switch替代方案2封裝成函數(shù)

return返回多個(gè)值，可以把這些值打包到元祖中环形，在調(diào)用時(shí)，對(duì)返回的元祖進(jìn)行解包即可

多個(gè)return語(yǔ)句

多個(gè)return語(yǔ)句重構(gòu)衙傀，增加變量

嵌套函數(shù)

嵌套函數(shù)抬吟，內(nèi)部函數(shù)

遞歸函數(shù)，經(jīng)典例子统抬，計(jì)算階乘

lambda函數(shù)

lambda函數(shù)用于創(chuàng)建一個(gè)匿名函數(shù)，函數(shù)名未和標(biāo)識(shí)符進(jìn)行綁定聪建，使用lambda函數(shù)可以返回一些簡(jiǎn)單的運(yùn)算結(jié)果。lambda函數(shù)的格式如下

lambda 變量1,變量2,... :表達(dá)式

其中擎析，變量列表用于表達(dá)式的計(jì)算挥下，lambda屬于函數(shù)桨醋，因此變量列表后需要一個(gè)冒號(hào)喜最，通常把lambda賦值給一個(gè)變量，變量就可作為函數(shù)使用

lambda也可以直接作為函數(shù)使用

Generator函數(shù)

yield關(guān)鍵字與return關(guān)鍵字的返回值和執(zhí)行原理都不相同，yield生成值并不會(huì)中止程序的執(zhí)行耻矮，返回值后程序繼續(xù)往后執(zhí)行秦躯。return返回值后，程序?qū)⒅兄箞?zhí)行裆装。

文件讀寫(xiě)

使用readlines()讀文件采桃，需要通過(guò)循環(huán)訪(fǎng)問(wèn)readlines()返回列表中的元素懒熙。函數(shù)readlines()可以一次性讀取文件多行數(shù)據(jù)。

使用read()最簡(jiǎn)單普办，將從文件中一次性讀出所有內(nèi)容工扎，并賦值給1個(gè)字符串變量

可以通過(guò)控制read()參數(shù)的值肢娘，返回指定字節(jié)的內(nèi)容

使用writelines()寫(xiě)文件

追加新的內(nèi)容到文件

使用writelines()寫(xiě)文件的速度更快。如果需要寫(xiě)入文件的字符串非常多笨忌，可以使用writelines()提高效率官疲。如果只需要寫(xiě)入少量的字符串途凫，直接用write()即可。

Python基本數(shù)據(jù)結(jié)構(gòu)：字典犀盟、集合等

元組

元組的訪(fǎng)問(wèn)

訪(fǎng)問(wèn)格式：tuple[n] ，n可以是0妆兑、正負(fù)整數(shù)。

輸出：print (tuple[n])

可以把元組理解為C或者Java中的數(shù)組芯勘。

注意：元組創(chuàng)建后其內(nèi)部元素的值不能被修改。元組中的元素不支持賦值操作屉来。

提示：元組不能添加或刪除任何元素茂契。因此掉冶，元組不存在任何添加厌小、刪除元素的方法，元組也不存在任何其他方法癣蟋。

tuple[m:n] 其中m彤断、n可以是0瓦糟、正整數(shù)或負(fù)整數(shù)菩浙。

元組還可以由其他元組組成衅胀。例如滚躯，二元元組可以表示為：

tuple = (('t1' , 't2'), ('t3' , 't4'))

該元組是一個(gè)二元元組茁影，該元組由('t1' , 't2')和('t3' , 't4')組成。

元組的遍歷

len()計(jì)算出tuple元組中元素的個(gè)數(shù)瑞凑，range()返回一個(gè)由數(shù)字組成的列表籽御。

也可以用for實(shí)現(xiàn)遍歷元組

列表

列表是Python中非常重要的數(shù)據(jù)類(lèi)型绘盟，通常作為函數(shù)的返回類(lèi)型撤嫩。列表和元組相似丈牢，也是由一組元組組成，列表可以實(shí)現(xiàn)添加霹粥、刪除和查找操作，元素的值可以被修改舶斧。

列表的創(chuàng)建

List(列表)是Python內(nèi)置的一種數(shù)據(jù)結(jié)構(gòu)怀酷。它由一系列元素組成友瘤，所有元素被包含在一對(duì)方括號(hào)中甥桂。列表創(chuàng)建后懂诗，可以執(zhí)行添加或刪除操作问窃。格式如下：

list = [元素1熟呛， 元素2昔逗， ...]

列表的添加可以調(diào)用append(),該方法的聲明如下所示。

append(object)

其中，object可以是元組姥饰、列表瘩蚪、字典或任何對(duì)象棚贾。

列表的刪除可以調(diào)用remove()沛贪，該方法的聲明如下所示塘偎。

remove(value)

該方法也可刪除元素value。如果value不在列表中赔退，python將拋出異常

注意：如果list列表中存在兩個(gè)相同的元素桥氏，此時(shí)調(diào)用remove()移除同名元素，將只刪除List列表中靠前的元素猛铅。

列表的使用字支，與元組十分相似，同樣支持負(fù)數(shù)索引奸忽、分片以及多遠(yuǎn)列表等特性堕伪，但是列表中的元素可修改，而且存在一些處理列表的方法栗菜。

列表實(shí)現(xiàn)了連接操作的功能刃跛，列表的連接同樣提供了兩種方式，一種是調(diào)用extend()連接兩個(gè)不同的列表苛萎，另一種是使用運(yùn)算符“+”或“+=”桨昙。

list = [元素1熟呛，元素2昔逗， ...]