numpy 統(tǒng)計(jì)函數(shù)
從數(shù)組中查找最小元素, 最大元素, 百分位標(biāo)準(zhǔn)差, 和方差燈
numpy.amin()和numpy.amax()
numpy.amin() 用于計(jì)算數(shù)組中的元素沿指定軸的最小值。
numpy.amax() 用于計(jì)算數(shù)組中的元素沿指定軸的最大值。
import numpy as np
a = np.array([[3,5,7],[8,4,3],[2,4,9]])
print ('原數(shù)組')
print (a)
print ('\n')
print ('調(diào)用amin()函數(shù)')
print (np.amin(a,1))
print ('\n')
print ('再次調(diào)用amin')
print (np.amin(a,0))
print ('調(diào)用amax')
print (np.amax(a))
print ('\n')
print ('再次調(diào)用amax')
print (np.amax(a, axis = 0))
原數(shù)組
[[3 5 7]
[8 4 3]
[2 4 9]]
調(diào)用amin()函數(shù)
[3 3 2]
再次調(diào)用amin
[2 4 3]
調(diào)用amax
9
再次調(diào)用amax
[8 5 9]
numpy.ptp()
計(jì)算元素最大值與最小值的差(最大值-最小值)
import numpy as np
a = np.array([[3,5,7],[8,4,3],[2,4,9]])
print (a)
print ('\n')
print ('調(diào)用ptp函數(shù)')
print (np.ptp(a))
print ('\n')
print ('沿軸1調(diào)用ptp函數(shù)')
print (np.ptp(a,axis = 1))
print ('\n')
print ('沿軸0調(diào)用ptp函數(shù)')
print (np.ptp(a,axis = 0))
[[3 5 7]
[8 4 3]
[2 4 9]]
調(diào)用ptp函數(shù)
7
沿軸1調(diào)用ptp函數(shù)
[4 5 7]
沿軸0調(diào)用ptp函數(shù)
[6 1 6]
numpy.percentile()
百分?jǐn)?shù)是統(tǒng)計(jì)中使用的度量, 表示小于這個(gè)值的觀察值的百分比.
numpy.percentile(a, q, axis)
a
輸入數(shù)組
q
要計(jì)算的百分位數(shù), 在0-100之間
axis
沿著它計(jì)算百分位數(shù)的軸
首先明確百分位數(shù):
第 p 個(gè)百分位數(shù)是這樣一個(gè)值港庄,它使得至少有 p% 的數(shù)據(jù)項(xiàng)小于或等于這個(gè)值设联,且至少有 (100-p)% 的數(shù)據(jù)項(xiàng)大于或等于這個(gè)值。
舉個(gè)例子:高等院校的入學(xué)考試成績經(jīng)常以百分位數(shù)的形式報(bào)告褥影。比如池户,假設(shè)某個(gè)考生在入學(xué)考試中的語文部分的原始分?jǐn)?shù)為 54 分。相對于參加同一考試的其他學(xué)生來說凡怎,他的成績?nèi)绾尾⒉蝗菀字佬=埂5侨绻挤謹(jǐn)?shù)54分恰好對應(yīng)的是第70百分位數(shù),我們就能知道大約70%的學(xué)生的考分比他低统倒,而約30%的學(xué)生考分比他高寨典。
這里的 p = 70。
import numpy as np
a = np.array([[10,7,4], [3,2,1]])
print (a)
print ('調(diào)用percentile函數(shù)')
# 50%的分位數(shù)就是a里排序之后的中位數(shù)
print (np.percentile(a, 50))
# axis為0 , 在縱列上求
print (np.percentile(a,50, axis = 0))
# 橫行上求
print (np.percentile(a, 50, axis = 1))
# 維度不變
print (np.percentile(a, 50, axis = 1, keepdims = True))
[[10 7 4]
[ 3 2 1]]
調(diào)用percentile函數(shù)
3.5
[ 6.5 4.5 2.5]
[ 7. 2.]
[[ 7.]
[ 2.]]
numpy.median()
函數(shù)用于計(jì)算數(shù)組a中元素的中位數(shù)(中值)
import numpy as np
a = np.array([[30,65,70,],[80, 95, 10], [50, 90, 60]])
print ('原數(shù)組')
print (a)
print ('\n')
print ('調(diào)用median')
print (np.median(a))
print ('\n')
print ('沿軸0調(diào)用median函數(shù)')
print (np.median(a, axis = 0))
print ('\n')
print ('沿軸1調(diào)用median函數(shù)')
print (np.median(a, axis = 1))
原數(shù)組
[[30 65 70]
[80 95 10]
[50 90 60]]
調(diào)用median
65.0
沿軸0調(diào)用median函數(shù)
[ 50. 90. 60.]
沿軸1調(diào)用median函數(shù)
[ 65. 80. 60.]
numpy.mean()
函數(shù)返回?cái)?shù)組中元素的算術(shù)平均值, 如果提供了軸, 則沿其計(jì)算, 算術(shù)平均值是沿軸的元素總和除以元素的數(shù)量
import numpy as np
a = np.array([[1,2,3],[3,4,5],[4,5,6]])
print ('我們的數(shù)組是')
print (a)
print ('\n')
print ('調(diào)用mean')
print (np.mean(a))
print ('\n')
print ('沿軸0調(diào)用mean函數(shù)')
print (np.mean(a, axis = 0))
print ('\n')
print ('沿軸1 調(diào)用mean函數(shù)')
print (np.mean(a, axis = 1))
我們的數(shù)組是
[[1 2 3]
[3 4 5]
[4 5 6]]
調(diào)用mean
3.66666666667
沿軸0調(diào)用mean函數(shù)
[ 2.66666667 3.66666667 4.66666667]
沿軸1 調(diào)用mean函數(shù)
[ 2. 4. 5.]
numpy.average()
函數(shù)根據(jù)在另一個(gè)數(shù)組中給出的各自的權(quán)重計(jì)算數(shù)組中元素的加權(quán)平均值房匆。
該函數(shù)可以接受一個(gè)軸參數(shù)耸成。 如果沒有指定軸,則數(shù)組會被展開浴鸿。
加權(quán)平均值即將各數(shù)值乘以相應(yīng)的權(quán)數(shù)井氢,然后加總求和得到總體值,再除以總的單位數(shù)岳链。
考慮數(shù)組[1,2,3,4]和相應(yīng)的權(quán)重[4,3,2,1]花竞,通過將相應(yīng)元素的乘積相加,并將和除以權(quán)重的和掸哑,來計(jì)算加權(quán)平均值约急。
加權(quán)平均值 = (1*4+2*3+3*2+4*1)/(4+3+2+1)
import numpy as np
a = np.array([1,2,3,4])
print ('原數(shù)組')
print (a)
print ('\n')
print ('調(diào)用average函數(shù)')
print (np.average(a))
print ('\n')
# 不指定權(quán)重時(shí)相當(dāng)于mean函數(shù)
wts = np.array([4,3,2,1])
print ("再次調(diào)用average函數(shù)")
print (np.average(a, weights = wts))
print ('\n')
# 如果returned參數(shù)設(shè)為true, 則返回權(quán)重的和
print ('權(quán)重的和:')
print (np.average([1,2,3,4], weights = [4,3,2,1], returned = True))
原數(shù)組
[1 2 3 4]
調(diào)用average函數(shù)
2.5
再次調(diào)用average函數(shù)
2.0
權(quán)重的和:
(2.0, 10.0)
多維數(shù)組中, 可以指定用于計(jì)算的軸
import numpy as np
a = np.arange(6).reshape(3,2)
print ('原數(shù)組')
print (a)
print ('\n')
print ('修改之后的數(shù)組')
wt = np.array([3,5])
print (np.average(a, axis = 1, weights = wt))
print ('\n')
print ('修改后的數(shù)組')
print (np.average(a, axis = 1, weights = wt, returned = True))
原數(shù)組
[[0 1]
[2 3]
[4 5]]
修改之后的數(shù)組
[ 0.625 2.625 4.625]
修改后的數(shù)組
(array([ 0.625, 2.625, 4.625]), array([ 8., 8., 8.]))
標(biāo)準(zhǔn)差std()
標(biāo)準(zhǔn)差是一組數(shù)據(jù)平均值分散程度的一種度量。
標(biāo)準(zhǔn)差是方差的算術(shù)平方根苗分。
標(biāo)準(zhǔn)差公式如下:
std = sqrt(mean((x - x.mean())**2))
如果數(shù)組是 [1厌蔽,2,3俭嘁,4]躺枕,則其平均值為 2.5。 因此供填,差的平方是 [2.25,0.25,0.25,2.25]拐云,并且其平均值的平方根除以 4,即 sqrt(5/4) 近她,結(jié)果為 1.1180339887498949叉瘩。
import numpy as np
print (np.std([1,2,3,4]))
1.11803398875
方差var()
統(tǒng)計(jì)中的方差(樣本方差)是每個(gè)樣本值與全體樣本值的平均數(shù)之差的平方值的平均數(shù),即 mean((x - x.mean())** 2)粘捎。
換句話說薇缅,標(biāo)準(zhǔn)差是方差的平方根危彩。
import numpy as np
print (np.var([1,2,3,4]))
1.25
numpy排序, 條件刷選函數(shù)
NumPy 提供了多種排序的方法。 這些排序函數(shù)實(shí)現(xiàn)不同的排序算法泳桦,每個(gè)排序算法的特征在于執(zhí)行速度汤徽,最壞情況性能,所需的工作空間和算法的穩(wěn)定性灸撰。 下表顯示了三種排序算法的比較谒府。
種類 | 速度 | 最壞情況 | 工作空間 | 穩(wěn)定性 |
---|---|---|---|---|
'quicksort' (快速排序) |
1 | O(n^2) |
0 | 否 |
'mergesort' (歸并排序) |
2 | O(n*log(n)) |
~n/2 | 是 |
'heapsort' (堆排序) |
3 | O(n*log(n)) |
0 | 否 |
numpy.sort()
返回輸入數(shù)組的排序副本
numpy.sort(a, axis, kind, order)
a
要排序的數(shù)組
axis
沿著它排序數(shù)組的軸, 如果沒有數(shù)組會被展開, 沿著最后的軸排序, axis = 0 按列排序, axis=1 按行
kind
默認(rèn)為quicksort
(快速排序)
order
如果數(shù)組包含字段, 則是要排序的字段
import numpy as np
a = np.array([[3,7],[9,1]])
print ('原數(shù)組')
print (a)
print ('\n')
print ('調(diào)用sort函數(shù)')
print (np.sort(a))
print ('\n')
print ('按列排序')
print (np.sort(a, axis = 0))
print ('\n')
# 在sort函數(shù)中排序字段
dt = np.dtype([('name','S10'), ('age', int)])
a = np.array([('raju', 21), ('anil', 25), ('ravi',17), ('amar', 27)], dtype = d
t)
print ('原數(shù)組')
print (a)
print ('\n')
print ('按name排序')
print (np.sort(a,order = 'name'))
原數(shù)組
[[3 7]
[9 1]]
調(diào)用sort函數(shù)
[[3 7]
[1 9]]
按列排序
[[3 1]
[9 7]]
原數(shù)組
[(b'raju', 21) (b'anil', 25) (b'ravi', 17) (b'amar', 27)]
按name排序
[(b'amar', 27) (b'anil', 25) (b'raju', 21) (b'ravi', 17)]
numpy.argsort()
返回?cái)?shù)組值從小到大的索引值
import numpy as np
x = np.array([3,1,2])
print ('原數(shù)組')
print (x)
print ('\n')
print ('對x調(diào)用argsort函數(shù)')
y = np.argsort(x)
print (y)
print ('\n')
print ('以排序后的順序重構(gòu)原數(shù)組')
print (x[y])
print ('\n')
print ('使用循環(huán)重構(gòu)原數(shù)組')
for i in y:
print (x[i], end = ' ')
原數(shù)組
[3 1 2]
對x調(diào)用argsort函數(shù)
[1 2 0]
以排序后的順序重構(gòu)原數(shù)組
[1 2 3]
使用循環(huán)重構(gòu)原數(shù)組
1 2 3
numpy.lexsort()
用于對多個(gè)序列進(jìn)行排序。把它想象成對電子表格進(jìn)行排序浮毯,每一列代表一個(gè)序列完疫,排序時(shí)優(yōu)先照顧靠后的列。
這里舉一個(gè)應(yīng)用場景:小升初考試债蓝,重點(diǎn)班錄取學(xué)生按照總成績錄取壳鹤。在總成績相同時(shí),數(shù)學(xué)成績高的優(yōu)先錄取饰迹,在總成績和數(shù)學(xué)成績都相同時(shí)芳誓,按照英語成績錄取…… 這里,總成績排在電子表格的最后一列蹦锋,數(shù)學(xué)成績在倒數(shù)第二列兆沙,英語成績在倒數(shù)第三列。
import numpy as np
nm = ('raju', 'anil', 'ravi', 'amar')
dv = ('f.y.', 's.y.', 's.y.', 'f.y.')
ind = np.lexsort((dv, nm))
print ('調(diào)用lexsort函數(shù)')
print (ind)
print ('\n')
print ('使用這個(gè)索引來獲取排序后的數(shù)據(jù)')
print ([nm[i] + ', ' + dv[i] for i in ind])
調(diào)用lexsort函數(shù)
[3 1 0 2]
使用這個(gè)索引來獲取排序后的數(shù)據(jù)
['amar, f.y.', 'anil, s.y.', 'raju, f.y.', 'ravi, s.y.']
上面?zhèn)魅胍粋€(gè)np.lexsort的是一個(gè)ruple, 排序是首先排nm, 順序?yàn)閍mar, anil, raju, ravi 綜上排序結(jié)果為[3 1 0 2]
msort sort_complex partition argpartition
函數(shù) | 描述 |
---|---|
msort(a) | 數(shù)組按第一個(gè)軸排序莉掂,返回排序后的數(shù)組副本葛圃。np.msort(a) 相等于 np.sort(a, axis=0)。 |
sort_complex(a) | 對復(fù)數(shù)按照先實(shí)部后虛部的順序進(jìn)行排序憎妙。 |
partition(a, kth[, axis, kind, order]) | 指定一個(gè)數(shù)库正,對數(shù)組進(jìn)行分區(qū) |
argpartition(a, kth[, axis, kind, order]) | 可以通過關(guān)鍵字 kind 指定算法沿著指定軸對數(shù)組進(jìn)行分區(qū) |
>>> import numpy as np
>>> np.sort_complex([5,3,6,2,1])
array([ 1.+0.j, 2.+0.j, 3.+0.j, 5.+0.j, 6.+0.j])
>>> np.sort_complex([1+2j, 2-1j, 3-2j, 3-3j, 3+5j])
array([ 1.+2.j, 2.-1.j, 3.-3.j, 3.-2.j, 3.+5.j])
>>>
import numpy as np
a = np.array([3,4,2,1])
print (np.partition(a,3)) # 將數(shù)組a中的所有元素(包括重復(fù)元素) 從小到大排列, 3
表示的是排序數(shù)組索引為3的數(shù)字, 比該數(shù)字小的排在該數(shù)字前面, 比該數(shù)字大的排在該數(shù)
字的后面
print (np.partition(a, (1,3))) # 小于1的在前面, 大于3的在后面, 1和3之間的在中間
'''
找到數(shù)組的第三小(index=2)的值和第二大index=-2的值
'''
arr = np.array([46,57,23,39,1,10,0,120])
print (arr[np.argpartition(arr, 2)[2]])
print (arr[np.argpartition(arr, -2)[-2]])
'''
同時(shí)找到第三和第四小的值, 注意這里用[2,3]同時(shí)將第3和第四小的排序, 然后可以分別
通過下標(biāo)[2]和[3]取得
'''
print (arr[np.argpartition(arr, [2,3])[2]])
print (arr[np.argpartition(arr, [2,3])[3]])
[2 1 3 4]
[1 2 3 4]
10
57
10
23
numpy.argmax()和numpy.argmin()
函數(shù)分別沿給定軸返回最大和最小值的索引
import numpy as np
a = np.array([[30,40,70],[80,20,10],[50,90,60]])
print ('原數(shù)組')
print (a)
print ('\n')
print ('調(diào)用argmax函數(shù)')
print (np.argmax(a))
print ('\n')
print ('展開數(shù)組')
print (a.flatten())
print ('\n')
print ('沿軸0的最大值索引')
maxindex = np.argmax(a, axis = 0)
print (maxindex)
print ('\n')
print ('沿軸1的最大值索引')
maxindex = np.argmax(a, axis = 1)
print (maxindex)
print ('\n')
print ('調(diào)用argmin函數(shù)')
minindex = np.argmin(a)
print (minindex)
print ('\n')
print ('展開數(shù)組中的最小值')
print (a.flatten()[minindex])
print ('\n')
print ('沿軸0的最小值索引')
minindex = np.argmin(a, axis = 0)
print (minindex)
print ('\n')
print ('沿軸1的最小值索引')
minindex = np.argmin(a, axis = 1)
print (minindex)
原數(shù)組
[[30 40 70]
[80 20 10]
[50 90 60]]
調(diào)用argmax函數(shù)
7
展開數(shù)組
[30 40 70 80 20 10 50 90 60]
沿軸0的最大值索引
[1 2 0]
沿軸1的最大值索引
[2 0 1]
調(diào)用argmin函數(shù)
5
展開數(shù)組中的最小值
10
沿軸0的最小值索引
[0 1 1]
沿軸1的最小值索引
[0 2 0]
numpy.nonzero()
函數(shù)返回輸入數(shù)組中非0元素的索引
import numpy as np
a = np.array([[30,40,0],[0,20,10],[50,0,60]])
print ('我們的數(shù)組是')
print (a)
print ('\n')
print ('調(diào)用nonzero函數(shù)')
print (np.nonzero(a))
我們的數(shù)組是
[[30 40 0]
[ 0 20 10]
[50 0 60]]
調(diào)用nonzero函數(shù)
(array([0, 0, 1, 1, 2, 2]), array([0, 1, 1, 2, 0, 2]))
numpy.where()
返回輸入數(shù)組中滿足給定條件的元素的索引
import numpy as np
x = np.arange(9.).reshape(3, 3)
print ('我們的數(shù)組是')
print (x)
print ('大于3的元素的索引')
y = np.where(x >3)
print (y)
print ('使用這些索引來獲取滿足條件的元素')
print (x[y])
我們的數(shù)組是
[[ 0. 1. 2.]
[ 3. 4. 5.]
[ 6. 7. 8.]]
大于3的元素的索引
(array([1, 1, 2, 2, 2]), array([1, 2, 0, 1, 2]))
使用這些索引來獲取滿足條件的元素
[ 4. 5. 6. 7. 8.]
numpy.extract()
根據(jù)某個(gè)條件從數(shù)組中抽取元素, 返回滿條件的元素
import numpy as np
x = np.arange(9.).reshape(3,3)
print ('原數(shù)組')
print (x)
# 定義條件, 選擇偶數(shù)元素
condition = np.mod(x,2) == 0
print ('按元素的條件值')
print (condition)
print ('使用條件提取元素')
print (np.extract(condition, x))
原數(shù)組
[[ 0. 1. 2.]
[ 3. 4. 5.]
[ 6. 7. 8.]]
按元素的條件值
[[ True False True]
[False True False]
[ True False True]]
使用條件提取元素
[ 0. 2. 4. 6. 8.]
numpy字節(jié)交換
在幾乎所有的機(jī)器上,多字節(jié)對象都被存儲為連續(xù)的字節(jié)序列厘唾。字節(jié)順序褥符,是跨越多字節(jié)的程序?qū)ο蟮拇鎯σ?guī)則。
- 大端模式:指數(shù)據(jù)的高字節(jié)保存在內(nèi)存的低地址中抚垃,而數(shù)據(jù)的低字節(jié)保存在內(nèi)存的高地址中喷楣,這樣的存儲模式有點(diǎn)兒類似于把數(shù)據(jù)當(dāng)作字符串順序處理:地址由小向大增加,而數(shù)據(jù)從高位往低位放鹤树;這和我們的閱讀習(xí)慣一致铣焊。
- 小端模式:指數(shù)據(jù)的高字節(jié)保存在內(nèi)存的高地址中,而數(shù)據(jù)的低字節(jié)保存在內(nèi)存的低地址中罕伯,這種存儲模式將地址的高低和數(shù)據(jù)位權(quán)有效地結(jié)合起來,高地址部分權(quán)值高追他,低地址部分權(quán)值低。
例如在 C 語言中,一個(gè)類型為 int 的變量 x 地址為 0x100朴乖,那么其對應(yīng)地址表達(dá)式&x的值為 0x100祖屏。且x的四個(gè)字節(jié)將被存儲在存儲器的 0x100, 0x101, 0x102, 0x103位置。
numpy.ndarray.byteswap()
將ndarray中每個(gè)元素中的字節(jié)進(jìn)行大小端轉(zhuǎn)換
import numpy as np
a = np.array([1, 256, 8755], dtype = np.int16)
print ('原數(shù)組')
print (a)
print ('以16進(jìn)制表示內(nèi)存中的數(shù)據(jù)')
print (map(hex, a))
# btypeswap()函數(shù)通過傳入true來原地交換
print ('調(diào)用byteswap函數(shù)')
print (a.byteswap(True))
print ('16進(jìn)制')
print (map(hex, a))
# 字節(jié)交換
原數(shù)組
[ 1 256 8755]
以16進(jìn)制表示內(nèi)存中的數(shù)據(jù)
<map object at 0x7fc8ff886898>
調(diào)用byteswap函數(shù)
[ 256 1 13090]
16進(jìn)制
<map object at 0x7fc8fa7d2ef0>
副本和視圖(深拷貝和淺拷貝)
副本是一個(gè)數(shù)據(jù)的完整的拷貝买羞,如果我們對副本進(jìn)行修改袁勺,它不會影響到原始數(shù)據(jù),物理內(nèi)存不在同一位置畜普。
視圖是數(shù)據(jù)的一個(gè)別稱或引用期丰,通過該別稱或引用亦便可訪問、操作原有數(shù)據(jù)吃挑,但原有數(shù)據(jù)不會產(chǎn)生拷貝钝荡。如果我們對視圖進(jìn)行修改,它會影響到原始數(shù)據(jù)舶衬,物理內(nèi)存在同一位置埠通。
視圖一般發(fā)生在:
- 1、numpy 的切片操作返回原數(shù)據(jù)的視圖逛犹。
- 2端辱、調(diào)用 ndarray 的 view() 函數(shù)產(chǎn)生一個(gè)視圖。
副本一般發(fā)生在:
- Python 序列的切片操作虽画,調(diào)用deepCopy()函數(shù)舞蔽。
- 調(diào)用 ndarray 的 copy() 函數(shù)產(chǎn)生一個(gè)副本。
無復(fù)制
簡單的賦值不會創(chuàng)建數(shù)組對象的副本狸捕。 相反喷鸽,它使用原始數(shù)組的相同id()來訪問它。 id()返回 Python 對象的通用標(biāo)識符灸拍,類似于 C 中的指針做祝。
此外砾省,一個(gè)數(shù)組的任何變化都反映在另一個(gè)數(shù)組上。 例如混槐,一個(gè)數(shù)組的形狀改變也會改變另一個(gè)數(shù)組的形狀编兄。
矩陣(Matrix)
NumPy 中包含了一個(gè)矩陣庫 numpy.matlib,該模塊中的函數(shù)返回的是一個(gè)矩陣声登,而不是 ndarray 對象狠鸳。
一個(gè) [圖片上傳失敗...(image-bf5fd9-1581603303589)]的矩陣是一個(gè)由[圖片上傳失敗...(image-49809c-1581603303589)]行(row)[圖片上傳失敗...(image-3e2b2c-1581603303589)]列(column)元素排列成的矩形陣列。
矩陣?yán)锏脑乜梢允菙?shù)字悯嗓、符號或數(shù)學(xué)式件舵。以下是一個(gè)由 6 個(gè)數(shù)字元素構(gòu)成的 2 行 3 列的矩陣:
[圖片上傳失敗...(image-6461e6-1581603303589)]
matlib.empty()
返回一個(gè)新矩陣
numpy.matlib.empty(shape, dtype, order)
shape
定義新矩陣的整數(shù)或 整數(shù)元組
dtype
可選, 數(shù)據(jù)類型
order
c或者f
import numpy.matlib
import numpy as np
print (np.matlib.empty((2,2)))
# 填充為隨機(jī)數(shù)
[[ 6.91000091e-310 4.68077452e-310]
[ 6.90999951e-310 0.00000000e+000]]
numpy.matlib.zeros()
創(chuàng)建一個(gè)以0填充的矩陣
import numpy.matlib
import numpy as np
print (np.matlib.zeros((2,2)))
[[ 0. 0.]
[ 0. 0.]]
numpy.matlib.ones()
創(chuàng)建一個(gè)以1填充的矩陣
numpy.matlib.ones((2,2))
numpy.matlib.eye()
返回一個(gè)矩陣, 對角元素為1, 其他位置為0
numpy.matlib.eye(n, M, k, dtype)
n
返回矩陣的行數(shù)
M
返回矩陣的列數(shù), 默認(rèn)為n
k
對角線的索引
dtype
數(shù)據(jù)類型
import numpy.matlib
import numpy as np
print (np.matlib.eye(n = 3, M = 4, k = 0, dtype = float))
[[ 1. 0. 0. 0.]
[ 0. 1. 0. 0.]
[ 0. 0. 1. 0.]]
numpy.matlib.identity()
返回給定大小的單位矩陣
單位矩陣是個(gè)方陣, 從左上角到右下角的對角線(稱為主對角線)上的元素均為1, 除此以外全都為0
import numpy.matlib
import numpy as np
print (np.matlib.identity(5, dtype = float))
# 大小為5, 類型為浮點(diǎn)數(shù)
[[ 1. 0. 0. 0. 0.]
[ 0. 1. 0. 0. 0.]
[ 0. 0. 1. 0. 0.]
[ 0. 0. 0. 1. 0.]
[ 0. 0. 0. 0. 1.]]
numpy.matlib.rand()
創(chuàng)建一個(gè)給定大小的矩陣, 數(shù)據(jù)是隨機(jī)填充的
numpy.matlib.rand(3,3)
矩陣是二維的, ndarray是一個(gè)n維數(shù)組, 兩個(gè)對象是可互換的
import numpy.matlib
import numpy as np
i = np.matrix('1,2;3,4')
print (i)
[[1 2]
[3 4]]
j = np.asarray(i)
print (j)
[[1 2]
[3 4]]
k = np.asmatrix(j)
print (k)
[[1 2]
[3 4]]
線性代數(shù)
NumPy 提供了線性代數(shù)函數(shù)庫 linalg,該庫包含了線性代數(shù)所需的所有功能脯厨,可以看看下面的說明:
函數(shù) | 描述 |
---|---|
dot |
兩個(gè)數(shù)組的點(diǎn)積铅祸,即元素對應(yīng)相乘。 |
vdot |
兩個(gè)向量的點(diǎn)積 |
inner |
兩個(gè)數(shù)組的內(nèi)積 |
matmul |
兩個(gè)數(shù)組的矩陣積 |
determinant |
數(shù)組的行列式 |
solve |
求解線性矩陣方程 |
inv |
計(jì)算矩陣的乘法逆矩陣 |
numpy.dot()
numpy.dot() 對于兩個(gè)一維的數(shù)組合武,計(jì)算的是這兩個(gè)數(shù)組對應(yīng)下標(biāo)元素的乘積和(數(shù)學(xué)上稱之為內(nèi)積)临梗;對于二維數(shù)組,計(jì)算的是兩個(gè)數(shù)組的矩陣乘積稼跳;對于多維數(shù)組盟庞,它的通用計(jì)算公式如下,即結(jié)果數(shù)組中的每個(gè)元素都是:數(shù)組a的最后一維上的所有元素與數(shù)組b的倒數(shù)第二位上的所有元素的乘積和: dot(a, b)[i,j,k,m] = sum(a[i,j,:] * b[k,:,m])汤善。
numpy.dot(a, b, out=None)
a
ndarray數(shù)組
b
ndarray 數(shù)組
out
ndarray 可選用來保存dot()的計(jì)算結(jié)果
import numpy.matlib
import numpy as np
a = np.array([[1,2],[3,4]])
b = np.array([[11,12],[13,14]])
print (np.dot(a, b))
[[37 40]
[85 92]]
計(jì)算公式
[[1*11+2*13, 1*12+2*14],[3*11+4*13, 3*12+4*14]]
numpy.vdot()
兩個(gè)向量的點(diǎn)積, 如果第一個(gè)參數(shù)是復(fù)數(shù), 那么它的共軛復(fù)數(shù)用于計(jì)算, 如果參數(shù)是多維數(shù)組, 他會被展開
import numpy as np
a = np.array([[1,2], [3, 4]])
b = np.array([[11, 12], [13, 14]])
# vdot 將數(shù)組展開計(jì)算內(nèi)積
print (np.vdot(a, b))
130
計(jì)算公式
1*11 + 2*12 + 3*13 + 4*14 = 130
numpy.inner()
返回一維數(shù)組的向量內(nèi)積, 對于更高的維度, 返回最后一個(gè)軸上的和的乘積
import numpy as np
print (np.inner(np.array([1,2,3]), np.array([0, 1,0])))
# 等價(jià)于1*0+2*1+3*0
2
多維數(shù)組::
import numpy as np
a = np.array([[1,2], [3, 4 ]])
print ('數(shù)組a')
print (a)
b = np.array([[11, 22], [13, 14]])
print ('數(shù)組b')
print (b)
print ('內(nèi)積')
print (np.inner(a, b))
數(shù)組a
[[1 2]
[3 4]]
數(shù)組b
[[11 22]
[13 14]]
內(nèi)積
[[ 55 41]
[121 95]]
1*11+2*12, 1*13+2*14
3*11+4*12, 3*13+4*14
numpy.matmul
numpy.matmul 函數(shù)返回兩個(gè)數(shù)組的矩陣乘積什猖。 雖然它返回二維數(shù)組的正常乘積,但如果任一參數(shù)的維數(shù)大于2萎津,則將其視為存在于最后兩個(gè)索引的矩陣的棧卸伞,并進(jìn)行相應(yīng)廣播。
另一方面锉屈,如果任一參數(shù)是一維數(shù)組荤傲,則通過在其維度上附加 1 來將其提升為矩陣,并在乘法之后被去除颈渊。
對于二維數(shù)組遂黍,它就是矩陣乘法:
import numpy.matlib
import numpy as np
a = [[1, 0], [0, 1]]
b = [[4, 1], [2, 2]]
print (np.matmul(a,b))
[[4 1]
[2 2]]
二維和一維運(yùn)算
import numpy.matlib
import numpy as np
a = [[1, 0], [0, 1]]
b = [1, 2]
print (np.matmul(a, b))
print (np.matmul(b, a))
[1 2]
[1 2]
維度大于二
import numpy.matlib
import numpy as np
a = np.arange(8).reshape(2,2,2)
b = np.arange(4).reshape(2,2)
print (np.matmul(a, b))
[[[ 2 3]
[ 6 11]]
[[10 19]
[14 27]]]
numpy.linalg.det()
numpy.linalg.det() 函數(shù)計(jì)算輸入矩陣的行列式。
行列式在線性代數(shù)中是非常有用的值俊嗽。 它從方陣的對角元素計(jì)算雾家。 對于 2×2 矩陣,它是左上和右下元素的乘積與其他兩個(gè)的乘積的差绍豁。
換句話說芯咧,對于矩陣[[a,b],[c敬飒,d]]邪铲,行列式計(jì)算為 ad-bc。 較大的方陣被認(rèn)為是 2×2 矩陣的組合无拗。
import numpy as np
a = np.array([[1, 2], [3, 4]])
print (np.linalg.det(a))
-2.0
import numpy as np
b = np.array([[6, 1, 1], [4, -2, 5], [2, 8, 7]])
print (b)
print (np.linalg.det(b))
print (6*(-2*7 - 5*8) - 1*(4*7 - 5*2) + 1*(4*8 - -2*2))
[[ 6 1 1]
[ 4 -2 5]
[ 2 8 7]]
-306.0
-306
numpy.linalg.solve()
給出了矩陣形式的線性方程的解
x + y + z = 6
2y + 5z = -4
2x + 5y - z = 27
如果矩陣成為A, X和B方程變?yōu)?/p>
AX = B
或
X = A^(-1)B
numpy.linalg.inv()
numpy.linalg.inv() 函數(shù)計(jì)算矩陣的乘法逆矩陣带到。
逆矩陣(inverse matrix):設(shè)A是數(shù)域上的一個(gè)n階矩陣,若在相同數(shù)域上存在另一個(gè)n階矩陣B英染,使得: AB=BA=E 揽惹,則我們稱B是A的逆矩陣,而A則被稱為可逆矩陣四康。注:E為單位矩陣搪搏。
import numpy as np
x = np.array([[1, 2], [3, 4]])
y = np.linalg.inv(x)
print (x)
print (y)
print (np.dot(x, y))
[[1 2]
[3 4]]
[[-2. 1. ]
[ 1.5 -0.5]]
[[ 1.00000000e+00 1.11022302e-16]
[ 0.00000000e+00 1.00000000e+00]]
import numpy as np
a = np.array([[1,1,1], [0, 2,5 ], [2,5,-1]])
print ("數(shù)組a")
print (a)
ainv = np.linalg.inv(a)
print ('a的逆矩陣')
print (ainv)
print ('矩陣b')
b = np.array([[6],[-4],[27]])
print (b)
print ('計(jì)算a^(-1)b')
x = np.linalg.solve(a, b)
print (x)
# 線性方向x=5 y=3 z=-2的解
數(shù)組a
[[ 1 1 1]
[ 0 2 5]
[ 2 5 -1]]
a的逆矩陣
[[ 1.28571429 -0.28571429 -0.14285714]
[-0.47619048 0.14285714 0.23809524]
[ 0.19047619 0.14285714 -0.0952381 ]]
矩陣b
[[ 6]
[-4]
[27]]
計(jì)算a^(-1)b
[[ 5.]
[ 3.]
[-2.]]
x = np.dot(ainv, b)
numpy IO
可以讀寫磁盤上的文本數(shù)據(jù)或者二進(jìn)制數(shù)據(jù). 為ndarray對象引入了一個(gè)簡單的文本格式, npy
npy文件用于存儲重建ndarray所需的數(shù)據(jù), 圖形, dtype和其他信息.
常用IO函數(shù)有:
- load() 和 save() 函數(shù)是讀寫文件數(shù)組數(shù)據(jù)的兩個(gè)主要函數(shù),默認(rèn)情況下闪金,數(shù)組是以未壓縮的原始二進(jìn)制格式保存在擴(kuò)展名為 .npy 的文件中慕嚷。
- savze() 函數(shù)用于將多個(gè)數(shù)組寫入文件,默認(rèn)情況下毕泌,數(shù)組是以未壓縮的原始二進(jìn)制格式保存在擴(kuò)展名為 .npz 的文件中。
- loadtxt() 和 savetxt() 函數(shù)處理正常的文本文件(.txt 等)
numpy.save()
將數(shù)組保存到以.npy為擴(kuò)展名的文件中
numpy.save(file, arr, allow_pickle=True, fix_imports=True)
- file:要保存的文件嗅辣,擴(kuò)展名為 .npy撼泛,如果文件路徑末尾沒有擴(kuò)展名 .npy,該擴(kuò)展名會被自動(dòng)加上澡谭。
- arr: 要保存的數(shù)組
- allow_pickle: 可選愿题,布爾值,允許使用 Python pickles 保存對象數(shù)組蛙奖,Python 中的 pickle 用于在保存到磁盤文件或從磁盤文件讀取之前潘酗,對對象進(jìn)行序列化和反序列化。
- fix_imports: 可選雁仲,為了方便 Pyhton2 中讀取 Python3 保存的數(shù)據(jù)仔夺。
import numpy as np
a = np.array([1,2,3,4,5])
# 保存到outfile.npy文件上
np.save('outfile.npy', a)
# 保存到outfile2.npy文件上, 如果文件 路徑末尾沒有.npy, 則會自動(dòng)加上
np.save('outfile2', a)
pig@deep:~/Desktop/note/python/numpy$ cat outfile.npy
?NUMPY?F{'descr': '<i8', 'fortran_order': False, 'shape': (5,), }
????pig@deep:~/Desktop/note/python/numpy$ cat outfile2.npy
?NUMPY?F{'descr': '<i8', 'fortran_order': False, 'shape': (5,), }
????p
可以看出文件是亂碼的,因?yàn)樗鼈兪?Numpy 專用的二進(jìn)制格式后的數(shù)據(jù)攒砖。
我們可以使用 load() 函數(shù)來讀取數(shù)據(jù)就可以正常顯示了:
import numpy as np
b = np.load('outfile.npy')
print (b)
[1 2 3 4 5]
numpy.savez
將多個(gè)數(shù)組保存到以npz為拓展名的文件中
numpy.savez(file, *arg, **kwds)
- file:要保存的文件缸兔,擴(kuò)展名為 .npz,如果文件路徑末尾沒有擴(kuò)展名 .npz吹艇,該擴(kuò)展名會被自動(dòng)加上惰蜜。
- args: 要保存的數(shù)組,可以使用關(guān)鍵字參數(shù)為數(shù)組起一個(gè)名字受神,非關(guān)鍵字參數(shù)傳遞的數(shù)組會自動(dòng)起名為 arr_0, arr_1, … 抛猖。
- kwds: 要保存的數(shù)組使用關(guān)鍵字名稱。
import numpy as np
a = np.array([[1,2,3], [4,5,6]])
b = np.arange(0,1.0,0.1)
c = np.sin(b)
# c使用了關(guān)鍵字參數(shù)sin_array
np.savez('savez.npz', a, b, sin_array = c)
r = np.load('savez.npz')
print (r.files) # 查看個(gè)數(shù)組名稱
print (r['arr_0']) # 數(shù)組a
print (r['arr_1'])
print (r['sin_array']) # 數(shù)組c
['arr_1', 'sin_array', 'arr_0']
[[1 2 3]
[4 5 6]]
[ 0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]
[ 0. 0.09983342 0.19866933 0.29552021 0.38941834 0.47942554
0.56464247 0.64421769 0.71735609 0.78332691]
savetxt()
是以簡單的文本格式存儲數(shù)據(jù) , 對應(yīng)的使用loadtxt函數(shù)來獲取數(shù)據(jù)
np.loadtxt(FILENAME, dtype=int, delimiter='')
np.savetxt(FILENAME, a, fmt='%d', delimiter=",")
delimiter可以指定各種分隔符, 針對特定列的轉(zhuǎn)換器函數(shù), 需要跳過的行數(shù)等.
import numpy as np
a = np.array([1,2,3,4,5])
np.savetxt('out.txt', a)
b = np.loadtxt('out.txt')
print (b)
[ 1. 2. 3. 4. 5.]
使用delimiter參數(shù):
import numpy as np
a = np.arange(0, 10, 0.5).reshape(4,-1)
np.savetxt('out2.txt', a, fmt="%d", delimiter="*") # 改為保存整數(shù), 以逗號分隔
b = np.loadtxt("out2.txt", delimiter="*") # load時(shí)也要指定為相同符號分隔
print (b)
[[ 0. 0. 1. 1. 2.]
[ 2. 3. 3. 4. 4.]
[ 5. 5. 6. 6. 7.]
[ 7. 8. 8. 9. 9.]]
matplotlib
Matplotlib 是 Python 的繪圖庫。 它可與 NumPy 一起使用财著,提供了一種有效的 MatLab 開源替代方案联四。 它也可以和圖形工具包一起使用,如 PyQt 和 wxPython瓢宦。
wim下安裝matplotlib:
python -m pip install -U pip setuptools
python -m pip install matplotlib
linux下:
sudo apt-get install python-matplotlib
mac:
sudo python -mpip install matplotlib
查看是否安裝完成:
python -m pip list | grep matplotlib
matplotlib 2.2.4
實(shí)例
import numpy as np
from matplotlib import pyplot as plt
x = np.arange(1,11)
y = 2 * x + 5
plt.title("test demo")
plt.xlabel("x axis caption")
plt.ylabel("y axis caption")
plt.plot(x, y)
plt.show()
以上實(shí)例中, np.arange()函數(shù)創(chuàng)建x軸上的值, y軸上對應(yīng)值存儲在另一個(gè)數(shù)組對象y中, 這些值使用matplotlib軟件包的pyplot子模塊plot()函數(shù)來繪制, 由show()函數(shù)來顯示
圖形中文顯示
默認(rèn)情況下不支持中文, 可以使用以下方法(下載字體)https://www.fontpalace.com/font-details/SimHei/
SimHei.ttf文件放在當(dāng)前執(zhí)行的代碼文件中.
import numpy as np
from matplotlib import pyplot as plt
import matplotlib
# fname 為 你下載的字體庫路徑碎连,注意 SimHei.ttf 字體的路徑
zhfont1 = matplotlib.font_manager.FontProperties(fname="SimHei.ttf")
x = np.arange(1,11)
y = 2 * x + 5
plt.title("測試", fontproperties=zhfont1)
# fontproperties 設(shè)置中文顯示,fontsize 設(shè)置字體大小
plt.xlabel("x 軸", fontproperties=zhfont1)
plt.ylabel("y 軸", fontproperties=zhfont1)
plt.plot(x,y)
plt.show()
此外還可以使用系統(tǒng)字體:
from matplotlib import pyplot as plt
import matplotlib
a = sorted([f.name for f in matplotlib.font_manager.fontManager.ttflist])
for i in a:
print (i)
打印出你的font_manage的ttflist中所有注冊的名字, 找一個(gè)看中文字體例如:STFangsong(仿宋)然后添加以下代碼即可:
plt.rcParams['font.family']=['STFangsong']
實(shí)例:
import numpy as np
from matplotlib import pyplot as plt
import matplotlib
# 導(dǎo)入系統(tǒng)字體庫
plt.rcParams['font.family']=['CESI_HT_GB18030']
x = np.arange(0, 2 * np.pi, 0.001)
y = np.sin(x)
plt.title("測試")
plt.xlabel("x軸")
plt.ylabel("y軸")
plt.plot(x, y)
plt.show()
作為線性圖的替代驮履,可以通過向 plot() 函數(shù)添加格式字符串來顯示離散值鱼辙。 可以使用以下格式化字符。
字符 | 描述 |
---|---|
'-' |
實(shí)線樣式 |
'--' |
短橫線樣式 |
'-.' |
點(diǎn)劃線樣式 |
':' |
虛線樣式 |
'.' |
點(diǎn)標(biāo)記 |
',' |
像素標(biāo)記 |
'o' |
圓標(biāo)記 |
'v' |
倒三角標(biāo)記 |
'^' |
正三角標(biāo)記 |
'<' |
左三角標(biāo)記 |
'>' |
右三角標(biāo)記 |
'1' |
下箭頭標(biāo)記 |
'2' |
上箭頭標(biāo)記 |
'3' |
左箭頭標(biāo)記 |
'4' |
右箭頭標(biāo)記 |
's' |
正方形標(biāo)記 |
'p' |
五邊形標(biāo)記 |
'*' |
星形標(biāo)記 |
'h' |
六邊形標(biāo)記 1 |
'H' |
六邊形標(biāo)記 2 |
'+' |
加號標(biāo)記 |
'x' |
X 標(biāo)記 |
'D' |
菱形標(biāo)記 |
'd' |
窄菱形標(biāo)記 |
'|' |
豎直線標(biāo)記 |
'_' |
水平線標(biāo)記 |
以下是顏色的縮寫:
字符 | 顏色 |
---|---|
'b' |
藍(lán)色 |
'g' |
綠色 |
'r' |
紅色 |
'c' |
青色 |
'm' |
品紅色 |
'y' |
黃色 |
'k' |
黑色 |
'w' |
白色 |
要顯示圓來代表點(diǎn)玫镐,而不是上面示例中的線倒戏,請使用 ob 作為 plot() 函數(shù)中的格式字符串。
import numpy as np
from matplotlib import pyplot as plt
x = np.arange(0, 2 * np.pi, 0.1)
y = np.cos(x)
plt.title("sin")
plt.xlabel("x axis caption")
plt.ylabel("y axis caption")
plt.plot(x, y, ".b")
plt.show()
繪制正弦波
import numpy as np
import matplotlib.pyplot as plt
x = np.arange(0, 3 * np.pi, 0.1)
y = np.sin(x)
plt.title("sine")
plt.plot(x, y, '.b')
plt.show()
subplot()
允許在同一圖中繪制不同的東西
正弦余弦
import numpy as np
import matplotlib.pyplot as plt
# 計(jì)算正弦和余弦曲線上的點(diǎn)x和y坐標(biāo)
x = np.arange(0, 2 * np.pi, 0.1)
y_sin = np.sin(x)
y_cos = np.cos(x)
# 建立subplot網(wǎng)格 高為1, 寬為2
# 激活第一個(gè)subplot
plt.subplot(1, 2, 1)
# 繪制第一個(gè)圖像
plt.plot(x, y_sin)
plt.title("sine")
# 激活第二個(gè)subplot并繪制第二個(gè)圖像
plt.subplot(1, 2, 2)
plt.plot(x, y_cos)
plt.title("cosine")
# 展示圖像
plt.show()
plt.subplot(1,2,1)
不同參數(shù)的區(qū)別
bar()
pyplot 子模塊提bar()函數(shù)來生成條形圖
實(shí)現(xiàn)兩組x 和y數(shù)組的條形圖
import matplotlib.pyplot as plt
x = [5, 8, 10]
y = [12, 16, 6]
x2 = [6, 9, 11]
y2 = [6, 15, 7]
plt.bar(x, y, align = 'center')
plt.bar(x2, y2, color = 'g', align = 'center')
plt.title('bar graph')
plt.ylabel('Y axis')
plt.xlabel('x axis')
plt.show()
numpy.histogram()
是數(shù)據(jù)頻率分布的圖形表示, 水平尺寸相等的矩形對應(yīng)于類間隔, 稱為bin, 變量height對應(yīng)與頻率
將輸入數(shù)組和bin作為兩個(gè)參數(shù), bin數(shù)組中連續(xù)元素用作每個(gè)bin的邊界
a = np.array([22,87,5,43,56,73,55,54,11,20,51,5,79,31,27])
np.histogram(a,bins = [0,20,40,60,80,100])
hist,bins = np.histogram(a,bins = [0,20,40,60,80,100])
print (hist)
print (bins)
[3 4 5 2 1]
[ 0 20 40 60 80 100]
plt()
Matplotlib 可以將直方圖的數(shù)字表示轉(zhuǎn)換為圖形恐似。 pyplot 子模塊的 plt() 函數(shù)將包含數(shù)據(jù)和 bin 數(shù)組的數(shù)組作為參數(shù)杜跷,并轉(zhuǎn)換為直方圖。
from matplotlib import pyplot as plt
import numpy as np
a = np.array([22,87,5,43,56,73,55,54,11,20,51,5,79,31,27])
plt.hist(a, bins = [0,20,40,60,80,100])
plt.title("histogram")
plt.show()