這個(gè)系列主要集中在python做科學(xué)計(jì)算的Numpy器贩、Scipy等庫,當(dāng)然原汁原味的知識(shí)才是最好的啸盏,請(qǐng)查看https://docs.scipy.org/
Numpy系列包含ndarray栗竖、ufunc驾胆、矩陣運(yùn)算和文件存取
Numpy主要包含兩種數(shù)據(jù)結(jié)構(gòu):Array和Matrix,以及對(duì)應(yīng)的的Ufunc函數(shù)
1. 安裝numpy
#終端命令 或用canda跛锌,以包含numpy弃秆、scipy等
sudo pip install numpy
2. 導(dǎo)入numpy
import numpy as np
3. 創(chuàng)建對(duì)象
Numpy最主要的對(duì)象是均勻的多維數(shù)組,我們可以通過給array函數(shù)傳遞Python的序列對(duì)象創(chuàng)建數(shù)組髓帽,如果傳遞的是多層嵌套的序列菠赚,將創(chuàng)建多維數(shù)組。Numpy的array類叫做ndarray郑藏,也就是通常說的array锈至,numpy.array與python的array.array是不同的,它僅提供一維數(shù)組和少量函數(shù)译秦。
3.1 ndarray最常用的屬性
- ndarray.ndim
--array的維數(shù)峡捡,及數(shù)組維數(shù),python中被稱為秩rank - ndarray.shape
--array的每個(gè)維度的長度筑悴,及各個(gè)維度數(shù)組的長度们拙,是一個(gè)tuple,eg:(4, 5),tuple的長度即為rank - ndarray.size
--array的元素個(gè)數(shù) - ndarray.dtype
--array元素的類型阁吝,常見的numpy.int64, numpy.int32, numpy.int16, numpy.float64, Numpy默認(rèn)數(shù)據(jù)類型為numpy.int64(不同版本會(huì)有區(qū)別) - ndarray.itemsize
--array元素的字節(jié)長砚婆,例如,float64為8字節(jié)(=64/8)突勇,complex32為4字節(jié) (=32/8). 它等同于ndarray.dtype.itemsize. - ndarray.data
--緩存中存有的實(shí)際array元素装盯,一般不用這個(gè)屬性對(duì)array進(jìn)行索引取值
# 采用python list, numpy默認(rèn)dtype為int64,默認(rèn)的dtype不顯示
>>>a = np.array([[1, 2, 3], [4, 5, 6]])
>>>a
array([[1, 2, 3],
[4, 5, 6]])
# 下面返回一個(gè)tuple
>>>a.ndim, a.shape, a.size, a.dtype, a.itemsize
(2, (2, 3), 6, dtype('int64'), 8)
>>>a.data
<read-write buffer for 0x7f79d8655c60, size 48, offset 0 at 0x7f79d8647e30>
# 利用reshape函數(shù)可以修改array尺寸產(chǎn)生新array甲馋,總elements不變
>>>a.reshape(3,2)
array([[1, 2],
[3, 4],
[5, 6]])
3.2 創(chuàng)建array對(duì)象—根據(jù)python序列對(duì)象和數(shù)據(jù)類型創(chuàng)建
# 一種參考3.1的例子埂奈,第二種是python對(duì)象: list + float
>>>b = np.array([[1, 2, 3], [4, 5, 6.0]])
>>>b
array([[ 1., 2., 3.],
[ 4., 5., 6.]])
# python tuple + float
>>>np.array((1, 2, 3.1))
array([ 1. , 2. , 3.1])
# python 混合對(duì)象 list+tuple
>>>np.array(([1, 2, 3], (4, 5, 6)))
array([[1, 2, 3],
[4, 5, 6]])
# 創(chuàng)建2維array對(duì)象,Minimum dimensions 2定躏,等同 np.array([[1, 2, 3]])
>>>np.array([1, 2, 3], ndmin=2)
array([[1, 2, 3]])
# 復(fù)數(shù)類型
>>>np.array([1, 2, 3], dtype=complex)
array([ 1.+0.j, 2.+0.j, 3.+0.j])
# 自定義數(shù)據(jù)類型 字節(jié)順序:>為big-edian <為little-endian账磺, i4:int32,及4個(gè)字節(jié)
>>>x = np.array([(1, 2), (3, 4), (5, 6)],dtype=[('a','<i4'),('b','<i8')])
>>>x['a']
array([1, 3, 5], dtype=int32)
# Numpy默認(rèn)類型為int64
>>>x['b']
array([2, 4, 6])
>>>x['b'].dtype
dtype('int64')
3.3 創(chuàng)建matrix對(duì)象 / matrix轉(zhuǎn)為array對(duì)象
# 同樣可以用 python對(duì)象來創(chuàng)建
>>>np.mat([(1,2),(3,4)])
matrix([[1, 2],
[3, 4]])
# 芹敌!可以用數(shù)值字符串創(chuàng)建matrix, 并將其轉(zhuǎn)為array對(duì)象
>>>np.array(np.mat('1 2; 3 4'))
array([[1, 2],
[3, 4]])
# 用數(shù)值字符串創(chuàng)建array,整體仍為字符類型的一個(gè)元素
>>>np.array(('1 2;3 4', 'a'))
array(['1 2;3 4', 'a'], dtype='|S7')
# 仍為matrix對(duì)象
>>>np.array(np.mat('1 2; 3 4'), subok=True)
matrix([[1, 2],
[3, 4]])
3.4 利用函數(shù)創(chuàng)建array對(duì)象
Numpy專門提供了很多函數(shù)來創(chuàng)建數(shù)組垮抗,常用的有arange氏捞、linspace、logspace冒版、zeros液茎、ones、empty等函數(shù)通過數(shù)值創(chuàng)建數(shù)組(類同matlab)辞嗡,以及frombuffer, fromstring, fromfile等函數(shù)可以從字節(jié)序列創(chuàng)建數(shù)組豁护,還可以通過fromfunction來通過函數(shù)創(chuàng)建數(shù)組.
3.4.1 通過arange、linspace欲间、logspace等函數(shù)創(chuàng)建數(shù)組
arange與linspace最主要的區(qū)別是楚里,arange第三個(gè)參數(shù)為step,linspace/logspace第三個(gè)參數(shù)為元素個(gè)數(shù)
- arange函數(shù)類似于python的range函數(shù)猎贴,通過指定開始值班缎、終值和步長來創(chuàng)建一維數(shù)組,注意數(shù)組不包括終值:
>>>np.arange(0, 1, 0.1)
array([ 0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9])
- linspace函數(shù)通過指定開始值她渴、終值和元素個(gè)數(shù)來創(chuàng)建一維數(shù)組达址,可以通過endpoint關(guān)鍵字指定是否包括終值,缺省設(shè)置是包括終值:
# linspace在生成數(shù)組需計(jì)算好數(shù)組的size趁耗,生成類似range步長的數(shù)組通常size比range()的大1,
# 或者將終值設(shè)為range()終值-step. 最后一個(gè)等同于 np.arange(0, 1, 0.1)
>>>np.linspace(0, 1, 10), np.linspace(0, 1, 11), np.linspace(0, 0.9, 10)
(array([ 0. , 0.11111111, 0.22222222, 0.33333333, 0.44444444,
0.55555556, 0.66666667, 0.77777778, 0.88888889, 1. ]),
array([ 0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. ]),
array([ 0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]))
- logspace函數(shù)和linspace類似沉唠,不過它創(chuàng)建等比數(shù)列,下面的例子產(chǎn)生1(100)到100(102)苛败、有20個(gè)元素的等比數(shù)列:
>>>np.logspace(0, 2, 20)
array([ 1. , 1.27427499, 1.62377674, 2.06913808,
2.6366509 , 3.35981829, 4.2813324 , 5.45559478,
6.95192796, 8.8586679 , 11.28837892, 14.38449888,
18.32980711, 23.35721469, 29.76351442, 37.92690191,
48.32930239, 61.58482111, 78.47599704, 100. ])
# 可以指定dtype
>>>np.zeros( (3,4) )
array([[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.]])
>>>np.ones( (2,3,4), dtype=np.int16 )
array([[[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1]],
[[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1]]], dtype=int16)
>>>np.empty( (2,3) )
array([[ 6.92492661e-310, 6.92492661e-310, 9.01700787e+223],
[ 3.42702482e-062, 1.12958007e+277, 7.28193369e+223]])
3.4.2 通過frombuffer, fromstring, fromfile等函數(shù)從字節(jié)序列創(chuàng)建array满葛,以fromstring為例
# Python的字符串實(shí)際上是字節(jié)序列,每個(gè)字符占一個(gè)字節(jié)罢屈,
# 因此如果從字符串s創(chuàng)建一個(gè)8bit的整數(shù)數(shù)組的話嘀韧,所得到的數(shù)組正好就是字符串中每個(gè)字符的ASCII編碼
s = 'abcdefgh'
>>>>np.fromstring(s, dtype=np.int8), np.fromstring(s, dtype=np.int64),
np.fromstring(s, dtype=np.float64)
(array([ 97, 98, 99, 100, 101, 102, 103, 104], dtype=int8),
array([7523094288207667809]),
array([ 8.54088322e+194]))
3.4.3 通過fromfunction創(chuàng)建array
# 創(chuàng)建 9×9 乘法表, 是不是很類似與 裝飾器缠捌?
>>>def multi_2(i, j):
return (i+1) * (j+1)
>>>c = np.fromfunction(multi_2, (9,9))
>>>c
array([[ 1., 2., 3., 4., 5., 6., 7., 8., 9.],
[ 2., 4., 6., 8., 10., 12., 14., 16., 18.],
[ 3., 6., 9., 12., 15., 18., 21., 24., 27.],
[ 4., 8., 12., 16., 20., 24., 28., 32., 36.],
[ 5., 10., 15., 20., 25., 30., 35., 40., 45.],
[ 6., 12., 18., 24., 30., 36., 42., 48., 54.],
[ 7., 14., 21., 28., 35., 42., 49., 56., 63.],
[ 8., 16., 24., 32., 40., 48., 56., 64., 72.],
[ 9., 18., 27., 36., 45., 54., 63., 72., 81.]])
Numpy彌補(bǔ)了Python自身的array的大量不足锄贷,為Python提供了數(shù)值計(jì)算的基礎(chǔ)庫,衍生出了大量做大數(shù)據(jù)分析的庫曼月,這奠定了Python做大數(shù)據(jù)分析的地位谊却,也是在機(jī)器學(xué)習(xí)、深度學(xué)習(xí)逐漸進(jìn)入應(yīng)用領(lǐng)域中最常用的語言哑芹,趕快摟起袖子加油干炎辨!
Enjoy it~