NumPy是機(jī)器學(xué)習(xí)中最常用的計(jì)算科學(xué)庫(kù)缩挑,今天就來(lái)看看吧
NumPy簡(jiǎn)單介紹
- NumPy的簡(jiǎn)單介紹:
- NumPy是機(jī)器學(xué)習(xí)中一個(gè)數(shù)據(jù)分析的核心基礎(chǔ)庫(kù)幻锁;
- NumPy中最核心的數(shù)據(jù)類型就是
NumPy數(shù)組
(類似于MatLab中的矩陣)通铲,要求這個(gè)數(shù)組中的數(shù)據(jù)的數(shù)據(jù)類型必須保持一致惹想; - 底層使用C栓辜、C++卜范,F(xiàn)orturn語(yǔ)言實(shí)現(xiàn)刹悴,所以運(yùn)算的效率是非常高的行楞;
- NumPy的主要內(nèi)容:
- NumPy數(shù)組的初始化;
- 花式索引土匀,即高階數(shù)組索引子房;
- 隨機(jī)數(shù)組的生成
NumPy數(shù)組的使用:
-
NumPy數(shù)組的初始化:同一個(gè)NumPy數(shù)組中數(shù)據(jù)的數(shù)據(jù)類型最好保持一致:
- 1維數(shù)組:
import numpy as np arr1 = np.array([1, 2, 3, 4, 5]) # type(arr1)=numpy.ndarray(n dimension array) arr2 = np.array((1, 2, 3, 4, 5))
- 即使使用元組的方式創(chuàng)建一個(gè)數(shù)組,那么最終會(huì)自動(dòng)轉(zhuǎn)化成列表的形式
- 2維數(shù)組:
import numpy as np arr1 = np.array(<list>) arr2 = np.array(<list>)
- 初始化的時(shí)候給定數(shù)據(jù)類型
arr = np.array(<list>, dtype=int)
- 其中dtype可以是:bool就轧,int证杭,float,str妒御,np.float32解愤,np.float64,np.int32乎莉,np.int64···
- 生成一個(gè)新的數(shù)組返回
- 使用已經(jīng)存在的NumPy數(shù)組初始化一個(gè)新的NumPy數(shù)組
arr = np.asarray(<nd-array>[, dtype=<data-type>])
- 如果<nd-array>和dtype都是一樣的送讲,就不會(huì)生成一個(gè)新的NumPy數(shù)組
- 使用astype生成新的NumPy數(shù)組
arr = <nd-array>.astype(<type>)
- 生成全0/1的NumPy數(shù)組
arr = <nd-array>.zeros/ones(<shape>)
- 這里的<shape>本質(zhì)上就是一個(gè)n維元組奸笤,而且這個(gè)元組的括號(hào)必須帶上
- 按照區(qū)間與步長(zhǎng)結(jié)合生成NumPy數(shù)組
arr = np.arange([<start>, ]<end>[, <step>])
- 需要知道的是這個(gè)arange方法支持浮點(diǎn)數(shù)的生成
- arange生成也是前閉后開(kāi)的
- 按照區(qū)間與生成個(gè)數(shù)結(jié)合生成NumPy數(shù)組
arr = np.linespace([<start>, ]<end>[, <shape>])
- linespace生成也是前閉后也是閉的
- <shape>默認(rèn)是50
- 隨機(jī)生成數(shù)組
arr = np.random.rand(<shape>) # 均勻分布 arr = np.random.randn(<shape>) # 高斯分布
- 1維數(shù)組:
-
NumPy數(shù)組的運(yùn)算:
- 給ndarray的每個(gè)元素加一個(gè)數(shù)字a
arr = <nd-array> + a
- 列表是不支持這個(gè)
列表+數(shù)字
操作的;
- 列表是不支持這個(gè)
- 兩個(gè)維度一樣的ndarray相加:
arr = <nd-array1> + <nd-array2>
- 列表支持
列表+列表
的操作哼鬓,其結(jié)果就是把兩個(gè)列表的一級(jí)元素重新組合成一個(gè)新的列表监右;而兩個(gè)維度一樣的ndarray相加的結(jié)果就是這兩個(gè)數(shù)組對(duì)應(yīng)位置的數(shù)字相加形成新的數(shù)組,維度與其父母保持一致异希;
- 列表支持
- 給ndarray的每個(gè)元素乘以一個(gè)數(shù)字a:
arr = <nd-array> * a
- 列表是支持這個(gè)
列表*數(shù)字
操作,其結(jié)果就是a個(gè)列表相加的結(jié)果秸侣,而NumPy數(shù)組與一個(gè)數(shù)字相乘的結(jié)果是這個(gè)NumPy數(shù)組的每個(gè)元素乘以這個(gè)數(shù)字得到的結(jié)果;
- 列表是支持這個(gè)
- 兩個(gè)維度一樣的ndarray相乘:
arr = <nd-array1> + <nd-array2>
- 列表不支持支持
列表*列表
的操作宠互;而兩個(gè)維度一樣的ndarray相乘的結(jié)果就是這兩個(gè)數(shù)組對(duì)應(yīng)位置的數(shù)字相乘形成新的數(shù)組味榛,維度與其父母保持一致;
- 列表不支持支持
- 給ndarray的每個(gè)元素加一個(gè)數(shù)字a
-
NumPy數(shù)組的常用屬性予跌、方法:
- 獲取NumPy數(shù)組的行列數(shù):
<nd-array>.shape np.shape(<list>/<scalar>)
- 獲取NumPy數(shù)組的維數(shù):
<nd-array>.ndim
- 當(dāng)參數(shù)為<scalar>的時(shí)候搏色,返回的結(jié)果是一個(gè)空元組;
- 獲取NumPy數(shù)組中數(shù)據(jù)的數(shù)據(jù)類型:
<nd-array>.dtype
- 獲取NumPy數(shù)組中每個(gè)元素個(gè)數(shù) 券册?频轿??高維烁焙?航邢??:
<nd-array>.size np.size(<list>)
- 獲取NumPy數(shù)組中每個(gè)元素所占字節(jié)數(shù):
<nd-array>.itemsize
- 獲取NumPy數(shù)組所占字節(jié)數(shù):
<nd-array>.nbytes
- 替換NumPy中的元素為一個(gè)新值:
<nd-array>.fill(<new-value>)
- 如果NumPy數(shù)組中的元素為一個(gè)虛數(shù)骄蝇,獲取其實(shí)部和虛部:
<nd-array>.imag <nd-array>.real
- 特殊值:無(wú)窮大和不是一個(gè)數(shù)字:
np.inf # 無(wú)窮大 np.nan # 不是一個(gè)數(shù)字
- 特殊值:無(wú)窮大和不是一個(gè)數(shù)字:
np.inf # 無(wú)窮大 np.nan # 不是一個(gè)數(shù)字
- NumPy數(shù)組求和:
- 全部的和
<nd-array>.sum()
- 所有列的和
<nd-array>.sum(axis=0)
- 所有行的和
<nd-array>.sum(axis=1)
- 全部的和
- NumPy數(shù)組求積:
<nd-array>.prod([axis=<num>])
- NumPy數(shù)組最小值:
<nd-array>.min([axis=<num>])
- NumPy數(shù)組求最大值:
<nd-array>.max([axis=<num>])
- NumPy數(shù)組求每行(1)/列(0)最大值的位置:
<nd-array>.argmax([axis=<num>])
- NumPy數(shù)組求每行(1)/列(0)最小值的位置:
<nd-array>.argmax([axis=<num>])
- NumPy數(shù)組求平均值:
<nd-array>.mean([axis=<num>])
- NumPy數(shù)組的轉(zhuǎn)置:
<nd-array>.T
- 獲取NumPy數(shù)組的行列數(shù):
-
索引和切片
- 索引和切片的方式和列表用法一樣膳殷,也有不一樣的地方:
- 使用列表的方式訪問(wèn)多維數(shù)組
<nd-array>[<dimension1>, <dimension2>, ...]
- 獲取二維數(shù)組的第n列數(shù)據(jù)
<nd-array>[:, n]
- 給已有的二維數(shù)組<nd-array>添加維度:
<nd-array>[:, :, None]
- 花式索引(Fancy Indexing):一次性從nd-array中根據(jù)索引獲取多個(gè)值
// TODO
- 使用列表的方式訪問(wèn)多維數(shù)組
- 索引和切片的方式和列表用法一樣膳殷,也有不一樣的地方:
-
NumPy數(shù)組的遍歷:
- 普通的遍歷
for ele in <nd-array>: <for-body>
- n維NumPy數(shù)組全元素遍歷:
for idx, ele in np.ndenumerate<nd-array>: <for-body>
- 普通的遍歷
-
兩個(gè)NumPy數(shù)組的拼接:
- 使用concatenate行(axis=0)/(axis=0)列拼接:
np.concatenate(<nd-array1>, <nd-array2>, [axis=<axis-value>])
- 注意,兩個(gè)數(shù)組進(jìn)行拼接的時(shí)候需要注意:若進(jìn)行拼接九火,則列數(shù)必須相等赚窃,列拼接行數(shù)則必須相等;
- 使用
vstack
(行:垂直拼接)/hstack
(列:水平拼接)拼接:np.vstack(<nd-array1>, <nd-array2>) # 類似SQL中的 union np.hstack(<nd-array1>, <nd-array2>) # 類似SQL中的join np.dstack(<nd-array1>, <nd-array2>) # 結(jié)果是一個(gè)三維的變化結(jié)果岔激,后面有時(shí)間講解
- 使用concatenate行(axis=0)/(axis=0)列拼接:
-
NumPy數(shù)組的數(shù)學(xué)運(yùn)算:
- NumPy數(shù)組的普通運(yùn)算:
<nd-array1> +/-/*///**/% <num>
- NumPy數(shù)組作為矩陣的乘法:
<nd-array1>.dot(<num>/<nd-array2>) <nd-array1> @ (<num>/<nd-array2>) # 與.dot的結(jié)果一樣勒极,Python3以后支持
- NumPy數(shù)組的一些數(shù)學(xué)函數(shù):
np.cos(<nd-array>) np.cos(<nd-array>) np.aqrt(<nd-array>) ...
- 注意, math模塊的函數(shù)是無(wú)法直接作用于NumPy數(shù)組的
- NumPy數(shù)組的普通運(yùn)算:
-
NumPy數(shù)組的邏輯運(yùn)算:
- NumPy數(shù)組的普通邏輯運(yùn)算:
<nd-array1> >/>=/</<= <num>
- 注意虑鼎,邏輯運(yùn)算的結(jié)果是一個(gè)數(shù)組辱匿,不能直接結(jié)合if使用,但是可以通過(guò)一些函數(shù)如:
if np.all/any/allclose(<nd-array-logic-expression>)
這種方式使用炫彩;
- 注意虑鼎,邏輯運(yùn)算的結(jié)果是一個(gè)數(shù)組辱匿,不能直接結(jié)合if使用,但是可以通過(guò)一些函數(shù)如:
- NumPy數(shù)組的普通邏輯運(yùn)算:
-
NumPy數(shù)組的廣播機(jī)制:
- 目前還不是很明白匾七,研究明白之后補(bǔ)吧
// TODO
- 目前還不是很明白匾七,研究明白之后補(bǔ)吧