原文:Data types
譯者:飛龍
?
另見
數(shù)組類型和類型之間的轉(zhuǎn)換
NumPy支持的數(shù)值類型比Python更多君旦。這一節(jié)會(huì)講述所有可用的類型,以及如何改變數(shù)組的數(shù)據(jù)類型红碑。
數(shù)據(jù)類型 | 描述 |
---|---|
bool_ | 以字節(jié)存儲(chǔ)的布爾值(True 或 False) |
int_ | 默認(rèn)的整數(shù)類型(和 C 的 long 一樣,是 int64 或者 int32) |
intc | 和 C 的 int 相同(一般為 int64 或 int32) |
intp | 用于下標(biāo)的整數(shù)(和 C 的 ssize_t 相同,一般為int64 或者 int32) |
int8 | 字節(jié)(-128 到 127) |
int16 | 整數(shù)(-32768 到 32767) |
int32 | 整數(shù)(-2147483648 到 2147483647) |
int64 | 整數(shù)(-9223372036854775808 到 9223372036854775807) |
uint8 | 無符號(hào)整數(shù)(0 到 255) |
uint16 | 無符號(hào)整數(shù)(0 到 65535) |
uint32 | 無符號(hào)整數(shù)(0 到 4294967295) |
uint64 | 無符號(hào)整數(shù)(0 到 18446744073709551615) |
float_ | float64 的簡(jiǎn)寫 |
float16 | 半精度浮點(diǎn):1位符號(hào)进泼,5位指數(shù)惕稻,10位尾數(shù) |
float32 | 單精度浮點(diǎn):1位符號(hào)竖共,8位指數(shù),23位尾數(shù) |
float64 | 雙精度浮點(diǎn):1位符號(hào)俺祠,11位指數(shù)公给,52位尾數(shù) |
complex_ | complex128 的簡(jiǎn)寫 |
complex64 | 由兩個(gè)32位浮點(diǎn)(實(shí)部和虛部)組成的復(fù)數(shù) |
complex128 | 由兩個(gè)64位浮點(diǎn)(實(shí)部和虛部)組成的復(fù)數(shù) |
此外,Intel平臺(tái)相關(guān)的C整數(shù)類型 short
蜘渣、long
淌铐,long long
和它們的無符號(hào)版本是有定義的。
NumPy數(shù)值類型是dtype對(duì)象的實(shí)例蔫缸,每個(gè)都有獨(dú)特的特點(diǎn)腿准。一旦你導(dǎo)入了NumPy:
>>> import numpy as np
這些 dtype 都可以通過 np.bool_
, np.float32
以及其它的形式訪問拾碌。
更高級(jí)的類型不在表中給出吐葱,請(qǐng)見結(jié)構(gòu)化數(shù)組一節(jié)街望。
有5種基本的數(shù)值類型:布爾(bool
),整數(shù)(int
)弟跑,無符號(hào)整數(shù)(uint
)灾前,浮點(diǎn)(float
)和復(fù)數(shù)。其中的數(shù)字表示類型所占的位數(shù)(即需要多少位代表內(nèi)存中的一個(gè)值)窖认。有些類型豫柬,如int
和intp
,依賴于平臺(tái)(例如32位和64位機(jī))有不同的位數(shù)扑浸。在與低級(jí)別的代碼(如C或Fortran)交互和在原始內(nèi)存中尋址時(shí)應(yīng)該考慮到這些烧给。
數(shù)據(jù)類型可以用做函數(shù),來將Python類型轉(zhuǎn)換為數(shù)組標(biāo)量(詳細(xì)解釋請(qǐng)見數(shù)組標(biāo)量一節(jié))喝噪,或者將Python的數(shù)值序列轉(zhuǎn)換為同類型的NumPy數(shù)組础嫡,或者作為參數(shù)傳入接受dtype的關(guān)鍵詞的NumPy函數(shù)或方法中,例如:
>>> import numpy as np
>>> x = np.float32(1.0)
>>> x
1.0
>>> y = np.int_([1,2,4])
>>> y
array([1, 2, 4])
>>> z = np.arange(3, dtype=np.uint8)
>>> z
array([0, 1, 2], dtype=uint8)
數(shù)組類型也可以由字符代碼指定酝惧,這主要是為了保留舊的包的向后兼容榴鼎,如Numeric。一些文檔仍舊可能這樣寫晚唇,例如:
>>> np.array([1, 2, 3], dtype='f')
array([ 1., 2., 3.], dtype=float32)
我們推薦用 dtype 對(duì)象來取代巫财。
要轉(zhuǎn)換數(shù)組類型,使用 .astype()
方法(推薦)哩陕,或者將類型自身用作函數(shù)平项,例如:
>>> z.astype(float)
array([ 0., 1., 2.])
>>> np.int8(z)
array([0, 1, 2], dtype=int8)
需要注意的是,上面我們使用Python的浮點(diǎn)對(duì)象作為 dtype悍及。NumPy知道int
是指np.int_
闽瓢,bool
指np.bool_
,float
指np.float_
心赶,complex
指np.complex_
扣讼。其他數(shù)據(jù)類型在Python中沒有對(duì)應(yīng)。
通過查看 dtype 屬性來確定數(shù)組的類型:
>>> z.dtype
dtype('uint8')
dtype 對(duì)象還包含有關(guān)類型的信息缨叫,如它的位寬和字節(jié)順序椭符。數(shù)據(jù)類型也可以間接用于類型的查詢屬性,例如檢查是否是整數(shù):
>>> d = np.dtype(int)
>>> d
dtype('int32')
>>> np.issubdtype(d, int)
True
>>> np.issubdtype(d, float)
False
數(shù)組標(biāo)量
NumPy一般以數(shù)組標(biāo)量返回?cái)?shù)組元素(帶有相關(guān)dtype的標(biāo)量)弯汰。數(shù)組標(biāo)量不同于Python標(biāo)量艰山,但他們中的大部分可以互換使用(一個(gè)主要的例外是2.x之前的Python欺冀,其中整數(shù)數(shù)組標(biāo)量不能作為列表和元組的下標(biāo))芥玉。也有一些例外,比如當(dāng)代碼需要標(biāo)量的一個(gè)非常特定的屬性媒怯,或檢查一個(gè)值是否是特定的Python標(biāo)量時(shí)。一般來說纵装,總是可以使用相應(yīng)的Python類型函數(shù)(如int
征讲,float
,complex
橡娄,str
诗箍,unicode
),將數(shù)組標(biāo)量顯式轉(zhuǎn)換為Python標(biāo)量來解決問題挽唉。
使用數(shù)組標(biāo)量的主要優(yōu)點(diǎn)是滤祖,它們保留了數(shù)組的類型(Python可能沒有匹配的標(biāo)量類型,如int16
)瓶籽。因此匠童,使用數(shù)組標(biāo)量確保了數(shù)組和標(biāo)量之間具有相同的行為,無論值在不在數(shù)組中塑顺。NumPy標(biāo)量也有許多和數(shù)組相同的方法汤求。
擴(kuò)展精度
Python 的浮點(diǎn)數(shù)通常都是64位的,幾乎相當(dāng)于 np.float64
严拒。在一些不常見的情況下扬绪,更精確的浮點(diǎn)數(shù)可能更好。是否可以這樣做取決于硬件和開發(fā)環(huán)境:具體來說裤唠,x86 機(jī)器提供了80位精度的硬件浮點(diǎn)支持挤牛,雖然大多數(shù) C 編譯器都以 long double
類型來提供這個(gè)功能,但 MSVC (標(biāo)準(zhǔn)的Windows版本)中 long double
和 double
一致种蘸。NumPy中可以通過 np.longdouble
來使用編譯器的 long double
(復(fù)數(shù)為 np.clongdouble
)赊颠。你可以通過 np.finfo(np.longdouble)
來了解你的 numpy 提供了什么。
NumPy 不提供比 C 的 long double
精度更高的 dtype劈彪;特別是128位 IEEE 四精度數(shù)據(jù)類型(Fortran 的 REAL*16
)是不能用的。
為了高效的內(nèi)存對(duì)齊顶猜,np.longdouble
通常填充零位來存儲(chǔ)沧奴,共96位或128位。哪個(gè)更有效取決于硬件環(huán)境长窄;通常在32位系統(tǒng)中滔吠,他們被填充到96位,而在64位系統(tǒng)挠日,他們通常是填充到128位疮绷。np.longdouble
以系統(tǒng)默認(rèn)的方式填充;而 np.float96
和 np.float128
為那些需要特定填充位的用戶提供嚣潜。盡管名字不同冬骚,np.float96
和 np.float128
都只提供和np.longdouble
相同的精度,也就是說,大多數(shù) x86 機(jī)器上面只有80位只冻,標(biāo)準(zhǔn)Windows版本上只有64位庇麦。
注意,即使np.longdouble
比Python的float
精度更高喜德,也很容易失去額外的精度山橄,因?yàn)镻ython經(jīng)常強(qiáng)行以float
來傳值。例如舍悯,%
格式化運(yùn)算符要求其參數(shù)轉(zhuǎn)換成標(biāo)準(zhǔn)的Python類型航棱,因此它不可能保留額外的精度,即使要求更多的小數(shù)位數(shù)萌衬∫迹可以使用1 + np.finfo(np.longdouble).eps
來測(cè)試你的代碼。