-
Pandas
提供高性能易用數(shù)據(jù)類型和分析工具,基于numpy實(shí)現(xiàn),經(jīng)常與numpy和matplotlib一起使用配乓。
主要提供兩個(gè)數(shù)據(jù)類型:Series(一維數(shù)據(jù)類型),Dataframe(二維乃至多維數(shù)據(jù)類型)
基礎(chǔ)數(shù)據(jù)類型
NumPy | Pandas |
---|---|
關(guān)注數(shù)據(jù)的結(jié)構(gòu)表達(dá)、維度關(guān)系 | 關(guān)注數(shù)據(jù)的應(yīng)用表達(dá) |
維度:數(shù)據(jù)間關(guān)系 | 數(shù)據(jù)與索引間關(guān)系 |
-
Serises數(shù)據(jù)類型
Series類型由一組數(shù)據(jù)及與之相關(guān)的數(shù)據(jù)索引組成。
其中數(shù)據(jù)索引可以自定義今豆。
import pandas as pd
b = pd.Series([9,8,7,6],index=['a', 'b', 'c', 'd'])
-
Serises數(shù)據(jù)類型創(chuàng)建方式有:標(biāo)量、字典柔袁、ndarray
標(biāo)量
b = pd.Series(8,index=['a', 'b', 'c', 'd'])
Out:
a 8
b 8
c 8
d 8
dtype: int64
字典
b = pd.Series({'a':9, 'b':8, 'c':7, 'd':6})
Out:
a 9
b 8
c 7
d 6
dtype: int64
b = pd.Series({'a':9, 'b':8, 'c':7}, index=['c','b','a','d'])
Out:
c 7.0
b 8.0
a 9.0
d NaN
dtype: float64
# 順序以index的為準(zhǔn)呆躲,其中'd'未指定值 則為:NaN表示空
ndarray:
n = pd.Series(np.arange(5),index=np.arange(9,4,-1))
Out:
9 0
8 1
7 2
6 3
5 4
dtype: int32
-
Serises數(shù)據(jù)類型基本操作
類似ndarray、字典操作n [1]
:out:8
可切片
對(duì)齊操作:
Series+Series 取 并集中的和
Series類型在運(yùn)算中會(huì)自動(dòng)對(duì)齊不同索引的數(shù)據(jù),
b = pd.Series({'a':9, 'b':8, 'c':7, 'd':6})
a = pd.Series({'b':9, 'd':8, 'c':7, 'f':6})
a+b
Out:
a NaN
b 17.0
c 14.0
d 14.0
f NaN
dtype: float64
Series對(duì)象和索引有一個(gè)name屬性
b.name='Series對(duì)象'
b.index.name='索引列'
b
Out:
索引列
a 9
b 8
c 7
d 6
Name: Series對(duì)象, dtype: int64
修改:隨時(shí)修改捶索,即刻生效
b[3]=22
b.name = 'Series'
b
Out[25]:
索引列
a 9
b 8
c 7
d 22
Name: Series, dtype: int64