在學(xué)習(xí)刪除方法drop
時焰枢,碰到了,也突然想明白了徽级,軸是什么意思气破。
引入:
import numpy as np
from pandas import Series,DataFrame#導(dǎo)入包
obj = Series(np.arange(5),index = ['a','b','c','d','e'])#創(chuàng)建Series obj
obj
Out[2]:
a 0
b 1
c 2
d 3
e 4
dtype: int32
new_obj = obj.drop('c')#刪除'c'
new_obj
Out[5]:
a 0
b 1
d 3
e 4
dtype: int32
obj
Out[6]:
a 0
b 1
c 2
d 3
e 4
dtype: int32
obj.drop(['b','d'])#刪除'b','d'
Out[7]:
a 0
c 2
e 4
dtype: int32
data = DataFrame(np.arange(25).reshape(5,5),index = ['bj','tj','heb','sjz','sh'],columns=['one','two','three','four','five'])#創(chuàng)建DataFrame
data
Out[9]:
one two three four five
bj 0 1 2 3 4
tj 5 6 7 8 9
heb 10 11 12 13 14
sjz 15 16 17 18 19
sh 20 21 22 23 24
data.drop(['bj','tj'])#刪除某行
Out[10]:
one two three four five
heb 10 11 12 13 14
sjz 15 16 17 18 19
sh 20 21 22 23 24
data.drop('one',axis=1)#刪除列
Out[11]:
two three four five
bj 1 2 3 4
tj 6 7 8 9
heb 11 12 13 14
sjz 16 17 18 19
sh 21 22 23 24
可已注意到的是,在上方使用drop
時餐抢,刪除列特意指明了axis=1
. 而在查看drop的文檔時现使,發(fā)現(xiàn)默認(rèn)參數(shù)是axis =0
低匙,這說明:
-
axis = 0
代表的是行。 -
axis = 1
代表的是列碳锈。
這樣想就明白了顽冶。但是接著問題來了,
data
Out[29]:
lie one two three four five
city
bj 0 1 2 3 4
tj 5 6 7 8 9
heb 10 11 12 13 14
sjz 15 16 17 18 19
sh 20 21 22 23 24
data.mean(axis = 0)#求列平均
Out[30]:
lie
one 10.0
two 11.0
three 12.0
four 13.0
five 14.0
dtype: float64
data.mean(axis = 1)#求行平均
Out[31]:
city
bj 2.0
tj 7.0
heb 12.0
sjz 17.0
sh 22.0
dtype: float64
其實(shí)售碳,我是有點(diǎn)蒙的强重,如果向上面那樣理解的話。
發(fā)現(xiàn)問題了嗎贸人?
在drop
中使用axis=1
實(shí)際上是刪掉了一列间景,而在mean
中實(shí)際上是計算的行平均值,而不是列的平均值艺智。
蒙了倘要。嗯,看了Stackoverflow中的解釋十拣,大概是明白了》馀。現(xiàn)記錄如下。
實(shí)際上axis = 1父晶,指的是沿著行求所有列的平均值哮缺,代表了橫軸,那axis = 0甲喝,就是沿著列求所有行的平均值尝苇,代表了縱軸。
那這樣的話埠胖,drop
就是沿著'two'
的方向刪除對應(yīng)的軸標(biāo)簽為axis = 1
的值糠溜。
又想到了numpy,pandas是以numpy為基礎(chǔ)構(gòu)造的庫直撤,因此非竿,它保留了對于axis使用的方式。