DataFrame描述統(tǒng)計(jì)、離散化灼卢、排序 (2020.04.09)

1.查看基本信息

1.df.info()
user_infor=pd.read_csv("new_infor.csv",index_col="索引名")  #index_col是指定原表列做索引
user_infor.info()

輸出:<class 'pandas.core.frame.DataFrame'>
     Int64Index: 8 entries, 0 to 7              # 描述索引:長(zhǎng)度為8绍哎,0-7
     Data columns (total 5 columns):            # 數(shù)據(jù)共5列
      #   Column      Non-Null Count  Dtype     # Non-Null代表非缺失數(shù)據(jù)個(gè)數(shù)
     ---  ------      --------------  ----- 
      0   Hero Name   8 non-null      object
      1   Age         8 non-null      int64 
      2   Sex         8 non-null      object
      3   Birthplace  8 non-null      object
      4   weapon      8 non-null      object
     dtypes: int64(1), object(4)                # 不同數(shù)據(jù)類型數(shù)量統(tǒng)計(jì)
     memory usage: 384.0+ bytes


2.df.head(num)  #查看頭部幾行
  df.tail(n)    #尾部幾行

3.df.shape    #查看形狀

4.df.T    #矩陣轉(zhuǎn)置,注意與tail和head的連用

5.df.values  轉(zhuǎn)為ndarray

2.描述與統(tǒng)計(jì)

2.1 常用統(tǒng)計(jì)指標(biāo)

指標(biāo) 描述
count() 計(jì)數(shù)項(xiàng)
first()鞋真、last() 第一項(xiàng)和最后一項(xiàng)
mean()崇堰、median() 均值與中位數(shù)
min()、max() 最大值與最小值
mode() 眾數(shù)
std()涩咖、var() 標(biāo)準(zhǔn)差與方差
mad() 均值絕對(duì)偏差
prod() 所有項(xiàng)乘積
sum() 所有項(xiàng)求和

語(yǔ)法: df.指標(biāo)函數(shù)()
注意:
1)Numpy沒有眾數(shù)方法海诲,其他Numpy方法用法:np.指標(biāo)方法(數(shù)據(jù))
2)DF中的列可以取出后相加,就像矩陣相加

#生成第二個(gè)總分列抠藕,計(jì)算語(yǔ)文+數(shù)學(xué)成績(jī)的總分饿肺,命名為‘總分2’
grade['總分2'] = grade['語(yǔ)文']+grade['數(shù)學(xué)']

#計(jì)算每個(gè)同學(xué)的‘?dāng)?shù)學(xué)減去語(yǔ)文’的成績(jī),取絕對(duì)值盾似,命名為‘文理偏科值’敬辣。
np.abs(grade['數(shù)學(xué)']-grade['語(yǔ)文'])

2.2 df.describe() 批量返回?cái)?shù)值列統(tǒng)計(jì)指標(biāo)

源數(shù)據(jù)grade
grade=pd.read_csv('student_grade.txt',sep='\t')
# 只支持?jǐn)?shù)值列,dtypes:數(shù)值
grade.describe()

describe()

如果想要查看非數(shù)字類型的列的統(tǒng)計(jì)指標(biāo),可以設(shè)置 include=["object"]來獲得零院。
include:top與freq組合出現(xiàn)

2.3 Series.value_counts() 查看頻率

1.查看某列數(shù)據(jù)頻率
DF對(duì)象['列名'].value_counts()

2.查看多列:先取DF對(duì)象的列List溉跃,再查看
c=[]
for i in user_infor.columns:
    d=user_infor[i].value_counts()
    c.append(d)

---
輸出:
索爾      1
黑寡婦     1
神奇女俠    1
奇異博士    1
鋼鐵俠     1
滅霸      1
蜘蛛俠     1
蝙蝠俠     1
Name: Hero Name, dtype: int64
---

3.離散化

3.1 pd.cut()

將數(shù)據(jù)按標(biāo)準(zhǔn)分段(分箱),區(qū)間默認(rèn)為左開右閉


3.2 pd.qcut()

除了可以使用 cut 進(jìn)行離散化之外告抄,qcut 也可以實(shí)現(xiàn)離散化撰茎。cut 是根據(jù)每個(gè)值的大小來進(jìn)行離散化的,qcut 是根據(jù)每個(gè)值出現(xiàn)的次數(shù)來進(jìn)行離散化打洼,也就是基于分位數(shù)的離散化功能龄糊。

4.排序

4.1 df.sort_index()

df.sort_index()  #按索引標(biāo)簽?zāi)J(rèn)升序
df.sort_index(ascending=False) #按索引標(biāo)簽降序排

4.2 df.sort_values()

按給定值排,多條件用[]嵌套
user_info.sort_values(by = ['Age',"Power"],ascending = [False,True])

4.3 series.nlargest(n)

取最大的n行數(shù)據(jù)

5. 函數(shù)應(yīng)用及映射

5.1 Series.map()

1)利用字典去對(duì)應(yīng)(映射)更改列值(區(qū)別于直接修改的一一對(duì)應(yīng))



2)利用自定義函數(shù)


5.2 Series.apply()和df.apply()

apply 方法既支持 Series募疮,也支持 DataFrame炫惩,在對(duì) Series 操作時(shí)會(huì)作用到每個(gè)值上,在對(duì) DataFrame 操作時(shí)會(huì)作用到所有行或所有列(通過 axis參數(shù)控制)阿浓。

# 對(duì) Series 來說他嚷,如果使用自定義函數(shù)映射的方法,apply 方法 與 map 方法區(qū)別不大芭毙。
earth_city=['紐約','費(fèi)城','紐約','哥譚','天堂島',"斯大林格勒","科羅拉多州"]

def func(x):
    if x in earth_city:
        return "地球人"
    else:
        return "外星人"


heros.Birthplace.apply(func)  #這里只是將上一小節(jié)中的Series.map()換成了.apply()筋蓖,其余代碼一樣

對(duì) DataFrame 來說,apply 方法的作用對(duì)象是一行或一列數(shù)據(jù)(一個(gè)Series)

- axis為0或'index':將函數(shù)應(yīng)用于每列退敦。
- axis為1或'columns':將函數(shù)應(yīng)用于每一行粘咖。

def max_01(x):
    return x.max()

# heros.Sex.value_counts()[0]
heros.apply(func=max_01,axis=0)

輸出:
Hero Name      黑寡婦
Age           3000
Sex              男
Birthplace    阿斯加德
weapon          魔法
Power          140
dtype: object

pandas中map()、apply()侈百、applymap()的區(qū)別:

  • map()方法適用于Series對(duì)象瓮下,可以通過字典或函數(shù)類對(duì)象來構(gòu)建映射關(guān)系對(duì)Series對(duì)象進(jìn)行轉(zhuǎn)換忠聚;
  • apply()方法使用與Series對(duì)象、DataFrame對(duì)象唱捣、Groupby對(duì)象两蟀,處理的是行或列數(shù)據(jù)(本質(zhì)上處理的是單個(gè)Series),用函數(shù)類對(duì)象來構(gòu)建映射關(guān)系對(duì)Series對(duì)象進(jìn)行轉(zhuǎn)換震缭;
  • applymap()方法用來處理DataFrame對(duì)象的單個(gè)元素值赂毯,也是使用函數(shù)類對(duì)象映射轉(zhuǎn)換;
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末拣宰,一起剝皮案震驚了整個(gè)濱河市党涕,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌巡社,老刑警劉巖膛堤,帶你破解...
    沈念sama閱讀 218,386評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異晌该,居然都是意外死亡肥荔,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門朝群,熙熙樓的掌柜王于貴愁眉苦臉地迎上來燕耿,“玉大人,你說我怎么就攤上這事姜胖∮В” “怎么了?”我有些...
    開封第一講書人閱讀 164,704評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵右莱,是天一觀的道長(zhǎng)蚜锨。 經(jīng)常有香客問我,道長(zhǎng)慢蜓,這世上最難降的妖魔是什么亚再? 我笑而不...
    開封第一講書人閱讀 58,702評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮胀瞪,結(jié)果婚禮上针余,老公的妹妹穿的比我還像新娘饲鄙。我一直安慰自己凄诞,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評(píng)論 6 392
  • 文/花漫 我一把揭開白布忍级。 她就那樣靜靜地躺著帆谍,像睡著了一般。 火紅的嫁衣襯著肌膚如雪轴咱。 梳的紋絲不亂的頭發(fā)上汛蝙,一...
    開封第一講書人閱讀 51,573評(píng)論 1 305
  • 那天烈涮,我揣著相機(jī)與錄音,去河邊找鬼窖剑。 笑死坚洽,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的西土。 我是一名探鬼主播讶舰,決...
    沈念sama閱讀 40,314評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼需了!你這毒婦竟也來了跳昼?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,230評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤肋乍,失蹤者是張志新(化名)和其女友劉穎鹅颊,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體墓造,經(jīng)...
    沈念sama閱讀 45,680評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡堪伍,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了觅闽。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片杠娱。...
    茶點(diǎn)故事閱讀 39,991評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖谱煤,靈堂內(nèi)的尸體忽然破棺而出摊求,到底是詐尸還是另有隱情,我是刑警寧澤刘离,帶...
    沈念sama閱讀 35,706評(píng)論 5 346
  • 正文 年R本政府宣布室叉,位于F島的核電站,受9級(jí)特大地震影響硫惕,放射性物質(zhì)發(fā)生泄漏茧痕。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評(píng)論 3 330
  • 文/蒙蒙 一恼除、第九天 我趴在偏房一處隱蔽的房頂上張望踪旷。 院中可真熱鬧,春花似錦豁辉、人聲如沸令野。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)气破。三九已至,卻和暖如春餐抢,著一層夾襖步出監(jiān)牢的瞬間现使,已是汗流浹背低匙。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留碳锈,地道東北人顽冶。 一個(gè)月前我還...
    沈念sama閱讀 48,158評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像售碳,于是被迫代替她去往敵國(guó)和親渗稍。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容