DataFrame描述統(tǒng)計(jì)、離散化灼卢、排序 (2020.04.09)

1.查看基本信息

1.df.info()
user_infor=pd.read_csv("new_infor.csv",index_col="索引名")  #index_col是指定原表列做索引
user_infor.info()

輸出：<class 'pandas.core.frame.DataFrame'>
     Int64Index: 8 entries, 0 to 7              # 描述索引：長(zhǎng)度為8绍哎，0-7
     Data columns (total 5 columns):            # 數(shù)據(jù)共5列
      #   Column      Non-Null Count  Dtype     # Non-Null代表非缺失數(shù)據(jù)個(gè)數(shù)
     ---  ------      --------------  ----- 
      0   Hero Name   8 non-null      object
      1   Age         8 non-null      int64 
      2   Sex         8 non-null      object
      3   Birthplace  8 non-null      object
      4   weapon      8 non-null      object
     dtypes: int64(1), object(4)                # 不同數(shù)據(jù)類型數(shù)量統(tǒng)計(jì)
     memory usage: 384.0+ bytes


2.df.head(num)  #查看頭部幾行
  df.tail(n)    #尾部幾行

3.df.shape    #查看形狀

4.df.T    #矩陣轉(zhuǎn)置，注意與tail和head的連用

5.df.values  轉(zhuǎn)為ndarray

2.描述與統(tǒng)計(jì)

2.1 常用統(tǒng)計(jì)指標(biāo)

指標(biāo)	描述
count()	計(jì)數(shù)項(xiàng)
first()鞋真、last()	第一項(xiàng)和最后一項(xiàng)
mean()崇堰、median()	均值與中位數(shù)
min()、max()	最大值與最小值
mode()	眾數(shù)
std()涩咖、var()	標(biāo)準(zhǔn)差與方差
mad()	均值絕對(duì)偏差
prod()	所有項(xiàng)乘積
sum()	所有項(xiàng)求和

語(yǔ)法： df.指標(biāo)函數(shù)()
注意：
1）Numpy沒有眾數(shù)方法海诲，其他Numpy方法用法：np.指標(biāo)方法(數(shù)據(jù))
2）DF中的列可以取出后相加，就像矩陣相加

#生成第二個(gè)總分列抠藕，計(jì)算語(yǔ)文+數(shù)學(xué)成績(jī)的總分饿肺，命名為‘總分2’
grade['總分2'] = grade['語(yǔ)文']+grade['數(shù)學(xué)']

#計(jì)算每個(gè)同學(xué)的‘?dāng)?shù)學(xué)減去語(yǔ)文’的成績(jī)，取絕對(duì)值盾似，命名為‘文理偏科值’敬辣。
np.abs(grade['數(shù)學(xué)']-grade['語(yǔ)文'])

2.2 df.describe() 批量返回?cái)?shù)值列統(tǒng)計(jì)指標(biāo)

源數(shù)據(jù)grade

grade=pd.read_csv('student_grade.txt',sep='\t')
# 只支持?jǐn)?shù)值列,dtypes:數(shù)值
grade.describe()

describe()

如果想要查看非數(shù)字類型的列的統(tǒng)計(jì)指標(biāo)，可以設(shè)置 include=["object"]來獲得零院。

include：top與freq組合出現(xiàn)

2.3 Series.value_counts() 查看頻率

1.查看某列數(shù)據(jù)頻率
DF對(duì)象['列名'].value_counts()

2.查看多列：先取DF對(duì)象的列List溉跃，再查看
c=[]
for i in user_infor.columns:
    d=user_infor[i].value_counts()
    c.append(d)

---
輸出：
索爾      1
黑寡婦     1
神奇女俠    1
奇異博士    1
鋼鐵俠     1
滅霸      1
蜘蛛俠     1
蝙蝠俠     1
Name: Hero Name, dtype: int64
---

3.離散化

3.1 pd.cut()

將數(shù)據(jù)按標(biāo)準(zhǔn)分段（分箱），區(qū)間默認(rèn)為左開右閉

3.2 pd.qcut()

除了可以使用 cut 進(jìn)行離散化之外告抄，qcut 也可以實(shí)現(xiàn)離散化撰茎。cut 是根據(jù)每個(gè)值的大小來進(jìn)行離散化的，qcut 是根據(jù)每個(gè)值出現(xiàn)的次數(shù)來進(jìn)行離散化打洼，也就是基于分位數(shù)的離散化功能龄糊。

4.排序

4.1 df.sort_index()

df.sort_index()  #按索引標(biāo)簽?zāi)J(rèn)升序
df.sort_index(ascending=False) #按索引標(biāo)簽降序排

4.2 df.sort_values()

按給定值排，多條件用[]嵌套
user_info.sort_values(by = ['Age',"Power"],ascending = [False,True])

4.3 series.nlargest(n)

取最大的n行數(shù)據(jù)

5. 函數(shù)應(yīng)用及映射

5.1 Series.map()

1）利用字典去對(duì)應(yīng)(映射)更改列值（區(qū)別于直接修改的一一對(duì)應(yīng)）

2）利用自定義函數(shù)

5.2 Series.apply()和df.apply()

apply 方法既支持 Series募疮，也支持 DataFrame炫惩，在對(duì) Series 操作時(shí)會(huì)作用到每個(gè)值上，在對(duì) DataFrame 操作時(shí)會(huì)作用到所有行或所有列（通過 axis參數(shù)控制）阿浓。

# 對(duì) Series 來說他嚷，如果使用自定義函數(shù)映射的方法，apply 方法 與 map 方法區(qū)別不大芭毙。
earth_city=['紐約','費(fèi)城','紐約','哥譚','天堂島',"斯大林格勒","科羅拉多州"]

def func(x):
    if x in earth_city:
        return "地球人"
    else:
        return "外星人"


heros.Birthplace.apply(func)  #這里只是將上一小節(jié)中的Series.map()換成了.apply()筋蓖，其余代碼一樣

對(duì) DataFrame 來說，apply 方法的作用對(duì)象是一行或一列數(shù)據(jù)（一個(gè)Series）

- axis為0或'index'：將函數(shù)應(yīng)用于每列退敦。
- axis為1或'columns'：將函數(shù)應(yīng)用于每一行粘咖。

def max_01(x):
    return x.max()

# heros.Sex.value_counts()[0]
heros.apply(func=max_01,axis=0)

輸出：
Hero Name      黑寡婦
Age           3000
Sex              男
Birthplace    阿斯加德
weapon          魔法
Power          140
dtype: object

pandas中map()、apply()侈百、applymap()的區(qū)別：

map()方法適用于Series對(duì)象瓮下，可以通過字典或函數(shù)類對(duì)象來構(gòu)建映射關(guān)系對(duì)Series對(duì)象進(jìn)行轉(zhuǎn)換忠聚；
apply()方法使用與Series對(duì)象、DataFrame對(duì)象唱捣、Groupby對(duì)象两蟀，處理的是行或列數(shù)據(jù)（本質(zhì)上處理的是單個(gè)Series），用函數(shù)類對(duì)象來構(gòu)建映射關(guān)系對(duì)Series對(duì)象進(jìn)行轉(zhuǎn)換震缭；
applymap()方法用來處理DataFrame對(duì)象的單個(gè)元素值赂毯，也是使用函數(shù)類對(duì)象映射轉(zhuǎn)換；

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末拣宰，一起剝皮案震驚了整個(gè)濱河市党涕，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌巡社，老刑警劉巖膛堤，帶你破解...
沈念sama閱讀 218,386評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異晌该，居然都是意外死亡肥荔，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,142評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門朝群，熙熙樓的掌柜王于貴愁眉苦臉地迎上來燕耿，“玉大人，你說我怎么就攤上這事姜胖∮В” “怎么了？”我有些...
開封第一講書人閱讀 164,704評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵右莱，是天一觀的道長(zhǎng)蚜锨。經(jīng)常有香客問我，道長(zhǎng)慢蜓，這世上最難降的妖魔是什么亚再？我笑而不...
開封第一講書人閱讀 58,702評(píng)論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮胀瞪，結(jié)果婚禮上针余，老公的妹妹穿的比我還像新娘饲鄙。我一直安慰自己凄诞，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,716評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布忍级。她就那樣靜靜地躺著帆谍，像睡著了一般。火紅的嫁衣襯著肌膚如雪轴咱。梳的紋絲不亂的頭發(fā)上汛蝙，一...
開封第一講書人閱讀 51,573評(píng)論 1贊 305
城市分裂傳說
那天烈涮，我揣著相機(jī)與錄音，去河邊找鬼窖剑。笑死坚洽，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的西土。我是一名探鬼主播讶舰，決...
沈念sama閱讀 40,314評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼需了！你這毒婦竟也來了跳昼？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,230評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤肋乍，失蹤者是張志新（化名）和其女友劉穎鹅颊，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體墓造，經(jīng)...
沈念sama閱讀 45,680評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡堪伍，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,873評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了觅闽。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片杠娱。...
茶點(diǎn)故事閱讀 39,991評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖谱煤，靈堂內(nèi)的尸體忽然破棺而出摊求，到底是詐尸還是另有隱情，我是刑警寧澤刘离，帶...
沈念sama閱讀 35,706評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布室叉，位于F島的核電站，受9級(jí)特大地震影響硫惕，放射性物質(zhì)發(fā)生泄漏茧痕。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,329評(píng)論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一恼除、第九天我趴在偏房一處隱蔽的房頂上張望踪旷。院中可真熱鬧，春花似錦豁辉、人聲如沸令野。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,910評(píng)論 0贊 22
一樁弒父案徽级，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)气破。三九已至，卻和暖如春餐抢，著一層夾襖步出監(jiān)牢的瞬間现使，已是汗流浹背低匙。一陣腳步聲響...
開封第一講書人閱讀 33,038評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留碳锈，地道東北人顽冶。一個(gè)月前我還...
沈念sama閱讀 48,158評(píng)論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像售碳，于是被迫代替她去往敵國(guó)和親渗稍。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,941評(píng)論 2贊 355

DataFrame描述統(tǒng)計(jì)秋秤、離散化、排序 (2020.04.09)