【導(dǎo)語】在做數(shù)據(jù)分析時(shí)都會(huì)用到 Pandas厢拭。雖然 Pandas 的功能十分強(qiáng)大它匕。但是實(shí)際用的時(shí)候,并不能快速的找到對(duì)應(yīng)的解決方案寞射,那么其實(shí)Pandas官方早就提供了一份知識(shí)框架渔工,放在了Github上。
地址:https://github.com/pandas-dev/pandas/tree/master/doc/cheatsheet
這兩張圖片一共歸納了13類常用的Pandas操作桥温,下面我們就來簡(jiǎn)單看一看引矩。
1、數(shù)據(jù)創(chuàng)建
介紹了幾種常用的DataFrame創(chuàng)建語法
2侵浸、數(shù)據(jù)重塑
這部分主要是一些在數(shù)據(jù)清洗中常用的方法旺韭,比如數(shù)據(jù)連接、數(shù)據(jù)排序掏觉、數(shù)據(jù)刪除等区端,并且還對(duì)四個(gè)常用的操作給出了圖示,理解起來簡(jiǎn)直不要太方便澳腹!
3织盼、數(shù)據(jù)篩選
這一塊區(qū)域主要是分別用行/列來講解一些常用的數(shù)據(jù)查看、抽樣酱塔、切片等操作沥邻,包含了tail
、head
羊娃、loc
唐全、iloc
等非常重要的方法,并且同樣給出了部分動(dòng)畫便于理解
4蕊玷、數(shù)據(jù)探索
這一塊主要給出了一些在進(jìn)行探索性分析時(shí)常用的方法邮利,比如max
、min
垃帅、count
等延届,不過官方將apply放在這里,并沒有展開講解
5挺智、數(shù)據(jù)修改
這兩個(gè)區(qū)域?yàn)槿笔е堤幚砗蛣?chuàng)建新的列祷愉,重點(diǎn)用動(dòng)畫示例了assign
和qcut
方法,缺失值處理部分僅給出了兩個(gè)方法赦颇,應(yīng)該是偷懶了
6二鳄、數(shù)據(jù)分組
主要就是groupby
和相關(guān)方法
7、數(shù)據(jù)連接
這里介紹的還是非常詳細(xì)媒怯!用圖片例子來展示pd.merge
中的各種參數(shù)變化的不同订讼,一看就懂
8、繪制圖表
繪制可視化圖表是Pandas的一個(gè)重要功能扇苞。不過受限于篇幅欺殿,官方在這里僅僅是一筆帶過寄纵。
大家應(yīng)該能看出來,這是一份提綱挈領(lǐng)的“學(xué)習(xí)線索”脖苏,為你理清思路程拭,指明方向。但是僅僅靠著兩張圖片是不可能把所有內(nèi)容就弄明白的棍潘,它更像是我們考試前劃的“復(fù)習(xí)重點(diǎn)”恃鞋。通過這兩張表,我們可以了解哪些操作可以用Pandas完成亦歉,以及在你不確定用什么方法處理數(shù)據(jù)時(shí)恤浪,快速查到Pandas中的哪個(gè)函數(shù)可以做到。因?yàn)槲⑿艜?huì)對(duì)圖片進(jìn)行壓縮肴楷,所以可以直接訪問項(xiàng)目地址水由。
希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來一定的幫助,每天進(jìn)步一點(diǎn)點(diǎn)赛蔫,加油?砂客。