上一篇文章帶大家一起了解了Pandas庫中的DataFrames的多級索引峡谊,本文是Python大數(shù)據(jù)與機(jī)器學(xué)習(xí)系列文章中的第13篇拗引,將帶大家一起了解一下Pandas的小技巧——數(shù)據(jù)補(bǔ)全勾拉。在這里還是要推薦下我自己建的Python開發(fā)學(xué)習(xí)群:483546416,群里都是學(xué)Python開發(fā)的他巨,如果你正在學(xué)習(xí)Python 澡匪,小編歡迎你加入,大家都是軟件開發(fā)黨拆融,不定期分享干貨(只有Python軟件開發(fā)相關(guān)的)蠢琳,包括我自己整理的一份2018最新的Python進(jìn)階資料和高級開發(fā)教程啊终,歡迎進(jìn)階中和進(jìn)想深入Python的小伙伴
實(shí)戰(zhàn)練習(xí)
在Jupyter Notebook上執(zhí)行以下代碼:
import numpy as np
import pandas as pd
df = pd.DataFrame({'A':[1,2,np.nan],
'B':[5,np.nan,np.nan],
'C':[1,2,3]})
df
刪除具有控制的行
df.dropna()
刪除掉含有空值的列
df.dropna(axis=1)
刪除掉空值數(shù)大于等于2的行。
df.dropna(thresh=2)
將某個(gè)值填充到空值中傲须。
df.fillna(value='FILL VALUE')
還可以將A列的平均值填充到空值中蓝牲。
df['A'].fillna(value=df['A'].mean())
進(jìn)度介紹
本系列文章共分為26個(gè)部分目前已經(jīng)進(jìn)行到了第6部分,所有內(nèi)容計(jì)劃如下:
預(yù)熱
環(huán)境搭建
Jupyter教程
Python速成
Python數(shù)據(jù)分析泰讽,NumPy庫的使用
Python數(shù)據(jù)分析例衍,Pandas庫的使用
Python數(shù)據(jù)分析,Pandas庫練習(xí)
Python數(shù)據(jù)可視化菇绵,Matplotlib
Python數(shù)據(jù)可視化肄渗,Seaborn
Python數(shù)據(jù)可視化,Pandas內(nèi)建數(shù)據(jù)可視化
Python數(shù)據(jù)可視化咬最,Plotly和Cufflinks
Python數(shù)據(jù)可視化翎嫡,Geographical Plotting
數(shù)據(jù) Capstone 項(xiàng)目
機(jī)器學(xué)習(xí)介紹
線性回歸
交叉驗(yàn)證與偏方差
邏輯回歸算法
k-近鄰算法
決策樹與隨機(jī)森林
支持向量機(jī)
k-means聚類
主成分分析
推薦系統(tǒng)
自然語言處理(NLP)
Python大數(shù)據(jù)與Spark
神經(jīng)網(wǎng)絡(luò)(NN)與深度學(xué)習(xí)(DL)