檢查重復(fù)值duplicated()
Duplicated函數(shù)功能:查找并顯示數(shù)據(jù)表中的重復(fù)值
這里需要注意的是:
- 當(dāng)兩條記錄中所有的數(shù)據(jù)都相等時duplicated函數(shù)才會判斷為重復(fù)值
- duplicated支持從前向后(first),和從后向前(last)兩種重復(fù)值查找模式
- 默認(rèn)是從前向后進(jìn)行重復(fù)值的查找和判斷辨液,也就是后面的條目在重復(fù)值判斷中顯示為True
1.查詢重復(fù)值的位置
data.duplicated() #返回布爾型數(shù)據(jù)虐急,告訴重復(fù)值的位置
image.png
2.檢查有多少重復(fù)值
data.duplicated().sum() #說明有4個重復(fù)值
image.png
3.打印重復(fù)值
data[data.duplicated()]#打印重復(fù)值
或者
data[data.duplicated()==True]#打印重復(fù)值
image.png
4.打印非重復(fù)值
data[data.duplicated()==False]#打印重復(fù)值
5.刪除重復(fù)記錄(drop_duplicates())
drop_duplicates函數(shù)功能是:刪除數(shù)據(jù)表中的重復(fù)值,判斷標(biāo)準(zhǔn)和邏輯與duplicated函數(shù)一樣
#inplace=True表示直接在源數(shù)據(jù)上進(jìn)行操作
data.drop_duplicates(inplace=True)
6.重置索引reset_index
data.reset_index()