from pandas import read_csv
df = read_csv('D://PDA//4.3//data.csv')
df
#找出行重復的位置
dIndex = df.duplicated()
#根據(jù)某些列蹬挺,找出重復的位置
dIndex = df.duplicated('id')
dIndex = df.duplicated(['id', 'key'])
#根據(jù)返回值范嘱,把重復數(shù)據(jù)提取出來
df[dIndex]
id? key? ? ? ? ? value
4? 1251147? ? 品牌? ? ? ? ? Apple
5? 1251147? 商品名稱? 蘋果iPad mini 3
#直接刪除重復值
#默認根據(jù)所有的列厨埋,進行刪除
newDF = df.drop_duplicates()
#當然也可以指定某一列馏段,進行重復值處理
newDF = df.drop_duplicates('id')