在進行數(shù)據(jù)分析的過程中秉宿,我們常常會根據(jù)不同變量做去重處理,有單一變量和多變量處理兩種情況
單一變量去重
result <-rawdata[!duplicated(rawdata$Topic),]
result <-rawdata[unique(rawdata$Topic),]
使用這兩種方法,獲得的結(jié)果是一樣的缰揪,其中rawdata[XXXXX,]的作用是提取選中的行數(shù)據(jù),同理急膀,rawdata[,XXXXX]則是提取選中的列數(shù)據(jù)
unique() 和 !duplicated() 是提取去重后的所在行的相關(guān)變量
多變量去重
按照Topic以及Sentiment進行去重,方法如下龄捡,該方法適用于>=2以上的參數(shù)進行去重
result<-rawdata[!duplicated(rawdata[,c('Topic','Sentiment')]),]