2答恶、data.table包
這個(gè)包讓你可以更快地完成數(shù)據(jù)集的數(shù)據(jù)處理工作。放棄選取行或列子集的傳統(tǒng)方法挣跋,用這個(gè)包進(jìn)行數(shù)據(jù)處理三圆。用最少的代碼,你可以做最多的事浆劲。相比使用data.frame嫌术,data.table可以幫助你減少運(yùn)算時(shí)間。你一定會(huì)對這個(gè)包的簡潔性感到震驚牌借。
一個(gè)數(shù)據(jù)表格包含三部分度气,即DT[i, j, by]。你可以理解為我們告訴R用i來選出行的子集膨报,并計(jì)算通過by來分組的j磷籍。大多數(shù)時(shí)候适荣,by是用于類別變量的。在下面的代碼中院领,我用了兩個(gè)數(shù)據(jù)集(airquality和iris)弛矛。
**第一步、加載數(shù)據(jù)比然,加載data.table包**
**第二步丈氓、把數(shù)據(jù)轉(zhuǎn)換成data.table格式**
如果你學(xué)習(xí)過python語言,你應(yīng)該比較熟悉强法。這個(gè)包和Python中的dataframe很相似万俗。可以索引查詢饮怯。
**第三步闰歪、按照你想要的查詢**
**記住,一定是[]符號(hào)才能索引data[a,b]表示a行蓖墅,b列库倘。逗號(hào)前不寫,則表明查找滿足列的條件的所有行论矾。**
還可以多條件查詢教翩。如上所示。
有問題拇囊,歡迎留言迂曲。
感謝關(guān)注!A认路捧!
CSDN同步更加精彩---ID:weixin_45098535