Apply:
利用df.apply(func)的方法可以將函數(shù)func應(yīng)用于DataFrame。
頻率統(tǒng)計(jì):
df.value_counts() 可以統(tǒng)計(jì)df中各元素出現(xiàn)的頻率
字符串操作:
DataFrame 包含了一系列對(duì)于字符串的操作:
str方法還可以對(duì)索引進(jìn)行操作:
使用split方法可以將元素進(jìn)行分割,返回的是裝有一組list的Series:
可以使用get或[]對(duì)分割后list中的元素進(jìn)行訪問(wèn):
split方法中的expand參數(shù)奈偏,可以選擇是否將結(jié)果輸出為dataframe:
元素的拼接:
將一個(gè)Series拼接成字符串:
正常情況下麻献,NaN在拼接時(shí)被忽略,你也可以選擇使用na_rep變量來(lái)指定替代NaN的字符:
cat()可以接受一個(gè)類(lèi)似list作為第一個(gè)參數(shù)灯节。在這種情況下,Series的各元素將依次與參數(shù)中包含的各元素進(jìn)行拼接。NaN與其他元素拼接仍為NaN:
join參數(shù)拆讯,兩個(gè)Series的拼接可以輸入join參數(shù),其原理與SQL的join原理相似养叛。join的可選值為:?'left',?'outer',?'inner',?'right'种呐。(注:join需要0.23.0以上的版本)
contains(等價(jià)于match)函數(shù)可以檢查Series中的元素是否含有相應(yīng)格式的部分:
合并:
concat:
利用concat方法可以將不同的dataframe對(duì)象拼接。
merge方法可以將dataframe進(jìn)行SQL風(fēng)格的合并:
groupby方法可將元素進(jìn)行分組弃甥,需要對(duì)分組對(duì)象應(yīng)用相應(yīng)的方法生成合適的數(shù)據(jù)結(jié)構(gòu):
時(shí)間序列:
如果DataFrame的數(shù)據(jù)是一定頻率的數(shù)據(jù)爽室,resample函數(shù)可以用來(lái)改變頻率: