bins = [0, 1, 2, 3, 5, pd.np.inf]
labels = ['0-1', '1-2', '2-3', '3-5', '5以上']
df['category'] = pd.cut(df['t'], bins=bins, labels=labels).to_list()
pd.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False,duplicates='raise')
x : 一維數(shù)組
bins :整數(shù),標(biāo)量序列或者間隔索引,是進(jìn)行分組的依據(jù)唤反,
如果填入整數(shù)n旦棉,則表示將x中的數(shù)值分成等寬的n份(即每一組內(nèi)的最大值與最小值之差約相等);
如果是標(biāo)量序列歌焦,序列中的數(shù)值表示用來分檔的分界值
如果是間隔索引,“ bins”的間隔索引必須不重疊
right :布爾值,默認(rèn)為True表示包含最右側(cè)的數(shù)值
當(dāng)“ right = True”(默認(rèn)值)時(shí)吭服,則“ bins”=[1、2蝗罗、3艇棕、4]表示(1,2],(2,3],(3,4]
當(dāng)bins是一個(gè)間隔索引時(shí)串塑,該參數(shù)被忽略沼琉。
labels : 數(shù)組或布爾值,可選.指定分箱的標(biāo)簽
如果是數(shù)組桩匪,長度要與分箱個(gè)數(shù)一致打瘪,比如“ bins”=[1、2傻昙、3闺骚、4]表示(1,2],(2,3],(3,4]一共3個(gè)區(qū)間妆档,則labels的長度也就是標(biāo)簽的個(gè)數(shù)也要是3
如果為False僻爽,則僅返回分箱的整數(shù)指示符,即x中的數(shù)據(jù)在第幾個(gè)箱子里
當(dāng)bins是間隔索引時(shí)过吻,將忽略此參數(shù)
retbins: 是否顯示分箱的分界值进泼。默認(rèn)為False,當(dāng)bins取整數(shù)時(shí)可以設(shè)置retbins=True以顯示分界值纤虽,得到劃分后的區(qū)間
precision:整數(shù)乳绕,默認(rèn)3,存儲和顯示分箱標(biāo)簽的精度逼纸。
include_lowest:布爾值洋措,表示區(qū)間的左邊是開還是閉,默認(rèn)為false杰刽,也就是不包含區(qū)間左邊菠发。
duplicates:如果分箱臨界值不唯一王滤,則引發(fā)ValueError或丟棄非唯一