看了幾個大佬的數(shù)據(jù)集劃分總覺得有些可能是后期進行過修改的扩氢,于是決定先用最簡單的數(shù)據(jù)集劃分方式,如下圖:
滑窗法以增加樣本
(修改:所有特征區(qū)間改為feature窗口效五,預(yù)測區(qū)間改為label窗口迅涮。feature區(qū)間-2取02/01-05/31棺亭,label窗口-2取06/01-06/30)
負樣本數(shù)量:977900
正樣本數(shù)量:75382
由這兩個數(shù)字得知正負樣本不均衡蝎宇,
看了幾個大佬的數(shù)據(jù)集劃分總覺得有些可能是后期進行過修改的扩氢,于是決定先用最簡單的數(shù)據(jù)集劃分方式,如下圖:
(修改:所有特征區(qū)間改為feature窗口效五,預(yù)測區(qū)間改為label窗口迅涮。feature區(qū)間-2取02/01-05/31棺亭,label窗口-2取06/01-06/30)
負樣本數(shù)量:977900
正樣本數(shù)量:75382
由這兩個數(shù)字得知正負樣本不均衡蝎宇,