tushare中的get_k_data的去重問題

由于獲取數(shù)據(jù)的時限性荞下,在日線以下的數(shù)據(jù)枪萄,比如小時線只能獲取一定時間范圍隐岛,超過該時間就無法再獲取了。根據(jù)實測瓷翻,60分鐘線大約能保存6個月的數(shù)據(jù)聚凹,5分鐘線約保存15天數(shù)據(jù),因此在實際數(shù)據(jù)處理過程中逻悠,需要定期保存元践。

每次處理需要讀取舊數(shù)據(jù)df1韭脊,再讀取新數(shù)據(jù)df2童谒,df1和df2的數(shù)據(jù)必然會有重復,因此需要合并后的數(shù)據(jù)去重后進行保存沪羔。

dataframe中用于去重的函數(shù)為drop_duplicates() 饥伊,默認整行數(shù)據(jù)均相同才去重,也可以指定某索引進行單獨去重蔫饰。

    #獲取第一個df
    df1 = ts.get_k_data('510050', start='2014-02-21',end='2014-04-01',ktype='D',autype='qfq')
    #重構索引
    df1.set_index(['date'], inplace = True)   
    #獲取第二個df
    df2 = ts.get_k_data('510050', start='2014-01-01',end='2014-04-01',ktype='D',autype='qfq')
    #重構索引
    df2.set_index(['date'], inplace = True) 
    #兩個dataframe合并
    df_new=pd.concat([df1, df2])
    #檢查去重
    df_new = df_new.drop_duplicates()  
    #按照索引[日期]進行排序琅豆,升序
    print(df_new.sort_index(ascending = True))

小坑一個:

實際去重操作會產(chǎn)生很大的問題,因為正常情況下df1是讀取本地csv文件篓吁,df2是使用get_k_data獲取的數(shù)據(jù)茫因,這兩者的去重無法實現(xiàn),推斷是數(shù)據(jù)格式的問題杖剪,這個問題至今無法解決冻押,只能采用變通的方法驰贷,即df2的實時數(shù)據(jù)讀取后保存再讀取,以便和df1的數(shù)據(jù)格式保持一致洛巢,這樣才能進行去重操作括袒,雖然系統(tǒng)開銷比較大,但也只能如此了

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末稿茉,一起剝皮案震驚了整個濱河市锹锰,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌漓库,老刑警劉巖恃慧,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異渺蒿,居然都是意外死亡糕伐,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進店門蘸嘶,熙熙樓的掌柜王于貴愁眉苦臉地迎上來良瞧,“玉大人,你說我怎么就攤上這事训唱∪祢牵” “怎么了?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵况增,是天一觀的道長赞庶。 經(jīng)常有香客問我,道長澳骤,這世上最難降的妖魔是什么歧强? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮为肮,結果婚禮上摊册,老公的妹妹穿的比我還像新娘。我一直安慰自己颊艳,他們只是感情好茅特,可當我...
    茶點故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著棋枕,像睡著了一般白修。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上重斑,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天兵睛,我揣著相機與錄音,去河邊找鬼。 笑死祖很,一個胖子當著我的面吹牛累盗,可吹牛的內容都是我干的。 我是一名探鬼主播突琳,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼若债,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了拆融?” 一聲冷哼從身側響起蠢琳,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎镜豹,沒想到半個月后傲须,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡趟脂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年泰讽,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片昔期。...
    茶點故事閱讀 38,605評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡已卸,死狀恐怖,靈堂內的尸體忽然破棺而出硼一,到底是詐尸還是另有隱情累澡,我是刑警寧澤,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布般贼,位于F島的核電站愧哟,受9級特大地震影響,放射性物質發(fā)生泄漏哼蛆。R本人自食惡果不足惜蕊梧,卻給世界環(huán)境...
    茶點故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望腮介。 院中可真熱鬧肥矢,春花似錦、人聲如沸萤厅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽惕味。三九已至,卻和暖如春玉锌,著一層夾襖步出監(jiān)牢的瞬間名挥,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工主守, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留禀倔,地道東北人榄融。 一個月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像救湖,于是被迫代替她去往敵國和親愧杯。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,472評論 2 348