一、數(shù)據(jù)集 背景概述 這個(gè)數(shù)據(jù)集是模擬 Starbucks rewards 移動(dòng) app 上考蕾,某一種飲品的推送和用戶消費(fèi)數(shù)據(jù)祸憋。每隔幾天会宪,星巴克會(huì)向 app 的用戶發(fā)送一些推送...
之前有一篇閑扯Tableau的文章讀者蠻多的肖卧。那一篇的寫作的過程也幫助我梳理了之前很多零碎的想法。正好最近幾個(gè)星期又重讀了一些自己領(lǐng)域的文獻(xiàn)掸鹅。再次整理下自己不成熟的想法塞帐。 這...
通俗統(tǒng)計(jì)之——如何計(jì)算統(tǒng)計(jì)功效(部分內(nèi)容受教于網(wǎng)絡(luò)葵姥,經(jīng)個(gè)人理解闡述于此荷鼠,不限版權(quán),盡管轉(zhuǎn)載) 1. 何為‘統(tǒng)計(jì)功效’榔幸? 統(tǒng)計(jì)功效允乐,是用來描述,在你的實(shí)驗(yàn)研究中削咆,你的統(tǒng)計(jì)檢驗(yàn)正...
一、Rolling 和 Expanding rolling和expanding都是類似的歼狼,目的是查看股票市場(chǎng)價(jià)格隨著時(shí)間的變化掏导,不同的是rolling average算的是最...
一直苦于沒有系統(tǒng)學(xué)習(xí)seanborn的教程,似乎市面上也還沒有完整的官方文檔的學(xué)習(xí)資料羽峰。終于下決心用幾天的時(shí)間通讀下官方文檔碘菜,并把記錄下來。 基于官方0.71版本限寞,所有代碼和...
配置 所有運(yùn)行節(jié)點(diǎn)安裝 pyarrow 履植,需要 >= 0.8 為什么會(huì)有 pandas UDF 在過去的幾年中计雌,python 正在成為數(shù)據(jù)分析師的默認(rèn)語言。一些類似 pand...
Introducing Pandas UDF for PySpark 更新:此博客于 2018 年 2 月 22 日更新翁脆,以包含一些更改。 這篇博文在即將發(fā)布的 Apache...
sklearn、XGBoost、LightGBM的文檔閱讀小記 文章導(dǎo)航 目錄 1.sklearn集成方法 1.1.bagging 1.1.1.基本思想 1.1.2.常見變體...