數(shù)據(jù)抽樣里最常見的四種方法:簡單隨機抽樣卖氨、系統(tǒng)抽樣会烙、分層抽樣和整群抽樣负懦。
大數(shù)據(jù)其實不是數(shù)據(jù)抽樣的終結(jié)者,無論是大數(shù)據(jù)還是小數(shù)據(jù)柏腻,它都無法逃離統(tǒng)計學(xué)纸厉、數(shù)學(xué)、集合論五嫂、數(shù)據(jù)結(jié)構(gòu)等這些基礎(chǔ)理論的約束颗品。所以我之前給你講的數(shù)據(jù)分析的原理,也同樣適用于大數(shù)據(jù)環(huán)境沃缘。
如果你能把數(shù)據(jù)抽樣的這個“渦輪加速器”運用到你自己的工作和生活當中躯枢,那么你就可以事半而功倍,通過針對一小部分的人和事情的觀察而看到整個事物的整體情況槐臀。古人說“管中窺豹锄蹂,可見一斑”,那么對應(yīng)到我們的數(shù)據(jù)分析上水慨,說的就是合適的數(shù)據(jù)抽樣算法能夠由點及面地看到事物的全貌得糜。
思:對全量數(shù)據(jù)的處理效率很低,有時候也不可能晰洒,所以需要采用抽樣的方式來從點到面看到全貌掀亩。抽樣包括簡單隨機抽樣、系統(tǒng)抽樣欢顷、分層抽樣槽棍、整群抽樣。
大數(shù)據(jù)時代同樣需要利用到抽樣技術(shù)抬驴,一方面消除數(shù)據(jù)的偏差炼七,一方面提高計算效率。
此文章為11月Day28學(xué)習筆記布持,內(nèi)容來源于極客時間《數(shù)據(jù)分析思維課》豌拙,強烈推薦該課