隨著大數(shù)據(jù)時代的到來员凝,數(shù)據(jù)挖掘和分析從原來單調的技能棧開始走向多元化,很多excel可以勝任的工作開始變得力不從心奋献,office2010以來健霹,單sheet可以處理的行數(shù)從2的16次方(65536)變成了現(xiàn)在的2的20次方(1048576),但是面對動輒GB\TB乃至PB級別的數(shù)據(jù),在很多情況下顯得無能為力瓶蚂。
鑒于此骤公,hadoop,hive,mysql,【R,SAS,Python,spss】均成為一個合格的數(shù)據(jù)分析師所必備的技能,而pandas則使得Python在數(shù)據(jù)分析領域中成為璀璨的一顆明星扬跋,筆者通讀了pandas官方文檔阶捆,結合自己的數(shù)據(jù)分析經(jīng)驗,對文檔做了翻譯工作钦听,一方面加深自己的印象洒试,一方面造福廣大網(wǎng)友,也算是GNU精神的一種傳承吧朴上。
翻譯計劃如下:打算用10篇文章來完成 Python Cookbook的整體翻譯工作垒棋,接下來會有10篇左右的博客來結合具體分析案例呈獻給數(shù)據(jù)分析的同仁們。
閑言少敘痪宰,書歸正傳叼架。