python基礎(chǔ):數(shù)據(jù)分析常用包

本文重點(diǎn)介紹pyhon最常用的幾個(gè)庫(kù):

1. SymPy

SymPy是python一個(gè)科學(xué)計(jì)算庫(kù)抢腐,有一套強(qiáng)大的科學(xué)計(jì)算體系怠惶,覆蓋了從基本的符號(hào)運(yùn)算到計(jì)算數(shù)學(xué)、代數(shù)學(xué)家制、離散數(shù)學(xué)、量子物理等多個(gè)領(lǐng)域泡一〔梗可以完成諸如多項(xiàng)式求值、求極限鼻忠、解方程涵但、微分方程、級(jí)數(shù)展開(kāi)帖蔓、矩陣運(yùn)算等等計(jì)算問(wèn)題矮瘟。

雖然Matlab的類(lèi)似科學(xué)計(jì)算能力也很強(qiáng)大,但是Python以其語(yǔ)法簡(jiǎn)單塑娇、易上手澈侠、異常豐富的三方庫(kù)生態(tài),個(gè)人認(rèn)為可以更優(yōu)雅地解決日常遇到的各種計(jì)算問(wèn)題埋酬。

2. Numpy

Numpy是用于數(shù)據(jù)分析哨啃、機(jī)器學(xué)習(xí)烧栋、科學(xué)計(jì)算的重要軟件包。它極大的簡(jiǎn)化了向量矩的操作及處理拳球。Python的不少數(shù)據(jù)處理軟件包依賴于Numpy作為其基礎(chǔ)架構(gòu)的核心部分(如Scikit-learn, Scipy, Pandas和tensflow等)

3. Scipy

Scipy是一個(gè)科學(xué)計(jì)算工具包审姓,可以處理插值、積分祝峻、優(yōu)化魔吐、圖像處理、常微分方程數(shù)據(jù)解的求解莱找、信息處理等問(wèn)題酬姆。它是基于Numpy搭建的∷尉啵可用于有效計(jì)算Numpy矩陣轴踱,使Numpy和Scipy協(xié)同工作,高效解決問(wèn)題

4. Scikit Learn(sklearn)

Sklearn是一個(gè)機(jī)器學(xué)習(xí)包谚赎,它是基于Numpy, Scipy和matplotlib搭建。它的主要功能分為六大部分:分類(lèi)诱篷、回歸壶唤、聚類(lèi)、數(shù)據(jù)降維棕所、模型選擇和數(shù)據(jù)預(yù)處理闸盔,性能也很不錯(cuò)。

不過(guò)琳省,sklearn不支持深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)迎吵,不支持圖模型和序列預(yù)測(cè),同時(shí)也不支持python之外的語(yǔ)言针贬,不支持PyPy也不支持GPU加速击费。

常用子模塊有:

分類(lèi) :SVM , K近鄰 桦他,隨機(jī)森林 蔫巩, 邏輯回歸等。
回歸 :Lasso ,嶺回歸 等快压。
聚類(lèi) :K-means ,譜聚類(lèi)等圆仔。
降維 :PCA ,特征選擇 ,矩陣分解等蔫劣。
模型選擇 :網(wǎng)格搜索坪郭, 交叉驗(yàn)證 ,指標(biāo)矩陣脉幢。
預(yù)處理: 特征提取歪沃,正態(tài)化信姓。
5. Statsmodels

Statsmodels用于擬合統(tǒng)計(jì)模型、參數(shù)據(jù)估計(jì)绸罗、假設(shè)檢驗(yàn)意推、不確定性評(píng)估以及數(shù)據(jù)探索和可視化。相比sklearn珊蟀,statsmodels更側(cè)重于統(tǒng)計(jì)推理菊值、p值和不確定性評(píng)價(jià)。常用子模塊包括:

回歸模型:線性回歸 育灸,通用線性回歸腻窒,魯邦線性模型  ,線性混合效應(yīng)模型等磅崭。
方差分析(ANOVA)
時(shí)間序列分析:AR , ARMA , ARIMA , VAR等儿子。
非參數(shù)方法: 核密度估計(jì) , 核回歸砸喻。
統(tǒng)計(jì)模型結(jié)果可視化柔逼。
6. Matplotlib

Matplotlib是python中類(lèi)似于matlab的繪圖工具,實(shí)際上matplotlib有一套完全依照MATLAB的函數(shù)形式的繪圖接口割岛,在matplot.pyplot模塊中愉适,這套函數(shù)接口方便MATLAB用戶過(guò)度到matplotlib

7. Seaborn

Seaborn在matplotlib基礎(chǔ)上進(jìn)行封裝的,但seaborn是針對(duì)統(tǒng)計(jì)繪圖的癣漆。一般來(lái)說(shuō)维咸,seaborn能滿足數(shù)據(jù)分析90%的的繪圖需求。

Seaborn旨在使可視化成為探索和理解數(shù)據(jù)的核心部分惠爽。其面向數(shù)據(jù)集的繪圖功能對(duì)包含整個(gè)數(shù)據(jù)集的數(shù)據(jù)框和數(shù)據(jù)組進(jìn)行操作癌蓖,并在內(nèi)部執(zhí)行必要的語(yǔ)義映射和統(tǒng)計(jì)聚合,以生成信息圖婚肆。

Seaborn可以做熱力圖租副、散點(diǎn)圖、直方圖旬痹、箱形圖附井、樹(shù)形圖、熱點(diǎn)圖等等

8. Pandas

Pandas是基于Numpy數(shù)組構(gòu)建的两残,專(zhuān)門(mén)為處理表格和混雜數(shù)據(jù)設(shè)的永毅,而Numpy更適合處理統(tǒng)一的數(shù)據(jù)數(shù)組數(shù)據(jù)。

參考資料:

  1. https://blog.csdn.net/cj151525/article/details/95756847

  2. https://www.cnblogs.com/jeshy/p/11165919.html

  3. http://www.reibang.com/p/6c742912047f

  4. http://www.reibang.com/p/cacbc6674984

  5. http://www.reibang.com/p/e45558ccf533

  6. http://www.reibang.com/p/da385a35f68d

  7. https://www.cnblogs.com/abdm-989/p/12204640.html

  8. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末人弓,一起剝皮案震驚了整個(gè)濱河市沼死,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌崔赌,老刑警劉巖意蛀,帶你破解...
    沈念sama閱讀 211,639評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件耸别,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡县钥,警方通過(guò)查閱死者的電腦和手機(jī)秀姐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)若贮,“玉大人省有,你說(shuō)我怎么就攤上這事∏绰螅” “怎么了蠢沿?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,221評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)匾效。 經(jīng)常有香客問(wèn)我舷蟀,道長(zhǎng),這世上最難降的妖魔是什么面哼? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,474評(píng)論 1 283
  • 正文 為了忘掉前任野宜,我火速辦了婚禮,結(jié)果婚禮上精绎,老公的妹妹穿的比我還像新娘速缨。我一直安慰自己,他們只是感情好代乃,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,570評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著仿粹,像睡著了一般搁吓。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上吭历,一...
    開(kāi)封第一講書(shū)人閱讀 49,816評(píng)論 1 290
  • 那天堕仔,我揣著相機(jī)與錄音,去河邊找鬼晌区。 笑死摩骨,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的朗若。 我是一名探鬼主播恼五,決...
    沈念sama閱讀 38,957評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼哭懈!你這毒婦竟也來(lái)了灾馒?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,718評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤遣总,失蹤者是張志新(化名)和其女友劉穎睬罗,沒(méi)想到半個(gè)月后轨功,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,176評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡容达,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,511評(píng)論 2 327
  • 正文 我和宋清朗相戀三年古涧,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片花盐。...
    茶點(diǎn)故事閱讀 38,646評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡羡滑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出卒暂,到底是詐尸還是另有隱情啄栓,我是刑警寧澤,帶...
    沈念sama閱讀 34,322評(píng)論 4 330
  • 正文 年R本政府宣布也祠,位于F島的核電站昙楚,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏诈嘿。R本人自食惡果不足惜堪旧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,934評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望奖亚。 院中可真熱鬧淳梦,春花似錦、人聲如沸昔字。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,755評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)作郭。三九已至陨囊,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間夹攒,已是汗流浹背蜘醋。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,987評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留咏尝,地道東北人压语。 一個(gè)月前我還...
    沈念sama閱讀 46,358評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像编检,于是被迫代替她去往敵國(guó)和親胎食。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,514評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容