python科學(xué)計(jì)算

python科學(xué)計(jì)算

1. NumPy
官網(wǎng):http://www.numpy.org/

NumPy 是科學(xué)應(yīng)用程序庫的主要軟件包之一,用于處理大型多維數(shù)組和矩陣值纱,它大量的高級(jí)數(shù)學(xué)函數(shù)集合和實(shí)現(xiàn)方法使得這些對(duì)象執(zhí)行操作成為可能嗜价。

**2. SciPy
官網(wǎng):https://scipy.org/scipylib/

科學(xué)計(jì)算的另一個(gè)核心庫是 SciPy鸭廷。它基于 NumPy,其功能也因此得到了擴(kuò)展偷卧。SciPy 主數(shù)據(jù)結(jié)構(gòu)又是一個(gè)多維數(shù)組,由 Numpy 實(shí)現(xiàn)吆倦。這個(gè)軟件包包含了幫助解決線性代數(shù)听诸、概率論、積分計(jì)算和許多其他任務(wù)的工具蚕泽。此外晌梨,SciPy 還封裝了許多新的 BLAS 和 LAPACK 函數(shù)。

3. Pandas**
官網(wǎng):https://pandas.pydata.org/

Pandas 是一個(gè) Python 庫须妻,提供高級(jí)的數(shù)據(jù)結(jié)構(gòu)和各種各樣的分析工具仔蝌。這個(gè)軟件包的主要特點(diǎn)是能夠?qū)⑾喈?dāng)復(fù)雜的數(shù)據(jù)操作轉(zhuǎn)換為一兩個(gè)命令。Pandas包含許多用于分組荒吏、過濾和組合數(shù)據(jù)的內(nèi)置方法敛惊,以及時(shí)間序列功能。

4. StatsModels** (Commits: 10067, Contributors: 153)
官網(wǎng):http://www.statsmodels.org/devel/

Statsmodels 是一個(gè) Python 模塊绰更,它為統(tǒng)計(jì)數(shù)據(jù)分析提供了許多機(jī)會(huì)瞧挤,例如統(tǒng)計(jì)模型估計(jì)、執(zhí)行統(tǒng)計(jì)測試等儡湾。在它的幫助下特恬,你可以實(shí)現(xiàn)許多機(jī)器學(xué)習(xí)方法并探索不同的繪圖可能性。
Python 庫不斷發(fā)展盒粮,不斷豐富新的機(jī)遇鸵鸥。因此奠滑,今年出現(xiàn)了時(shí)間序列的改進(jìn)和新的計(jì)數(shù)模型丹皱,即 GeneralizedPoisson、零膨脹模型(zero inflated models)和 NegativeBinomialP宋税,以及新的多元方法:因子分析摊崭、多元方差分析以及方差分析中的重復(fù)測量。

5. Matplotlib
官網(wǎng):https://matplotlib.org/index.html

Matplotlib 是一個(gè)用于創(chuàng)建二維圖和圖形的底層庫杰赛。藉由它的幫助呢簸,你可以構(gòu)建各種不同的圖標(biāo),從直方圖和散點(diǎn)圖到費(fèi)笛卡爾坐標(biāo)圖乏屯。此外根时,有許多流行的繪圖庫被設(shè)計(jì)為與matplotlib結(jié)合使用。

**6. Seaborn **
官網(wǎng):https://seaborn.pydata.org/

Seaborn 本質(zhì)上是一個(gè)基于 matplotlib 庫的高級(jí) API辰晕。它包含更適合處理圖表的默認(rèn)設(shè)置蛤迎。此外,還有豐富的可視化庫含友,包括一些復(fù)雜類型替裆,如時(shí)間序列校辩、聯(lián)合分布圖(jointplots)和小提琴圖(violin diagrams)。

7. Plotly *
官網(wǎng):https://plot.ly/python/

Plotly 是一個(gè)流行的庫辆童,它可以讓你輕松構(gòu)建復(fù)雜的圖形宜咒。該軟件包適用于交互式 Web 應(yīng)用程,可實(shí)現(xiàn)輪廓圖把鉴、三元圖和三維圖等視覺效果故黑。

**8. Bokeh **
官網(wǎng):https://bokeh.pydata.org/en/latest/

Bokeh 庫使用 JavaScript 小部件在瀏覽器中創(chuàng)建交互式和可縮放的可視化。該庫提供了多種圖表集合庭砍,樣式可能性(styling possibilities)倍阐,鏈接圖、添加小部件和定義回調(diào)等形式的交互能力逗威,以及許多更有用的特性峰搪。

9. Pydot* (Commits: 169, Contributors: 12)
官網(wǎng):https://pypi.org/project/pydot/

Pydot 是一個(gè)用于生成復(fù)雜的定向圖和無向圖的庫。它是用純 Python 編寫的Graphviz 接口凯旭。在它的幫助下概耻,可以顯示圖形的結(jié)構(gòu),這在構(gòu)建神經(jīng)網(wǎng)絡(luò)和基于決策樹的算法時(shí)經(jīng)常用到罐呼。

10. Scikit-learn

官網(wǎng):http://scikit-learn.org/stable/

這個(gè)基于 NumPy 和 SciPy 的 Python 模塊是處理數(shù)據(jù)的最佳庫之一鞠柄。它為許多標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘任務(wù)提供算法,如聚類嫉柴、回歸厌杜、分類、降維和模型選擇计螺。

**11. XGBoost / LightGBM / CatBoost **

http://xgboost.readthedocs.io/en/latest/

http://lightgbm.readthedocs.io/en/latest/Python-Intro.html

https://github.com/catboost/catboost

梯度增強(qiáng)算法是最流行的機(jī)器學(xué)習(xí)算法之一夯尽,它是建立一個(gè)不斷改進(jìn)的基本模型,即決策樹登馒。因此匙握,為了快速、方便地實(shí)現(xiàn)這個(gè)方法而設(shè)計(jì)了專門庫陈轿。就是說圈纺,我們認(rèn)為 XGBoost、LightGBM 和 CatBoost 值得特別關(guān)注麦射。它們都是解決常見問題的競爭者蛾娶,并且使用方式幾乎相同。這些庫提供了高度優(yōu)化的潜秋、可擴(kuò)展的蛔琅、快速的梯度增強(qiáng)實(shí)現(xiàn),這使得它們在數(shù)據(jù)科學(xué)家和 Kaggle 競爭對(duì)手中非常流行半等,因?yàn)樵谶@些算法的幫助下贏得了許多比賽揍愁。

12. Eli5 (
官網(wǎng):https://eli5.readthedocs.io/en/latest/

通常情況下呐萨,機(jī)器學(xué)習(xí)模型預(yù)測的結(jié)果并不完全清楚,這正是 Eli5 幫助應(yīng)對(duì)的挑戰(zhàn)莽囤。它是一個(gè)用于可視化和調(diào)試機(jī)器學(xué)習(xí)模型并逐步跟蹤算法工作的軟件包谬擦,為 scikit-learn、XGBoost朽缎、LightGBM惨远、lightning 和 sklearn-crfsuite 庫提供支持,并為每個(gè)庫執(zhí)行不同的任務(wù)话肖。

*13. TensorFlow
官網(wǎng):https://www.tensorflow.org/

TensorFlow 是一個(gè)流行的深度學(xué)習(xí)和機(jī)器學(xué)習(xí)框架北秽,由 Google Brain 開發(fā)。它提供了使用具有多個(gè)數(shù)據(jù)集的人工神經(jīng)網(wǎng)絡(luò)的能力最筒。在最流行的 TensorFlow應(yīng)用中有目標(biāo)識(shí)別贺氓、語音識(shí)別等。在常規(guī)的 TensorFlow 上也有不同的 leyer-helper床蜘,如 tflearn辙培、tf-slim、skflow 等邢锯。

14. PyTorch
官網(wǎng):https://pytorch.org/

PyTorch 是一個(gè)大型框架扬蕊,它允許使用 GPU 加速執(zhí)行張量計(jì)算,創(chuàng)建動(dòng)態(tài)計(jì)算圖并自動(dòng)計(jì)算梯度丹擎。在此之上尾抑,PyTorch 為解決與神經(jīng)網(wǎng)絡(luò)相關(guān)的應(yīng)用程序提供了豐富的 API。該庫基于 Torch蒂培,是用 C 實(shí)現(xiàn)的開源深度學(xué)習(xí)庫再愈。

**15. Keras *

官網(wǎng):https://keras.io/

Keras 是一個(gè)用于處理神經(jīng)網(wǎng)絡(luò)的高級(jí)庫,運(yùn)行在 TensorFlow毁渗、Theano 之上践磅,現(xiàn)在由于新版本的發(fā)布,還可以使用 CNTK 和 MxNet 作為后端灸异。它簡化了許多特定的任務(wù),并且大大減少了單調(diào)代碼的數(shù)量羔飞。然而肺樟,它可能不適合某些復(fù)雜的任務(wù)。

**16. Dist-keras / elephas / spark-deep-learning **

官網(wǎng):http://joerihermans.com/work/distributed-keras/
https://pypi.org/project/elephas/

https://databricks.github.io/spark-deep-learning/site/index.html

隨著越來越多的用例需要花費(fèi)大量的精力和時(shí)間逻淌,深度學(xué)習(xí)問題變得越來越重要么伯。然而,使用像 Apache Spark 這樣的分布式計(jì)算系統(tǒng)卡儒,處理如此多的數(shù)據(jù)要容易得多田柔,這再次擴(kuò)展了深入學(xué)習(xí)的可能性俐巴。因此,dist-keras硬爆、elephas 和 spark-deep-learning 都在迅速流行和發(fā)展欣舵,而且很難挑出一個(gè)庫,因?yàn)樗鼈兌际菫榻鉀Q共同的任務(wù)而設(shè)計(jì)的缀磕。這些包允許你在 Apache Spark 的幫助下直接訓(xùn)練基于 Keras 庫的神經(jīng)網(wǎng)絡(luò)缘圈。Spark-deep-learning 還提供了使用 Python 神經(jīng)網(wǎng)絡(luò)創(chuàng)建管道的工具。

17. NLTK

官網(wǎng):https://www.nltk.org/

NLTK 是一組庫袜蚕,一個(gè)用于自然語言處理的完整平臺(tái)糟把。在 NLTK 的幫助下,你可以以各種方式處理和分析文本牲剃,對(duì)文本進(jìn)行標(biāo)記和標(biāo)記遣疯,提取信息等。NLTK 也用于原型設(shè)計(jì)和建立研究系統(tǒng)凿傅。

18. SpaCy

官網(wǎng):https://spacy.io/

SpaCy 是一個(gè)具有優(yōu)秀示例另锋、API 文檔和演示應(yīng)用程序的自然語言處理庫。這個(gè)庫是用 Cython 語言編寫的狭归,Cython 是 Python 的 C 擴(kuò)展夭坪。它支持近 30 種語言,提供了簡單的深度學(xué)習(xí)集成过椎,保證了健壯性和高準(zhǔn)確率室梅。SpaCy 的另一個(gè)重要特性是專為整個(gè)文檔處理設(shè)計(jì)的體系結(jié)構(gòu),無須將文檔分解成短語疚宇。

**19. Gensim **

官網(wǎng):https://radimrehurek.com/gensim/

Gensim 是一個(gè)用于健壯語義分析亡鼠、主題建模和向量空間建模的 Python 庫,構(gòu)建在Numpy和Scipy之上敷待。它提供了流行的NLP算法的實(shí)現(xiàn)间涵,如 word2vec。盡管 gensim 有自己的 models.wrappers.fasttext實(shí)現(xiàn)榜揖,但 fasttext 庫也可以用來高效學(xué)習(xí)詞語表示勾哩。

數(shù)據(jù)采集*

20. Scrapy (

官網(wǎng):https://scrapy.org/

Scrapy 是一個(gè)用來創(chuàng)建網(wǎng)絡(luò)爬蟲,掃描網(wǎng)頁和收集結(jié)構(gòu)化數(shù)據(jù)的庫举哟。此外思劳,Scrapy 可以從 API 中提取數(shù)據(jù)。由于該庫的可擴(kuò)展性和可移植性妨猩,使得它用起來非常方便潜叛。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子威兜,更是在濱河造成了極大的恐慌销斟,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件椒舵,死亡現(xiàn)場離奇詭異蚂踊,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)逮栅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門悴势,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人措伐,你說我怎么就攤上這事特纤。” “怎么了侥加?”我有些...
    開封第一講書人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵捧存,是天一觀的道長。 經(jīng)常有香客問我担败,道長昔穴,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任提前,我火速辦了婚禮吗货,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘狈网。我一直安慰自己宙搬,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開白布拓哺。 她就那樣靜靜地躺著勇垛,像睡著了一般。 火紅的嫁衣襯著肌膚如雪士鸥。 梳的紋絲不亂的頭發(fā)上闲孤,一...
    開封第一講書人閱讀 51,727評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音烤礁,去河邊找鬼讼积。 笑死,一個(gè)胖子當(dāng)著我的面吹牛鸽凶,可吹牛的內(nèi)容都是我干的币砂。 我是一名探鬼主播,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼玻侥,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了亿蒸?” 一聲冷哼從身側(cè)響起凑兰,我...
    開封第一講書人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤掌桩,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后姑食,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體波岛,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年音半,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了则拷。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡曹鸠,死狀恐怖煌茬,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情彻桃,我是刑警寧澤坛善,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站邻眷,受9級(jí)特大地震影響眠屎,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜肆饶,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一改衩、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧驯镊,春花似錦葫督、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至洒放,卻和暖如春蛉鹿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背往湿。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來泰國打工妖异, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人领追。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓他膳,卻偏偏與公主長得像,于是被迫代替她去往敵國和親绒窑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子棕孙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • ATLAS + NumPy + SciPy + Theano的python科學(xué)計(jì)算環(huán)境的搭建 http://fhq...
    hzyido閱讀 1,849評(píng)論 0 6
  • Python科學(xué)計(jì)算 第二版 第二版序 Python世界的發(fā)展日新月異,在本書第一版出版之后,Python在數(shù)據(jù)處...
    hzyido閱讀 337評(píng)論 0 3
  • 選擇Python科學(xué)計(jì)算發(fā)行版 最近重裝Python蟀俊,看了一下Python科學(xué)計(jì)算發(fā)行版钦铺,打算多玩一下數(shù)據(jù)處理和數(shù)...
    hzyido閱讀 1,493評(píng)論 0 3
  • 今天是我新歷生日,感謝朋友們的祝福肢预。不過矛洞,這不是重點(diǎn)。 重點(diǎn)是烫映,今天沼本,將會(huì)有一個(gè)小天使降臨??????他的媽媽是個(gè)初產(chǎn)婦...
    安紫語幽閱讀 141評(píng)論 0 1
  • 花苞沒有開, 花兒都在哪兒锭沟。 讓我找一找抽兆, 沒找著, 只見苞冈钦。 突然下起雨郊丛, 花兒到處是。 花兒多美麗瞧筛, 讓我聞一...
    溪浚baba閱讀 127評(píng)論 0 0