[python相關(guān)]

Anaconda Python 是完全免費的企業(yè)級的Python發(fā)行大規(guī)模數(shù)據(jù)處理、預測分析和科學計算工具弄喘。

Anaconda 是 Python 科學技術(shù)包的合集,功能和 Python(x,y) 類似。它是新起之秀渐裂,已更新多次了炉抒。包管理使用 conda球拦,GUI基于PySide置森,容量適中,但該有的科學計算包都有端衰。Anaconda 支持所有操作系統(tǒng)平臺叠洗,它的安裝、更新和刪除都很方便,且所有的東西都只安裝在一個目錄中旅东。Anaconda目前提供Python 2.6.X,Python 2.7.X,Python 3.3.X和Python 3.4.X四個系列發(fā)行包灭抑,這也是其他發(fā)行版所望塵莫及的。

1.ipython

IPython provides a rich architecture for interactive computing with:

1)Powerful interactive shells (terminal and Qt-based).

2)A browser-based notebook with support for code, text, mathematical expressions, inline plots and other rich media.

3)Support for interactive data visualization and use of GUI toolkits.

4)Flexible, embeddable interpreters to load into your own projects.

5)Easy to use, high performance tools for parallel computing.

“iPython 是一個Python 的交互式Shell抵代,比默認的Python Shell 好用得多腾节,功能也更強大。 她支持語法高亮荤牍、自動完成案腺、代碼調(diào)試、對象自省康吵,支持 Bash Shell 命令劈榨,內(nèi)置了許多很有用的功能和函式等,非常容易使用晦嵌。 ” 啟動iPython的時候用這個命令“ipython –pylab”鞋既,默認開啟了matploblib的繪圖交互,用起來很方便耍铜。

2.numpy

NumPy is the fundamental package for scientific computing with Python. It contains among other things:

1)a powerful N-dimensional array object

2)sophisticated (broadcasting) functions

3)tools for integrating C/C++ and Fortran code

4) useful linear algebra, Fourier transform, and random number capabilities

Besides its obvious scientific uses, NumPy can also be used as an efficient multi-dimensional container of generic data. Arbitrary data-types can be defined. This allows NumPy to seamlessly and speedily integrate with a wide variety of databases.

NumPy幾乎是一個無法回避的科學計算工具包,最常用的也許是它的N維數(shù)組對象跌前,其他還包括一些成熟的函數(shù)庫棕兼,用于整合C/C++和Fortran代碼的工具包,線性代數(shù)抵乓、傅里葉變換和隨機數(shù)生成函數(shù)等伴挚。NumPy提供了兩種基本的對象:ndarray(N-dimensional array object)和 ufunc(universal function object)靶衍。ndarray是存儲單一數(shù)據(jù)類型的多維數(shù)組,而ufunc則是能夠?qū)?shù)組進行處理的函數(shù)茎芋。

3.scipy: Python Data Analysis Library

SciPy refers to several related but distinct entities:

1)The SciPy Stack, a collection of open source software for scientific computing in Python, and particularly a specified set of core packages.

2)The community of people who use and develop this stack.

3)Several conferences dedicated to scientific computing in Python – SciPy, EuroSciPy and SciPy.in.

4)The SciPy library, one component of the SciPy stack, providing many numerical routines.

matplotlib 是python最著名的繪圖庫颅眶,它提供了一整套和matlab相似的命令API,十分適合交互式地進行制圖田弥。而且也可以方便地將它作為繪圖控件涛酗,嵌入GUI應用程序中。Matplotlib可以配合ipython shell使用偷厦,提供不亞于Matlab的繪圖體驗商叹。

4.matplotlib

matplotlib is a python 2D plotting library which produces publication quality figures in a variety of hardcopy formats and interactive environments across platforms. matplotlib can be used in python scripts, the python and ipython shell (ala MATLAB?* or Mathematica??), web application servers, and six graphical user interface toolkits.

matplotlib 是python最著名的繪圖庫,它提供了一整套和matlab相似的命令API只泼,十分適合交互式地進行制圖剖笙。而且也可以方便地將它作為繪圖控件,嵌入GUI應用程序中请唱。Matplotlib可以配合ipython shell使用弥咪,提供不亞于Matlab的繪圖體驗。

第二部分 機器學習十绑、數(shù)據(jù)挖掘相關(guān)工具包

1.beautiful-soup

You didn’t write that awful page. You’re just trying to get some data out of it. Beautiful Soup is here to help. Since 2004, it’s been saving programmers hours or days of work on quick-turnaround screen scraping projects.

爬蟲工具

2.pandas: Python Data Analysis Library

Pandas is a software library written for the Python programming language for data manipulation and analysis. In particular, it offers data structures and operations for manipulating numerical tables and time series.

Pandas也是基于NumPy和Matplotlib開發(fā)的聚至,主要用于數(shù)據(jù)分析和數(shù)據(jù)可視化,它的數(shù)據(jù)結(jié)構(gòu)DataFrame和R語言里的data.frame很像孽惰,特別是對于時間序列數(shù)據(jù)有自己的一套分析機制晚岭,非常不錯。

3.scikit-learn: Machine Learning in Python

scikit-learn (formerly scikits.learn) is an open source machine learning library for the Python programming language. It features various classification, regression and clustering algorithms including support vector machines, logistic regression, naive Bayes, random forests, gradient boosting, k-means and DBSCAN, and is designed to interoperate with the Python numerical and scientific libraries NumPy and SciPy.

scikit-learn是一個基于NumPy, SciPy, Matplotlib的開源機器學習工具包勋功,主要涵蓋分類坦报,回歸和聚類算法,例如SVM狂鞋, 邏輯回歸片择,樸素貝葉斯,隨機森林骚揍,k-means等算法字管,代碼和文檔都非常不錯,在許多Python項目中都有應用信不。例如在我們熟悉的NLTK中嘲叔,分類器方面就有專門針對scikit-learn的接口,可以調(diào)用scikit-learn的分類算法以及訓練數(shù)據(jù)來訓練分類器模型抽活。

4.nltk:Natural Language Toolkit

NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, and an active discussion forum.

自然語言處理包

第三部分 其他重要包

1. conda

Conda is an open source package management system and environment management system for installing multiple versions of software packages and their dependencies and switching easily between them. It works on Linux, OS X and Windows, and was created for Python programs but can package and distribute any software.

conda是一個開源的包管理和環(huán)境管理系統(tǒng)硫戈。包管理功能能讓你非常容易的安裝和卸載各種Python庫,并且很好的管理Anaconda的各個組件下硕。環(huán)境管理功能支持在不同的python版本和插件換將下進行切換丁逝,方便不同的開發(fā)需求汁胆。

相關(guān)功能在test-drive文檔介紹的非常清楚,在此不再贅述霜幼。

2. ipython-notebook

使用一種基于Web技術(shù)的交互式計算文檔格式嫩码。為什么說它是文檔格式,而非計算工具呢罪既?實際上它兩者都是铸题。Notebook 在交互上使用了 C/S 結(jié)構(gòu),它通過 Tornado 建立一個 shell 服務器萝衩,并使用瀏覽器作為客戶端回挽。另外 notebook 頁面都被保存為 .ipynb 的類 JSON 文件格式。這種文件格式也是 Notebook 最吸引人的地方猩谊。IPython Notebook使用瀏覽器作為界面千劈,向后臺的IPython服務器發(fā)送請求,并顯示結(jié)果牌捷。在瀏覽器的界面中使用單元(Cell)保存各種信息墙牌。Cell有多種類型,經(jīng)常使用的有表示格式化文本的Markdown單元暗甥,和表示代碼的Code單元喜滨。

3. spyder

Spyder是Python(x,y)的作者為它開發(fā)的一個簡單的集成開發(fā)環(huán)境。和其他的Python開發(fā)環(huán)境相比撤防,它最大的優(yōu)點就是模仿MATLAB的“工作空間”的功能虽风,可以很方便地觀察和修改數(shù)組的值。

4. pyqt

PyQt是一個創(chuàng)建GUI應用程序的工具包寄月。它是Python編程語言和Qt庫的成功融合辜膝。Qt庫是目前最強大的庫之一。 PyQt實現(xiàn)了一個Python模塊集漾肮。它有超過300類厂抖,將近6000個函數(shù)和方法。它是一個多平臺的工具包克懊,可以運行在所有主要操作系統(tǒng)上忱辅,包括UNIX谭溉,Windows和Mac。 PyQt采用雙許可證扮念,開發(fā)人員可以選擇GPL和商業(yè)許可。在此之前,GPL的版本只能用在Unix上场躯,從PyQt的版本4開始,GPL許可證可用于所有支持的平臺旅挤。

5. cpython

用C語言實現(xiàn)Python及其解釋器

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市粘茄,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌柒瓣,老刑警劉巖儒搭,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異芙贫,居然都是意外死亡,警方通過查閱死者的電腦和手機磺平,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來擦酌,“玉大人菠劝,你說我怎么就攤上這事赊舶「险铮” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵出吹,是天一觀的道長辙喂。 經(jīng)常有香客問我捶牢,道長巍耗,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任灸蟆,我火速辦了婚禮亲族,結(jié)果婚禮上可缚,老公的妹妹穿的比我還像新娘斋枢。我一直安慰自己帘靡,他們只是感情好瓤帚,可當我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布描姚。 她就那樣靜靜地躺著戈次,像睡著了一般。 火紅的嫁衣襯著肌膚如雪绊寻。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天榛斯,我揣著相機與錄音搂捧,去河邊找鬼。 笑死允跑,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的索烹。 我是一名探鬼主播弱睦,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼况木!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起求类,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤屹耐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體犯眠,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡症革,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片羡亩。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖雷袋,靈堂內(nèi)的尸體忽然破棺而出辞居,到底是詐尸還是另有隱情,我是刑警寧澤瓦灶,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站刃泡,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏碉怔。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一桨踪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧锻离,春花似錦叁征、人聲如沸纳账。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽卧秘。三九已至,卻和暖如春翅敌,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蚯涮。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工遭顶, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留张峰,地道東北人棒旗。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像饶深,于是被迫代替她去往敵國和親逛拱。 傳聞我的和親對象是個殘疾皇子敌厘,可洞房花燭夜當晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容