一鬼廓、常用數(shù)據(jù)分析庫
安裝命令:pip install / conda install *(如果安裝了 Anaconda 可使用后面那個(gè)命令,但是缺點(diǎn)就是 conda install 會(huì)安裝或更新庫所以來的各種庫序目,而 pip install 不會(huì)更新) *
- pip install numpy (建議:https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 在這里下載對(duì)應(yīng)版本的 whl文件,安裝下載之后我們以后就沒必要去安裝 mkl 了伯襟,本地安裝格式:pip install 路徑\文件名.whl)
- pip install scipy
- pip install pandas
- pip install matplotlib
簡介:
Nuympy : 提供常用的數(shù)值數(shù)組猿涨、矩陣等函數(shù)
優(yōu)點(diǎn):1.是基于向量化的運(yùn)算 2.進(jìn)行數(shù)值運(yùn)算時(shí) Numpy 數(shù)組彼 list 效率高
Scipy: 是一種使用 NumPy 來做高等數(shù)學(xué)、信號(hào)處理姆怪、優(yōu)化叛赚、統(tǒng)計(jì)的擴(kuò)展包(https://docs.scipy.org/doc/)
Pandas: 是一種構(gòu)建于 Numpy 的高級(jí)數(shù)據(jù)結(jié)構(gòu)和精巧工具澡绩,快速簡單的處理數(shù)據(jù)。
數(shù)據(jù)結(jié)構(gòu):Series 和 DataFrame
Matplotlib: 繪圖庫
二俺附、常用高級(jí)數(shù)據(jù)分析庫
自然語言處理工具包
安裝:pip install -U nltk
應(yīng)用:文本提取肥卡、詞匯切分、詞頻分析事镣、詞袋模型步鉴、情感分析-
圖計(jì)算和社交網(wǎng)絡(luò)分析
安裝:pip install -U python-igraph (直接這樣安裝可能會(huì)出現(xiàn)問題)
解決辦法:
1- 打開網(wǎng)址:https://www.lfd.uci.edu/~gohlke/pythonlibs/
2- 下載對(duì)應(yīng) python 版本的 whl (筆者是 wind7x64位 py 是 3.6):
1522148091(1).jpg
3- 下載完之后,使用命令窗口指定到該目錄下璃哟,并以 pip install 文件名 進(jìn)行執(zhí)行:
1522148244(1).jpg 基于 Scipy 之上的一個(gè)用于機(jī)器學(xué)習(xí)的 Py 模塊
安裝:pip install -U scikit-learn-
統(tǒng)計(jì)分析模塊
安裝:pip install statsmodels
如果安裝失敗則可以去這個(gè)網(wǎng)址:
https://www.lfd.uci.edu/~gohlke/pythonlibs/ 搜索該模塊并下載對(duì)應(yīng)的版本氛琢,然后安裝:
QQ截圖20180507160217.png
三、常用挖掘模塊
- 文本挖掘模塊
安裝:pip install gensim
到此就基本 Over 啦~