如何利用python進(jìn)行數(shù)據(jù)分析?首先要知道為什么要用python進(jìn)行數(shù)據(jù)分析,今天科多大數(shù)據(jù)來簡單介紹一下為什么要用python進(jìn)行數(shù)據(jù)分析:
一、why Python?
為什么要利用python進(jìn)行數(shù)據(jù)分析乡小?python擁有一個(gè)巨大的活躍的科學(xué)計(jì)算社區(qū),擁有不斷改良的庫(本書主要是pandas和numpy)饵史,能夠輕松的集成C,C++,Fortran代碼(Cython項(xiàng)目)满钟,可以同時(shí)用于研究和原型的構(gòu)建以及生產(chǎn)系統(tǒng)的構(gòu)建。
Python有什么劣勢(shì):1.因?yàn)閜ython是一種解釋型語言胳喷,運(yùn)行速度比編譯型數(shù)據(jù)慢零远。2.由于python有一個(gè)全局解釋器鎖(GIL),防止解釋器同時(shí)執(zhí)行多條python字節(jié)碼,所以python不適用于高并發(fā)厌蔽、多線程的應(yīng)用程序牵辣。
二、工具環(huán)境:按照書上的指導(dǎo):window:EDPFree(含IPython)+pandas庫
1. EDPFree:面向科學(xué)計(jì)算的python安裝包(Numpy奴饮、SciPy纬向、matplotlib、Chaco和IPython)戴卜,官網(wǎng)上現(xiàn)在已經(jīng)變成canopy(太大了300多M)逾条,我按照書上搜索了相應(yīng)版本(epd_free-7.3.1-win-x86.msi)進(jìn)行了安裝,安裝路徑均按照默認(rèn)進(jìn)行投剥。
2.環(huán)境變量配置:將python的安裝文件夾位置加入PATH师脂,命令行中輸入IPython看看是否成功。
3. http://pypi.python.org/pypi/pandas,下載pandas庫。想找?guī)於荚谶@個(gè)官方網(wǎng)站(python package index)發(fā)布吃警,然后解壓后看到setup.py文件糕篇,cmd-->ipython setup.py文件路徑install就可以安裝了!可以進(jìn)入python解釋器中輸入import pandas驗(yàn)證下酌心。
三拌消、在學(xué)習(xí)過程中需要用到的重要的庫:
1.Numpy
2.pandas
3.matplotlib
4.SciPy