萬事開頭難甘桑,作為第一篇博客,學(xué)不來深入淺出,妙趣橫生跑杭,但求老老實實把事情說明白铆帽。
事情起源于kaggle競賽者很慷慨地在github上開放了源碼,kaggle非常貼心地將這些優(yōu)異的解決方案和實現(xiàn)整理出來德谅。對于小白級數(shù)據(jù)工作者爹橱,如我,是臨摹思路窄做,學(xué)習(xí)代碼的絕好機會愧驱。為了享受這場盛宴,我在windows下搭建了python環(huán)境浸策。由于ML包依賴有點復(fù)雜冯键,本文贅述一二惹盼。
常見ML的python lib有:numpy, matplotlib, scipy, scikit-learn.
常用的windows下安裝python第三方包的工具setuptools小巧而好用庸汗。它省略了安裝python第三方包所需要的下載,解壓手报,執(zhí)行python **.py 等繁瑣過程蚯舱,默認(rèn)到http://pypi.python.org/simple搜索第三方包并下載安裝,類似于linux下的yun功能掩蛤。
和yun一樣枉昏,它也會檢查依賴,因此numpy揍鸟,matplotlib兄裂,scikit-learn,安裝過程中都會報錯阳藻。我選擇手動安裝:sourceforge提供了exe安裝包晰奖,貌似不進行依賴檢查,以上各個包可以直接安裝腥泥。網(wǎng)上有觀點說scikit-learn會依賴nose匾南,這一點沒進行確認(rèn)。我直接先easy_install nose, 然后下載這三個包蛔外,并安裝蛆楞。
這樣留下的后患是,在運行python代碼時夹厌,會提示這些第三方包import *** 找不到豹爹。easy_install可以基本解決,如six矛纹。dateutil是個例外臂聋,并且sourceforge也沒有提供安裝包。此時,移步至dateutil:?http://www.lfd.uci.edu/~gohlke/pythonlibs/#python-dateutil
pyparsing亦是:http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyparsing
以上三種途徑基本上可以獲得所需要的第三方包逻住。