姓名:張玉軍 ?17021210876
轉(zhuǎn)載自:http://www.reibang.com/p/9655368cd7fd
【嵌牛導(dǎo)讀】開(kāi)源是技術(shù)創(chuàng)新和快速發(fā)展的核心舔示。這篇文章向你展示Python機(jī)器學(xué)習(xí)開(kāi)源項(xiàng)目以及在分析過(guò)程中發(fā)現(xiàn)的非常有趣的見(jiàn)解和趨勢(shì)秒梅。
【嵌牛鼻子】Python機(jī)器學(xué)習(xí)開(kāi)源項(xiàng)目
【嵌牛提問(wèn)】
【嵌牛正文】引言
我們分析了GitHub上的前20名Python機(jī)器學(xué)習(xí)項(xiàng)目乡范,發(fā)現(xiàn)scikit-Learn,PyLearn2和NuPic是貢獻(xiàn)最積極的項(xiàng)目吧碾。讓我們一起在Github上探索這些流行的項(xiàng)目!
1.Scikit-learn:Scikit-learn 是基于Scipy為機(jī)器學(xué)習(xí)建造的的一個(gè)Python模塊,他的特色就是多樣化的分類(lèi)棚放,回歸和聚類(lèi)的算法包括支持向量機(jī),邏輯回歸馅闽,樸素貝葉斯分類(lèi)器飘蚯,隨機(jī)森林,Gradient Boosting福也,聚類(lèi)算法和DBSCAN局骤。而且也設(shè)計(jì)出了Python numerical和scientific libraries Numpy and Scipy
2.Pylearn2:Pylearn是一個(gè)讓機(jī)器學(xué)習(xí)研究簡(jiǎn)單化的基于Theano的庫(kù)程序。
3.NuPIC:NuPIC是一個(gè)以HTM學(xué)習(xí)算法為工具的機(jī)器智能平臺(tái)暴凑。HTM是皮層的精確計(jì)算方法峦甩。HTM的核心是基于時(shí)間的持續(xù)學(xué)習(xí)算法和儲(chǔ)存和撤銷(xiāo)的時(shí)空模式。NuPIC適合于各種各樣的問(wèn)題,尤其是檢測(cè)異常和預(yù)測(cè)的流數(shù)據(jù)來(lái)源现喳。
4.Nilearn:Nilearn 是一個(gè)能夠快速統(tǒng)計(jì)學(xué)習(xí)神經(jīng)影像數(shù)據(jù)的Python模塊凯傲。它利用Python語(yǔ)言中的scikit-learn 工具箱和一些進(jìn)行預(yù)測(cè)建模,分類(lèi)嗦篱,解碼冰单,連通性分析的應(yīng)用程序來(lái)進(jìn)行多元的統(tǒng)計(jì)。
5.PyBrain:Pybrain是基于Python語(yǔ)言強(qiáng)化學(xué)習(xí)默色,人工智能球凰,神經(jīng)網(wǎng)絡(luò)庫(kù)的簡(jiǎn)稱(chēng)。 它的目標(biāo)是提供靈活腿宰、容易使用并且強(qiáng)大的機(jī)器學(xué)習(xí)算法和進(jìn)行各種各樣的預(yù)定義的環(huán)境中測(cè)試來(lái)比較你的算法呕诉。
6.Pattern:Pattern 是Python語(yǔ)言下的一個(gè)網(wǎng)絡(luò)挖掘模塊。它為數(shù)據(jù)挖掘吃度,自然語(yǔ)言處理甩挫,網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)提供工具。它支持向量空間模型椿每、聚類(lèi)伊者、支持向量機(jī)和感知機(jī)并且用KNN分類(lèi)法進(jìn)行分類(lèi)。
7.Fuel:Fuel為你的機(jī)器學(xué)習(xí)模型提供數(shù)據(jù)间护。他有一個(gè)共享如MNIST, CIFAR-10 (圖片數(shù)據(jù)集), Google's One Billion Words (文字)這類(lèi)數(shù)據(jù)集的接口亦渗。你使用他來(lái)通過(guò)很多種的方式來(lái)替代自己的數(shù)據(jù)。
8.Bob:Bob是一個(gè)免費(fèi)的信號(hào)處理和機(jī)器學(xué)習(xí)的工具汁尺。它的工具箱是用Python和C++語(yǔ)言共同編寫(xiě)的法精,它的設(shè)計(jì)目的是變得更加高效并且減少開(kāi)發(fā)時(shí)間,它是由處理圖像工具,音頻和視頻處理、機(jī)器學(xué)習(xí)和模式識(shí)別的大量軟件包構(gòu)成的搂蜓。
9.Skdata:Skdata是機(jī)器學(xué)習(xí)和統(tǒng)計(jì)的數(shù)據(jù)集的庫(kù)程序狼荞。這個(gè)模塊對(duì)于玩具問(wèn)題,流行的計(jì)算機(jī)視覺(jué)和自然語(yǔ)言的數(shù)據(jù)集提供標(biāo)準(zhǔn)的Python語(yǔ)言的使用帮碰。
10.MILK:MILK是Python語(yǔ)言下的機(jī)器學(xué)習(xí)工具包相味。它主要是在很多可得到的分類(lèi)比如SVMS,K-NN,隨機(jī)森林,決策樹(shù)中使用監(jiān)督分類(lèi)法殉挽。 它還執(zhí)行特征選擇丰涉。 這些分類(lèi)器在許多方面相結(jié)合,可以形成不同的例如無(wú)監(jiān)督學(xué)習(xí)、密切關(guān)系金傳播和由MILK支持的K-means聚類(lèi)等分類(lèi)系統(tǒng)此再。
11.IEPY:IEPY是一個(gè)專(zhuān)注于關(guān)系抽取的開(kāi)源性信息抽取工具昔搂。它主要針對(duì)的是需要對(duì)大型數(shù)據(jù)集進(jìn)行信息提取的用戶(hù)和想要嘗試新的算法的科學(xué)家。
12.Quepy:Quepy是通過(guò)改變自然語(yǔ)言問(wèn)題從而在數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)言中進(jìn)行查詢(xún)的一個(gè)Python框架输拇。他可以簡(jiǎn)單的被定義為在自然語(yǔ)言和數(shù)據(jù)庫(kù)查詢(xún)中不同類(lèi)型的問(wèn)題摘符。所以,你不用編碼就可以建立你自己的一個(gè)用自然語(yǔ)言進(jìn)入你的數(shù)據(jù)庫(kù)的系統(tǒng)〔叻停現(xiàn)在Quepy提供對(duì)于Sparql和MQL查詢(xún)語(yǔ)言的支持逛裤。并且計(jì)劃將它延伸到其他的數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)言。
13.Hebel:Hebel是在Python語(yǔ)言中對(duì)于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)的一個(gè)庫(kù)程序猴抹,它使用的是通過(guò)PyCUDA來(lái)進(jìn)行GPU和CUDA的加速带族。它是最重要的神經(jīng)網(wǎng)絡(luò)模型的類(lèi)型的工具而且能提供一些不同的活動(dòng)函數(shù)的激活功能,例如動(dòng)力蟀给,涅斯捷羅夫動(dòng)力蝙砌,信號(hào)丟失和停止法。
14.mlxtend:它是一個(gè)由有用的工具和日常數(shù)據(jù)科學(xué)任務(wù)的擴(kuò)展組成的一個(gè)庫(kù)程序跋理。
15.nolearn:這個(gè)程序包容納了大量能對(duì)你完成機(jī)器學(xué)習(xí)任務(wù)有幫助的實(shí)用程序模塊择克。其中大量的模塊和scikit-learn一起工作,其它的通常更有用前普。
16.Ramp:Ramp是一個(gè)在Python語(yǔ)言下制定機(jī)器學(xué)習(xí)中加快原型設(shè)計(jì)的解決方案的庫(kù)程序肚邢。他是一個(gè)輕型的pandas-based機(jī)器學(xué)習(xí)中可插入的框架,它現(xiàn)存的Python語(yǔ)言下的機(jī)器學(xué)習(xí)和統(tǒng)計(jì)工具(比如scikit-learn,rpy2等)Ramp提供了一個(gè)簡(jiǎn)單的聲明性語(yǔ)法探索功能從而能夠快速有效地實(shí)施算法和轉(zhuǎn)換拭卿。
17.Feature Forge:這一系列工具通過(guò)與scikit-learn兼容的API骡湖,來(lái)創(chuàng)建和測(cè)試機(jī)器學(xué)習(xí)功能。這個(gè)庫(kù)程序提供了一組工具峻厚,它會(huì)讓你在許多機(jī)器學(xué)習(xí)程序使用中很受用响蕴。當(dāng)你使用scikit-learn這個(gè)工具時(shí),你會(huì)感覺(jué)到受到了很大的幫助惠桃。(雖然這只能在你使用不同的算法時(shí)起作用浦夷。)
18.REP:REP是以一種和諧懊渡、可再生的方式為指揮數(shù)據(jù)移動(dòng)驅(qū)動(dòng)所提供的一種環(huán)境。它有一個(gè)統(tǒng)一的分類(lèi)器包裝來(lái)提供各種各樣的操作军拟,例如TMVA, Sklearn, XGBoost, uBoost等等。并且它可以在一個(gè)群體以平行的方式訓(xùn)練分類(lèi)器誓禁。同時(shí)它也提供了一個(gè)交互式的情節(jié)懈息。
19.Python 學(xué)習(xí)機(jī)器樣本:用亞馬遜的機(jī)器學(xué)習(xí)建造的簡(jiǎn)單軟件收集。
20.Python-ELM:這是一個(gè)在Python語(yǔ)言下基于scikit-learn的極端學(xué)習(xí)機(jī)器的實(shí)現(xiàn)摹恰。