** 轉載自URl-team
本文鏈接地址: 機器學習各語言領域工具庫中文版匯總
主要資源來自TensorFlow中文社區(qū)霞篡,翻譯借助谷歌翻譯,僅用于資源分享甲献。
以下是根據不同語言類型和應用領域收集的各類工具庫邮屁,持續(xù)更新中琐鲁。
C
通用機器學習
- 推薦人 -一個產品推薦的?語言庫,利用了協(xié)同過濾惭每。
計算機視覺
C ++
計算機視覺
- OpenCV – 最常用的視覺庫。有C ++览爵,C柿赊,Python以及Java接口),支持Windows逆趣,Linux苹支,Android和Mac OS。
- DLib – DLib有C ++和Python臉部識別和物體檢測接口俱济。
- EBLearn – Eblearn是一個面向對象的C ++庫嘶是,實現(xiàn)了各種機器學習模型。
- VIGRA – VIGRA是一個跨平臺的機器視覺和機器學習庫蛛碌,可以處理任意維度的數據聂喇,有Python接口。
通用機器學習
- MLPack – 可拓展的C ++機器學習庫。
- DLib – 設計為方便嵌入到其他系統(tǒng)中希太。
- encog-CPP
- 鯊魚
- Vowpal Wabbit(VW) – 快速的核心外學習系統(tǒng)克饶。
- sofia-ml – 快速增量算法套件。
- 幕府將軍 – 學徒機器學習工具箱
- Caffe – 深度學習框架誊辉,結構清晰矾湃,可讀性好,速度快堕澄。
- CXXNET – 精簡的框架邀跃,核心代碼不到1000行。
- XGBoost – 為并行計算優(yōu)化過的梯度提升庫蛙紫。
- CUDA – 這是一個快速的C ++ / CUDA實現(xiàn)卷積[DEEP LEARNING]
- Stan – 一種使用哈密爾頓蒙特卡洛取樣執(zhí)行完全貝葉斯統(tǒng)計推理的概率編程語言
- BanditLib – 一個簡單的多武裝強盜圖書館拍屑。
- Timbl – 實現(xiàn)了多個基于內存的算法,其中IB1-IG(KNN分類算法)和IGTree(決策樹)在NLP中廣泛應用坑傅。
自然語言處理
- MIT信息提取工具包 – C僵驰,C ++和Python工具,用來命名實體識別和關系抽取裁蚁。
- CRF ++ – 條件隨機場的開源實現(xiàn)矢渊,可以用作分詞,詞性標注等枉证。
- CRFsuite – CRFsuite是條件隨機場的實現(xiàn)矮男,可以用作詞性標注等。
- BLLIP解析器 – 即Charniak-Johnson解析器室谚。
- colibri-core – 一組C ++庫毡鉴,命令行工具以及Python綁定,高效實現(xiàn)了n-gram和skipgrams秒赤。
- ucto – 多語言tokenizer猪瞬,支持面向Unicode的正則表達式,支持FoLiA格式入篮。
- libfolia – FoLiA格式的 C ++庫
- MeTA – MeTA:ModErn文本分析從巨量文本中挖掘數據陈瘦。
機器翻譯
語音識別
- Kaldi – Kaldi是一個C ++工具,以Apache許可證V2.0發(fā)布.Kaldi適用于語音識別的研究潮售。
序列分析
- ToPS – 這是一個面向對象的框架痊项,有助于在用戶定義的字母表上整合序列的概率模型。
Java
自然語言處理
- Cortical.io – Retina:此API執(zhí)行復雜的NLP操作(消歧義酥诽,分類鞍泉,流文本過濾等),快速肮帐,直觀如同大腦一般咖驮。
- CoreNLP – Stanford CoreNLP提供了一組自然語言分析工具,可采取原始英語文本輸入并給出單詞的基本形式。
- 斯坦福解析器 – 解析器是一個程序托修,能分析出句子的語法結構忘巧。
- Stanford POS Tagger – 詞性標注器
- 斯坦福大學名稱實體識別器 – 斯坦福大學NER是一個Java實現(xiàn)的命名實體識別器。
- Stanford Word Segmenter – 原始文本的令牌化是許多NLP任務的標準預處理步驟诀黍。
- Tregex袋坑,Tsurgeon和Semgrex – Tregex是匹配樹模式的工具仗处,基于樹的關系和正則表達式的節(jié)點匹配(“樹正則表達式”的縮寫)眯勾。
- 斯坦福Phrasal:基于短語的翻譯系統(tǒng)
- 斯坦福英語Tokenizer – Stanford Phrasal是最先進的統(tǒng)計的基于短語的機器翻譯系統(tǒng),用Java編寫婆誓。
- 斯坦福令牌正則表達式 – 標記器將文本劃分成一系列令牌吃环,大致對應于“單詞”
- 斯坦福時代標簽 – SUTime是識別和規(guī)范時間表達式的庫。
- 斯坦福SPIED – 從種子集開始洋幻,迭代使用模式郁轻,從未標注文本中習得實體。
- 斯坦福主題建模工具箱 – 主題建模工具文留,社會學家用它分析的數據集好唯。
- Twitter Text Java – Java實現(xiàn)的Twitter文本處理庫。
- MALLET – 基于Java的軟件包燥翅,包括統(tǒng)計自然語言處理骑篙,文檔分類,聚類森书,主題建模靶端,信息提取,以及其它機器學習應用凛膏。
- OpenNLP – 一個基于機器學習的自然語言處理的工具包杨名。
- LingPipe – 計算語言學工具包。
- ClearTK – ClearTK提供了開發(fā)統(tǒng)計自然語言處理組件的框架猖毫,其建立在Apache UIMA之上台谍。
- Apache cTAKES – Apache臨床文本分析及知識提取系統(tǒng)(cTAKES)是從電子病歷,臨床文本中進行信息抽取的一個開源系統(tǒng)吁断。
通用機器學習
- 氣溶膠 – Airbnb從頭開始設計的機器學習庫趁蕊,易用性好。
- Datumbox – 機器學習和統(tǒng)計應用程序的快速開發(fā)框架胯府。
- ELKI – 數據挖掘工具介衔。(非監(jiān)督學習:聚類,離群點檢測等骂因。)
- Encog中包含用于創(chuàng)建各種網絡炎咖,以及規(guī)范和處理數據的神經網絡Encog訓練采用多線程彈性的傳播方式。Encog還可以利用GPU的進一步加快處理時間。有基于GUI的工作臺乘盼。
- H2O – 機器學習引擎升熊,支持Hadoop,Spark等分布式系統(tǒng)和個人電腦绸栅,可以通過R级野,Python,Scala粹胯,REST / JSON調用API蓖柔。
- htm.java – 通用機器學習庫,使用Numenta的皮質學習算法
- Java-deeplearning – 分布式深度學習平臺Java风纠,Clojure况鸣,Scala
- JAVA-ML – Java通用機器學習庫,所有算法統(tǒng)一接口竹观。
- JSAT – 具有很多分類镐捧,回歸,聚類等機器學習算法臭增。
- Mahout – 分布式機器學習工具懂酱。
- Meka – 一個開源實現(xiàn)的多標簽分類和評估方法。
- Apache Spark中的 MLlib – Spark分布式機器學習庫
- Neuroph – 輕量級Java神經網絡框架
- ORYX – Lambda架構框架誊抛,使用Apache Spark和Apache Kafka實現(xiàn)實時大規(guī)模機器學習列牺。
- RankLib – 排序算法學習庫。
- 斯坦福分類器 – 分類器是一種機器學習工具芍锚,它將獲取數據項并將它們放入k類之一昔园。
- SmileMiner – 統(tǒng)計機器智能和學習引擎
- SystemML – 靈活的,可擴展的機器學習語言并炮。
- WalnutiQ – 面向對象的人腦模型
- Weka – WEKA是機器學習算法用于數據挖掘任務的算法集合默刚。
語音識別
- CMU Sphinx – 開源工具包,用于語音識別逃魄,完全基于Java的語音識別庫荤西。
數據分析,可視化
- Hadoop – Hadoop / HDFS
- Spark – Spark快速通用的大規(guī)模數據處理引擎伍俘。
- Impala – 實時Hadoop查詢邪锌。
- DataMelt – 數學軟件,包含數值計算癌瘾,統(tǒng)計觅丰,符號計算,數據分析和數據可視化妨退。
- 邁克爾·托馬斯·弗拉納根博士的Java科學圖書館
深度學習
- Deeplearning4j – 可擴展的產業(yè)化的深度學習妇萄,利用并行的GPU蜕企。
Python
計算機視覺
- Scikit-Image – Python中的圖像處理算法的集合。
- SimpleCV – 一個開源的計算機視覺框架冠句,允許訪問幾個高性能計算機視覺庫轻掩,如OpenCV∨车祝可以運行在Mac唇牧,Windows和Ubuntu Linux操作系統(tǒng)上。
- Vigranumpy – 計算機視覺庫VIGRA C ++的Python綁定聚唐。
自然語言處理
- NLTK – 構建與人類語言數據相關工作的Python程序的領先平臺丐重。
- 模式 – 基于Python的Web挖掘模塊。它有自然語言處理拱层,機器學習等工具弥臼。
- Quepy – 將自然語言問題轉換成數據庫查詢語言。
- TextBlob – 為普通的自然語言處理(NLP)任務提供一致的API根灯。構建于NLTK和Pattern上,并且很好地與兩者交互掺栅。
- YAlign – 句子對齊工具烙肺,從對照語料中抽取并行句子。
- jieba – 中文分詞工具
- SnowNLP – 中文文本處理庫氧卧。
- loso – 中文分詞工具
- 天才 – 基于條件隨機場的中文分詞工具
- KoNLPy – 韓語自然語言處理
- 堅果 – 自然語言理解工具
- Rosetta – 文字處理工具和包裝紙(例如Vowpal Wabbit)
- BLLIP解析器 – BLLIP自然語言解析器的Python綁定(即Charniak-Johnson解析器)
- PyNLPl – Python的自然語言處理庫桃笙。還包含用于解析常見NLP格式的工具,如FoLiA沙绝,以及ARPA語言模型搏明,Moses短語,GIZA ++對齊等闪檬。
- python-ucto – ucto(面向unicode的基于規(guī)則的tokenizer)的Python綁定
- python-frog – Frog的Python綁定星著。荷蘭語的詞性標注,lemmatisation粗悯,依存分析虚循,NER。
- python-zpar – ZPar的Python綁定(英文的基于統(tǒng)計的詞性標注样傍,constiuency解析器和依賴解析器)
- colibri-core – 高效提取n-gram和skipgrams的C ++庫的Python綁定
- spaCy – 工業(yè)級NLP與Python和Cython横缔。
- PyStanfordDependencies – 將Penn Treebank樹轉換到Stanford依存樹的Python接口。
通用機器學習
- 機器學習 – 構建和Web界面衫哥, 程序化界面兼容的支持向量機API茎刚。相應的數據集存儲到一個SQL數據庫,然后生成用于預測的模型撤逢,存儲到一個的NoSQL的數據庫膛锭。
- XGBoost – eXtreme Gradient Boosting(Tree)庫的Python綁定
- Featureforge一組工具捌斧,用于創(chuàng)建和測試機器學習的特征,具有與scikit學習兼容的API
- scikit-learning – 基于SciPy的機器學習的Python模塊泉沾。
- 度量學習 – 度量學習的Python模塊
- SimpleAI – 實現(xiàn)了“人工智能現(xiàn)代方法”一書中描述的許多人工智能算法捞蚂。它著重于提供一個易于使用的,文檔良好的和經過測試的庫跷究。
- astroML – 天文學機器學習和數據挖掘庫姓迅。
- graphlab-create – 基于磁盤支持的DataFrame的庫,實現(xiàn)了各種機器學習模型(回歸俊马,聚類丁存,推薦系統(tǒng),圖形分析等)柴我。
- BigML – 與外部服務器交流的庫解寝。
- 模式 – Web數據挖掘模塊。
- NuPIC – Numenta智能計算平臺艘儒。
- Pylearn2 – 基于Theano的機器學習庫聋伦。
- keras – 基于Theano的神經網絡庫
- hebel – GPU加速的Python深度學習庫。
- Chainer – 靈活的神經網絡架構
- gensim – 易用的主題建模工具
- topik – 主題建模工具包
- PyBrain – 另一個Python機器學習庫界睁。
- Crab – 靈活的觉增,快速的推薦引擎
- python-recsys – 實現(xiàn)一個推薦系統(tǒng)的Python工具
- 限制玻爾茲曼機器 – 受限玻爾茲曼機
- CoverTree – 覆蓋樹的Python實現(xiàn),scipy.spatial.kdtree的近似替換
- nilearn – NeuroImaging機器學習庫
- 幕府將軍學習機器學習工具箱
- Pyevolve – 遺傳算法框架
- Caffe – 深度學習框架翻斟,結構清晰逾礁,可讀性好,速度快访惜。
- breze – 基于Theano的深度神經網絡
- pyhsmm -貝葉斯隱馬爾可夫模型近似無監(jiān)督的推理和顯式時長隱半馬爾可夫模型嘹履,專注于貝葉斯非參數擴展時,HDP-HMM和HDP-HSMM债热,大多是弱極限近似砾嫉。
- mrjob – 使得Python程序可以跑在Hadoop上。
- SKLL – 簡化的scikit-learn接口阳柔,易于做實驗
- neurolab – https://github.com/zueve/neurolab
- 薄荷 – 貝葉斯算法的優(yōu)化焰枢。方法見于論文:機器學習算法的實踐貝葉斯優(yōu)化。Jasper Snoek舌剂,Hugo Larochelle和Ryan P. Adams济锄。2012年神經信息處理系統(tǒng)進展。
- Pebl – 貝葉斯學習的Python環(huán)境
- Theano – 優(yōu)化GPU元編程代碼霍转,生成面向矩陣的優(yōu)化的數學編譯器
- TensorFlow – 用數據流圖進行數值計算的開源軟件庫
- yahmm – 隱馬爾可夫模型荐绝,用Cython實現(xiàn)
- python-timbl – 包裝了完整的TiMBL C ++編程接口。Timbl是一個精心制作的?最近鄰機器學習工具包避消。
- deap – 進化算法框架
- pydeep – Python深度學習
- mlxtend – 對數據科學和機器學習任務非常有用的工具庫低滩。
- 霓虹燈 – 高性能深度學習框架
- Optunity – 致力于自動化超參數優(yōu)化過程召夹,使用一個簡單的,輕量級的API,以方便直接替換網格搜索。
- 惹惱 -近似最近鄰居執(zhí)行
- skflow – TensorFlow的簡化界面乌询,類似Scikit Learn绳泉。
- TPOT – 自動創(chuàng)建并利用遺傳編程優(yōu)化機器學習的管道统倒。將它看作您的數據科學助理,自動化機器學習中大部分的枯燥工作。
數據分析,可視化
- SciPy – 一個基于Python的數據褐筛,科學和工程開源軟件生態(tài)系統(tǒng)。
- NumPy – 用Python進行科學計算的基礎軟件包叙身。
- Numba – Python JIT(及時)編譯為LLVM渔扎,由Cython和NumPy的開發(fā)人員針對科學Python。
- NetworkX – 復雜網絡的高生產率軟件信轿。
- 熊貓 – 提供高性能晃痴,易于使用的數據結構和數據分析工具的庫。
- 開放采礦 – Python中的商業(yè)智能(BI)(熊貓網絡界面)
- PyMC – 馬爾可夫鏈蒙特卡洛取樣工具包虏两。
- zipline – 一個Pythonic算法交易庫愧旦。
- PyDy – Python Dynamics的簡稱,用于協(xié)助基于NumPy定罢,SciPy,IPython和matplotlib的動態(tài)運動建模中的工作流程旁瘫。
- SymPy – 符號數學的Python庫祖凫。
- statsmodels – Python中的統(tǒng)計建模和計量經濟學。
- astropy – 一個用于天文學的社區(qū)Python庫酬凳。
- matplotlib – 一個Python 2D繪圖庫惠况。
- 散景 – Python的互動網絡繪圖。
- 劇情 – Python和matplotlib的協(xié)作網絡繪圖宁仔。
- vincent – 一個Python到Vega翻譯器稠屠。
- d3py -一個plottling庫的Python,基于D3.js翎苫。
- ggplot – 與ggplot2相同的API
- ggfortify – ggplot2流行的R包的統(tǒng)一接口权埠。
- Kartograph.py – 在Python中呈現(xiàn)美麗的SVG地圖。
- pygal – 一個Python SVG圖表創(chuàng)建者煎谍。
- PyQtGraph – 一個基于PyQt4 / PySide和NumPy的純python圖形和GUI庫攘蔽。
- pycascading
- Petrel – 用于編寫,提交呐粘,調試和監(jiān)視純Python中的風暴拓撲的工具满俗。
- Blaze – NumPy和Pandas與Big Data接口转捕。
- emcee – 仿射不變MCMC的Python集合采樣工具包。
- windML – 風能分析與預測的Python框架
- vispy – 基于GPU的高性能交互式OpenGL 2D / 3D數據可視化庫
- cerebro2 NuPIC的基于Web的可視化和調試平臺唆垃。
- NuPIC Studio一體化NuPIC分層時態(tài)內存可視化和調試超級工具五芝!
- PySpark上的SparklingPandas Pandas(POPS)
- Seaborn – 基于matplotlib的python可視化庫
- bqplot – 用于在Jupyter(IPython)中繪制的API
常見的Lisp
通用機器學習
Clojure
自然語言處理
- Clojure-openNLP – Clojure中的自然語言處理(opennlp)
- 感染 – clj – Clojure和ClojureScript的Rails樣拐彎庫
通用機器學習
- Touchstone – Clojure A / B測試庫
- Clojush – 他推動編程語言和在Clojure中實現(xiàn)的PushGP遺傳編程系統(tǒng)
- Infer – 推理和機器學習在clojure
- Clj-ML – 一個用于Clojure的機器學習庫枢步,建于Weka和朋友之上
- Encog – 用于Encog(v3)的Clojure包裝器(專門從事神經網絡的機器學習框架)
- Fungp – Clojure的遺傳編程庫
- Statistiker – Clojure中的基本機器學習算法。
- clortex – 通用機器學習庫使用Numenta的皮質學習算法
- comportex – 功能可組合的機器學習庫蓄坏,使用Numenta的皮質學習算法
數據分析价捧,可視化
- Incanter – Incanter是一個基于Clojure的R類統(tǒng)計計算和圖形平臺。
- PigPen – Map-Reduce for Clojure涡戳。
- Envision – Clojure數據可視化庫结蟋,基于Statistiker和D3
MATLAB
計算機視覺
- 輪廓 – 實現(xiàn)輪廓變換的 MATLAB源代碼及其效用函數。
- Shearlets – 用于小波變換的MATLAB代碼
- 曲線 – 曲線變換是小波變換的更高維度泛化渔彰,旨在表示不同尺度和不同角度的圖像嵌屎。
- Bandlets – 用于帶狀變換的MATLAB代碼
- mexopencv – OpenCV庫的收集和MATLAB mex功能的開發(fā)工具包
自然語言處理
- NLP – 一個用于Matlab的NLP庫
通用機器學習
- t分布隨機相鄰嵌入 – t-SNE是一個獲獎的技術,可以降維恍涂,尤其適合高維數據可視化
- 蜘蛛 – 蜘蛛有望成為matlab里機器學習中的完整的面向對象環(huán)境宝惰。
- LibSVM – 著名的支持向量機庫。
- LibLinear – 大型線性分類圖書館
- Caffe – 深度學習框架再沧,結構清晰尼夺,可讀性好,速度快炒瘸。
- 模式識別工具箱 – Matlab機器學習中一個完整的面向對象的環(huán)境淤堵。
- Optunity – 一個致力于自動化超參數優(yōu)化的庫,具有簡單輕便的API顷扩,便于網格搜索的替換拐邪。Optunity是用Python編寫的,但與MATLAB無縫連接隘截。致力于自動化超參數優(yōu)化的一個簡單的扎阶,輕量級的API庫,方便直接替換網格搜索婶芭。Optunity是用Python編寫的东臀,但與MATLAB的無縫連接。
數據分析雕擂,可視化
- matlab_gbl – MatlabBGL是一個用于處理圖形的Matlab包啡邑。
- gamic – 圖形算法的高效純Matlab實現(xiàn),以補充MatlabBGL的mex函數井赌。
C#
計算機視覺
- OpenCVDotNet – 用于與.NET應用程序一起使用的OpenCV項目的包裝器谤逼。
- Emgu CV – OpenCV的跨平臺包裝器贵扰,可以在Mono中編譯為在Windows,Linus流部,Mac OS X戚绕,iOS和Android上運行。
- AForge.NET – 開發(fā)人員和研究人員在計算機視覺和人工智能領域的開源CV剑框架舞丛。發(fā)展現(xiàn)在已經轉移到GitHub。
- Accord.NET – 與AForge.NET一起果漾,該庫可以為Windows球切,Windows RT和Windows Phone提供圖像處理和計算機視覺算法。一些組件也可用于Java和Android绒障。
自然語言處理
- Stanford.NLP for .NET – 一個完整的斯坦福NLP包到.NET吨凑,并且可以作為NuGet包預編譯。
通用機器學習
- 協(xié)調框架 – 一個完整的框架户辱,可以用于機器學習鸵钝,計算機視覺,計算機試聽庐镐,信號處理恩商,統(tǒng)計應用等。
- Accord.MachineLearning – 支持向量機必逆,決策樹怠堪,樸素貝葉斯模型,K均值名眉,高斯混合模型和一般算法研叫,如機器學習應用的Ransac,交叉驗證和網格搜索璧针。此包是Accord.NET Framework的一部分。
- DiffSharp – 一種用于機器學習和優(yōu)化應用程序的自動差分(AD)庫渊啰,提供精確和高效的衍生物(梯度探橱,Hessians,Jacobians绘证,方向導數和無矩陣Hessian和Jacobian矢量產品)隧膏。操作可以嵌套到任何級別,這意味著您可以計算精確的高階導數并區(qū)分在內部使用差異化的功能嚷那,例如超參數優(yōu)化應用程序胞枕。
- Vulpes – 用F#編寫的深度信念和深度學習實現(xiàn),并利用與Alea.cuBase的CUDA GPU執(zhí)行魏宽。
- Encog – 一個先進的神經網絡和機器學習框架腐泻。Encog包含創(chuàng)建各種網絡的類决乎,以及支持類來規(guī)范和處理這些神經網絡的數據。使用多線程彈性傳播的火車派桩。Encog還可以利用GPU來進一步加快處理時間构诚。還提供了基于GUI的工作臺來幫助模擬和訓練神經網絡。
- 神經網絡設計師 – DBMS管理系統(tǒng)和神經網絡設計師铆惑。設計師應用程序是使用WPF開發(fā)的范嘱,是一個用戶界面,允許您設計神經網絡员魏,查詢網絡丑蛤,創(chuàng)建和配置可以從您的反饋中提出問題和學習的聊天機器人。聊天機器人甚至可以刮擦互聯(lián)網以獲取信息以返回其輸出以及用于學習撕阎。
數據分析受裹,可視化
- numl – numl是一個機器學習庫,旨在簡化使用標準建模技術進行預測和聚類闻书。
- Math.NET數學 – Math.NET項目的數學基礎名斟,旨在為科學,工程和日常使用中的數值計算提供方法和算法魄眉。支持Windows砰盐,Linux和Mac上的.Net 4.0,.Net 3.5和Mono; Silverlight 5坑律,WindowsPhone / SL 8岩梳,WindowsPhone 8.1和Windows 8與PCL便攜式配置文件47和344; Android / iOS與Xamarin。
- Sho -Sho是用于數據分析和科學計算的交互式環(huán)境晃择,可讓您將腳本(在IronPython中)與編譯代碼(.NET)無縫連接冀值,以實現(xiàn)快速靈活的原型設計。環(huán)境包括用于線性代數的強大而高效的庫宫屠,以及可以從任何.NET語言使用的數據可視化列疗,以及用于快速開發(fā)的功能豐富的交互式shell。
Ruby
自然語言處理
- 對待 – 文本REtrieval和注釋工具包浪蹂,絕對是我迄今為止遇到的最全面的工具包
- Ruby語言學 – 語言學是用于為任何語言的Ruby對象構建語言實用程序的框架抵栈。它包括通用語言無關的前端,用于將語言代碼映射到語言名稱的模塊坤次,以及包含各種英語工具的模塊古劲。
- Stemmer – 將libstemmer_c發(fā)布給Ruby
- Ruby Wordnet – 該庫是WordNet的一個Ruby接口
- Raspel – raspell是一個綁定ruby的界面
- UEA Stemmer – UEALite Stemmer的Ruby端口 – 搜索和索引的保守干預
- Twitter-text-rb – 在Twitter中自動鏈接和提取用戶名,列表和主題標簽的圖書館
通用機器學習
- Ruby機器學習 – 一些機器學習算法缰猴,在Ruby中實現(xiàn)
- 機器學習Ruby
- jRuby Mahout – JRuby Mahout是在JRuby世界釋放Apache Mahout的力量的寶石产艾。
- CardMagic-Classifier – 一種允許貝葉斯和其他類型分類的通用分類器模塊。
數據分析,可視化
- rsruby – Ruby – R橋
- data-visualization-ruby – 使用Ruby進行數據可視化的Ruby Manor演示文稿的源代碼和支持內容
- ruby-plot – 用于ruby的gnuplot包裝闷堡,特別是用于將roc曲線繪制到svg文件中
- plot-rb – 建立在Vega和D3之上的Ruby中的繪圖庫隘膘。
- 襤褸 – 一個美麗的圖形工具包Ruby
- SciRuby
- Glean – 人類的數據管理工具
- Bioruby
- 阿雷爾
雜項
R
通用機器學習
- ahaz – ahaz:半參數加性危險回歸的正則化
- 弧形 – 弧形:采礦協(xié)會規(guī)則和頻繁項集
- bigrf – bigrf:大隨機森林:大數據集的分類和回歸森林
- bigRR – bigRR:廣義嶺回歸(對于p >> n個情況具有特殊優(yōu)勢)
- bmrm – bmrm:用于正則化風險最小化包的捆綁方法
- Boruta – Boruta:用于所有相關特征選擇的包裝算法
- bst – bst:漸變提升
- C50 – C50:C5.0決策樹和基于規(guī)則的模型
- 插入符號 – 分類和回歸訓練:統(tǒng)一接口到?150 ML算法在R.
- 護理裝配 – 護理裝配:適合多個插入符號模型的框架以及創(chuàng)建這種模型的集合。
- 機器學習的巧妙算法
- CORElearn – CORElearn:分類扫茅,回歸蹋嵌,特征評估和序數評估
- CoxBoost – CoxBoost:Cox模型通過基于可能性的單一生存終點提升或競爭風險
- 立體主義者 – 立體主義者:基于規(guī)則和實例的回歸建模
- 統(tǒng)計部門的其他功能(e1071),TU Wien
- 地球:多變量自適應回歸樣條模型
- elasticnet – elasticnet:彈性網稀疏估計和稀疏PCA
- ElemStatLearn – ElemStatLearn:本書的數據集葫隙,功能和示例:Trevor Hastie栽烂,Robert Tibshirani和Jerome Friedman預測的“統(tǒng)計學習,數據挖掘恋脚,推理和預測的要素”腺办,由Trevor Hastie,Robert Tibshirani和Jerome Friedman
- evtree – evtree:全球最佳樹的進化學習
- fpc – fpc:靈活的聚類過程
- frbs – frbs:用于分類和回歸任務的基于模糊規(guī)則的系統(tǒng)
- GAMBoost – GAMBoost:通過基于可能性的增強的廣義線性和加性模型
- gamboostLSS – gamboostLSS:GAMLSS的增強方法
- gbm – gbm:廣義增強回歸模型
- glmnet – glmnet:拉索和彈性網絡正則化廣義線性模型
- glmpath – glmpath:L1廣義線性模型和Cox比例危險模型的正則化路徑
- GMMBoost – GMMBoost:廣義混合模型的基于可能的推動
- grplasso – grplasso:適合用戶指定的模型與組拉索罰款
- grpreg – grpreg:具有分組協(xié)變量的回歸模型的正則化路徑
- h2o – 快速糟描,平行和分布式機器學習算法的框架 – 深度學習怀喉,隨機森林,GBM船响,KMeans躬拢,PCA,GLM
- hda – hda:異方差判別分析
- 統(tǒng)計學習簡介
- ipred – ipred:改進的預測器
- kernlab – kernlab:基于內核的機器學習實驗室
- klaR – klaR:分類和可視化
- Lars – lars:最小角度回歸见间,Lasso和Forward Stage
- lasso2 – lasso2:L1約束估計aka’lasso’
- LiblineaR – LiblineaR:基于線性C / C ++庫的線性預測模型
- LogicReg – LogicReg:邏輯回歸
- 機器學習黑客
- maptree – maptree:映射聊闯,修剪和圖形樹模型
- mboost – mboost:基于模型的增強
- 混合混合:混合回歸模型,使用貪心逐步的方法
- mlr – mlr:機器學習在R
- mvpart – mvpart:多變量分區(qū)
- ncvreg – ncvreg:SCAD和MCP懲罰回歸模型的正則化路徑
- nnet -nnet:前饋神經網絡和多項對數線性模型
- slope.tree – tilt.tree:分類數據的斜樹
- pamr – pamr:Pam:微陣列預測分析
- 黨派:遞歸提問實驗室
- partykit – partykit:一個遞歸提交工具包
- 懲罰 – 處罰:在GLMs和Cox模型中的L1(套索和融合套索)和L2(脊)懲罰估計
- 懲罰LDA – 處罰LDA:使用Fisher線性判別的懲罰分類
- 懲罰的 SVM – 處罰的SVM:使用懲罰函數的特征選擇SVM
- quantregForest – quantregForest:分位數回歸森林
- randomForest – randomForest:Breiman和Cutler的隨機森林進行分類和歸一化
- randomForestSRC – randomForestSRC:為生存米诉,回歸和分類隨機森林(RF-SRC)
- rattle – rattle:R中數據挖掘的圖形用戶界面
- rda – rda:Shrunken Centroids正則判別分析
- rdetools – rdetools:特征空間中的相關維度估計(RDE)
- REEMtree – REEMtree:回歸樹與縱向(面板)數據隨機效應
- relaxo – relaxo:輕松的套索
- rgenoud – rgenoud:R版本的使用衍生物的遺傳優(yōu)化
- rgp – rgp:R遺傳編程框架
- Rmalschains – Rmalschains:使用R中的本地搜索鏈(MA-LS鏈)的Memetic算法進行連續(xù)優(yōu)化
- 最簡單的:在分類和回歸中更簡單地使用數據挖掘方法(如NN和SVM)
- ROCR – ROCR:可視化評分分類器的性能
- RoughSets – RoughSets:數據分析基于粗糙集與模糊粗糙集理論
- rpart – rpart:遞歸分區(qū)和回歸樹
- RPMM – RPMM:遞歸分區(qū)混合模型
- RSNNS – RSNNS:使用斯圖加特神經網絡模擬器(SNNS)的R中的神經網絡
- RWeka – RWeka:R / Weka界面
- RXshrink – RXshrink:通過通用脊或最小角度回歸的最大似然收縮
- sda -sda:收縮判別分析和CAT分數變量選擇
- SDDA – SDDA:逐步對角判別分析
- 超級聽眾和組合 – 多算法集成學習包菱蔬。
- svmpath – svmpath:svmpath:SVM路徑算法
- tgp – tgp:貝葉斯高斯過程模型
- 樹 – 樹:分類和回歸樹
- varSelRF – varSelRF:使用隨機林的變量選擇
- XGBoost.R – R綁定用于eXtreme漸變提升(樹)庫
- Optunity – 一個致力于自動化超參數優(yōu)化的庫,具有簡單輕便的API史侣,便于網格搜索的替換汗销。Optunity是用Python編寫的,但是可以無縫地連接到R.
數據分析抵窒,可視化
- ggplot2 – 基于圖形語法的數據可視化包。
Scala
自然語言處理
- ScalaNLP – ScalaNLP是一套機器學習和數字計算庫叠骑。
- 微風 – 微風是Scala的數字處理庫李皇。
- 粉筆 – 粉筆是自然語言處理圖書館。
- FACTORIE – FACTORIE是可部署概率建模的工具包,在Scala中作為軟件庫實現(xiàn)掉房。它為用戶提供了一種簡潔的語言茧跋,用于創(chuàng)建關系因子圖,估計參數和執(zhí)行推理卓囚。
數據分析瘾杭,可視化
- Apache Spark中的 MLlib – Spark中的分布式機器學習庫
- Scalding – 用于級聯(lián)的Scala API
- 總結鳥 – 流行的MapReduce與Scalding和風暴
- Algebird – Scala的抽象代數
- xerial – Scala的數據管理工具
- 煨 – 減少你的數據。用于algebird供電聚合的unix過濾器哪亿。
- PredictionIO – PredictionIO粥烁,用于軟件開發(fā)人員和數據工程師的機器學習服務器。
- BIDMat – CPU和GPU加速矩陣庫蝇棉,旨在支持大規(guī)模的探索性數據分析讨阻。
- 沃爾夫聲明機器學習
通用機器學習
- 推測 – 可擴展機器學習在縮放
- 刷火 – Scala中的分布式決策樹合奏學習
- ganitha – 燙金機器學習
- adam – 使用Apache Avro,Apache Spark和Parquet構建的基因組處理引擎和專用文件格式篡殷。Apache 2許可钝吮。
- bioscala – Scala編程語言的生物信息學
- BIDMach – CPU和GPU加速機器學習庫。
- 費加羅 – 構建概率模型的Scala庫板辽。
-
H2O閃蒸水 – H2O和Spark互操作性奇瘦。
<div style="margin-top: 15px; font-style: italic">
** 轉載自URl-team
本文鏈接地址: 機器學習各語言領域工具庫中文版匯總