機器學習各語言領域工具庫中文版匯總

** 轉載自URl-team

本文鏈接地址: 機器學習各語言領域工具庫中文版匯總

主要資源來自TensorFlow中文社區(qū)霞篡，翻譯借助谷歌翻譯，僅用于資源分享甲献。
以下是根據不同語言類型和應用領域收集的各類工具庫邮屁，持續(xù)更新中琐鲁。

C

通用機器學習

推薦人 -一個產品推薦的?語言庫，利用了協(xié)同過濾惭每。

計算機視覺

CCV – C / Cached /核心計算機視覺庫骨饿，是一個現(xiàn)代化的計算機視覺庫。
VLFeat – VLFeat是開源的計算機視覺算法庫台腥，有Matlab工具箱宏赘。

C ++

計算機視覺

OpenCV – 最常用的視覺庫。有C ++览爵，C柿赊，Python以及Java接口），支持Windows逆趣，Linux苹支，Android和Mac OS。
DLib – DLib有C ++和Python臉部識別和物體檢測接口俱济。
EBLearn – Eblearn是一個面向對象的C ++庫嘶是，實現(xiàn)了各種機器學習模型。
VIGRA – VIGRA是一個跨平臺的機器視覺和機器學習庫蛛碌，可以處理任意維度的數據聂喇，有Python接口。

通用機器學習

MLPack – 可拓展的C ++機器學習庫。
DLib – 設計為方便嵌入到其他系統(tǒng)中希太。
encog-CPP
鯊魚
Vowpal Wabbit（VW） – 快速的核心外學習系統(tǒng)克饶。
sofia-ml – 快速增量算法套件。
幕府將軍 – 學徒機器學習工具箱
Caffe – 深度學習框架誊辉，結構清晰矾湃，可讀性好，速度快堕澄。
CXXNET – 精簡的框架邀跃，核心代碼不到1000行。
XGBoost – 為并行計算優(yōu)化過的梯度提升庫蛙紫。
CUDA – 這是一個快速的C ++ / CUDA實現(xiàn)卷積[DEEP LEARNING]
Stan – 一種使用哈密爾頓蒙特卡洛取樣執(zhí)行完全貝葉斯統(tǒng)計推理的概率編程語言
BanditLib – 一個簡單的多武裝強盜圖書館拍屑。
Timbl – 實現(xiàn)了多個基于內存的算法，其中IB1-IG（KNN分類算法）和IGTree（決策樹）在NLP中廣泛應用坑傅。

自然語言處理

MIT信息提取工具包 – C僵驰，C ++和Python工具，用來命名實體識別和關系抽取裁蚁。
CRF ++ – 條件隨機場的開源實現(xiàn)矢渊，可以用作分詞，詞性標注等枉证。
CRFsuite – CRFsuite是條件隨機場的實現(xiàn)矮男，可以用作詞性標注等。
BLLIP解析器 – 即Charniak-Johnson解析器室谚。
colibri-core – 一組C ++庫毡鉴，命令行工具以及Python綁定，高效實現(xiàn)了n-gram和skipgrams秒赤。
ucto – 多語言tokenizer猪瞬，支持面向Unicode的正則表達式，支持FoLiA格式入篮。
libfolia – FoLiA格式的 C ++庫
MeTA – MeTA：ModErn文本分析從巨量文本中挖掘數據陈瘦。

語音識別

Kaldi – Kaldi是一個C ++工具，以Apache許可證V2.0發(fā)布.Kaldi適用于語音識別的研究潮售。

序列分析

ToPS – 這是一個面向對象的框架痊项，有助于在用戶定義的字母表上整合序列的概率模型。

Java

自然語言處理

Cortical.io – Retina：此API執(zhí)行復雜的NLP操作（消歧義酥诽，分類鞍泉，流文本過濾等），快速肮帐，直觀如同大腦一般咖驮。
CoreNLP – Stanford CoreNLP提供了一組自然語言分析工具，可采取原始英語文本輸入并給出單詞的基本形式。
斯坦福解析器 – 解析器是一個程序托修，能分析出句子的語法結構忘巧。
Stanford POS Tagger – 詞性標注器
斯坦福大學名稱實體識別器 – 斯坦福大學NER是一個Java實現(xiàn)的命名實體識別器。
Stanford Word Segmenter – 原始文本的令牌化是許多NLP任務的標準預處理步驟诀黍。
Tregex袋坑，Tsurgeon和Semgrex – Tregex是匹配樹模式的工具仗处，基于樹的關系和正則表達式的節(jié)點匹配（“樹正則表達式”的縮寫）眯勾。
斯坦福Phrasal：基于短語的翻譯系統(tǒng)
斯坦福英語Tokenizer – Stanford Phrasal是最先進的統(tǒng)計的基于短語的機器翻譯系統(tǒng)，用Java編寫婆誓。
斯坦福令牌正則表達式 – 標記器將文本劃分成一系列令牌吃环，大致對應于“單詞”
斯坦福時代標簽 – SUTime是識別和規(guī)范時間表達式的庫。
斯坦福SPIED – 從種子集開始洋幻，迭代使用模式郁轻，從未標注文本中習得實體。
斯坦福主題建模工具箱 – 主題建模工具文留，社會學家用它分析的數據集好唯。
Twitter Text Java – Java實現(xiàn)的Twitter文本處理庫。
MALLET – 基于Java的軟件包燥翅，包括統(tǒng)計自然語言處理骑篙，文檔分類，聚類森书，主題建模靶端，信息提取，以及其它機器學習應用凛膏。
OpenNLP – 一個基于機器學習的自然語言處理的工具包杨名。
LingPipe – 計算語言學工具包。
ClearTK – ClearTK提供了開發(fā)統(tǒng)計自然語言處理組件的框架猖毫，其建立在Apache UIMA之上台谍。
Apache cTAKES – Apache臨床文本分析及知識提取系統(tǒng)（cTAKES）是從電子病歷，臨床文本中進行信息抽取的一個開源系統(tǒng)吁断。

通用機器學習

氣溶膠 – Airbnb從頭開始設計的機器學習庫趁蕊，易用性好。
Datumbox – 機器學習和統(tǒng)計應用程序的快速開發(fā)框架胯府。
ELKI – 數據挖掘工具介衔。（非監(jiān)督學習：聚類，離群點檢測等骂因。）
Encog中包含用于創(chuàng)建各種網絡炎咖，以及規(guī)范和處理數據的神經網絡Encog訓練采用多線程彈性的傳播方式。Encog還可以利用GPU的進一步加快處理時間。有基于GUI的工作臺乘盼。
H2O – 機器學習引擎升熊，支持Hadoop，Spark等分布式系統(tǒng)和個人電腦绸栅，可以通過R级野，Python，Scala粹胯，REST / JSON調用API蓖柔。
htm.java – 通用機器學習庫，使用Numenta的皮質學習算法
Java-deeplearning – 分布式深度學習平臺Java风纠，Clojure况鸣，Scala
JAVA-ML – Java通用機器學習庫，所有算法統(tǒng)一接口竹观。
JSAT – 具有很多分類镐捧，回歸，聚類等機器學習算法臭增。
Mahout – 分布式機器學習工具懂酱。
Meka – 一個開源實現(xiàn)的多標簽分類和評估方法。
Apache Spark中的 MLlib – Spark分布式機器學習庫
Neuroph – 輕量級Java神經網絡框架
ORYX – Lambda架構框架誊抛，使用Apache Spark和Apache Kafka實現(xiàn)實時大規(guī)模機器學習列牺。
RankLib – 排序算法學習庫。
斯坦福分類器 – 分類器是一種機器學習工具芍锚，它將獲取數據項并將它們放入k類之一昔园。
SmileMiner – 統(tǒng)計機器智能和學習引擎
SystemML – 靈活的，可擴展的機器學習語言并炮。
WalnutiQ – 面向對象的人腦模型
Weka – WEKA是機器學習算法用于數據挖掘任務的算法集合默刚。

語音識別

CMU Sphinx – 開源工具包，用于語音識別逃魄，完全基于Java的語音識別庫荤西。

數據分析，可視化

Hadoop – Hadoop / HDFS
Spark – Spark快速通用的大規(guī)模數據處理引擎伍俘。
Impala – 實時Hadoop查詢邪锌。
DataMelt – 數學軟件，包含數值計算癌瘾，統(tǒng)計觅丰，符號計算，數據分析和數據可視化妨退。
邁克爾·托馬斯·弗拉納根博士的Java科學圖書館

深度學習

Deeplearning4j – 可擴展的產業(yè)化的深度學習妇萄，利用并行的GPU蜕企。

Python

計算機視覺

Scikit-Image – Python中的圖像處理算法的集合。
SimpleCV – 一個開源的計算機視覺框架冠句，允許訪問幾個高性能計算機視覺庫轻掩，如OpenCV∨车祝可以運行在Mac唇牧，Windows和Ubuntu Linux操作系統(tǒng)上。
Vigranumpy – 計算機視覺庫VIGRA C ++的Python綁定聚唐。

自然語言處理

NLTK – 構建與人類語言數據相關工作的Python程序的領先平臺丐重。
模式 – 基于Python的Web挖掘模塊。它有自然語言處理拱层，機器學習等工具弥臼。
Quepy – 將自然語言問題轉換成數據庫查詢語言。
TextBlob – 為普通的自然語言處理（NLP）任務提供一致的API根灯。構建于NLTK和Pattern上，并且很好地與兩者交互掺栅。
YAlign – 句子對齊工具烙肺，從對照語料中抽取并行句子。
jieba – 中文分詞工具
SnowNLP – 中文文本處理庫氧卧。
loso – 中文分詞工具
天才 – 基于條件隨機場的中文分詞工具
KoNLPy – 韓語自然語言處理
堅果 – 自然語言理解工具
Rosetta – 文字處理工具和包裝紙（例如Vowpal Wabbit）
BLLIP解析器 – BLLIP自然語言解析器的Python綁定（即Charniak-Johnson解析器）
PyNLPl – Python的自然語言處理庫桃笙。還包含用于解析常見NLP格式的工具，如FoLiA沙绝，以及ARPA語言模型搏明，Moses短語，GIZA ++對齊等闪檬。
python-ucto – ucto（面向unicode的基于規(guī)則的tokenizer）的Python綁定
python-frog – Frog的Python綁定星著。荷蘭語的詞性標注，lemmatisation粗悯，依存分析虚循，NER。
python-zpar – ZPar的Python綁定（英文的基于統(tǒng)計的詞性標注样傍，constiuency解析器和依賴解析器）
colibri-core – 高效提取n-gram和skipgrams的C ++庫的Python綁定
spaCy – 工業(yè)級NLP與Python和Cython横缔。
PyStanfordDependencies – 將Penn Treebank樹轉換到Stanford依存樹的Python接口。

通用機器學習

機器學習 – 構建和Web界面衫哥，程序化界面兼容的支持向量機API茎刚。相應的數據集存儲到一個SQL數據庫，然后生成用于預測的模型撤逢，存儲到一個的NoSQL的數據庫膛锭。
XGBoost – eXtreme Gradient Boosting（Tree）庫的Python綁定
Featureforge一組工具捌斧，用于創(chuàng)建和測試機器學習的特征，具有與scikit學習兼容的API
scikit-learning – 基于SciPy的機器學習的Python模塊泉沾。
度量學習 – 度量學習的Python模塊
SimpleAI – 實現(xiàn)了“人工智能現(xiàn)代方法”一書中描述的許多人工智能算法捞蚂。它著重于提供一個易于使用的，文檔良好的和經過測試的庫跷究。
astroML – 天文學機器學習和數據挖掘庫姓迅。
graphlab-create – 基于磁盤支持的DataFrame的庫，實現(xiàn)了各種機器學習模型（回歸俊马，聚類丁存，推薦系統(tǒng)，圖形分析等）柴我。
BigML – 與外部服務器交流的庫解寝。
模式 – Web數據挖掘模塊。
NuPIC – Numenta智能計算平臺艘儒。
Pylearn2 – 基于Theano的機器學習庫聋伦。
keras – 基于Theano的神經網絡庫
hebel – GPU加速的Python深度學習庫。
Chainer – 靈活的神經網絡架構
gensim – 易用的主題建模工具
topik – 主題建模工具包
PyBrain – 另一個Python機器學習庫界睁。
Crab – 靈活的觉增，快速的推薦引擎
python-recsys – 實現(xiàn)一個推薦系統(tǒng)的Python工具
限制玻爾茲曼機器 – 受限玻爾茲曼機
CoverTree – 覆蓋樹的Python實現(xiàn)，scipy.spatial.kdtree的近似替換
nilearn – NeuroImaging機器學習庫
幕府將軍學習機器學習工具箱
Pyevolve – 遺傳算法框架
Caffe – 深度學習框架翻斟，結構清晰逾礁，可讀性好，速度快访惜。
breze – 基于Theano的深度神經網絡
pyhsmm -貝葉斯隱馬爾可夫模型近似無監(jiān)督的推理和顯式時長隱半馬爾可夫模型嘹履，專注于貝葉斯非參數擴展時，HDP-HMM和HDP-HSMM债热，大多是弱極限近似砾嫉。
mrjob – 使得Python程序可以跑在Hadoop上。
SKLL – 簡化的scikit-learn接口阳柔，易于做實驗
neurolab – https://github.com/zueve/neurolab
薄荷 – 貝葉斯算法的優(yōu)化焰枢。方法見于論文：機器學習算法的實踐貝葉斯優(yōu)化。Jasper Snoek舌剂，Hugo Larochelle和Ryan P. Adams济锄。2012年神經信息處理系統(tǒng)進展。
Pebl – 貝葉斯學習的Python環(huán)境
Theano – 優(yōu)化GPU元編程代碼霍转，生成面向矩陣的優(yōu)化的數學編譯器
TensorFlow – 用數據流圖進行數值計算的開源軟件庫
yahmm – 隱馬爾可夫模型荐绝，用Cython實現(xiàn)
python-timbl – 包裝了完整的TiMBL C ++編程接口。Timbl是一個精心制作的?最近鄰機器學習工具包避消。
deap – 進化算法框架
pydeep – Python深度學習
mlxtend – 對數據科學和機器學習任務非常有用的工具庫低滩。
霓虹燈 – 高性能深度學習框架
Optunity – 致力于自動化超參數優(yōu)化過程召夹，使用一個簡單的，輕量級的API，以方便直接替換網格搜索。
惹惱 -近似最近鄰居執(zhí)行
skflow – TensorFlow的簡化界面乌询，類似Scikit Learn绳泉。
TPOT – 自動創(chuàng)建并利用遺傳編程優(yōu)化機器學習的管道统倒。將它看作您的數據科學助理，自動化機器學習中大部分的枯燥工作。

數據分析，可視化

SciPy – 一個基于Python的數據褐筛，科學和工程開源軟件生態(tài)系統(tǒng)。
NumPy – 用Python進行科學計算的基礎軟件包叙身。
Numba – Python JIT（及時）編譯為LLVM渔扎，由Cython和NumPy的開發(fā)人員針對科學Python。
NetworkX – 復雜網絡的高生產率軟件信轿。
熊貓 – 提供高性能晃痴，易于使用的數據結構和數據分析工具的庫。
開放采礦 – Python中的商業(yè)智能（BI）（熊貓網絡界面）
PyMC – 馬爾可夫鏈蒙特卡洛取樣工具包虏两。
zipline – 一個Pythonic算法交易庫愧旦。
PyDy – Python Dynamics的簡稱，用于協(xié)助基于NumPy定罢，SciPy，IPython和matplotlib的動態(tài)運動建模中的工作流程旁瘫。
SymPy – 符號數學的Python庫祖凫。
statsmodels – Python中的統(tǒng)計建模和計量經濟學。
astropy – 一個用于天文學的社區(qū)Python庫酬凳。
matplotlib – 一個Python 2D繪圖庫惠况。
散景 – Python的互動網絡繪圖。
劇情 – Python和matplotlib的協(xié)作網絡繪圖宁仔。
vincent – 一個Python到Vega翻譯器稠屠。
d3py -一個plottling庫的Python，基于D3.js翎苫。
ggplot – 與ggplot2相同的API
ggfortify – ggplot2流行的R包的統(tǒng)一接口权埠。
Kartograph.py – 在Python中呈現(xiàn)美麗的SVG地圖。
pygal – 一個Python SVG圖表創(chuàng)建者煎谍。
PyQtGraph – 一個基于PyQt4 / PySide和NumPy的純python圖形和GUI庫攘蔽。
pycascading
Petrel – 用于編寫，提交呐粘，調試和監(jiān)視純Python中的風暴拓撲的工具满俗。
Blaze – NumPy和Pandas與Big Data接口转捕。
emcee – 仿射不變MCMC的Python集合采樣工具包。
windML – 風能分析與預測的Python框架
vispy – 基于GPU的高性能交互式OpenGL 2D / 3D數據可視化庫
cerebro2 NuPIC的基于Web的可視化和調試平臺唆垃。
NuPIC Studio一體化NuPIC分層時態(tài)內存可視化和調試超級工具五芝！
PySpark上的SparklingPandas Pandas（POPS）
Seaborn – 基于matplotlib的python可視化庫
bqplot – 用于在Jupyter（IPython）中繪制的API

常見的Lisp

通用機器學習

mgl – 神經網絡（boltzmann機器，前饋和復發(fā)網絡）辕万，高斯過程
mgl-gpr – 進化算法
cl-libsvm – libsvm支持向量機庫的包裝器

Clojure

自然語言處理

Clojure-openNLP – Clojure中的自然語言處理（opennlp）
感染 – clj – Clojure和ClojureScript的Rails樣拐彎庫

通用機器學習

Touchstone – Clojure A / B測試庫
Clojush – 他推動編程語言和在Clojure中實現(xiàn)的PushGP遺傳編程系統(tǒng)
Infer – 推理和機器學習在clojure
Clj-ML – 一個用于Clojure的機器學習庫枢步，建于Weka和朋友之上
Encog – 用于Encog（v3）的Clojure包裝器（專門從事神經網絡的機器學習框架）
Fungp – Clojure的遺傳編程庫
Statistiker – Clojure中的基本機器學習算法。
clortex – 通用機器學習庫使用Numenta的皮質學習算法
comportex – 功能可組合的機器學習庫蓄坏，使用Numenta的皮質學習算法

數據分析价捧，可視化

Incanter – Incanter是一個基于Clojure的R類統(tǒng)計計算和圖形平臺。
PigPen – Map-Reduce for Clojure涡戳。
Envision – Clojure數據可視化庫结蟋，基于Statistiker和D3

MATLAB

計算機視覺

輪廓 – 實現(xiàn)輪廓變換的 MATLAB源代碼及其效用函數。
Shearlets – 用于小波變換的MATLAB代碼
曲線 – 曲線變換是小波變換的更高維度泛化渔彰，旨在表示不同尺度和不同角度的圖像嵌屎。
Bandlets – 用于帶狀變換的MATLAB代碼
mexopencv – OpenCV庫的收集和MATLAB mex功能的開發(fā)工具包

自然語言處理

NLP – 一個用于Matlab的NLP庫

通用機器學習

t分布隨機相鄰嵌入 – t-SNE是一個獲獎的技術，可以降維恍涂，尤其適合高維數據可視化
蜘蛛 – 蜘蛛有望成為matlab里機器學習中的完整的面向對象環(huán)境宝惰。
LibSVM – 著名的支持向量機庫。
LibLinear – 大型線性分類圖書館
Caffe – 深度學習框架再沧，結構清晰尼夺，可讀性好，速度快炒瘸。
模式識別工具箱 – Matlab機器學習中一個完整的面向對象的環(huán)境淤堵。
Optunity – 一個致力于自動化超參數優(yōu)化的庫，具有簡單輕便的API顷扩，便于網格搜索的替換拐邪。Optunity是用Python編寫的，但與MATLAB無縫連接隘截。致力于自動化超參數優(yōu)化的一個簡單的扎阶，輕量級的API庫，方便直接替換網格搜索婶芭。Optunity是用Python編寫的东臀，但與MATLAB的無縫連接。

數據分析雕擂，可視化

matlab_gbl – MatlabBGL是一個用于處理圖形的Matlab包啡邑。
gamic – 圖形算法的高效純Matlab實現(xiàn)，以補充MatlabBGL的mex函數井赌。

C#

計算機視覺

OpenCVDotNet – 用于與.NET應用程序一起使用的OpenCV項目的包裝器谤逼。
Emgu CV – OpenCV的跨平臺包裝器贵扰，可以在Mono中編譯為在Windows，Linus流部，Mac OS X戚绕，iOS和Android上運行。
AForge.NET – 開發(fā)人員和研究人員在計算機視覺和人工智能領域的開源CＶ剑框架舞丛。發(fā)展現(xiàn)在已經轉移到GitHub。
Accord.NET – 與AForge.NET一起果漾，該庫可以為Windows球切，Windows RT和Windows Phone提供圖像處理和計算機視覺算法。一些組件也可用于Java和Android绒障。

自然語言處理

Stanford.NLP for .NET – 一個完整的斯坦福NLP包到.NET吨凑，并且可以作為NuGet包預編譯。

通用機器學習

協(xié)調框架 – 一個完整的框架户辱，可以用于機器學習鸵钝，計算機視覺，計算機試聽庐镐，信號處理恩商，統(tǒng)計應用等。
Accord.MachineLearning – 支持向量機必逆，決策樹怠堪，樸素貝葉斯模型，K均值名眉，高斯混合模型和一般算法研叫，如機器學習應用的Ransac，交叉驗證和網格搜索璧针。此包是Accord.NET Framework的一部分。
DiffSharp – 一種用于機器學習和優(yōu)化應用程序的自動差分（AD）庫渊啰，提供精確和高效的衍生物（梯度探橱，Hessians，Jacobians绘证，方向導數和無矩陣Hessian和Jacobian矢量產品）隧膏。操作可以嵌套到任何級別，這意味著您可以計算精確的高階導數并區(qū)分在內部使用差異化的功能嚷那，例如超參數優(yōu)化應用程序胞枕。
Vulpes – 用F＃編寫的深度信念和深度學習實現(xiàn)，并利用與Alea.cuBase的CUDA GPU執(zhí)行魏宽。
Encog – 一個先進的神經網絡和機器學習框架腐泻。Encog包含創(chuàng)建各種網絡的類决乎，以及支持類來規(guī)范和處理這些神經網絡的數據。使用多線程彈性傳播的火車派桩。Encog還可以利用GPU來進一步加快處理時間构诚。還提供了基于GUI的工作臺來幫助模擬和訓練神經網絡。
神經網絡設計師 – DBMS管理系統(tǒng)和神經網絡設計師铆惑。設計師應用程序是使用WPF開發(fā)的范嘱，是一個用戶界面，允許您設計神經網絡员魏，查詢網絡丑蛤，創(chuàng)建和配置可以從您的反饋中提出問題和學習的聊天機器人。聊天機器人甚至可以刮擦互聯(lián)網以獲取信息以返回其輸出以及用于學習撕阎。

數據分析受裹，可視化

numl – numl是一個機器學習庫，旨在簡化使用標準建模技術進行預測和聚類闻书。
Math.NET數學 – Math.NET項目的數學基礎名斟，旨在為科學，工程和日常使用中的數值計算提供方法和算法魄眉。支持Windows砰盐，Linux和Mac上的.Net 4.0，.Net 3.5和Mono; Silverlight 5坑律，WindowsPhone / SL 8岩梳，WindowsPhone 8.1和Windows 8與PCL便攜式配置文件47和344; Android / iOS與Xamarin。
Sho -Sho是用于數據分析和科學計算的交互式環(huán)境晃择，可讓您將腳本（在IronPython中）與編譯代碼（.NET）無縫連接冀值，以實現(xiàn)快速靈活的原型設計。環(huán)境包括用于線性代數的強大而高效的庫宫屠，以及可以從任何.NET語言使用的數據可視化列疗，以及用于快速開發(fā)的功能豐富的交互式shell。

Ruby

自然語言處理

對待 – 文本REtrieval和注釋工具包浪蹂，絕對是我迄今為止遇到的最全面的工具包
Ruby語言學 – 語言學是用于為任何語言的Ruby對象構建語言實用程序的框架抵栈。它包括通用語言無關的前端，用于將語言代碼映射到語言名稱的模塊坤次，以及包含各種英語工具的模塊古劲。
Stemmer – 將libstemmer_c發(fā)布給Ruby
Ruby Wordnet – 該庫是WordNet的一個Ruby接口
Raspel – raspell是一個綁定ruby的界面
UEA Stemmer – UEALite Stemmer的Ruby端口 – 搜索和索引的保守干預
Twitter-text-rb – 在Twitter中自動鏈接和提取用戶名，列表和主題標簽的圖書館

通用機器學習

Ruby機器學習 – 一些機器學習算法缰猴，在Ruby中實現(xiàn)
機器學習Ruby
jRuby Mahout – JRuby Mahout是在JRuby世界釋放Apache Mahout的力量的寶石产艾。
CardMagic-Classifier – 一種允許貝葉斯和其他類型分類的通用分類器模塊。

數據分析，可視化

rsruby – Ruby – R橋
data-visualization-ruby – 使用Ruby進行數據可視化的Ruby Manor演示文稿的源代碼和支持內容
ruby-plot – 用于ruby的gnuplot包裝闷堡，特別是用于將roc曲線繪制到svg文件中
plot-rb – 建立在Vega和D3之上的Ruby中的繪圖庫隘膘。
襤褸 – 一個美麗的圖形工具包Ruby
SciRuby
Glean – 人類的數據管理工具
Bioruby
阿雷爾

雜項

大數據為黑猩猩
Listof – 以社區(qū)為基礎的數據收集，包裝在寶石缚窿。在txt棘幸，json或hash中獲取幾乎任何東西（停止詞語，國家倦零，非單詞）的列表误续。演示/搜索列表

R

通用機器學習

ahaz – ahaz：半參數加性危險回歸的正則化
弧形 – 弧形：采礦協(xié)會規(guī)則和頻繁項集
bigrf – bigrf：大隨機森林：大數據集的分類和回歸森林
bigRR – bigRR：廣義嶺回歸（對于p >> n個情況具有特殊優(yōu)勢）
bmrm – bmrm：用于正則化風險最小化包的捆綁方法
Boruta – Boruta：用于所有相關特征選擇的包裝算法
bst – bst：漸變提升
C50 – C50：C5.0決策樹和基于規(guī)則的模型
插入符號 – 分類和回歸訓練：統(tǒng)一接口到?150 ML算法在R.
護理裝配 – 護理裝配：適合多個插入符號模型的框架以及創(chuàng)建這種模型的集合。
機器學習的巧妙算法
CORElearn – CORElearn：分類扫茅，回歸蹋嵌，特征評估和序數評估
CoxBoost – CoxBoost：Cox模型通過基于可能性的單一生存終點提升或競爭風險
立體主義者 – 立體主義者：基于規(guī)則和實例的回歸建模
統(tǒng)計部門的其他功能（e1071），TU Wien
地球：多變量自適應回歸樣條模型
elasticnet – elasticnet：彈性網稀疏估計和稀疏PCA
ElemStatLearn – ElemStatLearn：本書的數據集葫隙，功能和示例：Trevor Hastie栽烂，Robert Tibshirani和Jerome Friedman預測的“統(tǒng)計學習，數據挖掘恋脚，推理和預測的要素”腺办，由Trevor Hastie，Robert Tibshirani和Jerome Friedman
evtree – evtree：全球最佳樹的進化學習
fpc – fpc：靈活的聚類過程
frbs – frbs：用于分類和回歸任務的基于模糊規(guī)則的系統(tǒng)
GAMBoost – GAMBoost：通過基于可能性的增強的廣義線性和加性模型
gamboostLSS – gamboostLSS：GAMLSS的增強方法
gbm – gbm：廣義增強回歸模型
glmnet – glmnet：拉索和彈性網絡正則化廣義線性模型
glmpath – glmpath：L1廣義線性模型和Cox比例危險模型的正則化路徑
GMMBoost – GMMBoost：廣義混合模型的基于可能的推動
grplasso – grplasso：適合用戶指定的模型與組拉索罰款
grpreg – grpreg：具有分組協(xié)變量的回歸模型的正則化路徑
h2o – 快速糟描，平行和分布式機器學習算法的框架 – 深度學習怀喉，隨機森林，GBM船响，KMeans躬拢，PCA，GLM
hda – hda：異方差判別分析
統(tǒng)計學習簡介
ipred – ipred：改進的預測器
kernlab – kernlab：基于內核的機器學習實驗室
klaR – klaR：分類和可視化
Lars – lars：最小角度回歸见间，Lasso和Forward Stage
lasso2 – lasso2：L1約束估計aka’lasso’
LiblineaR – LiblineaR：基于線性C / C ++庫的線性預測模型
LogicReg – LogicReg：邏輯回歸
機器學習黑客
maptree – maptree：映射聊闯，修剪和圖形樹模型
mboost – mboost：基于模型的增強
混合混合：混合回歸模型，使用貪心逐步的方法
mlr – mlr：機器學習在R
mvpart – mvpart：多變量分區(qū)
ncvreg – ncvreg：SCAD和MCP懲罰回歸模型的正則化路徑
nnet -nnet：前饋神經網絡和多項對數線性模型
slope.tree – tilt.tree：分類數據的斜樹
pamr – pamr：Pam：微陣列預測分析
黨派：遞歸提問實驗室
partykit – partykit：一個遞歸提交工具包
懲罰 – 處罰：在GLMs和Cox模型中的L1（套索和融合套索）和L2（脊）懲罰估計
懲罰LDA – 處罰LDA：使用Fisher線性判別的懲罰分類
懲罰的 SVM – 處罰的SVM：使用懲罰函數的特征選擇SVM
quantregForest – quantregForest：分位數回歸森林
randomForest – randomForest：Breiman和Cutler的隨機森林進行分類和歸一化
randomForestSRC – randomForestSRC：為生存米诉，回歸和分類隨機森林（RF-SRC）
rattle – rattle：R中數據挖掘的圖形用戶界面
rda – rda：Shrunken Centroids正則判別分析
rdetools – rdetools：特征空間中的相關維度估計（RDE）
REEMtree – REEMtree：回歸樹與縱向（面板）數據隨機效應
relaxo – relaxo：輕松的套索
rgenoud – rgenoud：R版本的使用衍生物的遺傳優(yōu)化
rgp – rgp：R遺傳編程框架
Rmalschains – Rmalschains：使用R中的本地搜索鏈（MA-LS鏈）的Memetic算法進行連續(xù)優(yōu)化
最簡單的：在分類和回歸中更簡單地使用數據挖掘方法（如NN和SVM）
ROCR – ROCR：可視化評分分類器的性能
RoughSets – RoughSets：數據分析基于粗糙集與模糊粗糙集理論
rpart – rpart：遞歸分區(qū)和回歸樹
RPMM – RPMM：遞歸分區(qū)混合模型
RSNNS – RSNNS：使用斯圖加特神經網絡模擬器（SNNS）的R中的神經網絡
RWeka – RWeka：R / Weka界面
RXshrink – RXshrink：通過通用脊或最小角度回歸的最大似然收縮
sda -sda：收縮判別分析和CAT分數變量選擇
SDDA – SDDA：逐步對角判別分析
超級聽眾和組合 – 多算法集成學習包菱蔬。
svmpath – svmpath：svmpath：SVM路徑算法
tgp – tgp：貝葉斯高斯過程模型
樹 – 樹：分類和回歸樹
varSelRF – varSelRF：使用隨機林的變量選擇
XGBoost.R – R綁定用于eXtreme漸變提升（樹）庫
Optunity – 一個致力于自動化超參數優(yōu)化的庫，具有簡單輕便的API史侣，便于網格搜索的替換汗销。Optunity是用Python編寫的，但是可以無縫地連接到R.

數據分析抵窒，可視化

ggplot2 – 基于圖形語法的數據可視化包。

Scala

自然語言處理

ScalaNLP – ScalaNLP是一套機器學習和數字計算庫叠骑。
微風 – 微風是Scala的數字處理庫李皇。
粉筆 – 粉筆是自然語言處理圖書館。
FACTORIE – FACTORIE是可部署概率建模的工具包，在Scala中作為軟件庫實現(xiàn)掉房。它為用戶提供了一種簡潔的語言茧跋，用于創(chuàng)建關系因子圖，估計參數和執(zhí)行推理卓囚。

數據分析瘾杭，可視化

Apache Spark中的 MLlib – Spark中的分布式機器學習庫
Scalding – 用于級聯(lián)的Scala API
總結鳥 – 流行的MapReduce與Scalding和風暴
Algebird – Scala的抽象代數
xerial – Scala的數據管理工具
煨 – 減少你的數據。用于algebird供電聚合的unix過濾器哪亿。
PredictionIO – PredictionIO粥烁，用于軟件開發(fā)人員和數據工程師的機器學習服務器。
BIDMat – CPU和GPU加速矩陣庫蝇棉，旨在支持大規(guī)模的探索性數據分析讨阻。
沃爾夫聲明機器學習

通用機器學習

推測 – 可擴展機器學習在縮放
刷火 – Scala中的分布式決策樹合奏學習
ganitha – 燙金機器學習
adam – 使用Apache Avro，Apache Spark和Parquet構建的基因組處理引擎和專用文件格式篡殷。Apache 2許可钝吮。
bioscala – Scala編程語言的生物信息學
BIDMach – CPU和GPU加速機器學習庫。
費加羅 – 構建概率模型的Scala庫板辽。
H2O閃蒸水 – H2O和Spark互操作性奇瘦。
<div style="margin-top: 15px; font-style: italic">

** 轉載自URl-team

本文鏈接地址: 機器學習各語言領域工具庫中文版匯總

最后編輯于：2017.12.23 22:22:38

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市劲弦，隨后出現(xiàn)的幾起案子耳标，更是在濱河造成了極大的恐慌，老刑警劉巖瓶您，帶你破解...
沈念sama閱讀 216,372評論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件麻捻，死亡現(xiàn)場離奇詭異，居然都是意外死亡呀袱，警方通過查閱死者的電腦和手機贸毕，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來夜赵，“玉大人明棍，你說我怎么就攤上這事】苌” “怎么了摊腋？”我有些...
開封第一講書人閱讀 162,415評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長嘁傀。經常有香客問我兴蒸，道長，這世上最難降的妖魔是什么细办？我笑而不...
開封第一講書人閱讀 58,157評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任橙凳，我火速辦了婚禮燃辖，結果婚禮上载迄，老公的妹妹穿的比我還像新娘舱痘。我一直安慰自己派殷，他們只是感情好，可當我...
茶點故事閱讀 67,171評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布坚踩。她就那樣靜靜地躺著荡灾，像睡著了一般。火紅的嫁衣襯著肌膚如雪瞬铸。梳的紋絲不亂的頭發(fā)上批幌，一...
開封第一講書人閱讀 51,125評論 1贊 297
城市分裂傳說
那天，我揣著相機與錄音赴捞，去河邊找鬼逼裆。笑死，一個胖子當著我的面吹牛赦政，可吹牛的內容都是我干的胜宇。我是一名探鬼主播，決...
沈念sama閱讀 40,028評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼恢着，長吁一口氣：“原來是場噩夢啊……” “哼桐愉！你這毒婦竟也來了？” 一聲冷哼從身側響起掰派，我...
開封第一講書人閱讀 38,887評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤从诲，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后靡羡，有當地人在樹林里發(fā)現(xiàn)了一具尸體系洛，經...
沈念sama閱讀 45,310評論 1贊 310
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,533評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年略步，在試婚紗的時候發(fā)現(xiàn)自己被綠了描扯。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,690評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡趟薄，死狀恐怖绽诚，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情杭煎，我是刑警寧澤恩够，帶...
沈念sama閱讀 35,411評論 5贊 343
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站羡铲，受9級特大地震影響蜂桶，放射性物質發(fā)生泄漏。R本人自食惡果不足惜也切，卻給世界環(huán)境...
茶點故事閱讀 41,004評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一屎飘、第九天我趴在偏房一處隱蔽的房頂上張望妥曲。院中可真熱鬧，春花似錦钦购、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案押桃，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至导犹，卻和暖如春唱凯，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背谎痢。一陣腳步聲響...
開封第一講書人閱讀 32,812評論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工磕昼，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人节猿。一個月前我還...
沈念sama閱讀 47,693評論 2贊 368
代替公主和親
正文我出身青樓票从，卻偏偏與公主長得像，于是被迫代替她去往敵國和親滨嘱。傳聞我的和親對象是個殘疾皇子峰鄙，可洞房花燭夜當晚...
茶點故事閱讀 44,577評論 2贊 353

機器學習各語言領域工具庫中文版匯總

C

通用機器學習

計算機視覺

C ++

計算機視覺

通用機器學習

自然語言處理

機器翻譯

語音識別

序列分析

Java

自然語言處理

通用機器學習

語音識別

數據分析，可視化

深度學習

Python

計算機視覺

自然語言處理

通用機器學習

數據分析，可視化

常見的Lisp

通用機器學習

Clojure

自然語言處理

通用機器學習

數據分析价捧，可視化

MATLAB

計算機視覺

自然語言處理

通用機器學習

數據分析雕擂，可視化

C#

計算機視覺

自然語言處理

通用機器學習

數據分析受裹，可視化

Ruby

自然語言處理

通用機器學習

數據分析，可視化

雜項

R

通用機器學習

數據分析抵窒，可視化

Scala

自然語言處理

數據分析瘾杭，可視化

通用機器學習

推薦閱讀更多精彩內容