機器學習各語言領域工具庫中文版匯總

** 轉載自URl-team

本文鏈接地址: 機器學習各語言領域工具庫中文版匯總

主要資源來自TensorFlow中文社區(qū)霞篡,翻譯借助谷歌翻譯,僅用于資源分享甲献。
以下是根據不同語言類型和應用領域收集的各類工具庫邮屁,持續(xù)更新中琐鲁。

C

通用機器學習

  • 推薦人 -一個產品推薦的?語言庫,利用了協(xié)同過濾惭每。

計算機視覺

  • CCV – C / Cached /核心計算機視覺庫骨饿,是一個現(xiàn)代化的計算機視覺庫。
  • VLFeat – VLFeat是開源的計算機視覺算法庫台腥,有Matlab工具箱宏赘。

C ++

計算機視覺

  • OpenCV – 最常用的視覺庫。有C ++览爵,C柿赊,Python以及Java接口),支持Windows逆趣,Linux苹支,Android和Mac OS。
  • DLib – DLib有C ++和Python臉部識別和物體檢測接口俱济。
  • EBLearn – Eblearn是一個面向對象的C ++庫嘶是,實現(xiàn)了各種機器學習模型。
  • VIGRA – VIGRA是一個跨平臺的機器視覺和機器學習庫蛛碌,可以處理任意維度的數據聂喇,有Python接口。

通用機器學習

  • MLPack – 可拓展的C ++機器學習庫。
  • DLib – 設計為方便嵌入到其他系統(tǒng)中希太。
  • encog-CPP
  • 鯊魚
  • Vowpal Wabbit(VW) – 快速的核心外學習系統(tǒng)克饶。
  • sofia-ml – 快速增量算法套件。
  • 幕府將軍 – 學徒機器學習工具箱
  • Caffe – 深度學習框架誊辉,結構清晰矾湃,可讀性好,速度快堕澄。
  • CXXNET – 精簡的框架邀跃,核心代碼不到1000行。
  • XGBoost – 為并行計算優(yōu)化過的梯度提升庫蛙紫。
  • CUDA – 這是一個快速的C ++ / CUDA實現(xiàn)卷積[DEEP LEARNING]
  • Stan – 一種使用哈密爾頓蒙特卡洛取樣執(zhí)行完全貝葉斯統(tǒng)計推理的概率編程語言
  • BanditLib – 一個簡單的多武裝強盜圖書館拍屑。
  • Timbl – 實現(xiàn)了多個基于內存的算法,其中IB1-IG(KNN分類算法)和IGTree(決策樹)在NLP中廣泛應用坑傅。

自然語言處理

  • MIT信息提取工具包 – C僵驰,C ++和Python工具,用來命名實體識別和關系抽取裁蚁。
  • CRF ++ – 條件隨機場的開源實現(xiàn)矢渊,可以用作分詞,詞性標注等枉证。
  • CRFsuite – CRFsuite是條件隨機場的實現(xiàn)矮男,可以用作詞性標注等。
  • BLLIP解析器 – 即Charniak-Johnson解析器室谚。
  • colibri-core – 一組C ++庫毡鉴,命令行工具以及Python綁定,高效實現(xiàn)了n-gram和skipgrams秒赤。
  • ucto – 多語言tokenizer猪瞬,支持面向Unicode的正則表達式,支持FoLiA格式入篮。
  • libfoliaFoLiA格式的 C ++庫
  • MeTAMeTA:ModErn文本分析從巨量文本中挖掘數據陈瘦。

機器翻譯

語音識別

  • Kaldi – Kaldi是一個C ++工具,以Apache許可證V2.0發(fā)布.Kaldi適用于語音識別的研究潮售。

序列分析

  • ToPS – 這是一個面向對象的框架痊项,有助于在用戶定義的字母表上整合序列的概率模型。

Java

自然語言處理

  • Cortical.io – Retina:此API執(zhí)行復雜的NLP操作(消歧義酥诽,分類鞍泉,流文本過濾等),快速肮帐,直觀如同大腦一般咖驮。
  • CoreNLP – Stanford CoreNLP提供了一組自然語言分析工具,可采取原始英語文本輸入并給出單詞的基本形式。
  • 斯坦福解析器 – 解析器是一個程序托修,能分析出句子的語法結構忘巧。
  • Stanford POS Tagger – 詞性標注器
  • 斯坦福大學名稱實體識別器 – 斯坦福大學NER是一個Java實現(xiàn)的命名實體識別器。
  • Stanford Word Segmenter – 原始文本的令牌化是許多NLP任務的標準預處理步驟诀黍。
  • Tregex袋坑,Tsurgeon和Semgrex – Tregex是匹配樹模式的工具仗处,基于樹的關系和正則表達式的節(jié)點匹配(“樹正則表達式”的縮寫)眯勾。
  • 斯坦福Phrasal:基于短語的翻譯系統(tǒng)
  • 斯坦福英語Tokenizer – Stanford Phrasal是最先進的統(tǒng)計的基于短語的機器翻譯系統(tǒng),用Java編寫婆誓。
  • 斯坦福令牌正則表達式標記器將文本劃分成一系列令牌吃环,大致對應于“單詞”
  • 斯坦福時代標簽 – SUTime是識別和規(guī)范時間表達式的庫。
  • 斯坦福SPIED – 從種子集開始洋幻,迭代使用模式郁轻,從未標注文本中習得實體。
  • 斯坦福主題建模工具箱 – 主題建模工具文留,社會學家用它分析的數據集好唯。
  • Twitter Text Java – Java實現(xiàn)的Twitter文本處理庫。
  • MALLET – 基于Java的軟件包燥翅,包括統(tǒng)計自然語言處理骑篙,文檔分類,聚類森书,主題建模靶端,信息提取,以及其它機器學習應用凛膏。
  • OpenNLP – 一個基于機器學習的自然語言處理的工具包杨名。
  • LingPipe – 計算語言學工具包。
  • ClearTK – ClearTK提供了開發(fā)統(tǒng)計自然語言處理組件的框架猖毫,其建立在Apache UIMA之上台谍。
  • Apache cTAKES – Apache臨床文本分析及知識提取系統(tǒng)(cTAKES)是從電子病歷,臨床文本中進行信息抽取的一個開源系統(tǒng)吁断。

通用機器學習

  • 氣溶膠 – Airbnb從頭開始設計的機器學習庫趁蕊,易用性好。
  • Datumbox – 機器學習和統(tǒng)計應用程序的快速開發(fā)框架胯府。
  • ELKI – 數據挖掘工具介衔。(非監(jiān)督學習:聚類,離群點檢測等骂因。)
  • Encog中包含用于創(chuàng)建各種網絡炎咖,以及規(guī)范和處理數據的神經網絡Encog訓練采用多線程彈性的傳播方式。Encog還可以利用GPU的進一步加快處理時間。有基于GUI的工作臺乘盼。
  • H2O – 機器學習引擎升熊,支持Hadoop,Spark等分布式系統(tǒng)和個人電腦绸栅,可以通過R级野,Python,Scala粹胯,REST / JSON調用API蓖柔。
  • htm.java – 通用機器學習庫,使用Numenta的皮質學習算法
  • Java-deeplearning – 分布式深度學習平臺Java风纠,Clojure况鸣,Scala
  • JAVA-ML – Java通用機器學習庫,所有算法統(tǒng)一接口竹观。
  • JSAT – 具有很多分類镐捧,回歸,聚類等機器學習算法臭增。
  • Mahout – 分布式機器學習工具懂酱。
  • Meka – 一個開源實現(xiàn)的多標簽分類和評估方法。
  • Apache Spark中的 MLlib – Spark分布式機器學習庫
  • Neuroph – 輕量級Java神經網絡框架
  • ORYX – Lambda架構框架誊抛,使用Apache Spark和Apache Kafka實現(xiàn)實時大規(guī)模機器學習列牺。
  • RankLib排序算法學習庫。
  • 斯坦福分類器 – 分類器是一種機器學習工具芍锚,它將獲取數據項并將它們放入k類之一昔园。
  • SmileMiner – 統(tǒng)計機器智能和學習引擎
  • SystemML – 靈活的,可擴展的機器學習語言并炮。
  • WalnutiQ – 面向對象的人腦模型
  • Weka – WEKA是機器學習算法用于數據挖掘任務的算法集合默刚。

語音識別

  • CMU Sphinx – 開源工具包,用于語音識別逃魄,完全基于Java的語音識別庫荤西。

數據分析,可視化

深度學習

  • Deeplearning4j – 可擴展的產業(yè)化的深度學習妇萄,利用并行的GPU蜕企。

Python

計算機視覺

  • Scikit-Image – Python中的圖像處理算法的集合。
  • SimpleCV – 一個開源的計算機視覺框架冠句,允許訪問幾個高性能計算機視覺庫轻掩,如OpenCV∨车祝可以運行在Mac唇牧,Windows和Ubuntu Linux操作系統(tǒng)上。
  • Vigranumpy – 計算機視覺庫VIGRA C ++的Python綁定聚唐。

自然語言處理

  • NLTK – 構建與人類語言數據相關工作的Python程序的領先平臺丐重。
  • 模式 – 基于Python的Web挖掘模塊。它有自然語言處理拱层,機器學習等工具弥臼。
  • Quepy – 將自然語言問題轉換成數據庫查詢語言。
  • TextBlob – 為普通的自然語言處理(NLP)任務提供一致的API根灯。構建于NLTK和Pattern上,并且很好地與兩者交互掺栅。
  • YAlign – 句子對齊工具烙肺,從對照語料中抽取并行句子。
  • jieba – 中文分詞工具
  • SnowNLP – 中文文本處理庫氧卧。
  • loso – 中文分詞工具
  • 天才 – 基于條件隨機場的中文分詞工具
  • KoNLPy韓語自然語言處理
  • 堅果 – 自然語言理解工具
  • Rosetta – 文字處理工具和包裝紙(例如Vowpal Wabbit)
  • BLLIP解析器 – BLLIP自然語言解析器的Python綁定(即Charniak-Johnson解析器)
  • PyNLPl – Python的自然語言處理庫桃笙。還包含用于解析常見NLP格式的工具,如FoLiA沙绝,以及ARPA語言模型搏明,Moses短語,GIZA ++對齊等闪檬。
  • python-ucto – ucto(面向unicode的基于規(guī)則的tokenizer)的Python綁定
  • python-frog – Frog的Python綁定星著。荷蘭語的詞性標注,lemmatisation粗悯,依存分析虚循,NER。
  • python-zparZPar的Python綁定(英文的基于統(tǒng)計的詞性標注样傍,constiuency解析器和依賴解析器)
  • colibri-core – 高效提取n-gram和skipgrams的C ++庫的Python綁定
  • spaCy – 工業(yè)級NLP與Python和Cython横缔。
  • PyStanfordDependencies – 將Penn Treebank樹轉換到Stanford依存樹的Python接口。

通用機器學習

  • 機器學習 – 構建和Web界面衫哥, 程序化界面兼容的支持向量機API茎刚。相應的數據集存儲到一個SQL數據庫,然后生成用于預測的模型撤逢,存儲到一個的NoSQL的數據庫膛锭。
  • XGBoost – eXtreme Gradient Boosting(Tree)庫的Python綁定
  • Featureforge一組工具捌斧,用于創(chuàng)建和測試機器學習的特征,具有與scikit學習兼容的API
  • scikit-learning – 基于SciPy的機器學習的Python模塊泉沾。
  • 度量學習 – 度量學習的Python模塊
  • SimpleAI – 實現(xiàn)了“人工智能現(xiàn)代方法”一書中描述的許多人工智能算法捞蚂。它著重于提供一個易于使用的,文檔良好的和經過測試的庫跷究。
  • astroML – 天文學機器學習和數據挖掘庫姓迅。
  • graphlab-create – 基于磁盤支持的DataFrame的庫,實現(xiàn)了各種機器學習模型(回歸俊马,聚類丁存,推薦系統(tǒng),圖形分析等)柴我。
  • BigML – 與外部服務器交流的庫解寝。
  • 模式 – Web數據挖掘模塊。
  • NuPIC – Numenta智能計算平臺艘儒。
  • Pylearn2 – 基于Theano的機器學習庫聋伦。
  • keras – 基于Theano的神經網絡庫
  • hebel – GPU加速的Python深度學習庫。
  • Chainer – 靈活的神經網絡架構
  • gensim – 易用的主題建模工具
  • topik – 主題建模工具包
  • PyBrain – 另一個Python機器學習庫界睁。
  • Crab – 靈活的觉增,快速的推薦引擎
  • python-recsys – 實現(xiàn)一個推薦系統(tǒng)的Python工具
  • 限制玻爾茲曼機器 – 受限玻爾茲曼機
  • CoverTree – 覆蓋樹的Python實現(xiàn),scipy.spatial.kdtree的近似替換
  • nilearn – NeuroImaging機器學習庫
  • 幕府將軍學習機器學習工具箱
  • Pyevolve – 遺傳算法框架
  • Caffe – 深度學習框架翻斟,結構清晰逾礁,可讀性好,速度快访惜。
  • breze – 基于Theano的深度神經網絡
  • pyhsmm -貝葉斯隱馬爾可夫模型近似無監(jiān)督的推理和顯式時長隱半馬爾可夫模型嘹履,專注于貝葉斯非參數擴展時,HDP-HMM和HDP-HSMM债热,大多是弱極限近似砾嫉。
  • mrjob – 使得Python程序可以跑在Hadoop上。
  • SKLL – 簡化的scikit-learn接口阳柔,易于做實驗
  • neurolabhttps://github.com/zueve/neurolab
  • 薄荷 – 貝葉斯算法的優(yōu)化焰枢。方法見于論文:機器學習算法的實踐貝葉斯優(yōu)化。Jasper Snoek舌剂,Hugo Larochelle和Ryan P. Adams济锄。2012年神經信息處理系統(tǒng)進展。
  • Pebl – 貝葉斯學習的Python環(huán)境
  • Theano – 優(yōu)化GPU元編程代碼霍转,生成面向矩陣的優(yōu)化的數學編譯器
  • TensorFlow – 用數據流圖進行數值計算的開源軟件庫
  • yahmm – 隱馬爾可夫模型荐绝,用Cython實現(xiàn)
  • python-timbl – 包裝了完整的TiMBL C ++編程接口。Timbl是一個精心制作的?最近鄰機器學習工具包避消。
  • deap – 進化算法框架
  • pydeep – Python深度學習
  • mlxtend – 對數據科學和機器學習任務非常有用的工具庫低滩。
  • 霓虹燈高性能深度學習框架
  • Optunity – 致力于自動化超參數優(yōu)化過程召夹,使用一個簡單的,輕量級的API,以方便直接替換網格搜索。
  • 惹惱 -近似最近鄰居執(zhí)行
  • skflow – TensorFlow的簡化界面乌询,類似Scikit Learn绳泉。
  • TPOT – 自動創(chuàng)建并利用遺傳編程優(yōu)化機器學習的管道统倒。將它看作您的數據科學助理,自動化機器學習中大部分的枯燥工作。

數據分析,可視化

  • SciPy – 一個基于Python的數據褐筛,科學和工程開源軟件生態(tài)系統(tǒng)。
  • NumPy – 用Python進行科學計算的基礎軟件包叙身。
  • Numba – Python JIT(及時)編譯為LLVM渔扎,由Cython和NumPy的開發(fā)人員針對科學Python。
  • NetworkX – 復雜網絡的高生產率軟件信轿。
  • 熊貓 – 提供高性能晃痴,易于使用的數據結構和數據分析工具的庫。
  • 開放采礦 – Python中的商業(yè)智能(BI)(熊貓網絡界面)
  • PyMC – 馬爾可夫鏈蒙特卡洛取樣工具包虏两。
  • zipline – 一個Pythonic算法交易庫愧旦。
  • PyDy – Python Dynamics的簡稱,用于協(xié)助基于NumPy定罢,SciPy,IPython和matplotlib的動態(tài)運動建模中的工作流程旁瘫。
  • SymPy – 符號數學的Python庫祖凫。
  • statsmodels – Python中的統(tǒng)計建模和計量經濟學。
  • astropy – 一個用于天文學的社區(qū)Python庫酬凳。
  • matplotlib – 一個Python 2D繪圖庫惠况。
  • 散景 – Python的互動網絡繪圖。
  • 劇情 – Python和matplotlib的協(xié)作網絡繪圖宁仔。
  • vincent – 一個Python到Vega翻譯器稠屠。
  • d3py -一個plottling庫的Python,基于D3.js翎苫。
  • ggplot – 與ggplot2相同的API
  • ggfortify – ggplot2流行的R包的統(tǒng)一接口权埠。
  • Kartograph.py – 在Python中呈現(xiàn)美麗的SVG地圖。
  • pygal – 一個Python SVG圖表創(chuàng)建者煎谍。
  • PyQtGraph – 一個基于PyQt4 / PySide和NumPy的純python圖形和GUI庫攘蔽。
  • pycascading
  • Petrel – 用于編寫,提交呐粘,調試和監(jiān)視純Python中的風暴拓撲的工具满俗。
  • Blaze – NumPy和Pandas與Big Data接口转捕。
  • emcee – 仿射不變MCMC的Python集合采樣工具包。
  • windML – 風能分析與預測的Python框架
  • vispy – 基于GPU的高性能交互式OpenGL 2D / 3D數據可視化庫
  • cerebro2 NuPIC的基于Web的可視化和調試平臺唆垃。
  • NuPIC Studio一體化NuPIC分層時態(tài)內存可視化和調試超級工具五芝!
  • PySpark上的SparklingPandas Pandas(POPS)
  • Seaborn – 基于matplotlib的python可視化庫
  • bqplot – 用于在Jupyter(IPython)中繪制的API

常見的Lisp

通用機器學習

  • mgl – 神經網絡(boltzmann機器,前饋和復發(fā)網絡)辕万,高斯過程
  • mgl-gpr – 進化算法
  • cl-libsvm – libsvm支持向量機庫的包裝器

Clojure

自然語言處理

通用機器學習

  • Touchstone – Clojure A / B測試庫
  • Clojush – 他推動編程語言和在Clojure中實現(xiàn)的PushGP遺傳編程系統(tǒng)
  • Infer – 推理和機器學習在clojure
  • Clj-ML – 一個用于Clojure的機器學習庫枢步,建于Weka和朋友之上
  • Encog – 用于Encog(v3)的Clojure包裝器(專門從事神經網絡的機器學習框架)
  • Fungp – Clojure的遺傳編程庫
  • Statistiker – Clojure中的基本機器學習算法。
  • clortex – 通用機器學習庫使用Numenta的皮質學習算法
  • comportex – 功能可組合的機器學習庫蓄坏,使用Numenta的皮質學習算法

數據分析价捧,可視化

  • Incanter – Incanter是一個基于Clojure的R類統(tǒng)計計算和圖形平臺。
  • PigPen – Map-Reduce for Clojure涡戳。
  • Envision – Clojure數據可視化庫结蟋,基于Statistiker和D3

MATLAB

計算機視覺

  • 輪廓 – 實現(xiàn)輪廓變換的 MATLAB源代碼及其效用函數。
  • Shearlets – 用于小波變換的MATLAB代碼
  • 曲線 – 曲線變換是小波變換的更高維度泛化渔彰,旨在表示不同尺度和不同角度的圖像嵌屎。
  • Bandlets – 用于帶狀變換的MATLAB代碼
  • mexopencv – OpenCV庫的收集和MATLAB mex功能的開發(fā)工具包

自然語言處理

  • NLP – 一個用于Matlab的NLP庫

通用機器學習

  • t分布隨機相鄰嵌入 – t-SNE是一個獲獎的技術,可以降維恍涂,尤其適合高維數據可視化
  • 蜘蛛 – 蜘蛛有望成為matlab里機器學習中的完整的面向對象環(huán)境宝惰。
  • LibSVM – 著名的支持向量機庫。
  • LibLinear – 大型線性分類圖書館
  • Caffe – 深度學習框架再沧,結構清晰尼夺,可讀性好,速度快炒瘸。
  • 模式識別工具箱 – Matlab機器學習中一個完整的面向對象的環(huán)境淤堵。
  • Optunity – 一個致力于自動化超參數優(yōu)化的庫,具有簡單輕便的API顷扩,便于網格搜索的替換拐邪。Optunity是用Python編寫的,但與MATLAB無縫連接隘截。致力于自動化超參數優(yōu)化的一個簡單的扎阶,輕量級的API庫,方便直接替換網格搜索婶芭。Optunity是用Python編寫的东臀,但與MATLAB的無縫連接。

數據分析雕擂,可視化

  • matlab_gbl – MatlabBGL是一個用于處理圖形的Matlab包啡邑。
  • gamic – 圖形算法的高效純Matlab實現(xiàn),以補充MatlabBGL的mex函數井赌。

C#

計算機視覺

  • OpenCVDotNet – 用于與.NET應用程序一起使用的OpenCV項目的包裝器谤逼。
  • Emgu CV – OpenCV的跨平臺包裝器贵扰,可以在Mono中編譯為在Windows,Linus流部,Mac OS X戚绕,iOS和Android上運行。
  • AForge.NET – 開發(fā)人員和研究人員在計算機視覺和人工智能領域的開源CV剑框架舞丛。發(fā)展現(xiàn)在已經轉移到GitHub。
  • Accord.NET – 與AForge.NET一起果漾,該庫可以為Windows球切,Windows RT和Windows Phone提供圖像處理和計算機視覺算法。一些組件也可用于Java和Android绒障。

自然語言處理

  • Stanford.NLP for .NET – 一個完整的斯坦福NLP包到.NET吨凑,并且可以作為NuGet包預編譯。

通用機器學習

  • 協(xié)調框架 – 一個完整的框架户辱,可以用于機器學習鸵钝,計算機視覺,計算機試聽庐镐,信號處理恩商,統(tǒng)計應用等。
  • Accord.MachineLearning – 支持向量機必逆,決策樹怠堪,樸素貝葉斯模型,K均值名眉,高斯混合模型和一般算法研叫,如機器學習應用的Ransac,交叉驗證和網格搜索璧针。此包是Accord.NET Framework的一部分。
  • DiffSharp – 一種用于機器學習和優(yōu)化應用程序的自動差分(AD)庫渊啰,提供精確和高效的衍生物(梯度探橱,Hessians,Jacobians绘证,方向導數和無矩陣Hessian和Jacobian矢量產品)隧膏。操作可以嵌套到任何級別,這意味著您可以計算精確的高階導數并區(qū)分在內部使用差異化的功能嚷那,例如超參數優(yōu)化應用程序胞枕。
  • Vulpes – 用F#編寫的深度信念和深度學習實現(xiàn),并利用與Alea.cuBase的CUDA GPU執(zhí)行魏宽。
  • Encog – 一個先進的神經網絡和機器學習框架腐泻。Encog包含創(chuàng)建各種網絡的類决乎,以及支持類來規(guī)范和處理這些神經網絡的數據。使用多線程彈性傳播的火車派桩。Encog還可以利用GPU來進一步加快處理時間构诚。還提供了基于GUI的工作臺來幫助模擬和訓練神經網絡。
  • 神經網絡設計師 – DBMS管理系統(tǒng)和神經網絡設計師铆惑。設計師應用程序是使用WPF開發(fā)的范嘱,是一個用戶界面,允許您設計神經網絡员魏,查詢網絡丑蛤,創(chuàng)建和配置可以從您的反饋中提出問題和學習的聊天機器人。聊天機器人甚至可以刮擦互聯(lián)網以獲取信息以返回其輸出以及用于學習撕阎。

數據分析受裹,可視化

  • numl – numl是一個機器學習庫,旨在簡化使用標準建模技術進行預測和聚類闻书。
  • Math.NET數學 – Math.NET項目的數學基礎名斟,旨在為科學,工程和日常使用中的數值計算提供方法和算法魄眉。支持Windows砰盐,Linux和Mac上的.Net 4.0,.Net 3.5和Mono; Silverlight 5坑律,WindowsPhone / SL 8岩梳,WindowsPhone 8.1和Windows 8與PCL便攜式配置文件47和344; Android / iOS與Xamarin。
  • Sho -Sho是用于數據分析和科學計算的交互式環(huán)境晃择,可讓您將腳本(在IronPython中)與編譯代碼(.NET)無縫連接冀值,以實現(xiàn)快速靈活的原型設計。環(huán)境包括用于線性代數的強大而高效的庫宫屠,以及可以從任何.NET語言使用的數據可視化列疗,以及用于快速開發(fā)的功能豐富的交互式shell。

Ruby

自然語言處理

  • 對待 – 文本REtrieval和注釋工具包浪蹂,絕對是我迄今為止遇到的最全面的工具包
  • Ruby語言學 – 語言學是用于為任何語言的Ruby對象構建語言實用程序的框架抵栈。它包括通用語言無關的前端,用于將語言代碼映射到語言名稱的模塊坤次,以及包含各種英語工具的模塊古劲。
  • Stemmer – 將libstemmer_c發(fā)布給Ruby
  • Ruby Wordnet – 該庫是WordNet的一個Ruby接口
  • Raspel – raspell是一個綁定ruby的界面
  • UEA Stemmer – UEALite Stemmer的Ruby端口 – 搜索和索引的保守干預
  • Twitter-text-rb – 在Twitter中自動鏈接和提取用戶名,列表和主題標簽的圖書館

通用機器學習

數據分析,可視化

  • rsruby – Ruby – R橋
  • data-visualization-ruby – 使用Ruby進行數據可視化的Ruby Manor演示文稿的源代碼和支持內容
  • ruby-plot – 用于ruby的gnuplot包裝闷堡,特別是用于將roc曲線繪制到svg文件中
  • plot-rb – 建立在Vega和D3之上的Ruby中的繪圖庫隘膘。
  • 襤褸 – 一個美麗的圖形工具包Ruby
  • SciRuby
  • Glean – 人類的數據管理工具
  • Bioruby
  • 阿雷爾

雜項

  • 大數據為黑猩猩
  • Listof – 以社區(qū)為基礎的數據收集,包裝在寶石缚窿。在txt棘幸,json或hash中獲取幾乎任何東西(停止詞語,國家倦零,非單詞)的列表误续。演示/搜索列表

R

通用機器學習

  • ahaz – ahaz:半參數加性危險回歸的正則化
  • 弧形 – 弧形:采礦協(xié)會規(guī)則和頻繁項集
  • bigrf – bigrf:大隨機森林:大數據集的分類和回歸森林
  • bigRR – bigRR:廣義嶺回歸(對于p >> n個情況具有特殊優(yōu)勢)
  • bmrm – bmrm:用于正則化風險最小化包的捆綁方法
  • Boruta – Boruta:用于所有相關特征選擇的包裝算法
  • bst – bst:漸變提升
  • C50 – C50:C5.0決策樹和基于規(guī)則的模型
  • 插入符號 – 分類和回歸訓練:統(tǒng)一接口到?150 ML算法在R.
  • 護理裝配 – 護理裝配:適合多個插入符號模型的框架以及創(chuàng)建這種模型的集合。
  • 機器學習的巧妙算法
  • CORElearn – CORElearn:分類扫茅,回歸蹋嵌,特征評估和序數評估
  • CoxBoost – CoxBoost:Cox模型通過基于可能性的單一生存終點提升或競爭風險
  • 立體主義者 – 立體主義者:基于規(guī)則和實例的回歸建模
  • 統(tǒng)計部門的其他功能(e1071),TU Wien
  • 地球:多變量自適應回歸樣條模型
  • elasticnet – elasticnet:彈性網稀疏估計和稀疏PCA
  • ElemStatLearn – ElemStatLearn:本書的數據集葫隙,功能和示例:Trevor Hastie栽烂,Robert Tibshirani和Jerome Friedman預測的“統(tǒng)計學習,數據挖掘恋脚,推理和預測的要素”腺办,由Trevor Hastie,Robert Tibshirani和Jerome Friedman
  • evtree – evtree:全球最佳樹的進化學習
  • fpc – fpc:靈活的聚類過程
  • frbs – frbs:用于分類和回歸任務的基于模糊規(guī)則的系統(tǒng)
  • GAMBoost – GAMBoost:通過基于可能性的增強的廣義線性和加性模型
  • gamboostLSS – gamboostLSS:GAMLSS的增強方法
  • gbm – gbm:廣義增強回歸模型
  • glmnet – glmnet:拉索和彈性網絡正則化廣義線性模型
  • glmpath – glmpath:L1廣義線性模型和Cox比例危險模型的正則化路徑
  • GMMBoost – GMMBoost:廣義混合模型的基于可能的推動
  • grplasso – grplasso:適合用戶指定的模型與組拉索罰款
  • grpreg – grpreg:具有分組協(xié)變量的回歸模型的正則化路徑
  • h2o – 快速糟描,平行和分布式機器學習算法的框架 – 深度學習怀喉,隨機森林,GBM船响,KMeans躬拢,PCA,GLM
  • hda – hda:異方差判別分析
  • 統(tǒng)計學習簡介
  • ipred – ipred:改進的預測器
  • kernlab – kernlab:基于內核的機器學習實驗室
  • klaR – klaR:分類和可視化
  • Lars – lars:最小角度回歸见间,Lasso和Forward Stage
  • lasso2 – lasso2:L1約束估計aka’lasso’
  • LiblineaR – LiblineaR:基于線性C / C ++庫的線性預測模型
  • LogicReg – LogicReg:邏輯回歸
  • 機器學習黑客
  • maptree – maptree:映射聊闯,修剪和圖形樹模型
  • mboost – mboost:基于模型的增強
  • 混合混合:混合回歸模型,使用貪心逐步的方法
  • mlr – mlr:機器學習在R
  • mvpart – mvpart:多變量分區(qū)
  • ncvreg – ncvreg:SCAD和MCP懲罰回歸模型的正則化路徑
  • nnet -nnet:前饋神經網絡和多項對數線性模型
  • slope.tree – tilt.tree:分類數據的斜樹
  • pamr – pamr:Pam:微陣列預測分析
  • 黨派:遞歸提問實驗室
  • partykit – partykit:一個遞歸提交工具包
  • 懲罰 – 處罰:在GLMs和Cox模型中的L1(套索和融合套索)和L2(脊)懲罰估計
  • 懲罰LDA – 處罰LDA:使用Fisher線性判別的懲罰分類
  • 懲罰的 SVM – 處罰的SVM:使用懲罰函數的特征選擇SVM
  • quantregForest – quantregForest:分位數回歸森林
  • randomForest – randomForest:Breiman和Cutler的隨機森林進行分類和歸一化
  • randomForestSRC – randomForestSRC:為生存米诉,回歸和分類隨機森林(RF-SRC)
  • rattle – rattle:R中數據挖掘的圖形用戶界面
  • rda – rda:Shrunken Centroids正則判別分析
  • rdetools – rdetools:特征空間中的相關維度估計(RDE)
  • REEMtree – REEMtree:回歸樹與縱向(面板)數據隨機效應
  • relaxo – relaxo:輕松的套索
  • rgenoud – rgenoud:R版本的使用衍生物的遺傳優(yōu)化
  • rgp – rgp:R遺傳編程框架
  • Rmalschains – Rmalschains:使用R中的本地搜索鏈(MA-LS鏈)的Memetic算法進行連續(xù)優(yōu)化
  • 簡單的:在分類和回歸中更簡單地使用數據挖掘方法(如NN和SVM)
  • ROCR – ROCR:可視化評分分類器的性能
  • RoughSets – RoughSets:數據分析基于粗糙集與模糊粗糙集理論
  • rpart – rpart:遞歸分區(qū)和回歸樹
  • RPMM – RPMM:遞歸分區(qū)混合模型
  • RSNNS – RSNNS:使用斯圖加特神經網絡模擬器(SNNS)的R中的神經網絡
  • RWeka – RWeka:R / Weka界面
  • RXshrink – RXshrink:通過通用脊或最小角度回歸的最大似然收縮
  • sda -sda:收縮判別分析和CAT分數變量選擇
  • SDDA – SDDA:逐步對角判別分析
  • 超級聽眾組合 – 多算法集成學習包菱蔬。
  • svmpath – svmpath:svmpath:SVM路徑算法
  • tgp – tgp:貝葉斯高斯過程模型
  • – 樹:分類和回歸樹
  • varSelRF – varSelRF:使用隨機林的變量選擇
  • XGBoost.R – R綁定用于eXtreme漸變提升(樹)庫
  • Optunity – 一個致力于自動化超參數優(yōu)化的庫,具有簡單輕便的API史侣,便于網格搜索的替換汗销。Optunity是用Python編寫的,但是可以無縫地連接到R.

數據分析抵窒,可視化

  • ggplot2 – 基于圖形語法的數據可視化包。

Scala

自然語言處理

  • ScalaNLP – ScalaNLP是一套機器學習和數字計算庫叠骑。
  • 微風 – 微風是Scala的數字處理庫李皇。
  • 粉筆 – 粉筆是自然語言處理圖書館。
  • FACTORIE – FACTORIE是可部署概率建模的工具包,在Scala中作為軟件庫實現(xiàn)掉房。它為用戶提供了一種簡潔的語言茧跋,用于創(chuàng)建關系因子圖,估計參數和執(zhí)行推理卓囚。

數據分析瘾杭,可視化

  • Apache Spark中的 MLlib – Spark中的分布式機器學習庫
  • Scalding – 用于級聯(lián)的Scala API
  • 總結鳥 – 流行的MapReduce與Scalding和風暴
  • Algebird – Scala的抽象代數
  • xerial – Scala的數據管理工具
  • – 減少你的數據。用于algebird供電聚合的unix過濾器哪亿。
  • PredictionIO – PredictionIO粥烁,用于軟件開發(fā)人員和數據工程師的機器學習服務器。
  • BIDMat – CPU和GPU加速矩陣庫蝇棉,旨在支持大規(guī)模的探索性數據分析讨阻。
  • 沃爾夫聲明機器學習

通用機器學習

  • 推測 – 可擴展機器學習在縮放
  • 刷火 – Scala中的分布式決策樹合奏學習
  • ganitha燙金機器學習
  • adam – 使用Apache Avro,Apache Spark和Parquet構建的基因組處理引擎和專用文件格式篡殷。Apache 2許可钝吮。
  • bioscala – Scala編程語言的生物信息學
  • BIDMach – CPU和GPU加速機器學習庫。
  • 費加羅 – 構建概率模型的Scala庫板辽。
  • H2O閃蒸水 – H2O和Spark互操作性奇瘦。
    <div style="margin-top: 15px; font-style: italic">

** 轉載自URl-team

本文鏈接地址: 機器學習各語言領域工具庫中文版匯總

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市劲弦,隨后出現(xiàn)的幾起案子耳标,更是在濱河造成了極大的恐慌,老刑警劉巖瓶您,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件麻捻,死亡現(xiàn)場離奇詭異,居然都是意外死亡呀袱,警方通過查閱死者的電腦和手機贸毕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來夜赵,“玉大人明棍,你說我怎么就攤上這事】苌” “怎么了摊腋?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長嘁傀。 經常有香客問我兴蒸,道長,這世上最難降的妖魔是什么细办? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任橙凳,我火速辦了婚禮燃辖,結果婚禮上载迄,老公的妹妹穿的比我還像新娘舱痘。我一直安慰自己派殷,他們只是感情好,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布坚踩。 她就那樣靜靜地躺著荡灾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪瞬铸。 梳的紋絲不亂的頭發(fā)上批幌,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音赴捞,去河邊找鬼逼裆。 笑死,一個胖子當著我的面吹牛赦政,可吹牛的內容都是我干的胜宇。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼恢着,長吁一口氣:“原來是場噩夢啊……” “哼桐愉!你這毒婦竟也來了?” 一聲冷哼從身側響起掰派,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤从诲,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后靡羡,有當地人在樹林里發(fā)現(xiàn)了一具尸體系洛,經...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年略步,在試婚紗的時候發(fā)現(xiàn)自己被綠了描扯。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡趟薄,死狀恐怖绽诚,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情杭煎,我是刑警寧澤恩够,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站羡铲,受9級特大地震影響蜂桶,放射性物質發(fā)生泄漏。R本人自食惡果不足惜也切,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一屎飘、第九天 我趴在偏房一處隱蔽的房頂上張望妥曲。 院中可真熱鬧,春花似錦钦购、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至导犹,卻和暖如春唱凯,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背谎痢。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工磕昼, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人节猿。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓票从,卻偏偏與公主長得像,于是被迫代替她去往敵國和親滨嘱。 傳聞我的和親對象是個殘疾皇子峰鄙,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內容