AI開源框架（linux+mac）

本文將從開發(fā)者的角度出發(fā)谎倔，特別是針對開發(fā)者中為數(shù)眾多的Linux系統(tǒng)和Mac系統(tǒng)用戶，奉上一篇針對泛Linux生態(tài)的頂級人工智能開源工具盤點（當(dāng)然蘸拔，有些工具也并非只兼容Linux）巨缘。

1. Deeplearning4j：為Java用戶量身定制

Deeplearning4j（Deep Learning For Java）是Java和Scala環(huán)境下的一個開源分布式的深度學(xué)習(xí)項目欣鳖，由總部位于美國舊金山的商業(yè)智能和企業(yè)軟件公司Skymind牽頭開發(fā)，并得到了騰訊的投資不傅。正如它的命名旅掂，Deeplearning4j的運行需要Java虛擬機(jī)JVM的支持。

Deeplearning4j團(tuán)隊在官網(wǎng)表示访娶，他們希望通過一些深度學(xué)習(xí)算法的開發(fā)商虐，將商業(yè)帶入智能化數(shù)據(jù)的時代。也正是為了實現(xiàn)這一理想崖疤，惠及更多的用戶秘车，因此選擇了移植性更好的Java環(huán)境來實現(xiàn)這些算法。目前劫哼，Deeplearning4j的這些算法已經(jīng)在谷歌叮趴、Facebook和微軟等平臺得到了廣泛應(yīng)用。

值得一提的是权烧，為了便于開發(fā)者自由定制眯亦，Deeplearning4j已經(jīng)開放了盡可能多的算法調(diào)節(jié)接口，并對接口參數(shù)做出了詳盡解釋豪嚎。同時搔驼，Deeplearning4j團(tuán)隊還開發(fā)了針對矩陣運算的ND4J和ND4S庫（N-Dimensional Arrays for Java/Scala）谈火，同樣需要JVM的支持侈询。

Deeplearning4j遵循Apache 2.0開源協(xié)議，提供了基于AWS云服務(wù)的GPU運算支持糯耍，以及微軟服務(wù)器框架的支持扔字。

官網(wǎng)：Open-source, Distributed Deep Learning for the JVM

2. Caffe：廣受歡迎的深度學(xué)習(xí)框架

Caffe的全稱是 “Convolution Architecture For Feature Extraction”，意為“用于特征提取的卷積架構(gòu)”温技，主要開發(fā)者來自伯克利大學(xué)的視覺與學(xué)習(xí)中心（Berkeley Vision and Learning Center革为，BVLC），基于BSD 2-Clause開源許可協(xié)議發(fā)布舵鳞。

Caffe是業(yè)內(nèi)著名的深度學(xué)習(xí)框架震檩，根據(jù)官網(wǎng)介紹，其主要特點是：運算速度快（官方顯示在單片NVIDIA K40 GPU的運算能力下蜓堕，Caffe每天可以處理超過60M的圖片數(shù)據(jù)）抛虏，模塊定制方便（在CPU或GPU之間的轉(zhuǎn)換只需要簡單修改一下參數(shù)設(shè)定），擴(kuò)展能力強(qiáng)大（目前有超過一千名開發(fā)者基于Caffe開發(fā)了分支版本）套才，以及豐富的社區(qū)支持（Caffe已經(jīng)被授權(quán)給各種研究機(jī)構(gòu)迂猴、初創(chuàng)公司和工業(yè)集團(tuán)），因此特別適合于神經(jīng)網(wǎng)絡(luò)建模和圖像處理任務(wù)背伴。

官網(wǎng)：Caffe | Deep Learning Framework

3. H2O：企業(yè)級機(jī)器學(xué)習(xí)框架

H2O（即水的化學(xué)式）是一個開源沸毁、快速峰髓、可擴(kuò)展的分布式機(jī)器學(xué)習(xí)框架，同時提供了大量的算法實現(xiàn)息尺。它支持深度學(xué)習(xí)携兵、梯度推進(jìn)（Gradient Boosting）、隨機(jī)森林（Random Forest）搂誉、廣義線性模型（即邏輯回歸眉孩，彈性網(wǎng)絡(luò)）等各種機(jī)器學(xué)習(xí)算法。

H2O框架的核心代碼由Java編寫勒葱，數(shù)據(jù)和模型通過分布式的key/value存儲在各個集群節(jié)點的內(nèi)存中浪汪，算法使用Map/Reduce框架實現(xiàn)，并使用了Java中的Fork/Join機(jī)制來實現(xiàn)多線程凛虽。

H2O是一個更關(guān)注企業(yè)用戶的人工智能分析工具死遭，它聚焦于為掌握大量數(shù)據(jù)的企業(yè)用戶提供快速精準(zhǔn)的預(yù)測分析模型，從海量數(shù)據(jù)中提取有助于商業(yè)決策的信息凯旋。

根據(jù)H2O官方的數(shù)據(jù)呀潭，目前已經(jīng)有超過7萬名數(shù)據(jù)科學(xué)家和8萬家組織機(jī)構(gòu)成為了H2O平臺的忠實擁躉。

官網(wǎng)：H2O.ai

4. MLlib：基于Spark框架的機(jī)器學(xué)習(xí)算法實現(xiàn)庫

MLlib是Apache開源項目Spark針對一些常用的機(jī)器學(xué)習(xí)算法的實現(xiàn)庫至非，同時也包括了相關(guān)的測試程序和數(shù)據(jù)生成器钠署。

按照官網(wǎng)的描述，MLlib的主要特點是易用（天生兼容Spark框架的API接口和Python荒椭、Java谐鼎、Scala等多種語言）、高性能（依靠Spark的數(shù)據(jù)管理能力趣惠，運行迭代和邏輯回歸算法時比Hadoop框架快100倍）和易于部署（可以直接在現(xiàn)有的Hadoop數(shù)據(jù)集群上運行）狸棍。

MLlib目前支持分類、回歸味悄、推薦草戈、聚類、生存分析等多種機(jī)器學(xué)習(xí)算法侍瑟。

官網(wǎng)：MLlib | Apache Spark

5. Apache Mahout：Hadoop廣泛采用的機(jī)器學(xué)習(xí)開源框架

Apache Mahout同樣也是一個Apache開源項目唐片，與MLlib相對應(yīng)，Mahout是應(yīng)用在Hadoop平臺下的機(jī)器學(xué)習(xí)開源框架涨颜。

Mahout有如下三個主要特點：

1) 提供簡單费韭、可擴(kuò)展的編程環(huán)境和框架；

2) 同時為Scala + Apache Spark咐低、H2O以及Apache Flik平臺提供打包好的算法實現(xiàn)揽思；

3) 支持R語言的語法規(guī)則進(jìn)行矩陣計算。

官網(wǎng)：Scalable machine learning and data mining

6. OpenNN：專注神經(jīng)網(wǎng)絡(luò)的實現(xiàn)庫

OpenNN的全稱為“Open Neural Networks Library”见擦，即開源神經(jīng)網(wǎng)絡(luò)庫钉汗，其核心代碼由C++編寫羹令，從名字就可以看出，其主要面向深度學(xué)習(xí)領(lǐng)域损痰，助力于用戶構(gòu)建各種不同的神經(jīng)網(wǎng)絡(luò)模型福侈。

據(jù)官方描述，OpenNN可用于實現(xiàn)監(jiān)督學(xué)習(xí)場景中任何層次的非線性模型卢未，同時還支持各種具有通用近似屬性的神經(jīng)網(wǎng)絡(luò)設(shè)計肪凛。

除了模型的多層支持外，OpenNN最主要優(yōu)勢還在于強(qiáng)大的性能表現(xiàn)辽社。具體來說就是伟墙，OpenNN能夠通過C++語言實現(xiàn)的核心代碼高效地調(diào)節(jié)內(nèi)容使用，通過OpenMP庫很好地平衡多線程CPU調(diào)用滴铅，以及通過CUDA工具對GPU進(jìn)行加速戳葵。

官網(wǎng)：Open Neural Networks Library

7. Oryx 2：重新設(shè)計了Lambda架構(gòu)

Oryx 2是Oryx項目的2.0版，前身名為 Myrrix汉匙，后來被大數(shù)據(jù)公司 Cloudera 收購拱烁，才改名為 Oryx。

Oryx 2.0關(guān)注于大規(guī)模機(jī)器學(xué)習(xí)/預(yù)測分析基礎(chǔ)框架的實時表現(xiàn)噩翠，它基于Apache Spark和Apache Kafka框架開發(fā)戏自，并重新設(shè)計了Lambda架構(gòu)，使得層次之間的復(fù)用性更強(qiáng)伤锚。

2.0版相比之前實現(xiàn)了更多算法擅笔，包括ALS協(xié)同過濾、隨機(jī)森林见芹、以及K-means++等剂娄。

官網(wǎng)：Oryx - Overview

8. OpenCyc：全球最龐大、最完備的通用型知識庫與常識推理引擎

OpenCyc是Cycorp公司推出的一個基于Cyc的開源版本玄呛，而Cyc是目前全球最龐大、最完備的通用型知識庫與常識推理引擎和二。

OpenCyc包含數(shù)十萬個精心組織的Cyc詞條徘铝。Cycorp公司不但免費提供OpenCyc，同時也鼓勵開發(fā)者基于OpenCyc開發(fā)針對于特定應(yīng)用領(lǐng)域的分支版本惯吕。

目前惕它，OpenCyc已經(jīng)被成功應(yīng)用在大數(shù)據(jù)建模、語言數(shù)據(jù)整合废登、智能文本理解淹魄、特定領(lǐng)域的專家系統(tǒng)建模和人工智能游戲。

官網(wǎng)：OpenCyc - Cycorp

9. Apache SystemML：專注于大數(shù)據(jù)分析的開源機(jī)器學(xué)習(xí)平臺

SystemML是一個利用機(jī)器學(xué)習(xí)算法進(jìn)行大數(shù)據(jù)分析的開源AI平臺堡距，其主要特點是支持R語言和Python的語法甲锡，專注于大數(shù)據(jù)分析領(lǐng)域兆蕉，以及專門為高階數(shù)學(xué)計算設(shè)計。

按照官網(wǎng)的介紹缤沦，Apache SystemML基于Apache Spark框架運行虎韵，其最大的特點就是能夠自動、逐行地評估數(shù)據(jù)缸废，并根據(jù)評估結(jié)果確定用戶的代碼應(yīng)該直接運行在驅(qū)動器上還是運行在Apache Spark集群上包蓝。

除了Apache Spark之外，SystemML還支持Apache Hadoop企量、Jupyter和Apache Zeppelin等多個平臺测萎。目前，SystemML技術(shù)已經(jīng)成功應(yīng)用在交通届巩、航空和金融等多個領(lǐng)域绳泉。

官網(wǎng)：Apache SystemML - Declarative Large-Scale Machine Learning

10. NuPIC：基于層級實時存儲算法的機(jī)器智能平臺

NuPIC是一個與眾不同的開源機(jī)器智能平臺，它基于一種大腦皮層理論姆泻，即“層級實時存儲算法”（Heirarchical Temporary Memory零酪，HTM）。NuPIC聚焦于分析實時數(shù)據(jù)流拇勃，可以通過學(xué)習(xí)數(shù)據(jù)之間基于時間的狀態(tài)變化四苇，對未知數(shù)據(jù)進(jìn)行預(yù)測，并揭示其中的非常規(guī)特性方咆。

NuPIC關(guān)鍵的功能特性包括：

1) 持續(xù)的在線學(xué)習(xí)：NuPIC模型可以持續(xù)根據(jù)快速變化的數(shù)據(jù)流進(jìn)行實時調(diào)整月腋；

2) 時間和空間分析：像人腦一樣，NuPIC可以同時模擬時間和空間的變化瓣赂；

3) 實時的數(shù)據(jù)流分析：智能化的數(shù)據(jù)分析不會隨著數(shù)據(jù)量的增加而改變榆骚；

4) 預(yù)測和建模：通過通用性的大腦皮層算法，對數(shù)據(jù)進(jìn)行預(yù)測煌集、建模和學(xué)習(xí)妓肢；

5) 強(qiáng)大的異常檢測能力：實時檢測數(shù)據(jù)流的擾動，不依靠僵化的閾值設(shè)置和過時的算法苫纤；

6) 層級實時存儲算法：支持全新的HTM計算架構(gòu)碉钠。

官網(wǎng)：Numenta Platform for Intelligent Computing

由于2016僅僅是人工智能走向主流的元年，未來隨著技術(shù)的進(jìn)一步發(fā)展和革新卷拘，勢必會出現(xiàn)更多喊废、更豐富的開發(fā)工具。這里值得注意的一點是：工具的意義不僅在于解決了日常研發(fā)中遇到的各種問題栗弟，更在于降低了開發(fā)的難度污筷，引導(dǎo)了更多人投入到人工智能的研發(fā)之中。

最后編輯于：2017.12.09 18:19:05

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末乍赫，一起剝皮案震驚了整個濱河市瓣蛀，隨后出現(xiàn)的幾起案子陆蟆，更是在濱河造成了極大的恐慌，老刑警劉巖揪惦，帶你破解...
沈念sama閱讀 222,946評論 6贊 518
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件遍搞，死亡現(xiàn)場離奇詭異，居然都是意外死亡器腋，警方通過查閱死者的電腦和手機(jī)溪猿，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,336評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來纫塌，“玉大人诊县，你說我怎么就攤上這事〈胱螅” “怎么了依痊？”我有些...
開封第一講書人閱讀 169,716評論 0贊 364
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長怎披。經(jīng)常有香客問我胸嘁，道長，這世上最難降的妖魔是什么凉逛？我笑而不...
開封第一講書人閱讀 60,222評論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任性宏，我火速辦了婚禮，結(jié)果婚禮上状飞，老公的妹妹穿的比我還像新娘毫胜。我一直安慰自己，他們只是感情好诬辈，可當(dāng)我...
茶點故事閱讀 69,223評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布酵使。她就那樣靜靜地躺著，像睡著了一般焙糟。火紅的嫁衣襯著肌膚如雪口渔。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,807評論 1贊 314
城市分裂傳說
那天，我揣著相機(jī)與錄音，去河邊找鬼短荐。笑死萤捆，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的勤揩。我是一名探鬼主播咧党，決...
沈念sama閱讀 41,235評論 3贊 424
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼陨亡！你這毒婦竟也來了傍衡？” 一聲冷哼從身側(cè)響起深员，我...
開封第一講書人閱讀 40,189評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎蛙埂，沒想到半個月后倦畅，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,712評論 1贊 320
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡绣的，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,775評論 3贊 343
?白月光啟示錄
正文我和宋清朗相戀三年叠赐，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片屡江。...
茶點故事閱讀 40,926評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡芭概，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出惩嘉，到底是詐尸還是另有隱情罢洲，我是刑警寧澤，帶...
沈念sama閱讀 36,580評論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布文黎，位于F島的核電站惹苗，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏耸峭。R本人自食惡果不足惜桩蓉，卻給世界環(huán)境...
茶點故事閱讀 42,259評論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望抓艳。院中可真熱鬧触机，春花似錦、人聲如沸玷或。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,750評論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽偏友。三九已至蔬胯，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間位他，已是汗流浹背氛濒。一陣腳步聲響...
開封第一講書人閱讀 33,867評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留鹅髓，地道東北人舞竿。一個月前我還...
沈念sama閱讀 49,368評論 3贊 379
代替公主和親
正文我出身青樓，卻偏偏與公主長得像窿冯，于是被迫代替她去往敵國和親骗奖。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,930評論 2贊 361

AI開源框架（linux+mac）

推薦閱讀更多精彩內(nèi)容