第一：為什么學(xué)習(xí)大數(shù)據(jù)，第二：大數(shù)據(jù)學(xué)習(xí)資源詳細解讀

第一：為什么要學(xué)習(xí)大數(shù)據(jù)

大數(shù)據(jù)時代决左，中國IT環(huán)境也將面臨重新洗牌愕够，不僅僅是企業(yè)走贪，更是程序員們轉(zhuǎn)型可遇而不可求的機遇。

國內(nèi)大多數(shù)大型互聯(lián)網(wǎng)公司的程序員被稱作研發(fā)工程師惑芭，但實際上國內(nèi)幾乎沒有研發(fā)項目坠狡，只能叫做開發(fā)。開發(fā)程序員的工作大多是重復(fù)性勞動遂跟，容易產(chǎn)生疲憊感逃沿，薪資在工作2-5年內(nèi)就達到了一個峰值，再要提升就比較困難幻锁，這樣就導(dǎo)致了很多程序員最終轉(zhuǎn)行做了其他行業(yè)凯亮。

JAVA的精密，強大哄尔，擁有其它語言不可替代的性能和可維護性假消，早已經(jīng)是成為最受歡迎的編程語言之一，很多人想進入IT行業(yè)岭接，首選的第一門語言就是JAVA富拗。但是，在未來10年肯定是大數(shù)據(jù)的天下鸣戴，人工智能的爆發(fā)啃沪，將會有大量企業(yè)會進入大數(shù)據(jù)領(lǐng)域，而從JAVA程序員轉(zhuǎn)JAVA大數(shù)據(jù)就會有天然的優(yōu)勢窄锅，因為目前大數(shù)據(jù)的架構(gòu)基本都是用JAVA語言完成创千，未來10年，JAVA大數(shù)據(jù)的需求量會越來越大酬滤。

現(xiàn)在學(xué)習(xí)JAVA的小伙伴签餐，如果想以后不被淘汰，將來勢必會進軍大數(shù)據(jù)行列盯串，根據(jù)目前的行業(yè)動態(tài)氯檐，JAVA程序員由于發(fā)展的局限性以及隨著年齡增長，在競爭方面也越來越容易被年輕一代趕超体捏，因為JAVA程序員的加班時間過長導(dǎo)致冠摄，所以大批JAVA工程師前輩已經(jīng)先一步進軍大數(shù)據(jù)了。下面我們來分析一下大數(shù)據(jù)在未來的優(yōu)勢：

市場需求量大

經(jīng)常調(diào)查顯示几缭，去年有很多大小互聯(lián)網(wǎng)公司都在布局大數(shù)據(jù)河泳。而目前大數(shù)據(jù)方面的人才依舊十分緊缺，比如大數(shù)據(jù)生態(tài)Spark需要的Scala工程師年栓〔鸹樱基于Java和Scala等技術(shù)密切的關(guān)系，有些大數(shù)據(jù)公司會瞄準JAVA工程師某抓，通過培養(yǎng)轉(zhuǎn)而成為大數(shù)據(jù)工程師纸兔。

如果你先一步在學(xué)習(xí)JAVA的基礎(chǔ)上再學(xué)習(xí)一些大數(shù)據(jù)的知識惰瓜，那么將來你在公司的競爭力會明顯大于一般的JAVA工程師，甚至可能提前一步進軍大數(shù)據(jù)行列汉矿。

就業(yè)方向廣泛

JAVA大數(shù)據(jù)的人才以后可以進行的工作有很多種崎坊，下面舉幾個例子：

（1）大數(shù)據(jù)開發(fā)工程師

基礎(chǔ)大數(shù)據(jù)服務(wù)平臺，大中型的商業(yè)應(yīng)用包括我們常說的企業(yè)級應(yīng)用(主要指復(fù)雜的大企業(yè)的軟件系統(tǒng))洲拇、各種類型的網(wǎng)站等奈揍。負責搭建大數(shù)據(jù)應(yīng)用平臺以及開發(fā)分析應(yīng)用程序。

（2）大數(shù)據(jù)分析師

負責數(shù)據(jù)挖掘工作赋续，運用Hive男翰、Hbase等技術(shù)，專門對從事行業(yè)數(shù)據(jù)搜集蚕捉、整理奏篙、分析柴淘，并依據(jù)數(shù)據(jù)做出行業(yè)研究迫淹、評估和預(yù)測的專業(yè)人員。以及通過使用新型數(shù)據(jù)可視化工具如Spotifre为严，Qlikview和Tableau敛熬，對數(shù)據(jù)進行數(shù)據(jù)可視化和數(shù)據(jù)呈現(xiàn)。

（3）Android工程師

Android是一種基于Linux的自由及開放源代碼的操作系統(tǒng)第股，其源代碼是Java应民。所以市場上見到的手機系統(tǒng)例如MIUI，阿里云夕吻，樂蛙等诲锹，都是修改源代碼再發(fā)行的。Java做安卓不單單是指系統(tǒng)涉馅，還有APP對于更多的開發(fā)人員來說归园，他們更多的時間是花在開發(fā)APP上面。

還有很多其它職位比如大數(shù)據(jù)挖掘等就不一一說明了稚矿。

行業(yè)起薪高

下面我們用一張圖讓大家了解一下大數(shù)據(jù)工程師和java工程師的平均薪資

通過這篇文章我相信大家對JAVA大數(shù)據(jù)行業(yè)都有一點了解庸诱，在這個大家都呼吁的大數(shù)據(jù)時代，轉(zhuǎn)型做JAVA大數(shù)據(jù)是一個非常好的選擇晤揣，我相信即使幾年以后大數(shù)據(jù)依舊是一個很好的領(lǐng)域桥爽。

在美國，大數(shù)據(jù)工程師平均年薪達17.5萬美元昧识，在中國頂尖的互聯(lián)網(wǎng)公司里钠四，大數(shù)據(jù)工程師的薪酬也比同級別的其他職位高出30%以上。在未來若干年內(nèi)大數(shù)據(jù)工程師都會是供不應(yīng)求的狀況跪楞，指望大學(xué)培養(yǎng)出合格的大數(shù)據(jù)人才有如天方夜譚缀去，因此程序員們环疼，你們的春天到了！

對大數(shù)據(jù)的概念都是模糊不清的朵耕，大數(shù)據(jù)是什么炫隶，能做什么，學(xué)的時候阎曹，該按照什么線路去學(xué)習(xí)伪阶，學(xué)完往哪方面發(fā)展，想深入了解

想學(xué)習(xí)的同學(xué)歡迎加入大數(shù)據(jù)學(xué)習(xí)qq群：458345782处嫌，有大量干貨（零基礎(chǔ)以及進階的經(jīng)典實戰(zhàn)）分享給大家栅贴，并且有清華大學(xué)畢業(yè)的資深大數(shù)據(jù)講師給大家免費授課，給大家分享目前國內(nèi)最完整的大數(shù)據(jù)高端實戰(zhàn)實用學(xué)習(xí)流程體系熏迹。

第二：大數(shù)據(jù)學(xué)習(xí)資源詳細解讀

當前檐薯，整個互聯(lián)網(wǎng)正在從IT時代向DT時代演進，大數(shù)據(jù)技術(shù)也正在助力企業(yè)和公眾敲開DT世界大門注暗。當今“大數(shù)據(jù)”一詞的重點其實已經(jīng)不僅在于數(shù)據(jù)規(guī)模的定義坛缕，它更代表著信息技術(shù)發(fā)展進入了一個新的時代，代表著爆炸性的數(shù)據(jù)信息給傳統(tǒng)的計算技術(shù)和信息技術(shù)帶來的技術(shù)挑戰(zhàn)和困難捆昏，代表著大數(shù)據(jù)處理所需的新的技術(shù)和方法赚楚，也代表著大數(shù)據(jù)分析和應(yīng)用所帶來的新發(fā)明、新服務(wù)和新的發(fā)展機遇骗卜。

為了幫助大家更好深入了解大數(shù)據(jù)宠页，我翻譯了GitHub Awesome Big Data資源，供大家參考寇仓。本資源類型主要包括：大數(shù)據(jù)框架举户、論文等實用資源集合。

資源列表：

關(guān)系數(shù)據(jù)庫管理系統(tǒng)（RDBMS）

??框架

??分布式編程

??分布式文件系統(tǒng)

??文件數(shù)據(jù)模型

??Key -Map數(shù)據(jù)模型

??鍵-值數(shù)據(jù)模型

??圖形數(shù)據(jù)模型

??NewSQL數(shù)據(jù)庫

??列式數(shù)據(jù)庫

??時間序列數(shù)據(jù)庫

??類SQL處理

??數(shù)據(jù)攝取

??服務(wù)編程

??調(diào)度

??機器學(xué)習(xí)

??基準測試

??安全性

??系統(tǒng)部署

??應(yīng)用程序

??搜索引擎與框架

??MySQL的分支和演化

??PostgreSQL的分支和演化

??Memcached的分支和演化

??嵌入式數(shù)據(jù)庫

??商業(yè)智能

??數(shù)據(jù)可視化

??物聯(lián)網(wǎng)和傳感器

??文章

??論文

??視頻

關(guān)系數(shù)據(jù)庫管理系統(tǒng)（RDBMS）

SQLServer：世界最有活力的數(shù)據(jù)庫遍烦；??

??MySQL：世界最流行的開源數(shù)據(jù)庫俭嘁；

??PostgreSQL：世界最先進的開源數(shù)據(jù)庫；

??Oracle?數(shù)據(jù)庫：對象-關(guān)系型數(shù)據(jù)庫管理系統(tǒng)乳愉。

框架

??Apache Hadoop：分布式處理架構(gòu)兄淫，結(jié)合了?MapReduce（并行處理）、YARN（作業(yè)調(diào)度）和HDFS（分布式文件系統(tǒng)）蔓姚；

??Tigon：高吞吐量實時流處理框架捕虽。

分布式編程

??AddThis Hydra?：最初在AddThis上開發(fā)的分布式數(shù)據(jù)處理和存儲系統(tǒng)；

??AMPLab SIMR：用在Hadoop MapReduce v1上運行Spark坡脐；

??Apache Beam：為統(tǒng)一的模型以及一套用于定義和執(zhí)行數(shù)據(jù)處理工作流的特定SDK語言泄私；

??Apache Crunch：一個簡單的Java API，用于執(zhí)行在普通的MapReduce實現(xiàn)時比較單調(diào)的連接、數(shù)據(jù)聚合等任務(wù)晌端；

??Apache DataFu：由LinkedIn開發(fā)的針對Hadoop and?和Pig的用戶定義的函數(shù)集合捅暴；

??Apache Flink：具有高性能的執(zhí)行時間和自動程序優(yōu)化；

??Apache Gora：內(nèi)存中的數(shù)據(jù)模型和持久性框架咧纠；

??Apache Hama：BSP（整體同步并行）計算框架蓬痒；

??Apache MapReduce?：在集群上使用并行、分布式算法處理大數(shù)據(jù)集的編程模型漆羔；

??Apache Pig?：Hadoop中梧奢，用于處理數(shù)據(jù)分析程序的高級查詢語言；

??Apache REEF?：用來簡化和統(tǒng)一低層大數(shù)據(jù)系統(tǒng)的保留性評估執(zhí)行框架演痒；

??Apache S4?：S4中流處理與實現(xiàn)的框架流炕；

??Apache Spark?：內(nèi)存集群計算框架逢勾；

??Apache Spark Streaming?：流處理框架员帮，同時是Spark的一部分亥贸；

??Apache Storm?：Twitter流處理框架，也可用于YARN讯嫂；

??Apache Samza?：基于Kafka和YARN的流處理框架蹦锋；

??Apache Tez?：基于YARN，用于執(zhí)行任務(wù)中的復(fù)雜DAG（有向無環(huán)圖）端姚；

??Apache Twill?：基于YARN的抽象概念晕粪，用于減少開發(fā)分布式應(yīng)用程序的復(fù)雜度挤悉；

??Cascalog：數(shù)據(jù)處理和查詢庫渐裸；

??Cheetah?：在MapReduce之上的高性能、自定義數(shù)據(jù)倉庫装悲；

??Concurrent Cascading?：在Hadoop上的數(shù)據(jù)管理/分析框架昏鹃；

??Damballa Parkour?：用于Clojure的MapReduce庫；

??Datasalt Pangool?：可選擇的MapReduce范例诀诊；

??DataTorrent StrAM?：為實時引擎洞渤，用于以盡可能暢通的方式、最小的開支和對性能最小的影響属瓣，實現(xiàn)分布式载迄、異步、實時的內(nèi)存大數(shù)據(jù)計算抡蛙；

??Facebook Corona?：為Hadoop做優(yōu)化處理护昧，從而消除單點故障；

??Facebook Peregrine?：MapReduce框架粗截；

??Facebook Scuba?：分布式內(nèi)存數(shù)據(jù)存儲惋耙；

??Google Dataflow?：創(chuàng)建數(shù)據(jù)管道，以幫助其分析框架；

??Netflix PigPen?：為MapReduce绽榛，用于編譯成Apache Pig湿酸；

??Nokia Disco?：由Nokia開發(fā)的MapReduc獲取、轉(zhuǎn)換和分析數(shù)據(jù)灭美；

??Google MapReduce?：MapReduce框架推溃；

??Google MillWheel?：容錯流處理框架；?

??JAQL?：用于處理結(jié)構(gòu)化届腐、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)工作的聲明性編程語言美莫；

??Kite?：為一組庫、工具梯捕、實例和文檔集厢呵，用于使在Hadoop的生態(tài)系統(tǒng)上建立系統(tǒng)更加容易；

??Metamarkets Druid?：用于大數(shù)據(jù)集的實時e框架傀顾；

??Onyx?：分布式云計算襟铭；

??Pinterest Pinlater?：異步任務(wù)執(zhí)行系統(tǒng)；

??Pydoop?：用于Hadoop的Python MapReduce和HDFS API短曾；

??Rackerlabs Blueflood?：多租戶分布式測度處理系統(tǒng)寒砖；

??Stratosphere?：通用集群計算框架；

??Streamdrill?：用于計算基于不同時間窗口的事件流的活動嫉拐，并找到最活躍的一個哩都；

??Tuktu?：易于使用的用于分批處理和流計算的平臺，通過Scala婉徘、?Akka和Play所建漠嵌；

??Twitter Scalding：基于Cascading，用于Map?Reduce工作的Scala庫盖呼；

??Twitter Summingbird?：在Twitter上使用Scalding和Storm串流MapReduce儒鹿；

??Twitter TSAR?：Twitter上的時間序列聚合器。

分布式文件系統(tǒng)

??Apache HDFS：在多臺機器上存儲大型文件的方式几晤；

??BeeGFS：以前是FhGFS约炎，并行分布式文件系統(tǒng)；

??Ceph Filesystem：設(shè)計的軟件存儲平臺蟹瘾；

??Disco DDFS：分布式文件系統(tǒng)圾浅；

??Facebook Haystack：對象存儲系統(tǒng)；

??Google Colossus：分布式文件系統(tǒng)(GFS2)憾朴；

??Google GFS：分布式文件系統(tǒng)狸捕；

??Google Megastore：可擴展的、高度可用的存儲伊脓；

??GridGain：兼容GGFS府寒、Hadoop內(nèi)存的文件系統(tǒng)魁衙；

??Lustre file system：高性能分布式文件系統(tǒng)；

??Quantcast File System QFS：開源分布式文件系統(tǒng)株搔；

??Red Hat GlusterFS：向外擴展的附網(wǎng)存儲（Network-attached?Storage）文件系統(tǒng)剖淀；

??Seaweed-FS：簡單的、高度可擴展的分布式文件系統(tǒng)纤房；

??Alluxio：以可靠的存儲速率在跨集群框架上文件共享纵隔；

??Tahoe-LAFS：分布式云存儲系統(tǒng)；

文件數(shù)據(jù)模型

??Actian Versant：商用的面向?qū)ο髷?shù)據(jù)庫管理系統(tǒng)炮姨；

??Crate Data：是一個開源的大規(guī)陌乒危可擴展的數(shù)據(jù)存儲，需要零管理模式舒岸；

??Facebook Apollo：Facebook的Paxos算法绅作，類似于NoSQL數(shù)據(jù)庫；

??jumboDB：基于Hadoop的面向文檔的數(shù)據(jù)存儲蛾派；

??LinkedIn Espresso：可橫向擴展的面向文檔的NoSQL數(shù)據(jù)存儲俄认；

??MarkLogic：模式不可知的企業(yè)版NoSQL數(shù)據(jù)庫技術(shù)；

??MongoDB：面向文檔的數(shù)據(jù)庫系統(tǒng)洪乍；

??RavenDB：一個事務(wù)性的眯杏，開源文檔數(shù)據(jù)庫；

??RethinkDB：支持連接查詢和群組依據(jù)等查詢的文檔型數(shù)據(jù)庫壳澳。

Key Map?數(shù)據(jù)模型

注意：業(yè)內(nèi)存在一些術(shù)語混亂岂贩，有兩個不同的東西都叫做“列式數(shù)據(jù)庫”。這里列出的有一些是圍繞“key-map”數(shù)據(jù)模型而建的分布式巷波、持續(xù)型數(shù)據(jù)庫萎津，其中所有的數(shù)據(jù)都有（可能綜合了）鍵，并與映射中的鍵-值對相關(guān)聯(lián)褥紫。在一些系統(tǒng)中姜性，多個這樣的值映射可以與鍵相關(guān)聯(lián)，并且這些映射被稱為“列族”（具有映射值的鍵被稱為“列”）髓考。

另一組也可稱為“列式數(shù)據(jù)庫”的技術(shù)因其存儲數(shù)據(jù)的方式而有別于前一組，它在磁盤上或在存儲器中——而不是以傳統(tǒng)方式弃酌，即所有既定鍵的鍵值都相鄰著氨菇、逐行存儲。這些系統(tǒng)也彼此相鄰來存儲所有列值妓湘，但是要得到給定列的所有值卻不需要以前那么繁復(fù)的工作查蓉。

前一組在這里被稱為“key map數(shù)據(jù)模型”，這兩者和Key-value?數(shù)據(jù)模型之間的界限是相當模糊的榜贴。后者對數(shù)據(jù)模型有更多的存儲格式豌研，可在列式數(shù)據(jù)庫中列出妹田。若想了解更多關(guān)于這兩種模型的區(qū)分，可閱讀Daniel Abadi的博客：Distinguishing two major types of Column Stores鹃共。

??Apache Accumulo：內(nèi)置在Hadoop上的分布式鍵/值存儲鬼佣；

??Apache Cassandra：由BigTable授權(quán)，面向列的分布式數(shù)據(jù)存儲霜浴；

??Apache HBase：由BigTable授權(quán)晶衷，面向列的分布式數(shù)據(jù)存儲；

??Facebook HydraBase：Facebook所開發(fā)的HBase的衍化品阴孟；

??Google BigTable：面向列的分布式數(shù)據(jù)存儲晌纫；

??Google Cloud Datastore：為完全管理型的無模式數(shù)據(jù)庫，用于存儲在BigTable上非關(guān)系型數(shù)據(jù)永丝；

??Hypertable：由BigTable授權(quán)锹漱，面向列的分布式數(shù)據(jù)存儲；

??InfiniDB：通過MySQL的接口訪問慕嚷，并使用大規(guī)模并行處理進行并行查詢凌蔬；

??Tephra：用于HBase處理；

??Twitter Manhattan：Twitter的實時闯冷、多租戶分布式數(shù)據(jù)庫砂心。

鍵-值數(shù)據(jù)模型

??Aerospike：支持NoSQL的閃存優(yōu)化，數(shù)據(jù)存儲在內(nèi)存蛇耀。開源辩诞，“'C'（不是Java或Erlang）中的服務(wù)器代碼可精確地調(diào)整從而避免上下文切換和內(nèi)存拷貝”。

??Amazon DynamoDB：分布式鍵/值存儲纺涤，Dynamo論文的實現(xiàn)译暂；

??Edis：為替代Redis的協(xié)議兼容的服務(wù)器；

??ElephantDB：專門研究Hadoop中數(shù)據(jù)導(dǎo)出的分布式數(shù)據(jù)庫撩炊；

??EventStore：分布式時間序列數(shù)據(jù)庫外永；

??GridDB：適用于存儲在時間序列中的傳感器數(shù)據(jù)；

??LinkedIn Krati：簡單的持久性數(shù)據(jù)存儲拧咳，擁有低延遲和高吞吐量伯顶；

??Linkedin Voldemort：分布式鍵/值存儲系統(tǒng)；

??Oracle NoSQL Database：Oracle公司開發(fā)的分布式鍵值數(shù)據(jù)庫骆膝；

??Redis：內(nèi)存中的鍵值數(shù)據(jù)存儲祭衩；

??Riak：分散式數(shù)據(jù)存儲；

??Storehaus：Twitter開發(fā)的異步鍵值存儲的庫阅签；

??Tarantool：一個高效的NoSQL數(shù)據(jù)庫和Lua應(yīng)用服務(wù)器掐暮；

??TiKV：由Google Spanner和HBase授權(quán)，Rust提供技術(shù)支持的分布式鍵值數(shù)據(jù)庫政钟；

??TreodeDB：可復(fù)制路克、共享的鍵-值存儲樟结，能提供多行原子寫入。

圖形數(shù)據(jù)模型

??Apache Giraph：基于Hadoop的Pregel實現(xiàn)精算；

??Apache Spark Bagel：可實現(xiàn)Pregel瓢宦，為Spark的一部分；

??ArangoDB：多層模型分布式數(shù)據(jù)庫殖妇；

??DGraph：一個可擴展的刁笙、分布式、低時延谦趣、高吞吐量的圖形數(shù)據(jù)庫疲吸，旨在為Google生產(chǎn)水平規(guī)模和吞吐量提供足夠的低延遲，用于TB級的結(jié)構(gòu)化數(shù)據(jù)的實時用戶查詢前鹅；

??Facebook TAO：TAO是facebook廣泛用來存儲和服務(wù)于社交圖形的分布式數(shù)據(jù)存儲摘悴；

??GCHQ Gaffer：GCHQ中的Gaffer是一個易于存儲大規(guī)模圖形的框架，其中節(jié)點和邊緣都有統(tǒng)計數(shù)據(jù)舰绘；

??Google Cayley：開源圖形數(shù)據(jù)庫蹂喻；

??Google Pregel?：圖形處理框架；

??GraphLab PowerGraph：核心C ++ GraphLab API和建立在GraphLab API之上的高性能機器學(xué)習(xí)和數(shù)據(jù)挖掘工具包的集合捂寿；

??GraphX：Spark中的彈性分布式圖形系統(tǒng)口四；

??Gremlin：圖形追蹤語言；

??Infovore：以RDF為中心的Map / Reduce框架秦陋；

??Intel GraphBuilder：在Hadoop上構(gòu)建大規(guī)模圖形的工具蔓彩；

??MapGraph：用于在GPU上大規(guī)模并行圖形處理；

??Neo4j：完全用Java寫入的圖形數(shù)據(jù)庫驳概；

??OrientDB：文檔和圖形數(shù)據(jù)庫赤嚼；

??Phoebus：大型圖形處理框架；

??Titan：建于Cassandra的分布式圖形數(shù)據(jù)庫顺又；

??Twitter FlockDB：分布式圖形數(shù)據(jù)庫更卒。

NewSQL數(shù)據(jù)庫

??Actian Ingres：由商業(yè)支持，開源的SQL關(guān)系數(shù)據(jù)庫管理系統(tǒng)稚照；

??Amazon RedShift：基于PostgreSQL的數(shù)據(jù)倉庫服務(wù)蹂空；

??BayesDB：面向統(tǒng)計數(shù)值的SQL數(shù)據(jù)庫；

??CitusDB：通過分區(qū)和復(fù)制橫向擴展PostgreSQL锐锣；

??Cockroach：可擴展腌闯、地址可復(fù)制、交易型的數(shù)據(jù)庫雕憔；

??Datomic：旨在產(chǎn)生可擴展、靈活的智能應(yīng)用的分布式數(shù)據(jù)庫糖声；

??FoundationDB：由F1授意的分布式數(shù)據(jù)庫斤彼；

??Google F1：建立在Spanner上的分布式SQL數(shù)據(jù)庫分瘦；

??Google Spanner：全球性的分布式半關(guān)系型數(shù)據(jù)庫；

??H-Store：是一個實驗性主存并行數(shù)據(jù)庫管理系統(tǒng)琉苇，用于聯(lián)機事務(wù)處理（OLTP）應(yīng)用的優(yōu)化嘲玫；

??Haeinsa：基于Percolator，HBase的線性可擴展多行多表交易庫并扇；

??HandlerSocket：MySQL/MariaDB的NoSQL插件去团；

??InfiniSQL：無限可擴展的RDBMS；

??MemSQL：內(nèi)存中的SQL數(shù)據(jù)庫穷蛹，其中有優(yōu)化的閃存列存儲土陪；

??NuoDB：SQL / ACID兼容的分布式數(shù)據(jù)庫；

??Oracle TimesTen in-Memory Database：內(nèi)存中具有持久性和可恢復(fù)性的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)肴熏；

??Pivotal GemFire XD：內(nèi)存中低延時的分布式SQL數(shù)據(jù)存儲鬼雀，可為內(nèi)存列表數(shù)據(jù)提供SQL接口，在HDFS中較持久化蛙吏；

??SAP HANA：是在內(nèi)存中面向列的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)源哩；

??SenseiDB：分布式實時半結(jié)構(gòu)化的數(shù)據(jù)庫；

??Sky：用于行為數(shù)據(jù)的靈活鸦做、高性能分析的數(shù)據(jù)庫励烦；

??SymmetricDS：用于文件和數(shù)據(jù)庫同步的開源軟件；

??Map-D：為GPU內(nèi)存數(shù)據(jù)庫泼诱，也為大數(shù)據(jù)分析和可視化平臺坛掠；

??TiDB：TiDB是分布式SQL數(shù)據(jù)庫，基于谷歌F1的設(shè)計靈感坷檩；

??VoltDB：自稱為最快的內(nèi)存數(shù)據(jù)庫却音。

列式數(shù)據(jù)庫

注意：請在鍵-值數(shù)據(jù)模型?閱讀相關(guān)注釋。

??Columnar Storage：解釋什么是列存儲以及何時會需要用到它矢炼；

??Actian Vector：面向列的分析型數(shù)據(jù)庫系瓢；

??C-Store：面向列的DBMS；

??MonetDB：列存儲數(shù)據(jù)庫句灌；

??Parquet：Hadoop的列存儲格式夷陋；

??Pivotal Greenplum：專門設(shè)計的、專用的分析數(shù)據(jù)倉庫胰锌，類似于傳統(tǒng)的基于行的工具骗绕，提供了一個列式工具；

??Vertica：用來管理大規(guī)模资昧、快速增長的大量數(shù)據(jù)酬土，當用于數(shù)據(jù)倉庫時，能夠提供非掣翊快的查詢性能撤缴；

??Google BigQuery?：谷歌的云產(chǎn)品刹枉，由其在Dremel的創(chuàng)始工作提供支持；

??Amazon Redshift?：亞馬遜的云產(chǎn)品屈呕，它也是基于柱狀數(shù)據(jù)存儲后端微宝。

時間序列數(shù)據(jù)庫

??Cube：使用MongoDB來存儲時間序列數(shù)據(jù)；

??Axibase Time Series Database：在HBase之上的分布式時間序列數(shù)據(jù)庫虎眨，它包括內(nèi)置的Rule Engine蟋软、數(shù)據(jù)預(yù)測和可視化；

??Heroic：基于Cassandra和Elasticsearch的可擴展的時間序列數(shù)據(jù)庫嗽桩；

??InfluxDB：分布式時間序列數(shù)據(jù)庫岳守；

??Kairosdb：類似于OpenTSDB但會考慮到Cassandra；

??OpenTSDB：在HBase上的分布式時間序列數(shù)據(jù)庫涤躲；

??Prometheus：一種時間序列數(shù)據(jù)庫和服務(wù)監(jiān)測系統(tǒng)棺耍；

??Newts：一種基于Apache Cassandra的時間序列數(shù)據(jù)庫。

類SQL處理

??Actian SQL for Hadoop：高性能交互式的SQL种樱，可訪問所有的Hadoop數(shù)據(jù)蒙袍；

??Apache Drill：由Dremel授意的交互式分析框架；

??Apache HCatalog：Hadoop的表格和存儲管理層嫩挤；

??Apache Hive：Hadoop的類SQL數(shù)據(jù)倉庫系統(tǒng)害幅；

??Apache Optiq：一種框架，可允許高效的查詢翻譯岂昭，其中包括異構(gòu)性及聯(lián)合性數(shù)據(jù)的查詢以现；

??Apache Phoenix：Apache Phoenix?是?HBase?的?SQL?驅(qū)動；

??Cloudera Impala：由Dremel授意的交互式分析框架约啊；

??Concurrent Lingual：Cascading中的類SQL查詢語言邑遏；

??Datasalt Splout SQL：用于大數(shù)據(jù)集的完整的SQL查詢工具；

??Facebook PrestoDB：分布式SQL查詢工具恰矩；

??Google BigQuery：交互式分析框架记盒，Dremel的實現(xiàn)；

??Pivotal HAWQ：Hadoop的類SQL的數(shù)據(jù)倉庫系統(tǒng)外傅；

??RainstorDB：用于存儲大規(guī)模PB級結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫纪吮；

??Spark Catalyst：用于Spark和Shark的查詢優(yōu)化框架；

??SparkSQL：使用Spark操作結(jié)構(gòu)化數(shù)據(jù)萎胰；

??Splice Machine：一個全功能的Hadoop上的SQL?RDBMS碾盟，并帶有ACID事務(wù)；

??Stinger：用于Hive的交互式查詢技竟；

??Tajo：Hadoop的分布式數(shù)據(jù)倉庫系統(tǒng)冰肴；

??Trafodion：為企業(yè)級的SQL-on-HBase針對大數(shù)據(jù)的事務(wù)或業(yè)務(wù)工作負載的解決方案。

數(shù)據(jù)攝取

??Amazon Kinesis：大規(guī)模數(shù)據(jù)流的實時處理；

??Apache Chukwa：數(shù)據(jù)采集系統(tǒng)嚼沿；

??Apache Flume：管理大量日志數(shù)據(jù)的服務(wù)估盘；

??Apache Kafka：分布式發(fā)布-訂閱消息系統(tǒng)瓷患；

??Apache Sqoop：在Hadoop和結(jié)構(gòu)化的數(shù)據(jù)存儲區(qū)之間傳送數(shù)據(jù)的工具骡尽；

??Cloudera Morphlines：幫助Solr、HBase和HDFS完成ETL的框架擅编；

??Facebook Scribe：流日志數(shù)據(jù)聚合器攀细；

??Fluentd：采集事件和日志的工具；

??Google Photon：實時連接多個數(shù)據(jù)流的分布式計算機系統(tǒng)爱态，具有高可擴展性和低延遲性谭贪；

??Heka：開源流處理軟件系統(tǒng)；

??HIHO：用Hadoop連接不同數(shù)據(jù)源的框架锦担；

??Kestrel：分布式消息隊列系統(tǒng)俭识；

??LinkedIn Databus：對數(shù)據(jù)庫更改捕獲的事件流；

??LinkedIn Kamikaze：壓縮已分類整型數(shù)組的程序包洞渔；

??LinkedIn White Elephant：日志聚合器和儀表板套媚；

??Logstash：用于管理事件和日志的工具；

??Netflix Suro：像基于Chukwa?的Storm和Samza一樣的日志聚合器磁椒；

??Pinterest Secor：是實現(xiàn)Kafka日志持久性的服務(wù)堤瘤；

??Linkedin Gobblin：LinkedIn的通用數(shù)據(jù)攝取框架；

??Skizze：是一種數(shù)據(jù)存儲略圖浆熔，使用概率性數(shù)據(jù)結(jié)構(gòu)來處理計數(shù)本辐、略圖等相關(guān)的問題；

??StreamSets Data Collector：連續(xù)大數(shù)據(jù)采集的基礎(chǔ)設(shè)施医增，可簡單地使用IDE慎皱。

服務(wù)編程

??Akka Toolkit：JVM中分布性、容錯事件驅(qū)動應(yīng)用程序的運行時間叶骨；

??Apache Avro：數(shù)據(jù)序列化系統(tǒng)茫多；

??Apache Curator：Apache ZooKeeper的Java庫；

??Apache Karaf：在任何OSGi框架之上運行的OSGi運行時間邓萨；

??Apache Thrift：構(gòu)建二進制協(xié)議的框架地梨；

??Apache Zookeeper：流程管理集中式服務(wù)；

??Google Chubby：一種松耦合分布式系統(tǒng)鎖服務(wù)缔恳；

??Linkedin Norbert：集群管理器宝剖；

??OpenMPI：消息傳遞框架；

??Serf：服務(wù)發(fā)現(xiàn)和協(xié)調(diào)的分散化解決方案歉甚；

??Spotify Luigi：一種構(gòu)建批處理作業(yè)的復(fù)雜管道的Python包万细，它能夠處理依賴性解析、工作流管理、可視化赖钞、故障處理腰素、命令行一體化等等問題；

??Spring XD：數(shù)據(jù)攝取雪营、實時分析弓千、批量處理和數(shù)據(jù)導(dǎo)出的分布式、可擴展系統(tǒng)献起；

??Twitter Elephant Bird：LZO壓縮數(shù)據(jù)的工作庫洋访；

??Twitter Finagle：JVM的異步網(wǎng)絡(luò)堆棧。

調(diào)度

??Apache Aurora：在Apache Mesos之上運行的服務(wù)調(diào)度程序谴餐；

??Apache Falcon：數(shù)據(jù)管理框架姻政；

??Apache Oozie：工作流作業(yè)調(diào)度程序；

??Chronos：分布式容錯調(diào)度岂嗓；

??Linkedin Azkaban：批處理工作流作業(yè)調(diào)度汁展；

??Schedoscope：Hadoop作業(yè)敏捷調(diào)度的Scala DSL；

??Sparrow：調(diào)度平臺厌殉；

??Airflow：一個以編程方式編寫食绿、調(diào)度和監(jiān)控工作流的平臺。

機器學(xué)習(xí)

??Apache Mahout：Hadoop的機器學(xué)習(xí)庫年枕；

??brain：JavaScript中的神經(jīng)網(wǎng)絡(luò)炫欺；

??Cloudera Oryx：實時大規(guī)模機器學(xué)習(xí)；

??Concurrent Pattern：Cascading的機器學(xué)習(xí)庫熏兄；

??convnetjs：Javascript中的機器學(xué)習(xí)品洛，在瀏覽器中訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)（或普通網(wǎng)絡(luò)）；

??Decider：Ruby中靈活摩桶、可擴展的機器學(xué)習(xí)桥状；

??ENCOG：支持多種先進算法的機器學(xué)習(xí)框架，同時支持類的標準化和處理數(shù)據(jù)硝清；

??etcML：機器學(xué)習(xí)文本分類辅斟；

??Etsy Conjecture：Scalding中可擴展的機器學(xué)習(xí)；

??Google Sibyl：Google中的大規(guī)模機器學(xué)習(xí)系統(tǒng)芦拿；

??GraphLab Create：Python的機器學(xué)習(xí)平臺士飒，包括ML工具包、數(shù)據(jù)工程和部署工具的廣泛集合蔗崎；

??H2O：Hadoop統(tǒng)計性的機器學(xué)習(xí)和數(shù)學(xué)運行時間酵幕；

??MLbase：用于BDAS堆棧的分布式機器學(xué)習(xí)庫；

??MLPNeuralNet：針對iOS和Mac OS X的快速多層感知神經(jīng)網(wǎng)絡(luò)庫缓苛；

??MonkeyLearn：使文本挖掘更為容易芳撒，從文本中提取分類數(shù)據(jù)；

??nupic：智能計算的Numenta平臺，它是一個啟發(fā)大腦的機器智力平臺笔刹，基于皮質(zhì)學(xué)習(xí)算法的精準的生物神經(jīng)網(wǎng)絡(luò)芥备；

??PredictionIO：建于Hadoop、Mahout和Cascading上的機器學(xué)習(xí)服務(wù)器舌菜；

??SAMOA：分布式流媒體機器學(xué)習(xí)框架萌壳；

??scikit-learn：scikit-learn為Python中的機器學(xué)習(xí)；

??Spark MLlib：Spark中一些常用的機器學(xué)習(xí)（ML）功能的實現(xiàn)酷师；

??Vowpal Wabbit：微軟和雅虎發(fā)起的學(xué)習(xí)系統(tǒng)讶凉；

??WEKA：機器學(xué)習(xí)軟件套件；

??BidMach：CPU和加速GPU的機器學(xué)習(xí)庫山孔。

基準測試

??Apache Hadoop Benchmarking：測試Hadoop性能的微基準；

??Berkeley SWIM Benchmark：現(xiàn)實大數(shù)據(jù)工作負載基準測試荷憋；

??Intel HiBench：Hadoop基準測試套件台颠；

??PUMA Benchmarking：MapReduce應(yīng)用的基準測試套件；

??Yahoo Gridmix3：雅虎工程師團隊的Hadoop集群基準測試勒庄。

安全性

??Apache Knox Gateway：Hadoop集群安全訪問的單點串前；

??Apache Sentry：存儲在Hadoop的數(shù)據(jù)安全模塊。

系統(tǒng)部署

??Apache Ambari：Hadoop管理的運作框架实蔽；

??Apache Bigtop：Hadoop生態(tài)系統(tǒng)的部署框架荡碾；

??Apache Helix：集群管理框架；

??Apache Mesos：集群管理器局装；

??Apache Slider：一種YARN應(yīng)用坛吁，用來部署YARN中現(xiàn)有的分布式應(yīng)用程序；

??Apache Whirr：運行云服務(wù)的庫集铐尚；

??Apache YARN：集群管理器拨脉；

??Brooklyn：用于簡化應(yīng)用程序部署和管理的庫；

??Buildoop：基于Groovy語言宣增，和Apache BigTop類似玫膀；

??Cloudera HUE：和Hadoop進行交互的Web應(yīng)用程序；

??Facebook Prism：多數(shù)據(jù)中心復(fù)制系統(tǒng)爹脾；

??Google Borg：作業(yè)調(diào)度和監(jiān)控系統(tǒng)帖旨；

??Google Omega：作業(yè)調(diào)度和監(jiān)控系統(tǒng)；

??Hortonworks HOYA：可在YARN上部署HBase集群的應(yīng)用灵妨；

??Marathon：用于長期運行服務(wù)的Mesos框架解阅。

應(yīng)用程序

??Adobe spindle：使用Scala、Spark和Parquet處理的下一代web分析闷串；

??Apache Kiji：基于HBase瓮钥，實時采集和分析數(shù)據(jù)的框架；

??Apache Nutch：開源網(wǎng)絡(luò)爬蟲；

??Apache OODT：用于NASA科學(xué)檔案中數(shù)據(jù)的捕獲碉熄、處理和共享桨武；

??Apache Tika：內(nèi)容分析工具包；

??Argus：時間序列監(jiān)測和報警平臺锈津；

??Countly：基于Node.js和MongoDB呀酸，開源的手機和網(wǎng)絡(luò)分析平臺；

??Domino：運行琼梆、規(guī)劃性誉、共享和部署模型——沒有任何基礎(chǔ)設(shè)施；

??Eclipse BIRT：基于Eclipse的報告系統(tǒng)茎杂；

??Eventhub：開源的事件分析平臺错览；

??Hermes：建于Kafka上的異步消息代理；

??HIPI Library：在Hadoop's MapReduce上執(zhí)行圖像處理任務(wù)的API煌往；

??Hunk：Hadoop的Splunk分析倾哺；

??Imhotep：大規(guī)模分析平臺；

??MADlib：RDBMS的用于數(shù)據(jù)分析的數(shù)據(jù)處理庫刽脖；

??Kylin：來自eBay的開源分布式分析工具羞海；

??PivotalR：Pivotal HD / HAWQ和PostgreSQL中的R；

??Qubole：為自動縮放Hadoop集群曲管，內(nèi)置的數(shù)據(jù)連接器却邓；

??Sense：用于數(shù)據(jù)科學(xué)和大數(shù)據(jù)分析的云平臺；

??SnappyData：用于實時運營分析的分布式內(nèi)存數(shù)據(jù)存儲院水，提供建立在Spark單一集成集群中的數(shù)據(jù)流分析腊徙、OLTP（聯(lián)機事務(wù)處理）和OLAP（聯(lián)機分析處理）；

??Snowplow：企業(yè)級網(wǎng)絡(luò)和事件分析衙耕，由Hadoop昧穿、Kinesis、Redshift?和Postgres提供技術(shù)支持橙喘；

??SparkR：Spark的R前端时鸵；

??Splunk：用于機器生成的數(shù)據(jù)的分析；

??Sumo Logic：基于云的分析儀厅瞎，用于分析機器生成的數(shù)據(jù)饰潜；

??Talend：用于YARN、Hadoop和簸、HBASE彭雾、Hive、HCatalog和Pig的統(tǒng)一開源環(huán)境锁保；

??Warp：利用大數(shù)據(jù)（OS X app）的實例查詢工具荣月。

搜索引擎與框架

??Apache Lucene：搜索引擎庫；

??Apache Solr：用于Apache Lucene的搜索平臺惜互；

??ElasticSearch：基于Apache Lucene的搜索和分析引擎；

??Enigma.io：為免費增值的健壯性web應(yīng)用者填，用于探索、篩選做葵、分析占哟、搜索和導(dǎo)出來自網(wǎng)絡(luò)的大規(guī)模數(shù)據(jù)集；

??Facebook Unicorn：社交圖形搜索平臺酿矢；

??Google Caffeine：連續(xù)索引系統(tǒng)榨乎；

??Google Percolator：連續(xù)索引系統(tǒng)；

??TeraGoogle：大型搜索索引瘫筐；

??HBase Coprocessor：為Percolator的實現(xiàn)蜜暑，HBase的一部分；

??Lily HBase Indexer：快速严肪、輕松地搜索存儲在HBase的任何內(nèi)容史煎；

??LinkedIn Bobo：完全由Java編寫的分面搜索的實現(xiàn)，為Apache Lucene的延伸驳糯；

??LinkedIn Cleo：為一個一個靈活的軟件庫，使得局部氢橙、無序酝枢、實時預(yù)輸入的搜索實現(xiàn)了快速發(fā)展；

??LinkedIn Galene：LinkedIn搜索架構(gòu)悍手；

??LinkedIn Zoie：是用Java編寫的實時搜索/索引系統(tǒng)帘睦；

??Sphinx Search Server：全文搜索引擎

MySQL的分支和演化

??Amazon RDS：亞馬遜云的MySQL數(shù)據(jù)庫；

??Drizzle：MySQL的6.0的演化坦康；

??Google Cloud SQL：谷歌云的MySQL數(shù)據(jù)庫竣付；

??MariaDB：MySQL的增強版嵌入式替代品；

??MySQL Cluster：使用NDB集群存儲引擎的MySQL實現(xiàn)滞欠；

??Percona Server：MySQL的增強版嵌入式替代品古胆；

??ProxySQL：MySQL的高性能代理；

??TokuDB：用于MySQL和?MariaDB的存儲引擎筛璧；

??WebScaleSQL：運行MySQL時面臨類似挑戰(zhàn)的幾家公司逸绎，它們的工程師之間的合作。

PostgreSQL的分支和演化

??Yahoo Everest?- multi-peta-byte database / MPP derived by PostgreSQL.

??HadoopDB：MapReduce和DBMS的混合體夭谤；

??IBM Netezza：高性能數(shù)據(jù)倉庫設(shè)備棺牧；

??Postgres-XL：基于PostgreSQL，可擴展的開源數(shù)據(jù)庫集群朗儒；

??RecDB：完全建立在PostgreSQL內(nèi)部的開源推薦引擎颊乘；

??Stado：開源MPP數(shù)據(jù)庫系統(tǒng)参淹，只針對數(shù)據(jù)倉庫和數(shù)據(jù)集市的應(yīng)用程序；

??Yahoo Everest：PostgreSQL可以推導(dǎo)多字節(jié)P比特數(shù)據(jù)庫/MPP乏悄。

Memcached的分支和演化

??Facebook McDipper：閃存的鍵/值緩存浙值；

??Facebook Memcached：Memcache的分支；

??Twemproxy：Memcached和Redis的快速纲爸、輕型代理亥鸠；

??Twitter Fatcache：閃存的鍵/值緩存；

??Twitter Twemcache：Memcache的分支识啦。

嵌入式數(shù)據(jù)庫

??Actian PSQL：PervasiveSoftware公司開發(fā)的ACID兼容的DBMS负蚊，在應(yīng)用程序中嵌入了優(yōu)化；

??BerkeleyDB：為鍵/值數(shù)據(jù)提供一個高性能的嵌入式數(shù)據(jù)庫的一個軟件庫颓哮；

??HanoiDB：Erlang LSM BTree存儲家妆；

??LevelDB：谷歌寫的一個快速鍵-值存儲庫，它提供了從字符串鍵到字符串值的有序映射冕茅；

??LMDB：Symas開發(fā)的超快伤极、超緊湊的鍵-值嵌入的式數(shù)據(jù)存儲；

??RocksDB：基于性LevelDB姨伤，用于快速存儲的嵌入式持續(xù)性鍵-值存儲哨坪。

商業(yè)智能

??BIME Analytics：商業(yè)智能云平臺；

??Chartio：精益業(yè)務(wù)智能平臺乍楚，用于可視化和探索數(shù)據(jù)当编；

??datapine：基于云的自助服務(wù)商業(yè)智能工具；

??Jaspersoft：功能強大的商業(yè)智能套件徒溪；

??Jedox Palo：定制的商業(yè)智能平臺忿偷；

??Microsoft：商業(yè)智能軟件和平臺；

??Microstrategy：商業(yè)智能臊泌、移動智能和網(wǎng)絡(luò)應(yīng)用軟件平臺鲤桥；

??Pentaho：商業(yè)智能平臺；

??Qlik：商業(yè)智能和分析平臺渠概；

??Saiku：開源的分析平臺茶凳；

??SpagoBI：開源商業(yè)智能平臺；

??Tableau：商業(yè)智能平臺高氮；

??Zoomdata：大數(shù)據(jù)分析慧妄；

??Jethrodata：交互式大數(shù)據(jù)分析。

數(shù)據(jù)可視化

??Airpal：用于PrestoDB的網(wǎng)頁UI剪芍；

??Arbor：利用網(wǎng)絡(luò)工作者和jQuery的圖形可視化庫塞淹；

??Banana：對存儲在Kibana中Solr. Port的日志和時戳數(shù)據(jù)進行可視化；

??Bokeh：一個功能強大的Python交互式可視化庫罪裹，它針對要展示的現(xiàn)代web瀏覽器饱普，旨在為D3.js風格的新奇的圖形提供優(yōu)雅簡潔的設(shè)計运挫，同時在大規(guī)模數(shù)據(jù)或流數(shù)據(jù)集中，通過高性能交互性來表達這種能力套耕；

??C3：基于D3可重復(fù)使用的圖表庫谁帕；

??CartoDB：開源或免費增值的虛擬主機，用于帶有強大的前端編輯功能和API的地理空間數(shù)據(jù)庫冯袍；

??chartd：只帶Img標簽的反應(yīng)靈敏匈挖、兼容Retina的圖表；

??Chart.js：開源的HTML5圖表可視化效果康愤；

??Chartist.js：另一個開源HTML5圖表可視化效果儡循；

??Crossfilter：JavaScript庫，用于在瀏覽器中探索多元大數(shù)據(jù)集征冷，用Dc.js和D3.js.效果很好择膝；

??Cubism：用于時間序列可視化的JavaScript庫；

??Cytoscape：用于可視化復(fù)雜網(wǎng)絡(luò)的JavaScript庫检激；

??DC.js：維度圖表肴捉，和Crossfilter一起使用，通過D3.js呈現(xiàn)出來叔收，它比較擅長連接圖表/附加的元數(shù)據(jù)齿穗，從而徘徊在D3的事件附近；

??D3：操作文件的JavaScript庫饺律；

??D3.compose：從可重復(fù)使用的圖表和組件構(gòu)成復(fù)雜的缤灵、數(shù)據(jù)驅(qū)動的可視化；

??D3Plus：一組相當強大的可重用的圖表蓝晒，還有D3.js的樣式；

??Echarts：百度企業(yè)場景圖表帖鸦；

??Envisionjs：動態(tài)HTML5可視化芝薇；

??FnordMetric：寫SQL查詢，返回SVG圖表作儿，而不是表洛二；

??Freeboard：針對IOT和其他Web混搭的開源實時儀表盤構(gòu)建；

??Gephi：屢獲殊榮的開源平臺攻锰，可視化和操縱大型圖形和網(wǎng)絡(luò)連接晾嘶，有點像Photoshop，但是針對于圖表娶吞，適用于Windows和Mac OS X垒迂；

??Google Charts：簡單的圖表API；

??Grafana：石墨儀表板前端妒蛇、編輯器和圖形組合器机断；

??Graphite：可擴展的實時圖表楷拳；

??Highcharts：簡單而靈活的圖表API；

??IPython：為交互式計算提供豐富的架構(gòu)吏奸；

??Kibana：可視化日志和時間標記數(shù)據(jù)欢揖；

??Matplotlib：Python繪圖；

??Metricsgraphic.js：建立在D3之上的庫奋蔚，針對時間序列數(shù)據(jù)進行最優(yōu)化她混；

??NVD3：d3.js的圖表組件；

??Peity：漸進式SVG條形圖泊碑，折線和餅圖坤按；

??Plot.ly：易于使用的Web服務(wù)，它允許快速創(chuàng)建從熱圖到直方圖等復(fù)雜的圖表蛾狗，使用圖表Plotly的在線電子表格上傳數(shù)據(jù)進行創(chuàng)建和設(shè)計晋涣；

??Plotly.js：支持plotly的開源JavaScript圖形庫；

??Recline：簡單但功能強大的庫沉桌，純粹利用JavaScript和HTML構(gòu)建數(shù)據(jù)應(yīng)用谢鹊；

??Redash：查詢和可視化數(shù)據(jù)的開源平臺；

??Shiny：針對R的Web應(yīng)用程序框架留凭；

??Sigma.js：JavaScript庫佃扼，專門用于圖形繪制；

??Vega：一個可視化語法蔼夜；

??Zeppelin：一個筆記本式的協(xié)作數(shù)據(jù)分析兼耀；

??Zing Charts：用于大數(shù)據(jù)的JavaScript圖表庫。

想學(xué)習(xí)的同學(xué)歡迎加入大數(shù)據(jù)學(xué)習(xí)qq群：458345782求冷，有大量干貨（零基礎(chǔ)以及進階的經(jīng)典實戰(zhàn)）分享給大家瘤运，并且有清華大學(xué)畢業(yè)的資深大數(shù)據(jù)講師給大家免費授課，給大家分享目前國內(nèi)最完整的大數(shù)據(jù)高端實戰(zhàn)實用學(xué)習(xí)流程體系匠题。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末拯坟，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子韭山，更是在濱河造成了極大的恐慌郁季，老刑警劉巖，帶你破解...
沈念sama閱讀 217,734評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件钱磅，死亡現(xiàn)場離奇詭異梦裂，居然都是意外死亡，警方通過查閱死者的電腦和手機盖淡，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,931評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門年柠，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人禁舷，你說我怎么就攤上這事彪杉∫阃” “怎么了？”我有些...
開封第一講書人閱讀 164,133評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵派近，是天一觀的道長攀唯。經(jīng)常有香客問我，道長渴丸，這世上最難降的妖魔是什么侯嘀？我笑而不...
開封第一講書人閱讀 58,532評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮谱轨，結(jié)果婚禮上戒幔，老公的妹妹穿的比我還像新娘。我一直安慰自己土童，他們只是感情好诗茎，可當我...
茶點故事閱讀 67,585評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著献汗，像睡著了一般敢订。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上罢吃，一...
開封第一講書人閱讀 51,462評論 1贊 302
城市分裂傳說
那天楚午，我揣著相機與錄音，去河邊找鬼尿招。笑死矾柜，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的就谜。我是一名探鬼主播怪蔑，決...
沈念sama閱讀 40,262評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼丧荐！你這毒婦竟也來了饮睬？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,153評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤篮奄，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后割去，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體窟却，經(jīng)...
沈念sama閱讀 45,587評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,792評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年呻逆，在試婚紗的時候發(fā)現(xiàn)自己被綠了夸赫。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,919評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡咖城，死狀恐怖茬腿，靈堂內(nèi)的尸體忽然破棺而出呼奢，到底是詐尸還是另有隱情，我是刑警寧澤切平，帶...
沈念sama閱讀 35,635評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布握础，位于F島的核電站，受9級特大地震影響悴品，放射性物質(zhì)發(fā)生泄漏禀综。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,237評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一苔严、第九天我趴在偏房一處隱蔽的房頂上張望定枷。院中可真熱鬧，春花似錦届氢、人聲如沸欠窒。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,855評論 0贊 22
一樁弒父案退子，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽岖妄。三九已至，卻和暖如春絮供，著一層夾襖步出監(jiān)牢的瞬間衣吠，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,983評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工壤靶，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留缚俏，地道東北人。一個月前我還...
沈念sama閱讀 48,048評論 3贊 370
代替公主和親
正文我出身青樓贮乳，卻偏偏與公主長得像忧换，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子向拆，可洞房花燭夜當晚...
茶點故事閱讀 44,864評論 2贊 354

第一：為什么學(xué)習(xí)大數(shù)據(jù)恶耽，第二：大數(shù)據(jù)學(xué)習(xí)資源詳細解讀

第一：為什么學(xué)習(xí)大數(shù)據(jù)，第二：大數(shù)據(jù)學(xué)習(xí)資源詳細解讀

第一：為什么要學(xué)習(xí)大數(shù)據(jù)

第二：大數(shù)據(jù)學(xué)習(xí)資源詳細解讀

推薦閱讀更多精彩內(nèi)容