Java程序員使用哪些大數(shù)據(jù)開發(fā)工具业栅?-IT168 技術(shù)開發(fā)專區(qū)
http://tech.it168.com/a2016/0218/2484/000002484851.shtml
【IT168 評(píng)論】這是作者在另一個(gè)帖子中發(fā)布的一項(xiàng)近期調(diào)查結(jié)果,調(diào)查為作者詢問一些Java程序員涣狗,其在12個(gè)月內(nèi)使用了什么框架開發(fā)工具袜匿。本次調(diào)查中覆蓋了大數(shù)據(jù)工具更啄。
以下是調(diào)查所覆蓋的主題:
1、語言
2居灯、Web框架
3祭务、應(yīng)用服務(wù)器
4、SQL數(shù)據(jù)訪問工具
5怪嫌、SQL數(shù)據(jù)庫
6待牵、大數(shù)據(jù)
7、構(gòu)建工具
8喇勋、云提供商
今天讓我們來看看大數(shù)據(jù)缨该。
根據(jù)維基百科桨武,大數(shù)據(jù)是一個(gè)廣義的術(shù)語旷偿,所包含的的內(nèi)容十分龐大且復(fù)雜届宠,以至于傳統(tǒng)的數(shù)據(jù)處理應(yīng)用程序根本不足以應(yīng)對(duì)求豫。
在許多情況下,使用SQL數(shù)據(jù)庫用于存儲(chǔ)/檢索數(shù)據(jù)已經(jīng)足夠了膨更。但在一些其他情況下妙真,例如數(shù)據(jù)庫規(guī)模不夠,或是還有更好的工具荚守,這一切都取決于使用情況珍德。
現(xiàn)在讓我們來討論一下不同的存儲(chǔ)/處理數(shù)據(jù)所用的非SQL工具——NoSQL數(shù)據(jù)庫、內(nèi)存緩存矗漾、全文搜索引擎锈候、實(shí)時(shí)流媒體、圖形數(shù)據(jù)庫敞贡,等等泵琳。
大數(shù)據(jù)-調(diào)查結(jié)果
MongoDB—— 一種流行的,跨平臺(tái)的面向文檔的數(shù)據(jù)庫誊役。
Elasticsearch——為云構(gòu)建的分布式REST內(nèi)置搜索引擎获列。
Cassandra——開源的分布式數(shù)據(jù)庫管理系統(tǒng),最初在Facebook開發(fā)和設(shè)計(jì)蛔垢,用來處理橫跨多個(gè)商用服務(wù)器的海量數(shù)據(jù)击孩,提供了無單點(diǎn)故障的高度可用性。
Redis—— 開源的(BSD許可)鹏漆,內(nèi)存數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)溯壶,作為數(shù)據(jù)庫、緩存和消息代理使用甫男。
Hazelcast——開源,基于Java的內(nèi)存數(shù)據(jù)網(wǎng)格验烧。
EHCache——一種被廣泛使用的開源Java分布式緩存板驳,用于通用緩存、Java EE和輕量級(jí)容器碍拆。Ehcache相關(guān)介紹
Hadoop——以Java編寫的一個(gè)開源軟件框架若治,用于分布式存儲(chǔ)和對(duì)在計(jì)算機(jī)集群上的超大型數(shù)據(jù)集的分布式處理。
Solr——開源的企業(yè)搜索平臺(tái)感混,Java編寫端幼,來自Apache Lucene項(xiàng)目。
Spark——Apache Software Foundation中最活躍的項(xiàng)目弧满,一個(gè)開源的集群計(jì)算框架婆跑。
Memcached—— 通用的分布式內(nèi)存緩存系統(tǒng)。
Apache Hive——提供了Hadoop之上類似于SQL的層庭呜。
Apache Kafka—— 高通量滑进、分布式的發(fā)布-訂閱式消息系統(tǒng)犀忱,最初開發(fā)在LinkedIn上。Windows上脫離Cygwin運(yùn)行Apache Kafka
Akka—— 工具包扶关,運(yùn)行時(shí)阴汇,用于在JVM上構(gòu)建高度并行的、分布式的节槐、有彈性的消息驅(qū)動(dòng)的應(yīng)用程序搀庶。
HBase—— 一個(gè)開源的,非關(guān)系型的铜异,分布式數(shù)據(jù)庫哥倔,在谷歌的BigTable后建模,用Java編寫熙掺,并運(yùn)行在HDFS上未斑。
Neo4j——用Java編寫的開源圖形數(shù)據(jù)庫。
CouchBase——一個(gè)開源的币绩、面向文檔的分布式NoSQL數(shù)據(jù)庫蜡秽,特別為了交互式應(yīng)用而優(yōu)化。
Apache Storm——開源的分布式實(shí)時(shí)計(jì)算系統(tǒng)缆镣。
CouchDB——使用JSON來存儲(chǔ)數(shù)據(jù)的面向文檔的開源NoSQL數(shù)據(jù)庫芽突。
Oracle Coherence——內(nèi)存的數(shù)據(jù)網(wǎng)格解決方案,通過提供快速訪問常用數(shù)據(jù)的渠道董瞻,使得企業(yè)可預(yù)測(cè)地?cái)U(kuò)展關(guān)鍵任務(wù)應(yīng)用程序寞蚌。
Titan——可擴(kuò)展的圖形數(shù)據(jù)庫,優(yōu)化的目的在于存儲(chǔ)和查詢包含數(shù)千億頂點(diǎn)和邊的圖形钠糊,分布在多機(jī)集群挟秤。
Amazon DynamoDB——快速、靈活抄伍、全面管理的NoSQL數(shù)據(jù)庫服務(wù)艘刚,用于在任何規(guī)模需要一致的、個(gè)位數(shù)毫秒延遲的所有應(yīng)用程序截珍。
Amazon Kinesis——亞馬遜上的流數(shù)據(jù)實(shí)時(shí)平臺(tái)攀甚。
Datomic——用Clojure寫的分布式數(shù)據(jù)庫,完全事務(wù)式岗喉,支持云秋度。
原文鏈接:https://dzone.com/articles/big-data-java-survey-result