1、 Talend Open Studio
是第一家針對(duì)的數(shù)據(jù)集成工具市場(chǎng)的ETL(數(shù)據(jù)的提取Extract古话、傳輸Transform嫁怀、載入Load)開(kāi)源軟件供應(yīng)商刃唐。Talend的下載量已超過(guò)200萬(wàn)人次,其開(kāi)源軟件提供了數(shù)據(jù)整合功能减宣。其用戶(hù)包括美國(guó)國(guó)際集團(tuán)(AIG)盐须、康卡斯特、電子港灣蚪腋、通用電氣丰歌、三星、Ticketmaster和韋里遜等企業(yè)組織屉凯。
2立帖、DYSON
探碼科技自主研發(fā)的DYSON智能分析系統(tǒng)悠砚,可以完整的實(shí)現(xiàn)大數(shù)據(jù)的采集晓勇、分析、處理灌旧。DYSON智能分析系統(tǒng)專(zhuān)業(yè)針對(duì)互聯(lián)網(wǎng)數(shù)據(jù)抓取绑咱、處理、分析枢泰,挖掘描融。可以靈活迅速地抓取網(wǎng)頁(yè)上散亂分布的信息衡蚂,并通過(guò)強(qiáng)大的處理功能窿克,準(zhǔn)確挖掘出所需數(shù)據(jù)骏庸,是目前使用人數(shù)最多的網(wǎng)頁(yè)采集工具.
3、YARN
一種新的Hadoop資源管理器年叮,它是一個(gè)通用資源管理系統(tǒng)具被,可為上層應(yīng)用提供統(tǒng)一的資源管理和調(diào)度,解決了舊MapReduce框架的性能瓶頸只损。它的基本思想是把資源管理和作業(yè)調(diào)度/監(jiān)控的功能分割到單獨(dú)的守護(hù)進(jìn)程一姿。
4、Mesos
由加州大學(xué)伯克利分校的AMPLab首先開(kāi)發(fā)的一款開(kāi)源群集管理軟件跃惫,支持Hadoop叮叹、ElasticSearch、Spark辈挂、Storm 和Kafka等架構(gòu)衬横。對(duì)數(shù)據(jù)中心而言它就像一個(gè)單一的資源池,從物理或虛擬機(jī)器中抽離了CPU终蒂,內(nèi)存蜂林,存儲(chǔ)以及其它計(jì)算資源, 很容易建立和有效運(yùn)行具備容錯(cuò)性和彈性的分布式系統(tǒng)拇泣。
5噪叙、Datale
由探碼科技研發(fā)的一款基于Hadoop的大數(shù)據(jù)平臺(tái)開(kāi)發(fā)套件,RAI大數(shù)據(jù)應(yīng)用平臺(tái)架構(gòu)霉翔。
6睁蕾、 Ambari
作為Hadoop生態(tài)系統(tǒng)的一部分,提供了基于Web的直觀(guān)界面债朵,可用于配置子眶、管理和監(jiān)控Hadoop集群。目前已支持大多數(shù)Hadoop組件序芦,包括HDFS臭杰、MapReduce、Hive谚中、Pig渴杆、 Hbase、Zookeper宪塔、Sqoop和Hcatalog等磁奖。
7、ZooKeeper
一個(gè)分布式的應(yīng)用程序協(xié)調(diào)服務(wù)某筐,是Hadoop和Hbase的重要組件比搭。它是一個(gè)為分布式應(yīng)用提供一致性服務(wù)的工具,讓Hadoop集群里面的節(jié)點(diǎn)可以彼此協(xié)調(diào)南誊。ZooKeeper現(xiàn)在已經(jīng)成為了 Apache的頂級(jí)項(xiàng)目身诺,為分布式系統(tǒng)提供了高效可靠且易于使用的協(xié)同服務(wù)蔽莱。
8、Thrift
在2007年facebook提交Apache基金會(huì)將Thrift作為一個(gè)開(kāi)源項(xiàng)目戚长,對(duì)于當(dāng)時(shí)的facebook來(lái)說(shuō)創(chuàng)造thrift是為了解決facebook系統(tǒng)中各系統(tǒng)間大數(shù)據(jù)量的傳輸通信以及系統(tǒng)之間語(yǔ)言環(huán)境不同需要跨平臺(tái)的特性。
9怠苔、Chukwa
監(jiān)測(cè)大型分布式系統(tǒng)的一個(gè)開(kāi)源數(shù)據(jù)采集系統(tǒng)同廉,建立在HDFS/MapReduce框架之上并繼承了Hadoop的可伸縮性和可靠性,可以收集來(lái)自大型分布式系統(tǒng)的數(shù)據(jù)柑司,用于監(jiān)控迫肖。它還包括靈活而強(qiáng)大的顯示工具用于監(jiān)控、分析結(jié)果攒驰。
10蟆湖、Lustre
一個(gè)大規(guī)模的、安全可靠的玻粪、具備高可用性的集群文件系統(tǒng)隅津,它是由SUN公司開(kāi)發(fā)和維護(hù)的。該項(xiàng)目主要的目的就是開(kāi)發(fā)下一代的集群文件系統(tǒng)劲室,目前可以支持超過(guò)10000個(gè)節(jié)點(diǎn)伦仍,數(shù)以PB的數(shù)據(jù)存儲(chǔ)量。
11很洋、HDFS
Hadoop Distributed File System充蓝,簡(jiǎn)稱(chēng)HDFS,是一個(gè)分布式文件系統(tǒng)喉磁。HDFS是一個(gè)高度容錯(cuò)性的系統(tǒng)谓苟,適合部署在廉價(jià)的機(jī)器上。HDFS能提供高吞吐量的數(shù)據(jù)訪(fǎng)問(wèn)协怒,非常適合大規(guī)模數(shù)據(jù)集上的應(yīng)用涝焙。
12、GlusterFS
一個(gè)集群的文件系統(tǒng)斤讥,支持PB級(jí)的數(shù)據(jù)量纱皆。GlusterFS 通過(guò)RDMA和TCP/IP方式將分布到不同服務(wù)器上的存儲(chǔ)空間匯集成一個(gè)大的網(wǎng)絡(luò)化并行文件系統(tǒng)。
13芭商、Alluxio
前身是Tachyon派草,是以?xún)?nèi)存為中心的分布式文件系統(tǒng),擁有高性能和容錯(cuò)能力铛楣,能夠?yàn)榧嚎蚣埽ㄈ鏢park近迁、MapReduce)提供可靠的內(nèi)存級(jí)速度的文件共享服務(wù)。
14簸州、Ceph
新一代開(kāi)源分布式文件系統(tǒng)鉴竭,主要目標(biāo)是設(shè)計(jì)成基于POSIX的沒(méi)有單點(diǎn)故障的分布式文件系統(tǒng)歧譬,提高數(shù)據(jù)的容錯(cuò)性并實(shí)現(xiàn)無(wú)縫的復(fù)制埠褪。
15钳枕、PVFS
一個(gè)高性能、開(kāi)源的并行文件系統(tǒng)绣檬,主要用于并行計(jì)算環(huán)境中的應(yīng)用璧眠。PVFS特別為超大數(shù)量的客戶(hù)端和服務(wù)器端所設(shè)計(jì)缩焦,它的模塊化設(shè)計(jì)結(jié)構(gòu)可輕松的添加新的硬件和算法支持。
16责静、QFS
Quantcast File System (QFS) 是一個(gè)高性能袁滥、容錯(cuò)好、分布式的文件系統(tǒng)灾螃,用于開(kāi)發(fā)支持 MapReduce處理或者需要順序讀寫(xiě)大文件的應(yīng)用题翻。
17、 Logstash
一個(gè)應(yīng)用程序日志腰鬼、事件的傳輸嵌赠、處理、管理和搜索的平臺(tái)垃喊』眨可以用它來(lái)統(tǒng)一對(duì)應(yīng)用程序日志進(jìn)行收集管理,提供了Web接口用于查詢(xún)和統(tǒng)計(jì)本谜。
18初家、Scribe
Scribe是Facebook開(kāi)源的日志收集系統(tǒng),它能夠從各種日志源上收集日志乌助,存儲(chǔ)到一個(gè)中央存儲(chǔ)系統(tǒng)(可以是NFS溜在,分布式文件系統(tǒng)等)上,以便于進(jìn)行集中統(tǒng)計(jì)分析處理他托。
19掖肋、Flume
Cloudera提供的一個(gè)高可用的、高可靠的赏参、分布式的海量日志采集志笼、聚合和傳輸?shù)南到y(tǒng)。Flume支持在日志系統(tǒng)中定制各類(lèi)數(shù)據(jù)發(fā)送方把篓,用于收集數(shù)據(jù)纫溃。同時(shí),F(xiàn)lume支持對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單處理韧掩,并寫(xiě)入各種數(shù)據(jù)接受方(可定制)紊浩。
20、RabbitMQ
一個(gè)受歡迎的消息代理系統(tǒng),通常用于應(yīng)用程序之間或者程序的不同組件之間通過(guò)消息來(lái)進(jìn)行集成坊谁。RabbitMQ提供可靠的應(yīng)用消息發(fā)送费彼、易于使用、支持所有主流操作系統(tǒng)口芍、支持大量開(kāi)發(fā)者平臺(tái)箍铲。
21、ActiveMQ
Apache出品鬓椭,號(hào)稱(chēng)“最流行的虹钮,最強(qiáng)大”的開(kāi)源消息集成模式服務(wù)器。ActiveMQ特點(diǎn)是速度快膘融,支持多種跨語(yǔ)言的客戶(hù)端和協(xié)議,其企業(yè)集成模式和許多先進(jìn)的功能易于使用祭玉,是一個(gè)完全支持JMS1.1和J2EE 1.4規(guī)范的JMS Provider實(shí)現(xiàn)氧映。
22、Kafka
一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng)脱货,它可以處理消費(fèi)者規(guī)模網(wǎng)站中的所有動(dòng)作流數(shù)據(jù)岛都,目前已成為大數(shù)據(jù)系統(tǒng)在異步和分布式消息之間的最佳選擇。
23振峻、Spark
一個(gè)高速臼疫、通用大數(shù)據(jù)計(jì)算處理引擎。擁有Hadoop MapReduce所具有的優(yōu)點(diǎn)扣孟,但不同的是Job的中間輸出結(jié)果可以保存在內(nèi)存中烫堤,從而不再需要讀寫(xiě)HDFS,因此Spark能更好地適用于數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等需要迭代的MapReduce的算法凤价。它可以與Hadoop和Apache Mesos一起使用鸽斟,也可以獨(dú)立使用。
24利诺、Kinesis
可以構(gòu)建用于處理或分析流數(shù)據(jù)的自定義應(yīng)用程序富蓄,來(lái)滿(mǎn)足特定需求。Amazon Kinesis Streams 每小時(shí)可從數(shù)十萬(wàn)種來(lái)源中連續(xù)捕獲和存儲(chǔ)數(shù)TB數(shù)據(jù)慢逾,如網(wǎng)站點(diǎn)擊流立倍、財(cái)務(wù)交易、社交媒體源侣滩、IT日志和定位追蹤事件口注。
25、 Hadoop
一個(gè)開(kāi)源框架胜卤,適合運(yùn)行在通用硬件疆导,支持用簡(jiǎn)單程序模型分布式處理跨集群大數(shù)據(jù)集,支持從單一服務(wù)器到上千服務(wù)器的水平scale up。Apache的Hadoop項(xiàng)目已幾乎與大數(shù)據(jù)劃上了等號(hào)澈段,它不斷壯大起來(lái)悠菜,已成為一個(gè)完整的生態(tài)系統(tǒng),擁有眾多開(kāi)源工具面向高度擴(kuò)展的分布式計(jì)算败富。高效悔醋、可靠、可伸縮兽叮,能夠?yàn)槟愕臄?shù)據(jù)存儲(chǔ)項(xiàng)目提供所需的YARN芬骄、HDFS和基礎(chǔ)架構(gòu),并且運(yùn)行主要的大數(shù)據(jù)服務(wù)和應(yīng)用程序鹦聪。
26账阻、Spark Streaming
實(shí)現(xiàn)微批處理,目標(biāo)是很方便的建立可擴(kuò)展泽本、容錯(cuò)的流應(yīng)用淘太,支持Java、Scala和Python规丽,和Spark無(wú)縫集成蒲牧。Spark Streaming可以讀取數(shù)據(jù)HDFS,F(xiàn)lume赌莺,Kafka冰抢,Twitter和ZeroMQ,也可以讀取自定義數(shù)據(jù)艘狭。
27挎扰、Trident
是對(duì)Storm的更高一層的抽象,除了提供一套簡(jiǎn)單易用的流數(shù)據(jù)處理API之外巢音,它以batch(一組tuples)為單位進(jìn)行處理鼓鲁,這樣一來(lái),可以使得一些處理更簡(jiǎn)單和高效港谊。
28骇吭、Flink
于今年躋身Apache頂級(jí)開(kāi)源項(xiàng)目,與HDFS完全兼容歧寺。Flink提供了基于Java和Scala的API燥狰,是一個(gè)高效、分布式的通用大數(shù)據(jù)分析引擎斜筐。更主要的是龙致,F(xiàn)link支持增量迭代計(jì)算,使得系統(tǒng)可以快速地處理數(shù)據(jù)密集型顷链、迭代的任務(wù)目代。
29、Samza
出自于LinkedIn,構(gòu)建在Kafka之上的分布式流計(jì)算框架榛了,是Apache頂級(jí)開(kāi)源項(xiàng)目在讶。可直接利用Kafka和Hadoop YARN提供容錯(cuò)霜大、進(jìn)程隔離以及安全构哺、資源管理。
30战坤、Storm
Storm是Twitter開(kāi)源的一個(gè)類(lèi)似于Hadoop的實(shí)時(shí)數(shù)據(jù)處理框架曙强。編程模型簡(jiǎn)單,顯著地降低了實(shí)時(shí)處理的難度途茫,也是當(dāng)下最人氣的流計(jì)算框架之一碟嘴。與其他計(jì)算框架相比,Storm最大的優(yōu)點(diǎn)是毫秒級(jí)低延時(shí)囊卜。
31臀防、Yahoo S4 (Simple Scalable Streaming System)
是一個(gè)分布式流計(jì)算平臺(tái),具備通用边败、分布式、可擴(kuò)展的捎废、容錯(cuò)笑窜、可插拔等特點(diǎn),程序員可以很容易地開(kāi)發(fā)處理連續(xù)無(wú)邊界數(shù)據(jù)流(continuous unbounded streams of data)的應(yīng)用登疗。它的目標(biāo)是填補(bǔ)復(fù)雜專(zhuān)有系統(tǒng)和面向批處理開(kāi)源產(chǎn)品之間的空白排截,并提供高性能計(jì)算平臺(tái)來(lái)解決并發(fā)處理系統(tǒng)的復(fù)雜度。
32辐益、HaLoop
是一個(gè)Hadoop MapReduce框架的修改版本断傲,其目標(biāo)是為了高效支持 迭代,遞歸數(shù)據(jù) 分析任務(wù)智政,如PageRank认罩,HITs,K-means续捂,sssp等垦垂。
33、Presto
是一個(gè)開(kāi)源的分布式SQL查詢(xún)引擎牙瓢,適用于交互式分析查詢(xún)劫拗,可對(duì)250PB以上的數(shù)據(jù)進(jìn)行快速地交互式分析。Presto的設(shè)計(jì)和編寫(xiě)是為了解決像Facebook這樣規(guī)模的商業(yè)數(shù)據(jù)倉(cāng)庫(kù)的交互式分析和處理速度的問(wèn)題矾克。Facebook稱(chēng)Presto的性能比諸如Hive和MapReduce要好上10倍有多页慷。
34、 Drill
于2012年8月份由Apache推出,讓用戶(hù)可以使用基于SQL的查詢(xún)酒繁,查詢(xún)Hadoop滓彰、NoSQL數(shù)據(jù)庫(kù)和云存儲(chǔ)服務(wù)。它能夠運(yùn)行在上千個(gè)節(jié)點(diǎn)的服務(wù)器集群上欲逃,且能在幾秒內(nèi)處理PB級(jí)或者萬(wàn)億條的數(shù)據(jù)記錄找蜜。它可用于數(shù)據(jù)挖掘和即席查詢(xún),支持一系列廣泛的數(shù)據(jù)庫(kù)稳析,包括HBase洗做、MongoDB、MapR-DB彰居、HDFS诚纸、MapR-FS、亞馬遜S3陈惰、Azure Blob Storage畦徘、谷歌云存儲(chǔ)和Swift。
35抬闯、Phoenix
是一個(gè)Java中間層井辆,可以讓開(kāi)發(fā)者在Apache HBase上執(zhí)行SQL查詢(xún)。Phoenix完全使用Java編寫(xiě)溶握,并且提供了一個(gè)客戶(hù)端可嵌入的JDBC驅(qū)動(dòng)杯缺。Phoenix查詢(xún)引擎會(huì)將SQL查詢(xún)轉(zhuǎn)換為一個(gè)或多個(gè)HBase scan,并編排執(zhí)行以生成標(biāo)準(zhǔn)的JDBC結(jié)果集睡榆。
36萍肆、Pig
是一種編程語(yǔ)言,它簡(jiǎn)化了Hadoop常見(jiàn)的工作任務(wù)胀屿。Pig可加載數(shù)據(jù)塘揣、轉(zhuǎn)換數(shù)據(jù)以及存儲(chǔ)最終結(jié)果。Pig最大的作用就是為MapReduce框架實(shí)現(xiàn)了一套shell腳本 宿崭,類(lèi)似我們通常熟悉的SQL語(yǔ)句亲铡。
37、Hive
是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具葡兑,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫(kù)表奴愉,并提供簡(jiǎn)單的sql查詢(xún)功能,可以將sql語(yǔ)句轉(zhuǎn)換為MapReduce任務(wù)進(jìn)行運(yùn)行铁孵。 其優(yōu)點(diǎn)是學(xué)習(xí)成本低锭硼,可以通過(guò)類(lèi)SQL語(yǔ)句快速實(shí)現(xiàn)簡(jiǎn)單的MapReduce統(tǒng)計(jì),不必開(kāi)發(fā)專(zhuān)門(mén)的MapReduce應(yīng)用蜕劝,十分適合數(shù)據(jù)倉(cāng)庫(kù)的統(tǒng)計(jì)分析檀头。
38轰异、SparkSQL
前身是Shark,SparkSQL拋棄原有Shark的代碼并汲取了一些優(yōu)點(diǎn)暑始,如內(nèi)存列存儲(chǔ)(In-Memory Columnar Storage)搭独、Hive兼容性等。由于擺脫了對(duì)Hive的依賴(lài)性廊镜,SparkSQL無(wú)論在數(shù)據(jù)兼容牙肝、性能優(yōu)化、組件擴(kuò)展方面都得到了極大的方便嗤朴。
39配椭、Stinger
原來(lái)叫Tez,是下一代Hive雹姊,由Hortonworks主導(dǎo)開(kāi)發(fā)股缸,運(yùn)行在YARN上的DAG計(jì)算框架。某些測(cè)試下吱雏,Stinger能提升10倍左右的性能敦姻,同時(shí)會(huì)讓Hive支持更多的SQL。
40歧杏、Tajo
目的是在HDFS之上構(gòu)建一個(gè)可靠的镰惦、支持關(guān)系型數(shù)據(jù)的分布式數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),它的重點(diǎn)是提供低延遲犬绒、可擴(kuò)展的ad-hoc查詢(xún)和在線(xiàn)數(shù)據(jù)聚集旺入,以及為更傳統(tǒng)的ETL提供工具。
41懂更、Impala
Cloudera 聲稱(chēng),基于SQL的Impala數(shù)據(jù)庫(kù)是“面向Apache Hadoop的領(lǐng)先的開(kāi)源分析數(shù)據(jù)庫(kù)”急膀。它可以作為一款獨(dú)立產(chǎn)品來(lái)下載沮协,又是Cloudera的商業(yè)大數(shù)據(jù)產(chǎn)品的一部分。Cloudera Impala 可以直接為存儲(chǔ)在HDFS或HBase中的Hadoop數(shù)據(jù)提供快速卓嫂、交互式的SQL查詢(xún)慷暂。
42、 Elasticsearch
是一個(gè)基于Lucene的搜索服務(wù)器晨雳。它提供了一個(gè)分布式行瑞、支持多用戶(hù)的全文搜索引擎,基于RESTful web接口餐禁。Elasticsearch是用Java開(kāi)發(fā)的血久,并作為Apache許可條款下的開(kāi)放源碼發(fā)布,是當(dāng)前流行的企業(yè)級(jí)搜索引擎帮非。設(shè)計(jì)用于云計(jì)算中氧吐,能夠達(dá)到實(shí)時(shí)搜索讹蘑、穩(wěn)定、可靠筑舅、快速座慰、安裝使用方便。
43翠拣、Solr
基于Apache Lucene版仔,是一種高度可靠、高度擴(kuò)展的企業(yè)搜索平臺(tái)误墓。知名用戶(hù)包括eHarmony蛮粮、西爾斯、StubHub优烧、Zappos蝉揍、百思買(mǎi)、AT&T畦娄、Instagram又沾、Netflix、彭博社和Travelocity熙卡。
44杖刷、Shark
即Hive on Spark,本質(zhì)上是通過(guò)Hive的HQL解析驳癌,把HQL翻譯成Spark上的RDD操作滑燃,然后通過(guò)Hive的metadata獲取數(shù)據(jù)庫(kù)里的表信息,實(shí)際HDFS上的數(shù)據(jù)和文件颓鲜,會(huì)由Shark獲取并放到Spark上運(yùn)算表窘。Shark的特點(diǎn)就是快,完全兼容Hive甜滨,且可以在shell模式下使用rdd2sql()這樣的API乐严,把HQL得到的結(jié)果集,繼續(xù)在scala環(huán)境下運(yùn)算衣摩,支持自己編寫(xiě)簡(jiǎn)單的機(jī)器學(xué)習(xí)或簡(jiǎn)單分析處理函數(shù)昂验,對(duì)HQL結(jié)果進(jìn)一步分析計(jì)算。
45艾扮、Lucene
基于Java的Lucene可以非常迅速地執(zhí)行全文搜索既琴。據(jù)官方網(wǎng)站聲稱(chēng),它在現(xiàn)代硬件上每小時(shí)能夠檢索超過(guò)150GB的數(shù)據(jù)泡嘴,它擁有強(qiáng)大而高效的搜索算法甫恩。
46、Terracotta
聲稱(chēng)其BigMemory技術(shù)是“世界上首屈一指的內(nèi)存中數(shù)據(jù)管理平臺(tái)”酌予,支持簡(jiǎn)單填物、可擴(kuò)展纹腌、實(shí)時(shí)消息,聲稱(chēng)在190個(gè)國(guó)家擁有210萬(wàn)開(kāi)發(fā)人員滞磺,全球1000家企業(yè)部署了其軟件升薯。
47、 Ignite
是一種高性能击困、整合式涎劈、分布式的內(nèi)存中平臺(tái),可用于對(duì)大規(guī)模數(shù)據(jù)集執(zhí)行實(shí)時(shí)計(jì)算和處理阅茶,速度比傳統(tǒng)的基于磁盤(pán)的技術(shù)或閃存技術(shù)高出好幾個(gè)數(shù)量級(jí)蛛枚。該平臺(tái)包括數(shù)據(jù)網(wǎng)格、計(jì)算網(wǎng)格脸哀、服務(wù)網(wǎng)格蹦浦、流媒體、Hadoop加速撞蜂、高級(jí)集群盲镶、文件系統(tǒng)、消息傳遞蝌诡、事件和數(shù)據(jù)結(jié)構(gòu)等功能溉贿。
48、GemFire
Pivotal宣布它將開(kāi)放其大數(shù)據(jù)套件關(guān)鍵組件的源代碼浦旱,其中包括GemFire內(nèi)存中NoSQL數(shù)據(jù)庫(kù)宇色。它已向Apache軟件基金會(huì)遞交了一項(xiàng)提案,以便在“Geode”的名下管理GemFire數(shù)據(jù)庫(kù)的核心引擎颁湖。
49宣蠕、 GridGain
由Apache Ignite驅(qū)動(dòng)的GridGrain提供內(nèi)存中數(shù)據(jù)結(jié)構(gòu),用于迅速處理大數(shù)據(jù)甥捺,還提供基于同一技術(shù)的Hadoop加速器抢蚀。
50、MongoDB
是一個(gè)基于分布式文件存儲(chǔ)的數(shù)據(jù)庫(kù)涎永。由C++語(yǔ)言編寫(xiě)思币。旨在為web應(yīng)用提供可擴(kuò)展的高性能數(shù)據(jù)存儲(chǔ)解決方案鹿响。介于關(guān)系數(shù)據(jù)庫(kù)和非關(guān)系數(shù)據(jù)庫(kù)之間的開(kāi)源產(chǎn)品羡微,是非關(guān)系數(shù)據(jù)庫(kù)當(dāng)中功能最豐富、最像關(guān)系數(shù)據(jù)庫(kù)的產(chǎn)品惶我。
51妈倔、Redis
是一個(gè)高性能的key-value存儲(chǔ)系統(tǒng),和Memcached類(lèi)似绸贡,它支持存儲(chǔ)的value類(lèi)型相對(duì)更多盯蝴,包括string(字符串)毅哗、list(鏈表)、set(集合)和zset(有序集合)捧挺。Redis的出現(xiàn)虑绵,很大程度補(bǔ)償了memcached這類(lèi)key/value存儲(chǔ)的不足,在部分場(chǎng)合可以對(duì)關(guān)系數(shù)據(jù)庫(kù)起到很好的補(bǔ)充作用闽烙。
52翅睛、HDFS
Hadoop分布式文件系統(tǒng)(HDFS)被設(shè)計(jì)成適合運(yùn)行在通用硬件(commodity hardware)上的分布式文件系統(tǒng)。它和現(xiàn)有的分布式文件系統(tǒng)有很多共同點(diǎn)黑竞。HDFS是一個(gè)高度容錯(cuò)性的系統(tǒng)捕发,適合部署在廉價(jià)的機(jī)器上。HDFS能提供高吞吐量的數(shù)據(jù)訪(fǎng)問(wèn)很魂,非常適合大規(guī)模數(shù)據(jù)集上的應(yīng)用扎酷。
53、HBase
是Hadoop的數(shù)據(jù)庫(kù)遏匆,一個(gè)分布式法挨、可擴(kuò)展、大數(shù)據(jù)的存儲(chǔ)拉岁。是為有數(shù)十億行和數(shù)百萬(wàn)列的超大表設(shè)計(jì)的坷剧,是一種分布式數(shù)據(jù)庫(kù),可以對(duì)大數(shù)據(jù)進(jìn)行隨機(jī)性的實(shí)時(shí)讀取/寫(xiě)入訪(fǎng)問(wèn)喊暖。提供類(lèi)似谷歌Bigtable的存儲(chǔ)能力惫企,基于Hadoop和Hadoop分布式文件系統(tǒng)(HDFS)而建晃虫。
54折柠、Neo4j
是一個(gè)高性能的髓梅,NOSQL圖形數(shù)據(jù)庫(kù)禀梳,它將結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在網(wǎng)絡(luò)上而不是表中蕉陋。自稱(chēng)“世界上第一個(gè)和最好的圖形數(shù)據(jù)庫(kù)”蚤蔓,“速度最快哼御、擴(kuò)展性最佳的原生圖形數(shù)據(jù)庫(kù)”改艇,“最大和最有活力的社區(qū)”胖替。用戶(hù)包括Telenor研儒、Wazoku、ebay独令、必能寶(Pitney Bowes)端朵、MigRaven、思樂(lè)(Schleich)和Glowbl等燃箭。
55冲呢、 Vertica
基于列存儲(chǔ)高性能和高可用性設(shè)計(jì)的數(shù)據(jù)庫(kù)方案,由于對(duì)大規(guī)模并行處理(MPP)技術(shù)的支持招狸,提供細(xì)粒度敬拓、可伸縮性和可用性的優(yōu)勢(shì)邻薯。每個(gè)節(jié)點(diǎn)完全獨(dú)立運(yùn)作,完全無(wú)共享架構(gòu)乘凸,降低了共享資源的系統(tǒng)競(jìng)爭(zhēng)厕诡。
56、Cassandra
是一個(gè)混合型的非關(guān)系的數(shù)據(jù)庫(kù)营勤,類(lèi)似于Google的BigTable木人,其主要功能比Dynamo (分布式的Key-Value存儲(chǔ)系統(tǒng))更豐富。這種NoSQL數(shù)據(jù)庫(kù)最初由Facebook開(kāi)發(fā)冀偶,現(xiàn)已被1500多家企業(yè)組織使用醒第,包括蘋(píng)果、歐洲原子核研究組織(CERN)进鸠、康卡斯特稠曼、電子港灣、GitHub客年、GoDaddy霞幅、Hulu、Instagram量瓜、Intuit司恳、Netfilx、Reddit及其他機(jī)構(gòu)绍傲。
57扔傅、CouchDB
號(hào)稱(chēng)是“一款完全擁抱互聯(lián)網(wǎng)的數(shù)據(jù)庫(kù)”,它將數(shù)據(jù)存儲(chǔ)在JSON文檔中烫饼,這種文檔可以通過(guò)Web瀏覽器來(lái)查詢(xún)猎塞,并且用JavaScript來(lái)處理。它易于使用杠纵,在分布式上網(wǎng)絡(luò)上具有高可用性和高擴(kuò)展性荠耽。
58、Dynamo
是一個(gè)經(jīng)典的分布式Key-Value 存儲(chǔ)系統(tǒng)比藻,具備去中心化铝量、高可用性、高擴(kuò)展性的特點(diǎn)银亲。Dynamo在Amazon中得到了成功的應(yīng)用慢叨,能夠跨數(shù)據(jù)中心部署于上萬(wàn)個(gè)結(jié)點(diǎn)上提供服務(wù),它的設(shè)計(jì)思想也被后續(xù)的許多分布式系統(tǒng)借鑒群凶。
59插爹、 Amazon SimpleDB
是一個(gè)用Erlang編寫(xiě)的高可用的NoSQL數(shù)據(jù)存儲(chǔ)哄辣,能夠減輕數(shù)據(jù)庫(kù)管理工作请梢,開(kāi)發(fā)人員只需通過(guò)Web服務(wù)請(qǐng)求執(zhí)行數(shù)據(jù)項(xiàng)的存儲(chǔ)和查詢(xún)赠尾,Amazon SimpleDB 將負(fù)責(zé)余下的工作。作為一項(xiàng)Web 服務(wù)毅弧,像Amazon的EC2和S3一樣气嫁,是Amazon網(wǎng)絡(luò)服務(wù)的一部分。
60够坐、 Hypertable
是一個(gè)開(kāi)源寸宵、高性能、可伸縮的數(shù)據(jù)庫(kù)元咙,它采用與Google的Bigtable相似的模型梯影。它與Hadoop兼容,性能超高庶香,其用戶(hù)包括電子港灣甲棍、百度、高朋赶掖、Yelp及另外許多互聯(lián)網(wǎng)公司感猛。
61、Kettle
這是一個(gè)ETL工具集奢赂,它允許你管理來(lái)自不同數(shù)據(jù)庫(kù)的數(shù)據(jù)陪白,通過(guò)提供一個(gè)圖形化的用戶(hù)環(huán)境來(lái)描述你想做什么,而不是你想怎么做膳灶。作為Pentaho的一個(gè)重要組成部分咱士,現(xiàn)在在國(guó)內(nèi)項(xiàng)目應(yīng)用上逐漸增多。
62轧钓、 Kylin
是一個(gè)開(kāi)源的分布式分析引擎司致,提供了基于Hadoop的超大型數(shù)據(jù)集(TB/PB級(jí)別)的SQL接口以及多維度的OLAP分布式聯(lián)機(jī)分析。最初由eBay開(kāi)發(fā)并貢獻(xiàn)至開(kāi)源社區(qū)聋迎。它能在亞秒內(nèi)查詢(xún)巨大的Hive表脂矫。
63、 Kibana
是一個(gè)使用Apache 開(kāi)源協(xié)議的Elasticsearch 分析和搜索儀表板霉晕,可作為L(zhǎng)ogstash和ElasticSearch日志分析的 Web 接口庭再,對(duì)日志進(jìn)行高效的搜索、可視化牺堰、分析等各種操作拄轻。
64、 Druid
是一個(gè)用于大數(shù)據(jù)實(shí)時(shí)查詢(xún)和分析的高容錯(cuò)伟葫、高性能恨搓、分布式的開(kāi)源系統(tǒng),旨在快速處理大規(guī)模的數(shù)據(jù),并能夠?qū)崿F(xiàn)快速查詢(xún)和分析斧抱。
65常拓、 KNIME
全稱(chēng)是“康斯坦茨信息挖掘工具”(Konstanz Information Miner),是一個(gè)開(kāi)源分析和報(bào)表平臺(tái)辉浦。宣稱(chēng)“是任何數(shù)據(jù)科學(xué)家完美的工具箱弄抬,超過(guò)1000個(gè)模塊,可運(yùn)行數(shù)百個(gè)實(shí)例宪郊,全面的集成工具掂恕,以及先進(jìn)的算法”。
66弛槐、Zeppelin
是一個(gè)提供交互數(shù)據(jù)分析且基于Web的筆記本懊亡。方便你做出可數(shù)據(jù)驅(qū)動(dòng)的、可交互且可協(xié)作的精美文檔乎串,并且支持多種語(yǔ)言斋配,包括 Scala(使用 Apache Spark)、Python(Apache Spark)灌闺、SparkSQL艰争、 Hive、 Markdown桂对、Shell等甩卓。
67、Azkaban
一款基于Java編寫(xiě)的任務(wù)調(diào)度系統(tǒng)任務(wù)調(diào)度蕉斜,來(lái)自L(fǎng)inkedIn公司逾柿,用于管理他們的Hadoop批處理工作流。Azkaban根據(jù)工作的依賴(lài)性進(jìn)行排序宅此,提供友好的Web用戶(hù)界面來(lái)維護(hù)和跟蹤用戶(hù)的工作流程机错。
68、 Splunk
是機(jī)器數(shù)據(jù)的引擎父腕。使用 Splunk 可收集弱匪、索引和利用所有應(yīng)用程序、服務(wù)器和設(shè)備(物理璧亮、虛擬和云中)生成的快速移動(dòng)型計(jì)算機(jī)數(shù)據(jù)萧诫,從一個(gè)位置搜索并分析所有實(shí)時(shí)和歷史數(shù)據(jù)
69、Pentaho
是世界上最流行的開(kāi)源商務(wù)智能軟件枝嘶,以工作流為核心的帘饶、強(qiáng)調(diào)面向解決方案而非工具組件的、基于java平臺(tái)的商業(yè)智能(Business Intelligence)套件群扶。包括一個(gè)web server平臺(tái)和幾個(gè)工具軟件:報(bào)表及刻、分析镀裤、圖表、數(shù)據(jù)集成缴饭、數(shù)據(jù)挖掘等暑劝,可以說(shuō)包括了商務(wù)智能的方方面面。
70茴扁、Jaspersoft
提供了靈活、可嵌入的商業(yè)智能工具汪疮,用戶(hù)包括眾多企業(yè)組織:高朋峭火、冠群科技、美國(guó)農(nóng)業(yè)部智嚷、愛(ài)立信卖丸、時(shí)代華納有線(xiàn)電視、奧林匹克鋼鐵盏道、內(nèi)斯拉斯加大學(xué)和通用動(dòng)力公司稍浆。
71、 SpagoBI
Spago被市場(chǎng)分析師們稱(chēng)為“開(kāi)源領(lǐng)袖”猜嘱,它提供商業(yè)智能衅枫、中間件和質(zhì)量保證軟件,另外還提供相應(yīng)的Java EE應(yīng)用程序開(kāi)發(fā)框架朗伶。
72弦撩、Lumify
歸Altamira科技公司(以國(guó)家安全技術(shù)而聞名)所有,這是一種開(kāi)源大數(shù)據(jù)整合论皆、分析和可視化平臺(tái)益楼。
73、Lingual
是Cascading的高級(jí)擴(kuò)展点晴,為Hadoop提供了一個(gè)ANSI SQL接口極大地簡(jiǎn)化了應(yīng)用程序的開(kāi)發(fā)和集成感凤。Lingual實(shí)現(xiàn)了連接現(xiàn)有的商業(yè)智能(BI)工具,優(yōu)化了計(jì)算成本粒督,加快了基于Hadoop的應(yīng)用開(kāi)發(fā)速度陪竿。
74、Beam
基于Java提供了統(tǒng)一的數(shù)據(jù)進(jìn)程管道開(kāi)發(fā)屠橄,并且能夠很好地支持Spark和Flink萨惑。提供很多在線(xiàn)框架,開(kāi)發(fā)者無(wú)需學(xué)太多框架仇矾。
75庸蔼、Cascading
是一個(gè)基于Hadoop建立的API,用來(lái)創(chuàng)建復(fù)雜和容錯(cuò)數(shù)據(jù)處理工作流贮匕。它抽象了集群拓?fù)浣Y(jié)構(gòu)和配置姐仅,使得不用考慮背后的MapReduce,就能快速開(kāi)發(fā)復(fù)雜的分布式應(yīng)用。
76掏膏、HPCC
作為Hadoop之外的一種選擇劳翰,是一個(gè)利用集群服務(wù)器進(jìn)行大數(shù)據(jù)分析的系統(tǒng),HPCC在LexisNexis內(nèi)部使用多年馒疹,是一個(gè)成熟可靠的系統(tǒng)佳簸,包含一系列的工具、一個(gè)稱(chēng)為ECL的高級(jí)編程語(yǔ)言颖变、以及相關(guān)的數(shù)據(jù)倉(cāng)庫(kù)生均,擴(kuò)展性超強(qiáng)
77、Hivemall
結(jié)合了面向Hive的多種機(jī)器學(xué)習(xí)算法腥刹,它包括了很多擴(kuò)展性很好的算法马胧,可用于數(shù)據(jù)分類(lèi)、遞歸衔峰、推薦佩脊、k最近鄰、異常檢測(cè)和特征哈希等方面的分析應(yīng)用垫卤。
78威彰、 RapidMiner
具有豐富數(shù)據(jù)挖掘分析和算法功能,常用于解決各種的商業(yè)關(guān)鍵問(wèn)題穴肘,解決方案覆蓋了各個(gè)領(lǐng)域抱冷,包括汽車(chē)、銀行梢褐、保險(xiǎn)旺遮、生命科學(xué)、制造業(yè)盈咳、石油和天然氣耿眉、零售業(yè)及快消行業(yè)、通訊業(yè)鱼响、以及公用事業(yè)等各個(gè)行業(yè)鸣剪。
79、 Mahout
目的是“為快速創(chuàng)建可擴(kuò)展丈积、高性能的機(jī)器學(xué)習(xí)應(yīng)用程序而打造一個(gè)環(huán)境”筐骇,主要特點(diǎn)是為可伸縮的算法提供可擴(kuò)展環(huán)境、面向Scala/Spark/H2O/Flink的新穎算法江滨、Samsara(類(lèi)似R的矢量數(shù)學(xué)環(huán)境)铛纬,它還包括了用于在MapReduce上進(jìn)行數(shù)據(jù)挖掘的眾多算法。
80唬滑、Tableau
Tableau 是一款企業(yè)級(jí)的大數(shù)據(jù)可視化工具告唆。Tableau 可以讓你輕松創(chuàng)建圖形棺弊,表格和地圖。 它不僅提供了PC桌面版擒悬,還提供了服務(wù)器解決方案模她,可以讓您在線(xiàn)生成可視化報(bào)告。服務(wù)器解決方案可以提供了云托管服務(wù)懂牧。Tableau的客戶(hù)包括巴克萊銀行侈净,Pandora和Citrix等企業(yè)
81、Infogram
Infogram的最大優(yōu)勢(shì)在于僧凤,讓您的可視化信息圖表與實(shí)時(shí)大數(shù)據(jù)相鏈接畜侦。只須三個(gè)簡(jiǎn)單步驟,您可以選擇在眾多圖表拼弃,地圖夏伊,甚至是視頻可視化模板中進(jìn)行選擇摇展。 Infogram支持團(tuán)隊(duì)賬號(hào)吻氧。
82、ChartBlocks
ChartBlocks是一個(gè)易于使用在線(xiàn)工具咏连,它無(wú)需編碼盯孙,便能從電子表格,數(shù)據(jù)庫(kù)中構(gòu)建可視化圖表祟滴。整個(gè)過(guò)程可以在圖表向?qū)У闹笇?dǎo)下完成振惰。您的圖表將在HTML5的框架下使用強(qiáng)大的Java庫(kù)D3.js創(chuàng)建圖表。你的圖表是響應(yīng)式的垄懂,并且可以和任何的屏幕尺寸及設(shè)備兼容骑晶。 您還可以將圖表嵌入任何網(wǎng)頁(yè)中,分享在Twitter和Facebook上草慧。
83桶蛔、Datawrapper
Datawrapper是一款專(zhuān)注于新聞和出版的可視化工具。華盛頓郵報(bào)漫谷,衛(wèi)報(bào)仔雷,華爾街日?qǐng)?bào)和Twitter等媒體都使用了這一工具。Datawrapper非常容易使用舔示,不需要任何編程基礎(chǔ)碟婆。你只需要上傳你的數(shù)據(jù),便能輕松地創(chuàng)建和發(fā)布圖表惕稻,甚至是地圖竖共。Datawrapper提供了眾多的自定義布局及地圖模板。
84俺祠、Plotly
Plotly幫助你在短短幾分鐘內(nèi)肘迎,從簡(jiǎn)單的電子表格中開(kāi)始創(chuàng)建漂亮的圖表甥温。Plotly已經(jīng)為谷歌、美國(guó)空軍和紐約大學(xué)等機(jī)構(gòu)所使用妓布。 Plotly是一個(gè)非常人性化的網(wǎng)絡(luò)工具姻蚓,讓你在幾分鐘內(nèi)啟動(dòng)。如果你的團(tuán)隊(duì)希望為JavaScript和Python等編程語(yǔ)言提供一個(gè)API接口的話(huà)匣沼,Plotly是一款非常人性化的工具狰挡。
85、RAW
RAW彌補(bǔ)了很多工具在電子表格和矢量圖形(SVG)之間的缺失環(huán)節(jié)释涛。你的大數(shù)據(jù)可以來(lái)自MicrosoftExcel中加叁,谷歌文檔或是一個(gè)簡(jiǎn)單的逗號(hào)分隔的列表。它最厲害的功能是可以很容易地導(dǎo)出可視化結(jié)果唇撬,因?yàn)樗虯dobe Illustrator它匕,Sketch 和Inkscape是相容的。
86窖认、Visual.ly
isual.ly是一個(gè)可視化的內(nèi)容服務(wù)豫柬。它提供專(zhuān)門(mén)的大數(shù)據(jù)可視化的服務(wù),用戶(hù)包括了VISA扑浸,耐克烧给,Twitter,福特和國(guó)家地理等喝噪。如果你想完全外包可視化文件給第三方础嫡。你可以使用非常簡(jiǎn)化的在線(xiàn)流程:你只需描述你的項(xiàng)目,服務(wù)團(tuán)隊(duì)將在項(xiàng)目的整個(gè)持續(xù)時(shí)間內(nèi)和你在一起酝惧。 Visual.ly給您發(fā)送所有項(xiàng)目關(guān)鍵點(diǎn)的郵件通知榴鼎,也將讓你不斷給出反饋。
87晚唇、D3.js
毋容置疑D3.js是最好的數(shù)據(jù)可視化工具庫(kù)巫财。D3.js運(yùn)行在JavaScript上,并使用HTML缺亮,CSS和SVG翁涤。 D3.js是開(kāi)源工具,使用數(shù)據(jù)驅(qū)動(dòng)的方式創(chuàng)建漂亮的網(wǎng)頁(yè)萌踱。 D3.js可實(shí)現(xiàn)實(shí)時(shí)交互葵礼。這個(gè)庫(kù)非常強(qiáng)大和前沿,所以它帶有沒(méi)有預(yù)置圖表也不支持IE9并鸵。
88鸳粉、Ember Charts
Ember Charts – 顧名思義是一種基于Ember.js框架和使用d3.js的可視化工具。Ember Charts以繪制時(shí)間序列圖园担,柱狀圖届谈,餅圖和散點(diǎn)圖為主枯夜。它非常優(yōu)易于擴(kuò)展。同為Ember.js開(kāi)發(fā)團(tuán)隊(duì)艰山,Ember Charts聚焦于圖形互動(dòng)性湖雹。它有極強(qiáng)的錯(cuò)誤處理能力,當(dāng)你遇到壞數(shù)據(jù)時(shí)曙搬,系統(tǒng)也不會(huì)崩潰
89摔吏、NVD3
NVD3運(yùn)行在d3.js之上, 它可建立可重用的圖表組件。該項(xiàng)目的目標(biāo)是保持所有的圖表整潔和可定制性纵装。 NVD3是d3.js之上的簡(jiǎn)單的接口征讲,保持了d3.js的所有強(qiáng)大功能。 NVD3由Novus Partners前端工程師開(kāi)發(fā)和使其保持了圖表技術(shù)洞察力橡娄。
90诗箍、Google Charts
Google Charts 以HTML5和SVG為基礎(chǔ),充分考慮了跨瀏覽器的兼容性挽唉,并通過(guò)VML支持舊版本的IE瀏覽器滤祖。所有您將創(chuàng)建的圖表是交互式的,有的還可縮放橱夭。Google Charts是非常人性化和他們的網(wǎng)站擁有一個(gè)非常好的氨距,全面的模板庫(kù)桑逝,你可以從中找到所需模板棘劣。
91、FusionCharts
FusionCharts是最全面的JavaScript圖表庫(kù)楞遏,包括90個(gè)圖表和900種地圖茬暇。如果你不是特別喜歡的JavaScript。FusionCharts可以輕松集成像jQuery庫(kù)寡喝,Angularjs和React框架以及ASP.NET和PHP語(yǔ)言糙俗。 FusionCharts支持JSON和XML數(shù)據(jù),并提供許多格式圖表:PNG预鬓,JPEG巧骚,SVG和PDF。
92格二、Highcharts
Highcharts是一個(gè)JavaScript API與jQuery的集成劈彪,全球最大的100家公司中有61家正在使用它。圖表使用SVG格式顶猜,并使用VML支持舊版瀏覽器沧奴。它提供了兩個(gè)專(zhuān)門(mén)的圖表類(lèi)型:Highstock和Highmaps,并且還配備了一系列的插件长窄。你可以免費(fèi)使用它滔吠,而如果你想建立付費(fèi)的應(yīng)用纲菌,只須支付少量牌照費(fèi)用。此外疮绷,你還可以使用Highcharts云服務(wù)翰舌。
93、Chart.js
對(duì)于一個(gè)小項(xiàng)目的圖表冬骚,chart.js是一個(gè)很好的選擇灶芝。開(kāi)源,只有11KB大小唉韭,這使得它快速且易于使用夜涕,它支持多種圖表類(lèi)型: 餅圖,線(xiàn)性圖和雷達(dá)圖等属愤。
94女器、Leaflet
你是否專(zhuān)注于專(zhuān)業(yè)的大數(shù)據(jù)解決方案?無(wú)需餅圖和條形圖住诸?Leafleft 基于Open Street Map數(shù)據(jù)驾胆,使用HTML5 / CSS3繪制互動(dòng)式可視化圖。您可以使用他們的擴(kuò)展插件庫(kù)添加熱點(diǎn)圖(heatmaps)和動(dòng)畫(huà)標(biāo)記贱呐。 Leaflet 是開(kāi)源和只有33 KB大小丧诺。
95、Chartist.js
Chartist.js的開(kāi)發(fā)社區(qū)一直致力于打敗所有其他JavaScript圖表庫(kù)奄薇。它使用了Sass的個(gè)性化風(fēng)格驳阎,它的SVG輸出是響應(yīng)式的。
96馁蒂、n3-charts
N3-charts是一種基于AngularJS框架的工具呵晚。它建立在D3.js之上,幫助您創(chuàng)建簡(jiǎn)單的互動(dòng)圖表沫屡。 N3-charts是一種小型化的圖表工具饵隙,不適用于大型項(xiàng)目。
97沮脖、 Sigma JS
Sigma JS 是交互式可視化工具庫(kù)金矛。由于使用了WebGL技術(shù),你可以使用鼠標(biāo)和觸摸的方式來(lái)更新和變換圖表勺届。Sigma JS同時(shí)支持JSON和GEXF兩種數(shù)據(jù)格式驶俊。這為它提供了大量的可用互動(dòng)式插件。Sigma JS 專(zhuān)注于網(wǎng)頁(yè)格式的網(wǎng)絡(luò)圖可視化涮因。因此它在大數(shù)據(jù)網(wǎng)絡(luò)可視化中非常有用废睦。
98、Polymaps
Polymaps是一款地圖可視化一個(gè)JavaScript工具庫(kù)养泡。 Polymaps使用SVG實(shí)現(xiàn)從國(guó)家到街道一級(jí)地理數(shù)據(jù)的可視化嗜湃。您可以使用CSS格式來(lái)修改你的樣式奈应。Polymaps使用GeoJSON來(lái)解釋地理數(shù)據(jù)。它是創(chuàng)建heatmap熱點(diǎn)圖的最好的工具之一购披。您創(chuàng)建的所有地圖都可以變成動(dòng)態(tài)圖愕乎。
99苛吱、Processing.js
Processing.js是一個(gè)基于可視化編程語(yǔ)言的JavaScript庫(kù)匾效。作為一種面向Web的JavaScript庫(kù)碧聪,Processing.js是您能夠有效進(jìn)行網(wǎng)頁(yè)格式圖表處理。這使得它成為了一種非常好交換式可視化工具筐乳。 Processing.js需要一個(gè)兼容HTML5的瀏覽器來(lái)實(shí)現(xiàn)這一功能歌殃。
100、Pentaho BI
Pentaho BI 平臺(tái)不同于傳統(tǒng)的BI 產(chǎn)品蝙云,它是一個(gè)以流程為中心的氓皱,面向解決方案(Solution)的框架。其目的在于將一系列企業(yè)級(jí)BI產(chǎn)品勃刨、開(kāi)源軟件波材、API等等組件集成起來(lái),方便商務(wù)智能應(yīng)用的開(kāi)發(fā)身隐。它的出現(xiàn)廷区,使得一系列的面向商務(wù)智能的獨(dú)立產(chǎn)品如Jfree、Quartz等等贾铝,能夠集成在一起隙轻,構(gòu)成一項(xiàng)項(xiàng)復(fù)雜的、完整的商務(wù)智能解決方案忌傻。