Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎架構歪架。
用戶可以在不了解分布式底層細節(jié)的情況下,開發(fā)分布式程序霹陡。充分利用集群的威力進行高速運算和存儲和蚪。
Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(Hadoop Distributed File System)止状,簡稱HDFS。HDFS有高容錯性的特點攒霹,并且設計用來部署在低廉的(low-cost)硬件上怯疤;而且它提供高吞吐量(high throughput)來訪問應用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應用程序催束。HDFS放寬了(relax)POSIX的要求集峦,可以以流的形式訪問(streaming access)文件系統(tǒng)中的數(shù)據(jù)。
Hadoop的框架最核心的設計就是:HDFS和MapReduce抠刺。HDFS為海量的數(shù)據(jù)提供了存儲塔淤,則MapReduce為海量的數(shù)據(jù)提供了計算。