zookeeper是一個類似hdfs(Hadoop分布式文件系統(tǒng)或HDFS是基于Java的分布式文件系統(tǒng),允許您在Hadoop集群中的多個節(jié)點上存儲大量數(shù)據(jù)惊畏。因此枝冀,如果您安裝Hadoop联喘,您將HDFS作為底層存儲系統(tǒng)來存儲分布式環(huán)境中的數(shù)據(jù),如果你有十臺機器或十臺電腦,每臺機器上有1TB的硬盤≡赝ィ現(xiàn)在看彼,HDFS表示廊佩,如果您將Hadoop作為平臺安裝在這十臺機器上,您將獲得HDFS作為存儲服務靖榕。Hadoop分布式文件系統(tǒng)以這樣的方式分發(fā)标锄,即每臺機器都有自己的存儲空間來存儲任何類型的數(shù)據(jù)。當您從Hadoop集群中的十臺機器中的任何一臺訪問Hadoop分布式文件系統(tǒng)時茁计,您會感覺到您已經(jīng)登錄到一臺具有10 TB存儲容量的大型機器(總計存儲十臺以上的機器)料皇。這是什么意思?這意味著您可以存儲一個10 TB的大文件星压,這個文件將分布在十臺機器上(每個1 TB)践剂。所以,它不限于每臺機器的物理邊界)的樹形文件結(jié)構(gòu)娜膘,zookeeper可以保證數(shù)據(jù)在集群之間的數(shù)據(jù)的事務性一致
配置文件
安裝好zookeeper后要在conf文件夾中找到“zoo_sample.cfg”文件逊脯,你可以復制一份、也可以直接將它改名為zoo.cfg竣贪,因為ZooKeeper啟動時军洼,會默認加載“conf/zoo.cfg”作為配置文件,
tickTime:這個時間是作為 ZooKeeper服務器之間或客戶端與服務器之間維持心跳的時間間隔演怎,也就是每個 tickTime 時間就會發(fā)送一個心跳匕争。單位為毫秒。
initLimit:集群中的follower服務器(F)與leader服務器(L)之間 初始連接 時能容忍的最多心跳數(shù)(tickTime的數(shù)量)爷耀。此配置表示甘桑,允許?follower?(相對于?leader?而言的“客戶端”)連接并同步到??leader?的初始化連接時間,它以?tickTime?的倍數(shù)來表示歹叮。當超過設置倍數(shù)(syncLimit)的?tickTime?時間跑杭,則連接失敗〉琳停總的時間長度就是 5*2000=10 秒艘蹋。
dataDir:該配置項用于配置zookeeper快照日志和事務日志的存儲地址。