![240](https://cdn2.jianshu.io/assets/default_avatar/12-aeeea4bedf10f2a12c0d50d626951489.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
Hfile結(jié)構(gòu) 文件主要分為四個(gè)部分:Scanned block section艘策,Non-scanned block section蹋肮,Openi...
介紹 HBase是一個(gè)構(gòu)建在HDFS上的分布式列存儲(chǔ)系統(tǒng); HBase是基于Google BigTable模型開(kāi)發(fā)的闽撤,典型的key/value系...
hive介紹 Hive通常意義上來(lái)說(shuō)玛瘸,是把一個(gè)SQL轉(zhuǎn)化成一個(gè)分布式作業(yè)演怎,如MapReduce嚷炉,Spark或者Tez。無(wú)論Hive的底層執(zhí)行框架...
Year的資源管理模型 在實(shí)際系統(tǒng)中等太,資源本身是多維度的捂齐,包括CPU、內(nèi)存缩抡、網(wǎng)絡(luò)I/O和磁盤I/O等奠宜,因此,如果想精確控制資源分配瞻想,不能再有sl...
參與mapreduce作業(yè)執(zhí)行涉及4個(gè)獨(dú)立的實(shí)體: 客戶端(client)提交MapReduce作業(yè)JobTracker1.作業(yè)調(diào)度:將一個(gè)作業(yè)...
HDFS 2.0 的 HA 實(shí)現(xiàn) Active NameNode 和 Standby NameNode:兩臺(tái) NameNode 形成互備压真,一臺(tái)處...
hdfs架構(gòu)設(shè)計(jì) HDFS主要由3個(gè)組件構(gòu)成,分別是NameNode蘑险、SecondaryNameNode和DataNode滴肿,HSFS是以mast...
1.1 簡(jiǎn)單介紹 實(shí)時(shí)處理Stream流的能力,有容錯(cuò)性佃迄,保證性處理機(jī)制泼差。對(duì)于輸入數(shù)據(jù),支持消息隊(duì)列呵俏,像RabbitMQ, JMS, Kafka...
1.1 KafkaSpout流程 建立zookeeper客戶端堆缘,在zookeeper "borkers/topics/" + _topic + ...