
數(shù)據(jù)倉(cāng)庫(kù)概念的提出都要追溯到上世紀(jì)了脆贵,我們認(rèn)為在大數(shù)據(jù)元年之前的數(shù)倉(cāng)可以稱為傳統(tǒng)數(shù)倉(cāng)医清,而后隨著海量數(shù)據(jù)不斷增長(zhǎng),以及Hadoop生態(tài)不斷發(fā)展卖氨,主...
前面我們已經(jīng)分享過(guò)幾篇Kafka的文章,最近簡(jiǎn)單梳理了下Kafka內(nèi)核相關(guān)的知識(shí)筒捺,涵蓋了Kafka架構(gòu)總結(jié)柏腻,副本機(jī)制,控制器焙矛,高水位機(jī)制葫盼,日志或...
Hive和MapReduce中擁有較多在特定情況下優(yōu)化的特性,如何利用好相關(guān)特性村斟,是Hive性能調(diào)優(yōu)的關(guān)鍵贫导。本文就介紹那些耳熟但不能詳?shù)膸追NHi...
Hive在執(zhí)行MapReduce任務(wù)時(shí)經(jīng)常會(huì)碰到數(shù)據(jù)傾斜的問(wèn)題,表現(xiàn)為一個(gè)或者幾個(gè)reduce節(jié)點(diǎn)運(yùn)行很慢蟆盹,延長(zhǎng)了整個(gè)任務(wù)完成的時(shí)間孩灯,這是由于某...
這是使用 HBase 最不可避免的一個(gè)話題,就是 HBase 的性能調(diào)優(yōu)逾滥,而且通常建立在我們對(duì) HBase 內(nèi)部運(yùn)行機(jī)制比較了解的基礎(chǔ)上進(jìn)行的峰档,...
HBase 是目前主流的 NoSQL 數(shù)據(jù)庫(kù)寨昙,是一個(gè)高可靠讥巡、高性能、高伸縮的分布式 KV 存儲(chǔ)系統(tǒng)舔哪,本文講解 HBase 兩個(gè)核心機(jī)制——刷寫(...
Zookeeper 是一個(gè)高性能欢顷、高可靠的分布式協(xié)調(diào)系統(tǒng),是 Google Chubby 的一個(gè)開源實(shí)現(xiàn)捉蚤,目前在分布式系統(tǒng)抬驴、大數(shù)據(jù)領(lǐng)域中使用非常...
我們?cè)谑褂肏Base的時(shí)候炼七,必須要能夠清楚HBase服務(wù)端的性能,這對(duì)HBase的合理使用以及性能調(diào)優(yōu)都非常重要布持,所以一般在使用HBase之前豌拙,...
前段時(shí)間有一個(gè)同事問(wèn)到:Kafka 0.8.2 只能使用Zookeeper連接嗎?雖然仍有一部分Kafka的老用戶在使用 0.8.x 版本题暖,但 ...