數(shù)據(jù)倉庫概念的提出都要追溯到上世紀(jì)了船庇,我們認(rèn)為在大數(shù)據(jù)元年之前的數(shù)倉可以稱為傳統(tǒng)數(shù)倉吭产,而后隨著海量數(shù)據(jù)不斷增長,以及Hadoop生態(tài)不斷發(fā)展鸭轮,主...
前面我們已經(jīng)分享過幾篇Kafka的文章,最近簡單梳理了下Kafka內(nèi)核相關(guān)的知識(shí)窃爷,涵蓋了Kafka架構(gòu)總結(jié)邑蒋,副本機(jī)制,控制器按厘,高水位機(jī)制寺董,日志或...
Hive和MapReduce中擁有較多在特定情況下優(yōu)化的特性,如何利用好相關(guān)特性刻剥,是Hive性能調(diào)優(yōu)的關(guān)鍵遮咖。本文就介紹那些耳熟但不能詳?shù)膸追NHi...
Hive在執(zhí)行MapReduce任務(wù)時(shí)經(jīng)常會(huì)碰到數(shù)據(jù)傾斜的問題,表現(xiàn)為一個(gè)或者幾個(gè)reduce節(jié)點(diǎn)運(yùn)行很慢造虏,延長了整個(gè)任務(wù)完成的時(shí)間御吞,這是由于某...
這是使用 HBase 最不可避免的一個(gè)話題,就是 HBase 的性能調(diào)優(yōu)漓藕,而且通常建立在我們對 HBase 內(nèi)部運(yùn)行機(jī)制比較了解的基礎(chǔ)上進(jìn)行的陶珠,...
HBase 是目前主流的 NoSQL 數(shù)據(jù)庫享钞,是一個(gè)高可靠揍诽、高性能、高伸縮的分布式 KV 存儲(chǔ)系統(tǒng)栗竖,本文講解 HBase 兩個(gè)核心機(jī)制——刷寫(...
Zookeeper 是一個(gè)高性能暑脆、高可靠的分布式協(xié)調(diào)系統(tǒng),是 Google Chubby 的一個(gè)開源實(shí)現(xiàn)狐肢,目前在分布式系統(tǒng)添吗、大數(shù)據(jù)領(lǐng)域中使用非常...
我們在使用HBase的時(shí)候,必須要能夠清楚HBase服務(wù)端的性能份名,這對HBase的合理使用以及性能調(diào)優(yōu)都非常重要碟联,所以一般在使用HBase之前妓美,...
前段時(shí)間有一個(gè)同事問到:Kafka 0.8.2 只能使用Zookeeper連接嗎?雖然仍有一部分Kafka的老用戶在使用 0.8.x 版本鲤孵,但 ...