基本介紹Ganglia:是UC Berkeley發(fā)起的一個(gè)開(kāi)源集群監(jiān)視項(xiàng)目荣刑,設(shè)計(jì)用于測(cè)量數(shù)以千計(jì)的節(jié)點(diǎn)邮弹。Ganglia的核心包含gmond集畅、gm...
(本文基于Spark 2.1.1晓褪、Kafka 0.10.2、Scala 2.11.8综慎、Zookeeper 3.4.9涣仿、Kafka-manager...
曾經(jīng)試用過(guò)主流大廠提供的大數(shù)據(jù)平臺(tái)服務(wù),僅從用戶體驗(yàn)角度上來(lái)說(shuō),各有千秋好港。 百度天算控制臺(tái) 功能分類明確愉镰,使用簡(jiǎn)單,組件版本較新钧汹,客服響應(yīng)...
淺顯易懂的介紹岛杀,很多資料對(duì)File Blocks副本Location位置的描述是有誤的,正確的理解請(qǐng)參考本漫畫(huà)崭孤,后附Hadoop 2.7.3 B...
本文基于Spark 2.1.0版本类嗤、Hadoop 2.7.3版本 如無(wú)特殊說(shuō)明,本文的Spark Web UI辨宠,特指: [Driver Web ...
本文基于Spark2.1.0版本套用官文Tuning Spark中的一句話作為文章的標(biāo)題: *Often, choose a serializa...
本文基于Spark2.1.0精偿、Kafka 0.10.2、Scala 2.11.8版本 背景: Kafka做為一款流行的分布式發(fā)布訂閱消息系統(tǒng)赋兵,以...
本文基于Spark2.1.0版本 雖然很少有生產(chǎn)環(huán)境用Kafka傳遞超過(guò)1M消息的場(chǎng)景(因?yàn)楦咄掏卤恃省⒌脱訒r(shí)的要求,Kafka 發(fā)布-訂閱模型中P...
本文基于Spark2.1.0版本 1霹期,先簡(jiǎn)單介紹一下通過(guò)SparkSQL JDBC連接數(shù)據(jù)庫(kù)的好處叶组,不過(guò)這不是本文的重點(diǎn) 。 JDBC(Java...