Java同步關(guān)鍵字(synchronized) Java中的同步塊用synchronized標(biāo)記。同步塊在Java中是同步在某個(gè)對(duì)象上概漱。所有同步...
一.BitMap BitMap算法流程 假設(shè)需要排序或者查找的最大數(shù)MAX=10000000(lz:這里MAX應(yīng)該是最大的數(shù)而不是int數(shù)據(jù)的總...
根據(jù)緩存是否與應(yīng)用進(jìn)程屬于同一進(jìn)程丑慎,可以將內(nèi)存分為本地緩存和分布式緩存。本地緩存是在同一個(gè)進(jìn)程內(nèi)的內(nèi)存空間中緩存數(shù)據(jù)瓤摧,數(shù)據(jù)讀寫(xiě)都是在同一個(gè)...
1.通過(guò)flume竿裂,實(shí)時(shí)收集服務(wù)器上的日志信息,sink到hdfs 2.使用mapreduce對(duì)數(shù)據(jù)進(jìn)行清洗和校驗(yàn)照弥,規(guī)整出可建表的數(shù)據(jù)腻异,進(jìn)而創(chuàng)建...
Azkaban 1.為什么需要工作流調(diào)度系統(tǒng) 一個(gè)完整的數(shù)據(jù)分析系統(tǒng)通常都是由大量任務(wù)單元組成: shell腳本程序,java程序这揣,mapred...
日志采集框架Flume 1 Flume介紹 1.概述 Flume是一個(gè)分布式悔常、可靠敢会、和高可用的海量日志采集、聚合和傳輸?shù)南到y(tǒng)这嚣。 有問(wèn)題:并未實(shí)現(xiàn)...
一. 概念 所謂HA鸥昏,即高可用(7*24小時(shí)不中斷服務(wù)) 實(shí)現(xiàn)高可用最關(guān)鍵的是消除單點(diǎn)故障 hadoop-ha嚴(yán)格來(lái)說(shuō)應(yīng)該分成各個(gè)組件的HA機(jī)制...
1.基礎(chǔ):wordCount 2.三個(gè)重要自定義接口:partitioner、combiner姐帚、自定義排序(WritableComparator...
Day1 基礎(chǔ): 1.hive是做什么的吏垮?hive的特性,應(yīng)用場(chǎng)景 2.hive內(nèi)部組成 jar罐旗、Thrift膳汪、元數(shù)據(jù)服務(wù)(如何和mysql交互...