在遠方的你等我

IP屬地：浙江

Shuffle的執(zhí)行階段流程
1).Collect階段：將MapTask的結(jié)果輸出到默認大小為100M的環(huán)形緩沖區(qū)赵颅，保存的是key/value序列化數(shù)據(jù)行剂，Partition分...

0.1 1477 0 1
大數(shù)據(jù)面試題以及答案整理（一）
hadoop的shuffle過程一、Map端的shuffle Map端會處理輸入數(shù)據(jù)并產(chǎn)生中間結(jié)果如贷，這個中間結(jié)果會寫到本地磁盤，而不是HDFS...

1808 0 0

日志清洗案例
1.簡單解析版需求:去除日志中字段長度小于等于11的日志。輸入數(shù)據(jù) 實現(xiàn)代碼: 編寫LogMapper package com.itstar...

0.3 351 0 1
HDFS環(huán)境準備
1.配置Maven 2.修改本地倉庫位置 3.配置鏡像地址 4.pom文件配置 <dependencies><dependency> ...

0.3 308 0 1
大數(shù)據(jù)學習之MapReduce
1.MapReduce定義 Mapreduce是一個分布式運算程序的編程框架杠袱，是用戶開發(fā)“基于hadoop的數(shù)據(jù)分析應用”的核心框架尚猿。 Mapr...

0.3 548 0 2
HFDS命令行操作
二、HFDS命令行操作 1）基本語法 bin/hadoop fs具體命令 2）參數(shù)大全 bin/hadoop fs [-appendToFile...

0.2 634 0 1
HDFS文件系統(tǒng)
一HDFS概念 1.1概念 HDFS楣富，它是一個文件系統(tǒng)凿掂，全稱：Hadoop Distributed File System，用于存儲文件通過目錄...

0.2 691 0 1

大數(shù)據(jù)技術(shù)之Hadoop
1纹蝴、Hadoop的優(yōu)勢 1)高可靠性因為Hadoop假設計算元素和存儲會出現(xiàn)故障庄萎，因為它維護多個工作數(shù)據(jù)副本，在出現(xiàn)故障時可以對失敗的節(jié)點重新...

0.6 535 0 1
HDFS讀流程
1）客戶端向namenode請求下載文件塘安，namenode通過查詢元數(shù)據(jù)糠涛，找到文件塊所在的datanode地址。 2）挑選一臺datanode（...

0.5 161 0 1