1.hadoop的褒義狹義
狹義指hadoop所宰,廣義指hadoop生態(tài)圈
2.hadoop三大組件绒尊,分別做什么?官網(wǎng)地址是什么
hdfs,mr仔粥,yarn婴谱, ? ? ? ? ? hadoop.apache.org
3.hdfs的塊默認(rèn)大小,副本數(shù)默認(rèn)多少?哪個參數(shù)控制會找嗎躯泰?
128M谭羔,3
4.hdfs進(jìn)程有哪些?按啟動順序
nn dn snn
5.談?wù)剬ps命令的理解
顯示java進(jìn)程信息的一個命令
6.談?wù)剬id文件的理解
保存進(jìn)程號的文件
7.說說你們會的hdfs哪些shell命令
??hdfs dfs -ls -mkdir -text -cat -mv -cp
8.NN,DN麦向,SNN節(jié)點分別做什么的?
? ??NN存儲元數(shù)據(jù)
????DN存儲數(shù)據(jù)
????SNN默認(rèn)一小時的冷備
9.淺談副本放置策略
?首先就近dn瘟裸,然后考慮當(dāng)前機(jī)柜不同dn,再不同機(jī)架dn诵竭,最后考慮跨數(shù)據(jù)中心dn
10.(面試題)hdfs讀寫流程话告,mr提交到y(tǒng)arn流程? 這三塊,博客有沒有文檔了?
11.yarn的調(diào)優(yōu)參數(shù)那兩篇秀撇,你們博客上有沒有?
12.談?wù)勀銈儗huffle的初步理解
? ??預(yù)先reduce超棺,減少reduce的復(fù)雜度
13.hive里哪種SQL會執(zhí)行mr job?
? ? 聚合,join
? ??insert ... as select
14.hive的元數(shù)據(jù)和數(shù)據(jù)分別存儲在哪?
? ??mysql呵燕,hdfs