大數(shù)據(jù)面試問(wèn)題及答案:10個(gè)大數(shù)據(jù)Hadoop面試問(wèn)題

在上兩次文章中我們給大家分享了妻献,對(duì)于剛剛從事大數(shù)據(jù)行業(yè)和已從事大數(shù)據(jù)行業(yè)的面試者可能會(huì)遇到的專(zhuān)業(yè)面試題20道,如果還沒(méi)有閱讀的朋友可以跳轉(zhuǎn)觀看哦团赁!

干貨|50個(gè)大數(shù)據(jù)面試問(wèn)題及答案第一篇:10個(gè)大數(shù)據(jù)面試入門(mén)級(jí)問(wèn)題

干貨|50個(gè)大數(shù)據(jù)面試問(wèn)題及答案第二篇:10個(gè)大數(shù)據(jù)面試中級(jí)問(wèn)題?

本次我們就來(lái)分享一下10個(gè)大數(shù)據(jù)Hadoop面試時(shí)會(huì)問(wèn)的專(zhuān)業(yè)問(wèn)題育拨。

Hadoop是最受歡迎的大數(shù)據(jù)框架之一,如果您正在進(jìn)行Hadoop面試欢摄,請(qǐng)為Big Data Hadoop準(zhǔn)備這些基本級(jí)別的面試問(wèn)題熬丧。無(wú)論您是要參加Hadoop開(kāi)發(fā)人員還是Hadoop Admin面試,這些問(wèn)題都將對(duì)您有所幫助剧浸。

21.解釋Hadoop和RDBMS之間的區(qū)別锹引。

答:Hadoop和RDBMS之間的區(qū)別如下 :

22. Hadoop中常見(jiàn)的輸入格式是什么?

答:以下是Hadoop中常見(jiàn)的輸入格式 -

文本輸入格式 -?Hadoop中定義的默認(rèn)輸入格式是文本輸入格式唆香。

序列文件輸入格式 -要讀取序列中的文件嫌变,請(qǐng)使用序列文件輸入格式。

鍵值輸入格式 -用于純文本文件(分成行的文件)的輸入格式是鍵值輸入格式躬它。

23.解釋Hadoop的一些重要特性腾啥。

答:Hadoop支持大數(shù)據(jù)的存儲(chǔ)和處理。它是處理大數(shù)據(jù)挑戰(zhàn)的最佳解決方案。Hadoop的一些重要功能是 -

開(kāi)源 -?Hadoop是一個(gè)開(kāi)源框架倘待,這意味著它是免費(fèi)提供的疮跑。此外,允許用戶根據(jù)他們的要求更改源代碼凸舵。

分布式處理 -?Hadoop支持?jǐn)?shù)據(jù)的分布式處理祖娘,即更快的處理。Hadoop HDFS中的數(shù)據(jù)以分布式方式存儲(chǔ)啊奄,MapReduce負(fù)責(zé)數(shù)據(jù)的并行處理渐苏。

容錯(cuò)力 -?Hadoop具有高度容錯(cuò)能力。默認(rèn)情況下菇夸,它為不同節(jié)點(diǎn)的每個(gè)塊創(chuàng)建三個(gè)副本琼富。這個(gè)數(shù)字可以根據(jù)要求改變。因此庄新,如果一個(gè)節(jié)點(diǎn)發(fā)生故障鞠眉,我們可以從另一個(gè)節(jié)點(diǎn)恢復(fù)數(shù)據(jù)。節(jié)點(diǎn)故障的檢測(cè)和數(shù)據(jù)的恢復(fù)是自動(dòng)完成的择诈。

可靠性 -?Hadoop以獨(dú)立于計(jì)算機(jī)的可靠方式在群集上存儲(chǔ)數(shù)據(jù)械蹋。因此,存儲(chǔ)在Hadoop環(huán)境中的數(shù)據(jù)不受機(jī)器故障的影響吭从。

可伸縮性 -?Hadoop的另一個(gè)重要特性是可伸縮性朝蜘。它與其他硬件兼容,我們可以輕松地將新硬件分配給節(jié)點(diǎn)涩金。

高可用性 -即使在硬件故障后,也可以訪問(wèn)存儲(chǔ)在Hadoop中的數(shù)據(jù)暇仲。如果硬件發(fā)生故障步做,可以從另一個(gè)路徑訪問(wèn)數(shù)據(jù)。

24.解釋Hadoop運(yùn)行的不同模式奈附。

答:Apache Hadoop運(yùn)行在以下三種模式 -

獨(dú)立(本地)模式 -默認(rèn)情況下全度,Hadoop以本地模式運(yùn)行,即在非分布式單節(jié)點(diǎn)上運(yùn)行斥滤。此模式使用本地文件系統(tǒng)執(zhí)行輸入和輸出操作将鸵。此模式不支持使用HDFS,因此用于調(diào)試佑颇。在此模式下顶掉,配置文件不需要自定義配置。

偽分布式模式 -在偽分布式模式下挑胸,Hadoop就像獨(dú)立模式一樣在單個(gè)節(jié)點(diǎn)上運(yùn)行痒筒。在此模式下,每個(gè)守護(hù)程序都在單獨(dú)的Java進(jìn)程中運(yùn)行。由于所有守護(hù)進(jìn)程都在單個(gè)節(jié)點(diǎn)上運(yùn)行簿透,因此主節(jié)點(diǎn)和從節(jié)點(diǎn)都有相同的節(jié)點(diǎn)移袍。

完全分布式模式 -在完全分布式模式下,所有守護(hù)進(jìn)程都在不同的單個(gè)節(jié)點(diǎn)上運(yùn)行老充,從而形成一個(gè)多節(jié)點(diǎn)集群葡盗。主節(jié)點(diǎn)和從節(jié)點(diǎn)有不同的節(jié)點(diǎn)。

25.解釋Hadoop的核心組件啡浊。

答:Hadoop是一個(gè)開(kāi)源框架觅够,用于以分布式方式存儲(chǔ)和處理大數(shù)據(jù)。Hadoop的核心組件是 -

HDFS(Hadoop分布式文件系統(tǒng)) -?HDFS是Hadoop的基本存儲(chǔ)系統(tǒng)虫啥。在商用硬件集群上運(yùn)行的大型數(shù)據(jù)文件存儲(chǔ)在HDFS中蔚约。即使硬件出現(xiàn)故障,它也能以可靠的方式存儲(chǔ)數(shù)據(jù)涂籽。

Hadoop的核心組件

Hadoop MapReduce -?MapReduce是負(fù)責(zé)數(shù)據(jù)處理的Hadoop層苹祟。它編寫(xiě)了一個(gè)應(yīng)用程序來(lái)處理存儲(chǔ)在HDFS中的非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)。它負(fù)責(zé)通過(guò)將數(shù)據(jù)劃分為獨(dú)立任務(wù)來(lái)并行處理大量數(shù)據(jù)评雌。處理分兩個(gè)階段完成Map和Reduce树枫。Map是指定復(fù)雜邏輯代碼的第一個(gè)處理階段,Reduce是指定輕量級(jí)操作的第二階段處理景东。

YARN -?Hadoop中的處理框架是YARN砂轻。它用于資源管理并提供多種數(shù)據(jù)處理引擎,即數(shù)據(jù)科學(xué)斤吐,實(shí)時(shí)流和批處理搔涝。

26.“MapReduce”程序中的配置參數(shù)是什么?

答:“MapReduce”框架中的主要配置參數(shù)是:

在分布式文件系統(tǒng)中輸入Jobs的位置

在分布式文件系統(tǒng)中輸出Jobs的位置

數(shù)據(jù)的輸入格式

數(shù)據(jù)的輸出格式

包含map函數(shù)的類(lèi)

包含reduce函數(shù)的類(lèi)

包含mapper和措,reducer和驅(qū)動(dòng)程序類(lèi)的JAR文件

27. HDFS中的塊是什么庄呈?它在Hadoop 1和Hadoop 2中的默認(rèn)大小是多少?我們可以改變塊大小嗎派阱?

答:塊是硬盤(pán)中最小的連續(xù)數(shù)據(jù)存儲(chǔ)诬留。對(duì)于HDFS,塊存儲(chǔ)在Hadoop集群中贫母。

Hadoop 1中的默認(rèn)塊大小為:64 MB

Hadoop 2中的默認(rèn)塊大小為:128 MB

是的文兑,我們可以使用位于hdfs-site.xml文件中的參數(shù)--dfs.block.size?來(lái)更改塊大小。

28.什么是MapReduce框架中的分布式緩存

答:分布式緩存是Hadoop MapReduce框架的一項(xiàng)功能腺劣,用于緩存應(yīng)用程序的文件绿贞。Hadoop框架使緩存文件可用于在數(shù)據(jù)節(jié)點(diǎn)上運(yùn)行的每個(gè)map / reduce任務(wù)。因此誓酒,數(shù)據(jù)文件可以作為指定作業(yè)中的本地文件訪問(wèn)緩存文件樟蠕。

29. Hadoop的三種運(yùn)行模式是什么贮聂?

答:Hadoop的三種運(yùn)行模式如下:

Ⅰ、獨(dú)立或本地:這是默認(rèn)模式寨辩,不需要任何配置吓懈。在此模式下,Hadoop的以下所有組件都使用本地文件系統(tǒng)并在單個(gè)JVM上運(yùn)行 -

的NameNode

數(shù)據(jù)管理部

的ResourceManager

節(jié)點(diǎn)管理器

II靡狞、偽分布式:在此模式下耻警,所有主從Hadoop服務(wù)都在單個(gè)節(jié)點(diǎn)上部署和執(zhí)行。

III甸怕、完全分布式:在此模式下甘穿,Hadoop主服務(wù)器和從服務(wù)器在不同的節(jié)點(diǎn)上部署和執(zhí)行。

30.在Hadoop中解釋JobTracker

答:JobTracker是Hadoop中的JVM進(jìn)程梢杭,用于提交和跟蹤MapReduce作業(yè)温兼。

JobTracker按順序在Hadoop中執(zhí)行以下活動(dòng) :

JobTracker接收客戶端應(yīng)用程序提交給作業(yè)跟蹤器的作業(yè);

JobTracker通知NameNode確定數(shù)據(jù)節(jié)點(diǎn)武契;

JobTracker根據(jù)可用的插槽分配TaskTracker節(jié)點(diǎn)募判;

它提交了已分配的TaskTracker節(jié)點(diǎn)的工作;

JobTracker監(jiān)視TaskTracker節(jié)點(diǎn)咒唆;

當(dāng)任務(wù)失敗時(shí)届垫,會(huì)通知JobTracker并決定如何重新分配任務(wù)。

下期預(yù)告:干貨|50個(gè)大數(shù)據(jù)面試問(wèn)題及答案第四篇:Hadoop開(kāi)發(fā)人員面試新手的問(wèn)題

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末全释,一起剝皮案震驚了整個(gè)濱河市装处,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌浸船,老刑警劉巖妄迁,帶你破解...
    沈念sama閱讀 218,607評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異李命,居然都是意外死亡判族,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)项戴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人槽惫,你說(shuō)我怎么就攤上這事周叮。” “怎么了界斜?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,960評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵仿耽,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我各薇,道長(zhǎng)项贺,這世上最難降的妖魔是什么君躺? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,750評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮开缎,結(jié)果婚禮上棕叫,老公的妹妹穿的比我還像新娘。我一直安慰自己奕删,他們只是感情好俺泣,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,764評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著完残,像睡著了一般伏钠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上谨设,一...
    開(kāi)封第一講書(shū)人閱讀 51,604評(píng)論 1 305
  • 那天熟掂,我揣著相機(jī)與錄音,去河邊找鬼扎拣。 笑死赴肚,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的鹏秋。 我是一名探鬼主播尊蚁,決...
    沈念sama閱讀 40,347評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼侣夷!你這毒婦竟也來(lái)了横朋?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,253評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤百拓,失蹤者是張志新(化名)和其女友劉穎琴锭,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體衙传,經(jīng)...
    沈念sama閱讀 45,702評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡决帖,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,893評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蓖捶。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片地回。...
    茶點(diǎn)故事閱讀 40,015評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖俊鱼,靈堂內(nèi)的尸體忽然破棺而出刻像,到底是詐尸還是另有隱情,我是刑警寧澤并闲,帶...
    沈念sama閱讀 35,734評(píng)論 5 346
  • 正文 年R本政府宣布细睡,位于F島的核電站,受9級(jí)特大地震影響帝火,放射性物質(zhì)發(fā)生泄漏溜徙。R本人自食惡果不足惜湃缎,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,352評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蠢壹。 院中可真熱鬧嗓违,春花似錦、人聲如沸知残。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,934評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)求妹。三九已至乏盐,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間制恍,已是汗流浹背父能。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,052評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留净神,地道東北人何吝。 一個(gè)月前我還...
    沈念sama閱讀 48,216評(píng)論 3 371
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像鹃唯,于是被迫代替她去往敵國(guó)和親爱榕。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,969評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容