不滿足于入門級問題肢扯?這里有10個大數(shù)據(jù)面試中級問題送你!

上一篇文章我們總結了10個大數(shù)據(jù)面試入門級問題郊闯,大家是否有收獲蛛株,本次我們分析的是10個已經(jīng)在大數(shù)據(jù)行業(yè)工作的老司機們面試時的問題及建議答案,話不多說谨履,趕緊開始今天的學習笋粟。

基于大數(shù)據(jù)已從業(yè)者的面試問題

如果您在大數(shù)據(jù)世界中有相當豐富的工作經(jīng)驗,那么根據(jù)您以前的經(jīng)驗绿淋,您將在大數(shù)據(jù)面試中被問到一些問題尝盼。這些問題可能與您的經(jīng)驗或基于場景有關。所以,準備好這些最好的大數(shù)據(jù)面試問題和答案 殿漠。

11.您有大數(shù)據(jù)經(jīng)驗嗎佩捞?如果有,請分享一下一忱。

如何處理:??問題沒有具體答案,因為這是一個主觀問題菇夸,答案取決于您以前的經(jīng)驗仪吧。在大數(shù)據(jù)訪談期間詢問這個問題鞠眉,面試官想要了解您以前的經(jīng)驗,并且還試圖評估您是否適合項目要求出皇。

那么哗戈,你將如何處理這個問題呢?如果您有以前的經(jīng)驗唯咬,請在過去的職位上開始履行職責,并慢慢向對話添加詳細信息狞贱。告訴他們您使項目成功的貢獻蜀涨。一般來說,這個問題是在面試中提出的第二或第三個問題厚柳。后面的問題是基于這個問題,所以請仔細回答便监。您還應該注意不要過度使用以前工作的一個方面宰闰。保持簡單和重點簿透。

12.您更喜歡好的數(shù)據(jù)還是好的模型解藻?為什么?

如何處理:?這是一個棘手的問題啡浊,但通常在大數(shù)據(jù)面試中被問到胶背。它要求您在好的數(shù)據(jù)或好的模型之間進行選擇。作為候選人钳吟,您應該嘗試根據(jù)自己的經(jīng)驗回答這個問題。許多公司希望遵循嚴格的數(shù)據(jù)評估流程坝茎,這意味著他們已經(jīng)選擇了數(shù)據(jù)模型暇番。在這種情況下,擁有良好的數(shù)據(jù)可能會改變游戲規(guī)則壁酬。另一種方式也適用于基于良好數(shù)據(jù)選擇的模型。

正如我們已經(jīng)提到的岳服,請根據(jù)您的經(jīng)驗回答蜕煌。但是,不要說擁有良好的數(shù)據(jù)和良好的模型很重要贫母,因為在現(xiàn)實生活中很難同時擁有這兩個數(shù)據(jù)盒刚。

13.您是否會優(yōu)化算法或代碼以使其運行更快?

如何處理:?這個問題的答案應該始終是“是”因块。真實世界的性能很重要,它不依賴于您在項目中使用的數(shù)據(jù)或模型趾断。

面試官可能也有興趣知道您是否有任何以前的代碼或算法優(yōu)化經(jīng)驗。對于初學者來說增显,這顯然取決于他過去從事過哪些項目脐帝。有經(jīng)驗的候選人也可以相應地分享他們的經(jīng)驗。但是堵腹,請誠實地對待您的工作,如果您過去沒有優(yōu)化代碼旱易,那就沒關系了荡含。只需讓面試官了解您的真實體驗,您就可以破解大數(shù)據(jù)訪談。

14.您如何處理數(shù)據(jù)準備装处?

如何處理:?數(shù)據(jù)準備是大數(shù)據(jù)項目的關鍵步驟之一。大數(shù)據(jù)訪談可能涉及至少一個基于數(shù)據(jù)準備的問題寝蹈。當面試官問你這個問題時登淘,他想知道你在數(shù)據(jù)準備過程中采取了哪些步驟或預防措施。

如您所知黔州,需要數(shù)據(jù)準備才能獲得必要的數(shù)據(jù)流妻,然后可以進一步用于建模目的。你應該把這個消息傳達給面試官绅这。您還應該強調要使用的模型類型以及選擇特定模型的原因。最后度苔,但并非最不重要,您還應該討論重要的數(shù)據(jù)準備術語寇窑,如轉換變量,異常值完残,非結構化數(shù)據(jù)横漏,識別差距等。

15.您如何將非結構化數(shù)據(jù)轉換為結構化數(shù)據(jù)扎拣?

如何處理:?非結構化數(shù)據(jù)在大數(shù)據(jù)中非常常見素跺。應將非結構化數(shù)據(jù)轉換為結構化數(shù)據(jù),以確保正確的數(shù)據(jù)分析刊愚。您可以通過簡要區(qū)分兩者來開始回答問題踩验。完成后,您現(xiàn)在可以討論用于將一個表單轉換為另一個表單的方法箕憾。您也可以分享您所做的真實情況。如果您最近剛畢業(yè)钠龙,那么您可以分享與您的學術項目相關的信息御铃。

通過正確回答這個問題,您發(fā)出信號表明您了解結構化和非結構化數(shù)據(jù)的類型并闲,并且具有使用這些數(shù)據(jù)的實踐經(jīng)驗谷羞。如果你具體回答這個問題溜徙,你肯定能夠破解大數(shù)據(jù)訪談犀填。

16.哪種硬件配置對Hadoop作業(yè)最有利?

配置4/8 GB RAM和ECC內存的雙處理器或核心機器是運行Hadoop操作的理想選擇图贸。但是冕广,硬件配置因項目特定的工作流程和流程而異,因此需要進行自定義撒汉。

17.當兩個用戶嘗試訪問HDFS中的同一文件時會發(fā)生什么睬辐?

HDFS NameNode支持獨占只寫。因此溯饵,只有第一個用戶將收到文件訪問權限,第二個用戶將被拒絕隘谣。

18.如何在NameNode關閉時恢復它藻三?

需要執(zhí)行以下步驟才能啟動并運行Hadoop集群:

使用文件系統(tǒng)元數(shù)據(jù)副本的FsImage啟動新的NameNode。?

配置DataNode以及客戶端以使它們確認新啟動的NameNode。

一旦新的NameNode完成加載從DataNode收到足夠塊報告的最后一個檢查點FsImage渣玲,它將開始為客戶端提供服務。?

在大型Hadoop集群的情況下逾苫,NameNode恢復過程會消耗大量時間枚钓,這在日常維護的情況下將成為更大的挑戰(zhàn)。

19.您對Hadoop中的Rack Awareness有何了解星掰?

它是一種應用于NameNode的算法,用于決定塊及其副本的放置方式氢烘。根據(jù)機架定義播玖,同一機架內的DataNode之間的網(wǎng)絡流量最小化。例如蜀踏,如果我們將復制因子視為3,則將兩個副本放在一個機架上颅痊,而將第三個副本放在單獨的機架中随静。

20.“HDFS Block”和“Input Split”有什么區(qū)別?

HDFS將輸入數(shù)據(jù)物理地劃分為用于處理的塊恋捆,這被稱為HDFS塊重绷。

輸入拆分是映射器用于映射操作的邏輯數(shù)據(jù)劃分。

下集預告:干貨|50個大數(shù)據(jù)面試問題及答案第三篇:10個大數(shù)據(jù)Hadoop面試問題

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末愤钾,一起剝皮案震驚了整個濱河市候醒,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌伙菊,老刑警劉巖敌土,帶你破解...
    沈念sama閱讀 211,265評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異兴枯,居然都是意外死亡矩欠,警方通過查閱死者的電腦和手機悠夯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評論 2 385
  • 文/潘曉璐 我一進店門疗疟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瞳氓,“玉大人,你說我怎么就攤上這事店诗∫舭瘢” “怎么了?”我有些...
    開封第一講書人閱讀 156,852評論 0 347
  • 文/不壞的土叔 我叫張陵擦囊,是天一觀的道長嘴办。 經(jīng)常有香客問我,道長贯被,這世上最難降的妖魔是什么妆艘? 我笑而不...
    開封第一講書人閱讀 56,408評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮幌陕,結果婚禮上汽煮,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好瑟俭,可當我...
    茶點故事閱讀 65,445評論 5 384
  • 文/花漫 我一把揭開白布摆寄。 她就那樣靜靜地躺著坯门,像睡著了一般逗扒。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上矩肩,一...
    開封第一講書人閱讀 49,772評論 1 290
  • 那天黍檩,我揣著相機與錄音,去河邊找鬼喳逛。 笑死棵里,一個胖子當著我的面吹牛,可吹牛的內容都是我干的殿怜。 我是一名探鬼主播,決...
    沈念sama閱讀 38,921評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼乔夯!你這毒婦竟也來了?” 一聲冷哼從身側響起侧纯,我...
    開封第一講書人閱讀 37,688評論 0 266
  • 序言:老撾萬榮一對情侶失蹤甲脏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后娜氏,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體墩新,經(jīng)...
    沈念sama閱讀 44,130評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,467評論 2 325
  • 正文 我和宋清朗相戀三年绵疲,在試婚紗的時候發(fā)現(xiàn)自己被綠了盔憨。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,617評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡婿奔,死狀恐怖驯用,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情蝴乔,我是刑警寧澤记餐,帶...
    沈念sama閱讀 34,276評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站薇正,受9級特大地震影響片酝,放射性物質發(fā)生泄漏。R本人自食惡果不足惜挖腰,卻給世界環(huán)境...
    茶點故事閱讀 39,882評論 3 312
  • 文/蒙蒙 一雕沿、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧猴仑,春花似錦审轮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至崖飘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間朱浴,已是汗流浹背吊圾。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留翰蠢,地道東北人项乒。 一個月前我還...
    沈念sama閱讀 46,315評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像梁沧,于是被迫代替她去往敵國和親板丽。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,486評論 2 348

推薦閱讀更多精彩內容