數(shù)據(jù)倉(cāng)庫(kù)面試問(wèn)題匯總

? ? ? 畢業(yè)后做了7年java應(yīng)用開(kāi)發(fā),主要在一家傳統(tǒng)軟件公司做BI相關(guān)的東西何吝。因?yàn)橹饕菍憳I(yè)務(wù)代碼溉委,大公司都有自己的技術(shù)平臺(tái)鹃唯,所以java技術(shù)也并不很強(qiáng),多線程都很少自己寫瓣喊。最近三年到了互聯(lián)網(wǎng)公司俯渤,轉(zhuǎn)到做數(shù)倉(cāng)相關(guān)的項(xiàng)目,其實(shí)主要是用hive sql在做數(shù)據(jù)處理型宝,就是被鄙視的sql boy八匠。由于進(jìn)的并不是正經(jīng)的數(shù)倉(cāng)部門,而是在數(shù)倉(cāng)基礎(chǔ)上做數(shù)據(jù)應(yīng)用系統(tǒng)的部門趴酣,所以還是偏業(yè)務(wù)梨树,且對(duì)數(shù)倉(cāng)理解不是很深入。所以本人技術(shù)水平很渣岖寞。面試了很多抡四,面不過(guò)。把遇到的問(wèn)題記錄下來(lái)仗谆,希望可以和大家一起探討指巡,也是一種提高吧。如果大家能夠回答這些問(wèn)題隶垮,希望可以回復(fù)藻雪。

說(shuō)一說(shuō)你整個(gè)項(xiàng)目從數(shù)據(jù)采集到指標(biāo)、報(bào)表的這整個(gè)過(guò)程是怎么做的吧狸吞。

這個(gè)問(wèn)題還是挺能反映應(yīng)聘者能力的勉耀,因?yàn)閿?shù)倉(cāng)是比較雜的一個(gè)工種,在不同的公司或者不同的項(xiàng)目蹋偏,側(cè)重點(diǎn)不一樣便斥。比如小公司基本上從ETL開(kāi)始就要親力親為了,對(duì)于建模理論要求沒(méi)那么迫切威始。大公司可能etl基于平臺(tái)枢纠,開(kāi)發(fā)量變少,但是對(duì)建模黎棠、數(shù)據(jù)治理要求可能更高晋渺。還有的公司更偏重?cái)?shù)據(jù)分析的思路,或者說(shuō)分析業(yè)務(wù)的思路葫掉,而不是單純搞搞工程些举。開(kāi)放問(wèn)題,回答的時(shí)候就是把自己的項(xiàng)目說(shuō)清楚俭厚。如果不知道怎么說(shuō)清楚户魏,那么推薦一個(gè)技巧:把各個(gè)階段的產(chǎn)出物交代清楚,比如了解業(yè)務(wù)階段輸出什么、建模階段輸出什么叼丑,等等关翎。我太渣了,沒(méi)真正從0做過(guò)數(shù)倉(cāng)鸠信,項(xiàng)目經(jīng)驗(yàn)不足纵寝,哪里能找到標(biāo)準(zhǔn)一點(diǎn)的答案呢?從《阿里巴巴大數(shù)據(jù)之路》里面能找到嗎星立?

事實(shí)表有哪幾種類型爽茴?

本渣之前看過(guò)《數(shù)據(jù)倉(cāng)庫(kù)工具箱---維度建模指南》,但一時(shí)想不起來(lái)了绰垂,仔細(xì)想還是想不起來(lái)室奏。確定看過(guò),確定想不起劲装。

緩慢變化維你們是怎么處理的胧沫?

使用拉鏈表

拉鏈表是怎么實(shí)現(xiàn)的?

這個(gè)在網(wǎng)上一搜可以搜到實(shí)例占业,但是如果結(jié)合業(yè)務(wù)再問(wèn)的話绒怨,這是一個(gè)可以問(wèn)的挺深的問(wèn)題。數(shù)倉(cāng)就是這樣一個(gè)跟業(yè)務(wù)強(qiáng)結(jié)合的東西谦疾,離開(kāi)業(yè)務(wù)抽象出來(lái)的東西反而沒(méi)有靈魂南蹂,解決具體業(yè)務(wù)問(wèn)題的方法才是價(jià)值。

數(shù)據(jù)總線矩陣是怎么理解的餐蔬,為什么要做這個(gè)碎紊?

感覺(jué)可以從數(shù)據(jù)整合佑附、數(shù)據(jù)打通等角度回答吧樊诺,回答不好。

你們的數(shù)倉(cāng)是怎么樣的架構(gòu)音同?

技術(shù)架構(gòu)我基本不會(huì)词爬,所以也沒(méi)什么可以說(shuō)的。只會(huì)一個(gè)數(shù)倉(cāng)分層:ods权均、dwd顿膨、dwb、ads(app)叽赊。細(xì)問(wèn)的話會(huì)有很多衍生問(wèn)題:

ods你們是怎么實(shí)現(xiàn)的恋沃?

dwd這一層做了什么?

維度建模用在哪一層上必指?

維度建模有什么優(yōu)缺點(diǎn)囊咏?

更好的應(yīng)對(duì)業(yè)務(wù)變化,數(shù)據(jù)冗余多,占空間多梅割,就是用空間換時(shí)間霜第。這個(gè)問(wèn)題其實(shí)還蠻難的,分析優(yōu)缺點(diǎn)户辞,就要有對(duì)比泌类,跟別的建模方式對(duì)比,只有對(duì)其他的建模方式有理解才可能回答出來(lái)底燎。

做數(shù)據(jù)倉(cāng)庫(kù)如何解決不同業(yè)務(wù)部門的統(tǒng)計(jì)口徑不一致的問(wèn)題刃榨?

我們公司業(yè)務(wù)變化特別快,有時(shí)候半年業(yè)務(wù)主流程就會(huì)大變双仍,這種情況下喇澡,你怎么應(yīng)對(duì)?

如何評(píng)價(jià)一個(gè)數(shù)據(jù)倉(cāng)庫(kù)的好壞殊校?

數(shù)據(jù)準(zhǔn)確性晴玖、時(shí)效性、健壯性为流。面試官說(shuō)這些都是一些原則呕屎,比較虛,有沒(méi)有可衡量的指標(biāo)敬察?就是一個(gè)數(shù)據(jù)倉(cāng)庫(kù)建好了秀睛,用這些指標(biāo)評(píng)價(jià)它好不好,有不好的要指出來(lái)莲祸,指導(dǎo)它改進(jìn)蹂安。這個(gè)我真不知道。

mapreduce原理清楚嗎锐帜?講一講田盈,畫一畫那個(gè)經(jīng)典的流程圖吧。

從hive sql提交到生成mapreduce任務(wù)缴阎,再執(zhí)行允瞧,這個(gè)過(guò)程是怎么樣的?資源調(diào)度是怎樣的蛮拔?

hive優(yōu)化接觸過(guò)嗎述暂?做過(guò)哪些?

hive的數(shù)據(jù)傾斜一般怎么處理建炫?

spark用過(guò)嗎畦韭?

spark現(xiàn)在用的是真多。肛跌。艺配。

你們的數(shù)倉(cāng)建設(shè)過(guò)程中是如何保障數(shù)據(jù)正確性的据过?

讓你建設(shè)一個(gè)數(shù)倉(cāng)的話,你的關(guān)注點(diǎn)有哪些妒挎?

這個(gè)就開(kāi)放問(wèn)題了绳锅,能看出做數(shù)倉(cāng)的思路,也能看出對(duì)數(shù)倉(cāng)理解的情況酝掩。如果對(duì)面試官的路子就好鳞芙。

你的項(xiàng)目中怎么應(yīng)用維度建模?能具體說(shuō)說(shuō)嗎期虾,具體的表有哪些原朝?

RCFile解析過(guò)嗎?文件結(jié)構(gòu)是怎么樣的镶苞?

udaf寫過(guò)嗎喳坠?udtf呢?怎么寫茂蚓,分哪幾個(gè)步驟壕鹉,怎么轉(zhuǎn)換成mr的?

hive中transform用過(guò)嗎聋涨?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末晾浴,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子牍白,更是在濱河造成了極大的恐慌脊凰,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,544評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件茂腥,死亡現(xiàn)場(chǎng)離奇詭異狸涌,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)最岗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門帕胆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人仑性,你說(shuō)我怎么就攤上這事惶楼。” “怎么了诊杆?”我有些...
    開(kāi)封第一講書人閱讀 162,764評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)何陆。 經(jīng)常有香客問(wèn)我晨汹,道長(zhǎng),這世上最難降的妖魔是什么贷盲? 我笑而不...
    開(kāi)封第一講書人閱讀 58,193評(píng)論 1 292
  • 正文 為了忘掉前任淘这,我火速辦了婚禮剥扣,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘铝穷。我一直安慰自己钠怯,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,216評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布曙聂。 她就那樣靜靜地躺著晦炊,像睡著了一般。 火紅的嫁衣襯著肌膚如雪宁脊。 梳的紋絲不亂的頭發(fā)上断国,一...
    開(kāi)封第一講書人閱讀 51,182評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音榆苞,去河邊找鬼稳衬。 笑死,一個(gè)胖子當(dāng)著我的面吹牛坐漏,可吹牛的內(nèi)容都是我干的薄疚。 我是一名探鬼主播,決...
    沈念sama閱讀 40,063評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼赊琳,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼输涕!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起慨畸,我...
    開(kāi)封第一講書人閱讀 38,917評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤莱坎,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后寸士,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體檐什,經(jīng)...
    沈念sama閱讀 45,329評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,543評(píng)論 2 332
  • 正文 我和宋清朗相戀三年弱卡,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了乃正。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,722評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡婶博,死狀恐怖瓮具,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情凡人,我是刑警寧澤名党,帶...
    沈念sama閱讀 35,425評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站挠轴,受9級(jí)特大地震影響传睹,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜岸晦,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,019評(píng)論 3 326
  • 文/蒙蒙 一欧啤、第九天 我趴在偏房一處隱蔽的房頂上張望睛藻。 院中可真熱鬧,春花似錦邢隧、人聲如沸店印。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,671評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)按摘。三九已至,卻和暖如春迫靖,著一層夾襖步出監(jiān)牢的瞬間院峡,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,825評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工系宜, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留照激,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,729評(píng)論 2 368
  • 正文 我出身青樓盹牧,卻偏偏與公主長(zhǎng)得像俩垃,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子汰寓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,614評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容