面試(數(shù)倉打工人)

記錄一下 2021-03
最近在面試,總結(jié)一下面試技巧,我應(yīng)聘的是數(shù)倉工程師,其實(shí)技術(shù)含金量不是很高,好幾個(gè)同學(xué)連SQL都沒寫,連spark都沒問,算法也沒有就直接入職了,啊這,,,,我很羨慕.....,很多大/中型公司的數(shù)倉都還在建,比如喜馬拉雅去年才開始建,游族網(wǎng)絡(luò)甚至是從零開始,米哈游也是從零開始.....,有完善的數(shù)倉還得是銀行系/保險(xiǎn)系/阿里系.....個(gè)人喜歡二次元......不知道有沒有有希望......,總結(jié)一下回答技巧,分享給讀者

1.雜項(xiàng)

1.如何自我介紹

1.基本情況
2.最近一段時(shí)間的工作經(jīng)驗(yàn)
介紹一個(gè)你最熟悉 技術(shù)棧最豐富的項(xiàng)目(當(dāng)前項(xiàng)目的價(jià)值及項(xiàng)目的技術(shù)體系 你負(fù)責(zé)的主要模塊以及你解決的主要問題)
3.對(duì)該公司的了解,行業(yè)解決方案

2.如何陳述自己的項(xiàng)目

我要改進(jìn)一下我的項(xiàng)目,項(xiàng)目太拉胯了......
如何陳述我的項(xiàng)目:
核心部分,技術(shù)棧

3.如何回答自己會(huì)的題目

總分

4.如何回答自己不會(huì)的題目
5.如何談薪資
6.你有什么要問我的嗎

HR:內(nèi)部的福利內(nèi)容 晉升機(jī)制 公司的規(guī)模(技術(shù)組)
技術(shù)官:內(nèi)部的技術(shù)培訓(xùn) 有沒有內(nèi)部的技術(shù)分享 公司在當(dāng)前行業(yè)解決方案中用了哪些技術(shù),我回去學(xué)習(xí)一下

2.引導(dǎo)面試官

大表join大表的問題怎么處理
hive數(shù)據(jù)傾斜的處理方法
spark中的shuffle機(jī)制 join機(jī)制 shuffle底層的shufflerdd算法等
維度建模的方法論與實(shí)際生產(chǎn)結(jié)合起來
表和表之間的關(guān)系

3.描述(照著我這個(gè)改改就行了)

基本介紹

您好面試官,我叫.....,來自....我面試的崗位是數(shù)倉工程師
我在上一家公司主要做的是ETL的開發(fā),與業(yè)務(wù)系統(tǒng)的DBA同事溝通交流,處理數(shù)據(jù)的增量和全量的導(dǎo)入問題,與前端同時(shí)溝通數(shù)據(jù)的埋點(diǎn)相關(guān)工作,以及處理數(shù)據(jù)完整性和規(guī)范性的問題,用戶主題模塊的維護(hù)和報(bào)表的開發(fā)工作,用戶連續(xù)登陸,留存問題,活躍度問題,訪問間隔問題,訪問偏好問題,用戶的基本畫像標(biāo)簽的開發(fā)工作,指標(biāo)報(bào)表的開發(fā)(例如哪類書籍閱讀的人數(shù)多,由電子書轉(zhuǎn)化到實(shí)體書的轉(zhuǎn)化率是多少),還有平時(shí)一些活動(dòng)指標(biāo)的開發(fā)(這次的活動(dòng)做的怎么樣).第三個(gè)部分是負(fù)責(zé)庫存模塊的開發(fā)和設(shè)計(jì),與零售模塊的統(tǒng)一,是我做的最有挑戰(zhàn)的事情
我對(duì)....你們公司的了解,大學(xué)期間我也考取了相關(guān)的證書,對(duì)你們的行業(yè)業(yè)務(wù)也有所了解,我認(rèn)為精準(zhǔn)營(yíng)銷和質(zhì)量的指標(biāo)分析和建模是重要的
對(duì)于我的技術(shù)棧(主要的) hadoop hive spark flink(目前正在學(xué)習(xí))

項(xiàng)目介紹

首先提出難題:溝通的問題 大表和大表的join的性能問題 對(duì)shuffle的處理 數(shù)據(jù)傾斜的處理 SQL可解釋性和結(jié)構(gòu)化的處理 數(shù)據(jù)倉庫系統(tǒng)的可迭代工作 spark算子的優(yōu)化工作 緩慢變化維的處理 (引導(dǎo)面試官來問你這些問題)
有一個(gè)重要的注意事項(xiàng)是:要結(jié)合公司的業(yè)務(wù)來講述項(xiàng)目.避免空洞
重點(diǎn)介紹維度建模(庫存的方法論),照著我那個(gè)庫存模塊的示例來講就行了

對(duì)于用戶主題模塊的報(bào)表的分析與邏輯化(好好梳理一下)
基于流量用戶主題的分析,基于日志采集enent_app_detail表進(jìn)行輕度的聚合(按照session字段)生成我們的數(shù)倉架構(gòu)的一張非常重要的一張表traffic_aggr_session
,基于這樣表我們可以衍生出流量聚合表,多維組合表,同時(shí)我們可以對(duì)用戶進(jìn)行分析,例如生成我們的用戶活躍度表(我們可以分析的指標(biāo)有用戶留存 轉(zhuǎn)化 連續(xù)登陸 連續(xù)活躍 訪問間隔 新用戶留存報(bào)表以及用戶事件分析報(bào)表的開發(fā) ),同時(shí)我們經(jīng)常會(huì)有一些優(yōu)惠的活動(dòng)我們就需要對(duì)該活動(dòng)進(jìn)行分析,例如是漏斗分析 歸因分析 點(diǎn)擊分析,行為路徑 等(基于我hexo上的博客)

我在工作中的一些困難,例如數(shù)據(jù)質(zhì)量的問題(數(shù)據(jù)治理),對(duì)于多源數(shù)據(jù)過程的數(shù)據(jù)捕獲的問題,還有歸因分析的處理

對(duì)于整個(gè)數(shù)倉架構(gòu)的描述:
我們的項(xiàng)目分為這樣幾個(gè)部分:數(shù)據(jù)的采集和埋點(diǎn) 業(yè)務(wù)數(shù)據(jù)系統(tǒng)數(shù)據(jù)的增量和全量的導(dǎo)入 DWD層維度建模的方法論 DWS層的大寬表的建立

待補(bǔ)充.......
用戶獲取、用戶激活结借、用戶留存靶橱、用戶收益以及用戶傳播。(AARRR)
表名的設(shè)計(jì)
數(shù)據(jù)采集標(biāo)簽
ABT
DNA

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末贞远,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖泰涂,帶你破解...
    沈念sama閱讀 211,042評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異辐怕,居然都是意外死亡逼蒙,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門寄疏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來是牢,“玉大人,你說我怎么就攤上這事陕截⊙梗” “怎么了?”我有些...
    開封第一講書人閱讀 156,674評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵艘策,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我渊季,道長(zhǎng)朋蔫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評(píng)論 1 283
  • 正文 為了忘掉前任却汉,我火速辦了婚禮驯妄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘合砂。我一直安慰自己青扔,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評(píng)論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著微猖,像睡著了一般谈息。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上凛剥,一...
    開封第一講書人閱讀 49,749評(píng)論 1 289
  • 那天侠仇,我揣著相機(jī)與錄音,去河邊找鬼犁珠。 笑死逻炊,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的犁享。 我是一名探鬼主播余素,決...
    沈念sama閱讀 38,902評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼炊昆!你這毒婦竟也來了桨吊?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,662評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤窑眯,失蹤者是張志新(化名)和其女友劉穎屏积,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體磅甩,經(jīng)...
    沈念sama閱讀 44,110評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡炊林,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了卷要。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片渣聚。...
    茶點(diǎn)故事閱讀 38,577評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖僧叉,靈堂內(nèi)的尸體忽然破棺而出奕枝,到底是詐尸還是另有隱情,我是刑警寧澤瓶堕,帶...
    沈念sama閱讀 34,258評(píng)論 4 328
  • 正文 年R本政府宣布隘道,位于F島的核電站,受9級(jí)特大地震影響郎笆,放射性物質(zhì)發(fā)生泄漏谭梗。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評(píng)論 3 312
  • 文/蒙蒙 一宛蚓、第九天 我趴在偏房一處隱蔽的房頂上張望激捏。 院中可真熱鬧,春花似錦凄吏、人聲如沸远舅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽图柏。三九已至序六,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間爆办,已是汗流浹背难咕。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評(píng)論 1 264
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留距辆,地道東北人余佃。 一個(gè)月前我還...
    沈念sama閱讀 46,271評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像跨算,于是被迫代替她去往敵國(guó)和親爆土。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容