數(shù)據(jù)的一些思考

一位岔、背景

最近領(lǐng)導(dǎo)和團(tuán)隊溝通,想提高數(shù)據(jù)建模團(tuán)隊的能力堡牡。結(jié)合自己工作的經(jīng)驗和朋友的交流抒抬,來總結(jié)下如何去做。

二晤柄、我做過什么

很多大數(shù)據(jù)數(shù)據(jù)倉庫人員都是從事過傳統(tǒng)BI業(yè)務(wù)或者數(shù)據(jù)庫業(yè)務(wù)的擦剑。傳統(tǒng)BI一般都是Oracle存儲過程,O是真的牛,很多銀行和電力業(yè)務(wù)目前還是存儲過程寫的業(yè)務(wù)代碼惠勒。自己曾經(jīng)親身經(jīng)歷過赚抡,兩千行的業(yè)務(wù)package,寫起來和改起來特別有“成就感”纠屋!后來聽說了Hadoop涂臣,網(wǎng)上自己自己找資料,Win環(huán)境搭建了起來售担,現(xiàn)在去百度還能搜到那篇文章赁遗。后來再也不推薦別人去碰Win搭建Hadoop!


后來機(jī)遇灼舍,進(jìn)了大數(shù)據(jù)行業(yè)吼和,參與主導(dǎo)了一些大數(shù)據(jù)從無到有的建設(shè)過程。真的很感謝那段晚上十點后回家的歲月骑素,還有工作中的伙伴炫乓,這段工作算是自己的一個能力的很大提升。從沒有接觸過Linux到寫過近1000行的數(shù)據(jù)處理腳本献丑,現(xiàn)在公司應(yīng)該還在用吧末捣。接觸運維了百億級別數(shù)據(jù)聚合秒出的Vertica (商業(yè)軟件真好用),建了一個100多人的技術(shù)交流群创橄,雖然不活躍箩做,但確實幫到很多人。(還專門申請了一個Vertica的域名妥畏,部署了自己博客 http://vertica.club/ ,又該續(xù)費了……)

了解了zeppelin邦邦,參與了早期的一些功能建議和驗證,雖然后來工作中沒用到醉蚁,自己也沒有再跟社區(qū)燃辖,但這個工具真好用,這是專門給數(shù)據(jù)人的工具网棍,非常好黔龟,可以寫出很漂亮的數(shù)據(jù)報告。(下面找我名字吧…)



三滥玷、數(shù)據(jù)人應(yīng)該做什么

還是說說我熟悉的數(shù)據(jù)倉庫建設(shè)氏身。個人認(rèn)為數(shù)據(jù)人員可以走兩個大方向提升自己(當(dāng)然數(shù)倉理論知識必須得掌握),一惑畴、精通業(yè)務(wù)蛋欣,熟練SQL,加強(qiáng)工程能力如贷。記住工程能力很重要豁状!二捉偏、了解算法,掌握PYTHON泻红,熟練做分析夭禽。我是那種什么都想做的人……

1)、精通業(yè)務(wù)谊路,就要做到業(yè)務(wù)指標(biāo)的標(biāo)準(zhǔn)由你說了算讹躯,努力成為業(yè)務(wù)專家,參與一些重要指標(biāo)的定義缠劝。比如去看公司的Wiki潮梯,通過在公司熟悉的同事找到業(yè)務(wù)架構(gòu)負(fù)責(zé)人,了解相關(guān)資料惨恭。

2)秉馏、熟練SQL,并不僅僅是熟練寫脱羡。要做到了解SQL的執(zhí)行計劃萝究,掌握執(zhí)行數(shù)據(jù)庫環(huán)境的調(diào)優(yōu)。當(dāng)然很多人會說這是DBA做的工作锉罐,但是數(shù)據(jù)人應(yīng)該比DBA寫的SQL多吧帆竹,當(dāng)你發(fā)現(xiàn)你寫的一段邏輯能從1個小時優(yōu)化到5分鐘,你就會發(fā)現(xiàn)這是多有成就感脓规。掌握數(shù)據(jù)庫栽连,要從數(shù)據(jù)庫的存儲架構(gòu)出發(fā),掌握數(shù)據(jù)庫的簡單管理侨舆,熟練應(yīng)用場景秒紧。最終你掌握幾種數(shù)據(jù)庫使用后,你會發(fā)現(xiàn)你能夠幫助公司或部門做數(shù)據(jù)庫選型了挨下。

算法這個筆者自己現(xiàn)在還沒真正入門噩茄,學(xué)習(xí)中……,歡迎大神帶進(jìn)門复颈!

四、如何做

1)沥割,既然是做大數(shù)據(jù)的數(shù)據(jù)倉庫耗啦,對大數(shù)據(jù)各個組件要有了解,對大數(shù)據(jù)整個處理架構(gòu)要有了解机杜,從數(shù)據(jù)采集帜讲,到處理,再到數(shù)據(jù)展示椒拗,數(shù)據(jù)運營等似将,都需要了解获黔。推薦一本書《大數(shù)據(jù)之路》,很感謝上家公司選購了這本書在验,給員工看玷氏。

2),SQL 熟能生巧腋舌,其實可以嘗試用SQL寫一些小工具盏触,記得自己15年的時候閑暇寫了一個身份證解析的包,大家用著很不錯块饺。附上代碼 :https://blog.csdn.net/windyqcf/article/details/46048657

3)赞辩,養(yǎng)成筆記的習(xí)慣,記得剛開始接觸Vertica數(shù)據(jù)庫的時候授艰,自己上網(wǎng)百度辨嗽,很少有資料,沒辦法淮腾,只能自己看英文版的官方文檔糟需,在自己的環(huán)境和工作中嘗試總結(jié),形成博客来破,慢慢發(fā)現(xiàn)自己積累了很多篮灼。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市徘禁,隨后出現(xiàn)的幾起案子诅诱,更是在濱河造成了極大的恐慌,老刑警劉巖送朱,帶你破解...
    沈念sama閱讀 211,123評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件娘荡,死亡現(xiàn)場離奇詭異,居然都是意外死亡驶沼,警方通過查閱死者的電腦和手機(jī)炮沐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來回怜,“玉大人大年,你說我怎么就攤上這事∮裎恚” “怎么了翔试?”我有些...
    開封第一講書人閱讀 156,723評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長复旬。 經(jīng)常有香客問我垦缅,道長,這世上最難降的妖魔是什么驹碍? 我笑而不...
    開封第一講書人閱讀 56,357評論 1 283
  • 正文 為了忘掉前任壁涎,我火速辦了婚禮凡恍,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘怔球。我一直安慰自己嚼酝,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,412評論 5 384
  • 文/花漫 我一把揭開白布庞溜。 她就那樣靜靜地躺著革半,像睡著了一般。 火紅的嫁衣襯著肌膚如雪流码。 梳的紋絲不亂的頭發(fā)上又官,一...
    開封第一講書人閱讀 49,760評論 1 289
  • 那天,我揣著相機(jī)與錄音漫试,去河邊找鬼六敬。 笑死,一個胖子當(dāng)著我的面吹牛驾荣,可吹牛的內(nèi)容都是我干的外构。 我是一名探鬼主播,決...
    沈念sama閱讀 38,904評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼播掷,長吁一口氣:“原來是場噩夢啊……” “哼审编!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起歧匈,我...
    開封第一講書人閱讀 37,672評論 0 266
  • 序言:老撾萬榮一對情侶失蹤垒酬,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后件炉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體勘究,經(jīng)...
    沈念sama閱讀 44,118評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,456評論 2 325
  • 正文 我和宋清朗相戀三年斟冕,在試婚紗的時候發(fā)現(xiàn)自己被綠了口糕。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,599評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡磕蛇,死狀恐怖景描,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情秀撇,我是刑警寧澤超棺,帶...
    沈念sama閱讀 34,264評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站捌袜,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏炸枣。R本人自食惡果不足惜虏等,卻給世界環(huán)境...
    茶點故事閱讀 39,857評論 3 312
  • 文/蒙蒙 一弄唧、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧霍衫,春花似錦候引、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至柠傍,卻和暖如春麸俘,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背惧笛。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評論 1 264
  • 我被黑心中介騙來泰國打工从媚, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人患整。 一個月前我還...
    沈念sama閱讀 46,286評論 2 360
  • 正文 我出身青樓拜效,卻偏偏與公主長得像,于是被迫代替她去往敵國和親各谚。 傳聞我的和親對象是個殘疾皇子紧憾,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,465評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 授權(quán)信息 請第三方(非商業(yè)機(jī)構(gòu))轉(zhuǎn)載時在轉(zhuǎn)載內(nèi)容前添加下列文字:「本文作者為高豐@開放數(shù)據(jù)中國,內(nèi)容授權(quán)于知識共享...
    Feng閱讀 2,640評論 1 9
  • 6紐約時報報導(dǎo)昌渤,數(shù)據(jù)已經(jīng)成為一類新的經(jīng)濟(jì)資產(chǎn)赴穗,就像貨幣或者是黃金一樣;CNBC這樣比喻愈涩,數(shù)據(jù)就像新型石油一樣望抽,經(jīng)過...
    尋葉亭閱讀 618評論 0 2
  • 第三章 數(shù)據(jù)庫系統(tǒng) 3.1 數(shù)據(jù)庫管理系統(tǒng)的類型 通常有多個分類標(biāo)準(zhǔn)。如按數(shù)據(jù)模型分類履婉、按用戶數(shù)分類煤篙、按數(shù)據(jù)庫分布...
    步積閱讀 2,687評論 0 7
  • 中午的公交上響起黃耀明的《四季歌》,想起許多以為淡忘的事毁腿。 人的記憶是種很神奇的東西辑奈,似乎無論塵封多久的回憶總有一...
    王滾滾打小怪獸閱讀 228評論 0 0
  • 或許 我已經(jīng)走到了 生命的黃昏 回頭再看看 假如 ,已烤,鸠窗, 假如 我年少有為 或許 我的未來 會和自己心中的她 漫...
    幽然南閱讀 162評論 0 0