成為高級(jí)大數(shù)據(jù)工程師的必備技能詳解

概述:謹(jǐn)以此文獻(xiàn)給對(duì)數(shù)據(jù)有熱情,想長(zhǎng)期從事此行業(yè)的年輕人省撑,希望對(duì)你們有所啟發(fā)赌蔑,并快速調(diào)整思路和方向,讓自己的職業(yè)生涯有更好的發(fā)展竟秫。 根據(jù)數(shù)據(jù)應(yīng)用的不同階段娃惯,我將從數(shù)據(jù)底層到最后應(yīng)用,來(lái)談?wù)勀切?shù)據(jù)人的必備技能肥败。

我自己是一個(gè)從事了6年的Java全棧工程師趾浅,最近整理了一套適合2019年學(xué)習(xí)的Java\大數(shù)據(jù)資料,從基礎(chǔ)的Java馒稍、大數(shù)據(jù)面向?qū)ο蟮竭M(jìn)階的框架知識(shí)

都有整理哦皿哨,可以來(lái)我的主頁(yè)免費(fèi)領(lǐng)取哦。

1纽谒、?大數(shù)據(jù)?平臺(tái)

目前很火证膨,數(shù)據(jù)源頭,各種炫酷新技術(shù)鼓黔,搭建Hadoop央勒、Hive、Spark请祖、Kylin订歪、Druid、Beam~肆捕,前提是你要懂Java刷晋,很多平臺(tái)都是用Java開(kāi)發(fā)的。

目前很多企業(yè)都把數(shù)據(jù)采集下來(lái)了,對(duì)于傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)眼虱,用傳統(tǒng)的數(shù)據(jù)是完全夠用的喻奥,可是對(duì)于用戶(hù)行為和點(diǎn)擊行為這些數(shù)據(jù)或者很多非結(jié)構(gòu)化的數(shù)據(jù),文本捏悬、圖像和文本類(lèi)的撞蚕,由于數(shù)據(jù)量太大,很多公司都不知道怎么進(jìn)行存儲(chǔ)过牙。

這里面要解決的是實(shí)時(shí)甥厦、近實(shí)時(shí)和離線的?大數(shù)據(jù)?框架如何搭建,各數(shù)據(jù)流之間如何耦合和解耦寇钉,如何進(jìn)行容災(zāi)刀疙、平臺(tái)穩(wěn)定、可用是需要重點(diǎn)考慮的扫倡。

我的感覺(jué)是:最近兩三年中谦秧,這塊人才還是很稀缺的,因?yàn)榇髷?shù)據(jù)概念炒作的這么厲害撵溃,很多企業(yè)都被忽悠說(shuō)疚鲤,我們也來(lái)開(kāi)始進(jìn)入大數(shù)據(jù)行業(yè)吧。進(jìn)入的前提之一就是需要把數(shù)據(jù)存儲(chǔ)下來(lái)缘挑,特別是很多用戶(hù)行為方面的數(shù)據(jù)集歇,對(duì)于業(yè)務(wù)的提升比較明顯的,如果你能很好的刻畫(huà)用戶(hù)卖哎,那么對(duì)你的產(chǎn)品設(shè)計(jì)鬼悠、市場(chǎng)營(yíng)銷(xiāo)、開(kāi)發(fā)市場(chǎng)都是有幫助的】髂龋現(xiàn)階段焕窝,很多公司都要做第一步:存儲(chǔ)更多的數(shù)據(jù)。這也是這塊人員流動(dòng)性比較高的原因维贺,都被高薪挖走了它掂。

和傳統(tǒng)的SQL不同的是,針對(duì)大數(shù)據(jù)量的非結(jié)構(gòu)式數(shù)據(jù)溯泣,我們所想的就是:用最廉價(jià)的成本存儲(chǔ)數(shù)據(jù)同時(shí)能夠達(dá)到容災(zāi)虐秋、擴(kuò)展性高、高性能垃沦、跨域客给,從目前來(lái)看,分布式已經(jīng)被證明是個(gè)很好的一個(gè)方式肢簿。

另外靶剑,云端會(huì)是個(gè)很好的方向蜻拨,不是每個(gè)公司都養(yǎng)得起這么多這么貴的大數(shù)據(jù)平臺(tái)開(kāi)發(fā)人員和運(yùn)維人員OPS,從事這個(gè)行業(yè)的我們要有很好的危機(jī)意識(shí)桩引,及時(shí)貢獻(xiàn)出自己的價(jià)值缎讼,積極主動(dòng)的學(xué)習(xí)新技術(shù)、否則就可能被淘汰了坑匠。

此外血崭,花點(diǎn)錢(qián)把數(shù)據(jù)托管給云服務(wù)提供商是對(duì)于創(chuàng)業(yè)公司或者一些傳統(tǒng)的企業(yè)來(lái)說(shuō)是個(gè)很好的思路,這樣能夠最快速的確定數(shù)據(jù)對(duì)你的價(jià)值是什么厘灼,而不用采購(gòu)這么多的服務(wù)器夹纫、雇傭這么多的運(yùn)維人員和網(wǎng)站開(kāi)發(fā)人員。

說(shuō)了以上這些设凹,主要是想給未來(lái)會(huì)從事這塊的人或者想存儲(chǔ)數(shù)據(jù)的公司一點(diǎn)方向捷凄。我自己不做這塊,體會(huì)不深围来,大家看看就行。

這塊工作最被吐槽的一點(diǎn)就是:Hive速度好慢匈睁,SQL查詢(xún)好慢监透,集群怎么又掛掉了,hadoop版本升級(jí)后航唆,怎么數(shù)據(jù)跑出來(lái)不對(duì)了等等胀蛮。

因此,在這個(gè)領(lǐng)域內(nèi)工作糯钙,需要有強(qiáng)大的攻堅(jiān)能力粪狼,并且還需要有快速定位和解決bug的能力,因?yàn)橛泻芏喙ぞ叨际情_(kāi)源的任岸。因?yàn)槭情_(kāi)源的再榄,所以你們懂得,各種坑爹享潜,甚至出現(xiàn)無(wú)法向下兼容的情況困鸥,所以需要強(qiáng)大的Java開(kāi)發(fā)能力。

如果想在這塊做的很好剑按,還需要有整個(gè)系統(tǒng)架構(gòu)的設(shè)計(jì)能力疾就、比較的強(qiáng)的抗壓能力和解決問(wèn)題的能力、資源收集的能力艺蝴,可以打入開(kāi)源社區(qū)猬腰,這樣就可以隨時(shí)follow最新的潮流和技術(shù)。

2猜敢、數(shù)據(jù)倉(cāng)庫(kù)-ETL

確實(shí)做倉(cāng)庫(kù)的人很辛苦姑荷,單單Oncall就會(huì)讓人望而卻步盒延。有很多數(shù)據(jù)庫(kù)工程師,晚上睡覺(jué)的時(shí)候經(jīng)常被Oncall電話吵醒厢拭,因?yàn)閿?shù)據(jù)流程出問(wèn)題兰英,需要第一時(shí)間去排查,是哪個(gè)數(shù)據(jù)源出問(wèn)題供鸠,并且要立即解決畦贸,否則整個(gè)數(shù)據(jù)流程都會(huì)受到影響。

如果數(shù)據(jù)流程受到了影響楞捂,你就可能會(huì)被大領(lǐng)導(dǎo)一言不合叫到辦公室說(shuō):我要的數(shù)據(jù)怎么還沒(méi)有準(zhǔn)備好薄坏,我的業(yè)務(wù)報(bào)表今天怎么沒(méi)有發(fā)出來(lái)。

通過(guò)上面這個(gè)情景寨闹,我們可以知道:這是個(gè)很重要的崗位胶坠,因?yàn)閿?shù)據(jù)流程很重要,決定了數(shù)據(jù)從源頭雜亂無(wú)章的狀況繁堡,通過(guò)ETL之后變成了整齊的數(shù)據(jù)沈善,這些整齊一致性的數(shù)據(jù)可以讓你很方便地把各業(yè)務(wù)的統(tǒng)計(jì)結(jié)果計(jì)算出來(lái),并且能夠統(tǒng)一口徑椭蹄。要不然就會(huì)變成有幾個(gè)部門(mén)闻牡,就有幾種統(tǒng)計(jì)結(jié)果,到時(shí)候A部門(mén)說(shuō)業(yè)務(wù)增長(zhǎng)了5%绳矩,B部門(mén)說(shuō)業(yè)務(wù)漲了10%罩润,OMG,到底信誰(shuí)翼馆。

至少在以下幾點(diǎn)上割以,我覺(jué)得數(shù)據(jù)倉(cāng)庫(kù)人員應(yīng)該要做好:

a、數(shù)據(jù)字典的完整性应媚,用的人都希望能夠清晰的知道這個(gè)字段的邏輯是什么严沥。字段要保持很好的一致性,不要同樣一個(gè)字段在不同表里有不同的定義中姜。

b祝峻、核心流程的穩(wěn)定性,不要讓每天訂單主表能夠使用的時(shí)間很不穩(wěn)定扎筒,有的時(shí)候很早莱找,有的時(shí)候要中午才出來(lái),如果不穩(wěn)定就會(huì)導(dǎo)致使用數(shù)據(jù)的人對(duì)你很沒(méi)有信心嗜桌。

c奥溺、倉(cāng)庫(kù)版本迭代不要過(guò)于頻繁,要保持不同版本之間的兼容性骨宠。不要做好了倉(cāng)庫(kù)1.0浮定,很快就把原來(lái)的推倒重來(lái)相满,變成了2.0。在數(shù)據(jù)倉(cāng)庫(kù)中需要考慮到延續(xù)性桦卒,主表的變動(dòng)不要太頻繁立美,否則使用的人會(huì)非常痛苦,好不容易才用習(xí)慣了1.0的表結(jié)構(gòu)方灾,沒(méi)辦法這么快進(jìn)行切換建蹄。簡(jiǎn)單地說(shuō),要能向下兼容裕偿。

d洞慎、保持各業(yè)務(wù)邏輯的統(tǒng)一性,不要出現(xiàn)同樣的業(yè)務(wù)邏輯嘿棘,同一個(gè)組別的人統(tǒng)計(jì)出來(lái)的結(jié)果不同劲腿。原因在于共同的邏輯沒(méi)有落地成通用的東西,所以導(dǎo)致每個(gè)人寫(xiě)法不同鸟妙。這點(diǎn)其實(shí)需要特別注意焦人。

針對(duì)以上,這個(gè)崗位的技能要求是:不要成為僅僅會(huì)寫(xiě)SQL的人重父,現(xiàn)在工具都很發(fā)達(dá)垃瞧,如果你的技能很單一的話,那么可替代指數(shù)是非常高的坪郭,并且你自身也沒(méi)有什么成就感。這里并不是說(shuō)會(huì)寫(xiě)SQL的人很low脉幢,只是說(shuō)應(yīng)該多學(xué)一些技能歪沃,否則會(huì)很危險(xiǎn)。

倉(cāng)庫(kù)人員應(yīng)該要常常思考嫌松,如何進(jìn)行架構(gòu)設(shè)計(jì)是最合理的沪曙,你要考慮是否需要字段冗余、行存儲(chǔ)還是列存儲(chǔ)萎羔、字段如何擴(kuò)展最有效液走,熱數(shù)據(jù)和冷數(shù)據(jù)如何拆分等,所以需要有架構(gòu)思維贾陷。

技能上缘眶,除了SQL熟練之外,還需要知道如何寫(xiě)Transform髓废,MapReduce巷懈,因?yàn)橛泻芏鄻I(yè)務(wù)邏輯用SQL實(shí)現(xiàn)起來(lái)非常復(fù)雜,但是如果你會(huì)其他腳本語(yǔ)言慌洪,那么就能給你提供便利顶燕,讓你的效率提升很多凑保。另外好的倉(cāng)庫(kù)人員需要寫(xiě)Java或者Scala,通過(guò)寫(xiě)UDTF或者UDAF來(lái)提升你的效率是很有必要的涌攻。

數(shù)據(jù)倉(cāng)庫(kù)人員也應(yīng)該常撑芬考慮自動(dòng)化和工具化方面的事情,需要很好的工具或者模塊的抽象能力恳谎,動(dòng)手實(shí)現(xiàn)自動(dòng)化的工具來(lái)提高整個(gè)組織效能芝此。針對(duì)經(jīng)常碰到的數(shù)據(jù)傾斜問(wèn)題,需要很快定位問(wèn)題并進(jìn)行優(yōu)化惠爽。

說(shuō)完了數(shù)據(jù)存儲(chǔ)這塊癌蓖,接下來(lái)是數(shù)據(jù)應(yīng)用的幾個(gè)關(guān)鍵職位,在此之前婚肆,我想說(shuō)數(shù)據(jù)應(yīng)用的一個(gè)最關(guān)鍵的前提是:數(shù)據(jù)質(zhì)量租副、數(shù)據(jù)質(zhì)量、數(shù)據(jù)質(zhì)量=闲浴用僧!在每次闡述你的觀點(diǎn)、分析結(jié)論或者用算法的時(shí)候赞咙,都需要先檢查责循,源頭數(shù)據(jù)正確性,否則任何結(jié)論都是偽命題攀操。

3院仿、數(shù)據(jù)可視化

這是個(gè)很炫的工作,最好是能懂點(diǎn)前端速和,比如js歹垫。數(shù)據(jù)可視化人員需要有很好的分析思維,不能為了炫技而忽視對(duì)業(yè)務(wù)的幫助程度颠放。因?yàn)槲覍?duì)這個(gè)崗位客串的不多排惨,所以沒(méi)有特別深入的感悟,不過(guò)我覺(jué)得這個(gè)崗位需要有分析的能力碰凶,才能把可視化做好暮芭。

另外一方面來(lái)說(shuō),做數(shù)據(jù)應(yīng)用的人都應(yīng)該懂點(diǎn)數(shù)據(jù)可視化欲低,要知道觀點(diǎn)表達(dá)的素材順序是:圖片>表格>文字辕宏,一個(gè)能夠用圖片來(lái)闡述的機(jī)會(huì)千萬(wàn)別用文字來(lái)描述,因?yàn)檫@樣更易于讓別人理解砾莱。要知道匾效,給大領(lǐng)導(dǎo)講解事情的時(shí)候,需要把大領(lǐng)導(dǎo)設(shè)想成是個(gè)“數(shù)據(jù)白癡”恤磷,這樣才能把一件事情說(shuō)的比較生動(dòng)面哼。

4野宜、?數(shù)據(jù)分析?師

現(xiàn)在對(duì)數(shù)據(jù)分析的需求是很大的,因?yàn)榇蠹叶枷胫f(shuō):數(shù)據(jù)有了魔策,但是能做些什么呢匈子?這就需要有數(shù)據(jù)分析師,對(duì)數(shù)據(jù)進(jìn)行分析和挖掘闯袒,然后做數(shù)據(jù)應(yīng)用虎敦。

對(duì)數(shù)據(jù)分析師吐槽最多的是:你分析出來(lái)的不就是正常的業(yè)務(wù)邏輯嗎,還需要你分析什么政敢?或者是你分析的結(jié)論不對(duì)其徙,跟我們的業(yè)務(wù)邏輯不符合。特別是:ABTest的結(jié)果和當(dāng)初設(shè)定的預(yù)期不相符合的時(shí)候喷户,分析師會(huì)常常被拉過(guò)去說(shuō):分析一下唾那,為什么我的AB實(shí)驗(yàn)結(jié)果不顯著蕾管,里面肯定有原因的粘优。

很多時(shí)候,寶寶的心里苦啊颜懊,你說(shuō)這個(gè)轉(zhuǎn)化率下降了河哑,從數(shù)據(jù)上可以看出哪個(gè)細(xì)分渠道下降了避诽,至于為什么客戶(hù)不下單,我們得去用戶(hù)去璃谨,很多時(shí)候沙庐,數(shù)據(jù)上也體現(xiàn)不出來(lái)為什么,只能告訴你現(xiàn)狀是什么佳吞。

如果你一直在寫(xiě)分析報(bào)告拱雏,給結(jié)論中,持續(xù)周而復(fù)始容达,沒(méi)有直接在業(yè)務(wù)中體現(xiàn)成績(jī)的時(shí)候,數(shù)據(jù)分析師們?cè)撔研蚜舜谷阍撓胂脒@個(gè)是你要的崗位嗎花盐?

對(duì)于數(shù)據(jù)分析師的定位:個(gè)人認(rèn)為,成為優(yōu)秀的數(shù)據(jù)分析師是非常難的菇爪,現(xiàn)在市面上也沒(méi)有多少優(yōu)秀的分析師算芯。數(shù)據(jù)分析師的技能要求,除了會(huì)數(shù)據(jù)分析凳宙、提煉結(jié)論熙揍、洞察數(shù)據(jù)背后的原因之外,還需要了解業(yè)務(wù)氏涩,懂算法届囚。只有這樣有梆,當(dāng)面對(duì)一個(gè)業(yè)務(wù)問(wèn)題時(shí),數(shù)據(jù)分析師們才可以針對(duì)問(wèn)題抽絲剝繭意系,層層遞進(jìn)去解決問(wèn)題泥耀,再根據(jù)定位的問(wèn)題進(jìn)行策略的應(yīng)對(duì),比如是先做上策略進(jìn)行測(cè)試還是應(yīng)用算法進(jìn)行優(yōu)化蛔添,用算法用在哪個(gè)場(chǎng)景上痰催,能不能用算法來(lái)解決問(wèn)題。

一個(gè)優(yōu)秀的數(shù)據(jù)分析師迎瞧,是個(gè)精通業(yè)務(wù)和算法的全能數(shù)據(jù)科學(xué)家夸溶,不是那個(gè)只會(huì)聽(tīng)從業(yè)務(wù)的需求而進(jìn)行拉數(shù)據(jù)、做報(bào)表凶硅、只做分析的閑雜人等缝裁。我們都說(shuō)分析要給出結(jié)論,優(yōu)秀分析師的結(jié)論就是一個(gè)能解決問(wèn)題的一攬子策略和應(yīng)對(duì)措施咏尝,同時(shí)很多需求是分析師去主動(dòng)發(fā)現(xiàn)并通過(guò)數(shù)據(jù)來(lái)挖掘出來(lái)的压语。

從上述描述中,可以看到對(duì)數(shù)據(jù)分析師的要求是:會(huì)寫(xiě)sql拉數(shù)據(jù)编检,精通業(yè)務(wù)胎食、會(huì)數(shù)據(jù)洞察、精通算法允懂,主動(dòng)性強(qiáng)厕怜,要求還是很高的。

如果你一直只是忙于應(yīng)付日常分析需求蕾总,熱衷于寫(xiě)華麗的報(bào)告粥航,那么你要記得,你很危險(xiǎn)生百,因?yàn)闀?huì)有一堆人在那里質(zhì)疑你存在的價(jià)值递雀,特別是小公司。因?yàn)閿?shù)據(jù)人員的薪資是個(gè)不小的支出蚀浆。

大部分不落地的分析都是偽分析缀程,有一些探索性的可行性研究可以不考慮落地,但是其他的特定業(yè)務(wù)需求的分析都需要考慮落地市俊,然后通過(guò)實(shí)踐來(lái)反推你的作用杨凑,如此反復(fù),才能慢慢的給你價(jià)值的肯定摆昧,同時(shí)提升你的分析技能撩满,也只有這樣才能證明你作為分析師、數(shù)據(jù)落地者的價(jià)值。

5伺帘、數(shù)據(jù)挖掘/算法

這塊的話昭躺,經(jīng)過(guò)這三年的摸爬滾打,感觸蠻多的曼追。體會(huì)比較深的吐槽主要有以下幾點(diǎn):

一個(gè)規(guī)則搞定了窍仰,還用什么算法。

你的準(zhǔn)確率怎么這么低礼殊?驹吮!

你的準(zhǔn)確率可以到99%嗎?

你的推薦有價(jià)值嗎晶伦?你不推薦客人也會(huì)下那個(gè)產(chǎn)品的訂單的碟狞。

幫我做個(gè)大數(shù)據(jù)預(yù)測(cè)他想要什么?

很多時(shí)候婚陪,不同的場(chǎng)景對(duì)準(zhǔn)確率的要求是不同的族沃,所以在一定合理的場(chǎng)景下和業(yè)務(wù)進(jìn)行據(jù)理力爭(zhēng)是必要,不要害怕讓業(yè)務(wù)吐槽泌参,更多的時(shí)候管理好他們的預(yù)期脆淹。

有些場(chǎng)景下,推薦的價(jià)值在于『長(zhǎng)期復(fù)購(gòu)率』沽一,所以不要每次都盯著ABTest的轉(zhuǎn)化率來(lái)說(shuō)事盖溺,讓客人的費(fèi)力度降低也是很有前途和前景的。一個(gè)智能的產(chǎn)品會(huì)讓客人用起來(lái)愛(ài)不釋手铣缠,雖然在這一次的轉(zhuǎn)化中沒(méi)有明顯的差別烘嘱,但是觀察長(zhǎng)期復(fù)購(gòu)率才能體現(xiàn)價(jià)值。特別是要區(qū)分:高頻和低頻產(chǎn)品蝗蛙。頻次比較低的產(chǎn)品就特別難體現(xiàn)出短期價(jià)值蝇庭。

對(duì)于這個(gè)崗位的技能要求來(lái)說(shuō),沒(méi)有要求你一定要從零開(kāi)始實(shí)現(xiàn)所有的算法捡硅,現(xiàn)在有很多現(xiàn)成的算法包進(jìn)行調(diào)用哮内。最基本的要求是,你要知道每個(gè)場(chǎng)景會(huì)用到哪個(gè)算法壮韭,比如分類(lèi)場(chǎng)景北发,常用的分類(lèi)算法就有LR/RF/Xgboost/ET等等,此外泰涂,你還要知道每個(gè)算法的有效優(yōu)化參數(shù)是什么鲫竞、模型效果不好的時(shí)候怎么優(yōu)化辐怕。還需要有算法的實(shí)現(xiàn)能力逼蒙,語(yǔ)言方面可以用Scala/python/R/Java等。我們常說(shuō):工具不重要寄疏,重要的是你玩工具是牢,不是工具玩你僵井。

另外針對(duì)有監(jiān)督式學(xué)習(xí)算法,算法工程師最好有很好的業(yè)務(wù)sense驳棱,這樣在feature設(shè)計(jì)的時(shí)候才能更有針對(duì)性批什,設(shè)計(jì)的feature才有可能有很好的先驗(yàn)性。

6社搅、深度學(xué)習(xí)(NLP驻债,CNN,語(yǔ)音識(shí)別)

這塊我沒(méi)具體商用過(guò)形葬,只是動(dòng)手實(shí)踐過(guò)合呐。個(gè)人感覺(jué)商業(yè)化是重點(diǎn)吧,特別是大家都在觀望說(shuō)你的chatbot很有用啊笙以,可是siri做了這么久淌实,最后反響也一般。

現(xiàn)在客服機(jī)器人又很火猖腕,大家又在一通吐槽說(shuō)拆祈,這個(gè)上下文理解的太差了,機(jī)器人的語(yǔ)義識(shí)別做的怎么這么差倘感。誰(shuí)做誰(shuí)知道放坏,對(duì)于中文的語(yǔ)義識(shí)別,難度比國(guó)外的難多了侠仇,因?yàn)橹形牡囊环N否定說(shuō)法有太多種變體轻姿,你不知道我們會(huì)說(shuō)哪種。

另外逻炊,常常有人吐槽說(shuō)互亮,你這個(gè)CNN這么復(fù)雜,我線上需要滿足100ms內(nèi)返回余素,搞的這么復(fù)雜豹休,實(shí)時(shí)調(diào)用怎么整,肯定來(lái)不及了桨吊,最后只能考慮offline預(yù)測(cè)了威根。常常說(shuō)這話的人,是不會(huì)自己寫(xiě)底層代碼的视乐,很多時(shí)候我覺(jué)得:不是你沒(méi)有解決問(wèn)題的辦法洛搀,而是你沒(méi)有去思考怎么解決問(wèn)題,心智決定了你的產(chǎn)出佑淀。

整體來(lái)說(shuō)留美,這塊對(duì)個(gè)人的綜合素質(zhì)要求是很高的。如果你只是想簡(jiǎn)單利用現(xiàn)成的Model,提取中間層的特征谎砾,然后再套用其他的機(jī)器學(xué)習(xí)模型進(jìn)行預(yù)測(cè)的話逢倍,倒也能很好的解決一些現(xiàn)實(shí)中的公司應(yīng)用,比如yelp的圖片分類(lèi)景图。

不過(guò)较雕,嚴(yán)格來(lái)說(shuō),這個(gè)不算是做深度學(xué)習(xí)的人挚币,因?yàn)檎嬲鍰L的人亮蒋,是需要自己動(dòng)手建模型,調(diào)參數(shù)妆毕,改symbol的宛蚓,所以他們的編程能力是很強(qiáng)的,這點(diǎn)上设塔,我一直都高山仰止凄吏。特別是一些創(chuàng)業(yè)公司,對(duì)于這個(gè)崗位的編程能力要求很高闰蛔。如果你面試創(chuàng)業(yè)公司后沒(méi)有下文了那就表示:你很優(yōu)秀痕钢,但是不一定適合我們公司,因?yàn)槲覀円业木幊棠芰軓?qiáng)的人序六。

這塊我不專(zhuān)業(yè)任连,所以就點(diǎn)到為止,不說(shuō)太多例诀。個(gè)人認(rèn)為随抠,在這塊上需要有比較強(qiáng)的算法改造和優(yōu)化能力,盡量的提高算法預(yù)測(cè)的速度繁涂,同時(shí)不斷的提高算法的外延性提高精度拱她,目前整個(gè)行業(yè)也都是朝著好的方向在發(fā)展。如果有很多人看到這塊行業(yè)開(kāi)出來(lái)的高工資扔罪,記得和招聘上的要求核對(duì)一下秉沼,自己哪塊技能需要補(bǔ)充。這樣你才能成為人中之鳳矿酵。

對(duì)于未來(lái)唬复,一片光明,對(duì)于未來(lái)全肮,甚是期待敞咧,對(duì)于未來(lái),一切可能辜腺。

總結(jié)

以上說(shuō)了這么多休建,嘮叨了這么多柱锹,其實(shí)核心就是:?如何用數(shù)據(jù)創(chuàng)造價(jià)值,如果你沒(méi)有用數(shù)據(jù)創(chuàng)造價(jià)值的能力丰包,那么就只能等著被數(shù)據(jù)淹沒(méi),被數(shù)據(jù)拍死在職場(chǎng)上壤巷,早早到達(dá)職業(yè)的天花板邑彪。

體現(xiàn)數(shù)據(jù)價(jià)值的層面上,越往數(shù)據(jù)應(yīng)用層靠攏胧华,對(duì)數(shù)據(jù)產(chǎn)生價(jià)值的要求就越高寄症,從事這塊領(lǐng)域的人要常常自省是否有好的商業(yè)Sense,畢竟在工業(yè)界矩动,沒(méi)人關(guān)心你是否比傳統(tǒng)的baseline提高了一個(gè)百分點(diǎn)有巧,他們關(guān)心的是你提高了一個(gè)百分點(diǎn)之后,對(duì)公司的價(jià)值是什么悲没。

而越往底層那塊篮迎,倒也沒(méi)有強(qiáng)制要求和業(yè)績(jī)綁定在一起,更多的是從流程上進(jìn)行約定示姿,對(duì)于這塊的價(jià)值體現(xiàn)甜橱,主要從技術(shù)層面上的創(chuàng)新為主,你如果解決了現(xiàn)存架構(gòu)的問(wèn)題栈戳,那么你就可以成為一個(gè)大牛岂傲,所以多學(xué)學(xué)編程吧,別太約束自己子檀,故步自封镊掖。

我自己是一個(gè)從事了6年的Java全棧工程師,最近整理了一套適合2019年學(xué)習(xí)的Java\大數(shù)據(jù)資料褂痰,從基礎(chǔ)的Java亩进、大數(shù)據(jù)面向?qū)ο蟮竭M(jìn)階的框架知識(shí)

都有整理哦,可以來(lái)我的主頁(yè)免費(fèi)領(lǐng)取哦缩歪。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末镐侯,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子驶冒,更是在濱河造成了極大的恐慌苟翻,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,198評(píng)論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件骗污,死亡現(xiàn)場(chǎng)離奇詭異崇猫,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)需忿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門(mén)诅炉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)蜡歹,“玉大人,你說(shuō)我怎么就攤上這事涕烧≡露” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 167,643評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵议纯,是天一觀的道長(zhǎng)父款。 經(jīng)常有香客問(wèn)我,道長(zhǎng)瞻凤,這世上最難降的妖魔是什么憨攒? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,495評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮阀参,結(jié)果婚禮上肝集,老公的妹妹穿的比我還像新娘。我一直安慰自己蛛壳,他們只是感情好杏瞻,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著衙荐,像睡著了一般伐憾。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上赫模,一...
    開(kāi)封第一講書(shū)人閱讀 52,156評(píng)論 1 308
  • 那天树肃,我揣著相機(jī)與錄音,去河邊找鬼瀑罗。 笑死胸嘴,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的斩祭。 我是一名探鬼主播劣像,決...
    沈念sama閱讀 40,743評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼摧玫!你這毒婦竟也來(lái)了耳奕?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,659評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤诬像,失蹤者是張志新(化名)和其女友劉穎屋群,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體坏挠,經(jīng)...
    沈念sama閱讀 46,200評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡芍躏,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了降狠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片对竣。...
    茶點(diǎn)故事閱讀 40,424評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡庇楞,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出否纬,到底是詐尸還是另有隱情吕晌,我是刑警寧澤,帶...
    沈念sama閱讀 36,107評(píng)論 5 349
  • 正文 年R本政府宣布临燃,位于F島的核電站睛驳,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏谬俄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評(píng)論 3 333
  • 文/蒙蒙 一弃理、第九天 我趴在偏房一處隱蔽的房頂上張望溃论。 院中可真熱鬧,春花似錦痘昌、人聲如沸钥勋。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,264評(píng)論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)算灸。三九已至,卻和暖如春驻啤,著一層夾襖步出監(jiān)牢的瞬間菲驴,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,390評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工骑冗, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赊瞬,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,798評(píng)論 3 376
  • 正文 我出身青樓贼涩,卻偏偏與公主長(zhǎng)得像巧涧,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子遥倦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容