如果你想要在數(shù)據(jù)科學(xué)方向發(fā)展蔗牡,避免這9個代價不菲的初學(xué)者錯誤颖系,你能夠免去數(shù)天,數(shù)周甚至數(shù)月的受挫辩越。
如果您不小心嘁扼,這些錯誤將會消耗您最寶貴的資源:您的時間,精力和動力区匣。
我們將它們分為三類:
- 學(xué)習(xí)數(shù)據(jù)科學(xué)時的錯誤
- 申請工作時的錯誤
- 工作面試中的錯誤
何時學(xué)習(xí)數(shù)據(jù)科學(xué)
第一套錯誤是“臥底”偷拔,很難發(fā)現(xiàn)蒋院。他們慢慢地亏钩,但肯定會耗盡你的時間和精力,而不會給你警告欺旧,他們從這個領(lǐng)域的誤解中產(chǎn)生姑丑。
1. 花費(fèi)太多時間在理論上。
許多初學(xué)者陷入了花費(fèi)太多時間在理論上的陷阱辞友,無論是數(shù)學(xué)相關(guān)(線性代數(shù)栅哀,統(tǒng)計(jì)學(xué)等)還是機(jī)器學(xué)習(xí)相關(guān)的(算法,派生等)称龙。
這種方法效率低下有三個主要原因:
- 首先留拾,這是緩慢而艱巨的。如果你曾經(jīng)感到所有學(xué)習(xí)的內(nèi)容都非常費(fèi)解鲫尊,你可能已深陷陷阱痴柔。
- 第二,你也不會保留這些概念疫向。數(shù)據(jù)科學(xué)是一個應(yīng)用領(lǐng)域咳蔚,鞏固技能的最佳方法是通過實(shí)踐。
- 最后搔驼,如果你不能看到你正在學(xué)習(xí)的東西如何和現(xiàn)實(shí)聯(lián)系起來谈火,那么會增加你變得消極想要放棄的風(fēng)險。
這種重視理論的方法是學(xué)術(shù)界教授的傳統(tǒng)論調(diào)舌涨,但大多數(shù)從業(yè)者更易從結(jié)果導(dǎo)向中受益糯耍。
為了避免這個錯誤:
- 平衡花費(fèi)在研究與提供實(shí)踐機(jī)會的項(xiàng)目的時間。
- 學(xué)會對部分知識不求甚解。隨著進(jìn)度温技,你自然會填補(bǔ)空白啦租。
- 了解每件作品如何適應(yīng)背景。
2.從頭編寫太多的算法荒揣。
下一個錯誤也會導(dǎo)致學(xué)生為了一棵樹錯過一片森林篷角。在最初,你真的不需要從頭開始編寫每個算法系任。
雖然實(shí)現(xiàn)一些只是為了學(xué)習(xí)目的很好恳蹲,但現(xiàn)實(shí)是算法正在成為商品。由于成熟的機(jī)器學(xué)習(xí)庫和基于云的解決方案俩滥,大多數(shù)從業(yè)人員從來沒有從頭開始編碼算法嘉蕾。
今天,了解如何在正確的設(shè)置(以正確的方式)應(yīng)用正確的算法更為重要霜旧。
為了避免這個錯誤:
- 學(xué)習(xí)通用機(jī)器學(xué)習(xí)庫错忱,如Scikit-Learn(Python)或Caret(R) 。
- 如果你從頭開始編寫一個算法挂据,這樣做是為了學(xué)習(xí)而不是完善你的實(shí)現(xiàn)以清。
- 了解現(xiàn)代機(jī)器學(xué)習(xí)算法的優(yōu)勢及其優(yōu)缺點(diǎn)。
3. 跳入深淵崎逃。
有些人進(jìn)入這個領(lǐng)域是因?yàn)樗麄兿胍獦?gòu)建未來的技術(shù):自駕車掷倔,高級機(jī)器人,計(jì)算機(jī)視覺等个绍。這些技術(shù)由深度學(xué)習(xí)和自然語言處理等技術(shù)驅(qū)動勒葱。
但是,掌握基本原理很重要巴柿。正如每個奧運(yùn)潛水員都需要先學(xué)習(xí)如何游泳凛虽,你也一樣。
為了避免這個錯誤:
- 首先掌握“古典”機(jī)器學(xué)習(xí)的技術(shù)和算法广恢,作為高級課題的基石凯旋。
- 知道古典機(jī)器學(xué)習(xí)仍然具有難以置信的未開發(fā)潛力。雖然算法已經(jīng)成熟袁波,但我們?nèi)匀惶幱谕诰蛉绾卫盟鼈兊脑缙陔A段瓦阐。
- 學(xué)習(xí)系統(tǒng)的方法來解決任何形式的機(jī)器學(xué)習(xí)問題。
申請工作時
下一套錯誤可能會導(dǎo)致您在求職過程中錯過一些很好的機(jī)會篷牌。即使你已經(jīng)合格睡蟋,你可以通過避免這些小錯誤來最大限度地發(fā)揮你的作用。
4.在簡歷中有太多的技術(shù)術(shù)語枷颊。
許多申請人在寫簡歷時最大的錯誤是用太多技術(shù)術(shù)語戳杀。
相反该面,你的簡歷應(yīng)該畫一張照片,你的核心應(yīng)該講故事信卡。您的簡歷應(yīng)主張您對組織帶來的影響隔缀,特別是如果您申請入門級職位。
為了避免這個錯誤:
- 不要簡單地列出您使用的編程語言或庫傍菇。描述你如何使用它們并解釋結(jié)果猾瘸。
- “少即是多……”仔細(xì)思考后強(qiáng)調(diào)最重要的技能,并通過消除其他不必要的內(nèi)容丢习。
- 制作簡歷主模板牵触,以便您可以分離針對不同角色定制的不同版本。這保持每個版本干凈咐低。
5. 高估學(xué)位的價值揽思。
有時,畢業(yè)生可以高估他們的教育價值见擦。雖然在相關(guān)領(lǐng)域的強(qiáng)大程度肯定會提高您的機(jī)會钉汗,但它也不夠充分,也不是通常最重要的因素鲤屡。
很顯然损痰,我們不是說畢業(yè)生傲慢自大...
在大多數(shù)情況下,在學(xué)術(shù)環(huán)境中所教授的東西與企業(yè)中應(yīng)用的機(jī)器學(xué)習(xí)過程截然不同执俩。使用期限徐钠,客戶和技術(shù)阻礙在學(xué)術(shù)界不那么迫切地需要根據(jù)實(shí)際權(quán)衡。
為了避免這個錯誤:
- 用使用現(xiàn)實(shí)世界數(shù)據(jù)的項(xiàng)目練習(xí)作為課程的補(bǔ)充役首。
- 系統(tǒng)學(xué)習(xí)解決機(jī)器學(xué)習(xí)問題的方法。
- 參加相關(guān)實(shí)習(xí)显拜,即使是兼職衡奥。
- 在LinkedIn上接觸當(dāng)?shù)氐臄?shù)據(jù)科學(xué)家進(jìn)行咖啡聊天。
6. 搜索工作時太局限远荠。
數(shù)據(jù)科學(xué)是一個相對較新的領(lǐng)域矮固,組織仍在不斷發(fā)展,以適應(yīng)日益增長的數(shù)據(jù)影響譬淳。如果您只搜索“數(shù)據(jù)科學(xué)家”開頭档址,那么您將會限制自己。
許多職位沒有被標(biāo)注為“數(shù)據(jù)科學(xué)”邻梆,但是它們將允許您以類似的角色發(fā)展類似的技能和功能守伸。
為了避免這個錯誤:
- 通過所需技能 (機(jī)器學(xué)習(xí),數(shù)據(jù)可視化浦妄,SQL等)進(jìn)行搜索尼摹。
- 按工作職責(zé)搜索(預(yù)測建模见芹,A / B測試,數(shù)據(jù)分析等)蠢涝。
- 通過所用技術(shù)手段搜索(Python玄呛,R,Scikit-Learn和二,Keras等)徘铝。
- 根據(jù)職位擴(kuò)展您的搜索(數(shù)據(jù)分析師,定量分析師惯吕,機(jī)器學(xué)習(xí)工程師等)庭砍。
面試期間
最后一套錯誤是面試過程中的絆腳石。你已經(jīng)做了艱苦的工作來實(shí)現(xiàn)這一步混埠,所以現(xiàn)在是時候做個好的結(jié)尾怠缸。
7.沒有為面試時可能談及的項(xiàng)目做準(zhǔn)備。
有實(shí)際的項(xiàng)目經(jīng)驗(yàn)是當(dāng)遇到“如何做”類型面試問題時的應(yīng)對保障钳宪。不僅僅只能在假設(shè)的說明應(yīng)對方案揭北,你還可以指出處理某些情況的具體例子。
此外吏颖,許多招聘經(jīng)理會想要你有自給自足的能力搔体,因?yàn)閿?shù)據(jù)科學(xué)角色自然包括項(xiàng)目管理的要素。這意味著您應(yīng)該了解整個數(shù)據(jù)科學(xué)工作流程半醉,并了解如何將所有內(nèi)容整理在一起疚俱。
為了避免這個錯誤:
- 從頭到尾地完成一次項(xiàng)目,使您能夠練習(xí)每一個重要步驟 (即數(shù)據(jù)清理缩多,模型訓(xùn)練等)呆奕。
- 組織你的方法論。數(shù)據(jù)科學(xué)應(yīng)該是深思熟慮的衬吆,而不是無計(jì)劃的梁钾。
- 回顧和重新描述你過去在實(shí)習(xí),工作或課程中曾做過的項(xiàng)目逊抡。
8.低估領(lǐng)域知識的價值姆泻。
技術(shù)技能和機(jī)器學(xué)習(xí)知識是獲取數(shù)據(jù)科學(xué)職位的基本先決條件。但是冒嫡,要真正脫穎而出拇勃,您應(yīng)該了解更多關(guān)于您將應(yīng)用您的技能的具體行業(yè)。
記住孝凌,數(shù)據(jù)科學(xué)從來不存在于真空中方咆。
為了避免這個錯誤:
- 如果你正在面試一個銀行的職位,請刷一些基本的財(cái)務(wù)概念胎许。
- 如果您在《財(cái)富》雜志500周年期間面試一個重要位置峻呛,那么就可以進(jìn)行一些案例訪談并了解盈利能力的驅(qū)動因素罗售。
- 如果您正在為創(chuàng)業(yè)公司面試,了解其市場钩述,并嘗試了解如何獲得競爭優(yōu)勢寨躁。
- 簡而言之,在這里采取一點(diǎn)額外的舉措可以帶來很大的好處牙勘!
9.忽視溝通技巧
目前职恳,在大多數(shù)組織中,與開發(fā)團(tuán)隊(duì)或分析師團(tuán)隊(duì)相比方面,數(shù)據(jù)科學(xué)團(tuán)隊(duì)仍然很小放钦。因此,當(dāng)入門級軟件工程師一般被一名高級工程師指導(dǎo)時恭金,數(shù)據(jù)科學(xué)家往往在更多的跨功能設(shè)置中工作操禀。
面試官會需要你有能夠與技術(shù)或數(shù)學(xué)背景的同事溝通的能力。
為了避免這個錯誤:
- 練習(xí)為非技術(shù)觀眾解釋技術(shù)概念横腿。例如颓屑,嘗試向朋友解釋你最喜歡的算法。
- 為常見的面試問題準(zhǔn)備重點(diǎn)耿焊,并提供答案揪惦。
- 實(shí)踐分析各種數(shù)據(jù)集,提取關(guān)鍵洞察力罗侯,并呈現(xiàn)您的發(fā)現(xiàn)器腋。
結(jié)論
在本指南中,您學(xué)習(xí)了避免數(shù)據(jù)科學(xué)初學(xué)者9個最常見錯誤的實(shí)用技巧:
1.花費(fèi)太多時間在理論上钩杰。
2.從頭編寫太多的算法纫塌。
3.直接跳入高級課程,例如深度學(xué)習(xí)榜苫,太快护戳。
4.在簡歷中有太多的技術(shù)術(shù)語。
5.高估學(xué)位的價值垂睬。
6.搜索工作時太局限。
7.沒有為面試時可能談及的項(xiàng)目做準(zhǔn)備.
8.低估領(lǐng)域知識的價值抗悍。
9.忽視溝通技巧驹饺。
翻譯來源:elitedatascience | 2017 年 6 月 23 日
本文鏈接:https://elitedatascience.com/beginner-mistakes