來源:機器學習初學者
我叫黃海廣荚恶,這篇文章主要寫了我的學術(shù)公益之路撩穿。我希望初學者少踩一些坑,我也希望我能做個“雪中送炭”的人裆甩,希望越來越多的人加入到學術(shù)公益的道路上來冗锁。
2014年9月,我考上了博士嗤栓,那時候已經(jīng)36周歲7個月了冻河,然后,第一次知道了“機器學習”茉帅,開始了學習之路叨叙。在學習的道路上,我踩了無數(shù)的坑堪澎,直到博三才感覺漸入佳境擂错。我發(fā)現(xiàn)初學者最需要的是“雪中送炭”,而不是“錦上添花”樱蛤。作為博士钮呀,要有社會責任感剑鞍,我希望初學者少踩一些坑,我也希望我能做個“雪中送炭”的人爽醋。
一蚁署、學術(shù)作品
我的作品都比較簡單,不需要太高知識水平蚂四,但是很少有人認真去做光戈,或者堅持做下去,因為大部分人在學習過程中學會了遂赠,很少會把學習的東西重新整理分享給別人久妆。做這些事情,需要專注和嚴謹跷睦。
我相信:贈人玫瑰筷弦,手有余香。
以下是幾個學術(shù)公益作品送讲,都是站在巨人的肩膀上完成的奸笤。
1.翻譯吳恩達機器學習課程
2014年12月開始到mooc網(wǎng)上學堂學習機器學習課程,該課程內(nèi)容非常不錯哼鬓,但好多視頻沒有中文字幕,我就發(fā)動幾位博士來一起翻譯字幕边灭,我整理和翻譯了大部分視頻异希,并把視頻和中英文字幕壓制到mkv文件中去。(該視頻字幕已經(jīng)無償送給網(wǎng)易云課堂:吳恩達機器學習課程绒瘦,由他們進行潤色称簿,致謝里有我的名字。這個課程有好多個翻譯版本惰帽,我的可能是最差的一個版本憨降,但可能下載最多。)
這個視頻可以上網(wǎng)易云課堂搜索“吳恩達機器學習”该酗,目前是最受歡迎的機器學習課程授药,課程免費。
此外呜魄,我的github里有離線視頻下載悔叽,中英文字幕的。
https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
https://user-gold-cdn.xitu.io/2019/9/22/16d549aa68b4cb1e?w=1026&h=664&f=webp&s=44874
2.機器學習筆記
在學習機器學習課程時爵嗅,我發(fā)現(xiàn)看視頻有點累娇澎,就邊看邊寫筆記,大概寫了三個月睹晒,寫了差不多了趟庄,我在mooc學院發(fā)個帖子給大家下載括细。后來我也忘了發(fā)帖這個事情了,直到博二下學期有人發(fā)郵件告訴我鏈接失效了戚啥,我才發(fā)現(xiàn)筆記已經(jīng)被下載了7000多次了奋单,然后被百度云和諧了。我覺得筆記應該幫助了不少人虑鼎,給了我繼續(xù)修改完善筆記的動力辱匿,一直斷斷續(xù)續(xù)改了兩年,期間收到幾千封感謝郵件炫彩,后來我把筆記放到了github上提供下載匾七,被下載了幾十萬次,獲得11500+star江兢。原課程的作業(yè)代碼是octave的昨忆,現(xiàn)在幾乎用不到了,我用python3.6復現(xiàn)了課程代碼杉允,并且公開了筆記的word和markdown版本邑贴。
https://user-gold-cdn.xitu.io/2019/9/22/16d549aa689a994f?w=662&h=836&f=webp&s=35452
圖:四年來的筆記更新記錄
以上資料都放在了我的github:
https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
3. 深度學習筆記
2017年8月,吳恩達老師推出了深度學習課(DeepLearning.ai)叔磷,這門課是陸續(xù)推出的拢驾,我開始組織翻譯課程,很多朋友加入義務翻譯的隊伍改基,翻譯了第一門課之后繁疤,網(wǎng)易云課堂宣布他們得到授權(quán)翻譯所有五門課程,我們就不再翻譯了秕狰,開始編寫這門課的筆記稠腊,我組織了很多同學來一起編寫,最后由我來整理成word和markdown文件鸣哀,那時候正好是寫博士論文的時候架忌,特別忙,但還是抽出時間來整理筆記我衬。此外特別要感謝林興木和祝彥森同學叹放,他們提供了自己做筆記,我來修改整合低飒。此外许昨,我對DeepLearning.ai的課后測試題進行了翻譯,建議初學者學習褥赊。所有題目都翻譯完畢糕档,適合英文不好的同學學習。
這個筆記相當詳細,有700多頁速那。
https://user-gold-cdn.xitu.io/2019/9/22/16d549aa68e18adc?w=924&h=623&f=webp&s=19494
圖:深度學習筆記打印后的效果
筆記放在github下載:
https://github.com/fengdu78/deeplearning_ai_books
為了宣傳筆記俐银,我把筆記放到了知乎,收到了6600多贊端仰,并被各大人工智能方向的媒體廣泛報道捶惜。
知乎鏈接:
https://zhuanlan.zhihu.com/p/35940466
4.統(tǒng)計學習方法的代碼實現(xiàn)
我初學機器學習過程中,李航老師的《統(tǒng)計學習方法》給我極大的幫助荔烧,我試著從github搜索下載和自己修改代碼吱七,把這本書用python代碼實現(xiàn)了,并放到了github下載(差不多7000star):
https://github.com/fengdu78/lihang-code
今年7月我參加機器之心舉辦的GMIS峰會鹤竭,見到來了李航老師踊餐,加了微信,簡單交流了下臀稚,我做的這個項目得到了李航老師的肯定吝岭,后來我邀請李航老師加入了我的博士微信群,李航老師熱情應邀吧寺。
5.數(shù)學基礎翻譯
機器學習的基礎是數(shù)學窜管,數(shù)學內(nèi)容真的太多,初學者根本學不完稚机。
我把考研和考博的數(shù)學筆記中跟機器學習有關(guān)的部分做成了markdown文件幕帆,提供下載。
今年8月赖条,我學習了Stanford cs229 manchine learning課程蜓肆,相比于Coursera中的機器學習有更多的數(shù)學要求和公式的推導,課程全英文谋币,基礎材料部分還沒有翻譯。這個基礎材料主要分為線性代數(shù)和概率論症概,而且針對機器學習課程做了優(yōu)化蕾额,非常適合學習。我已經(jīng)翻譯了線性代數(shù)部分彼城,石振宇博士翻譯完了概率論部分诅蝶,我修改制作后放在github和百度云提供下載。
數(shù)學基礎的github:
https://github.com/fengdu78/Data-Science-Notes/tree/master/0.math
6.其他
- python深度學習代碼注釋翻譯
《python深度學習》由Keras之父募壕、現(xiàn)任Google人工智能研究員的弗朗索瓦?肖萊(Franc?ois Chollet)執(zhí)筆调炬,詳盡介紹了用Python和Keras進行深度學習的探索實踐,包括計算機視覺舱馅、自然語言處理缰泡、產(chǎn)生式模型等應用。書中包含30多個代碼示例代嗤,步驟講解詳細透徹棘钞。
作者在github公布了代碼缠借,代碼幾乎囊括了本書所有知識點。在學習完本書后宜猜,讀者將具備搭建自己的深度學習環(huán)境泼返、建立圖像識別模型、生成圖像和文字等能力姨拥。但是有一個小小的遺憾:代碼的解釋和注釋是全英文的绅喉,即使英文水平較好的朋友看起來也很吃力。
本人認為叫乌,這本書和代碼是初學者入門深度學習及Keras最好的工具柴罐。
我對全部代碼做了中文解釋和注釋,并下載了代碼所需要的一些數(shù)據(jù)集(尤其是“貓狗大戰(zhàn)”數(shù)據(jù)集)综芥,并對其中一些圖像進行了本地化丽蝎,代碼全部測試通過。
github地址:
- 翻譯官方PyTorch簡易入門教程(PyTorch1.0版本)
“PyTorch 深度學習:60分鐘快速入門”為PyTorch官網(wǎng)教程膀藐,網(wǎng)上已經(jīng)有部分翻譯作品屠阻,隨著PyTorch1.0版本的公布,這個教程有較大的代碼改動额各,我對教程進行重新翻譯国觉,并測試運行了官方代碼,制作成Jupyter Notebook文件(中文注釋)在github予以公布虾啦。
https://github.com/fengdu78/machine_learning_beginner/tree/master/PyTorch_beginner
- 特征工程的寶典-《Feature Engineering for Machine Learning》翻譯及代碼實現(xiàn)
由O'Reilly Media,Inc.出版的《Feature Engineering for Machine Learning》(國內(nèi)譯作《精通特征工程》)一書麻诀,可以說是特征工程的寶典,我在知名開源apachecn組織翻譯的英文版基礎上傲醉,將原文修改成jupyter notebook格式蝇闭,并增加和修改了部分代碼,測試全部通過硬毕。這個資料可以說是特征工程的寶典呻引,值得推薦。
翻譯代碼放在數(shù)據(jù)科學的github倉庫提供下載吐咳,倉庫地址:
https://github.com/fengdu78/Data-Science-Notes/tree/master/9.feature-engineering
備注:我們的翻譯版本與人民郵電出版社出版的《精通特征工程》有所不同逻悠,屬于獨立完成。
我的學術(shù)作品大部分放在我的github(fengdu78)韭脊,獲得很多好評童谒,star數(shù)累計達到28785,排在世界123名沪羔。
二饥伊、學術(shù)交流
1.交流群
我的qq和微信的機器學習愛好者朋友越來越多,我產(chǎn)生了建立機器學習交流群的想法。
2016年2月我建立了第一個qq群撵渡,群友是這么過來的:
我的筆記上印了群號融柬,通過群號搜索加入
群內(nèi)朋友介紹
我發(fā)出邀請
qq群只有通過群號才能找到,因此加人比較精準趋距,而且群實行實名制粒氧,群的質(zhì)量和活躍度在相關(guān)領域處于top1%行列,群人數(shù)平穩(wěn)增長节腐,每天增加幾十人外盯,就這樣過了三年半,現(xiàn)在已經(jīng)有9個機器學習愛好者qq群了(7個2000群翼雀,2個3000群)饱苟,群友慢慢成長起來,我見證了很多菜鳥到大牛的轉(zhuǎn)變狼渊。
此外箱熬,我也建立了微信群,目前有8個微信群狈邑,其中一個群是人工智能博士群城须,有430多人,包括李航老師那樣的大佬也在群里米苹。
通過網(wǎng)上的交流糕伐,我認識了李航老師、徐亦達老師等業(yè)界大神蘸嘶,也認識了很多學術(shù)界和工業(yè)界良瞧、競賽圈的大佬。
2.知乎和公眾號
2017年底训唱,我遇到了向老師褥蚯,一位多次獲得數(shù)據(jù)競賽冠軍的數(shù)據(jù)分析師,她推薦我注冊了知乎(ID:黃海廣)况增,還介紹了很多數(shù)據(jù)競賽的top選手給我認識遵岩。
我的知乎兩年來,發(fā)了幾十篇機器學習相關(guān)文章巡通,粉絲達到20500多人。
在向老師指導下舍哄,2018年9月宴凉,我注冊了公眾號“機器學習初學者”,為機器學習愛好者提供學習的路線和基礎資料表悬,一年來粉絲達到31000人弥锄。
3.知識星球
由于各個群的人數(shù)有限,不同的群很難互通消息,而且群里討論氣氛熱烈籽暇,群友的問題很容易被覆蓋温治,不利于知識的沉淀。
有位同學給我提了一個建議戒悠,建立知識星球熬荆。
他是個優(yōu)秀的研究生,研二就獲得了20萬競賽獎金绸狐,而且卤恳,現(xiàn)在研三開學,已經(jīng)獲得了多個大廠的offer寒矿。我相信緣分突琳,他的名字叫黃海龍,非常親切的感覺符相,于是我請他做了知識星球的合伙人拆融。
關(guān)于知識星球是否收費,我們討論了好久啊终,后來決定象征性地收費镜豹,第一是作為星球的運營費用,如嘉賓的和優(yōu)秀回答者的獎勵孕索,第二是保證了群友的質(zhì)量逛艰,加入的人比較精準,知識星球從今年3月建立至今搞旭,吸引了4000多名愛好者加入散怖,知識星球名稱:黃博的機器學習圈子。
其實肄渗,我們一直對優(yōu)秀的愛好者免費镇眷,比如數(shù)據(jù)競賽高手、博士等翎嫡,目前星球是機器學習方向排名第一的星球欠动。
4.線下交流
由于在不同的城市,我和機器學習愛好者的線下交流不是很多惑申,但有機會一定會當面交流具伍。
https://user-gold-cdn.xitu.io/2019/9/22/16d549aa68a96d17?w=2134&h=1600&f=jpeg&s=618071
圖:2018年12月,CCF BDCI決賽圈驼,沈陽人芽,擔任嘉賓,和數(shù)據(jù)競賽大師擼串(左三)
https://user-gold-cdn.xitu.io/2019/9/22/16d549aa68da964b?w=1080&h=810&f=webp&s=59308
圖:2019年7月GMIS峰會绩脆,上海(C位)
5.學術(shù)公益合作
我和幾個知名AI一直有合作萤厅,聯(lián)合Datawhale橄抹,ApacheCN,AI 有道推出了完備的 AI 學習路線:內(nèi)容涵蓋 AI 入門基礎知識惕味、數(shù)據(jù)分析\挖掘楼誓、機器學習、深度學習名挥、強化學習疟羹、前沿 Paper 和五大 AI 理論應用領域:自然語言處理,計算機視覺躺同,推薦系統(tǒng)阁猜,風控模型和知識圖譜,學習 AI 從入門到專家必備的學習路線和優(yōu)質(zhì)學習資源蹋艺。
完備的 AI 學習路線剃袍,最詳細的中英文資源整理:
https://zhuanlan.zhihu.com/p/64080846
結(jié)語
機器學習課程在國內(nèi)還不夠普及,大部分初學者還是很迷茫捎谨,走了很多彎路民效,我是一名博士,博士應該有社會責任感涛救,希望能盡自己的微薄之力畏邢,為機器學習初學者“雪中送炭”。
慶幸的是检吆,很多朋友加入了學術(shù)公益的行列舒萎,有萌新,也有百萬年薪的大佬蹭沛。
在學習的道路上臂寝,你不是一個人在戰(zhàn)斗!