黃海廣:那些年做的學術(shù)公益——你不是一個人在戰(zhàn)斗

來源:機器學習初學者

我叫黃海廣荚恶,這篇文章主要寫了我的學術(shù)公益之路撩穿。我希望初學者少踩一些坑,我也希望我能做個“雪中送炭”的人裆甩,希望越來越多的人加入到學術(shù)公益的道路上來冗锁。

2014年9月,我考上了博士嗤栓,那時候已經(jīng)36周歲7個月了冻河,然后,第一次知道了“機器學習”茉帅,開始了學習之路叨叙。在學習的道路上,我踩了無數(shù)的坑堪澎,直到博三才感覺漸入佳境擂错。我發(fā)現(xiàn)初學者最需要的是“雪中送炭”,而不是“錦上添花”樱蛤。作為博士钮呀,要有社會責任感剑鞍,我希望初學者少踩一些坑,我也希望我能做個“雪中送炭”的人爽醋。

一蚁署、學術(shù)作品

我的作品都比較簡單,不需要太高知識水平蚂四,但是很少有人認真去做光戈,或者堅持做下去,因為大部分人在學習過程中學會了遂赠,很少會把學習的東西重新整理分享給別人久妆。做這些事情,需要專注和嚴謹跷睦。

我相信:贈人玫瑰筷弦,手有余香。

以下是幾個學術(shù)公益作品送讲,都是站在巨人的肩膀上完成的奸笤。

1.翻譯吳恩達機器學習課程

2014年12月開始到mooc網(wǎng)上學堂學習機器學習課程,該課程內(nèi)容非常不錯哼鬓,但好多視頻沒有中文字幕,我就發(fā)動幾位博士來一起翻譯字幕边灭,我整理和翻譯了大部分視頻异希,并把視頻和中英文字幕壓制到mkv文件中去。(該視頻字幕已經(jīng)無償送給網(wǎng)易云課堂:吳恩達機器學習課程绒瘦,由他們進行潤色称簿,致謝里有我的名字。這個課程有好多個翻譯版本惰帽,我的可能是最差的一個版本憨降,但可能下載最多。)

這個視頻可以上網(wǎng)易云課堂搜索“吳恩達機器學習”该酗,目前是最受歡迎的機器學習課程授药,課程免費。

此外呜魄,我的github里有離線視頻下載悔叽,中英文字幕的。

https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes

https://user-gold-cdn.xitu.io/2019/9/22/16d549aa68b4cb1e?w=1026&h=664&f=webp&s=44874

2.機器學習筆記

在學習機器學習課程時爵嗅,我發(fā)現(xiàn)看視頻有點累娇澎,就邊看邊寫筆記,大概寫了三個月睹晒,寫了差不多了趟庄,我在mooc學院發(fā)個帖子給大家下載括细。后來我也忘了發(fā)帖這個事情了,直到博二下學期有人發(fā)郵件告訴我鏈接失效了戚啥,我才發(fā)現(xiàn)筆記已經(jīng)被下載了7000多次了奋单,然后被百度云和諧了。我覺得筆記應該幫助了不少人虑鼎,給了我繼續(xù)修改完善筆記的動力辱匿,一直斷斷續(xù)續(xù)改了兩年,期間收到幾千封感謝郵件炫彩,后來我把筆記放到了github上提供下載匾七,被下載了幾十萬次,獲得11500+star江兢。原課程的作業(yè)代碼是octave的昨忆,現(xiàn)在幾乎用不到了,我用python3.6復現(xiàn)了課程代碼杉允,并且公開了筆記的word和markdown版本邑贴。

https://user-gold-cdn.xitu.io/2019/9/22/16d549aa689a994f?w=662&h=836&f=webp&s=35452

圖:四年來的筆記更新記錄

以上資料都放在了我的github:

https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes

3. 深度學習筆記

2017年8月,吳恩達老師推出了深度學習課(DeepLearning.ai)叔磷,這門課是陸續(xù)推出的拢驾,我開始組織翻譯課程,很多朋友加入義務翻譯的隊伍改基,翻譯了第一門課之后繁疤,網(wǎng)易云課堂宣布他們得到授權(quán)翻譯所有五門課程,我們就不再翻譯了秕狰,開始編寫這門課的筆記稠腊,我組織了很多同學來一起編寫,最后由我來整理成word和markdown文件鸣哀,那時候正好是寫博士論文的時候架忌,特別忙,但還是抽出時間來整理筆記我衬。此外特別要感謝林興木和祝彥森同學叹放,他們提供了自己做筆記,我來修改整合低飒。此外许昨,我對DeepLearning.ai的課后測試題進行了翻譯,建議初學者學習褥赊。所有題目都翻譯完畢糕档,適合英文不好的同學學習。

這個筆記相當詳細,有700多頁速那。

https://user-gold-cdn.xitu.io/2019/9/22/16d549aa68e18adc?w=924&h=623&f=webp&s=19494

圖:深度學習筆記打印后的效果

筆記放在github下載:

https://github.com/fengdu78/deeplearning_ai_books

為了宣傳筆記俐银,我把筆記放到了知乎,收到了6600多贊端仰,并被各大人工智能方向的媒體廣泛報道捶惜。

知乎鏈接:

https://zhuanlan.zhihu.com/p/35940466

4.統(tǒng)計學習方法的代碼實現(xiàn)

我初學機器學習過程中,李航老師的《統(tǒng)計學習方法》給我極大的幫助荔烧,我試著從github搜索下載和自己修改代碼吱七,把這本書用python代碼實現(xiàn)了,并放到了github下載(差不多7000star):

https://github.com/fengdu78/lihang-code

今年7月我參加機器之心舉辦的GMIS峰會鹤竭,見到來了李航老師踊餐,加了微信,簡單交流了下臀稚,我做的這個項目得到了李航老師的肯定吝岭,后來我邀請李航老師加入了我的博士微信群,李航老師熱情應邀吧寺。

5.數(shù)學基礎翻譯

機器學習的基礎是數(shù)學窜管,數(shù)學內(nèi)容真的太多,初學者根本學不完稚机。

我把考研和考博的數(shù)學筆記中跟機器學習有關(guān)的部分做成了markdown文件幕帆,提供下載。

今年8月赖条,我學習了Stanford cs229 manchine learning課程蜓肆,相比于Coursera中的機器學習有更多的數(shù)學要求和公式的推導,課程全英文谋币,基礎材料部分還沒有翻譯。這個基礎材料主要分為線性代數(shù)和概率論症概,而且針對機器學習課程做了優(yōu)化蕾额,非常適合學習。我已經(jīng)翻譯了線性代數(shù)部分彼城,石振宇博士翻譯完了概率論部分诅蝶,我修改制作后放在github和百度云提供下載。

數(shù)學基礎的github:

https://github.com/fengdu78/Data-Science-Notes/tree/master/0.math

6.其他

  • python深度學習代碼注釋翻譯

《python深度學習》由Keras之父募壕、現(xiàn)任Google人工智能研究員的弗朗索瓦?肖萊(Franc?ois Chollet)執(zhí)筆调炬,詳盡介紹了用Python和Keras進行深度學習的探索實踐,包括計算機視覺舱馅、自然語言處理缰泡、產(chǎn)生式模型等應用。書中包含30多個代碼示例代嗤,步驟講解詳細透徹棘钞。

作者在github公布了代碼缠借,代碼幾乎囊括了本書所有知識點。在學習完本書后宜猜,讀者將具備搭建自己的深度學習環(huán)境泼返、建立圖像識別模型、生成圖像和文字等能力姨拥。但是有一個小小的遺憾:代碼的解釋和注釋是全英文的绅喉,即使英文水平較好的朋友看起來也很吃力。

本人認為叫乌,這本書和代碼是初學者入門深度學習及Keras最好的工具柴罐。

我對全部代碼做了中文解釋和注釋,并下載了代碼所需要的一些數(shù)據(jù)集(尤其是“貓狗大戰(zhàn)”數(shù)據(jù)集)综芥,并對其中一些圖像進行了本地化丽蝎,代碼全部測試通過。

github地址:

https://github.com/fengdu78/machine_learning_beginner/tree/master/deep-learning-with-python-notebooks

  • 翻譯官方PyTorch簡易入門教程(PyTorch1.0版本)

“PyTorch 深度學習:60分鐘快速入門”為PyTorch官網(wǎng)教程膀藐,網(wǎng)上已經(jīng)有部分翻譯作品屠阻,隨著PyTorch1.0版本的公布,這個教程有較大的代碼改動额各,我對教程進行重新翻譯国觉,并測試運行了官方代碼,制作成Jupyter Notebook文件(中文注釋)在github予以公布虾啦。

https://github.com/fengdu78/machine_learning_beginner/tree/master/PyTorch_beginner

  • 特征工程的寶典-《Feature Engineering for Machine Learning》翻譯及代碼實現(xiàn)

由O'Reilly Media,Inc.出版的《Feature Engineering for Machine Learning》(國內(nèi)譯作《精通特征工程》)一書麻诀,可以說是特征工程的寶典,我在知名開源apachecn組織翻譯的英文版基礎上傲醉,將原文修改成jupyter notebook格式蝇闭,并增加和修改了部分代碼,測試全部通過硬毕。這個資料可以說是特征工程的寶典呻引,值得推薦。

翻譯代碼放在數(shù)據(jù)科學的github倉庫提供下載吐咳,倉庫地址:

https://github.com/fengdu78/Data-Science-Notes/tree/master/9.feature-engineering

備注:我們的翻譯版本與人民郵電出版社出版的《精通特征工程》有所不同逻悠,屬于獨立完成。

我的學術(shù)作品大部分放在我的github(fengdu78)韭脊,獲得很多好評童谒,star數(shù)累計達到28785,排在世界123名沪羔。

二饥伊、學術(shù)交流

1.交流群

我的qq和微信的機器學習愛好者朋友越來越多,我產(chǎn)生了建立機器學習交流群的想法。

2016年2月我建立了第一個qq群撵渡,群友是這么過來的:

  • 我的筆記上印了群號融柬,通過群號搜索加入

  • 群內(nèi)朋友介紹

  • 我發(fā)出邀請

qq群只有通過群號才能找到,因此加人比較精準趋距,而且群實行實名制粒氧,群的質(zhì)量和活躍度在相關(guān)領域處于top1%行列,群人數(shù)平穩(wěn)增長节腐,每天增加幾十人外盯,就這樣過了三年半,現(xiàn)在已經(jīng)有9個機器學習愛好者qq群了(7個2000群翼雀,2個3000群)饱苟,群友慢慢成長起來,我見證了很多菜鳥到大牛的轉(zhuǎn)變狼渊。

此外箱熬,我也建立了微信群,目前有8個微信群狈邑,其中一個群是人工智能博士群城须,有430多人,包括李航老師那樣的大佬也在群里米苹。

通過網(wǎng)上的交流糕伐,我認識了李航老師、徐亦達老師等業(yè)界大神蘸嘶,也認識了很多學術(shù)界和工業(yè)界良瞧、競賽圈的大佬。

2.知乎和公眾號

2017年底训唱,我遇到了向老師褥蚯,一位多次獲得數(shù)據(jù)競賽冠軍的數(shù)據(jù)分析師,她推薦我注冊了知乎(ID:黃海廣)况增,還介紹了很多數(shù)據(jù)競賽的top選手給我認識遵岩。

我的知乎兩年來,發(fā)了幾十篇機器學習相關(guān)文章巡通,粉絲達到20500多人。

在向老師指導下舍哄,2018年9月宴凉,我注冊了公眾號“機器學習初學者”,為機器學習愛好者提供學習的路線和基礎資料表悬,一年來粉絲達到31000人弥锄。

3.知識星球

由于各個群的人數(shù)有限,不同的群很難互通消息,而且群里討論氣氛熱烈籽暇,群友的問題很容易被覆蓋温治,不利于知識的沉淀。

有位同學給我提了一個建議戒悠,建立知識星球熬荆。

他是個優(yōu)秀的研究生,研二就獲得了20萬競賽獎金绸狐,而且卤恳,現(xiàn)在研三開學,已經(jīng)獲得了多個大廠的offer寒矿。我相信緣分突琳,他的名字叫黃海龍,非常親切的感覺符相,于是我請他做了知識星球的合伙人拆融。

關(guān)于知識星球是否收費,我們討論了好久啊终,后來決定象征性地收費镜豹,第一是作為星球的運營費用,如嘉賓的和優(yōu)秀回答者的獎勵孕索,第二是保證了群友的質(zhì)量逛艰,加入的人比較精準,知識星球從今年3月建立至今搞旭,吸引了4000多名愛好者加入散怖,知識星球名稱:黃博的機器學習圈子

其實肄渗,我們一直對優(yōu)秀的愛好者免費镇眷,比如數(shù)據(jù)競賽高手、博士等翎嫡,目前星球是機器學習方向排名第一的星球欠动。

4.線下交流

由于在不同的城市,我和機器學習愛好者的線下交流不是很多惑申,但有機會一定會當面交流具伍。

https://user-gold-cdn.xitu.io/2019/9/22/16d549aa68a96d17?w=2134&h=1600&f=jpeg&s=618071

圖:2018年12月,CCF BDCI決賽圈驼,沈陽人芽,擔任嘉賓,和數(shù)據(jù)競賽大師擼串(左三)

https://user-gold-cdn.xitu.io/2019/9/22/16d549aa68da964b?w=1080&h=810&f=webp&s=59308

圖:2019年7月GMIS峰會绩脆,上海(C位)

5.學術(shù)公益合作

我和幾個知名AI一直有合作萤厅,聯(lián)合Datawhale橄抹,ApacheCN,AI 有道推出了完備的 AI 學習路線:內(nèi)容涵蓋 AI 入門基礎知識惕味、數(shù)據(jù)分析\挖掘楼誓、機器學習、深度學習名挥、強化學習疟羹、前沿 Paper 和五大 AI 理論應用領域:自然語言處理,計算機視覺躺同,推薦系統(tǒng)阁猜,風控模型和知識圖譜,學習 AI 從入門到專家必備的學習路線和優(yōu)質(zhì)學習資源蹋艺。

完備的 AI 學習路線剃袍,最詳細的中英文資源整理:

https://zhuanlan.zhihu.com/p/64080846

結(jié)語

機器學習課程在國內(nèi)還不夠普及,大部分初學者還是很迷茫捎谨,走了很多彎路民效,我是一名博士,博士應該有社會責任感涛救,希望能盡自己的微薄之力畏邢,為機器學習初學者“雪中送炭”。

慶幸的是检吆,很多朋友加入了學術(shù)公益的行列舒萎,有萌新,也有百萬年薪的大佬蹭沛。

在學習的道路上臂寝,你不是一個人在戰(zhàn)斗!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末摊灭,一起剝皮案震驚了整個濱河市咆贬,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌帚呼,老刑警劉巖掏缎,帶你破解...
    沈念sama閱讀 221,576評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異煤杀,居然都是意外死亡眷蜈,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評論 3 399
  • 文/潘曉璐 我一進店門沈自,熙熙樓的掌柜王于貴愁眉苦臉地迎上來端蛆,“玉大人,你說我怎么就攤上這事酥泛〗穸梗” “怎么了?”我有些...
    開封第一講書人閱讀 168,017評論 0 360
  • 文/不壞的土叔 我叫張陵柔袁,是天一觀的道長呆躲。 經(jīng)常有香客問我,道長捶索,這世上最難降的妖魔是什么插掂? 我笑而不...
    開封第一講書人閱讀 59,626評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮腥例,結(jié)果婚禮上辅甥,老公的妹妹穿的比我還像新娘。我一直安慰自己燎竖,他們只是感情好璃弄,可當我...
    茶點故事閱讀 68,625評論 6 397
  • 文/花漫 我一把揭開白布蔼水。 她就那樣靜靜地躺著堤撵,像睡著了一般赋朦。 火紅的嫁衣襯著肌膚如雪供炼。 梳的紋絲不亂的頭發(fā)上雅宾,一...
    開封第一講書人閱讀 52,255評論 1 308
  • 那天恰响,我揣著相機與錄音拓颓,去河邊找鬼讲坎。 笑死借跪,一個胖子當著我的面吹牛政己,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播掏愁,決...
    沈念sama閱讀 40,825評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼歇由,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了托猩?” 一聲冷哼從身側(cè)響起印蓖,我...
    開封第一講書人閱讀 39,729評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎京腥,沒想到半個月后赦肃,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,271評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡公浪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,363評論 3 340
  • 正文 我和宋清朗相戀三年他宛,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片欠气。...
    茶點故事閱讀 40,498評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡厅各,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出预柒,到底是詐尸還是另有隱情队塘,我是刑警寧澤袁梗,帶...
    沈念sama閱讀 36,183評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站憔古,受9級特大地震影響遮怜,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜鸿市,卻給世界環(huán)境...
    茶點故事閱讀 41,867評論 3 333
  • 文/蒙蒙 一锯梁、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧焰情,春花似錦陌凳、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至谒获,卻和暖如春蛤肌,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背批狱。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評論 1 272
  • 我被黑心中介騙來泰國打工裸准, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人赔硫。 一個月前我還...
    沈念sama閱讀 48,906評論 3 376
  • 正文 我出身青樓炒俱,卻偏偏與公主長得像,于是被迫代替她去往敵國和親爪膊。 傳聞我的和親對象是個殘疾皇子权悟,可洞房花燭夜當晚...
    茶點故事閱讀 45,507評論 2 359