Datawhale 三月組隊學習計劃

這次一共打算組織14個組隊學習,涵蓋了AI領域從理論知識到動手實踐的內容韧掩,難度系數分為低、中窖铡、高檔疗锐,可以按照需要參加哦

組隊學習信息

1 /Python基礎

課程設計:馬晶敏,葉梁费彼、許輝

組隊學習說明:學習Python基礎知識滑臊,針對Python小白的學習之路

任務路線:基礎知識-函數-第三方模塊-類和對象-基礎爬蟲

組隊學習周期:10天

定位人群:Python小白,難度系數低

每個任務完成大概所需時間:每天平均花費時間2小時-4小時不等箍铲,根據個人學習接受能力強弱有所浮動

任務預覽(2天)

1雇卷、環(huán)境搭建

2、Python初體驗

3、Python基礎

如:變量特性+命名規(guī)則关划、注釋方法小染、“:”作用、學會使用dir( )及和help( )贮折、import使用裤翩、pep8介紹

4、Python數值基本知識

如:Python中數值類型调榄,int踊赠,float,bool每庆,e記法等筐带、算數運算符、邏輯運算符扣孟、成員運算符烫堤、身份運算符、運算符優(yōu)先級

2 /數據分析

課程設計:金娟娟

組隊學習說明:學習python for data analysis基礎知識

任務路線:python基礎-重要的python庫(numpy/pandas/matplotlib/seaborn等)-數據清洗和分析

組隊學習周期:15天定位人群:數據分析小白凤价,難度系數低

每個任務完成大概所需時間:每天平均花費時間2小時-4小時不等鸽斟,根據個人學習接受能力強弱有所浮動

任務預覽(2天)

完成《利用python進行數據分析》書上1-2章的學習,代碼實現的過程用上傳到GitHub

3 /初級算法梳理

課程設計:蘇靜利诺、康兵兵

組隊學習說明:通過查閱書籍或參考文獻富蓄、學習視頻等,對傳統機器學習算法進行梳理

任務路線:線性回歸--->邏輯回歸--->決策樹

組隊學習周期:7天

定位人群:有概率論慢逾、矩陣運算立倍、求導、泰勒展開等基礎數學知識侣滩;難度系數低

每個任務完成大概所需時間:2-3h

任務預覽(2天)

1. 機器學習的一些概念

有監(jiān)督口注、無監(jiān)督、泛化能力君珠、過擬合欠擬合(方差和偏差以及各自解決辦法)寝志、交叉驗證

2. 線性回歸的原理

3. 線性回歸損失函數、代價函數策添、目標函數

4. 優(yōu)化方法(梯度下降法材部、牛頓法、擬牛頓法等)

5唯竹、線性回歸的評估指標

6乐导、sklearn參數詳解

學習時長:兩天

參考:西瓜書

cs229吳恩達機器學習課程

李航統計學習

谷歌搜索

4 /MySQL

課程設計:楊皓博 孫濤 楊煜

組隊學習說明:一周內快速了解并掌握MySQL的主要內容。通過大量SQL語句的實戰(zhàn)練習浸颓,可以在簡歷上寫熟練掌握MySQL物臂。(注意:本課程只關注SQL查詢語句本身旺拉,對數據庫的涉及較少。)

任務路線: MySQL軟件安裝及數據庫基礎->查詢語句->表操作->表聯結->MySQL 實戰(zhàn)->MySQL 實戰(zhàn)-復雜項目

組隊學習周期:(7天)

定位人群:小白鹦聪,難度系數低

每個任務完成大概所需時間:2-3h

任務預覽(2天)

任務預覽(3天)

軟件安裝及服務器設置账阻。

數據庫基礎知識

MySQL數據庫管理系統

SQL是什么?MySQL是什么泽本?

查詢語句 SELECT FROM

篩選語句 WHERE

分組語句 GROUP BY

排序語句 ORDER BY

SQL注釋

SQL代碼規(guī)范

5 /統計學

課程設計:王佳鑫、許輝

組隊學習說明:學習內容涵蓋統計學中所有的主要知識姻僧,并對其分部分進行梳理總結规丽。

任務路線:根據所學習內容進行(1)統計學基本知識、二項及泊松分布撇贺、大數定律赌莺、正態(tài)分布等內容的總結進行整體的回顧、梳理與完善松嘶;(2)中心極限定理艘狭、置信區(qū)間、 假設檢驗等內容的總結進行整體的回顧翠订、梳理與完善巢音。

組隊學習周期:7天

定位人群:微積分、基本概率知識儲備尽超,難度系數中

每個任務完成大概所需時間:2-3h

任務預覽(2天)

學習內容 1:統計學基本知識官撼、二項及泊松分布

學習內容 2: 大數定律、正態(tài)分布

6 /LeetCode

課程設計:老表似谁、于鴻飛傲绣、楊皓博

組隊學習說明:LeetCode刷題組隊學習,從零開始每周10道算法題巩踏,在良好的學習氛圍下秃诵,培養(yǎng)刷題習慣,學習算法思想塞琼。(不限制編程語言)

任務路線:按照LeetCode默認題目順序每周10道題菠净。

組隊學習周期:7天

定位人群:適合有一門語言基礎的同學,難度系數中

每個任務完成大概所需時間:2-3h

課程內容:選取leetcode上面的10道題

7 /知乎小組

課程設計:小堯屈梁、黑桃嗤练、李嚴

組隊學習說明:到知乎回答問題,鞏固自身所學的知識在讶,鍛煉寫作輸出和表達能力煞抬,提升個人影響力,小組以“寫出自己的最佳回答”為總目標

任務路線:自己選擇較為熟悉領域的相關1個問題构哺,寫出優(yōu)質答案革答,并互相點評

組隊學習周期:7天

定位人群:比較熟悉AI某領域战坤,難度系數中,對輸出能力有要求

3個任務完成所需時間:6-8h

在知乎上選擇一道AI相關的題残拐,回答并優(yōu)化

8 /爬蟲

課程設計:光城途茫、李方

組隊學習說明:

從零基礎到能獨立完成一個簡易的爬蟲項目

任務路線:請求→re庫→BeautifulSoup庫→lxml庫→selenium庫→IP問題→實戰(zhàn)小項目

組隊學習周期:7天

定位人群:有Python基礎。難度系數中

每個任務完成大概所需時間:2-3h/天

任務預覽(2天)

1溪食、學習get與post請求囊卜,嘗試使用requests或者是urllib用get方法向 https://www.baidu.com/ 發(fā)出一個請求,并將其返回結果輸出错沃。

2栅组、如果是斷開了網絡,再發(fā)出申請枢析,結果又是什么玉掸。了解申請返回的狀態(tài)碼。

3醒叁、了解什么是請求頭司浪,如何添加請求頭。

4把沼、學習什么是正則表達式并嘗試一些正則表達式并進行匹配啊易。

然后結合requests、re兩者的內容爬取 https://movie.douban.com/top250 里的內容智政。

9 /高級算法梳理

課程設計:黑桃认罩,劉廣月,于鴻飛

組隊學習說明:通過查閱相關文獻续捂,對機器學習算法進行梳理

任務路線:RF--->GBDT--->XGB

組隊學習周期:7天

定位人群:有概率論垦垂、矩陣運算、求導牙瓢、泰勒展開等基礎數學知識劫拗;難度系數中

每個任務完成大概所需時間:2-3h

任務預覽(2天)

【參考框架】歡迎有自己的框架

1. 集成學習概念

2. 個體學習器概念

3. boosting bagging

4. 結合策略(平均法,投票法矾克,學習法)

5. 隨機森林思想

6. 隨機森林的推廣

7. 優(yōu)缺點

8. sklearn參數

9.應用場景

10 /數據挖掘項目

課程設計:范晶晶页慷、李碧涵、

組隊學習說明:應用機器學習算法胁附,完整地走完一個數據挖掘項目流程

任務路線:數據分析→特征工程→模型構建→模型評估→模型調優(yōu)→模型融合

組隊學習周期:12天

定位人群:有Python基礎酒繁,sklearn基礎。難度系數中

每個任務完成大概所需時間:2-3h/天

任務預覽(2天)

要求:數據切分方式 - 三七分控妻,其中測試集30%州袒,訓練集70%,隨機種子設置為2018

任務1:對數據進行探索和分析弓候。時間:2天

數據類型的分析

無關特征刪除

數據類型轉換

缺失值處理

……以及你能想到和借鑒的數據分析處理

11 /數據競賽 - 達觀杯

課程設計:胡穩(wěn) 李振強 居居

組隊學習說明:12天的時間實現數據預處理(TF-IDF與word2vec)郎哭、模型實踐(樸素貝葉斯他匪、SVM與LightGBM)以及模型優(yōu)化的整套流程,一起完成一次NLP類型的比賽夸研。

任務路線:數據初識->數據處理->模型實踐->模型優(yōu)化

組隊學習周期:12天

定位人群:能夠熟練使用python邦蜜,難度系數中

每個任務完成大概所需時間:2-3h

任務預覽(2天)

1、下載數據亥至,讀取數據悼沈,觀察數據

(提取5000條數據進行實踐)

2、將訓練集拆分為訓練集和驗證集

分享自己對數據以及賽題的理解和發(fā)現抬闯;

12 /PyTorch基礎

課程設計:許輝 李奇峰

組隊學習說明:通過學習pytorch的基本操作井辆,最終完成手寫數字的識別

任務路線:安裝pytorch->設立圖并計算->實現邏輯回歸->構建多層神經網絡->PyTorch實現L1,L2正則化以及Dropout->書寫優(yōu)化器代碼->用PyTorch完成手寫數字識別

學習周期:7天

定位人群:熟悉python的基礎用法溶握,難度系數中

任務完成所需時間:2-3h/天

任務預覽(2天)

什么是Pytorch,為什么選擇Pytroch蒸播?

Pytroch的安裝

配置Python環(huán)境

準備Python管理器

通過命令行安裝PyTorch

PyTorch基礎概念

通用代碼實現流程

設立計算圖并自動計算

閱讀梯度下降代碼并書寫體會

寫一個簡單的神經網絡

13 /深度學習-nlp

課程設計:jepson

組隊學習說明:學習自然語言處理理論睡榆,并且通過對某些數據集的文本分類任務不斷優(yōu)化來進行實踐。

任務路線:特征提取—>特征選擇—>文本表示—>傳統機器學習算法跑模型—>LDA生成新特征—>深度學習算法跑模型

定位人群:有Python基礎袍榆,基本框架的基礎(例如TensorFlow胀屿、Keras和pyTorch等)!難度系數高

組隊學習周期:18天

每個任務完成大概所需時間:3-4h

任務預覽(2天)

1包雀、IMDB數據集下載和探索(參考TensorFlow官方教程)

2宿崭、THUCNews數據集下載和探索(參考博客中的數據集部分和預處理部分)

3、學習召回率才写、準確率葡兑、ROC曲線、AUC赞草、PR曲線這些基本概念

14 /編程

課程設計:光城 讹堤、LeoLRH

組隊學習說明:利用自己所熟知的編程語言,具有一定基礎厨疙,討論在面試中可能出現的數據結構問題洲守,一起學習重溫經典數據結構

任務路線:數組->鏈表->棧->隊列->遞歸->排序->二分查找->哈希表->字符串->二叉樹->堆->圖->回溯->分治->動態(tài)規(guī)劃

組隊學習周期:14天甚至往上大概16天左右(周末進行整體整理討論)(每天任務時間具體看任務情況)

定位人群:有一門語言基礎和算法基礎的同學,難度系數高沾凄,小白慎入94肌!撒蟀!

每個任務完成大概所需時間:平均每天學習時間在1個小時左右叙谨,晚上統一,半個小時進行集體討論總結打卡牙肝。

任務預覽(2天)

【數組】

實現一個支持動態(tài)擴容的數組

實現一個大小固定的有序數組唉俗,支持動態(tài)增刪改操作

實現兩個有序數組合并為一個有序數組

學習哈希表思想嗤朴,并完成leetcode上的兩數之和(1)及Happy Number(202)!(要求全部用哈希思想實現虫溜!)(選做)(注意:在第四天會進行繼續(xù)學習)

練習:

Three Sum(求三數之和)

Majority Element(求眾數)

Missing Positive(求缺失的第一個正數)

【鏈表】

實現單鏈表雹姊、循環(huán)鏈表、雙向鏈表衡楞,支持增刪操作

實現單鏈表反轉

實現兩個有序的鏈表合并為一個有序鏈表

實現求鏈表的中間結點

練習:

Linked List Cycle I(環(huán)形鏈表)

Merge k Sorted Lists(合并 k 個排序鏈表)

報名意向

我們會根據學習需求對Datawhale團隊進行分工安排吱雏,不作為最終選擇。

在這里投票:https://mp.weixin.qq.com/s/35v6Dl2jvrguDRG7eoY0cg

參與方式

image

圖片: 伊小雪

排版: 無 多 李 方

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末瘾境,一起剝皮案震驚了整個濱河市歧杏,隨后出現的幾起案子,更是在濱河造成了極大的恐慌迷守,老刑警劉巖犬绒,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異兑凿,居然都是意外死亡凯力,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進店門礼华,熙熙樓的掌柜王于貴愁眉苦臉地迎上來咐鹤,“玉大人,你說我怎么就攤上這事圣絮∑砘蹋” “怎么了?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵扮匠,是天一觀的道長捧请。 經常有香客問我,道長餐禁,這世上最難降的妖魔是什么血久? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮帮非,結果婚禮上氧吐,老公的妹妹穿的比我還像新娘。我一直安慰自己末盔,他們只是感情好筑舅,可當我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著陨舱,像睡著了一般翠拣。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上游盲,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天误墓,我揣著相機與錄音蛮粮,去河邊找鬼。 笑死谜慌,一個胖子當著我的面吹牛然想,可吹牛的內容都是我干的。 我是一名探鬼主播欣范,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼变泄,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了恼琼?” 一聲冷哼從身側響起妨蛹,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎晴竞,沒想到半個月后蛙卤,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡噩死,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年表窘,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片甜滨。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖瘤袖,靈堂內的尸體忽然破棺而出衣摩,到底是詐尸還是另有隱情,我是刑警寧澤捂敌,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布艾扮,位于F島的核電站,受9級特大地震影響占婉,放射性物質發(fā)生泄漏泡嘴。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一逆济、第九天 我趴在偏房一處隱蔽的房頂上張望酌予。 院中可真熱鬧,春花似錦奖慌、人聲如沸抛虫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽建椰。三九已至,卻和暖如春岛马,著一層夾襖步出監(jiān)牢的瞬間棉姐,已是汗流浹背屠列。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留伞矩,地道東北人笛洛。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像扭吁,于是被迫代替她去往敵國和親撞蜂。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,554評論 2 349

推薦閱讀更多精彩內容