這次一共打算組織14個組隊學習,涵蓋了AI領域從理論知識到動手實踐的內容韧掩,難度系數分為低、中窖铡、高檔疗锐,可以按照需要參加哦
組隊學習信息
1 /Python基礎
課程設計:馬晶敏,葉梁费彼、許輝
組隊學習說明:學習Python基礎知識滑臊,針對Python小白的學習之路
任務路線:基礎知識-函數-第三方模塊-類和對象-基礎爬蟲
組隊學習周期:10天
定位人群:Python小白,難度系數低
每個任務完成大概所需時間:每天平均花費時間2小時-4小時不等箍铲,根據個人學習接受能力強弱有所浮動
任務預覽(2天)
1雇卷、環(huán)境搭建
2、Python初體驗
3、Python基礎
如:變量特性+命名規(guī)則关划、注釋方法小染、“:”作用、學會使用dir( )及和help( )贮折、import使用裤翩、pep8介紹
4、Python數值基本知識
如:Python中數值類型调榄,int踊赠,float,bool每庆,e記法等筐带、算數運算符、邏輯運算符扣孟、成員運算符烫堤、身份運算符、運算符優(yōu)先級
2 /數據分析
課程設計:金娟娟
組隊學習說明:學習python for data analysis基礎知識
任務路線:python基礎-重要的python庫(numpy/pandas/matplotlib/seaborn等)-數據清洗和分析
組隊學習周期:15天定位人群:數據分析小白凤价,難度系數低
每個任務完成大概所需時間:每天平均花費時間2小時-4小時不等鸽斟,根據個人學習接受能力強弱有所浮動
任務預覽(2天)
完成《利用python進行數據分析》書上1-2章的學習,代碼實現的過程用上傳到GitHub
3 /初級算法梳理
課程設計:蘇靜利诺、康兵兵
組隊學習說明:通過查閱書籍或參考文獻富蓄、學習視頻等,對傳統機器學習算法進行梳理
任務路線:線性回歸--->邏輯回歸--->決策樹
組隊學習周期:7天
定位人群:有概率論慢逾、矩陣運算立倍、求導、泰勒展開等基礎數學知識侣滩;難度系數低
每個任務完成大概所需時間:2-3h
任務預覽(2天)
1. 機器學習的一些概念
有監(jiān)督口注、無監(jiān)督、泛化能力君珠、過擬合欠擬合(方差和偏差以及各自解決辦法)寝志、交叉驗證
2. 線性回歸的原理
3. 線性回歸損失函數、代價函數策添、目標函數
4. 優(yōu)化方法(梯度下降法材部、牛頓法、擬牛頓法等)
5唯竹、線性回歸的評估指標
6乐导、sklearn參數詳解
學習時長:兩天
參考:西瓜書
cs229吳恩達機器學習課程
李航統計學習
谷歌搜索
4 /MySQL
課程設計:楊皓博 孫濤 楊煜
組隊學習說明:一周內快速了解并掌握MySQL的主要內容。通過大量SQL語句的實戰(zhàn)練習浸颓,可以在簡歷上寫熟練掌握MySQL物臂。(注意:本課程只關注SQL查詢語句本身旺拉,對數據庫的涉及較少。)
任務路線: MySQL軟件安裝及數據庫基礎->查詢語句->表操作->表聯結->MySQL 實戰(zhàn)->MySQL 實戰(zhàn)-復雜項目
組隊學習周期:(7天)
定位人群:小白鹦聪,難度系數低
每個任務完成大概所需時間:2-3h
任務預覽(2天)
任務預覽(3天)
軟件安裝及服務器設置账阻。
數據庫基礎知識
MySQL數據庫管理系統
SQL是什么?MySQL是什么泽本?
查詢語句 SELECT FROM
篩選語句 WHERE
分組語句 GROUP BY
排序語句 ORDER BY
SQL注釋
SQL代碼規(guī)范
5 /統計學
課程設計:王佳鑫、許輝
組隊學習說明:學習內容涵蓋統計學中所有的主要知識姻僧,并對其分部分進行梳理總結规丽。
任務路線:根據所學習內容進行(1)統計學基本知識、二項及泊松分布撇贺、大數定律赌莺、正態(tài)分布等內容的總結進行整體的回顧、梳理與完善松嘶;(2)中心極限定理艘狭、置信區(qū)間、 假設檢驗等內容的總結進行整體的回顧翠订、梳理與完善巢音。
組隊學習周期:7天
定位人群:微積分、基本概率知識儲備尽超,難度系數中
每個任務完成大概所需時間:2-3h
任務預覽(2天)
學習內容 1:統計學基本知識官撼、二項及泊松分布
學習內容 2: 大數定律、正態(tài)分布
6 /LeetCode
課程設計:老表似谁、于鴻飛傲绣、楊皓博
組隊學習說明:LeetCode刷題組隊學習,從零開始每周10道算法題巩踏,在良好的學習氛圍下秃诵,培養(yǎng)刷題習慣,學習算法思想塞琼。(不限制編程語言)
任務路線:按照LeetCode默認題目順序每周10道題菠净。
組隊學習周期:7天
定位人群:適合有一門語言基礎的同學,難度系數中
每個任務完成大概所需時間:2-3h
課程內容:選取leetcode上面的10道題
7 /知乎小組
課程設計:小堯屈梁、黑桃嗤练、李嚴
組隊學習說明:到知乎回答問題,鞏固自身所學的知識在讶,鍛煉寫作輸出和表達能力煞抬,提升個人影響力,小組以“寫出自己的最佳回答”為總目標
任務路線:自己選擇較為熟悉領域的相關1個問題构哺,寫出優(yōu)質答案革答,并互相點評
組隊學習周期:7天
定位人群:比較熟悉AI某領域战坤,難度系數中,對輸出能力有要求
3個任務完成所需時間:6-8h
在知乎上選擇一道AI相關的題残拐,回答并優(yōu)化
8 /爬蟲
課程設計:光城途茫、李方
組隊學習說明:
從零基礎到能獨立完成一個簡易的爬蟲項目
任務路線:請求→re庫→BeautifulSoup庫→lxml庫→selenium庫→IP問題→實戰(zhàn)小項目
組隊學習周期:7天
定位人群:有Python基礎。難度系數中
每個任務完成大概所需時間:2-3h/天
任務預覽(2天)
1溪食、學習get與post請求囊卜,嘗試使用requests或者是urllib用get方法向 https://www.baidu.com/ 發(fā)出一個請求,并將其返回結果輸出错沃。
2栅组、如果是斷開了網絡,再發(fā)出申請枢析,結果又是什么玉掸。了解申請返回的狀態(tài)碼。
3醒叁、了解什么是請求頭司浪,如何添加請求頭。
4把沼、學習什么是正則表達式并嘗試一些正則表達式并進行匹配啊易。
然后結合requests、re兩者的內容爬取 https://movie.douban.com/top250 里的內容智政。
9 /高級算法梳理
課程設計:黑桃认罩,劉廣月,于鴻飛
組隊學習說明:通過查閱相關文獻续捂,對機器學習算法進行梳理
任務路線:RF--->GBDT--->XGB
組隊學習周期:7天
定位人群:有概率論垦垂、矩陣運算、求導牙瓢、泰勒展開等基礎數學知識劫拗;難度系數中
每個任務完成大概所需時間:2-3h
任務預覽(2天)
【參考框架】歡迎有自己的框架
1. 集成學習概念
2. 個體學習器概念
3. boosting bagging
4. 結合策略(平均法,投票法矾克,學習法)
5. 隨機森林思想
6. 隨機森林的推廣
7. 優(yōu)缺點
8. sklearn參數
9.應用場景
10 /數據挖掘項目
課程設計:范晶晶页慷、李碧涵、
組隊學習說明:應用機器學習算法胁附,完整地走完一個數據挖掘項目流程
任務路線:數據分析→特征工程→模型構建→模型評估→模型調優(yōu)→模型融合
組隊學習周期:12天
定位人群:有Python基礎酒繁,sklearn基礎。難度系數中
每個任務完成大概所需時間:2-3h/天
任務預覽(2天)
要求:數據切分方式 - 三七分控妻,其中測試集30%州袒,訓練集70%,隨機種子設置為2018
任務1:對數據進行探索和分析弓候。時間:2天
數據類型的分析
無關特征刪除
數據類型轉換
缺失值處理
……以及你能想到和借鑒的數據分析處理
11 /數據競賽 - 達觀杯
課程設計:胡穩(wěn) 李振強 居居
組隊學習說明:12天的時間實現數據預處理(TF-IDF與word2vec)郎哭、模型實踐(樸素貝葉斯他匪、SVM與LightGBM)以及模型優(yōu)化的整套流程,一起完成一次NLP類型的比賽夸研。
任務路線:數據初識->數據處理->模型實踐->模型優(yōu)化
組隊學習周期:12天
定位人群:能夠熟練使用python邦蜜,難度系數中
每個任務完成大概所需時間:2-3h
任務預覽(2天)
1、下載數據亥至,讀取數據悼沈,觀察數據
(提取5000條數據進行實踐)
2、將訓練集拆分為訓練集和驗證集
分享自己對數據以及賽題的理解和發(fā)現抬闯;
12 /PyTorch基礎
課程設計:許輝 李奇峰
組隊學習說明:通過學習pytorch的基本操作井辆,最終完成手寫數字的識別
任務路線:安裝pytorch->設立圖并計算->實現邏輯回歸->構建多層神經網絡->PyTorch實現L1,L2正則化以及Dropout->書寫優(yōu)化器代碼->用PyTorch完成手寫數字識別
學習周期:7天
定位人群:熟悉python的基礎用法溶握,難度系數中
任務完成所需時間:2-3h/天
任務預覽(2天)
什么是Pytorch,為什么選擇Pytroch蒸播?
Pytroch的安裝
配置Python環(huán)境
準備Python管理器
通過命令行安裝PyTorch
PyTorch基礎概念
通用代碼實現流程
設立計算圖并自動計算
閱讀梯度下降代碼并書寫體會
寫一個簡單的神經網絡
13 /深度學習-nlp
課程設計:jepson
組隊學習說明:學習自然語言處理理論睡榆,并且通過對某些數據集的文本分類任務不斷優(yōu)化來進行實踐。
任務路線:特征提取—>特征選擇—>文本表示—>傳統機器學習算法跑模型—>LDA生成新特征—>深度學習算法跑模型
定位人群:有Python基礎袍榆,基本框架的基礎(例如TensorFlow胀屿、Keras和pyTorch等)!難度系數高
組隊學習周期:18天
每個任務完成大概所需時間:3-4h
任務預覽(2天)
1包雀、IMDB數據集下載和探索(參考TensorFlow官方教程)
2宿崭、THUCNews數據集下載和探索(參考博客中的數據集部分和預處理部分)
3、學習召回率才写、準確率葡兑、ROC曲線、AUC赞草、PR曲線這些基本概念
14 /編程
課程設計:光城 讹堤、LeoLRH
組隊學習說明:利用自己所熟知的編程語言,具有一定基礎厨疙,討論在面試中可能出現的數據結構問題洲守,一起學習重溫經典數據結構
任務路線:數組->鏈表->棧->隊列->遞歸->排序->二分查找->哈希表->字符串->二叉樹->堆->圖->回溯->分治->動態(tài)規(guī)劃
組隊學習周期:14天甚至往上大概16天左右(周末進行整體整理討論)(每天任務時間具體看任務情況)
定位人群:有一門語言基礎和算法基礎的同學,難度系數高沾凄,小白慎入94肌!撒蟀!
每個任務完成大概所需時間:平均每天學習時間在1個小時左右叙谨,晚上統一,半個小時進行集體討論總結打卡牙肝。
任務預覽(2天)
【數組】
實現一個支持動態(tài)擴容的數組
實現一個大小固定的有序數組唉俗,支持動態(tài)增刪改操作
實現兩個有序數組合并為一個有序數組
學習哈希表思想嗤朴,并完成leetcode上的兩數之和(1)及Happy Number(202)!(要求全部用哈希思想實現虫溜!)(選做)(注意:在第四天會進行繼續(xù)學習)
練習:
Three Sum(求三數之和)
Majority Element(求眾數)
Missing Positive(求缺失的第一個正數)
【鏈表】
實現單鏈表雹姊、循環(huán)鏈表、雙向鏈表衡楞,支持增刪操作
實現單鏈表反轉
實現兩個有序的鏈表合并為一個有序鏈表
實現求鏈表的中間結點
練習:
Linked List Cycle I(環(huán)形鏈表)
Merge k Sorted Lists(合并 k 個排序鏈表)
報名意向
我們會根據學習需求對Datawhale團隊進行分工安排吱雏,不作為最終選擇。
在這里投票:https://mp.weixin.qq.com/s/35v6Dl2jvrguDRG7eoY0cg
參與方式
圖片: 伊小雪
排版: 無 多 李 方