因為有同學(xué)反映英文版看得太心累狞悲,所以翻譯了一下,如果有任何錯誤衷畦,歡迎指正栗涂。 英文版可以戳這里,后期可能會加上每個技能要求背后學(xué)習(xí)地址的鏈接祈争。
總目錄
- 編程
- 統(tǒng)計學(xué)
- 數(shù)學(xué)
- 機(jī)器學(xué)習(xí)
- 數(shù)據(jù)整理
- 數(shù)據(jù)可視化
- 數(shù)據(jù)直覺
編程
-
Python
- numpy
- pandas
- matplotlib
- scipy
- scikit-learn
-
R語言
- ggplot2
- dplyr
- ggally
- reshape2
-
可選
- ipython
- ipython notebook
- anaconda
- ggplot
- seaborn
- 電子表格工具 (比如Excel)
-
額外的技能
- Javascript 和 HTML
- D3.js
- AJAX
- jQuery
- C/C++ 或者 Java
- Javascript 和 HTML
統(tǒng)計學(xué)
- 描述性和推理性統(tǒng)計
- 平均數(shù)斤程,中位數(shù),眾數(shù)
- 數(shù)據(jù)分布
- 正態(tài)分布
- 指數(shù)/泊松
- 二項式分布
- 卡方分布
- 標(biāo)準(zhǔn)偏差和方差
- 假設(shè)檢驗
- P-values
- 顯著性檢驗
- z檢驗, t檢驗, 曼-惠特尼秩和檢驗
- 卡方檢驗和方差分析
- 實驗設(shè)計
- A/B 測試
- 控制變量并選擇良好的控制和測試組
- 采樣大小和冪次現(xiàn)象
- 假設(shè)測試菩混,測試假設(shè)
- 置信水平
- SMART實驗:具體忿墅,可衡量,可行沮峡,現(xiàn)實疚脐,及時
數(shù)學(xué)
- 將數(shù)字和概念轉(zhuǎn)換為數(shù)學(xué)表達(dá)式
- 求解代數(shù)方程中的缺失值
- 線性代數(shù)和微積分
- 矩陣, 向量點積是理解的關(guān)鍵。
- 特征值和特征向量 - 了解這兩個概念的意義
- 多變量導(dǎo)數(shù)和積分在微積分
機(jī)器學(xué)習(xí)
- 監(jiān)督學(xué)習(xí)
- 決策樹
- 樸素貝葉斯分類
- 普通最小二乘回法
- 邏輯回歸
- 神經(jīng)網(wǎng)絡(luò)
- 支持向量機(jī)
- 集合方法
- 無監(jiān)督學(xué)習(xí)
- 集群算法
- 主成分分析(PCA)
- 奇異值分解(SVD)
- 獨(dú)立成分分析(ICA)
- 增強(qiáng)學(xué)習(xí)
- Qlearning
- TD-學(xué)習(xí)
- 增強(qiáng)學(xué)習(xí)
數(shù)據(jù)整理
- ** Python **
- 了解Python字符串庫的字符串操作
- 解析常見的文件格式,如csv和xml文件
- 正則表達(dá)式
- 數(shù)學(xué)變換
- 比如,使用log-10變換將非正態(tài)分布轉(zhuǎn)換為正態(tài)分布
- 數(shù)據(jù)庫系統(tǒng)(基于SQL和基于SQL) - 數(shù)據(jù)庫充當(dāng)存儲信息的中心樞紐
- 關(guān)系數(shù)據(jù)庫脊阴,如PostgreSQL,mySQL呼畸,Netezza,Oracle等颁虐。
- 可選:Hadoop蛮原,Spark,MongoDB
- SQL
交流和數(shù)據(jù)可視化
- 了解可視化編碼并傳達(dá)您希望受眾從可視化中移除的內(nèi)容
- 編程
- matplotlib
- ggplot
- d3.js
- 顯示數(shù)據(jù)并說服用戶與您的數(shù)據(jù)
- 了解手頭業(yè)務(wù)數(shù)據(jù)情況的背景
- 思考五個步驟另绩,預(yù)測聽眾的的問題將會在哪里儒陨,你的觀眾將挑戰(zhàn)你的假設(shè)和結(jié)論
- 提供(報告)預(yù)讀,并在實際會議之前與感興趣的各方進(jìn)行預(yù)先協(xié)調(diào)會議