Python文本數(shù)據(jù)與圖像數(shù)據(jù)分析的常見技術
文本分析:清洗與常見算法
a) 正則表達式
b) 分詞與關鍵字提取
圖像分析:預處理方法(PIL)
a) 圖像數(shù)據(jù)讀取
b) 圖像分析
基本圖像處理的基本流程
實踐:基于微博數(shù)據(jù)的人物信息的提取九火、清洗
數(shù)據(jù)可視化
1 數(shù)據(jù)可視化簡介
2 常用可視化方式與圖表繪制
3 Matplolib
4 Seaborn
5 實踐:基于微博數(shù)據(jù)的人物信息以及關系的數(shù)據(jù)可視化
Python與機器學習
1 什么是機器學習
2 scikit-learn介紹
3 scikit-learn內(nèi)常用算法介紹
4 機器學習基本流程
5 實踐:微博人物相似聚類算法
Python與深度學習
1 深度學習簡介
2 Tensorflow入門
3 Kaggle:簡單二分類:貓狗識別
4 實踐圖像分類:微博明星人臉識別
Python與社交網(wǎng)絡
1 圖(graph)基礎
2 社交網(wǎng)絡算法(包括PageRank算法糠悼、社區(qū)發(fā)現(xiàn)算法等)
3 igraph介紹與network
4 實踐微博社區(qū)發(fā)現(xiàn)算法:明星關系與可視化