2017年最新 《基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)》全套課程:視頻畜疾、課件及代碼
官網(wǎng)課程介紹:http://www.chinahadoop.cn/classroom/46/introduction
課程下載:
主講老師:
張宗健悉尼科技大學(xué) 計(jì)算機(jī)視覺(jué)博士
曾任職澳大利亞聯(lián)邦科學(xué)與工業(yè)研究院(CSIRO )研究工程師纲爸,Vancl技術(shù)中心研究院圖像研發(fā)工程師窟勃,研究領(lǐng)域?yàn)橛?jì)算機(jī)視覺(jué)樊零,具體涉及:圖像場(chǎng)景理解、圖像語(yǔ)言問(wèn)題剂府、深度神經(jīng)網(wǎng)絡(luò)佳励、圖像檢索、Human ReID富腊、數(shù)據(jù)分析及預(yù)測(cè)坏逢、信號(hào)模式識(shí)別等
課程簡(jiǎn)介:
1. 基本理解計(jì)算機(jī)視覺(jué)中針對(duì)圖像的重要研究問(wèn)題。由淺及深得講解圖像的存儲(chǔ)赘被、預(yù)處理是整、特征提取、以及學(xué)術(shù)界和工業(yè)界中的主要應(yīng)用問(wèn)題民假。
2. 重點(diǎn)介紹深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)(DNN)模型在計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用浮入。具體涉及在計(jì)算機(jī)視覺(jué)領(lǐng)域如何應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)(CNN)、區(qū)域卷積網(wǎng)絡(luò)(R-CNN)羊异、全卷積網(wǎng)絡(luò)(FCN)事秀、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)、生成對(duì)抗網(wǎng)絡(luò)(GAN)等解決圖像應(yīng)用的難點(diǎn)野舶。
3. 課程將使用Python語(yǔ)言及深度網(wǎng)絡(luò)框架Tensorflow進(jìn)行案例實(shí)踐教學(xué)易迹。
面向人群:
1. 想入門計(jì)算機(jī)視覺(jué)的學(xué)生或從業(yè)者
2. 想學(xué)習(xí)深度學(xué)習(xí)的學(xué)生或從業(yè)者
3. 想了解和學(xué)習(xí)Tensorflow框架的學(xué)生或從業(yè)者
學(xué)習(xí)收益:
1. 循序漸進(jìn)得學(xué)習(xí)計(jì)算機(jī)視覺(jué)中的一些重要研究問(wèn)題
2. 學(xué)習(xí)不同深度神經(jīng)網(wǎng)絡(luò)(DNN)模型在計(jì)算機(jī)視覺(jué)的成功應(yīng)用
3. 了解DNN的設(shè)計(jì)及改進(jìn)思路
4. 學(xué)習(xí)深度學(xué)習(xí)框架Tensorflow的基本使用
開(kāi)課時(shí)間:
2017年5月12日
課程大綱:
第一講課題介紹/Introduction
1. 主要研究問(wèn)題
2. 開(kāi)源庫(kù)介紹(OpenCV,Caffe筒愚,Theano赴蝇,Tensorflow,Torch等)
3. 應(yīng)用案例:基于Python語(yǔ)言的OpenCV庫(kù)配置
第二講圖像數(shù)據(jù)處理/Image Data Processing
1. 空域分析及變換(Sobel巢掺,拉普拉斯句伶,高斯,中值等)
2. 頻域分析及變換(Fourier & Wavelet Transform)
3. 模板匹配陆淀,金字塔考余,濾波器組
4. 主成分分析/PCA,奇異值分解/SVD轧苫,聚類/Cluster
5. 應(yīng)用案例:人臉檢測(cè)方法——基于OpenCV庫(kù)
第三講圖像特征與描述/Image Feature & Descriptor
1. 顏色特征(RBG楚堤,HSV,Lab等)
2. 幾何特征(Edge含懊,Corner身冬,Blob等)
3. 紋理特征(HOG,LBP岔乔,Gabor等)
4. 局部特征(SIFT酥筝,SURF,F(xiàn)AST等)
5. 應(yīng)用案例:虛擬現(xiàn)實(shí)的圖像拼接(Image Stitching)
第四講圖像識(shí)別之圖像分類/Image Classification
1. 卷積神經(jīng)網(wǎng)絡(luò)介紹/CNN(AlexNet, VGG, GoogLeNet, ResNet)
2. 圖片分類/Image Classification
3. 場(chǎng)景分類/Scene Classification
4. ILSVRC(Imagenet Large Scale Visual Recognition Challenge )競(jìng)賽之分類問(wèn)題
5. 應(yīng)用案例:圖片分類之殘差神經(jīng)網(wǎng)絡(luò)ResNet
第五講圖像識(shí)別之圖像檢測(cè)/Image Detection
1. 區(qū)域卷積神經(jīng)網(wǎng)絡(luò)/R-CNN(SPPnet雏门,F(xiàn)ast/Faster R-CNN嘿歌,R-FCN)
2. 物體檢測(cè)/object detection & localization
3. 行人檢測(cè)/pedestrian detection
4. 人臉檢測(cè)/face detection
5. ILSVRC競(jìng)賽之物體檢測(cè)及定位問(wèn)題
6. 應(yīng)用案例:人臉檢測(cè)的Faster R-CNN應(yīng)用(快速版區(qū)域卷積神經(jīng)網(wǎng)絡(luò))
第六講圖像分割/Image Segmentation
1. 顯著性檢測(cè)/Saliency Detection
2. 物體分割/Object Segmentation(GraphCut掸掏,GrabCut等)
3. 語(yǔ)義分割/Semantic Segmentation(FCN,CRF/MRF)
4. PASCAL VOC競(jìng)賽介紹
5. 應(yīng)用案例:自動(dòng)駕駛場(chǎng)景圖片的語(yǔ)義分割——全卷積網(wǎng)絡(luò)DeepLab
第七講圖像描述(圖說(shuō))/Image Captioning
1. 深度語(yǔ)言模型介紹(Vanilla-RNN宙帝,LSTM丧凤,GRU)
2. LSTM原理解析
3. 圖說(shuō)模型原理與結(jié)構(gòu)
4. 大數(shù)據(jù)集介紹(MSCOCO,F(xiàn)lickr8K步脓,F(xiàn)lickr30k)
5. 應(yīng)用案例:圖說(shuō)智能(圖像標(biāo)注)的應(yīng)用——Show and Tell
第八講圖像問(wèn)答/Image Question Answering
1. 與圖像描述的區(qū)別
2. 大數(shù)據(jù)集介紹(VQA愿待,Visual Genome)
3. 圖像問(wèn)答模型原理及結(jié)構(gòu)
4. 模型增強(qiáng):注意力機(jī)制及外部知識(shí)庫(kù)
5. 應(yīng)用案例:圖像智能問(wèn)答的應(yīng)用模型堆棧注意網(wǎng)絡(luò)Stacked Attention Networks(SANs)
第九講圖像生成/Image Generation
1. 對(duì)抗生成網(wǎng)絡(luò)(GAN)
2. GAN在圖像生成中的應(yīng)用(圖片分布學(xué)習(xí)、以文生圖)
3. GAN在傳統(tǒng)問(wèn)題中的應(yīng)用(超分辨沪编、語(yǔ)義分割)
4. 應(yīng)用實(shí)例:圖像復(fù)原的超分辨(SRGAN)模型應(yīng)用
第十講圖像檢索/Content-based Image Retrieval
1. 檢索特征(顏色呼盆,紋理年扩,形狀蚁廓,局部特征,Bag of Visual Words)
2. 特征相似度
3.大數(shù)據(jù)集下的索引加速技術(shù)(KD-tree厨幻,Locality Sensitive Hash)
4. 雙向檢索技術(shù)(以圖搜圖&以文搜圖)
5.應(yīng)用案例:圖像檢索之開(kāi)源庫(kù)Lire (Lucence Image Retrieval)的應(yīng)用
需要課程加薇心:Bainchen888