人工智能猾普,用計算機(jī)實現(xiàn)人類智能。機(jī)器通過大量訓(xùn)練數(shù)據(jù)訓(xùn)練本谜,程序不斷自我學(xué)習(xí)初家、修正訓(xùn)練模型。模型本質(zhì)乌助,一堆參數(shù)溜在,描述業(yè)務(wù)特點。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)(結(jié)合深度神經(jīng)網(wǎng)絡(luò))眷茁。
傳統(tǒng)計算機(jī)器下棋,貪婪算法纵诞,Alpha-Beta修剪法配合Min-Max算法上祈。
AlphaGo,蒙特卡洛樹搜索法(Monte Carlo tree search,MCTS)和深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)浙芙。估值網(wǎng)絡(luò)(value network登刺,盤面評估函數(shù)),計算盤面分類嗡呼。策略網(wǎng)絡(luò)(policy network)纸俭,計算每個棋概率、勝率南窗。訓(xùn)練模型過程揍很,分類方法得到直接策略,直接策略對歷史棋局資料庫進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)(深度卷積神經(jīng)網(wǎng)絡(luò))得到習(xí)得策略万伤,強(qiáng)化學(xué)習(xí)自我對局(蒙特卡洛樹狀搜尋法)得到改良策略窒悔,回歸整體統(tǒng)計得到估值網(wǎng)絡(luò)。谷歌《Nature》論文敌买,《Mastering the game of Go with deep neural networks and tree search》简珠。
深度學(xué)習(xí)。前身 是人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)虹钮,模仿人腦神經(jīng)元傳遞聋庵、處理信息模式膘融。輸入層(input layer)輸入訓(xùn)練數(shù)據(jù),輸出層(output layer)輸出計算結(jié)果祭玉,中間隱藏層(hidden layer)向前傳播數(shù)據(jù)氧映。
數(shù)據(jù)預(yù)處理,圖片攘宙,圖像居中屯耸、灰度調(diào)整、梯度銳化蹭劈、去除噪聲疗绣、傾斜度調(diào)整。輸入神經(jīng)網(wǎng)絡(luò)第一層铺韧,第一層提取圖像特征多矮,有用向下傳遞,最后一層輸出結(jié)果哈打。前向傳播(forword propagation)塔逃。分類概率向量,前5概率值料仗。
深度學(xué)習(xí)湾盗,利用已知數(shù)據(jù)學(xué)習(xí)模型,在未知數(shù)據(jù)做出預(yù)測立轧。神經(jīng)元特性格粪,激活函數(shù)(activation function),非線性函數(shù)氛改,輸入非線性變化帐萎,前向傳播;成本函數(shù)(cost function),定量評估預(yù)測值和真實值差距胜卤,調(diào)整權(quán)重參數(shù)疆导,減少損失,反向傳播(backword propagation)葛躏。
神經(jīng)網(wǎng)絡(luò)算法核心澈段,計算、連接舰攒、評估均蜜、糾錯、訓(xùn)練芒率。深度學(xué)習(xí)增加中間隱藏層數(shù)和神經(jīng)元數(shù)囤耳,網(wǎng)絡(luò)變深變寬,大量數(shù)據(jù)訓(xùn)練。
分類(classification)充择。輸入訓(xùn)練數(shù)據(jù)特征(feature)德玫、標(biāo)記(label),找出特征和標(biāo)記映射關(guān)系(mapping)椎麦,標(biāo)記糾正學(xué)習(xí)偏差宰僧,提高預(yù)測率。有標(biāo)記學(xué)習(xí)為監(jiān)督學(xué)習(xí)(supervised learning)观挎。無監(jiān)督學(xué)習(xí)(unsuperVised learning)琴儿,數(shù)據(jù)只有特征沒有標(biāo)記。訓(xùn)練不指定明確分類嘁捷,數(shù)據(jù)聚群結(jié)構(gòu)造成,相似類型聚集一起。沒有標(biāo)記數(shù)據(jù)分組合雄嚣,聚類(clustering)晒屎;成功激勵制度,強(qiáng)化學(xué)習(xí)(reinforcement learning,RL)缓升。延遲獎賞與訓(xùn)練相關(guān)鼓鲁,激勵函數(shù)獲得狀態(tài)行動映射,適合連續(xù)決策領(lǐng)域港谊。半監(jiān)督學(xué)習(xí)(semi-supervised learning)骇吭,訓(xùn)練數(shù)據(jù)部分有標(biāo)記,部分沒有歧寺,數(shù)據(jù)分布必然不完全隨機(jī)燥狰,結(jié)合有標(biāo)記數(shù)據(jù)局部特征,大量無標(biāo)記數(shù)據(jù)整體分布成福,得到較好分類結(jié)果碾局。有監(jiān)督學(xué)習(xí)(分類荆残、回歸)-半監(jiān)督學(xué)習(xí)(分類奴艾、回歸)-半監(jiān)督聚類(標(biāo)記不確定)-無監(jiān)督學(xué)習(xí)(聚類)。
深度學(xué)習(xí)入門内斯,算法知識蕴潦、大量數(shù)據(jù)、計算機(jī)(最好GPU)俘闯。
學(xué)習(xí)數(shù)學(xué)知識潭苞,訓(xùn)練過程涉及過程抽象數(shù)學(xué)函數(shù),定義網(wǎng)絡(luò)結(jié)構(gòu)真朗,定義線性非線性函數(shù)此疹,設(shè)定優(yōu)化目標(biāo),定義損失函數(shù)(loss function),訓(xùn)練過程求解最優(yōu)解次優(yōu)解蝗碎,基本概率統(tǒng)計湖笨、高等數(shù)學(xué)、線性代數(shù)蹦骑,知道原理慈省、過程,興趣涉獵推導(dǎo)證明眠菇。
經(jīng)典機(jī)器學(xué)習(xí)理論边败、基本算法,支持向量機(jī)捎废、邏輯回歸笑窜、決策樹、樸素貝葉斯分類器缕坎、隨機(jī)森林怖侦、聚類算法、協(xié)同過濾谜叹、關(guān)聯(lián)性分析匾寝、人工神經(jīng)網(wǎng)絡(luò)、BP算法荷腊、PCA艳悔、過擬合、正則化女仰。
編程工具(語言)猜年,Python解釋型、面向?qū)ο蠹踩獭討B(tài)數(shù)據(jù)類型高級程序設(shè)計語言乔外,線性代數(shù)庫、矩陣操作一罩,Numpy杨幼、Pandas第三方庫,機(jī)器學(xué)習(xí)庫sklearn聂渊,SVM差购、邏輯回歸,MATLAB汉嗽,R欲逃,C++,Java饼暑,Go稳析。
經(jīng)典論文洗做,最新動態(tài)研究成果,手寫數(shù)據(jù)字識別彰居,LeNet竭望,物體目標(biāo)檢測,MSCNN裕菠,博客咬清、筆記、微信公眾號奴潘、微博旧烧、新媒體資訊,新訓(xùn)練方法画髓,新模型掘剪。
自己動手訓(xùn)練神經(jīng)網(wǎng)絡(luò),選擇開源深度學(xué)習(xí)框架奈虾,主要考慮用的人多夺谁,方向主要集中視覺、語音肉微,初學(xué)最好從計算機(jī)視覺入手匾鸥,用各種網(wǎng)絡(luò)模型訓(xùn)練手寫數(shù)字(MNIST)、圖像分類(CIFAR)數(shù)據(jù)集碉纳。
學(xué)入興趣工作領(lǐng)域勿负,計算機(jī)視覺,自然語言處理劳曹,預(yù)測奴愉,圖像分類、目標(biāo)檢測铁孵、視頻目標(biāo)檢測锭硼,語音識別、語音合成蜕劝、對話系統(tǒng)檀头、機(jī)器翻譯、文章摘要熙宇、情感分析鳖擒,醫(yī)學(xué)行業(yè)溉浙,醫(yī)學(xué)影像識別烫止,淘寶穿衣,衣服搭配戳稽,款式識別馆蠕,保險期升、通信客服,對話機(jī)器人智能問答系統(tǒng)互躬,智能家居播赁,人機(jī)自然語言交互。
工作問題吼渡,準(zhǔn)確率容为、壞案例(bad case)、識別速度寺酪,可能瓶頸坎背,結(jié)合具體行業(yè)領(lǐng)域業(yè)務(wù)創(chuàng)新,最新科研成果寄雀,調(diào)整模型得滤,更改模型參數(shù)候址,貼近業(yè)務(wù)需求讲仰。
傳統(tǒng)基于規(guī)則,依賴知識竹握。統(tǒng)計方法為核心機(jī)器學(xué)習(xí)急膀,重要的是做特征工程(feature engineering)沮协,調(diào)參,根據(jù)領(lǐng)域經(jīng)驗提取特征卓嫂,文字等抽象領(lǐng)域皂股,特征相對容易提取,語音一維時域信號命黔、圖像二維空域信號等領(lǐng)域呜呐,提取特征困難。深度學(xué)習(xí)悍募,神經(jīng)網(wǎng)絡(luò)每層自動學(xué)習(xí)特征蘑辑。TensorFlow深度學(xué)習(xí)開源工具。
TensorFlow支持異構(gòu)設(shè)備分布式計算(heterogeneous distributed computing)坠宴。異構(gòu)洋魂,包含不同成分,異構(gòu)網(wǎng)絡(luò)喜鼓、異構(gòu)數(shù)據(jù)庫副砍。異構(gòu)設(shè)備,CPU庄岖、GPU核心協(xié)同合作豁翎。分布式架構(gòu)調(diào)度分配計算資源、容錯隅忿。TensorFlow支持卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)心剥、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)邦尊,長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM,RNN特例)。
《The Unreasonable Effectiveness of Recurrent Neural Networks》优烧。Tensor庫對CPU/GPU透明蝉揍,不同設(shè)備運(yùn)行由框架實現(xiàn),用戶指定什么設(shè)置做什么運(yùn)算畦娄。完全獨(dú)立代碼庫又沾,腳本語言(Python)操作Tensor,實現(xiàn)所有深度學(xué)習(xí)內(nèi)容熙卡,前向傳播捍掺、反向傳播、圖形計算再膳。共享訓(xùn)練模型挺勿,TensorFlow slim模塊。沒有編譯過程喂柒,更大更復(fù)雜網(wǎng)絡(luò)不瓶,可解釋性,有效日志調(diào)試灾杰。
研究人群蚊丐。學(xué)者,深度學(xué)習(xí)理論研究艳吠,網(wǎng)絡(luò)模型麦备,修改參數(shù)方法和理論,產(chǎn)耱科研前沿昭娩,理論研究凛篙、模型實驗,新技術(shù)新理論敏感栏渺。算法改進(jìn)者呛梆,現(xiàn)有網(wǎng)絡(luò)模型適配應(yīng)用,達(dá)到更好立人日木磕诊,模型改進(jìn)填物,新算法改進(jìn)應(yīng)用現(xiàn)有模型,為上層應(yīng)用提供優(yōu)良模型霎终。工業(yè)研究者滞磺,掌握各種模型網(wǎng)絡(luò)結(jié)構(gòu)、算法實現(xiàn)莱褒,閱讀優(yōu)秀論文击困,復(fù)現(xiàn)成果,應(yīng)用工業(yè)保礼,主流人群沛励。
TensorFlow工業(yè)優(yōu)勢,基于服務(wù)端大數(shù)據(jù)服務(wù)(谷歌云平臺炮障、搜索)目派,面向終端用戶移動端(Android)和嵌入式。模型壓縮胁赢、8位低精度數(shù)據(jù)存儲企蹭。
TensorFlow特性。高度靈活性(deep flexibility)智末,數(shù)據(jù)流圖(data flow graph)數(shù)值計算谅摄,只需要構(gòu)建圖,書寫計算內(nèi)部循環(huán)系馆,自定義上層庫送漠。真正可移植性(true portability),CPU由蘑、GPU闽寡、臺式機(jī)、服務(wù)器尼酿、移動端爷狈、云端服務(wù)器、Docker容器裳擎。產(chǎn)研結(jié)合(connect research and production)涎永,快速試驗框架,新算法鹿响,訓(xùn)練模型羡微。自動求微分(auto-differentiation),只需要定義預(yù)測模型結(jié)構(gòu)惶我、目標(biāo)函數(shù)拷淘,添加數(shù)據(jù)。多語言支持(language options)指孤,Python启涯、C++、Java接口恃轩,C++實現(xiàn)核心结洼,Jupyter Notebook,特征映射(feature map)叉跛,自定義其他語言接口松忍。優(yōu)化性能(maximize performance),線程筷厘、隊列鸣峭、分布式計算支持宏所,TensorFlow數(shù)據(jù)流圖不同計算元素分配不同設(shè)備,最大化利用硬件資源摊溶。
應(yīng)用公司爬骤。谷歌、京東莫换、小米霞玄、Uber、eBay拉岁、Dropbox坷剧、Airbnb。
2016.4喊暖,0.8版支持分布式惫企、多GPU。2016.6陵叽,0.9版支持移動設(shè)備雅任。2017.2,1.0版Java咨跌、Go實驗API沪么,專用編譯器XLA、調(diào)試工具Debugger锌半,tf.transform數(shù)據(jù)預(yù)處理禽车,動態(tài)圖計算TensorFlow Fold。
機(jī)器學(xué)習(xí)賽事刊殉。
ImageNet ILSVRC(ImageNet Large Scale Visual Recognition Challenge殉摔,大規(guī)模視覺識別挑戰(zhàn)賽),對象檢測记焊、圖像識別算法逸月。2010年開始,最大圖像識別數(shù)據(jù)庫遍膜,1500萬張有標(biāo)記高分辨率圖像數(shù)據(jù)集碗硬,22000類別,比寒用1000類別各1000圖像瓢颅,120萬訓(xùn)練圖像恩尾,5萬驗證圖像,15萬測試圖像挽懦。每年邀請知名IT公司測試圖片分類系統(tǒng)翰意。Top-1,預(yù)測輸出概率最高類別錯誤率。Top-5,預(yù)測輸出概率前五類別錯誤率。2016冀偶,CUImage目標(biāo)檢測第一醒第,商湯科技、香港中文大學(xué)进鸠;CUvideo視頻物體檢測子項目第一稠曼,商湯科技、香港中文大學(xué)堤如;SenseCUSceneParsing場景分析第一蒲列,商湯科技窒朋、香港中文大學(xué)搀罢;Trimps-Soushen目標(biāo)定位第一,公安部三所NUIST視頻物體探測兩個子項目第一侥猩,南京信息工程大學(xué)榔至;Hikvvision場景分類第一,浩劾停康威視唧取;
Kaggel,2010年成立划提,數(shù)據(jù)發(fā)掘枫弟、數(shù)據(jù)分析預(yù)測競賽在線平臺。公司出數(shù)據(jù)出錢鹏往,計算機(jī)科學(xué)家淡诗、數(shù)學(xué)家、數(shù)據(jù)科學(xué)家領(lǐng)取任務(wù)伊履,提供解決方案韩容。3萬到25萬美元獎勵。
天池大數(shù)據(jù)競賽唐瀑,阿里群凶,穿衣搭配、微博互動預(yù)測哄辣、用戶重復(fù)購買行為預(yù)測请梢,賽題攻略。
國內(nèi)人工智能公司力穗。騰訊優(yōu)圖溢陪、阿里云ET、百度無人駕駛睛廊,搜狗形真、云從科技、商湯科技、昆侖萬維咆霜、格靈深瞳邓馒。
陌上花科技,衣+(dress+)蛾坯,圖像識別光酣、圖像搜索、特體追蹤檢測是脉课、圖片自動化標(biāo)記救军、圖像視頻智能分析、邊看邊買倘零、人臉識別分析唱遭。曠視科技,F(xiàn)ace++呈驶,人臉識別精度拷泽,美顏,支付袖瞻∷局拢科大訊飛,語音識別聋迎、語音合成脂矫、語言云、分詞霉晕、詞性標(biāo)注庭再、命名實體識別、依存句法分析娄昆、語義角色標(biāo)注佩微。地平線,嵌入式萌焰。
參考資料:
《TensorFlow技術(shù)解析與實戰(zhàn)》
歡迎付費(fèi)咨詢(150元每小時)哺眯,我的微信:qingxingfengzi