學(xué)習(xí)筆記TF045:人工智能睦焕、深度學(xué)習(xí)藐握、TensorFlow、比賽垃喊、公司

人工智能猾普,用計算機(jī)實現(xiàn)人類智能。機(jī)器通過大量訓(xùn)練數(shù)據(jù)訓(xùn)練本谜,程序不斷自我學(xué)習(xí)初家、修正訓(xùn)練模型。模型本質(zhì)乌助,一堆參數(shù)溜在,描述業(yè)務(wù)特點。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)(結(jié)合深度神經(jīng)網(wǎng)絡(luò))眷茁。

傳統(tǒng)計算機(jī)器下棋,貪婪算法纵诞,Alpha-Beta修剪法配合Min-Max算法上祈。
AlphaGo,蒙特卡洛樹搜索法(Monte Carlo tree search,MCTS)和深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)浙芙。估值網(wǎng)絡(luò)(value network登刺,盤面評估函數(shù)),計算盤面分類嗡呼。策略網(wǎng)絡(luò)(policy network)纸俭,計算每個棋概率、勝率南窗。訓(xùn)練模型過程揍很,分類方法得到直接策略,直接策略對歷史棋局資料庫進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)(深度卷積神經(jīng)網(wǎng)絡(luò))得到習(xí)得策略万伤,強(qiáng)化學(xué)習(xí)自我對局(蒙特卡洛樹狀搜尋法)得到改良策略窒悔,回歸整體統(tǒng)計得到估值網(wǎng)絡(luò)。谷歌《Nature》論文敌买,《Mastering the game of Go with deep neural networks and tree search》简珠。

深度學(xué)習(xí)。前身 是人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)虹钮,模仿人腦神經(jīng)元傳遞聋庵、處理信息模式膘融。輸入層(input layer)輸入訓(xùn)練數(shù)據(jù),輸出層(output layer)輸出計算結(jié)果祭玉,中間隱藏層(hidden layer)向前傳播數(shù)據(jù)氧映。

數(shù)據(jù)預(yù)處理,圖片攘宙,圖像居中屯耸、灰度調(diào)整、梯度銳化蹭劈、去除噪聲疗绣、傾斜度調(diào)整。輸入神經(jīng)網(wǎng)絡(luò)第一層铺韧,第一層提取圖像特征多矮,有用向下傳遞,最后一層輸出結(jié)果哈打。前向傳播(forword propagation)塔逃。分類概率向量,前5概率值料仗。

深度學(xué)習(xí)湾盗,利用已知數(shù)據(jù)學(xué)習(xí)模型,在未知數(shù)據(jù)做出預(yù)測立轧。神經(jīng)元特性格粪,激活函數(shù)(activation function),非線性函數(shù)氛改,輸入非線性變化帐萎,前向傳播;成本函數(shù)(cost function),定量評估預(yù)測值和真實值差距胜卤,調(diào)整權(quán)重參數(shù)疆导,減少損失,反向傳播(backword propagation)葛躏。

神經(jīng)網(wǎng)絡(luò)算法核心澈段,計算、連接舰攒、評估均蜜、糾錯、訓(xùn)練芒率。深度學(xué)習(xí)增加中間隱藏層數(shù)和神經(jīng)元數(shù)囤耳,網(wǎng)絡(luò)變深變寬,大量數(shù)據(jù)訓(xùn)練。

分類(classification)充择。輸入訓(xùn)練數(shù)據(jù)特征(feature)德玫、標(biāo)記(label),找出特征和標(biāo)記映射關(guān)系(mapping)椎麦,標(biāo)記糾正學(xué)習(xí)偏差宰僧,提高預(yù)測率。有標(biāo)記學(xué)習(xí)為監(jiān)督學(xué)習(xí)(supervised learning)观挎。無監(jiān)督學(xué)習(xí)(unsuperVised learning)琴儿,數(shù)據(jù)只有特征沒有標(biāo)記。訓(xùn)練不指定明確分類嘁捷,數(shù)據(jù)聚群結(jié)構(gòu)造成,相似類型聚集一起。沒有標(biāo)記數(shù)據(jù)分組合雄嚣,聚類(clustering)晒屎;成功激勵制度,強(qiáng)化學(xué)習(xí)(reinforcement learning,RL)缓升。延遲獎賞與訓(xùn)練相關(guān)鼓鲁,激勵函數(shù)獲得狀態(tài)行動映射,適合連續(xù)決策領(lǐng)域港谊。半監(jiān)督學(xué)習(xí)(semi-supervised learning)骇吭,訓(xùn)練數(shù)據(jù)部分有標(biāo)記,部分沒有歧寺,數(shù)據(jù)分布必然不完全隨機(jī)燥狰,結(jié)合有標(biāo)記數(shù)據(jù)局部特征,大量無標(biāo)記數(shù)據(jù)整體分布成福,得到較好分類結(jié)果碾局。有監(jiān)督學(xué)習(xí)(分類荆残、回歸)-半監(jiān)督學(xué)習(xí)(分類奴艾、回歸)-半監(jiān)督聚類(標(biāo)記不確定)-無監(jiān)督學(xué)習(xí)(聚類)。

深度學(xué)習(xí)入門内斯,算法知識蕴潦、大量數(shù)據(jù)、計算機(jī)(最好GPU)俘闯。
學(xué)習(xí)數(shù)學(xué)知識潭苞,訓(xùn)練過程涉及過程抽象數(shù)學(xué)函數(shù),定義網(wǎng)絡(luò)結(jié)構(gòu)真朗,定義線性非線性函數(shù)此疹,設(shè)定優(yōu)化目標(biāo),定義損失函數(shù)(loss function),訓(xùn)練過程求解最優(yōu)解次優(yōu)解蝗碎,基本概率統(tǒng)計湖笨、高等數(shù)學(xué)、線性代數(shù)蹦骑,知道原理慈省、過程,興趣涉獵推導(dǎo)證明眠菇。

經(jīng)典機(jī)器學(xué)習(xí)理論边败、基本算法,支持向量機(jī)捎废、邏輯回歸笑窜、決策樹、樸素貝葉斯分類器缕坎、隨機(jī)森林怖侦、聚類算法、協(xié)同過濾谜叹、關(guān)聯(lián)性分析匾寝、人工神經(jīng)網(wǎng)絡(luò)、BP算法荷腊、PCA艳悔、過擬合、正則化女仰。

編程工具(語言)猜年,Python解釋型、面向?qū)ο蠹踩獭討B(tài)數(shù)據(jù)類型高級程序設(shè)計語言乔外,線性代數(shù)庫、矩陣操作一罩,Numpy杨幼、Pandas第三方庫,機(jī)器學(xué)習(xí)庫sklearn聂渊,SVM差购、邏輯回歸,MATLAB汉嗽,R欲逃,C++,Java饼暑,Go稳析。

經(jīng)典論文洗做,最新動態(tài)研究成果,手寫數(shù)據(jù)字識別彰居,LeNet竭望,物體目標(biāo)檢測,MSCNN裕菠,博客咬清、筆記、微信公眾號奴潘、微博旧烧、新媒體資訊,新訓(xùn)練方法画髓,新模型掘剪。

自己動手訓(xùn)練神經(jīng)網(wǎng)絡(luò),選擇開源深度學(xué)習(xí)框架奈虾,主要考慮用的人多夺谁,方向主要集中視覺、語音肉微,初學(xué)最好從計算機(jī)視覺入手匾鸥,用各種網(wǎng)絡(luò)模型訓(xùn)練手寫數(shù)字(MNIST)、圖像分類(CIFAR)數(shù)據(jù)集碉纳。

學(xué)入興趣工作領(lǐng)域勿负,計算機(jī)視覺,自然語言處理劳曹,預(yù)測奴愉,圖像分類、目標(biāo)檢測铁孵、視頻目標(biāo)檢測锭硼,語音識別、語音合成蜕劝、對話系統(tǒng)檀头、機(jī)器翻譯、文章摘要熙宇、情感分析鳖擒,醫(yī)學(xué)行業(yè)溉浙,醫(yī)學(xué)影像識別烫止,淘寶穿衣,衣服搭配戳稽,款式識別馆蠕,保險期升、通信客服,對話機(jī)器人智能問答系統(tǒng)互躬,智能家居播赁,人機(jī)自然語言交互。

工作問題吼渡,準(zhǔn)確率容为、壞案例(bad case)、識別速度寺酪,可能瓶頸坎背,結(jié)合具體行業(yè)領(lǐng)域業(yè)務(wù)創(chuàng)新,最新科研成果寄雀,調(diào)整模型得滤,更改模型參數(shù)候址,貼近業(yè)務(wù)需求讲仰。

傳統(tǒng)基于規(guī)則,依賴知識竹握。統(tǒng)計方法為核心機(jī)器學(xué)習(xí)急膀,重要的是做特征工程(feature engineering)沮协,調(diào)參,根據(jù)領(lǐng)域經(jīng)驗提取特征卓嫂,文字等抽象領(lǐng)域皂股,特征相對容易提取,語音一維時域信號命黔、圖像二維空域信號等領(lǐng)域呜呐,提取特征困難。深度學(xué)習(xí)悍募,神經(jīng)網(wǎng)絡(luò)每層自動學(xué)習(xí)特征蘑辑。TensorFlow深度學(xué)習(xí)開源工具。

TensorFlow支持異構(gòu)設(shè)備分布式計算(heterogeneous distributed computing)坠宴。異構(gòu)洋魂,包含不同成分,異構(gòu)網(wǎng)絡(luò)喜鼓、異構(gòu)數(shù)據(jù)庫副砍。異構(gòu)設(shè)備,CPU庄岖、GPU核心協(xié)同合作豁翎。分布式架構(gòu)調(diào)度分配計算資源、容錯隅忿。TensorFlow支持卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)心剥、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)邦尊,長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM,RNN特例)。

《The Unreasonable Effectiveness of Recurrent Neural Networks》优烧。Tensor庫對CPU/GPU透明蝉揍,不同設(shè)備運(yùn)行由框架實現(xiàn),用戶指定什么設(shè)置做什么運(yùn)算畦娄。完全獨(dú)立代碼庫又沾,腳本語言(Python)操作Tensor,實現(xiàn)所有深度學(xué)習(xí)內(nèi)容熙卡,前向傳播捍掺、反向傳播、圖形計算再膳。共享訓(xùn)練模型挺勿,TensorFlow slim模塊。沒有編譯過程喂柒,更大更復(fù)雜網(wǎng)絡(luò)不瓶,可解釋性,有效日志調(diào)試灾杰。

研究人群蚊丐。學(xué)者,深度學(xué)習(xí)理論研究艳吠,網(wǎng)絡(luò)模型麦备,修改參數(shù)方法和理論,產(chǎn)耱科研前沿昭娩,理論研究凛篙、模型實驗,新技術(shù)新理論敏感栏渺。算法改進(jìn)者呛梆,現(xiàn)有網(wǎng)絡(luò)模型適配應(yīng)用,達(dá)到更好立人日木磕诊,模型改進(jìn)填物,新算法改進(jìn)應(yīng)用現(xiàn)有模型,為上層應(yīng)用提供優(yōu)良模型霎终。工業(yè)研究者滞磺,掌握各種模型網(wǎng)絡(luò)結(jié)構(gòu)、算法實現(xiàn)莱褒,閱讀優(yōu)秀論文击困,復(fù)現(xiàn)成果,應(yīng)用工業(yè)保礼,主流人群沛励。

TensorFlow工業(yè)優(yōu)勢,基于服務(wù)端大數(shù)據(jù)服務(wù)(谷歌云平臺炮障、搜索)目派,面向終端用戶移動端(Android)和嵌入式。模型壓縮胁赢、8位低精度數(shù)據(jù)存儲企蹭。

TensorFlow特性。高度靈活性(deep flexibility)智末,數(shù)據(jù)流圖(data flow graph)數(shù)值計算谅摄,只需要構(gòu)建圖,書寫計算內(nèi)部循環(huán)系馆,自定義上層庫送漠。真正可移植性(true portability),CPU由蘑、GPU闽寡、臺式機(jī)、服務(wù)器尼酿、移動端爷狈、云端服務(wù)器、Docker容器裳擎。產(chǎn)研結(jié)合(connect research and production)涎永,快速試驗框架,新算法鹿响,訓(xùn)練模型羡微。自動求微分(auto-differentiation),只需要定義預(yù)測模型結(jié)構(gòu)惶我、目標(biāo)函數(shù)拷淘,添加數(shù)據(jù)。多語言支持(language options)指孤,Python启涯、C++、Java接口恃轩,C++實現(xiàn)核心结洼,Jupyter Notebook,特征映射(feature map)叉跛,自定義其他語言接口松忍。優(yōu)化性能(maximize performance),線程筷厘、隊列鸣峭、分布式計算支持宏所,TensorFlow數(shù)據(jù)流圖不同計算元素分配不同設(shè)備,最大化利用硬件資源摊溶。

應(yīng)用公司爬骤。谷歌、京東莫换、小米霞玄、Uber、eBay拉岁、Dropbox坷剧、Airbnb。

2016.4喊暖,0.8版支持分布式惫企、多GPU。2016.6陵叽,0.9版支持移動設(shè)備雅任。2017.2,1.0版Java咨跌、Go實驗API沪么,專用編譯器XLA、調(diào)試工具Debugger锌半,tf.transform數(shù)據(jù)預(yù)處理禽车,動態(tài)圖計算TensorFlow Fold。

機(jī)器學(xué)習(xí)賽事刊殉。
ImageNet ILSVRC(ImageNet Large Scale Visual Recognition Challenge殉摔,大規(guī)模視覺識別挑戰(zhàn)賽),對象檢測记焊、圖像識別算法逸月。2010年開始,最大圖像識別數(shù)據(jù)庫遍膜,1500萬張有標(biāo)記高分辨率圖像數(shù)據(jù)集碗硬,22000類別,比寒用1000類別各1000圖像瓢颅,120萬訓(xùn)練圖像恩尾,5萬驗證圖像,15萬測試圖像挽懦。每年邀請知名IT公司測試圖片分類系統(tǒng)翰意。Top-1,預(yù)測輸出概率最高類別錯誤率。Top-5,預(yù)測輸出概率前五類別錯誤率。2016冀偶,CUImage目標(biāo)檢測第一醒第,商湯科技、香港中文大學(xué)进鸠;CUvideo視頻物體檢測子項目第一稠曼,商湯科技、香港中文大學(xué)堤如;SenseCUSceneParsing場景分析第一蒲列,商湯科技窒朋、香港中文大學(xué)搀罢;Trimps-Soushen目標(biāo)定位第一,公安部三所NUIST視頻物體探測兩個子項目第一侥猩,南京信息工程大學(xué)榔至;Hikvvision場景分類第一,浩劾停康威視唧取;
Kaggel,2010年成立划提,數(shù)據(jù)發(fā)掘枫弟、數(shù)據(jù)分析預(yù)測競賽在線平臺。公司出數(shù)據(jù)出錢鹏往,計算機(jī)科學(xué)家淡诗、數(shù)學(xué)家、數(shù)據(jù)科學(xué)家領(lǐng)取任務(wù)伊履,提供解決方案韩容。3萬到25萬美元獎勵。
天池大數(shù)據(jù)競賽唐瀑,阿里群凶,穿衣搭配、微博互動預(yù)測哄辣、用戶重復(fù)購買行為預(yù)測请梢,賽題攻略。

國內(nèi)人工智能公司力穗。騰訊優(yōu)圖溢陪、阿里云ET、百度無人駕駛睛廊,搜狗形真、云從科技、商湯科技、昆侖萬維咆霜、格靈深瞳邓馒。
陌上花科技,衣+(dress+)蛾坯,圖像識別光酣、圖像搜索、特體追蹤檢測是脉课、圖片自動化標(biāo)記救军、圖像視頻智能分析、邊看邊買倘零、人臉識別分析唱遭。曠視科技,F(xiàn)ace++呈驶,人臉識別精度拷泽,美顏,支付袖瞻∷局拢科大訊飛,語音識別聋迎、語音合成脂矫、語言云、分詞霉晕、詞性標(biāo)注庭再、命名實體識別、依存句法分析娄昆、語義角色標(biāo)注佩微。地平線,嵌入式萌焰。

參考資料:
《TensorFlow技術(shù)解析與實戰(zhàn)》

歡迎付費(fèi)咨詢(150元每小時)哺眯,我的微信:qingxingfengzi

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市扒俯,隨后出現(xiàn)的幾起案子奶卓,更是在濱河造成了極大的恐慌,老刑警劉巖撼玄,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件夺姑,死亡現(xiàn)場離奇詭異,居然都是意外死亡掌猛,警方通過查閱死者的電腦和手機(jī)盏浙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人废膘,你說我怎么就攤上這事竹海。” “怎么了丐黄?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵斋配,是天一觀的道長。 經(jīng)常有香客問我灌闺,道長艰争,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任桂对,我火速辦了婚禮甩卓,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘接校。我一直安慰自己猛频,他們只是感情好狮崩,可當(dāng)我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布蛛勉。 她就那樣靜靜地躺著,像睡著了一般睦柴。 火紅的嫁衣襯著肌膚如雪诽凌。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天坦敌,我揣著相機(jī)與錄音侣诵,去河邊找鬼。 笑死狱窘,一個胖子當(dāng)著我的面吹牛杜顺,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蘸炸,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼躬络,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了搭儒?” 一聲冷哼從身側(cè)響起穷当,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎淹禾,沒想到半個月后馁菜,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡铃岔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年汪疮,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡智嚷,死狀恐怖躲胳,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情纤勒,我是刑警寧澤坯苹,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站摇天,受9級特大地震影響粹湃,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜泉坐,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一为鳄、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧腕让,春花似錦孤钦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至觉鼻,卻和暖如春俊扭,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背坠陈。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工萨惑, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人仇矾。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓庸蔼,卻偏偏與公主長得像,于是被迫代替她去往敵國和親贮匕。 傳聞我的和親對象是個殘疾皇子姐仅,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容