跨出前端智能化的第一步-tensorflow的應用（object_detection）

tensorflow賦能前端

第一部分俺附、引言

一肥卡、閱讀本篇文章你能得到什么

1、了解tensorflow及關鍵社區(qū)資源事镣；
2步鉴、能夠自主訓練和應用自己想要的模型（主要）；
3璃哟、開闊前端智能化的思考與認知氛琢；

二、什么是對象識別

簡單來說随闪，在圖片或視頻識別出你關注的對象類別阳似、坐標就是對象識別，你可以通過以下視頻加深認知：
1铐伴、Ai采摘機器人：
https://www.bilibili.com/video/BV1YE41147iV/?spm_id_from=333.788.videocard.2
2撮奏、英雄聯盟血條識別：
https://www.bilibili.com/s/video/BV1gs411V7B5
3、車輛識別：
https://www.bilibili.com/video/BV1si4y1b7RP/?spm_id_from=333.788.videocard.6
4当宴、人物識別：
https://www.bilibili.com/video/BV1Es411K7CQ/?spm_id_from=333.788.videocard.11
5畜吊、衛(wèi)星船舶檢測
https://www.bilibili.com/s/video/BV1QC4y187Yx

三、前端為什么需要對象識別能力

D2C

1即供、通過對象識別可以做到D2C定拟，也就是設計稿識別產出代碼；
2逗嫡、他帶給了前端更多可能性青自、效率提升、可控能力驱证；

四延窜、帶著目標看流程

ui-識別.jpg

我簡單訓練了一個antd ui識別模型，可以將圖片中的ui組件坐標和類別識別出來抹锄，同時附帶識別的分數逆瑞，下面將詳細為大家介紹如何訓練一個自己的object_detection模型。

第二部分伙单、object_detection完整實踐

分為以下幾個環(huán)節(jié)：
1获高、搭建環(huán)境；
2吻育、創(chuàng)建數據集念秧；
3、選擇預訓練算法模型布疼；
4摊趾、調整參數開始訓練币狠；
5、驗證訓練成果砾层；
6漩绵、導出并轉換模型給前端使用（瀏覽器/node環(huán)境）；

一肛炮、搭建環(huán)境

參考：https://www.tensorflow.org/install
1止吐、準備最新python環(huán)境；
2铸董、安裝tensorflow2祟印；
3、通過pip安裝tensorflowjs（這個主要用于轉換最終導出的模型供js環(huán)境使用）粟害；
4蕴忆、注意Python Package Installation這一步：https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf2.md
5、可通過conda做環(huán)境管理（可選）悲幅；

注意：直接使用tensorflow2就行了套鹅，沒有太多必要使用tensorflow1；安裝和使用過程中應該會遇到一些pip包缺失的問題汰具，這個需要自己看提示解決卓鹿，其實跟npm類似。建議用主機進行環(huán)境搭建及訓練留荔，配置當然越高越好吟孙。

二、創(chuàng)建數據集

tensorflow對象識別需要使用tfrecord格式數據集
推薦的標注平臺：https://app.labelbox.com/
推薦的制作導出平臺：https://app.roboflow.com/
創(chuàng)建數據集的方式有很多種聚蝶，可以通過python語言創(chuàng)建自定義tfrecords數據集杰妓，也可以通過各類數據集標注平臺；

注：
1碘勉、tfrecords是tensorflow定義的一種數據格式巷挥，直接用于數據訓練；
2验靡、通過收集大量訓練圖片進行人工標注（也有半自動標注倍宾、自動標注，如通過UI組件生產頁面進行自動標注）胜嗓；
3高职、標注的分類數量需要盡可能均勻一些，減少準確性偏差辞州；

這里簡單介紹一下通過平臺標注流程（labelbox+roboflow）：

labelbox 部分

1怔锌、準備一些含ui的圖片，尺寸和名稱沒有特別要求，可以直接截圖保存产禾；
2、在labelbox新建項目并批量上傳圖片牵啦；
3亚情、編輯分類

編輯分類

添加ui分類

4、開始標注（start labeling）

image.png

5哈雏、完成所有標注楞件，導出JSON文件

image.png

roboflow 部分

1、創(chuàng)建數據集

image.png

2裳瘪、按提示上傳剛剛導出的json文件土浸，根據提示繼續(xù)操作
3、在導入數據集基礎上彭羹，進行自定義圖片處理

image.png

注意：這里可能包含旋轉黄伊、模糊、翻轉等操作派殷，你可以通過最終模型識別目標來判斷是否有必要加入某一步驟还最；比如：如果你識別的全部都是方方正正的UI設計稿，則旋轉就沒有太多必要了毡惜。他的作用在于幫你自動處理擴充數據集拓轻，以便適應各類識別場景。
4经伙、點擊generate扶叉、查看健康檢查

image.png

注意：上文提到過，盡量不要讓標注的分類數量相差太多帕膜。
5枣氧、下載數據集

image.png

注意：這里選擇tensorflow tfrecord格式下載即可。

三、選擇預訓練算法模型

tensorflow擁有很完善的文檔淫茵，大家直接在對應的官網或github尋找即可途凫！
https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf2_detection_zoo.md

image.png

目前使用的是（訓練容易/導出的文件不算太大）：SSD MobileNet V2 FPNLite 640x640
選擇模型的時候需要考慮以下幾點：
1、識別速度宗挥；
2、識別準確率种蝶；
3契耿、訓練難度（尺寸越大訓練難度越大，主要體現在對機器性能上）螃征；
4搪桂、前端解析識別數據（重要）；

注意：多數模型都提供了入參（處理后的圖片）和出參（一個tensor格式的數組），不同模型最終產出的結果是不一樣的踢械，但一般都包含對象分數score酗电、對象尺寸及位置boxes、數量等内列，這些需要自行判斷撵术。

四、調整參數開始訓練

image.png

https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf2_training_and_evaluation.md

image.png

主要有以下幾個參數需要調整：
1话瞧、num_classes 代表數據集的分類數量嫩与；
2、fine_tune_checkpoint 指向下載預訓練模型中的checkpoint（根據這個文件的model_checkpoint_path來就行）交排；
3划滋、fine_tune_checkpoint_type 改成detection（實際分類模型tf2也有提供，如不改容易出現內存問題中斷訓練）埃篓；
4处坪、label_map_path 都指向導出tfrecords里面生成的就行（其實就是標注的分類）；
5架专、tf_record_input_reader 分別對應train/test目錄的tfrecord文件稻薇；
6、關鍵點train_config配置胶征，batch_size訓練批次（即一次訓練所抓取的數據樣本數量）塞椎、total_steps、num_steps調整睛低，這部分既要考慮機器性能又要考慮數據量案狠，需要根據自己的實際情況而定（位數的調整可能引起成倍的訓練時間）；

注意：
1钱雷、建議找個性能不錯的主機進行訓練骂铁，用自己的mac大概率會失敗（下一步驗證訓練結果會提及）罩抗。
2拉庵、批次大小機器允許的情況可以設置大一些，但也不是越大越好哈套蒂，可以自己另外了解一下钞支；
3、total step根據loss曲線做調整操刀；
4烁挟、二次訓練場景（有了一個訓練好的優(yōu)質模型，里面已經儲備了大量知識骨坑，當前訓練的數據比較少撼嗓，可以嘗試在已有模型基礎上二次訓練），如果不確定建議都從0開始；
5且警、訓練時長受數據粉捻、算法模型、批次斑芜、step杀迹、機器效率等影響，可以通過本地編譯押搪、使用gpu加速等方式減少訓練時間；

五浅碾、驗證訓練成果

執(zhí)行：tensorboard --logdir model_dir
打開啟動的地址：http://localhost:6006/
1大州、觀察loss曲線，判斷step設置是否合理

image.png

2垂谢、查看圖片驗證結果

image.png

注意：通過以上2點基本可以確定模型是否可用厦画，大家也可以學習一下其他分析技巧，互相分享滥朱。

六根暑、導出并轉換模型給前端使用（瀏覽器/node環(huán)境）

1、exporter_main_v2.py 導出saved_model徙邻；
2排嫌、記得pip install tensorflowjs，然后使用tensorflowjs_converter轉換成前端可用模型
3缰犁、參考coco-ssd的模型導入與識別：https://github.com/tensorflow/tfjs-models/tree/master/coco-ssd

注意：后面其實就是通過@tensorflow/tfjs-core等庫進行模型加載和圖片識別了淳地，也可以參考我這個庫https://github.com/aisriver/tf-ui-detection，里面包括了一些訓練代碼和使用示例帅容。

image.png

第三部分颇象、結合tensorflow的其他前端實踐

可直接投入前端使用的模型和演示：https://github.com/tensorflow/tfjs-models
其他能力：圖像分類、文本識別并徘、語音識別遣钳、視頻識別，并可以直接在社區(qū)找到對應資源麦乞；

前端應用：
組件識別/D2C（如imgcook：https://www.imgcook.com/）蕴茴、
圖表庫識別（大屏設計稿識別）、搜圖（antd的圖表搜索）姐直、
手勢識別（大屏手勢交互：https://www.bilibili.com/video/BV1ET4y1j7SL/?spm_id_from=333.788.videocard.2）荐开、語言指令、惡意評論檢測简肴、敏感圖片/視頻識別晃听、智能家居、物聯領域的環(huán)境安全檢測等

大屏通過手勢進行互動，想想都覺得很酷能扒，而且實現起來也沒有那么難佣渴。

最后，幫大家整合一下社區(qū)資源

1鹃答、官網：https://tensorflow.google.cn/
2乎澄、模型庫可數據集（重要）：https://www.tensorflow.org/resources/models-datasets?
3、對象識別github（核心）：https://github.com/tensorflow/models/tree/master/research/object_detection?
4测摔、訓練和評估（重要）：https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf2_training_and_evaluation.md?
5置济、js相關已有模型庫及應用（參考）：https://github.com/tensorflow/tfjs-models
6、數據標注平臺（重要）：https://app.labelbox.com/
7锋八、數據集訂制與導出平臺（重要）：https://app.roboflow.com/
8浙于、模型分析工具（了解就行）：https://github.com/lutzroeder/netron
9、tflite在node環(huán)境下使用（我沒有試過）：https://www.npmjs.com/package/node-tflite
10挟纱、文本OCR識別（推薦）：https://www.npmjs.com/package/tesseract.js

github

https://github.com/aisriver

最后編輯于：2021.01.31 22:10:21

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末羞酗，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子紊服，更是在濱河造成了極大的恐慌整慎，老刑警劉巖，帶你破解...
沈念sama閱讀 218,682評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件围苫，死亡現場離奇詭異裤园，居然都是意外死亡，警方通過查閱死者的電腦和手機剂府，發(fā)現死者居然都...
沈念sama閱讀 93,277評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門拧揽，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人腺占，你說我怎么就攤上這事淤袜。” “怎么了衰伯？”我有些...
開封第一講書人閱讀 165,083評論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵铡羡，是天一觀的道長。經常有香客問我意鲸，道長烦周，這世上最難降的妖魔是什么尽爆？我笑而不...
開封第一講書人閱讀 58,763評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮读慎，結果婚禮上漱贱，老公的妹妹穿的比我還像新娘。我一直安慰自己夭委，他們只是感情好幅狮，可當我...
茶點故事閱讀 67,785評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著株灸，像睡著了一般崇摄。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上慌烧，一...
開封第一講書人閱讀 51,624評論 1贊 305
城市分裂傳說
那天逐抑，我揣著相機與錄音，去河邊找鬼杏死。笑死，一個胖子當著我的面吹牛捆交，可吹牛的內容都是我干的淑翼。我是一名探鬼主播，決...
沈念sama閱讀 40,358評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼品追，長吁一口氣：“原來是場噩夢啊……” “哼玄括！你這毒婦竟也來了？” 一聲冷哼從身側響起肉瓦，我...
開封第一講書人閱讀 39,261評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤遭京，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后泞莉，有當地人在樹林里發(fā)現了一具尸體哪雕，經...
沈念sama閱讀 45,722評論 1贊 315
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,900評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年鲫趁，在試婚紗的時候發(fā)現自己被綠了斯嚎。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,030評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡挨厚，死狀恐怖堡僻，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情疫剃，我是刑警寧澤钉疫，帶...
沈念sama閱讀 35,737評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站巢价，受9級特大地震影響牲阁，放射性物質發(fā)生泄漏固阁。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,360評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一咨油、第九天我趴在偏房一處隱蔽的房頂上張望您炉。院中可真熱鬧，春花似錦役电、人聲如沸赚爵。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,941評論 0贊 22
一樁弒父案法瑟，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽冀膝。三九已至，卻和暖如春霎挟，著一層夾襖步出監(jiān)牢的瞬間窝剖，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,057評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工酥夭，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留赐纱，地道東北人。一個月前我還...
沈念sama閱讀 48,237評論 3贊 371
代替公主和親
正文我出身青樓熬北，卻偏偏與公主長得像疙描，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子讶隐，可洞房花燭夜當晚...
茶點故事閱讀 44,976評論 2贊 355

跨出前端智能化的第一步-tensorflow的應用（object_detection）

跨出前端智能化的第一步-tensorflow的應用（object_detection）

第一部分俺附、引言

一肥卡、閱讀本篇文章你能得到什么

二、什么是對象識別

三、前端為什么需要對象識別能力

四延窜、帶著目標看流程

第二部分伙单、object_detection完整實踐

一肛炮、搭建環(huán)境

二、創(chuàng)建數據集

這里簡單介紹一下通過平臺標注流程（labelbox+roboflow）：

labelbox 部分

roboflow 部分

三、選擇預訓練算法模型

四、調整參數開始訓練

五浅碾、驗證訓練成果

六根暑、導出并轉換模型給前端使用（瀏覽器/node環(huán)境）

第三部分颇象、結合tensorflow的其他前端實踐

推薦一個直接可用的文本ocr識別

最后，幫大家整合一下社區(qū)資源

github

推薦閱讀更多精彩內容