基于CNN的可實際應用的圖片驗證碼識別平臺介紹

這是一個圖片字符型驗證碼識別平臺桐玻；

本文主要：

一篙挽、簡單介紹圖片驗證碼識別平臺；

二镊靴、介紹訓練模型（識別圖片驗證碼）：詳細介紹從獲取驗證碼原始數據铣卡、打標簽、特殊處理到訓練出模型的過程偏竟，解釋什么是訓練煮落；

三、平臺工作原理：介紹平臺對圖片（驗證碼）的處理過程踊谋；

一蝉仇、簡單介紹圖片驗證碼識別平臺：

（1）一個圖片驗證碼識別平臺，提供接口殖蚕，接收base64編碼圖片轿衔，識別，返回結果睦疫；

（2）基于卷積神經網絡( Convolutional Neural Network, CNN )害驹；

（3）Python語言編寫；

（4）基于Tensorflow框架蛤育；

（5）運行于Gunicorn服務器裙秋；

（6）示意圖：

解釋：圖片驗證碼經base64編碼后，發(fā)送到驗證碼識別平臺（PCP）缨伊，平臺返回識別結果摘刑；

二、訓練模型：

1刻坊、獲取原始數據

即是到目標網站獲取足夠多需要識別的驗證碼圖片枷恕，用于接下來的訓練；

2谭胚、對圖片驗證碼打標簽（有監(jiān)督學習）

對獲取到的大量原始驗證碼圖片需要正確標記：每個圖片驗證碼對應的正確字符徐块；標記完后還需要核對，確保正確灾而，否則會非常影響訓練的準確性胡控；

這一步最耗費時間和精力；

目前打標簽的過程：

（1）寫一段代碼旁趟，使用現(xiàn)有的OCR庫昼激，對一部分圖片（如1000張）進行初次識別；

（2）然后進行人工修改、打標簽橙困；

（3）最后人工核對瞧掺；得到了1000張正確打好標簽的驗證碼圖片；

（4）重復（1）~（3）步凡傅，如辟狈，得到了2000張正確打好標簽的驗證碼圖片；——當然夏跷，可以一直如此重復哼转，直到得到所需要的圖片數量；

（5）另：把此2000張圖片進行訓練槽华，如準確率能有0.7以上释簿，那么可用此訓練的模型識別原始（未打標簽）的圖片——即是替換（1），OCR的成功率非常低硼莽；

（6）得到所需要的打好標簽的圖片數量，如1萬張煮纵；

3懂鸵、進行模型訓練

把標記好的圖片驗證碼輸入寫好的AI程序中，進行訓練行疏；

一般要求準確率達到0.98匆光；

對于訓練來說，理想的情況是：輸入的數據越多（打好標簽的圖片）酿联、訓練的次數越少终息，如此得到的模型越好，可以用下面的公式表達：

acc = Ax + By

A贞让、B: 權重周崭；x: 圖片；y: 次數喳张；acc: 準確率续镇；

上面的1~3步，就是訓練模型的一般過程销部；

存在問題：需要大量的打好標簽的圖片摸航，耗時費力；

所以舅桩，一般采用針對不同的驗證碼圖片進行特殊處理的方法：切割大法酱虎；

切割法操作如下（大致思路，因為每個驗證碼特征不同擂涛，處理方法會不同）：

如有驗證碼圖片：

同一種驗證碼读串，模式都會是固定的，針對上面的驗證碼可以這樣切割：

得到：

然后合成一張圖片：

最后，訓練爹土、識別都是針對：

其實甥雕，就是將擁有特殊、多字符的驗證碼圖片轉為簡單胀茵、少字符的圖片社露；

如此一來：

只需要訓練識別0-9數字；

打標簽數量大大減少琼娘，300張峭弟；

打標簽難度也大大減少，僅需要輸入數字脱拼；

再如瞒瘸，此種驗證碼：

直接切割4個單獨字符的圖片：

然后，訓練熄浓、識別都是針對單個字符圖片進行情臭，難度也大大降低，準確率大大提高赌蔑；

打標簽的數量也大大減少俯在；

一些數據：由于此圖片，底色有絕對的干擾娃惯，測試中發(fā)現(xiàn)跷乐，直接訓練的話，3000張圖片進行訓練趾浅，準確率也只有區(qū)區(qū)0.1%愕提；

利用切割方法，只用1000張圖片皿哨，切割得到4000張單獨字符的圖片浅侨，訓練8100次，準確率即可達到0.995证膨；

簡單解釋一下什么是訓練仗颈，這是一個數學問題：

先看基本的函數，如：y = 2x + 1椎例，輸入x=1挨决，輸出y=3；這是已經知道函數對應關系f = 2x + 1订歪；

再看高階一點的數學脖祈，如：已知 y = 2x + 1，y = 3刷晋，求x盖高；從輸出慎陵，反推輸入，同樣也是知道函數對應關系f = 2x + 1喻奥；

再進階一步席纽，就接觸到機器學習了，函數對應關系f 撞蚕，我們不知道润梯，但是知道了x、y的值（x就是驗證碼圖片甥厦、y就是對應的標簽）纺铭，求對應關系f；

如果是簡單的刀疙，已知函數f的形式舶赔，如：y = ax + b；只要兩組（x, y）即可求得a谦秧、b竟纳；從而求得f；

如果是完全不知道函數的形式疚鲤，那么就需要構造函數锥累，f 可能是 2x + 1、3x + 3石咬、x^2 + 1等等無數種情況；僅有兩組（x, y）是無法得出f的卖哎；但是如果有大量的（x, y）鬼悠，就能通過“逼近計算”方法，不斷調整公式權重亏娜，近似求得函數f —— 這就是訓練過程焕窝；

三、平臺工作原理：

簡單介紹平臺對圖片（驗證碼）的處理過程维贺；

示意圖：

解釋：

圖片驗證碼通過base64編碼后它掂，通過提供的API發(fā)送到驗證碼識別平臺；

平臺獲取圖片的寬高溯泣，然后進入判別器1：根據針對此驗證碼配置的屬性虐秋，決定是否要切割圖片（若要切割，切割的尺寸是多大）垃沦；

如果發(fā)現(xiàn)有兩種不同的驗證碼尺寸一樣客给，那么需要進入判別器2：根據圖片特征對圖片進行分類；

經過判別器1和判別器2肢簿，可以確定此圖片驗證碼對應的是哪個訓練模型（用于最終的識別）靶剑、是否要切割蜻拨、切割成多大；

最后桩引，把圖片切割成預定的大小缎讼，選擇對應的模型，進行識別坑匠，返回結果血崭；

以上就是利用AI識別驗證碼的簡單介紹；

完畢笛辟；

最后編輯于：2020.10.04 15:46:33

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末功氨，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子手幢，更是在濱河造成了極大的恐慌捷凄，老刑警劉巖，帶你破解...
沈念sama閱讀 219,188評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件围来，死亡現(xiàn)場離奇詭異跺涤，居然都是意外死亡，警方通過查閱死者的電腦和手機监透，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,464評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門桶错，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人胀蛮，你說我怎么就攤上這事院刁。” “怎么了粪狼？”我有些...
開封第一講書人閱讀 165,562評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵退腥，是天一觀的道長。經常有香客問我再榄，道長狡刘，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,893評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任困鸥，我火速辦了婚禮嗅蔬，結果婚禮上，老公的妹妹穿的比我還像新娘疾就。我一直安慰自己澜术，他們只是感情好，可當我...
茶點故事閱讀 67,917評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布猬腰。她就那樣靜靜地躺著瘪板，像睡著了一般。火紅的嫁衣襯著肌膚如雪漆诽。梳的紋絲不亂的頭發(fā)上侮攀，一...
開封第一講書人閱讀 51,708評論 1贊 305
城市分裂傳說
那天锣枝，我揣著相機與錄音，去河邊找鬼兰英。笑死撇叁，一個胖子當著我的面吹牛，可吹牛的內容都是我干的畦贸。我是一名探鬼主播陨闹，決...
沈念sama閱讀 40,430評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼薄坏！你這毒婦竟也來了趋厉？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,342評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤胶坠，失蹤者是張志新（化名）和其女友劉穎君账，沒想到半個月后，有當地人在樹林里發(fā)現(xiàn)了一具尸體沈善，經...
沈念sama閱讀 45,801評論 1贊 317
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡乡数，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,976評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年闻牡，在試婚紗的時候發(fā)現(xiàn)自己被綠了净赴。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,115評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡罩润，死狀恐怖玖翅，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情割以，我是刑警寧澤金度，帶...
沈念sama閱讀 35,804評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站拳球，受9級特大地震影響审姓，放射性物質發(fā)生泄漏珍特。R本人自食惡果不足惜祝峻，卻給世界環(huán)境...
茶點故事閱讀 41,458評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望扎筒。院中可真熱鬧莱找，春花似錦、人聲如沸嗜桌。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,008評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽骨宠。三九已至浮定，卻和暖如春相满，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背桦卒。一陣腳步聲響...
開封第一講書人閱讀 33,135評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工立美，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人方灾。一個月前我還...
沈念sama閱讀 48,365評論 3贊 373
代替公主和親
正文我出身青樓建蹄，卻偏偏與公主長得像，于是被迫代替她去往敵國和親裕偿。傳聞我的和親對象是個殘疾皇子洞慎，可洞房花燭夜當晚...
茶點故事閱讀 45,055評論 2贊 355

基于CNN的可實際應用的圖片驗證碼識別平臺介紹

推薦閱讀更多精彩內容