一次簡(jiǎn)單的驗(yàn)證碼識(shí)別以及思考

驗(yàn)證碼

驗(yàn)證碼(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自動(dòng)區(qū)分計(jì)算機(jī)和人類的圖靈測(cè)試)的縮寫蹭越,是一種區(qū)分用戶是計(jì)算機(jī)還是人的公共全自動(dòng)程序也颤《焉可以防止:惡意破解密碼白华、刷票、論壇灌水方妖,有效防止某個(gè)黑客對(duì)某一個(gè)特定注冊(cè)用戶用特定程序暴力破解方式進(jìn)行不斷的登陸嘗試匣缘,實(shí)際上用驗(yàn)證碼是現(xiàn)在很多網(wǎng)站通行的方式窘哈,我們利用比較簡(jiǎn)易的方式實(shí)現(xiàn)了這個(gè)功能澄成。這個(gè)問(wèn)題可以由計(jì)算機(jī)生成并評(píng)判胧洒,但是必須只有人類才能解答。由于計(jì)算機(jī)無(wú)法解答CAPTCHA的問(wèn)題墨状,所以回答出問(wèn)題的用戶就可以被認(rèn)為是人類卫漫。

驗(yàn)證碼通常用于網(wǎng)站的登錄,以區(qū)分是否是人類的行為還是機(jī)器的行為肾砂。啟用驗(yàn)證碼是反爬蟲列赎、反黑客的常用手段之一。然而通今,隨著技術(shù)的不斷進(jìn)步粥谬,特別是machine learning的發(fā)展肛根,普通的驗(yàn)證碼識(shí)別也不是很復(fù)雜的事情辫塌。

識(shí)別驗(yàn)證碼的架構(gòu)

在搭建識(shí)別驗(yàn)證碼服務(wù)之前需要完成兩件事情。
1)使用現(xiàn)有的爬蟲采集好圖片驗(yàn)證碼派哲,并標(biāo)注好這些圖片臼氨。這里,我使用自己開發(fā)的圖片爬蟲程序PicCrawler芭届。所謂標(biāo)注储矩,就是用肉眼去正確地識(shí)別出圖片中的數(shù)字和字母感耙,然后用這些數(shù)字和字母作為圖片的名字。

2)使用tensorflow來(lái)訓(xùn)練這些驗(yàn)證碼生成模型持隧,每一批的驗(yàn)證碼至少幾千起即硼。這樣,訓(xùn)練好的模型可以通過(guò)tensorflow的api來(lái)加載屡拨。

做完這些事情之后只酥,需要考慮使用怎樣的方式整合到現(xiàn)有的框架中。

  • 最初的架構(gòu)


    最初的架構(gòu).png

    最初考慮使用OpenCV來(lái)加載模型呀狼,因?yàn)镺penCV有Java的API裂允。然后Vert.x跟OpenCV進(jìn)行交互。在這個(gè)架構(gòu)中有線上的模型和離線的模型哥艇,線上的模型是生產(chǎn)環(huán)境中使用的模型绝编。每次訓(xùn)練好的離線模型可以替換線上的模型。但是OpenCV加載模型時(shí)遇到了問(wèn)題貌踏,于是嘗試另一種辦法十饥。

  • 后來(lái)的嘗試


    后來(lái)的嘗試.png

用tensorflow java api替換OpenCV來(lái)加載模型,這種方式也遇到了問(wèn)題祖乳,不得不使用最后的方式绷跑。

  • 最終的架構(gòu)


    最終的架構(gòu).png

使用python的web框架flask以及tensorflow python api來(lái)加載模型。在這個(gè)架構(gòu)中凡资,需要Vert.x調(diào)用flask暴露的接口砸捏,最后將識(shí)別的結(jié)果返回。

目標(biāo)驗(yàn)證碼.jpeg
驗(yàn)證碼識(shí)別的演示.jpeg

最終隙赁,接口返回的數(shù)據(jù)跟圖片中驗(yàn)證碼的內(nèi)容一致垦藏。算是完成了一次驗(yàn)證碼的識(shí)別。

思考

目前伞访,只能識(shí)別1掂骏、2種驗(yàn)證碼,未來(lái)會(huì)將多種驗(yàn)證碼進(jìn)行打標(biāo)簽厚掷,然后訓(xùn)練到一個(gè)模型中弟灼。

驗(yàn)證碼的功能打算整合到爬蟲框架NetDiscovery中,成為它的一個(gè)組件冒黑。由于爬蟲框架是開源的田绑,所以大家都可以免費(fèi)使用這個(gè)模塊。

驗(yàn)證碼模塊的架構(gòu)抡爹,也爭(zhēng)取使用熟悉的Java來(lái)替換python掩驱。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子欧穴,更是在濱河造成了極大的恐慌民逼,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,270評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件涮帘,死亡現(xiàn)場(chǎng)離奇詭異拼苍,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)调缨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門映屋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人同蜻,你說(shuō)我怎么就攤上這事棚点。” “怎么了湾蔓?”我有些...
    開封第一講書人閱讀 165,630評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵瘫析,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我默责,道長(zhǎng)贬循,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,906評(píng)論 1 295
  • 正文 為了忘掉前任桃序,我火速辦了婚禮杖虾,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘媒熊。我一直安慰自己奇适,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,928評(píng)論 6 392
  • 文/花漫 我一把揭開白布芦鳍。 她就那樣靜靜地躺著嚷往,像睡著了一般。 火紅的嫁衣襯著肌膚如雪柠衅。 梳的紋絲不亂的頭發(fā)上皮仁,一...
    開封第一講書人閱讀 51,718評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音菲宴,去河邊找鬼贷祈。 笑死,一個(gè)胖子當(dāng)著我的面吹牛喝峦,可吹牛的內(nèi)容都是我干的势誊。 我是一名探鬼主播,決...
    沈念sama閱讀 40,442評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼愈犹,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼键科!你這毒婦竟也來(lái)了闻丑?” 一聲冷哼從身側(cè)響起漩怎,我...
    開封第一講書人閱讀 39,345評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤勋颖,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后勋锤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體饭玲,經(jīng)...
    沈念sama閱讀 45,802評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,984評(píng)論 3 337
  • 正文 我和宋清朗相戀三年叁执,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了茄厘。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,117評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡谈宛,死狀恐怖次哈,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情吆录,我是刑警寧澤窑滞,帶...
    沈念sama閱讀 35,810評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站恢筝,受9級(jí)特大地震影響哀卫,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜撬槽,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,462評(píng)論 3 331
  • 文/蒙蒙 一此改、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧侄柔,春花似錦共啃、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至敢靡,卻和暖如春挂滓,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背啸胧。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工赶站, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人纺念。 一個(gè)月前我還...
    沈念sama閱讀 48,377評(píng)論 3 373
  • 正文 我出身青樓贝椿,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親陷谱。 傳聞我的和親對(duì)象是個(gè)殘疾皇子烙博,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,060評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容